← Modelos LLM

R1 Distill Qwen 32B

Código abierto

DeepSeek

DeepSeek R1 Distill Qwen 32B es un modelo de lenguaje grande destilado basado en [Qwen 2.5 32B](https://huggingface.co/Qwen/Qwen2.5-32B), que utiliza salidas de [DeepSeek R1](/deepseek/deepseek-r1). Supera al o1-mini de OpenAI en varios puntos de referencia, logrando nuevos...

openrouter.ai ↗

📖Contexto128K tokens

🚀Velocidad-

💵Precio entrada$0.290/1M

💸Precio salida$0.290/1M

🧠Parámetros32.764B

Benchmarks

Barra gris = promedio del dataset

Puntuación compuestaScore = MMLU×20% + GPQA×30% + HumanEval×25% + SWE-Bench×25%-

HF Open LLM Leaderboard

IFEval · BBH · MATH · GPQA · MuSR · MMLU-Pro

Promedio

23.0

IFEvalSeguimiento de instrucciones

41.9%prom. 79.9

BBHBig Bench Hard

17.1%prom. 48.7

MATH Lvl 5Matemáticas de competición

17.1%prom. 37.8

GPQAPreguntas científicas de posgrado

4.6%prom. 12.9

MuSRRazonamiento multietapa

16.1%prom. 10.7

MMLU-ProConocimiento profesional

41.0%prom. 40.0

Creado por

Más de DeepSeek

Score 75$0.700/1M→

Score 68$0.200/1M→

R1 Distill Llama 70BOSS

DeepSeek V3.2 Exp

Proveedores API

Detalles

Proveedor: DeepSeek
Parámetros: 32.764B
Contexto: 128K tokens
Velocidad: -
Código abierto: Sí
Licencia: Abierta (varía)
Lanzado: Jan 2025

Reseñas

Sin reseñas aún

Inicia sesión para valorar

← Ver todo 381 modelos