← Modelos LLMCódigo abiertoView on HF →→
R1 Distill Qwen 32B
DeepSeek
DeepSeek R1 Distill Qwen 32B es un modelo de lenguaje grande destilado basado en [Qwen 2.5 32B](https://huggingface.co/Qwen/Qwen2.5-32B), que utiliza salidas de [DeepSeek R1](/deepseek/deepseek-r1). Supera al o1-mini de OpenAI en varios puntos de referencia, logrando nuevos...
openrouter.ai ↗📖Contexto128K tokens
🚀Velocidad-
💵Precio entrada$0.290/1M
💸Precio salida$0.290/1M
🧠Parámetros32.764B
Benchmarks
Barra gris = promedio del datasetPuntuación compuestaScore = MMLU×20% + GPQA×30% + HumanEval×25% + SWE-Bench×25%-
HF Open LLM Leaderboard
IFEval · BBH · MATH · GPQA · MuSR · MMLU-Pro
Promedio
23.0
IFEvalSeguimiento de instrucciones
41.9%prom. 79.9
BBHBig Bench Hard
17.1%prom. 48.7
MATH Lvl 5Matemáticas de competición
17.1%prom. 37.8
GPQAPreguntas científicas de posgrado
4.6%prom. 12.9
MuSRRazonamiento multietapa
16.1%prom. 10.7
MMLU-ProConocimiento profesional
41.0%prom. 40.0
Creado por
🏢
DeepSeek
providerMás de DeepSeek
Proveedores API
Detalles
- Proveedor
- DeepSeek
- Parámetros
- 32.764B
- Contexto
- 128K tokens
- Velocidad
- -
- Código abierto
- Sí
- Licencia
- Abierta (varía)
- Lanzado
- Jan 2025

