TECHAGENT - MY AI LIFE
Modelos LLM

R1 Distill Qwen 32B

Código abierto

DeepSeek

DeepSeek R1 Distill Qwen 32B es un modelo de lenguaje grande destilado basado en [Qwen 2.5 32B](https://huggingface.co/Qwen/Qwen2.5-32B), que utiliza salidas de [DeepSeek R1](/deepseek/deepseek-r1). Supera al o1-mini de OpenAI en varios puntos de referencia, logrando nuevos...

openrouter.ai ↗
📖Contexto128K tokens
🚀Velocidad-
💵Precio entrada$0.290/1M
💸Precio salida$0.290/1M
🧠Parámetros32.764B

Benchmarks

Barra gris = promedio del dataset
Puntuación compuestaScore = MMLU×20% + GPQA×30% + HumanEval×25% + SWE-Bench×25%-

HF Open LLM Leaderboard

IFEval · BBH · MATH · GPQA · MuSR · MMLU-Pro

Promedio
23.0
View on HF →
IFEvalSeguimiento de instrucciones
41.9%prom. 79.9
BBHBig Bench Hard
17.1%prom. 48.7
MATH Lvl 5Matemáticas de competición
17.1%prom. 37.8
GPQAPreguntas científicas de posgrado
4.6%prom. 12.9
MuSRRazonamiento multietapa
16.1%prom. 10.7
MMLU-ProConocimiento profesional
41.0%prom. 40.0

Detalles

Proveedor
DeepSeek
Parámetros
32.764B
Contexto
128K tokens
Velocidad
-
Código abierto
Licencia
Abierta (varía)
Lanzado
Jan 2025

Reseñas

Sin reseñas aún

Inicia sesión para valorar