← Modelos LLMCódigo abiertoView on HF →→
R1 Distill Llama 70B
DeepSeek
DeepSeek R1 Distill Llama 70B es un modelo de lenguaje grande destilado basado en [Llama-3.3-70B-Instruct](/meta-llama/llama-3.3-70b-instruct), usando salidas de [DeepSeek R1](/deepseek/deepseek-r1). El modelo combina técnicas avanzadas de destilación para lograr un alto rendimiento en...
openrouter.ai ↗📖Contexto131K tokens
🚀Velocidad-
💵Precio entrada$0.800/1M
💸Precio salida$0.800/1M
🧠Parámetros70.554B
Benchmarks
Barra gris = promedio del datasetPuntuación compuestaScore = MMLU×20% + GPQA×30% + HumanEval×25% + SWE-Bench×25%-
HF Open LLM Leaderboard
IFEval · BBH · MATH · GPQA · MuSR · MMLU-Pro
Promedio
27.8
IFEvalSeguimiento de instrucciones
43.4%prom. 79.9
BBHBig Bench Hard
35.8%prom. 48.7
MATH Lvl 5Matemáticas de competición
30.7%prom. 37.8
GPQAPreguntas científicas de posgrado
2.0%prom. 12.9
MuSRRazonamiento multietapa
13.3%prom. 10.7
MMLU-ProConocimiento profesional
41.6%prom. 40.0
Creado por
🏢
DeepSeek
providerMás de DeepSeek
Proveedores API
Detalles
- Proveedor
- DeepSeek
- Parámetros
- 70.554B
- Contexto
- 131K tokens
- Velocidad
- -
- Código abierto
- Sí
- Licencia
- Abierta (varía)
- Lanzado
- Jan 2025

