TECHAGENT - MY AI LIFE
Modelos LLM

R1 Distill Llama 70B

Código abierto

DeepSeek

DeepSeek R1 Distill Llama 70B es un modelo de lenguaje grande destilado basado en [Llama-3.3-70B-Instruct](/meta-llama/llama-3.3-70b-instruct), usando salidas de [DeepSeek R1](/deepseek/deepseek-r1). El modelo combina técnicas avanzadas de destilación para lograr un alto rendimiento en...

openrouter.ai ↗
📖Contexto131K tokens
🚀Velocidad-
💵Precio entrada$0.800/1M
💸Precio salida$0.800/1M
🧠Parámetros70.554B

Benchmarks

Barra gris = promedio del dataset
Puntuación compuestaScore = MMLU×20% + GPQA×30% + HumanEval×25% + SWE-Bench×25%-

HF Open LLM Leaderboard

IFEval · BBH · MATH · GPQA · MuSR · MMLU-Pro

Promedio
27.8
View on HF →
IFEvalSeguimiento de instrucciones
43.4%prom. 79.9
BBHBig Bench Hard
35.8%prom. 48.7
MATH Lvl 5Matemáticas de competición
30.7%prom. 37.8
GPQAPreguntas científicas de posgrado
2.0%prom. 12.9
MuSRRazonamiento multietapa
13.3%prom. 10.7
MMLU-ProConocimiento profesional
41.6%prom. 40.0

Detalles

Proveedor
DeepSeek
Parámetros
70.554B
Contexto
131K tokens
Velocidad
-
Código abierto
Licencia
Abierta (varía)
Lanzado
Jan 2025

Reseñas

Sin reseñas aún

Inicia sesión para valorar