← LLM МоделиОткрытый кодView on HF →→
R1 Distill Llama 70B
DeepSeek
DeepSeek R1 Distill Llama 70B - это дистиллированная модель большого языка, основанная на [Llama-3.3-70B-Instruct](/meta-llama/llama-3.3-70b-instruct), использующая выходные данные из [DeepSeek R1](/deepseek/deepseek-r1). Модель сочетает в себе передовые методы дистилляции для достижения высокой производительности во всем...
openrouter.ai ↗📖Контекст131K tokens
🚀Скорость-
💵Входящий токен$0.800/1M
💸Исходящий токен$0.800/1M
🧠Параметры70.554B
Бенчмарки
Серая полоса = среднее по датасетуСоставной ScoreScore = MMLU×20% + GPQA×30% + HumanEval×25% + SWE-Bench×25%-
HF Open LLM Leaderboard
IFEval · BBH · MATH · GPQA · MuSR · MMLU-Pro
Среднее
27.8
IFEvalСледование инструкциям
43.4%ср. 79.9
BBHBig Bench Hard
35.8%ср. 48.7
MATH Lvl 5Соревновательная математика
30.7%ср. 37.8
GPQAНаучные вопросы уровня аспирантуры
2.0%ср. 12.9
MuSRМногошаговые рассуждения
13.3%ср. 10.7
MMLU-ProПрофессиональные знания
41.6%ср. 40.0
Создано
🏢
DeepSeek
providerЕщё от DeepSeek
API Провайдеры
Детали
- Провайдер
- DeepSeek
- Параметры
- 70.554B
- Контекст
- 131K tokens
- Скорость
- -
- Открытый код
- Да
- Лицензия
- Открытая (варьируется)
- Релиз
- Jan 2025

