TECHAGENT - MY AI LIFE
LLM Модели

R1 Distill Llama 70B

Открытый код

DeepSeek

DeepSeek R1 Distill Llama 70B - это дистиллированная модель большого языка, основанная на [Llama-3.3-70B-Instruct](/meta-llama/llama-3.3-70b-instruct), использующая выходные данные из [DeepSeek R1](/deepseek/deepseek-r1). Модель сочетает в себе передовые методы дистилляции для достижения высокой производительности во всем...

openrouter.ai ↗
📖Контекст131K tokens
🚀Скорость-
💵Входящий токен$0.800/1M
💸Исходящий токен$0.800/1M
🧠Параметры70.554B

Бенчмарки

Серая полоса = среднее по датасету
Составной ScoreScore = MMLU×20% + GPQA×30% + HumanEval×25% + SWE-Bench×25%-

HF Open LLM Leaderboard

IFEval · BBH · MATH · GPQA · MuSR · MMLU-Pro

Среднее
27.8
View on HF →
IFEvalСледование инструкциям
43.4%ср. 79.9
BBHBig Bench Hard
35.8%ср. 48.7
MATH Lvl 5Соревновательная математика
30.7%ср. 37.8
GPQAНаучные вопросы уровня аспирантуры
2.0%ср. 12.9
MuSRМногошаговые рассуждения
13.3%ср. 10.7
MMLU-ProПрофессиональные знания
41.6%ср. 40.0

Детали

Провайдер
DeepSeek
Параметры
70.554B
Контекст
131K tokens
Скорость
-
Открытый код
Да
Лицензия
Открытая (варьируется)
Релиз
Jan 2025

Отзывы

Отзывов пока нет

Войдите чтобы оценить