← LLM Модели

R1 Distill Llama 70B

Открытый код

DeepSeek

DeepSeek R1 Distill Llama 70B - это дистиллированная модель большого языка, основанная на [Llama-3.3-70B-Instruct](/meta-llama/llama-3.3-70b-instruct), использующая выходные данные из [DeepSeek R1](/deepseek/deepseek-r1). Модель сочетает в себе передовые методы дистилляции для достижения высокой производительности во всем...

openrouter.ai ↗

📖Контекст131K tokens

🚀Скорость-

💵Входящий токен$0.800/1M

💸Исходящий токен$0.800/1M

🧠Параметры70.554B

Бенчмарки

Серая полоса = среднее по датасету

Составной ScoreScore = MMLU×20% + GPQA×30% + HumanEval×25% + SWE-Bench×25%-

HF Open LLM Leaderboard

IFEval · BBH · MATH · GPQA · MuSR · MMLU-Pro

Среднее

27.8

IFEvalСледование инструкциям

43.4%ср. 79.9

BBHBig Bench Hard

35.8%ср. 48.7

MATH Lvl 5Соревновательная математика

30.7%ср. 37.8

GPQAНаучные вопросы уровня аспирантуры

2.0%ср. 12.9

MuSRМногошаговые рассуждения

13.3%ср. 10.7

MMLU-ProПрофессиональные знания

41.6%ср. 40.0

Создано

Ещё от DeepSeek

Score 75$0.700/1M→

Score 68$0.200/1M→

R1 Distill Qwen 32BOSS

DeepSeek V3.2 Exp

API Провайдеры

Детали

Провайдер: DeepSeek
Параметры: 70.554B
Контекст: 131K tokens
Скорость: -
Открытый код: Да
Лицензия: Открытая (варьируется)
Релиз: Jan 2025

Отзывы

Отзывов пока нет

Войдите чтобы оценить

← Посмотреть все 381 моделей