← LLM МоделиОткрытый кодView on HF →→
R1 Distill Qwen 32B
DeepSeek
DeepSeek R1 Distill Qwen 32B - это дистиллированная модель большого языка, основанная на [Qwen 2.5 32B](https://huggingface.co/Qwen/Qwen2.5-32B), использующая выходные данные [DeepSeek R1](/deepseek/deepseek-r1). Он превосходит o1-mini OpenAI в различных тестах, достигая новых...
openrouter.ai ↗📖Контекст128K tokens
🚀Скорость-
💵Входящий токен$0.290/1M
💸Исходящий токен$0.290/1M
🧠Параметры32.764B
Бенчмарки
Серая полоса = среднее по датасетуСоставной ScoreScore = MMLU×20% + GPQA×30% + HumanEval×25% + SWE-Bench×25%-
HF Open LLM Leaderboard
IFEval · BBH · MATH · GPQA · MuSR · MMLU-Pro
Среднее
23.0
IFEvalСледование инструкциям
41.9%ср. 79.9
BBHBig Bench Hard
17.1%ср. 48.7
MATH Lvl 5Соревновательная математика
17.1%ср. 37.8
GPQAНаучные вопросы уровня аспирантуры
4.6%ср. 12.9
MuSRМногошаговые рассуждения
16.1%ср. 10.7
MMLU-ProПрофессиональные знания
41.0%ср. 40.0
Создано
🏢
DeepSeek
providerЕщё от DeepSeek
API Провайдеры
Детали
- Провайдер
- DeepSeek
- Параметры
- 32.764B
- Контекст
- 128K tokens
- Скорость
- -
- Открытый код
- Да
- Лицензия
- Открытая (варьируется)
- Релиз
- Jan 2025

