← LLM Модели

R1 Distill Qwen 32B

Открытый код

DeepSeek

DeepSeek R1 Distill Qwen 32B - это дистиллированная модель большого языка, основанная на [Qwen 2.5 32B](https://huggingface.co/Qwen/Qwen2.5-32B), использующая выходные данные [DeepSeek R1](/deepseek/deepseek-r1). Он превосходит o1-mini OpenAI в различных тестах, достигая новых...

openrouter.ai ↗

📖Контекст128K tokens

🚀Скорость-

💵Входящий токен$0.290/1M

💸Исходящий токен$0.290/1M

🧠Параметры32.764B

Бенчмарки

Серая полоса = среднее по датасету

Составной ScoreScore = MMLU×20% + GPQA×30% + HumanEval×25% + SWE-Bench×25%-

HF Open LLM Leaderboard

IFEval · BBH · MATH · GPQA · MuSR · MMLU-Pro

Среднее

23.0

IFEvalСледование инструкциям

41.9%ср. 79.9

BBHBig Bench Hard

17.1%ср. 48.7

MATH Lvl 5Соревновательная математика

17.1%ср. 37.8

GPQAНаучные вопросы уровня аспирантуры

4.6%ср. 12.9

MuSRМногошаговые рассуждения

16.1%ср. 10.7

MMLU-ProПрофессиональные знания

41.0%ср. 40.0

Создано

Ещё от DeepSeek

Score 75$0.700/1M→

Score 68$0.200/1M→

R1 Distill Llama 70BOSS

DeepSeek V3.2 Exp

API Провайдеры

Детали

Провайдер: DeepSeek
Параметры: 32.764B
Контекст: 128K tokens
Скорость: -
Открытый код: Да
Лицензия: Открытая (варьируется)
Релиз: Jan 2025

Отзывы

Отзывов пока нет

Войдите чтобы оценить

← Посмотреть все 381 моделей