TECHAGENT - MY AI LIFE
LLM Модели
60Оценка

Qwen 2.5 72B

#25Открытый код

Alibaba/Qwen

Открытая электростанция Alibaba. Лучшие тесты по программированию и математике на уровне 72B.

Официальная страница →
📖Контекст128K tokens
🚀Скорость80 tok/s
💵Входящий токен-
💸Исходящий токен-
🧠Параметры72B

Бенчмарки

Серая полоса = среднее по датасету
MMLU57 академических предметов
86.1%ср. 81.8
GPQA DiamondВопросы уровня PhD
49.0%ср. 50.4
HumanEvalГенерация Python-кода
86.5%ср. 79.9
SWE-Bench VerifiedРеальные задачи с GitHub
23.7%ср. 32.4
Составной ScoreScore = MMLU×20% + GPQA×30% + HumanEval×25% + SWE-Bench×25%59.5

HF Open LLM Leaderboard

IFEval · BBH · MATH · GPQA · MuSR · MMLU-Pro

Среднее
48.0
View on HF →
IFEvalСледование инструкциям
86.4%ср. 79.9
BBHBig Bench Hard
61.9%ср. 48.7
MATH Lvl 5Соревновательная математика
59.8%ср. 37.8
GPQAНаучные вопросы уровня аспирантуры
16.7%ср. 12.9
MuSRМногошаговые рассуждения
11.7%ср. 10.7
MMLU-ProПрофессиональные знания
51.4%ср. 40.0

Детали

Провайдер
Alibaba/Qwen
Параметры
72B
Контекст
128K tokens
Скорость
80 tok/s
Открытый код
Да
Лицензия
Открытая (варьируется)
Релиз
-

Отзывы

Отзывов пока нет

Войдите чтобы оценить