TECHAGENT - MY AI LIFE
LLM模型
60评分

Qwen 2.5 72B

#25开源

Alibaba/Qwen

阿里巴巴的开放巨头。编码和数学基准测试最高为 72B。

官方页面 →
📖上下文128K tokens
🚀速度80 tok/s
💵输入价格-
💸输出价格-
🧠参数72B

基准测试

灰色条 = 数据集平均
MMLU57个学术科目
86.1% 81.8
GPQA Diamond博士级科学问题
49.0% 50.4
HumanEvalPython代码生成
86.5% 79.9
SWE-Bench Verified真实GitHub工程任务
23.7% 32.4
综合评分Score = MMLU×20% + GPQA×30% + HumanEval×25% + SWE-Bench×25%59.5

HF开放LLM排行榜

IFEval · BBH · MATH · GPQA · MuSR · MMLU-Pro

平均
48.0
View on HF →
IFEval指令遵循
86.4% 79.9
BBHBig Bench Hard
61.9% 48.7
MATH Lvl 5竞赛数学
59.8% 37.8
GPQA研究生水平科学问答
16.7% 12.9
MuSR多步软推理
11.7% 10.7
MMLU-Pro专业知识
51.4% 40.0

详情

提供商
Alibaba/Qwen
参数
72B
上下文
128K tokens
速度
80 tok/s
开源
许可证
开放(各异)
发布
-

评论

暂无评论

登录后评分