TECHAGENT - MY AI LIFE
LLM模型
59评分

Qwen 2.5 Coder 32B

#26开源

Alibaba/Qwen

最先进的开源编码模型。强大的 HumanEval 分数。

官方页面 →
📖上下文128K tokens
🚀速度90 tok/s
💵输入价格-
💸输出价格-
🧠参数32B

基准测试

灰色条 = 数据集平均
MMLU57个学术科目
80.0% 81.8
GPQA Diamond博士级科学问题
42.0% 50.4
HumanEvalPython代码生成
92.3% 79.9
SWE-Bench Verified真实GitHub工程任务
30.0% 32.4
综合评分Score = MMLU×20% + GPQA×30% + HumanEval×25% + SWE-Bench×25%59.2

HF开放LLM排行榜

IFEval · BBH · MATH · GPQA · MuSR · MMLU-Pro

平均
39.9
View on HF →
IFEval指令遵循
72.7% 79.9
BBHBig Bench Hard
52.3% 48.7
MATH Lvl 5竞赛数学
49.5% 37.8
GPQA研究生水平科学问答
13.2% 12.9
MuSR多步软推理
13.7% 10.7
MMLU-Pro专业知识
37.9% 40.0

详情

提供商
Alibaba/Qwen
参数
32B
上下文
128K tokens
速度
90 tok/s
开源
许可证
开放(各异)
发布
-

评论

暂无评论

登录后评分