← LLM模型View on HF →
📖上下文128K tokens
🚀速度90 tok/s
💵输入价格-
💸输出价格-
🧠参数32B
基准测试
灰色条 = 数据集平均MMLU57个学术科目
80.0%均 81.8
GPQA Diamond博士级科学问题
42.0%均 50.4
HumanEvalPython代码生成
92.3%均 79.9
SWE-Bench Verified真实GitHub工程任务
30.0%均 32.4
综合评分Score = MMLU×20% + GPQA×30% + HumanEval×25% + SWE-Bench×25%59.2
HF开放LLM排行榜
IFEval · BBH · MATH · GPQA · MuSR · MMLU-Pro
平均
39.9
IFEval指令遵循
72.7%均 79.9
BBHBig Bench Hard
52.3%均 48.7
MATH Lvl 5竞赛数学
49.5%均 37.8
GPQA研究生水平科学问答
13.2%均 12.9
MuSR多步软推理
13.7%均 10.7
MMLU-Pro专业知识
37.9%均 40.0
更多来自 Alibaba/Qwen
详情
- 提供商
- Alibaba/Qwen
- 参数
- 32B
- 上下文
- 128K tokens
- 速度
- 90 tok/s
- 开源
- 是
- 许可证
- 开放(各异)
- 发布
- -

