← LLM模型View on HF →
📖上下文128K tokens
🚀速度500 tok/s
💵输入价格-
💸输出价格-
🧠参数3B
基准测试
灰色条 = 数据集平均MMLU57个学术科目
63.4%均 81.8
GPQA Diamond博士级科学问题
24.7%均 50.4
HumanEvalPython代码生成
58.3%均 79.9
SWE-Bench Verified真实GitHub工程任务
9.5%均 32.4
综合评分Score = MMLU×20% + GPQA×30% + HumanEval×25% + SWE-Bench×25%37.0
HF开放LLM排行榜
IFEval · BBH · MATH · GPQA · MuSR · MMLU-Pro
平均
24.2
IFEval指令遵循
73.9%均 79.9
BBHBig Bench Hard
24.1%均 48.7
MATH Lvl 5竞赛数学
17.7%均 37.8
GPQA研究生水平科学问答
3.8%均 12.9
MuSR多步软推理
1.4%均 10.7
MMLU-Pro专业知识
24.4%均 40.0
更多来自 Meta
详情
- 提供商
- Meta
- 参数
- 3B
- 上下文
- 128K tokens
- 速度
- 500 tok/s
- 开源
- 是
- 许可证
- 开放(各异)
- 发布
- -

