TECHAGENT - MY AI LIFE
LLM模型
37评分

Llama 3.2 3B

#35开源

Meta

虽小但能干。在设备(手机/笔记本电脑)上运行。消费级 GPU 上的速度超过 500 tok/s。

官方页面 →
📖上下文128K tokens
🚀速度500 tok/s
💵输入价格-
💸输出价格-
🧠参数3B

基准测试

灰色条 = 数据集平均
MMLU57个学术科目
63.4% 81.8
GPQA Diamond博士级科学问题
24.7% 50.4
HumanEvalPython代码生成
58.3% 79.9
SWE-Bench Verified真实GitHub工程任务
9.5% 32.4
综合评分Score = MMLU×20% + GPQA×30% + HumanEval×25% + SWE-Bench×25%37.0

HF开放LLM排行榜

IFEval · BBH · MATH · GPQA · MuSR · MMLU-Pro

平均
24.2
View on HF →
IFEval指令遵循
73.9% 79.9
BBHBig Bench Hard
24.1% 48.7
MATH Lvl 5竞赛数学
17.7% 37.8
GPQA研究生水平科学问答
3.8% 12.9
MuSR多步软推理
1.4% 10.7
MMLU-Pro专业知识
24.4% 40.0

详情

提供商
Meta
参数
3B
上下文
128K tokens
速度
500 tok/s
开源
许可证
开放(各异)
发布
-

评论

暂无评论

登录后评分