TECHAGENT - MY AI LIFE
LLM模型
56评分

Llama 3.1 70B

#29开源

Meta

最佳开放70B型号。非常适合微调和自托管。

官方页面 →
📖上下文128K tokens
🚀速度150 tok/s
💵输入价格-
💸输出价格-
🧠参数70B

基准测试

灰色条 = 数据集平均
MMLU57个学术科目
83.6% 81.8
GPQA Diamond博士级科学问题
46.7% 50.4
HumanEvalPython代码生成
80.5% 79.9
SWE-Bench Verified真实GitHub工程任务
21.8% 32.4
综合评分Score = MMLU×20% + GPQA×30% + HumanEval×25% + SWE-Bench×25%56.3

HF开放LLM排行榜

IFEval · BBH · MATH · GPQA · MuSR · MMLU-Pro

平均
43.4
View on HF →
IFEval指令遵循
86.7% 79.9
BBHBig Bench Hard
55.9% 48.7
MATH Lvl 5竞赛数学
38.1% 37.8
GPQA研究生水平科学问答
14.2% 12.9
MuSR多步软推理
17.7% 10.7
MMLU-Pro专业知识
47.9% 40.0

详情

提供商
Meta
参数
70B
上下文
128K tokens
速度
150 tok/s
开源
许可证
开放(各异)
发布
-

评论

暂无评论

登录后评分