TECHAGENT - MY AI LIFE
LLM模型

R1 Distill Llama 70B

开源

DeepSeek

DeepSeek R1 Distill Llama 70B 是基于 [Llama-3.3-70B-Instruct](/meta-llama/llama-3.3-70b-instruct) 的蒸馏大语言模型,使用 [DeepSeek R1](/deepseek/deepseek-r1) 的输出。该模型结合了先进的蒸馏技术,以实现跨领域的高性能...

openrouter.ai ↗
📖上下文131K tokens
🚀速度-
💵输入价格$0.800/1M
💸输出价格$0.800/1M
🧠参数70.554B

基准测试

灰色条 = 数据集平均
综合评分Score = MMLU×20% + GPQA×30% + HumanEval×25% + SWE-Bench×25%-

HF开放LLM排行榜

IFEval · BBH · MATH · GPQA · MuSR · MMLU-Pro

平均
27.8
View on HF →
IFEval指令遵循
43.4% 79.9
BBHBig Bench Hard
35.8% 48.7
MATH Lvl 5竞赛数学
30.7% 37.8
GPQA研究生水平科学问答
2.0% 12.9
MuSR多步软推理
13.3% 10.7
MMLU-Pro专业知识
41.6% 40.0

详情

提供商
DeepSeek
参数
70.554B
上下文
131K tokens
速度
-
开源
许可证
开放(各异)
发布
Jan 2025

评论

暂无评论

登录后评分