← LLM模型开源View on HF →
R1 Distill Llama 70B
DeepSeek
DeepSeek R1 Distill Llama 70B 是基于 [Llama-3.3-70B-Instruct](/meta-llama/llama-3.3-70b-instruct) 的蒸馏大语言模型,使用 [DeepSeek R1](/deepseek/deepseek-r1) 的输出。该模型结合了先进的蒸馏技术,以实现跨领域的高性能...
openrouter.ai ↗📖上下文131K tokens
🚀速度-
💵输入价格$0.800/1M
💸输出价格$0.800/1M
🧠参数70.554B
基准测试
灰色条 = 数据集平均综合评分Score = MMLU×20% + GPQA×30% + HumanEval×25% + SWE-Bench×25%-
HF开放LLM排行榜
IFEval · BBH · MATH · GPQA · MuSR · MMLU-Pro
平均
27.8
IFEval指令遵循
43.4%均 79.9
BBHBig Bench Hard
35.8%均 48.7
MATH Lvl 5竞赛数学
30.7%均 37.8
GPQA研究生水平科学问答
2.0%均 12.9
MuSR多步软推理
13.3%均 10.7
MMLU-Pro专业知识
41.6%均 40.0
更多来自 DeepSeek
详情
- 提供商
- DeepSeek
- 参数
- 70.554B
- 上下文
- 131K tokens
- 速度
- -
- 开源
- 是
- 许可证
- 开放(各异)
- 发布
- Jan 2025

