R1 Distill Llama 70B

开源

DeepSeek

DeepSeek R1 Distill Llama 70B 是基于 [Llama-3.3-70B-Instruct](/meta-llama/llama-3.3-70b-instruct) 的蒸馏大语言模型，使用 [DeepSeek R1](/deepseek/deepseek-r1) 的输出。该模型结合了先进的蒸馏技术，以实现跨领域的高性能...

openrouter.ai ↗

📖上下文131K tokens

🚀速度-

💵输入价格$0.800/1M

💸输出价格$0.800/1M

🧠参数70.554B

基准测试

灰色条 = 数据集平均

综合评分Score = MMLU×20% + GPQA×30% + HumanEval×25% + SWE-Bench×25%-

HF开放LLM排行榜

IFEval · BBH · MATH · GPQA · MuSR · MMLU-Pro

平均

27.8

IFEval指令遵循

43.4%均 79.9

BBHBig Bench Hard

35.8%均 48.7

MATH Lvl 5竞赛数学

30.7%均 37.8

GPQA研究生水平科学问答

2.0%均 12.9

MuSR多步软推理

13.3%均 10.7

MMLU-Pro专业知识

41.6%均 40.0

开发者

更多来自 DeepSeek

Score 75$0.700/1M→

Score 68$0.200/1M→

R1 Distill Qwen 32BOSS

DeepSeek V3.2 Exp

API提供商

详情

提供商: DeepSeek
参数: 70.554B
上下文: 131K tokens
速度: -
开源: 是
许可证: 开放（各异）
发布: Jan 2025

评论

暂无评论

登录后评分

← 查看全部 381个模型