R1 Distill Qwen 32B

开源

DeepSeek

DeepSeek R1 Distill Qwen 32B 是基于 [Qwen 2.5 32B](https://huggingface.co/Qwen/Qwen2.5-32B) 的蒸馏大语言模型，使用 [DeepSeek R1](/deepseek/deepseek-r1) 的输出。它在各种基准测试中均优于 OpenAI 的 o1-mini，实现了新的...

openrouter.ai ↗

📖上下文128K tokens

🚀速度-

💵输入价格$0.290/1M

💸输出价格$0.290/1M

🧠参数32.764B

基准测试

灰色条 = 数据集平均

综合评分Score = MMLU×20% + GPQA×30% + HumanEval×25% + SWE-Bench×25%-

HF开放LLM排行榜

IFEval · BBH · MATH · GPQA · MuSR · MMLU-Pro

平均

23.0

IFEval指令遵循

41.9%均 79.9

BBHBig Bench Hard

17.1%均 48.7

MATH Lvl 5竞赛数学

17.1%均 37.8

GPQA研究生水平科学问答

4.6%均 12.9

MuSR多步软推理

16.1%均 10.7

MMLU-Pro专业知识

41.0%均 40.0

开发者

更多来自 DeepSeek

Score 75$0.700/1M→

Score 68$0.200/1M→

R1 Distill Llama 70BOSS

DeepSeek V3.2 Exp

API提供商

详情

提供商: DeepSeek
参数: 32.764B
上下文: 128K tokens
速度: -
开源: 是
许可证: 开放（各异）
发布: Jan 2025

评论

暂无评论

登录后评分

← 查看全部 381个模型