TECHAGENT - MY AI LIFE
LLM模型

R1 Distill Qwen 32B

开源

DeepSeek

DeepSeek R1 Distill Qwen 32B 是基于 [Qwen 2.5 32B](https://huggingface.co/Qwen/Qwen2.5-32B) 的蒸馏大语言模型,使用 [DeepSeek R1](/deepseek/deepseek-r1) 的输出。它在各种基准测试中均优于 OpenAI 的 o1-mini,实现了新的...

openrouter.ai ↗
📖上下文128K tokens
🚀速度-
💵输入价格$0.290/1M
💸输出价格$0.290/1M
🧠参数32.764B

基准测试

灰色条 = 数据集平均
综合评分Score = MMLU×20% + GPQA×30% + HumanEval×25% + SWE-Bench×25%-

HF开放LLM排行榜

IFEval · BBH · MATH · GPQA · MuSR · MMLU-Pro

平均
23.0
View on HF →
IFEval指令遵循
41.9% 79.9
BBHBig Bench Hard
17.1% 48.7
MATH Lvl 5竞赛数学
17.1% 37.8
GPQA研究生水平科学问答
4.6% 12.9
MuSR多步软推理
16.1% 10.7
MMLU-Pro专业知识
41.0% 40.0

详情

提供商
DeepSeek
参数
32.764B
上下文
128K tokens
速度
-
开源
许可证
开放(各异)
发布
Jan 2025

评论

暂无评论

登录后评分