← LLM मॉडलओपन सोर्सView on HF →→
R1 Distill Qwen 32B
DeepSeek
DeepSeek R1 डिस्टिल Qwen 32B एक डिस्टिल्ड बड़ा भाषा मॉडल है जो [Qwen 2.5 32B](https://huggingface.co/Qwen/Qwen2.5-32B) पर आधारित है, जो [DeepSeek R1](/deepseek/deepseek-r1) के आउटपुट का उपयोग करता है। यह विभिन्न बेंचमार्क में OpenAI के o1-मिनी से बेहतर प्रदर्शन करता है, नई उपलब्धि हासिल करता है...
openrouter.ai ↗📖संदर्भ128K tokens
🚀गति-
💵इनपुट मूल्य$0.290/1M
💸आउटपुट मूल्य$0.290/1M
🧠पैरामीटर32.764B
बेंचमार्क
ग्रे बार = डेटासेट औसतसमग्र स्कोरScore = MMLU×20% + GPQA×30% + HumanEval×25% + SWE-Bench×25%-
HF Open LLM Leaderboard
IFEval · BBH · MATH · GPQA · MuSR · MMLU-Pro
औसत
23.0
IFEvalनिर्देश पालन
41.9%औसत 79.9
BBHBig Bench Hard
17.1%औसत 48.7
MATH Lvl 5प्रतिस्पर्धी गणित
17.1%औसत 37.8
GPQAस्नातक स्तर विज्ञान Q&A
4.6%औसत 12.9
MuSRबहु-चरणीय तर्क
16.1%औसत 10.7
MMLU-Proव्यावसायिक ज्ञान
41.0%औसत 40.0
द्वारा बनाया गया
🏢
DeepSeek
providerऔर से DeepSeek
API प्रदाता
विवरण
- प्रदाता
- DeepSeek
- पैरामीटर
- 32.764B
- संदर्भ
- 128K tokens
- गति
- -
- ओपन सोर्स
- हां
- लाइसेंस
- खुला (अलग-अलग)
- रिलीज़
- Jan 2025

