TECHAGENT - MY AI LIFE
LLM मॉडल
60स्कोर

Qwen 2.5 72B

#25ओपन सोर्स

Alibaba/Qwen

अलीबाबा का खुला पावरहाउस. कोडिंग और गणित बेंचमार्क में 72बी पर शीर्ष पर।

आधिकारिक पृष्ठ →
📖संदर्भ128K tokens
🚀गति80 tok/s
💵इनपुट मूल्य-
💸आउटपुट मूल्य-
🧠पैरामीटर72B

बेंचमार्क

ग्रे बार = डेटासेट औसत
MMLU57 शैक्षणिक विषय
86.1%औसत 81.8
GPQA DiamondPhD स्तर के विज्ञान प्रश्न
49.0%औसत 50.4
HumanEvalPython कोड जनरेशन
86.5%औसत 79.9
SWE-Bench Verifiedवास्तविक GitHub कार्य
23.7%औसत 32.4
समग्र स्कोरScore = MMLU×20% + GPQA×30% + HumanEval×25% + SWE-Bench×25%59.5

HF Open LLM Leaderboard

IFEval · BBH · MATH · GPQA · MuSR · MMLU-Pro

औसत
48.0
View on HF →
IFEvalनिर्देश पालन
86.4%औसत 79.9
BBHBig Bench Hard
61.9%औसत 48.7
MATH Lvl 5प्रतिस्पर्धी गणित
59.8%औसत 37.8
GPQAस्नातक स्तर विज्ञान Q&A
16.7%औसत 12.9
MuSRबहु-चरणीय तर्क
11.7%औसत 10.7
MMLU-Proव्यावसायिक ज्ञान
51.4%औसत 40.0

विवरण

प्रदाता
Alibaba/Qwen
पैरामीटर
72B
संदर्भ
128K tokens
गति
80 tok/s
ओपन सोर्स
हां
लाइसेंस
खुला (अलग-अलग)
रिलीज़
-

समीक्षाएं

अभी तक कोई समीक्षा नहीं

रेट करने के लिए लॉग इन करें