TECHAGENT - MY AI LIFE
Model LLM
60Skor

Qwen 2.5 72B

#25Open Source

Alibaba/Qwen

Pembangkit tenaga listrik terbuka Alibaba. Mengungguli tolok ukur pengkodean dan matematika di 72B.

Halaman resmi →
📖Konteks128K tokens
🚀Kecepatan80 tok/s
💵Harga input-
💸Harga output-
🧠Parameter72B

Benchmark

Batang abu = rata-rata dataset
MMLU57 subjek akademik
86.1%rata 81.8
GPQA DiamondPertanyaan sains level PhD
49.0%rata 50.4
HumanEvalPembuatan kode Python
86.5%rata 79.9
SWE-Bench VerifiedTugas rekayasa GitHub nyata
23.7%rata 32.4
Skor kompositScore = MMLU×20% + GPQA×30% + HumanEval×25% + SWE-Bench×25%59.5

HF Open LLM Leaderboard

IFEval · BBH · MATH · GPQA · MuSR · MMLU-Pro

Rata-rata
48.0
View on HF →
IFEvalMengikuti instruksi
86.4%rata 79.9
BBHBig Bench Hard
61.9%rata 48.7
MATH Lvl 5Matematika kompetisi
59.8%rata 37.8
GPQASains Q&A level pascasarjana
16.7%rata 12.9
MuSRPenalaran multistep
11.7%rata 10.7
MMLU-ProPengetahuan profesional
51.4%rata 40.0

Detail

Penyedia
Alibaba/Qwen
Parameter
72B
Konteks
128K tokens
Kecepatan
80 tok/s
Open Source
Ya
Lisensi
Terbuka (bervariasi)
Rilis
-

Ulasan

Belum ada ulasan

Masuk untuk memberi nilai