TECHAGENT - MY AI LIFE
Model LLM
59Skor

Qwen 2.5 Coder 32B

#26Open Source

Alibaba/Qwen

Model pengkodean sumber terbuka yang canggih. Skor HumanEval yang kuat.

Halaman resmi →
📖Konteks128K tokens
🚀Kecepatan90 tok/s
💵Harga input-
💸Harga output-
🧠Parameter32B

Benchmark

Batang abu = rata-rata dataset
MMLU57 subjek akademik
80.0%rata 81.8
GPQA DiamondPertanyaan sains level PhD
42.0%rata 50.4
HumanEvalPembuatan kode Python
92.3%rata 79.9
SWE-Bench VerifiedTugas rekayasa GitHub nyata
30.0%rata 32.4
Skor kompositScore = MMLU×20% + GPQA×30% + HumanEval×25% + SWE-Bench×25%59.2

HF Open LLM Leaderboard

IFEval · BBH · MATH · GPQA · MuSR · MMLU-Pro

Rata-rata
39.9
View on HF →
IFEvalMengikuti instruksi
72.7%rata 79.9
BBHBig Bench Hard
52.3%rata 48.7
MATH Lvl 5Matematika kompetisi
49.5%rata 37.8
GPQASains Q&A level pascasarjana
13.2%rata 12.9
MuSRPenalaran multistep
13.7%rata 10.7
MMLU-ProPengetahuan profesional
37.9%rata 40.0

Detail

Penyedia
Alibaba/Qwen
Parameter
32B
Konteks
128K tokens
Kecepatan
90 tok/s
Open Source
Ya
Lisensi
Terbuka (bervariasi)
Rilis
-

Ulasan

Belum ada ulasan

Masuk untuk memberi nilai