TECHAGENT - MY AI LIFE
Model LLM
37Skor

Llama 3.2 3B

#35Open Source

Meta

Kecil tapi mampu. Berjalan di perangkat (ponsel/laptop). 500+ tok/dtk pada GPU konsumen.

Halaman resmi →
📖Konteks128K tokens
🚀Kecepatan500 tok/s
💵Harga input-
💸Harga output-
🧠Parameter3B

Benchmark

Batang abu = rata-rata dataset
MMLU57 subjek akademik
63.4%rata 81.8
GPQA DiamondPertanyaan sains level PhD
24.7%rata 50.4
HumanEvalPembuatan kode Python
58.3%rata 79.9
SWE-Bench VerifiedTugas rekayasa GitHub nyata
9.5%rata 32.4
Skor kompositScore = MMLU×20% + GPQA×30% + HumanEval×25% + SWE-Bench×25%37.0

HF Open LLM Leaderboard

IFEval · BBH · MATH · GPQA · MuSR · MMLU-Pro

Rata-rata
24.2
View on HF →
IFEvalMengikuti instruksi
73.9%rata 79.9
BBHBig Bench Hard
24.1%rata 48.7
MATH Lvl 5Matematika kompetisi
17.7%rata 37.8
GPQASains Q&A level pascasarjana
3.8%rata 12.9
MuSRPenalaran multistep
1.4%rata 10.7
MMLU-ProPengetahuan profesional
24.4%rata 40.0

Detail

Penyedia
Meta
Parameter
3B
Konteks
128K tokens
Kecepatan
500 tok/s
Open Source
Ya
Lisensi
Terbuka (bervariasi)
Rilis
-

Ulasan

Belum ada ulasan

Masuk untuk memberi nilai