TECHAGENT - MY AI LIFE
Model LLM

R1 Distill Qwen 32B

Open Source

DeepSeek

DeepSeek R1 Distill Qwen 32B adalah model bahasa besar yang disaring berdasarkan [Qwen 2.5 32B](https://huggingface.co/Qwen/Qwen2.5-32B), menggunakan keluaran dari [DeepSeek R1](/deepseek/deepseek-r1). Performanya mengungguli o1-mini OpenAI di berbagai tolok ukur, mencapai...

openrouter.ai ↗
📖Konteks128K tokens
🚀Kecepatan-
💵Harga input$0.290/1M
💸Harga output$0.290/1M
🧠Parameter32.764B

Benchmark

Batang abu = rata-rata dataset
Skor kompositScore = MMLU×20% + GPQA×30% + HumanEval×25% + SWE-Bench×25%-

HF Open LLM Leaderboard

IFEval · BBH · MATH · GPQA · MuSR · MMLU-Pro

Rata-rata
23.0
View on HF →
IFEvalMengikuti instruksi
41.9%rata 79.9
BBHBig Bench Hard
17.1%rata 48.7
MATH Lvl 5Matematika kompetisi
17.1%rata 37.8
GPQASains Q&A level pascasarjana
4.6%rata 12.9
MuSRPenalaran multistep
16.1%rata 10.7
MMLU-ProPengetahuan profesional
41.0%rata 40.0

Detail

Penyedia
DeepSeek
Parameter
32.764B
Konteks
128K tokens
Kecepatan
-
Open Source
Ya
Lisensi
Terbuka (bervariasi)
Rilis
Jan 2025

Ulasan

Belum ada ulasan

Masuk untuk memberi nilai