R1 Distill Qwen 32B

Open Source

DeepSeek

DeepSeek R1 Distill Qwen 32B adalah model bahasa besar yang disaring berdasarkan [Qwen 2.5 32B](https://huggingface.co/Qwen/Qwen2.5-32B), menggunakan keluaran dari [DeepSeek R1](/deepseek/deepseek-r1). Performanya mengungguli o1-mini OpenAI di berbagai tolok ukur, mencapai...

openrouter.ai ↗

📖Konteks128K tokens

🚀Kecepatan-

💵Harga input$0.290/1M

💸Harga output$0.290/1M

🧠Parameter32.764B

Benchmark

Batang abu = rata-rata dataset

Skor kompositScore = MMLU×20% + GPQA×30% + HumanEval×25% + SWE-Bench×25%-

HF Open LLM Leaderboard

IFEval · BBH · MATH · GPQA · MuSR · MMLU-Pro

Rata-rata

23.0

IFEvalMengikuti instruksi

41.9%rata 79.9

BBHBig Bench Hard

17.1%rata 48.7

MATH Lvl 5Matematika kompetisi

17.1%rata 37.8

GPQASains Q&A level pascasarjana

4.6%rata 12.9

MuSRPenalaran multistep

16.1%rata 10.7

MMLU-ProPengetahuan profesional

41.0%rata 40.0

Dibuat oleh

Lebih dari DeepSeek

Score 75$0.700/1M→

Score 68$0.200/1M→

R1 Distill Llama 70BOSS

DeepSeek V3.2 Exp

Penyedia API

Detail

Penyedia: DeepSeek
Parameter: 32.764B
Konteks: 128K tokens
Kecepatan: -
Open Source: Ya
Lisensi: Terbuka (bervariasi)
Rilis: Jan 2025

Ulasan

Belum ada ulasan

Masuk untuk memberi nilai

← Lihat semua 381 model