← Modelos LLM

R1 Distill Qwen 32B

Código aberto

DeepSeek

DeepSeek R1 Distill Qwen 32B é um modelo destilado de linguagem grande baseado em [Qwen 2.5 32B](https://huggingface.co/Qwen/Qwen2.5-32B), usando resultados de [DeepSeek R1](/deepseek/deepseek-r1). Ele supera o o1-mini de OpenAI em vários benchmarks, alcançando novos...

openrouter.ai ↗

📖Contexto128K tokens

🚀Velocidade-

💵Preço de entrada$0.290/1M

💸Preço de saída$0.290/1M

🧠Parâmetros32.764B

Benchmarks

Barra cinza = média do conjunto de dados

Pontuação compostaPontuação = MMLU×20% + GPQA×30% + HumanEval×25% + SWE-Bench×25%-

Tabela de classificação HF Open LLM

IFEval · BBH · MATH · GPQA · MuSR · MMLU-Pro

Média

23.0

IFEvalSeguindo instruções

41.9%média. 79.9

BBHGrande banco duro

17.1%média. 48.7

MATH Lvl 5Matemática de Competição

17.1%média. 37.8

GPQAQuestões científicas de pós-graduação

4.6%média. 12.9

MuSRRaciocínio em vários estágios

16.1%média. 10.7

MMLU-ProConhecimento profissional

41.0%média. 40.0

Criado por

Mais de DeepSeek

Score 75$0.700/1M→

Score 68$0.200/1M→

R1 Distill Llama 70BOSS

DeepSeek V3.2 Exp

Provedores de API

Detalhes

Fornecedor: DeepSeek
Parâmetros: 32.764B
Contexto: 128K tokens
Velocidade: -
Código aberto: Sim
Licença: Aberto (varia)
Lançado: Jan 2025

Avaliações

Ainda não há comentários

Faça login para avaliar

← Ver tudo 381 modelos