← Modelos LLMCódigo abertoView on HF →→
R1 Distill Qwen 32B
DeepSeek
DeepSeek R1 Distill Qwen 32B é um modelo destilado de linguagem grande baseado em [Qwen 2.5 32B](https://huggingface.co/Qwen/Qwen2.5-32B), usando resultados de [DeepSeek R1](/deepseek/deepseek-r1). Ele supera o o1-mini de OpenAI em vários benchmarks, alcançando novos...
openrouter.ai ↗📖Contexto128K tokens
🚀Velocidade-
💵Preço de entrada$0.290/1M
💸Preço de saída$0.290/1M
🧠Parâmetros32.764B
Benchmarks
Barra cinza = média do conjunto de dadosPontuação compostaPontuação = MMLU×20% + GPQA×30% + HumanEval×25% + SWE-Bench×25%-
Tabela de classificação HF Open LLM
IFEval · BBH · MATH · GPQA · MuSR · MMLU-Pro
Média
23.0
IFEvalSeguindo instruções
41.9%média. 79.9
BBHGrande banco duro
17.1%média. 48.7
MATH Lvl 5Matemática de Competição
17.1%média. 37.8
GPQAQuestões científicas de pós-graduação
4.6%média. 12.9
MuSRRaciocínio em vários estágios
16.1%média. 10.7
MMLU-ProConhecimento profissional
41.0%média. 40.0
Criado por
🏢
DeepSeek
providerMais de DeepSeek
Provedores de API
Detalhes
- Fornecedor
- DeepSeek
- Parâmetros
- 32.764B
- Contexto
- 128K tokens
- Velocidade
- -
- Código aberto
- Sim
- Licença
- Aberto (varia)
- Lançado
- Jan 2025

