TECHAGENT - MY AI LIFE
Modelos LLM
59Pontuação

Qwen 2.5 Coder 32B

#26Código aberto

Alibaba/Qwen

Modelo de codificação de código aberto de última geração. Pontuação HumanEval forte.

Página oficial →
📖Contexto128K tokens
🚀Velocidade90 tok/s
💵Preço de entrada-
💸Preço de saída-
🧠Parâmetros32B

Benchmarks

Barra cinza = média do conjunto de dados
MMLU57 disciplinas acadêmicas
80.0%média. 81.8
GPQA DiamondQuestões científicas de nível de doutorado
42.0%média. 50.4
HumanEvalGeração de código Python
92.3%média. 79.9
SWE-Bench VerifiedTarefas reais do GitHub
30.0%média. 32.4
Pontuação compostaPontuação = MMLU×20% + GPQA×30% + HumanEval×25% + SWE-Bench×25%59.2

Tabela de classificação HF Open LLM

IFEval · BBH · MATH · GPQA · MuSR · MMLU-Pro

Média
39.9
View on HF →
IFEvalSeguindo instruções
72.7%média. 79.9
BBHGrande banco duro
52.3%média. 48.7
MATH Lvl 5Matemática de Competição
49.5%média. 37.8
GPQAQuestões científicas de pós-graduação
13.2%média. 12.9
MuSRRaciocínio em vários estágios
13.7%média. 10.7
MMLU-ProConhecimento profissional
37.9%média. 40.0

Detalhes

Fornecedor
Alibaba/Qwen
Parâmetros
32B
Contexto
128K tokens
Velocidade
90 tok/s
Código aberto
Sim
Licença
Aberto (varia)
Lançado
-

Avaliações

Ainda não há comentários

Faça login para avaliar