TECHAGENT - MY AI LIFE
Modelos LLM
59Puntuación

Qwen 2.5 Coder 32B

#26Código abierto

Alibaba/Qwen

Modelo de codificación de código abierto de última generación. Fuerte puntuación de HumanEval.

Página oficial →
📖Contexto128K tokens
🚀Velocidad90 tok/s
💵Precio entrada-
💸Precio salida-
🧠Parámetros32B

Benchmarks

Barra gris = promedio del dataset
MMLU57 materias académicas
80.0%prom. 81.8
GPQA DiamondPreguntas científicas de nivel PhD
42.0%prom. 50.4
HumanEvalGeneración de código Python
92.3%prom. 79.9
SWE-Bench VerifiedTareas reales de GitHub
30.0%prom. 32.4
Puntuación compuestaScore = MMLU×20% + GPQA×30% + HumanEval×25% + SWE-Bench×25%59.2

HF Open LLM Leaderboard

IFEval · BBH · MATH · GPQA · MuSR · MMLU-Pro

Promedio
39.9
View on HF →
IFEvalSeguimiento de instrucciones
72.7%prom. 79.9
BBHBig Bench Hard
52.3%prom. 48.7
MATH Lvl 5Matemáticas de competición
49.5%prom. 37.8
GPQAPreguntas científicas de posgrado
13.2%prom. 12.9
MuSRRazonamiento multietapa
13.7%prom. 10.7
MMLU-ProConocimiento profesional
37.9%prom. 40.0

Detalles

Proveedor
Alibaba/Qwen
Parámetros
32B
Contexto
128K tokens
Velocidad
90 tok/s
Código abierto
Licencia
Abierta (varía)
Lanzado
-

Reseñas

Sin reseñas aún

Inicia sesión para valorar