TECHAGENT - MY AI LIFE
Modelos LLM
37Puntuación

Llama 3.2 3B

#35Código abierto

Meta

Pequeño pero capaz. Se ejecuta en el dispositivo (teléfono/portátil). Más de 500 tok/s en GPU de consumo.

Página oficial →
📖Contexto128K tokens
🚀Velocidad500 tok/s
💵Precio entrada-
💸Precio salida-
🧠Parámetros3B

Benchmarks

Barra gris = promedio del dataset
MMLU57 materias académicas
63.4%prom. 81.8
GPQA DiamondPreguntas científicas de nivel PhD
24.7%prom. 50.4
HumanEvalGeneración de código Python
58.3%prom. 79.9
SWE-Bench VerifiedTareas reales de GitHub
9.5%prom. 32.4
Puntuación compuestaScore = MMLU×20% + GPQA×30% + HumanEval×25% + SWE-Bench×25%37.0

HF Open LLM Leaderboard

IFEval · BBH · MATH · GPQA · MuSR · MMLU-Pro

Promedio
24.2
View on HF →
IFEvalSeguimiento de instrucciones
73.9%prom. 79.9
BBHBig Bench Hard
24.1%prom. 48.7
MATH Lvl 5Matemáticas de competición
17.7%prom. 37.8
GPQAPreguntas científicas de posgrado
3.8%prom. 12.9
MuSRRazonamiento multietapa
1.4%prom. 10.7
MMLU-ProConocimiento profesional
24.4%prom. 40.0

Detalles

Proveedor
Meta
Parámetros
3B
Contexto
128K tokens
Velocidad
500 tok/s
Código abierto
Licencia
Abierta (varía)
Lanzado
-

Reseñas

Sin reseñas aún

Inicia sesión para valorar