TECHAGENT - MY AI LIFE
Modelos LLM

R1 Distill Llama 70B

Código aberto

DeepSeek

DeepSeek R1 Distill Llama 70B é um modelo destilado de linguagem grande baseado em [Llama-3.3-70B-Instruct](/meta-llama/llama-3.3-70b-instruct), usando saídas de [DeepSeek R1](/deepseek/deepseek-r1). O modelo combina técnicas avançadas de destilação para alcançar alto desempenho em...

openrouter.ai ↗
📖Contexto131K tokens
🚀Velocidade-
💵Preço de entrada$0.800/1M
💸Preço de saída$0.800/1M
🧠Parâmetros70.554B

Benchmarks

Barra cinza = média do conjunto de dados
Pontuação compostaPontuação = MMLU×20% + GPQA×30% + HumanEval×25% + SWE-Bench×25%-

Tabela de classificação HF Open LLM

IFEval · BBH · MATH · GPQA · MuSR · MMLU-Pro

Média
27.8
View on HF →
IFEvalSeguindo instruções
43.4%média. 79.9
BBHGrande banco duro
35.8%média. 48.7
MATH Lvl 5Matemática de Competição
30.7%média. 37.8
GPQAQuestões científicas de pós-graduação
2.0%média. 12.9
MuSRRaciocínio em vários estágios
13.3%média. 10.7
MMLU-ProConhecimento profissional
41.6%média. 40.0

Detalhes

Fornecedor
DeepSeek
Parâmetros
70.554B
Contexto
131K tokens
Velocidade
-
Código aberto
Sim
Licença
Aberto (varia)
Lançado
Jan 2025

Avaliações

Ainda não há comentários

Faça login para avaliar