Saltar al contenido
FB
Frontier Benchmarks AI
Modelos
Wizard
Battle
Hardware
Pricing
Methodology
Descargar
Buscar
/
EN
ES
Home
Modelos
Wizard
Battle
Hardware
Pricing
Methodology
Descargar
home
/
benchmarks
/
Terminal-Bench-Hard
Coding
Terminal-Bench-Hard
Tareas dificiles de terminal/CLI.
1 modelos publicaron score
#
Modelo
Empresa
Score
1
Claude Opus 4.5
Anthropic
44.0
← Todos los benchmarks
Como medimos