Changelog
Lo que cambia en Frontier Benchmarks AI. Cada entrada esta firmada con su fecha y tag — sin retoques retroactivos.
Tags
- data (1) actualizaciones de scores, pricing, modelos nuevos
- product (5) features nuevas (vistas, herramientas, UI)
- methodology (1) cambios de criterio, formula, definiciones
-
Pricing Calculator cross-provider
productTCO mensual estimado por modelo + provider. Inputs: M tokens input/output/cached. Compara hasta 12 modelos sorted asc por costo. Cache support cuando el provider lo expone.
-
Use Case Wizard recommender
productWizard de 4 pasos para recomendar top 3 modelos por uso (coding, math, writing, vision, agent, RAG, summarization, translation). Composite = baseScore × coverage × priorityFactor.
-
Battle Mode head-to-head
productComparativa de 2-4 modelos side-by-side benchmark por benchmark. URL compartible con ?models=a,b,c. Verdict global con winner por wins, abstenciones cuando no hay score.
-
Hardware Compatibility Checker
productDetecta GPU/RAM/CPU del navegador (con limitaciones honestas Firefox/Safari) y clasifica cada modelo en tier S/A/B/C/D/F segun VRAM disponible y quantization. Multi-GPU 1-8.
-
Enrichment de modelos open source
dataAgregamos params totales, params activos (MoE), licencia, pricing cross-provider y comandos de instalacion (Ollama / LM Studio / vLLM) a los principales modelos open weight.
-
Definicion de "comparable" en battles
methodologyUn benchmark es comparable solo si 2+ modelos del battle tienen score publicado. Si un modelo no tiene score, se cuenta como abstained (no afecta winRate).
-
Lanzamiento Frontier Benchmarks AI
productPrimera version publica del atlas. 62 modelos, 32 benchmarks, 25 empresas. Vistas Catalog, Modelos individuales, Benchmarks, Companies, Methodology y Download single-file.