Saltar al contenido

Changelog

Lo que cambia en Frontier Benchmarks AI. Cada entrada esta firmada con su fecha y tag — sin retoques retroactivos.

7 entries · ultimo: 2026-05-01 · RSS feed

Tags

  • data (1) actualizaciones de scores, pricing, modelos nuevos
  • product (5) features nuevas (vistas, herramientas, UI)
  • methodology (1) cambios de criterio, formula, definiciones
  1. Pricing Calculator cross-provider

    product

    TCO mensual estimado por modelo + provider. Inputs: M tokens input/output/cached. Compara hasta 12 modelos sorted asc por costo. Cache support cuando el provider lo expone.

  2. Use Case Wizard recommender

    product

    Wizard de 4 pasos para recomendar top 3 modelos por uso (coding, math, writing, vision, agent, RAG, summarization, translation). Composite = baseScore × coverage × priorityFactor.

  3. Battle Mode head-to-head

    product

    Comparativa de 2-4 modelos side-by-side benchmark por benchmark. URL compartible con ?models=a,b,c. Verdict global con winner por wins, abstenciones cuando no hay score.

  4. Hardware Compatibility Checker

    product

    Detecta GPU/RAM/CPU del navegador (con limitaciones honestas Firefox/Safari) y clasifica cada modelo en tier S/A/B/C/D/F segun VRAM disponible y quantization. Multi-GPU 1-8.

  5. Enrichment de modelos open source

    data

    Agregamos params totales, params activos (MoE), licencia, pricing cross-provider y comandos de instalacion (Ollama / LM Studio / vLLM) a los principales modelos open weight.

  6. Definicion de "comparable" en battles

    methodology

    Un benchmark es comparable solo si 2+ modelos del battle tienen score publicado. Si un modelo no tiene score, se cuenta como abstained (no afecta winRate).

  7. Lanzamiento Frontier Benchmarks AI

    product

    Primera version publica del atlas. 62 modelos, 32 benchmarks, 25 empresas. Vistas Catalog, Modelos individuales, Benchmarks, Companies, Methodology y Download single-file.