Hardware Checker
What LLM can I run on my PC? Pick your GPU, choose a quantization and a context, and the checker classifies all 111 models in the atlas into S/A/B/C/D/F tiers.
Your hardware
Result · 24 GB VRAM · Q4_K_M · context 8,000
Cabe en Q4_K_M con margen amplio (3 GB / 24 GB). Contexto largo y batching OK.
Cabe comodo en Q4_K_M (13 GB / 24 GB). Margen para batch normal.
Cabe comodo en Q4_K_M (13 GB / 24 GB). Margen para batch normal.
Cabe justo en Q4_K_M (18 GB / 24 GB). Sin margen para batch grande. (MoE: 31.6B totales, 3.2B activos — VRAM = totales).
Cabe justo en Q4_K_M (19 GB / 24 GB). Sin margen para batch grande.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
No corre en Q4_K_M (59 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 109B totales, 17B activos — VRAM = totales).
No corre en Q4_K_M (60 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M.
No corre en Q4_K_M (60 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M.
No corre en Q4_K_M (64 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 119B totales, 6B activos — VRAM = totales).
No corre en Q4_K_M (64 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 120B totales, 12B activos — VRAM = totales).
No corre en Q4_K_M (104 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 196B totales, 11B activos — VRAM = totales).
No corre en Q4_K_M (122 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 230B totales, 10B activos — VRAM = totales).
No corre en Q4_K_M (125 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 236B totales, 23B activos — VRAM = totales).
No corre en Q4_K_M (150 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 284B totales, 13B activos — VRAM = totales).
No corre en Q4_K_M (163 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 309B totales, 15B activos — VRAM = totales).
No corre en Q4_K_M (170 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 321B totales, 38B activos — VRAM = totales).
No corre en Q4_K_M (189 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 357B totales, 32B activos — VRAM = totales).
No corre en Q4_K_M (210 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 398B totales, 94B activos — VRAM = totales).
No corre en Q4_K_M (211 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 400B totales, 17B activos — VRAM = totales).
No corre en Q4_K_M (240 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 456B totales, 45.9B activos — VRAM = totales).
No corre en Q4_K_M (353 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 671B totales, 37B activos — VRAM = totales).
No corre en Q4_K_M (355 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 675B totales, 41B activos — VRAM = totales).
No corre en Q4_K_M (360 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 685B totales, 37B activos — VRAM = totales).
No corre en Q4_K_M (360 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 685B totales, 37B activos — VRAM = totales).
No corre en Q4_K_M (391 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 744B totales, 40B activos — VRAM = totales).
No corre en Q4_K_M (525 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 1000B totales, 42B activos — VRAM = totales).
No corre en Q4_K_M (525 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 1000B totales, 32B activos — VRAM = totales).
No corre en Q4_K_M (840 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 1600B totales, 49B activos — VRAM = totales).
No corre en Q4_K_M (1049 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 2000B totales, 288B activos — VRAM = totales).
No corre en Q4_K_M (1259 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M.
Estimate = params * bytes_per_param + KV cache + overhead. For MoE we use total params (not active), because every expert sits in VRAM.
How the math works
Formula: VRAM = params × bytes_per_param + KV_cache(context) + overhead
- bytes_per_param: FP16 = 2.0, Q8_0 = 1.06, Q5_K_M = 0.69, Q4_K_M = 0.56, Q3_K_M = 0.44, Q2_K = 0.31
- KV cache: ~0.5-5 KB per token depending on model size (scales with num_layers × head_dim)
- Overhead: ~1.5 GB constant (CUDA/Metal runtime + framework)
- MoE caveat: for Mixture-of-Experts (Llama 4 Maverick, DeepSeek V3.2, GLM-5.1, etc.) we use total params — every expert sits in VRAM even if only a few activate per token. Compute uses only the active ones.
- Apple Silicon: effective VRAM is 75% of unified RAM (Metal Performance Shaders).
Best-effort estimate. Real numbers can vary 5-15% depending on framework (llama.cpp, vLLM, transformers), batch size and KV-cache compression. For production inference, benchmarks with your workload are the source of truth.