Skip to content

Hardware Checker

What LLM can I run on my PC? Pick your GPU, choose a quantization and a context, and the checker classifies all 111 models in the atlas into S/A/B/C/D/F tiers.

Your hardware

Quantization
Typical context

Result · 24 GB VRAM · Q4_K_M · context 8,000

AFM On-Device
Apple
S

Cabe en Q4_K_M con margen amplio (3 GB / 24 GB). Contexto largo y batching OK.

Need: 4.1 GBHave: 24 GB
Reka Flash 3
Reka
A

Cabe comodo en Q4_K_M (13 GB / 24 GB). Margen para batch normal.

Need: 13.5 GBHave: 24 GB
Reka Flash 3.1
Reka
A

Cabe comodo en Q4_K_M (13 GB / 24 GB). Margen para batch normal.

Need: 13.5 GBHave: 24 GB
Nemotron 3 Nano
Nvidia
B

Cabe justo en Q4_K_M (18 GB / 24 GB). Sin margen para batch grande. (MoE: 31.6B totales, 3.2B activos — VRAM = totales).

Need: 19.1 GBHave: 24 GB
EXAONE 4.5 33B
LG AI Research
B

Cabe justo en Q4_K_M (19 GB / 24 GB). Sin margen para batch grande.

Need: 19.8 GBHave: 24 GB
GPT-5.5
OpenAI
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
GPT-5.5 Instant
OpenAI
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
GPT-5.5 Pro
OpenAI
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
GPT-5.4 Pro
OpenAI
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
GPT-5.4
OpenAI
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
GPT-5.2
OpenAI
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
GPT-5.2 Pro
OpenAI
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
GPT-5.3-Codex
OpenAI
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
GPT-5.4 mini
OpenAI
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
GPT-5.4 nano
OpenAI
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Claude Opus 4.7
Anthropic
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Claude Mythos Preview
Anthropic
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Claude Opus 4.6
Anthropic
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Claude Sonnet 4.6
Anthropic
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Claude Opus 4.5
Anthropic
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Claude Haiku 4.5
Anthropic
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Gemini 3 Deep Think
Google DeepMind
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Gemini 3 Flash
Google DeepMind
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Gemini 3.1 Flash-Lite
Google DeepMind
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Gemini 3.1 Pro
Google DeepMind
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Gemini 3 Pro
Google DeepMind
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Gemini 3.1 Flash Live
Google DeepMind
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Gemma 4 (31B dense)
Google DeepMind
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Gemma 4 26B-A4B
Google DeepMind
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Gemma 4 E4B
Google DeepMind
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Gemma 4 E2B
Google DeepMind
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Grok 4.3
xAI
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Grok 4.1
xAI
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Grok 4.1 Fast
xAI
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Grok 4 Heavy
xAI
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Grok 4.20 Heavy
xAI
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Grok 4.20
xAI
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Grok 4
xAI
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Muse Spark
Meta
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Mistral Medium 3.5
Mistral AI
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Devstral 2
Mistral AI
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Devstral Small 2
Mistral AI
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Magistral Medium 1.2
Mistral AI
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Codestral 25.08
Mistral AI
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Jamba2 Mini
AI21 Labs
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Qwen3.6 Max Preview
Alibaba
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Qwen3.6 Flash
Alibaba
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Qwen3.6-27B
Alibaba
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Qwen3.6-35B-A3B
Alibaba
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Qwen3-Coder-Next
Alibaba
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Qwen3.5-397B-A17B
Alibaba
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Qwen3.5-Omni-Plus
Alibaba
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Qwen3.6-Plus
Alibaba
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Qwen3-Max-Thinking
Alibaba
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Qwen3-Max
Alibaba
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
GLM-5
Zhipu AI
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
GLM-5V-Turbo
Zhipu AI
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
GLM-5-Turbo
Zhipu AI
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
GLM-4.7
Zhipu AI
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
GLM-4.5
Zhipu AI
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
ERNIE 5.1 Preview
Baidu
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
ERNIE 4.5 VL Thinking
Baidu
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Doubao Seed 2.0 Mini
ByteDance
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Doubao Seed 2.0 Code
ByteDance
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Doubao Seed 2.0 Pro
ByteDance
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Doubao Seed 2.0 Lite
ByteDance
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Yi-Lightning
01.AI
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
MiMo V2.5 Pro
Xiaomi
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
MiMo V2.5
Xiaomi
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
MiniMax M2.1
MiniMax
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
MiniMax M2
MiniMax
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
MiniMax M2.7
MiniMax
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Nemotron 3 Nano Omni
Nvidia
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
AFM Server
Apple
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Amazon Nova 2 Omni
Amazon
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Nova 2 Pro
Amazon
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Nova 2 Lite
Amazon
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Nova Premier
Amazon
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Nova Pro
Amazon
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Nova Lite
Amazon
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Inflection-3 Pi
Inflection AI
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Inflection-3 Productivity
Inflection AI
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Samsung Gauss2 Supreme
Samsung
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Samsung Gauss 2.3
Samsung
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Kimi K2.6
Moonshot AI
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
EXAONE 4.0 32B
LG AI Research
F

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB
Llama 4 Scout
Meta
F

No corre en Q4_K_M (59 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 109B totales, 17B activos — VRAM = totales).

Need: 59.6 GBHave: 24 GB
Command A
Cohere
F

No corre en Q4_K_M (60 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M.

Need: 60.7 GBHave: 24 GB
Command A Reasoning
Cohere
F

No corre en Q4_K_M (60 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M.

Need: 60.7 GBHave: 24 GB
Mistral Small 4
Mistral AI
F

No corre en Q4_K_M (64 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 119B totales, 6B activos — VRAM = totales).

Need: 64.9 GBHave: 24 GB
Nemotron 3 Super
Nvidia
F

No corre en Q4_K_M (64 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 120B totales, 12B activos — VRAM = totales).

Need: 65.4 GBHave: 24 GB
Step 3.5 Flash
StepFun
F

No corre en Q4_K_M (104 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 196B totales, 11B activos — VRAM = totales).

Need: 105.2 GBHave: 24 GB
MiniMax M2.5
MiniMax
F

No corre en Q4_K_M (122 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 230B totales, 10B activos — VRAM = totales).

Need: 123.0 GBHave: 24 GB
K-EXAONE 236B-A23B
LG AI Research
F

No corre en Q4_K_M (125 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 236B totales, 23B activos — VRAM = totales).

Need: 126.2 GBHave: 24 GB
DeepSeek V4 Flash
DeepSeek
F

No corre en Q4_K_M (150 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 284B totales, 13B activos — VRAM = totales).

Need: 151.3 GBHave: 24 GB
MiMo V2 Flash
Xiaomi
F

No corre en Q4_K_M (163 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 309B totales, 15B activos — VRAM = totales).

Need: 164.4 GBHave: 24 GB
Step-3
StepFun
F

No corre en Q4_K_M (170 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 321B totales, 38B activos — VRAM = totales).

Need: 170.7 GBHave: 24 GB
GLM-4.6
Zhipu AI
F

No corre en Q4_K_M (189 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 357B totales, 32B activos — VRAM = totales).

Need: 189.6 GBHave: 24 GB
Jamba 1.7 Large
AI21 Labs
F

No corre en Q4_K_M (210 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 398B totales, 94B activos — VRAM = totales).

Need: 211.0 GBHave: 24 GB
Llama 4 Maverick
Meta
F

No corre en Q4_K_M (211 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 400B totales, 17B activos — VRAM = totales).

Need: 212.1 GBHave: 24 GB
MiniMax-M1
MiniMax
F

No corre en Q4_K_M (240 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 456B totales, 45.9B activos — VRAM = totales).

Need: 241.4 GBHave: 24 GB
DeepSeek V3.2
DeepSeek
F

No corre en Q4_K_M (353 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 671B totales, 37B activos — VRAM = totales).

Need: 354.0 GBHave: 24 GB
Mistral Large 3
Mistral AI
F

No corre en Q4_K_M (355 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 675B totales, 41B activos — VRAM = totales).

Need: 356.1 GBHave: 24 GB
DeepSeek V3.2 Speciale
DeepSeek
F

No corre en Q4_K_M (360 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 685B totales, 37B activos — VRAM = totales).

Need: 361.4 GBHave: 24 GB
DeepSeek R1 0528
DeepSeek
F

No corre en Q4_K_M (360 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 685B totales, 37B activos — VRAM = totales).

Need: 361.4 GBHave: 24 GB
GLM-5.1
Zhipu AI
F

No corre en Q4_K_M (391 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 744B totales, 40B activos — VRAM = totales).

Need: 392.3 GBHave: 24 GB
MiMo V2 Pro
Xiaomi
F

No corre en Q4_K_M (525 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 1000B totales, 42B activos — VRAM = totales).

Need: 526.4 GBHave: 24 GB
Kimi K2.5
Moonshot AI
F

No corre en Q4_K_M (525 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 1000B totales, 32B activos — VRAM = totales).

Need: 526.4 GBHave: 24 GB
DeepSeek V4 Pro
DeepSeek
F

No corre en Q4_K_M (840 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 1600B totales, 49B activos — VRAM = totales).

Need: 840.7 GBHave: 24 GB
Llama 4 Behemoth
Meta
F

No corre en Q4_K_M (1049 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 2000B totales, 288B activos — VRAM = totales).

Need: 1050.3 GBHave: 24 GB
ERNIE 5.0
Baidu
F

No corre en Q4_K_M (1259 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M.

Need: 1259.8 GBHave: 24 GB

Estimate = params * bytes_per_param + KV cache + overhead. For MoE we use total params (not active), because every expert sits in VRAM.

How the math works

Formula: VRAM = params × bytes_per_param + KV_cache(context) + overhead

  • bytes_per_param: FP16 = 2.0, Q8_0 = 1.06, Q5_K_M = 0.69, Q4_K_M = 0.56, Q3_K_M = 0.44, Q2_K = 0.31
  • KV cache: ~0.5-5 KB per token depending on model size (scales with num_layers × head_dim)
  • Overhead: ~1.5 GB constant (CUDA/Metal runtime + framework)
  • MoE caveat: for Mixture-of-Experts (Llama 4 Maverick, DeepSeek V3.2, GLM-5.1, etc.) we use total params — every expert sits in VRAM even if only a few activate per token. Compute uses only the active ones.
  • Apple Silicon: effective VRAM is 75% of unified RAM (Metal Performance Shaders).

Best-effort estimate. Real numbers can vary 5-15% depending on framework (llama.cpp, vLLM, transformers), batch size and KV-cache compression. For production inference, benchmarks with your workload are the source of truth.

Tiers explained

S — Fits with 2x+ headroom. Big batch, long context OK.
A — Comfortable fit (1.5-2x). Margin for normal batch.
B — Tight fit (1.1-1.5x). No big batch.
C — At the edge (0.9-1.1x). Consider lower quant or trimming context.
D — Requires offloading to RAM (slow). Better with lower quant.
F — Will not run. Need more VRAM or much lower quant.