Homelab IA con RTX 3090 usadas

La RTX 3090 sigue apareciendo como opción popular por sus 24 GB de VRAM y precio usado, pero un homelab no es solo comprar GPUs: necesitas fuente, caja, calor, ruido, drivers, seguridad eléctrica y expectativas realistas.

Objetivos de aprendizaje
  • Calcular si una RTX 3090 usada tiene sentido para tu caso.
  • Entender límites de single GPU y multi-GPU sin NVLink.
  • Diseñar un homelab que puedas mantener sin sufrir.
En cristiano: VRAM. Es la memoria de la GPU. Para LLMs locales importa muchísimo: pesos del modelo, KV cache, contexto y batches compiten por ella.

Cuándo sí tiene sentido

  • Quieres aprender serving local, llama.cpp, Docker GPU y observabilidad.
  • Vas a ejecutar modelos medianos con frecuencia.
  • Necesitas privacidad o coste predecible.
  • Te compensa el mantenimiento frente a pagar APIs o suscripciones.

Cuándo no

  • Quieres cero mantenimiento.
  • No puedes tolerar ruido, calor o consumo.
  • Solo necesitas IA unas horas al mes.
  • No quieres depurar drivers, fuentes o contenedores.
Idea clave. Una 3090 no “suma contexto infinito”. Multi-GPU puede ayudar a cargar modelos más grandes, pero no todos los runtimes escalan igual ni todos los modelos se reparten bien.
Terminal
# llama.cpp multi-GPU: ejemplo conceptual
./llama-server \
  -m ./models/modelo.gguf \
  --n-gpu-layers 99 \
  --split-mode layer \
  --tensor-split 1,1 \
  --ctx-size 8192 \
  --port 8080

Checklist de compra

  • Fotos reales, historial de minería si existe y política de devolución.
  • Fuente con margen suficiente y conectores adecuados.
  • Caja con espacio físico y flujo de aire.
  • Medición de consumo en pared.
  • Plan de backups y acceso remoto seguro.
Cuidado. Cuatro GPUs usadas no son cuatro veces menos problemas. Son más calor, más cables, más puntos de fallo y más riesgo eléctrico. Empieza con una si estás aprendiendo.
Comprueba que funciona. Antes de montar multi-GPU, ejecuta un benchmark repetible con una sola GPU: modelo, quant, contexto, tokens/segundo, consumo y temperatura.
Guardar y reabrir el proyecto.
El mejor homelab no es el más grande: es el que puedes encender, medir, actualizar y apagar sin miedo.