Agentes 24/7 offline en hardware real

Un agente 24/7 local no falla solo por tokens: falla por calor, RAM, VRAM, reinicios, modelos que tardan en cargar, discos llenos y tareas que nadie corta. Diseña operación antes de venderte autonomía.

Objetivos de aprendizaje
  • Elegir arquitectura según Mac, PC con GPU, mini PC o VPS.
  • Separar bandeja de entrada, worker y modelo.
  • Crear watchdog, logs y límites de recursos.
En cristiano: watchdog. Es un proceso o regla que observa si el agente sigue vivo, si avanza y si consume demasiado. Si algo va mal, pausa o reinicia con registro.

Arquitecturas honestas

  • Mac M-series: cómodo, silencioso y buen entorno dev; vigila prefill y memoria unificada.
  • RTX 3090/4090: más VRAM y CUDA; vigila calor, consumo y drivers.
  • Mini PC: útil para orquestación, no para modelos grandes.
  • VPS barato: bien para n8n/colas; mal para inferencia pesada sin GPU.
Terminal
agent-runtime:
  inbox: sqlite_or_postgres
  worker_concurrency: 1
  max_runtime_minutes: 20
  max_steps: 12
  idle_sleep_seconds: 10
  healthcheck:
    - ollama_api_alive
    - disk_free_gt_10gb
    - memory_free_gt_2gb
    - no_repeated_error_3x
  on_failure:
    - pause_task
    - save_trace
    - notify_human
Idea clave. Para solopreneurs y pymes, un agente 24/7 suele ser una bandeja de tareas con aprobación humana, no un robot tocando sistemas críticos sin permiso.

Checklist de operación local

  • Un solo worker al principio.
  • Cola persistente para no perder tareas al reiniciar.
  • Logs por tarea, no solo logs globales.
  • Resumen final con comandos, archivos y errores.
  • Límite de GPU/CPU/tiempo antes de repetir.
Cuidado. Si el modelo tarda más en cargar que el intervalo de auto-restart, puedes crear un bucle que mata el servicio justo antes de que arranque. Mide tiempo de carga antes de configurar watchdogs agresivos.
Comprueba que funciona. Simula tres fallos: Ollama apagado, disco lleno y tool que falla dos veces. El agente debe pausar y avisar, no repetir hasta el infinito.
Guardar y reabrir el proyecto.
Un agente 24/7 local no es “siempre activo”; es recuperable, observable y capaz de detenerse sin romper nada.