Cursos/Claude Code + IA Local/Varios ordenadores, una IA

Varios ordenadores, una sola IA

El capítulo más ambicioso: unir varios ordenadores en red para que trabajen juntos y ejecuten modelos de IA más grandes de los que cabrían en uno solo. Si tienes un par de portátiles o Macs por casa, puedes montar tu propio “mini centro de datos”.

Objetivos de aprendizaje
  • Qué es un clúster de inferencia y cuándo merece la pena.
  • Usar exo para repartir un modelo entre varios equipos.
  • Conectar los ordenadores por red local (Ethernet o Thunderbolt).

Conceptos clave

En cristiano: clúster e “inferencia”. Inferencia es simplemente “usar” el modelo (que responda). Un clúster es un grupo de ordenadores que colaboran como si fueran uno. Repartir la inferencia entre varios equipos permite ejecutar modelos que no caben en la memoria de uno solo: cada máquina se encarga de una parte.
Idea clave. ¿Cuándo merece la pena? Cuando quieres usar un modelo grande (que no entra en tu equipo) y tienes varios ordenadores disponibles. Para el uso normal del libro, un solo equipo basta; esto es el siguiente nivel.

exo: el clúster casero

exo (de exolabs) es un proyecto open source que une automáticamente los ordenadores de tu red y reparte el modelo entre ellos. En 2026 es una herramienta madura: detecta los equipos, equilibra la carga según la potencia de cada uno y aprovecha conexiones rápidas como Thunderbolt.

En cristiano: ¿y Ollama o LM Studio?. Ollama y LM Studio están pensados para un ordenador. exo es la pieza que los lleva a varios: coordina el conjunto. También existen otras vías (por ejemplo, el modo de red de llama.cpp), pero exo es la más sencilla para empezar en casa.
Requisitos
  • Dos o más ordenadores (Macs con chip M y/o PCs). Cuantos más y más potentes, modelos más grandes.
  • Todos en la misma red local. Lo ideal es conectarlos por cable Ethernet (o Thunderbolt entre Macs): mucho más rápido y estable que el wifi.
  • Claude Code en uno de ellos para guiarte en la instalación de exo en cada equipo.

Paso a paso (en líneas generales)

El montaje exacto lo verás en la documentación de exo, pero la idea es esta:

  1. Conecta todos los ordenadores a la misma red (mejor por cable).
  2. Instala exo en cada equipo. Pídele a Claude Code en cada uno: “ayúdame a instalar exo y a comprobar que arranca”.
  3. Arranca exo en todos. Se descubren entre sí automáticamente y forman el clúster.
  4. Desde cualquiera de ellos, lanza un modelo grande: exo lo reparte entre las máquinas y expone un punto de acceso común para tus aplicaciones.
Cuidado. La red es el cuello de botella. Con wifi funcionará, pero lento; con Ethernet o Thunderbolt notarás la diferencia. Si va a trompicones, lo primero que hay que mirar es la conexión entre equipos.
Comprueba que funciona. Cuando exo esté en marcha en todos los equipos, debería mostrarte cuántos nodos ha detectado y la memoria total combinada. Si ves más de un nodo y la suma de memoria de tus máquinas, el clúster está formado. Lanza una pregunta a un modelo grande y observa cómo responde algo que un solo equipo no podría cargar.
Guardar y reabrir el proyecto.
Un clúster no es un “proyecto” con carpeta: es una configuración de tus equipos. Anota en un documento qué ordenadores lo forman, cómo los conectas y el comando para arrancar exo en cada uno, para poder reconstruirlo en minutos cuando lo necesites.

Si algo falla

  • No se ven entre ellos — confirma que están en la misma red y que ningún cortafuegos bloquea exo.
  • Va muy lento — pasa de wifi a cable; comprueba que ningún equipo esté saturado por otra tarea.
  • Un equipo tira del rendimiento hacia abajo — exo reparte según capacidad, pero un nodo muy débil puede lastrar; pruébalo con y sin él.

Reto para practicar

Mide la diferencia: ejecuta el modelo más grande que quepa en un equipo y luego uno mayor con el clúster. Compara qué modelos puedes usar en cada caso. Habrás construido tu propia infraestructura de IA en casa.