Cursos/Claude Code + IA Local/Soluciona errores de Ollama

Soluciona errores de Ollama en Windows, macOS y Linux

La mayoría de fallos con IA local no son misteriosos: servicio apagado, modelo mal escrito, puerto incorrecto, falta de memoria o expectativas demasiado altas para el hardware. Esta guía te da un diagnóstico rápido antes de perder la tarde.

Objetivos de aprendizaje
  • Diagnosticar si Ollama está instalado, arrancado y accesible.
  • Resolver errores típicos al conectar apps, Claude Code o pasarelas.
  • Ajustar modelo y flujo cuando el equipo se queda corto.
En cristiano: localhost:11434. Es la dirección de Ollama dentro de tu propio ordenador. Si una app no puede conectar con esa dirección, el problema suele estar en que Ollama no está arrancado, el puerto cambió o la app está ejecutándose en otro entorno.

Diagnóstico de 60 segundos

Terminal
ollama --version
ollama list
ollama ps
curl http://localhost:11434/api/tags
Comprueba que funciona. Si api/tags devuelve una lista de modelos, Ollama está vivo. Si falla ahí, no sigas tocando tu app: arregla primero Ollama.

Error: connection refused

Significa que tu programa llama a localhost:11434, pero no hay nada escuchando.

Terminal
ollama serve

En macOS y Windows, Ollama normalmente arranca como app de escritorio. Si cerraste la app, vuelve a abrirla. En Linux, revisa el servicio:

Terminal
systemctl status ollama
sudo systemctl restart ollama

Error: model not found

El nombre que usas en tu app no coincide con el modelo instalado.

Terminal
ollama list
ollama pull qwen3:4b
Idea clave. Copia el nombre exacto que aparece en ollama list. qwen3, qwen3:4b y ollama/qwen3:4b pueden significar cosas distintas según la herramienta.

Ollama responde muy lento

  • Baja a un modelo más pequeño: 1B, 3B o 4B.
  • Cierra apps pesadas antes de lanzar el modelo.
  • Reduce contexto y documentos de entrada.
  • Usa el flujo híbrido: Claude Code para construir, Ollama para procesar datos privados o repetitivos.
Cuidado. Si tu equipo entra en intercambio de memoria, todo se vuelve lentísimo. No es “culpa de la IA”: el modelo no cabe cómodo. Cambia a uno más pequeño y vuelve a probar.

La app funciona en terminal, pero no desde Docker

Dentro de un contenedor, localhost apunta al contenedor, no a tu ordenador. Prueba con el host de Docker:

Terminal
http://host.docker.internal:11434

LiteLLM o una pasarela no conecta

Primero prueba Ollama directo. Después revisa el archivo de configuración de la pasarela.

Terminal
curl http://localhost:11434/api/tags

# En LiteLLM, el modelo suele declararse así:
model: ollama/qwen3:4b
api_base: http://localhost:11434

Checklist final

  • El comando ollama --version funciona.
  • ollama list muestra el modelo exacto.
  • curl /api/tags responde.
  • Tu app apunta a http://localhost:11434 o al host correcto si usa Docker.
  • El modelo cabe en tu RAM sin bloquear el equipo.
Guardar y reabrir el proyecto.
Cuando algo falle, guarda el error exacto, el sistema operativo, el modelo y la salida de los cuatro comandos de diagnóstico. Con eso, cualquier asistente o foro puede ayudarte mucho mejor.