Ollama desde cero: instala tu primera IA local
Ollama es la forma más directa de ejecutar modelos abiertos en tu ordenador. En esta lección montas una IA local real, eliges un modelo sensato para tu equipo y verificas que responde antes de conectarla a proyectos más grandes.
Objetivos de aprendizaje
- Instalar Ollama en Windows, macOS o Linux.
- Elegir un modelo según memoria, velocidad y calidad.
- Comprobar la API local para usarla después con tus apps.
En cristiano: Ollama. Es un programa que descarga y ejecuta modelos de lenguaje en tu ordenador. Tú le pides texto por terminal o por API local, y el modelo responde sin enviar tus documentos a una plataforma externa.
Requisitos mínimos realistas
- 8 GB de RAM: modelos pequeños de 1B a 4B para pruebas, resúmenes y chat ligero.
- 16 GB de RAM: modelos de 7B a 8B, mejor equilibrio para aprender.
- 32 GB o más: modelos de 14B y flujos más cómodos con documentos largos.
- GPU: ayuda mucho, pero no es obligatoria para empezar.
Cuidado. No midas Ollama con una demo espectacular de internet. Un portátil normal puede aprender, prototipar y automatizar mucho, pero un modelo local pequeño no razona igual que Claude, GPT o Gemini en tareas largas de programación.
Instalación
Entra en la web oficial de Ollama, instala la versión de tu sistema y abre una terminal nueva. En Linux también puedes usar el instalador por terminal:
Terminal
curl -fsSL https://ollama.com/install.sh | sh
Comprueba que el comando existe:
Terminal
ollama --version
Tu primer modelo
Para empezar, usa un modelo pequeño y rápido. Si tu equipo va bien, luego subes tamaño.
Terminal
ollama run qwen3:4b
Idea clave. Empieza con el modelo que responde, no con el modelo que queda bonito en una comparativa. Aprenderás más con un 4B rápido que con un 14B que tarda demasiado en cada prueba.
Modelos recomendados para aprender
- qwen3:4b: buena primera opción para equipos modestos.
- llama3.1:8b: equilibrio clásico si tienes 16 GB de RAM o más.
- mistral: rápido y práctico para pruebas generales.
- codellama: útil para ejemplos de código, aunque no sustituye a Claude Code.
Comprueba la API local
Ollama queda escuchando en http://localhost:11434. Tus aplicaciones hablarán con esa dirección.
Terminal
curl http://localhost:11434/api/generate -d '{
"model": "qwen3:4b",
"prompt": "Resume en una frase qué es la IA local.",
"stream": false
}' Comprueba que funciona. Si ves una respuesta JSON con un campo
response, ya tienes una IA local lista para usar en apps de RAG, PDF, automatización y prototipos privados.Comandos que usarás cada semana
Terminal
ollama list ollama run qwen3:4b ollama pull llama3.1:8b ollama rm modelo:tag ollama ps
Guardar y reabrir el proyecto.
Quédate con tres datos: modelo elegido, puerto local
11434 y comando de prueba con curl. Si esos tres funcionan, cualquier proyecto del curso puede conectarse a Ollama.