Inicio/Volumen II/Texto a audio

🔊 Convierte cualquier texto en audio

Una herramienta que coge un texto —un artículo, unos apuntes, un capítulo de un libro— y lo convierte en un archivo de audio que puedes escuchar en el móvil o el coche. En el idioma que quieras. Perfecto para estudiar, para accesibilidad o para hacer audiolibros de tus propios materiales.

🎯 Objetivos de aprendizaje
  • Generar audio de calidad a partir de texto, en local y en varios idiomas.
  • Producir archivos MP3 descargables.
  • Elegir la voz y el idioma adecuados.

Conceptos clave

Esto es TTS (texto a voz) puro, sin micrófono ni modelo de lenguaje: solo texto que entra y audio que sale.

🧠 En cristiano: ¿por qué en local y no una web cualquiera?. Hay webs que convierten texto a voz, pero suelen tener límites, marcas de agua o cobran por textos largos, y tu texto viaja a sus servidores. En local no hay límites, es gratis y privado: puedes convertir un libro entero si quieres.

Qué herramientas usar (2026)

  • Kokoro — ligera, rápida en CPU, buena calidad, multi-idioma. Gran punto de partida.
  • MagpieTTS — voces de calidad de producción en 9 idiomas (incluye español); mejor con GPU.
  • F5-TTS — si quieres clonar una voz concreta a partir de una muestra.
Requisitos
Claude Code y Node.js. Para las voces puede hacer falta Python; Claude Code te guía. No necesitas Ollama en este proyecto (no hay “cerebro”, solo voz).

Paso a paso

⌨️ Terminal
cd ~/proyectos-ia
mkdir texto-a-audio
cd texto-a-audio
claude
💬Escribe esto a Claude Code
Crea una app web local de texto a voz: - Motor Kokoro por defecto; deja preparado MagpieTTS como alternativa de más calidad. - Puedo pegar texto o subir un .txt. - Selector de idioma y de voz (incluye español). - Botón para generar y para descargar el audio en MP3. - Si el texto es muy largo, divídelo y únelo en un solo MP3. - README con instrucciones.
💡 Idea clave. Para textos muy largos conviene trocear y unir el audio: si no, algunos motores se atragantan. Por eso lo pedimos explícitamente en el encargo.

Ejecutar en tu ordenador

⌨️ Terminal
npm install
npm run dev

Pega un párrafo, elige idioma y voz, y genera el audio.

✅ Comprueba que funciona. Deberías poder reproducir el audio en la propia página y descargar el MP3. Pruébalo con un texto en español y con otro en inglés para ver el cambio de voz.
💾 Guardar y reabrir el proyecto.
Proyecto: carpeta texto-a-audio. Cerrar: Ctrl + C. Reabrir: cd ~/proyectos-ia/texto-a-audio y npm run dev. Los MP3 que generes se guardan donde tú los descargues; no dependen de que la app esté abierta.

Si algo falla

  • Voz en idioma equivocado — selecciona la voz correcta para ese idioma; no todas hablan todos los idiomas.
  • Se corta en textos largos — confirma que la app trocea y une; si no, pídeselo a Claude Code.
  • Suena metálica — prueba MagpieTTS para más calidad (mejor con GPU).

Reto para practicar

Añade un “modo pódcast”: que dos voces distintas lean un diálogo alternándose. Ideal para material educativo más ameno.