Mapa de herramientas y licencias
La IA generativa cambia rápido. Por eso no vamos a memorizar nombres: vamos a aprender a elegir herramientas por control, licencia, coste, privacidad y capacidad de repetir resultados.
Objetivos de aprendizaje
- Elegir stack para imagen, voz y vídeo sin perderte entre modelos.
- Distinguir modelo abierto, uso comercial y servicio en la nube.
- Guardar evidencia de qué modelo, licencia y parámetros usaste.
En cristiano: modelo abierto. Que puedas descargar pesos o código no significa automáticamente “puedo usarlo para cualquier cosa”. Hay que mirar la licencia del modelo, la licencia del software y la licencia de cada voz, LoRA o checkpoint.
Stack base de Aulafy
- ComfyUI: interfaz visual por nodos para imágenes, vídeo, audio y workflows reproducibles.
- Diffusers: código Python para generar, comparar y automatizar imágenes con pipelines versionables.
- FLUX: familia potente para imagen; revisa cada variante porque no todas comparten licencia.
- Whisper: transcripción local y subtítulos.
- Piper: texto a voz local con modelos ligeros.
- Wan: generación de vídeo para clips cortos, normalmente con más demanda de VRAM.
Idea clave. Usa ComfyUI cuando quieras explorar visualmente y Diffusers cuando quieras repetir el mismo resultado desde código, pruebas o automatizaciones.
Ficha que debes guardar por cada recurso
Terminal
recurso: tipo: modelo | lora | voz | workflow | dataset nombre: version_o_commit: fuente: licencia: uso_permitido: personal | comercial | investigacion | revisar restricciones: parametros_clave: fecha_revision: 2026-07-02
Cuidado. FLUX.1 schnell aparece con licencia Apache-2.0, mientras que otras variantes como FLUX.1 dev usan licencia no comercial. No mezcles variantes sin revisar la ficha oficial.
Decisión rápida
- Quiero una imagen ya: ComfyUI con un workflow sencillo.
- Quiero repetir cien variaciones: Diffusers con seed, prompt y manifest.
- Quiero voz para una lección: Whisper para transcribir y Piper para narrar.
- Quiero vídeo: empieza con clips de 3 a 5 segundos y una sola escena.
- Quiero venderlo: revisa licencia antes de generar, no después.
Comprueba que funciona. Elige un modelo de imagen, una voz y un workflow. Antes de ejecutarlos, escribe su licencia y fuente. Si no puedes completar la ficha, no lo metas en un proyecto serio.
Guardar y reabrir el proyecto.
La calidad empieza antes del prompt: modelo correcto, licencia clara, seed guardada y salida revisable.