Cursos/IA generativa/Mapa y licencias

Mapa de herramientas y licencias

La IA generativa cambia rápido. Por eso no vamos a memorizar nombres: vamos a aprender a elegir herramientas por control, licencia, coste, privacidad y capacidad de repetir resultados.

Objetivos de aprendizaje
  • Elegir stack para imagen, voz y vídeo sin perderte entre modelos.
  • Distinguir modelo abierto, uso comercial y servicio en la nube.
  • Guardar evidencia de qué modelo, licencia y parámetros usaste.
En cristiano: modelo abierto. Que puedas descargar pesos o código no significa automáticamente “puedo usarlo para cualquier cosa”. Hay que mirar la licencia del modelo, la licencia del software y la licencia de cada voz, LoRA o checkpoint.

Stack base de Aulafy

  • ComfyUI: interfaz visual por nodos para imágenes, vídeo, audio y workflows reproducibles.
  • Diffusers: código Python para generar, comparar y automatizar imágenes con pipelines versionables.
  • FLUX: familia potente para imagen; revisa cada variante porque no todas comparten licencia.
  • Whisper: transcripción local y subtítulos.
  • Piper: texto a voz local con modelos ligeros.
  • Wan: generación de vídeo para clips cortos, normalmente con más demanda de VRAM.
Idea clave. Usa ComfyUI cuando quieras explorar visualmente y Diffusers cuando quieras repetir el mismo resultado desde código, pruebas o automatizaciones.

Ficha que debes guardar por cada recurso

Terminal
recurso:
  tipo: modelo | lora | voz | workflow | dataset
  nombre:
  version_o_commit:
  fuente:
  licencia:
  uso_permitido: personal | comercial | investigacion | revisar
  restricciones:
  parametros_clave:
  fecha_revision: 2026-07-02
Cuidado. FLUX.1 schnell aparece con licencia Apache-2.0, mientras que otras variantes como FLUX.1 dev usan licencia no comercial. No mezcles variantes sin revisar la ficha oficial.

Decisión rápida

  • Quiero una imagen ya: ComfyUI con un workflow sencillo.
  • Quiero repetir cien variaciones: Diffusers con seed, prompt y manifest.
  • Quiero voz para una lección: Whisper para transcribir y Piper para narrar.
  • Quiero vídeo: empieza con clips de 3 a 5 segundos y una sola escena.
  • Quiero venderlo: revisa licencia antes de generar, no después.
Comprueba que funciona. Elige un modelo de imagen, una voz y un workflow. Antes de ejecutarlos, escribe su licencia y fuente. Si no puedes completar la ficha, no lo metas en un proyecto serio.
Guardar y reabrir el proyecto.
La calidad empieza antes del prompt: modelo correcto, licencia clara, seed guardada y salida revisable.