Supply chain de modelos y datasets

Tu app de IA hereda la confianza de todo lo que descarga: modelo, tokenizer, dataset, LoRA, paquete npm, imagen Docker, workflow, script y extensión.

Objetivos de aprendizaje
  • Crear una ficha de procedencia para modelos y datasets.
  • Evitar pesos, scripts y dependencias sin control.
  • Separar licencia, seguridad y calidad como decisiones distintas.
En cristiano: supply chain. Es la cadena de piezas que usas para construir. Si una pieza viene comprometida o no sabes de dónde sale, tu sistema también queda comprometido.

Ficha de procedencia

Terminal
modelo:
  nombre: "qwen3-8b"
  fuente: "repositorio oficial"
  version_o_commit: "..."
  licencia: "revisada"
  formato: "gguf | safetensors | onnx"
  hash: "sha256:..."
  requiere_trust_remote_code: false
  datos_entrenamiento_conocidos: parcial
  uso_permitido: "educativo | comercial | revisar"
  fecha_revision: "2026-07-03"
Idea clave. OWASP incluye supply chain porque muchos ataques no pasan por el prompt: pasan por dependencias, paquetes, datos, plugins o permisos.

Reglas sencillas

  • Prefiere formatos que no ejecuten código al cargar pesos.
  • Evita trust_remote_code salvo que revises exactamente qué ejecuta.
  • Guarda hashes de pesos usados en producción.
  • No mezcles datasets privados con públicos sin registro.
  • Revisa licencia de modelo, dataset y adaptadores por separado.
Terminal
sha256sum modelo.gguf > checksums.txt
pip freeze > requirements.lock.txt
npm ls --depth=0 > npm-deps.txt
docker image inspect qdrant/qdrant:latest > docker-qdrant.json
Cuidado. "Lo descargué de internet" no es una fuente. Para producción, necesitas procedencia, versión, hash y criterio de actualización.
Comprueba que funciona. Elige un modelo local que uses. ¿Puedes decir fuente, licencia, hash y fecha de descarga? Si no, crea la ficha antes de seguir.
Guardar y reabrir el proyecto.
La seguridad de IA empieza antes de ejecutar el modelo: empieza cuando decides qué descargas y de dónde.