Supply chain de modelos y datasets
Tu app de IA hereda la confianza de todo lo que descarga: modelo, tokenizer, dataset, LoRA, paquete npm, imagen Docker, workflow, script y extensión.
Objetivos de aprendizaje
- Crear una ficha de procedencia para modelos y datasets.
- Evitar pesos, scripts y dependencias sin control.
- Separar licencia, seguridad y calidad como decisiones distintas.
En cristiano: supply chain. Es la cadena de piezas que usas para construir. Si una pieza viene comprometida o no sabes de dónde sale, tu sistema también queda comprometido.
Ficha de procedencia
Terminal
modelo: nombre: "qwen3-8b" fuente: "repositorio oficial" version_o_commit: "..." licencia: "revisada" formato: "gguf | safetensors | onnx" hash: "sha256:..." requiere_trust_remote_code: false datos_entrenamiento_conocidos: parcial uso_permitido: "educativo | comercial | revisar" fecha_revision: "2026-07-03"
Idea clave. OWASP incluye supply chain porque muchos ataques no pasan por el prompt: pasan por dependencias, paquetes, datos, plugins o permisos.
Reglas sencillas
- Prefiere formatos que no ejecuten código al cargar pesos.
- Evita
trust_remote_codesalvo que revises exactamente qué ejecuta. - Guarda hashes de pesos usados en producción.
- No mezcles datasets privados con públicos sin registro.
- Revisa licencia de modelo, dataset y adaptadores por separado.
Terminal
sha256sum modelo.gguf > checksums.txt pip freeze > requirements.lock.txt npm ls --depth=0 > npm-deps.txt docker image inspect qdrant/qdrant:latest > docker-qdrant.json
Cuidado. "Lo descargué de internet" no es una fuente. Para producción, necesitas procedencia, versión, hash y criterio de actualización.
Comprueba que funciona. Elige un modelo local que uses. ¿Puedes decir fuente, licencia, hash y fecha de descarga? Si no, crea la ficha antes de seguir.
Guardar y reabrir el proyecto.
La seguridad de IA empieza antes de ejecutar el modelo: empieza cuando decides qué descargas y de dónde.