RAG útil: mucho más que chat con PDF

Un RAG serio no consiste en subir un PDF y esperar milagros. Es una tubería de datos: limpia documentos, recupera contexto relevante, cita fuentes y se niega a responder cuando no sabe.

Objetivos de aprendizaje

Entender las piezas reales de un sistema RAG.
Distinguir una demo bonita de un sistema usable en una pyme.
Definir criterios de calidad antes de indexar documentos.

En cristiano: RAG. Es una forma de responder con tus documentos. Primero busca fragmentos relevantes, luego se los pasa al modelo y finalmente genera una respuesta basada en ese contexto.

La tubería completa

Terminal

Documentos
  -> ingesta y limpieza
  -> chunking
  -> embeddings
  -> base vectorial
  -> recuperación
  -> reranking
  -> generación con citas
  -> evaluación y logs

Idea clave. La calidad del RAG se decide antes de preguntar. Si tus documentos entran sucios, troceados sin criterio y sin metadatos, el modelo solo maquillará el desorden.

Preguntas de diseño

¿Qué documentos puede consultar cada usuario?
¿Cada respuesta necesita cita exacta?
¿Qué pasa si no encuentra evidencia?
¿Cómo se actualizan documentos antiguos?
¿Qué entradas podrían contener instrucciones maliciosas?

Cuidado. “Responde siempre” es una mala regla para RAG. Un sistema fiable debe poder decir: “no tengo evidencia suficiente en los documentos”.

Comprueba que funciona. Antes de construir, escribe tres preguntas que tu RAG debe responder y tres que debe rechazar. Ese pequeño test evitará muchas falsas demos.

Guardar y reabrir el proyecto.

Un RAG bueno tiene cuatro compromisos: recupera bien, cita bien, limita permisos y deja evidencia. Si falta uno, no está listo para datos sensibles.

Ingesta, limpieza y chunking →