RAG útil: mucho más que chat con PDF
Un RAG serio no consiste en subir un PDF y esperar milagros. Es una tubería de datos: limpia documentos, recupera contexto relevante, cita fuentes y se niega a responder cuando no sabe.
Objetivos de aprendizaje
- Entender las piezas reales de un sistema RAG.
- Distinguir una demo bonita de un sistema usable en una pyme.
- Definir criterios de calidad antes de indexar documentos.
En cristiano: RAG. Es una forma de responder con tus documentos. Primero busca fragmentos relevantes, luego se los pasa al modelo y finalmente genera una respuesta basada en ese contexto.
La tubería completa
Terminal
Documentos -> ingesta y limpieza -> chunking -> embeddings -> base vectorial -> recuperación -> reranking -> generación con citas -> evaluación y logs
Idea clave. La calidad del RAG se decide antes de preguntar. Si tus documentos entran sucios, troceados sin criterio y sin metadatos, el modelo solo maquillará el desorden.
Preguntas de diseño
- ¿Qué documentos puede consultar cada usuario?
- ¿Cada respuesta necesita cita exacta?
- ¿Qué pasa si no encuentra evidencia?
- ¿Cómo se actualizan documentos antiguos?
- ¿Qué entradas podrían contener instrucciones maliciosas?
Cuidado. “Responde siempre” es una mala regla para RAG. Un sistema fiable debe poder decir: “no tengo evidencia suficiente en los documentos”.
Comprueba que funciona. Antes de construir, escribe tres preguntas que tu RAG debe responder y tres que debe rechazar. Ese pequeño test evitará muchas falsas demos.
Guardar y reabrir el proyecto.
Un RAG bueno tiene cuatro compromisos: recupera bien, cita bien, limita permisos y deja evidencia. Si falta uno, no está listo para datos sensibles.