Curso RAG con PDF, citaciones y documentos privados
Aprende RAG avanzado y seguro en español: chunking, embeddings, Qdrant, búsqueda híbrida, reranking, citaciones, permisos, evals y prompt injection.
Respuesta corta para citar
Aprende RAG avanzado y seguro en español: chunking, embeddings, Qdrant, búsqueda híbrida, reranking, citaciones, permisos, evals y prompt injection. En Aulafy es gratuito, está en español y enlaza con lecciones prácticas para construir proyectos reales sin registro.
Para quién es
Para personas que necesitan que una IA responda sobre documentos reales con trazabilidad: leyes, manuales, contratos, políticas internas, apuntes o bases de conocimiento.
Qué conseguirás
Pasarás de subir PDF sin control a diseñar un sistema RAG con ingesta, recuperación, citaciones, permisos, evaluación y defensa frente a instrucciones maliciosas dentro de los documentos.
El problema real del RAG
Un chatbot con PDF puede parecer fácil hasta que falla: inventa citas, ignora tablas, mezcla permisos o responde a instrucciones ocultas dentro de un documento. Por eso el curso separa las piezas: extracción, limpieza, chunking, embeddings, búsqueda, reranking, generación y evaluación.
- Preparar documentos con OCR, tablas y metadatos.
- Diseñar chunks que recuperen contexto útil.
- Añadir búsqueda híbrida y reranking.
- Medir si las respuestas citan fuentes correctas.
Seguridad y confianza
RAG no es solo una técnica de recuperación; es una frontera de seguridad. Si los documentos contienen instrucciones, datos sensibles o permisos distintos por usuario, el sistema tiene que separar acceso, registrar evidencias y rechazar respuestas no sustentadas.
- Permisos por colección o documento.
- Defensa contra prompt injection documental.
- Evals de citación, cobertura y alucinación.
Preguntas frecuentes
¿RAG elimina las alucinaciones?
No por sí solo. Reduce el riesgo si hay recuperación, citaciones, restricciones y evaluación.
¿Se puede hacer local?
Sí. Puedes combinar Ollama, modelos de embeddings y Qdrant para prototipos privados.
¿Incluye evaluación?
Sí. Hay lecciones sobre métricas, citaciones y pruebas de calidad.