📄 Pregúntale a tus PDF
Una aplicación donde sueltas cualquier PDF —un manual, un contrato, un artículo, los apuntes de una asignatura— y le haces preguntas en lenguaje normal. Te responde y te dice en qué página lo ha encontrado. Es el capítulo anterior llevado a cualquier documento, no solo legal.
- Extraer y consultar el contenido de PDF con IA local.
- Pedir resúmenes, tablas y respuestas con referencia a la página.
- Reutilizar la técnica RAG que ya conoces en un caso nuevo.
Conceptos clave
Aquí aplicamos lo mismo del chatbot legal: RAG (buscar en tus documentos y responder con esos fragmentos). Lo nuevo es que un PDF no siempre es texto limpio.
qwen3:4b y nomic-embed-text descargados (capítulo de IA local).Paso a paso
Crea el proyecto y arranca Claude Code:
cd ~/proyectos-ia mkdir pregunta-pdf cd pregunta-pdf claude
Pégale este encargo:
Ejecutar en tu ordenador
npm install npm run dev
Abre la dirección local, sube un PDF y pregunta algo concreto que sepas que está en el documento.
pregunta-pdf. Para cerrarlo: Ctrl + C. Para volver otro día: cd ~/proyectos-ia/pregunta-pdf y npm run dev. Recuerda hacer un commit de Git cuando funcione.Una prueba guiada de principio a fin
Para comprobar que todo funciona sin depender de tus propios archivos, usa un PDF público del BOE. Descarga la Constitución Española (dominio público) y colócala en la carpeta docs/ de tu proyecto:
mkdir -p docs curl -L -o docs/constitucion.pdf \ "https://www.boe.es/buscar/pdf/1978/BOE-A-1978-31229-consolidado.pdf" npm run dev
Abre la app, sube (o reindexa) constitucion.pdf y escribe esta pregunta exacta:
¿Qué establece el artículo 14 de la Constitución Española sobre la igualdad ante la ley?
Qué deberías ver: una respuesta que cite el artículo 14 y mencione que los españoles son iguales ante la ley, sin discriminación por nacimiento, raza, sexo, religión, opinión u otra condición personal o social. La app debe indicar el archivo (constitucion.pdf) y una página. Si responde con contenido inventado o sin cita, reindexa el PDF y vuelve a preguntar.
Si algo falla
- Texto vacío al indexar — PDF escaneado: activa OCR.
- Respuestas lentas — normal en documentos largos; prueba un modelo más pequeño o reduce cuántos fragmentos usa por respuesta.
- Cita la página equivocada — pide a Claude Code trozos más pequeños al indexar.
Reto para practicar
Pídele a Claude Code que añada un modo “compara dos PDF” (por ejemplo dos versiones de un contrato) y que te señale las diferencias importantes.