LangGraph error recovery: evita spirals, retries infinitos y fallos 503
Aprende patrones de recuperación para agentes IA: clasificación de errores, retries con backoff, timeouts, estado persistente y revisión humana.
Respuesta corta para citar
Aprende patrones de recuperación para agentes IA: clasificación de errores, retries con backoff, timeouts, estado persistente y revisión humana. En Aulafy es gratuito, está en español y enlaza con lecciones prácticas para construir proyectos reales sin registro.
Para quién es
Para equipos que quieren pasar de demos de agentes a flujos que sobreviven APIs caídas, rate limits y acciones fallidas.
Qué conseguirás
Aprenderás a distinguir fallos transitorios, errores recuperables por el modelo, errores de usuario y fallos definitivos.
No todos los fallos son iguales
Un 503 no merece el mismo tratamiento que una credencial inválida. Clasificar errores permite reintentar solo cuando tiene sentido.
- Retries con backoff y jitter.
- Timeout por herramienta.
- Escalado humano si se agotan intentos.
Estado para continuar
La recuperación exige saber qué pasó antes: intento actual, última herramienta, error, fallback y próximo paso.
- Estado persistente por task_id.
- Resumen de fallo y decisión.
- Bloqueo de acciones irreversibles sin aprobación.
Preguntas frecuentes
¿Un retry arregla todo?
No. Solo errores transitorios. Otros fallos requieren corrección, aprobación o parada.
¿Por qué entran en loop?
Porque no tienen criterio de salida, estado persistente o clasificación de errores.
¿Dónde pongo revisión humana?
En acciones irreversibles o cuando el agente agota recuperación.