Hermes avanzado con Gemma y MLX
Hermes, Gemma y MLX forman uno de los stacks más comentados para agentes locales en Mac. La clave no es solo velocidad: es diseñar skills, memoria, límites y pruebas para que el agente no derive.
Objetivos de aprendizaje
- Entender qué aporta MLX en Apple Silicon.
- Usar skills de Hermes como memoria operativa reusable.
- Separar agente rápido, verificador y escalado híbrido.
En cristiano: Mixture of Agents. En Hermes, un preset MoA permite que modelos de referencia aporten análisis y un modelo agregador escriba la respuesta final y emita tool calls.
Terminal
workflow:
planner:
provider: "ollama"
model: "gemma-local-fast"
max_steps: 4
verifier:
provider: "local"
model: "qwen-coder"
can_edit: false
escalation:
trigger:
- "same_error_twice"
- "tests_fail_after_patch"
- "missing_context" Idea clave. MLX puede mejorar mucho la experiencia en Mac, pero no arregla prompts vagos, tools sin límites o memoria llena de ruido.
Patrón de trabajo
- Crear una skill estrecha para la tarea repetida.
- Probarla en un repo pequeño.
- Registrar decisiones y errores frecuentes.
- Permitir que Hermes reutilice la skill, no todo el historial.
- Escalar a MoA solo cuando una tarea lo justifique.
Terminal
skill:
name: "review-nextjs-page"
purpose: "Revisar páginas Next.js de Aulafy"
when_to_use:
- "nueva lección"
- "landing SEO"
checks:
- "metadata con canonical"
- "fuentes oficiales"
- "ChapterNav correcto"
- "sin secretos ni datos personales" Cuidado. “Self-improvement” no significa que el agente deba editar sus propias reglas sin revisión. Guarda skills versionadas y revisa cambios igual que código.
Comprueba que funciona. Mide tres cosas: tiempo al primer token, calidad del diff y número de intervenciones humanas. Si solo mides tokens/s, te pierdes lo importante para agentes.
Guardar y reabrir el proyecto.
Hermes avanzado no va de dejar correr más loops. Va de convertir experiencia en skills pequeñas, observables y revisables.