Hermes avanzado con Gemma y MLX

Hermes, Gemma y MLX forman uno de los stacks más comentados para agentes locales en Mac. La clave no es solo velocidad: es diseñar skills, memoria, límites y pruebas para que el agente no derive.

Objetivos de aprendizaje
  • Entender qué aporta MLX en Apple Silicon.
  • Usar skills de Hermes como memoria operativa reusable.
  • Separar agente rápido, verificador y escalado híbrido.
En cristiano: Mixture of Agents. En Hermes, un preset MoA permite que modelos de referencia aporten análisis y un modelo agregador escriba la respuesta final y emita tool calls.
Terminal
workflow:
  planner:
    provider: "ollama"
    model: "gemma-local-fast"
    max_steps: 4
  verifier:
    provider: "local"
    model: "qwen-coder"
    can_edit: false
  escalation:
    trigger:
      - "same_error_twice"
      - "tests_fail_after_patch"
      - "missing_context"
Idea clave. MLX puede mejorar mucho la experiencia en Mac, pero no arregla prompts vagos, tools sin límites o memoria llena de ruido.

Patrón de trabajo

  1. Crear una skill estrecha para la tarea repetida.
  2. Probarla en un repo pequeño.
  3. Registrar decisiones y errores frecuentes.
  4. Permitir que Hermes reutilice la skill, no todo el historial.
  5. Escalar a MoA solo cuando una tarea lo justifique.
Terminal
skill:
  name: "review-nextjs-page"
  purpose: "Revisar páginas Next.js de Aulafy"
  when_to_use:
    - "nueva lección"
    - "landing SEO"
  checks:
    - "metadata con canonical"
    - "fuentes oficiales"
    - "ChapterNav correcto"
    - "sin secretos ni datos personales"
Cuidado. “Self-improvement” no significa que el agente deba editar sus propias reglas sin revisión. Guarda skills versionadas y revisa cambios igual que código.
Comprueba que funciona. Mide tres cosas: tiempo al primer token, calidad del diff y número de intervenciones humanas. Si solo mides tokens/s, te pierdes lo importante para agentes.
Guardar y reabrir el proyecto.
Hermes avanzado no va de dejar correr más loops. Va de convertir experiencia en skills pequeñas, observables y revisables.