Cursos/Claude Code + IA Local/Hermes avanzado

Hermes avanzado con Gemma y MLX

Hermes, Gemma y MLX forman uno de los stacks más comentados para agentes locales en Mac. La clave no es solo velocidad: es diseñar skills, memoria, límites y pruebas para que el agente no derive.

Objetivos de aprendizaje

Entender qué aporta MLX en Apple Silicon.
Usar skills de Hermes como memoria operativa reusable.
Separar agente rápido, verificador y escalado híbrido.

En cristiano: Mixture of Agents. En Hermes, un preset MoA permite que modelos de referencia aporten análisis y un modelo agregador escriba la respuesta final y emita tool calls.

Terminal

workflow:
  planner:
    provider: "ollama"
    model: "gemma-local-fast"
    max_steps: 4
  verifier:
    provider: "local"
    model: "qwen-coder"
    can_edit: false
  escalation:
    trigger:
      - "same_error_twice"
      - "tests_fail_after_patch"
      - "missing_context"

Idea clave. MLX puede mejorar mucho la experiencia en Mac, pero no arregla prompts vagos, tools sin límites o memoria llena de ruido.

Patrón de trabajo

Crear una skill estrecha para la tarea repetida.
Probarla en un repo pequeño.
Registrar decisiones y errores frecuentes.
Permitir que Hermes reutilice la skill, no todo el historial.
Escalar a MoA solo cuando una tarea lo justifique.

Terminal

skill:
  name: "review-nextjs-page"
  purpose: "Revisar páginas Next.js de Aulafy"
  when_to_use:
    - "nueva lección"
    - "landing SEO"
  checks:
    - "metadata con canonical"
    - "fuentes oficiales"
    - "ChapterNav correcto"
    - "sin secretos ni datos personales"

Cuidado. “Self-improvement” no significa que el agente deba editar sus propias reglas sin revisión. Guarda skills versionadas y revisa cambios igual que código.

Comprueba que funciona. Mide tres cosas: tiempo al primer token, calidad del diff y número de intervenciones humanas. Si solo mides tokens/s, te pierdes lo importante para agentes.

Guardar y reabrir el proyecto.

Hermes avanzado no va de dejar correr más loops. Va de convertir experiencia en skills pequeñas, observables y revisables.

Fuentes oficiales

← Hermes y Ollama Tool calling local →