Cinco servidores MCP antes de que Claude Code escriba una sola línea

Matthias Meyer

Claude Code creció sorprendentemente rápido de research preview a una parte notable de todos los commits públicos de GitHub, según los propios datos de Anthropic y el resumen de mejores prácticas. La mayoría de esos commits llegaron a producción. Una parte considerable se revirtió poco después.

La pregunta interesante no es cómo el modelo escribe el código. Es qué ocurre en la ventana inicial antes de que empiece. Esa ventana es donde divergen las buenas sesiones de Claude Code y las malas.

El problema del cold start

Una sesión nueva de Claude Code no tiene idea de qué decidiste antes, cómo luce la codebase, cuál es el estado actual de las bibliotecas que usas, ni qué errores ya cometiste y descartaste. Sin ayuda, reconstruye tu razonamiento desde cero cada vez. Generalmente mal.

Tres modos de fallo aparecen casi de inmediato. El modelo inventa nombres de clases que suenan plausibles pero no existen en el proyecto. Cita métodos de API de versiones de un SDK que fueron renombrados hace dos releases. Vuelve a discutir decisiones que se tomaron hace meses, porque la justificación nunca se guardó en ningún lugar que el modelo pudiera leer.

Cada uno de estos problemas tiene solución, pero no prompting más intenso. La solución es darle a Claude Code el contexto que tendría si hubiera estado en el equipo desde hace tiempo. El Model Context Protocol existe exactamente para esto. Ya hay un gran ecosistema público de servidores MCP, y el pequeño subconjunto que se gana su lugar en una rutina diaria es de lo que trata este post.

El stack de cinco pasos

La rutina es breve. Corre al inicio de cada sesión, antes de escribir cualquier código o editar cualquier archivo. Cinco pasos, en este orden.

1. Cargar Memory

La primera llamada va a un servidor MCP de memoria que lleva contexto entre sesiones (nosotros usamos StudioMeyer Memory para esta capa). El último sprint, decisiones abiertas, learnings recientes, por qué se tomó una decisión técnica específica antes, y los modos de fallo que el equipo ya encontró. Memory es lo que convierte una sesión de cold start en warm start.

Sin ella, cada conversación empieza con el modelo intentando reconstruir tu razonamiento desde el árbol de archivos y unas pocas frases en CLAUDE.md. Con ella, el modelo llega ya sabiendo que probaste Postgres pooling, que la respuesta fue raw pg en lugar de Prisma en la capa de agentes, y que tuviste un Cross-Tenant leak en abril que influye en la forma del esquema hoy.

El punto no es que el modelo lo recuerde todo. Es que las decisiones acumuladas del equipo quedan disponibles para el modelo como contexto de fondo, de la misma forma en que están disponibles para un senior engineer en el primer día de la vigésima semana.

2. Indexar la codebase como grafo

La segunda llamada va a un servidor de memoria de codebase. codebase-memory-mcp, por ejemplo, indexa un repositorio en un grafo de conocimiento consultable rápidamente, soporta una amplia gama de lenguajes y responde preguntas estructurales con muy baja latencia y una fracción del coste en tokens comparado con ciclos grep-y-lectura (según los benchmarks del repositorio del maintainer).

Lo que esto cambia en el día a día es enorme. Cuando el modelo necesita saber qué llama a processOrder, consulta el grafo y recibe una lista con números de línea. Sin el grafo, hace grep a ciegas, lee archivos, sigue imports y quema grandes cantidades de tokens para llegar a la misma respuesta. Multiplica eso por muchas preguntas así por sesión y la diferencia entre un agente que puede razonar sobre una codebase grande y uno que solo puede razonar sobre un puñado de archivos a la vez está exactamente en este servidor.

3. Buscar el presente, no el conjunto de entrenamiento

La tercera llamada va a un servidor MCP de búsqueda web como Tavily, Brave Search o Anthropic web search. El punto no es reemplazar el conocimiento del modelo. Es reemplazar el conocimiento desactualizado del modelo con lo que la gente está haciendo en realidad ahora mismo, antes de tomar una decisión no trivial.

Los datos de entrenamiento envejecen, a veces mal. Las mejores prácticas de hace tiempo siguen siendo buenas la mayoría de las veces, pero a veces están silenciosamente muertas. Una búsqueda corta antes de una decisión real obtiene una respuesta limpia con fuentes, en lugar de una reconstrucción segura de un consenso anterior.

El retrieval estilo Tavily funciona especialmente bien aquí porque filtra el ruido SEO y devuelve los pocos resultados que realmente contienen la respuesta. El coste es pequeño, la ventaja es un modelo que no se compromete con un patrón obsoleto delante de un revisor de código.

4. Cargar Context7 para la documentación de bibliotecas

La cuarta llamada va a Context7, que obtiene la documentación actual de cualquier biblioteca que se vaya a tocar a continuación. El Anthropic SDK, Next.js, Prisma, Tailwind, el AWS SDK, lo que sea que implique el siguiente bloque de trabajo.

El training cutoff es la mayor fuente individual de código que parece plausible pero está roto que genera Claude Code. El modelo inventa alegremente métodos de API que fueron renombrados hace dos versiones, llama a hooks que se deprecaron en un minor release, y olvida que una opción de configuración cambió su valor por defecto en el último patch. Cargar la documentación actual real terminó con toda esa categoría de bugs en flujos de trabajo de producción hace meses.

Context7 se cita consistentemente como uno de los servidores MCP más usados en configuraciones de desarrollo en 2026, exactamente por esta razón.

5. Escribir código

Para cuando el modelo empieza a escribir, tiene memoria, estructura de la codebase, contexto actual del ecosistema y documentación precisa de las bibliotecas. El output se lee diferente. Menos "déjame probar esto y ver si compila", más "basándonos en el call graph y la documentación de v5, el cambio va aquí, y los cuatro callers en src/orders necesitan esta actualización."

La breve ventana al inicio se devuelve muchas veces a lo largo de la sesión. Las sesiones que se saltan la rutina pasan bastante más tiempo limpiando edits que se hicieron a ciegas.

La capa de hooks

Los servidores MCP le dan contexto al modelo. Los hooks imponen comportamiento. La distinción importa porque los hooks corren fuera del bucle del agente y son deterministas, lo que significa que se disparan incluso cuando el modelo preferiría no hacerlo.

La guía completa de CLI de Blake Crosley, que refleja releases recientes de Claude Code, lo expresa claramente: "Hooks guarantee execution of shell commands regardless of model behavior. Unlike CLAUDE.md instructions which are advisory, hooks are deterministic and guarantee the action." Esa es la razón completa por la que los hooks importan.

Tres hooks se ganan su lugar en la rutina diaria.

El primero es un read-before-edit guard. Rechaza cualquier edición en un archivo que la sesión actual no haya leído de verdad antes. El modelo tiene que cargar el archivo correctamente en lugar de adivinar qué contiene. La objeción siempre es la misma: "eso cuesta tokens extra por adelantado." El coste en tokens de leer el archivo es trivial comparado con el coste en tokens de limpiar una edición que rompió tres callers porque el modelo adivinó la firma de la función. Este hook surgió de la regresión de adaptive thinking documentada en anthropics/claude-code issue #42796, donde las tasas de edición ciega subieron del 6,2 al 33,7 por ciento después de que Anthropic cambiara un valor por defecto. La solución a nivel de usuario fue un gate determinista. El workaround a nivel de usuario para una regresión Codex relacionada lo describimos en detalle en el post Codex Memory MCP Fix.

El segundo es un safety guard para comandos destructivos. Cualquier cosa parecida a rm -rf, git push --force a una rama protegida, prisma db push --force-reset, DROP DATABASE, la lista habitual. El modelo sugiere ocasionalmente uno de estos en momentos de confusión. El hook lo detiene antes de que corra.

El tercero es un re-index hook que se dispara después de las ediciones. Actualiza el grafo de conocimiento de la codebase para que la siguiente consulta refleje lo que realmente está en el repositorio, no lo que estaba al inicio de la sesión. Los grafos desactualizados son un modo de fallo silencioso, el tipo que produce alucinaciones de "la función que busco no existe" incluso cuando la función se acaba de crear hace dos minutos.

Ninguno de estos hooks es ingenioso. Son barreras deterministas para los modos de fallo predecibles de un sistema generativo. Por eso funcionan en producción.

Cerrar el bucle

Lo que funciona en una sesión vuelve a la memoria. Las decisiones se persisten como decisions. Los patrones que se demostraron se almacenan como learnings, con confidence scores. Los errores se registran con suficiente contexto para que la siguiente sesión los evite. La siguiente sesión arranca con todo eso ya cargado.

Esta es la parte que se acumula. Los servidores MCP y los hooks no son una configuración puntual, son el sustrato sobre el que el conocimiento acumulado del equipo se vuelve operativo. El sistema se afila cada semana, no porque el modelo haya cambiado, sino porque el contexto a su alrededor sigue creciendo en calidad.

Encuestas recientes de la industria muestran de forma consistente que la gran mayoría de los desarrolladores siguen revisando el código generado por IA antes de hacer commit. El patrón de cerrar el bucle es lo que hace esa revisión más rápida, porque las sugerencias del modelo se alinean progresivamente con cómo el equipo realmente construye. Las primeras sesiones usando un servidor de memoria son anodinas. Tras un uso sostenido es donde la brecha entre equipos que cierran el bucle y equipos que no lo hacen se vuelve obvia.

Qué reemplaza esto, qué no

La rutina pre-coding reemplaza una cantidad sorprendente de tooling a medida. La página de Confluence de "base de conocimiento" interna que nadie lee. El canal de Slack donde las decisiones pasadas van a morir. Los ciclos de grep para encontrar una definición de función. Las búsquedas en Stack Overflow de un método de API que puede o no seguir existiendo. El archivo CLAUDE.md que creció hasta dos mil líneas porque cada regresión añadió un nuevo párrafo de "recuerda no hacer esto."

No reemplaza la revisión humana del código generado. No reemplaza los tests, los type checks ni el monitoring de producción. No convierte Claude Code en un senior engineer. Lo que hace es mover al modelo de "junior dev con amnesia" a "contribuyente informado con acceso a la memoria de trabajo del equipo." Eso es suficiente para entregar trabajo serio, no suficiente para saltarse la revisión.

El patrón mayor

El cambio después de unos meses ejecutando esta rutina está en el encuadre. El modelo deja de ser la fuente de conocimiento. El modelo se convierte en el orquestador. Los servidores MCP y los hooks son el sistema.

Memory recuerda. El grafo conoce el código. Search conoce el presente. Context7 conoce la documentación. Los hooks mantienen al modelo honesto. El modelo los conecta.

Este es el mismo patrón arquitectónico que los ingenieros de Anthropic describen cuando hablan de Claude Code como "un CLI agéntico que lee tu codebase, ejecuta comandos y modifica archivos a través de un sistema de capas de permisos, hooks, integraciones MCP y subagentes". El modelo en el centro es un componente. El trabajo de ingeniería interesante es todo lo que lo rodea.

Para equipos que todavía corren Claude Code sin servidores MCP y sin hooks, el camino de actualización es corto. Empieza con un servidor de memoria, un grafo de codebase y el read-before-edit hook. La primera sesión después de ese cambio es cuando el resto de la rutina se vuelve obvio.

La rutina pre-coding es breve. El interés compuesto de ese breve preámbulo es lo que marca la diferencia, con el tiempo, entre un modelo que entrega y un modelo que alucina.