Claude en 2026: modelos, apps, Claude Code y la API

Matthias Meyer

La mayoría de quienes usan Claude solo han visto una décima parte. Abren la ventana de chat, escriben una pregunta, reciben una respuesta y cierran la pestaña. Eso es Claude como un móvil es una calculadora. Funciona, pero pierde el sentido.

Claude en 2026 son cuatro cosas con un mismo cerebro. Está el producto de chat en claude.ai. Está Claude Code, un agente que vive en tu terminal y edita archivos reales. Está la API para desarrolladores, con la que integras Claude en tu propio software. Y bajo las tres se asienta una familia de modelos, disponible no solo en Anthropic, sino también en las nubes de Amazon, Google y Microsoft. La habilidad que de verdad importa no se llama "prompting". Se llama saber cuál de estas cuatro superficies usar y cuándo. Esta guía recorre las cuatro, con los números reales, para que dejes de adivinar.

Dirijo un estudio de diseño e IA en Mallorca, y usamos cada una de estas superficies a diario, en nuestro propio trabajo y en sistemas de clientes. Lo que sigue es el mapa que me habría gustado tener al principio.

La familia de modelos en una tabla#

Todo empieza por los modelos. A fecha de junio de 2026 hay tres actuales, y son herramientas realmente distintas, no solo tamaños de lo mismo.

	Claude Opus 4.8	Claude Sonnet 4.6	Claude Haiku 4.5
ID de modelo API	`claude-opus-4-8`	`claude-sonnet-4-6`	`claude-haiku-4-5`
Fuerte en	razonamiento difícil, coding agéntico largo	velocidad más inteligencia	el más rápido, casi frontera
Context Window	1M tokens	1M tokens	200K tokens
Salida máxima	128K tokens	64K tokens	64K tokens
Precio (entrada / salida por 1M)	$5 / $25	$3 / $15	$1 / $5
SWE-bench Verified	88,6%	79,6%	fuerte, menor

Opus 4.8 salió el 28 de mayo de 2026 y es el buque insignia. Logra un 88,6% en SWE-bench Verified, el benchmark estándar para resolver issues reales de GitHub, frente al 87,6% de Opus 4.7. En Terminal-Bench 2.1 alcanza el 90,1%. Pero el número que Anthropic más destacó en el lanzamiento no fue un benchmark: Opus 4.8 deja pasar un fallo en su propio código sin comentarlo unas cuatro veces menos que su predecesor. Esa honestidad importa en la práctica más que un punto de SWE-bench, porque el modo de fallo típico de un agente de coding rara vez es "no sabe resolverlo" y casi siempre es "lo resolvió mal y te dijo que estaba bien".

Un Context Window de 1M tokens significa que Opus 4.8 y Sonnet 4.6 sostienen entre 555.000 y 750.000 palabras a la vez, una base de código mediana entera o una pila de contratos. Haiku se queda en unos todavía amplios 200K. Un matiz que conviene saber: un Context Window grande no significa que debas llenarlo. La calidad baja a medida que el contexto se llena, un problema que ya se llama Context Rot. La ventana es margen, no objetivo.

El precio escala como cabe esperar. Opus cuesta cinco veces lo de Haiku en entrada y cinco veces en salida. La regla práctica que usamos: Haiku para trabajo de gran volumen y bien definido como clasificación, extracción y enrutado. Sonnet como caballo de batalla diario para la mayoría del chat y del coding. Opus cuando la tarea es de verdad difícil, larga o cara si la fastidias. Existe además un Fast Mode en Opus 4.8 con $10 de entrada y $50 de salida por millón de tokens, para cuando la latencia importa más que el coste.

Los tres leen texto e imágenes, hablan docenas de idiomas y funcionan a través de la Claude API, Amazon Bedrock, Google Vertex AI y Microsoft Foundry. Así que si tu empresa está atada a la compra en AWS o Azure, puedes usar los mismos modelos por la nube que ya pagas. Una salvedad: en Microsoft Foundry, Opus 4.8 corre por ahora con ventana de 200K en vez de la completa de 1M.

Superficie uno: claude.ai, el producto de chat#

Esta es la parte que todos conocen, y se ha convertido sin ruido en un espacio de trabajo serio. Vale la pena entenderlo antes de pagar nada.

Projects es la función que la mayoría se pierde. Un Project es un contenedor con sus propias instrucciones y conocimiento subido. Mete tu guía de marca, tu documentación de API y tus reglas de tono en un Project una vez, y cada conversación dentro hereda ese contexto automáticamente. Para una pequeña empresa, esa es la diferencia entre explicar tu negocio cada mañana y no volver a explicarlo.

Artifacts convierte un chat en un espacio vivo. Pide una pequeña app web, un gráfico o un documento, y Claude lo renderiza junto a la conversación, donde lo previsualizas e iteras. Artifacts guardan ahora almacenamiento persistente de hasta 20MB cada uno, pueden llamar APIs, hablar con servicios externos por MCP y refrescarse con datos en vivo al reabrirlos. Hay gente publicando herramientas internas realmente útiles así, sin tocar un editor.

Luego está el tejido conectivo. Connectors es como claude.ai habla con el mundo exterior, y funcionan sobre el Model Context Protocol, el estándar abierto que Anthropic publicó para conectar IA con herramientas y datos. Por MCP, Claude llega a Gmail, Google Drive, Slack, GitHub, Notion, Stripe y cientos de servicios más. Como persona no técnica añades un connector con unos clics, y Claude puede de repente leer tu calendario o triar tu bandeja de entrada. Es el mismo MCP para el que los desarrolladores construyen servidores, y eso es lo elegante: el protocolo es una sola cosa, expuesta en cada nivel.

Dos superficies más amplían dónde vive Claude. Claude in Chrome, en beta para planes de pago desde finales de abril de 2026, pone a Claude en un panel lateral del navegador, donde ve la página y hace clic contigo. Y la app de escritorio de Claude añadió Cowork, que llegó a disponibilidad general en todos los planes de pago en abril de 2026 y deja que Claude lea, edite y cree archivos en una carpeta que tú eliges, ejecutando trabajo de varios pasos por su cuenta. El modo de voz en el móvil es ahora gratis para todos.

Los planes, con precios reales:

Plan	Precio	Para
Free	$0	probar, uso ligero
Pro	$20/mes ($17 anual)	individuos, uso diario
Max 5x	$100/mes	uso intenso, más cuota
Max 20x	$200/mes	power users, Claude Code
Team	$25-30/asiento/mes	equipos pequeños
Enterprise	a medida	empresas mayores, desde unos 70 asientos

La versión honesta: Free sirve para evaluar. Pro es el nivel adecuado para una persona que trabaja de verdad con ello. Max existe porque quienes corren Claude Code todo el día chocaban con los límites, y el nivel Max alto y el asiento Team Premium son donde Claude Code resulta más cómodo.

Superficie dos: Claude Code, el agente en tu terminal#

Esta es la superficie que cambia cómo se siente el trabajo, y la que más se malinterpreta. Claude Code no es un chatbot en un terminal. Anthropic lo describe como una herramienta de coding agéntico que lee tu base de código, edita archivos, ejecuta comandos y se integra con tus herramientas de desarrollo. Le dices en lenguaje normal lo que quieres y hace el trabajo a través de muchos archivos, corre los tests y te muestra el diff.

Instalarlo es una línea. En macOS, Linux o WSL:

curl -fsSL https://claude.ai/install.sh | bash

También hay Homebrew (brew install --cask claude-code) y WinGet para Windows. Luego ejecutas claude en cualquier proyecto e inicias sesión. Tampoco se queda en el terminal. El mismo motor corre en una extensión de VS Code y Cursor, en IDEs de JetBrains, en una app de escritorio con sesiones lado a lado, en el navegador en claude.ai/code y en la app de iOS. Tu configuración te sigue por todas ellas.

Lo de mayor impacto en Claude Code, con diferencia, es un archivo llamado CLAUDE.md. El propio documento de buenas prácticas de Anthropic lo llama la constitución del agente. Es un archivo markdown en la raíz de tu proyecto que Claude lee al inicio de cada sesión. Pones ahí tus estándares de código, tus decisiones de arquitectura, tus librerías preferidas y tu lista de revisión, y dejas de repetirte. Encima, Claude Code construye ahora Auto Memory mientras trabaja, guardando cosas como tu comando de build y aprendizajes de depuración entre sesiones sin que escribas nada.

A partir de ahí se vuelve potente por capas. Estas son las piezas que conviene conocer por su nombre, porque son las palabras con las que haces que Claude se configure solo:

MCP Servers. El mismo Model Context Protocol de claude.ai, aquí en tu terminal. claude mcp add conecta un servidor, y de pronto Claude Code puede leer tus tickets de Jira, consultar tu base de datos o usar cualquier herramienta que le des. Los servidores se configuran por usuario, por proyecto o en local, y un .mcp.json compartido deja los servidores del proyecto en git para todo el equipo.
Subagents. Un subagent es una sesión de Claude aparte con su propio Context Window, lanzada para una tarea ruidosa o paralelizable que solo devuelve un resumen. La conversación principal queda limpia. Con /agents los gestionas. Así corres varios hilos de trabajo a la vez.
Hooks. Comandos de shell dirigidos por eventos que se disparan de forma determinista cuando pasa algo, como PreToolUse, PostToolUse o SessionStart. A diferencia de un prompt, un hook siempre se ejecuta. Se usan para formatear automáticamente tras cada edición, bloquear comandos peligrosos o reindexar una base de código. Lo más nuevo: un hook puede ahora llamar a una herramienta MCP directamente, no solo a un comando de shell.
Skills. Un Skill es un archivo SKILL.md en .claude/skills/ que empaqueta un flujo repetible, invocado como /tu-skill o de forma automática cuando Claude lo juzga relevante. A diferencia de un subagent, un Skill corre en la conversación actual, sin contexto nuevo, sin spawning. Bueno para fijar una receta que tu equipo reutiliza.
Plugins. Un paquete versionado que entrega Skills, Subagents, Slash Commands, Hooks, Output Styles y MCP Servers juntos como una unidad instalable, compartible por un marketplace. Si un Skill es una ficha de receta, un plugin es el libro de cocina entero.
Plan Mode. Claude lee y propone un plan escrito sin tocar nada. Tú lo apruebas, y entonces ejecuta. La disciplina que impone es todo el juego.
Checkpoints. Claude Code sigue tu sesión para que puedas rebobinar a un estado anterior si un cambio salió mal.

Bajo todo hay un flujo que Anthropic recomienda y que de verdad funciona: explore, plan, code, commit. Deja que Claude lea primero los archivos relevantes en Plan Mode, que apunte qué va a cambiar y en qué orden, luego que implemente contra ese plan y que haga commit con un mensaje claro. Saltarse explore y plan es la causa más común de que una sesión se descarrile.

Y como sigue la filosofía Unix, puedes guionizarlo. El flag -p corre Claude headless, así que puedes hacer pipe hacia él:

git diff main --name-only | claude -p "review these changed files for security issues"

Ese único patrón, Claude en una pipe, es lo que convierte al asistente en infraestructura. Nosotros corremos revisiones, traducciones y auditorías así en la CI.

Superficie tres: la API y el Agent SDK, para quien construye#

Cuando quieres a Claude dentro de tu propio producto, bajas a la API. El núcleo es la Messages API, con SDKs oficiales para Python, TypeScript y Go. Una llamada mínima se ve así:

from anthropic import Anthropic

client = Anthropic()
message = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=1024,
    messages=[{"role": "user", "content": "Summarize this contract."}],
)
print(message.content[0].text)

Sobre esa base, un puñado de funciones hace casi todo el trabajo pesado, y saber que existen te ahorra dinero y reescrituras.

Tool Use, también llamado function calling, deja que Claude decida cuándo llamar a funciones que tú defines y con qué argumentos. Es la base de todo agente. Le das a Claude una lista de tools con esquemas JSON, y devuelve llamadas estructuradas que tú ejecutas.

Prompt Caching es la función que se paga sola. Marcas una parte estable de tu prompt, un system prompt largo o un documento grande, con cache_control, y las llamadas siguientes la reutilizan. Las lecturas de caché cuestan alrededor del diez por ciento de la tarifa normal de entrada, así que el contexto repetido sale hasta un noventa por ciento más barato. La caché por defecto vive cinco minutos, con opción de una hora. Si mandas las mismas instrucciones en cada request y no cacheas, estás pagando de más.

Extended Thinking deja que el modelo razone antes de responder, con un budget_tokens que tú controlas:

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=4096,
    thinking={"type": "enabled", "budget_tokens": 2000},
    messages=[{"role": "user", "content": "Plan a database migration."}],
)

El resto de la plataforma es una caja de herramientas de la que sacas según haga falta. La Batch API corre trabajos grandes de forma asíncrona en menos de 24 horas con un 50% de descuento fijo, ideal para trabajo masivo que no es urgente. La Files API gestiona documentos e imágenes que referencias entre llamadas. Citations hace que Claude señale las frases exactas que usó, y así construyes salidas fiables y comprobables. También hay herramientas propias: un Web Search Tool para datos actuales, un Code Execution Tool que corre Python en la llamada y un MCP Connector con el que Claude alcanza cualquier servidor MCP remoto sin que escribas código de cliente. Una herramienta de memoria para agentes de larga duración está en beta pública.

Cuando quieres construir un agente completo en vez de hacer llamadas sueltas, está el Claude Agent SDK, antes Claude Code SDK. Te da el mismo bucle de agente, el mismo manejo de tools y la misma gestión de contexto que mueven a Claude Code, en Python y TypeScript, con control total sobre orquestación y permisos. El modelo mental: la API es para llamadas, el Agent SDK es para agentes.

Qué superficie para qué tarea#

Pon las cuatro juntas y la decisión se vuelve sencilla.

Usa claude.ai cuando hay un humano en el bucle y el trabajo es pensar, escribir, analizar o una herramienta rápida en Artifacts. Usa Claude Code cuando el trabajo toca archivos, una base de código o tu máquina local y quieres un agente que actúe, no que solo responda. Usa la API cuando Claude tiene que vivir dentro de software que entregas a otros. Y elige la versión en la nube, Bedrock, Vertex o Foundry, cuando la compra o la residencia de datos lo convierten en el camino de menor resistencia.

Para el modelo dentro de cualquiera de ellas: Haiku para volumen, Sonnet para casi todo, Opus cuando es difícil o caro equivocarse.

Las trampas que no vienen en la caja#

Una guía que solo lista funciones es marketing. Esto es lo que de verdad muerde.

La primera es código mal hecho con seguridad. Claude a veces inventa un método de API que suena bien pero se renombró hace dos versiones, o cita una función de librería que no existe. La solución no es desconfiar de forma vaga, es darle al modelo hechos actuales. Apúntalo a documentación real y, en Claude Code, dale herramientas que lean tu código de verdad en vez de adivinar. Opus 4.8 es claramente mejor aquí, pero mejor no es cero.

La segunda es el Context Rot. Cuanto más larga se vuelve una sesión, más se adelgaza la atención del modelo y más cae la calidad. La ventana de 1M tienta a volcarlo todo, y entonces la respuesta empeora. Mantén las sesiones acotadas. Usa subagents para empujar el trabajo ruidoso a su propio contexto. Empieza de cero cuando un hilo se ha desviado.

La tercera es la que hay que tomarse en serio en cuanto conectas Claude con tus herramientas: la Lethal Trifecta. Los investigadores de seguridad llaman así a tres condiciones que, juntas, hacen explotable a un agente. Acceso a datos privados, contacto con contenido no fiable y una vía para sacar datos. Cada una por separado es inofensiva. Las tres a la vez significan que una instrucción oculta, por ejemplo en una página web o un correo, puede hacer que tu agente filtre lo que ve. MCP hace a Claude mucho más capaz y, en el mismo gesto, agranda esa superficie de ataque. Las defensas son poco glamurosas y reales: corre solo servidores MCP en los que confías, usa la allowlist de permisos para que el agente no pueda ejecutar lo que quiera, y sigue el principio de mínimo privilegio. No le des a un agente tus secretos y una puerta abierta a la vez.

Ninguna de estas trampas es razón para evitar Claude. Son la diferencia entre usarlo bien y llevarte una sorpresa.

Por dónde empezar#

Si nunca pasaste de la ventana de chat, haz tres cosas esta semana. Crea un Project y llénalo con tu contexto real. Instala Claude Code y escribe una CLAUDE.md de diez líneas para un repo. Engancha un MCP Connector a algo que de verdad uses. Ese es el arco entero de esta guía en tres pasos, del chat al agente a lo conectado.

La razón por la que esto importa para una empresa es que el hueco entre islas de herramientas es donde se escapa el tiempo, y Claude a través de estas cuatro superficies es, sobre todo, una forma de cerrar esos huecos. Conectamos Claude con sistemas de clientes por MCP justo para eso, y el servidor StudioMeyer Memory es nuestra propia respuesta al punto sobre el que esta guía no para de girar: darle a Claude una memoria que sobreviva entre sesiones.

Si quieres en concreto el lado del terminal, nuestra guía para configurar Claude Code sin jerga técnica es la lectura natural siguiente.

Claude ya no es una sola ventana. Aprende las cuatro superficies y el modelo deja de ser un juguete ingenioso y pasa a ser algo sobre lo que construyes.