Claude 2026: Modelle, Apps, Claude Code und die API

Matthias Meyer

Die meisten, die Claude nutzen, haben nur ein Zehntel davon gesehen. Sie öffnen das Chatfenster, tippen eine Frage, bekommen eine Antwort und schließen den Tab. Das ist Claude so, wie ein Smartphone ein Taschenrechner ist. Funktioniert, verfehlt aber den Punkt.

Claude ist 2026 vier Dinge mit einem Gehirn. Da ist das Chatprodukt auf claude.ai. Da ist Claude Code, ein Agent der in deinem Terminal lebt und echte Dateien bearbeitet. Da ist die Entwickler API, mit der du Claude in deine eigene Software einbaust. Und unter allen dreien sitzt eine Familie von Modellen, verfügbar nicht nur bei Anthropic, sondern auch in den Clouds von Amazon, Google und Microsoft. Die Fähigkeit, auf die es wirklich ankommt, heißt nicht "Prompting". Sie heißt: zu wissen, welche dieser vier Oberflächen du wann greifst. Dieser Guide geht alle vier durch, mit den echten Zahlen, damit du aufhörst zu raten.

Ich führe ein Design und KI Studio auf Mallorca, und wir nutzen jede dieser Oberflächen täglich, an eigener Arbeit und an Kundensystemen. Was folgt, ist die Karte, die mir am Anfang gefehlt hat.

Die Modellfamilie in einer Tabelle#

Alles beginnt mit den Modellen. Stand Juni 2026 gibt es drei aktuelle, und das sind wirklich verschiedene Werkzeuge, nicht nur Größen desselben Dings.

	Claude Opus 4.8	Claude Sonnet 4.6	Claude Haiku 4.5
API Modell ID	`claude-opus-4-8`	`claude-sonnet-4-6`	`claude-haiku-4-5`
Stark bei	schwerstes Reasoning, lange Agentic Coding Läufe	Tempo plus Intelligenz	am schnellsten, fast Frontier
Context Window	1M Tokens	1M Tokens	200K Tokens
Max Output	128K Tokens	64K Tokens	64K Tokens
Preis (Input / Output pro 1M)	$5 / $25	$3 / $15	$1 / $5
SWE-bench Verified	88,6%	79,6%	stark, niedriger

Opus 4.8 erschien am 28. Mai 2026 und ist das Flaggschiff. Es erreicht 88,6% auf SWE-bench Verified, dem Standard Benchmark fürs Lösen echter GitHub Issues, gegenüber 87,6% bei Opus 4.7. Auf Terminal-Bench 2.1 sind es 90,1%. Die Zahl, die Anthropic beim Launch am stärksten betont hat, war aber kein Benchmark: Opus 4.8 lässt einen Fehler im eigenen Code rund viermal seltener unkommentiert durchgehen als sein Vorgänger. Diese Ehrlichkeit zählt in der Praxis mehr als ein Punkt SWE-bench, denn der typische Fehlermodus eines Coding Agenten ist selten "kann es nicht lösen" und meistens "hat es falsch gelöst und dir gesagt, alles sei in Ordnung".

Ein Context Window von 1M Tokens heißt, dass Opus 4.8 und Sonnet 4.6 etwa 555.000 bis 750.000 Wörter auf einmal halten, eine ganze mittelgroße Codebase oder einen Stapel Verträge. Haiku bleibt bei immer noch großen 200K. Eine Feinheit, die man kennen sollte: ein großes Context Window heißt nicht, dass du es füllen solltest. Die Qualität sinkt, je voller der Kontext wird, ein Problem, das man inzwischen Context Rot nennt. Das Fenster ist Spielraum, kein Ziel.

Der Preis skaliert so, wie man es erwartet. Opus kostet das Fünffache von Haiku beim Input und das Fünffache beim Output. Die praktische Regel, die wir nutzen: Haiku für Arbeit mit großem Volumen und klarer Definition wie Klassifizierung, Extraktion und Routing. Sonnet als Alltagspferd für die meisten Chats und das meiste Coding. Opus, wenn die Aufgabe wirklich schwer ist, lange läuft oder teuer wird, wenn man sie verkackt. Es gibt außerdem einen Fast Mode auf Opus 4.8 mit $10 Input und $50 Output pro Million Tokens, für die Fälle, in denen Latenz wichtiger ist als Kosten.

Alle drei lesen Text und Bilder, sprechen Dutzende Sprachen und laufen über die Claude API, Amazon Bedrock, Google Vertex AI und Microsoft Foundry. Wenn dein Unternehmen also auf AWS oder Azure festgelegt ist, kannst du dieselben Modelle über die Cloud nutzen, die du ohnehin bezahlst. Ein Vorbehalt: auf Microsoft Foundry läuft Opus 4.8 derzeit mit 200K Window statt der vollen 1M.

Oberfläche eins: claude.ai, das Chatprodukt#

Das ist der Teil, den jeder kennt, und er ist still zu einem ernsthaften Arbeitsplatz gewachsen. Lohnt sich zu verstehen, bevor du irgendwas bezahlst.

Projects sind das Feature, das die meisten übersehen. Ein Project ist ein Behälter mit eigenen Anweisungen und hochgeladenem Wissen. Leg deinen Marken Guide, deine API Doku und deine Tonregeln einmal in ein Project, und jede Unterhaltung darin erbt diesen Kontext automatisch. Für ein kleines Unternehmen ist das der Unterschied zwischen "jeden Morgen die Firma neu erklären" und "nie wieder erklären".

Artifacts machen aus einem Chat einen lebendigen Arbeitsbereich. Bitte um eine kleine Web App, ein Diagramm oder ein Dokument, und Claude rendert es neben der Unterhaltung, wo du es ansiehst und weiterdrehst. Artifacts halten inzwischen bis zu 20MB festen Speicher pro Stück, können APIs aufrufen, über MCP mit externen Diensten reden und sich beim erneuten Öffnen mit Live Daten aktualisieren. Leute bauen so wirklich brauchbare interne Werkzeuge, ohne je einen Editor anzufassen.

Dann gibt es das Bindegewebe. Connectors sind der Weg, über den claude.ai mit der Außenwelt spricht, und sie laufen über das Model Context Protocol, den offenen Standard, den Anthropic zum Verbinden von KI mit Werkzeugen und Daten herausgegeben hat. Über MCP erreicht Claude Gmail, Google Drive, Slack, GitHub, Notion, Stripe und Hunderte andere Dienste. Als Nicht Entwickler fügst du einen Connector mit ein paar Klicks hinzu, und Claude kann plötzlich deinen Kalender lesen oder deinen Posteingang sortieren. Das ist dasselbe MCP, für das Entwickler Server bauen, und genau das ist das Elegante daran: das Protokoll ist eine Sache, auf jeder Ebene verfügbar.

Zwei weitere Oberflächen erweitern, wo Claude lebt. Claude in Chrome, seit Ende April 2026 in der Beta für bezahlte Pläne, setzt Claude in eine Browser Seitenleiste, wo es die Seite sieht und mit dir durchklickt. Und die Claude Desktop App hat Cowork bekommen, das im April 2026 für alle bezahlten Pläne allgemein verfügbar wurde und Claude erlaubt, Dateien in einem von dir gewählten Ordner zu lesen, zu bearbeiten und zu erstellen und mehrstufige Arbeit allein zu erledigen. Voice Mode auf dem Handy ist jetzt für alle kostenlos.

Die Pläne, mit echten Preisen:

Plan	Preis	Für
Free	$0	ausprobieren, leichte Nutzung
Pro	$20/Mo ($17 jährlich)	Einzelpersonen, täglich
Max 5x	$100/Mo	Vielnutzer, mehr Kontingent
Max 20x	$200/Mo	Power User, Claude Code
Team	$25-30/Platz/Mo	kleine Teams
Enterprise	individuell	größere Firmen, ab ca. 70 Plätzen

Die ehrliche Fassung: Free reicht zum Testen. Pro ist die richtige Stufe für eine Person, die echt damit arbeitet. Max gibt es, weil die Leute, die Claude Code den ganzen Tag laufen lassen, ständig an Grenzen stießen, und die höhere Max Stufe sowie der Team Premium Platz sind die Stellen, an denen Claude Code am bequemsten läuft.

Oberfläche zwei: Claude Code, der Agent im Terminal#

Das ist die Oberfläche, die verändert, wie sich Arbeit anfühlt, und sie wird am häufigsten missverstanden. Claude Code ist kein Chatbot in einem Terminal. Anthropic beschreibt es als ein Agentic Coding Tool, das deine Codebase liest, Dateien bearbeitet, Befehle ausführt und sich in deine Entwickler Werkzeuge einklinkt. Du sagst in normaler Sprache, was du willst, und es erledigt die Arbeit über viele Dateien, lässt die Tests laufen und zeigt dir den Diff.

Die Installation ist eine Zeile. Auf macOS, Linux oder WSL:

curl -fsSL https://claude.ai/install.sh | bash

Es gibt auch Homebrew (brew install --cask claude-code) und WinGet für Windows. Dann startest du claude in einem Projekt und loggst dich ein. Es bleibt auch nicht im Terminal. Dieselbe Engine läuft in einer VS Code und Cursor Erweiterung, in JetBrains IDEs, in einer Desktop App mit Sitzungen nebeneinander, im Browser auf claude.ai/code und in der iOS App. Deine Konfiguration folgt dir über alle hinweg.

Das mit Abstand Wirkungsvollste in Claude Code ist eine Datei namens CLAUDE.md. Anthropics eigenes Best Practices Dokument nennt sie die Verfassung des Agenten. Es ist eine Markdown Datei in deinem Projektordner, die Claude zu Beginn jeder Sitzung liest. Du legst deine Coding Standards, deine Architektur Entscheidungen, deine bevorzugten Bibliotheken und deine Review Checkliste hinein und hörst auf, dich zu wiederholen. Dazu baut Claude Code inzwischen Auto Memory auf, während es arbeitet, und merkt sich Dinge wie deinen Build Befehl und Debugging Erkenntnisse über Sitzungen hinweg, ohne dass du etwas aufschreibst.

Von dort wird es schichtweise mächtig. Das sind die Bausteine, die man beim Namen kennen sollte, denn es sind die Wörter, mit denen du Claude dazu bringst, sich selbst einzurichten:

MCP Server. Dasselbe Model Context Protocol wie auf claude.ai, hier in deinem Terminal. claude mcp add richtet einen Server ein, und schon kann Claude Code deine Jira Tickets lesen, deine Datenbank abfragen oder jedes Werkzeug nutzen, das du ihm gibst. Server werden pro Benutzer, pro Projekt oder lokal konfiguriert, und ein gemeinsames .mcp.json legt die Server des Projekts für das ganze Team in git ab.
Subagents. Ein Subagent ist eine eigene Claude Sitzung mit eigenem Context Window, gestartet für eine laute oder parallelisierbare Aufgabe, die nur eine Zusammenfassung zurückmeldet. Die Hauptunterhaltung bleibt sauber. Mit /agents verwaltest du sie. So lässt du mehrere Arbeitsstränge gleichzeitig laufen.
Hooks. Ereignisgesteuerte Shell Befehle, die deterministisch feuern, wenn etwas passiert, etwa PreToolUse, PostToolUse oder SessionStart. Anders als ein Prompt läuft ein Hook immer. Man nutzt sie, um nach jeder Bearbeitung automatisch zu formatieren, gefährliche Befehle zu blocken oder eine Codebase neu zu indexieren. Das Neueste daran: ein Hook kann jetzt direkt ein MCP Tool aufrufen, nicht nur einen Shell Befehl.
Skills. Ein Skill ist eine SKILL.md Datei in .claude/skills/, die einen wiederholbaren Ablauf verpackt, aufgerufen als /dein-skill oder automatisch, wenn Claude ihn für passend hält. Anders als ein Subagent läuft ein Skill in der aktuellen Unterhaltung, kein neuer Kontext, kein Spawning. Gut, um ein Rezept festzuhalten, das dein Team wiederverwendet.
Plugins. Ein versioniertes Bündel, das Skills, Subagents, Slash Commands, Hooks, Output Styles und MCP Server zusammen als eine installierbare Einheit liefert, teilbar über einen Marketplace. Wenn ein Skill eine Rezeptkarte ist, ist ein Plugin das ganze Kochbuch.
Plan Mode. Claude liest und schlägt einen schriftlichen Plan vor, ohne irgendetwas anzufassen. Du genehmigst ihn, dann führt es aus. Die Disziplin, die das erzwingt, ist das ganze Spiel.
Checkpoints. Claude Code verfolgt deine Sitzung, sodass du zu einem früheren Zustand zurückspulen kannst, wenn eine Änderung schiefging.

Unter allem liegt ein Ablauf, den Anthropic empfiehlt und der wirklich funktioniert: explore, plan, code, commit. Lass Claude die relevanten Dateien zuerst im Plan Mode lesen, lass es aufschreiben, was es ändert und in welcher Reihenfolge, dann lass es gegen diesen Plan umsetzen und committe mit einer klaren Nachricht. Das Überspringen von explore und plan ist der häufigste Grund, warum eine Sitzung entgleist.

Und weil es der Unix Philosophie folgt, kannst du es skripten. Das Flag -p lässt Claude headless laufen, sodass du hineinpipen kannst:

git diff main --name-only | claude -p "review these changed files for security issues"

Dieses eine Muster, Claude in einer Pipe, macht aus dem Assistenten Infrastruktur. Wir fahren Reviews, Übersetzungen und Audits genau so in der CI.

Oberfläche drei: die API und das Agent SDK, für Bauende#

Wenn du Claude in dein eigenes Produkt willst, steigst du auf die API hinab. Der Kern ist die Messages API, mit offiziellen SDKs für Python, TypeScript und Go. Ein minimaler Aufruf sieht so aus:

from anthropic import Anthropic

client = Anthropic()
message = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=1024,
    messages=[{"role": "user", "content": "Summarize this contract."}],
)
print(message.content[0].text)

Auf diesem Fundament erledigt eine Handvoll Features die meiste Schwerarbeit, und zu wissen, dass es sie gibt, spart dir Geld und Neubauten.

Tool Use, auch Function Calling genannt, lässt Claude entscheiden, wann es von dir definierte Funktionen mit welchen Argumenten aufruft. Es ist die Grundlage jedes Agenten. Du gibst Claude eine Liste von Tools mit JSON Schemas, und es gibt strukturierte Aufrufe zurück, die du ausführst.

Prompt Caching ist das Feature, das sich selbst bezahlt. Du markierst einen stabilen Teil deines Prompts, einen langen System Prompt oder ein großes Dokument, mit cache_control, und folgende Aufrufe nutzen ihn wieder. Cache Reads kosten etwa zehn Prozent des normalen Input Preises, wiederholter Kontext wird also bis zu neunzig Prozent günstiger. Der Standard Cache lebt fünf Minuten, mit einer Option auf eine Stunde. Wenn du dieselben Anweisungen bei jedem Request schickst und nicht cachst, zahlst du zu viel.

Extended Thinking lässt das Modell vor der Antwort nachdenken, mit einem budget_tokens, das du steuerst:

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=4096,
    thinking={"type": "enabled", "budget_tokens": 2000},
    messages=[{"role": "user", "content": "Plan a database migration."}],
)

Der Rest der Plattform ist ein Werkzeugkasten, aus dem du nach Bedarf greifst. Die Batch API fährt große Jobs asynchron innerhalb von 24 Stunden mit pauschal 50% Rabatt, ideal für Massenarbeit, die nicht zeitkritisch ist. Die Files API verwaltet Dokumente und Bilder, die du über mehrere Aufrufe hinweg referenzierst. Citations lassen Claude auf die genauen Sätze zeigen, die es benutzt hat, und genau so baust du vertrauenswürdige, prüfbare Ausgaben. Es gibt auch hauseigene Tools: ein Web Search Tool für aktuelle Daten, ein Code Execution Tool, das Python im Aufruf ausführt, und einen MCP Connector, mit dem Claude jeden entfernten MCP Server erreicht, ohne dass du Client Code schreibst. Ein Memory Tool für lang laufende Agenten ist in der öffentlichen Beta.

Wenn du einen vollen Agenten bauen willst statt einzelner Aufrufe, gibt es das Claude Agent SDK, früher Claude Code SDK. Es gibt dir denselben Agent Loop, dieselbe Tool Behandlung und dasselbe Context Management, die Claude Code antreiben, in Python und TypeScript, mit voller Kontrolle über Orchestrierung und Berechtigungen. Das Denkmodell: die API ist für Aufrufe, das Agent SDK ist für Agenten.

Welche Oberfläche für welche Aufgabe#

Stell die vier nebeneinander, und die Entscheidung wird einfach.

Greif zu claude.ai, wenn ein Mensch dabei ist und die Arbeit Denken, Schreiben, Analyse oder ein schnelles Werkzeug in Artifacts ist. Greif zu Claude Code, wenn die Arbeit Dateien, eine Codebase oder deinen lokalen Rechner berührt und du einen Agenten willst, der handelt statt nur antwortet. Greif zur API, wenn Claude in Software leben muss, die du an andere auslieferst. Und nimm die Cloud Variante, Bedrock, Vertex oder Foundry, wenn Einkauf oder Datenresidenz das zum Weg des geringsten Widerstands machen.

Für das Modell darin: Haiku fürs Volumen, Sonnet für das meiste, Opus, wenn es schwer oder teuer ist, falsch zu liegen.

Die Fallen, die nicht auf der Packung stehen#

Ein Guide, der nur Features auflistet, ist Marketing. Hier ist, was wirklich beißt.

Die erste ist selbstsicher falscher Code. Claude erfindet manchmal eine API Methode, die richtig klingt, aber vor zwei Versionen umbenannt wurde, oder zitiert eine Bibliotheksfunktion, die es nicht gibt. Die Lösung ist nicht, vage weniger zu vertrauen, sondern dem Modell aktuelle Fakten zu geben. Zeig ihm echte Dokumentation, und gib ihm in Claude Code Werkzeuge, die deinen echten Code lesen statt zu raten. Opus 4.8 ist hier deutlich besser, aber besser ist nicht null.

Die zweite ist Context Rot. Je länger eine Sitzung wird, desto dünner wird die Aufmerksamkeit des Modells, und die Qualität fällt. Das 1M Window verleitet dazu, alles hineinzukippen, und dann wird die Antwort schlechter. Halte Sitzungen eng. Nutze Subagents, um laute Arbeit in eigenen Kontext zu schieben. Fang neu an, wenn ein Faden abgeschweift ist.

Die dritte ist die, die du ernst nehmen solltest, sobald du Claude mit deinen Werkzeugen verbindest: die Lethal Trifecta. Sicherheitsforscher nennen so drei Bedingungen, die zusammen einen Agenten angreifbar machen. Zugang zu privaten Daten, Kontakt mit nicht vertrauenswürdigem Inhalt und ein Weg, Daten hinauszuschicken. Jede einzeln ist harmlos. Alle drei zusammen heißen, dass eine versteckte Anweisung, etwa in einer Webseite oder einer Mail, deinen Agenten dazu bringen kann, preiszugeben, was er sieht. MCP macht Claude viel fähiger und vergrößert in derselben Bewegung diese Angriffsfläche. Die Abwehr ist unglamourös und echt: betreibe nur MCP Server, denen du traust, nutze die Berechtigungs Allowlist, damit der Agent nicht alles ausführen kann, und folge dem Prinzip der geringsten Rechte. Gib einem Agenten nicht gleichzeitig deine Geheimnisse und eine offene Tür.

Keine dieser Fallen ist ein Grund, Claude zu meiden. Sie sind der Unterschied zwischen "gut nutzen" und "überrascht werden".

Wo du anfängst#

Wenn du nie über das Chatfenster hinausgegangen bist, mach diese Woche drei Dinge. Bau ein Project und füll es mit deinem echten Kontext. Installiere Claude Code und schreib eine zehnzeilige CLAUDE.md für ein Repo. Häng einen MCP Connector an etwas, das du wirklich nutzt. Das ist der ganze Bogen dieses Guides in drei Schritten, vom Chat zum Agenten zum Verbundenen.

Der Grund, warum das für ein Unternehmen zählt, ist, dass die Lücke zwischen Werkzeug Inseln die Stelle ist, an der Zeit verloren geht, und Claude über diese vier Oberflächen ist vor allem ein Weg, diese Lücken zu schließen. Wir verbinden Claude über MCP genau dafür mit Kundensystemen, und der StudioMeyer Memory Server ist unsere eigene Antwort auf den Punkt, um den dieser Guide ständig kreist: Claude ein Gedächtnis zu geben, das Sitzungen überlebt.

Wenn du speziell die Terminal Seite willst, ist unsere Anleitung, Claude Code ohne Fachjargon einzurichten, die natürliche nächste Lektüre.

Claude ist kein einzelnes Fenster mehr. Lern die vier Oberflächen, und das Modell hört auf, ein cleveres Spielzeug zu sein, und wird etwas, auf dem du baust.