KI

Claude Fable 5 ist zurück: Ein Klassifikator löste, was Exportkontrollen nicht lösen konnten

Adrian Kessler

Claude Fable 5, Anthropics leistungsfähigstes öffentlich zugängliches KI-Modell, ist weltweit wieder verfügbar. Die Rückkehr folgt auf achtzehn Tage vollständiger Sperrung, ausgelöst durch Exportkontrollvorschriften der US-Regierung, die Anthropic zur Echtzeit-Nationalitätsverifizierung seiner Nutzer verpflichteten. Da das Unternehmen diese Anforderung im globalen Maßstab nicht erfüllen konnte, entschied es sich für eine vollständige Aussetzung statt einer Teilkonformität.

Ausgelöst wurde die Sperrung durch eine spezifische Jailbreak-Technik, die Amazon-Forscher entdeckt hatten. Mit dieser Methode wurde Fable 5 eingesetzt, um Software-Schwachstellen auf eine Weise zu kartieren, die US-Exportbeschränkungen für bestimmte ausländische Staatsangehörige untersagen. Die interne Untersuchung förderte etwas zutage, das die regulatorische Logik verkompliziert: Dieselbe Klasse von Schwachstellen ließ sich auch mit deutlich weniger leistungsfähigen Modellen identifizieren — darunter Opus 4.8, GPT-5.5 und Kimi K2.7. Die fragliche Fähigkeit war also nicht exklusiv Fable 5 zuzuschreiben.

Der Fix, der die Exportkontrollen entsperrte

Was sich geändert hat, ist ein neuer Sicherheitsklassifikator, der speziell darauf trainiert wurde, die von Amazon dokumentierte Bypass-Technik zu blockieren. Anthropic gibt an, dass der Klassifikator die offengelegte Methode in mehr als 99 Prozent der Fälle abfängt. Das ist kein Versprechen absoluten Schutzes vor künftigen Jailbreaks, sondern eine gezielte Korrektur für eine bekannte Schwachstelle. Der Klassifikator wirkt auf Eingabeebene und leitet Anfragen, die den dokumentierten Mustern entsprechen, vor der Modellverarbeitung um.

Die weitergehende Implikation für die KI-Regulierung verdient eine klare Formulierung. Die Exportkontrollen wurden auf Fable 5 angewandt, nicht weil das Modell als einziges in der Lage gewesen wäre, den Schaden zu verursachen, sondern weil eine bekannte Technik es ausnutzte. Sie wurden nicht aufgehoben, weil der regulatorische Rahmen diese Frage gelöst hätte, sondern weil ein Klassifikator die dokumentierte Lücke schloss. Anthropic arbeitet mit Amazon, Microsoft und Google an einem gemeinsamen Framework zur Bewertung der Schwere von KI-Jailbreaks anhand von vier Kriterien: Fähigkeitsgewinn, Breite dieses Gewinns, Leichtigkeit der Waffenisierung und Entdeckbarkeit. Dieses Framework existiert noch nicht als öffentlicher Standard.

Was das Modell leistet — und was es kostet

Das Modell selbst ist unverändert. Fable 5 ist für anspruchsvolles Langstrecken-Reasoning und agentisches Arbeiten konzipiert — Aufgaben, die Planung, Ausführung und Kurskorrektur über lange Sequenzen hinweg erfordern, ohne menschliche Freigabe bei jedem Schritt. Das Kontextfenster beträgt eine Million Token, was auch der Standardwert ist. Die maximale Ausgabe pro Antwort beläuft sich auf 128.000 Token. Das Denken ist immer aktiviert; die Gedankenkette wird als lesbares Resumé zurückgegeben, nicht als Rohausgabe.

Der Zugang ist mit Bedingungen verknüpft, die vor der Sperrung nicht galten. Fable 5 erfordert nun eine 30-tägige Datenspeicherung — es ist unter Vereinbarungen ohne Datenspeicherung nicht verfügbar. Das betrifft Organisationen aus Gesundheitswesen, Recht und öffentlichem Sektor, wo solche Zero-Retention-Vereinbarungen oft Voraussetzung für die Einführung von KI-Werkzeugen sind. Die Preise liegen über dem Opus-Niveau: zehn Dollar pro Million Eingabe-Token, fünfzig Dollar pro Million Ausgabe-Token. Anfragen, die Sicherheitsklassifikatoren auslösen, können an ein Ausweichmodell weitergeleitet werden statt abgelehnt zu werden; ob diese Weiterleitung für den Endnutzer sichtbar ist, hängt von der jeweiligen Betreiberkonfiguration ab.

Verfügbarkeit und Ausblick

Fable 5 verfügt über ein Schwestermodell, Claude Mythos 5, das dieselben Grundfähigkeiten und denselben Preis aufweist, aber offensive Cybersicherheitsfunktionen umfasst, die Fable 5 fehlen. Mythos 5 ist über Project Glasswing, eine eigene Zugangsstufe, verfügbar. Die beiden Modelle kehrten nicht gleichzeitig zurück: Der Zugang zu Mythos 5 wurde für bestimmte US-Organisationen eine Woche vor der globalen Rückkehr von Fable 5 wiederhergestellt.

Fable 5 ist ab sofort auf der Claude-Plattform, Claude.ai, Claude Code und Claude Cowork verfügbar. Für Pro-, Max-, Team- und ausgewählte Enterprise-Pläne ist das Modell bis zum 7. Juli im Rahmen von bis zu 50 Prozent der wöchentlichen Nutzungslimits inbegriffen; danach wechselt es zu nutzungsbasierter Kreditabrechnung. Die Zugänge über AWS, Google Cloud und Microsoft Foundry werden schrittweise wiederhergestellt. Der Rahmen, der bestimmen wird, wie beim nächsten Auftreten einer neuartigen Bypass-Technik vorzugehen ist, befindet sich noch im Aufbau.

Schlagwörter: , , , , ,

Diskussion

Es gibt 0 Kommentare.