KI

Anthropics Claude Fable 5 ist da, mit angezogener Handbremse

Susan Hill

27 Jahre lang lag eine einzige Schwachstelle unberührt in OpenBSD, einem der Betriebssysteme, denen Banken, Firewalls und die Server hinter alltäglichen Websites vertrauen. Wer die Maschine über ein Netzwerk erreichte, konnte sie zum Absturz bringen, und fast drei Jahrzehnte lang bemerkte es niemand. Ein Anthropic-Modell namens Mythos schon. Jetzt hat dieses Modell ein öffentliches Gesicht: Anthropic hat Claude Fable 5 freigegeben, die erste Version seines leistungsfähigsten Systems, für die sich jeder anmelden kann.

Das Bemerkenswerte an Fable 5 ist kein Ranglistenplatz. Es ist, dass das zugrunde liegende Modell Software liest wie ein erfahrener Prüfer einen Vertrag und genau die eine Klausel findet, die alles bricht. Im Rahmen eines Forschungsprogramms, das Anthropic Project Glasswing nennt, arbeitete sich die Vorabversion durch mehr als tausend Open-Source-Projekte, den freien, geteilten Code, der weite Teile des Internets antreibt, und meldete über 23.000 Auffälligkeiten. Mehr als 10.000 davon waren schwerwiegend genug, um als hoch oder kritisch eingestuft zu werden.

Das Detail, das selbst Anthropics eigene Forscher beunruhigte, ist, dass niemand dem Modell dies beigebracht hat. Die Fähigkeit, Schwachstellen zu finden und auszunutzen, sei nie ein Trainingsziel gewesen, so das Unternehmen; sie entstand von selbst, je besser das Modell über Code nachdachte. FFmpeg ist das deutlichste Beispiel. Eine Schwachstelle steckte 16 Jahre lang in dieser Software zur Videoverarbeitung, dem Motor hinter unzähligen Streaming-Apps und Mediaplayern, verborgen in einer Codezeile, die automatische Testwerkzeuge fünf Millionen Mal ausgelöst hatten, ohne die Gefahr je zu erkennen. Das Modell erkannte sie.

Für die meisten Menschen sieht das alles nach nichts aus. Die Software, die Mythos prüfte, ist unsichtbare Infrastruktur: die Browser-Engine, der Betriebssystemkern, die Mediathek tief im Inneren eines Telefons. Doch das Unsichtbare ist genau das Problem. Die aufgedeckten Schwachstellen hatten überlebt, weil sie in Code lebten, der zu alt, zu langweilig oder zu tief vergraben war, als dass ihn jemand immer wieder durchgelesen hätte. Ein Werkzeug, das all das unermüdlich neu liest, verschiebt die Chancen für jene, die das Fundament des Internets pflegen, und in den falschen Händen für jene, die es angreifen würden.

Solche Zahlen bedeuten nur etwas vor einem Maßstab. Bei CyberGym, einem Test, ob ein Modell eine echte Sicherheitslücke reproduzieren kann, erreicht der Mythos-Kern in Fable 83,1 Prozent gegenüber 66,6 Prozent beim älteren Claude Opus 4.6, ungefähr der Unterschied zwischen einem fähigen Nachwuchsanalysten und einem Spezialisten, der selten danebenliegt. Die Fortschritte beschränken sich nicht auf Sicherheit. Das Analyseunternehmen Hex berichtete, Fable sei das erste Modell gewesen, das in seinem internen Test über 90 Prozent kam, und frühe Nutzer beschreiben ähnliche Sprünge in der Softwareentwicklung, der Datenanalyse und dem Schnittstellenentwurf.

Dann kommt die Wendung. Das öffentliche Fable 5 wird genau das nicht tun, was es bemerkenswert macht. Anthropic hat vier Bereiche abgeriegelt, Cybersicherheit, Biologie, Chemie und ein Kopierverfahren namens Distillation, und sobald eine Anfrage dorthin abdriftet, gibt Fable das Gespräch still an das ältere, sicherere Claude Opus 4.8 ab. Das geschehe selten, sagt das Unternehmen, frühe Daten zeigten, dass mindestens 95 Prozent der Sitzungen vollständig auf Fable selbst liefen. Das Ergebnis ist ein ungewöhnliches Produkt: das leistungsfähigste Modell, das Anthropic je ausgeliefert hat, absichtlich daran gehindert, seine schärfste Fähigkeit einzusetzen.

Dieser Entwurf lässt Fragen offen, die der Start nicht ganz beantwortet. Eine Schutzgrenze, die in 5 Prozent der Fälle beiseitetritt, bleibt eine Schutzgrenze mit Nähten, und die Linie zwischen der Erklärung, wie eine Software funktioniert, und der Erklärung, wie man sie bricht, verläuft selten sauber. Anthropic erklärt, ein externes Bug-Bounty-Programm habe mehr als 1.000 Stunden gelaufen, ohne einen universellen Weg um die Grenzen herum zu finden, doch das sind die eigenen Zahlen des Unternehmens, von keiner externen Aufsicht geprüft. Hinzu kommen Kosten, die die meisten zuerst spüren: Fable 5 kostet 10 Dollar pro Million Token Eingabe und 50 pro Million Ausgabe, die groben Einheiten, die ein Modell fürs Lesen und Schreiben berechnet, doppelt so viel wie Opus 4.8. Und wer es nutzt, gibt etwas Stilleres auf, denn Anthropic speichert nun 30 Tage Nutzungsdaten selbst für Kunden, die sonst für keine Speicherung zahlen, und nennt das eine Verteidigung gegen Missbrauch.

Vorerst hängt der Zugang davon ab, wie Sie Claude bereits nutzen. Entwickler erreichen Fable 5 sofort über Anthropics Programmierschnittstelle, und eine eigene Version namens Mythos 5 ging an eine kleine Gruppe vorab freigegebener Organisationen, neben einem Branchenbündnis, das Apple, Google, Microsoft, Nvidia und die Linux Foundation umfasst und daran arbeitet, das vom Modell Gefundene zu schließen, bevor Angreifer es können. Anthropic hat 100 Millionen Dollar an Modell-Guthaben und 4 Millionen an direkten Spenden für die Open-Source-Sicherheitsgruppen zugesagt, die diese Reparaturarbeit leisten.

Die breitere Einführung folgt einem Kalender. Abonnenten der Anthropic-Pläne Pro, Max, Team und sitzplatzbasiertes Enterprise erhalten Fable 5 bis zum 22. Juni ohne Aufpreis; ab dem 23. Juni zehrt die Nutzung an Guthaben. Ob die Schutzgrenzen halten, wenn Millionen neuer Nutzer dagegen drücken, ist der noch offene Teil. Die verblüffendere Tatsache ist es nicht. Eine Maschine kann nun den Code unter dem modernen Leben lesen und die Risse finden, die einer ganzen Generation entgingen, und die Frage danach lautet nicht mehr, ob sie es kann, sondern wer sie darum bitten darf.

Schlagwörter: , , ,

Diskussion

Es gibt 0 Kommentare.