KI

Microsoft verhandelt mit Anthropic über den ersten externen Maia-200-Einsatz

Susan Hill

Microsoft verhandelt mit Anthropic über die Lieferung seines hauseigenen Maia-200-KI-Chips, was zugleich das erste Mal wäre, dass dieses Silizium die eigenen Rechenzentren des Konzerns verlässt. Die Gespräche, zuerst von The Information gemeldet und von CNBC bestätigt, sind die operative Konsequenz einer Finanzbeziehung, die bisher vor allem auf der Tabellenkalkulation existierte.

Die diskutierte Vereinbarung ist eng gefasst, aber gewichtig. Anthropic würde Azure-Server mit Maia-200-Chips für die Inferenz mieten, also für die teure Phase, in der Claude den Nutzern antwortet, getrennt vom sichtbareren Training neuer Modelle. Die Inferenz ist die Stelle, an der jedes Frontier-Lab gerade Geld verbrennt. Die Stückkosten einer einzelnen Anfrage, multipliziert mit Hunderten Millionen Nutzern, sind die wichtigste Zahl des KI-Geschäfts.

Für Microsoft wäre Anthropic auf Maia 200 die stärkste denkbare kommerzielle Validierung eines Chipprogramms, das bisher als internes Forschungsprojekt existierte. Amazons Trainium und Inferentia stehen seit Jahren externen Kunden zur Verfügung. Googles TPU ist das stille Rückgrat eines Großteils der LLM-Revolution. Maia wurde dagegen nur in den eigenen Anlagen von Microsoft in Arizona und Iowa eingesetzt, für interne KI-Lasten, die das Unternehmen nicht öffentlich aufschlüsselt. Das weltweit am zweitstärksten beobachtete Frontier-Lab als Kunden würde den Chip über Nacht von interner Infrastruktur zu einem kommerziellen Produkt machen.

Die finanzielle Logik liegt bereits vor. Microsoft hält eine Eigenkapitalbeteiligung von fünf Milliarden Dollar an Anthropic; Anthropic wiederum hat sich zu rund 30 Milliarden Dollar langfristiger Azure-Compute-Ausgaben verpflichtet. Dieses Geld würde ohnehin durch irgendeine Form von Silizium fließen. Die offene Frage, die dieser Deal beantworten würde, war stets, ob Anthropic es in Nvidia-GPUs verbrennt, die Microsoft vermietet, oder ob Microsoft einen relevanten Anteil in eigene Chips lenken kann.

Maia 200 ist Microsofts Inferenzbeschleuniger der zweiten Generation. Das Bauteil wird im 3-Nanometer-Prozess von TSMC gefertigt und verwendet vier verlinkte Beschleuniger pro Package. Das Unternehmen positioniert es als inferenzorientiertes Silizium, optimiert für die Arbeit des Antwortens, nicht für die des Lernens. CEO Satya Nadella hat Investoren gesagt, der Chip liefere „über 30 Prozent verbesserte Tokens pro Dollar“ gegenüber dem aktuellsten GPU-Silizium in der Azure-Flotte. Das ist eine Kosten-, keine Leistungsaussage, und in der Inferenz entscheidet die Kostenrechnung darüber, ob ein Chip lange genug überlebt, um Bedeutung zu haben.

Für Anthropic passen die Maia-200-Gespräche in ein Muster. Das Labor hat im vergangenen Jahr einen bewusst heterodoxen Compute-Stack aufgebaut: Nvidia-GPUs über mehrere Clouds, AWS Trainium über eine mehrjährige Vereinbarung mit Amazon, die mit über 100 Milliarden Dollar bewertet wird, und Googles TPU für Teile der Trainings-Pipeline. Microsofts Silizium rundet das Bild ab. Damit hätte Anthropic in der Praxis die anbieterdiverseste Compute-Architektur unter den Frontier-Labs. Das ist der operative Ausdruck einer Strategie, die Dario Amodei seit Monaten kommuniziert: dass Rechenleistung, nicht Talent, der bindende Engpass des Labors ist.

Beschlossen ist nichts. Beide Seiten beschreiben die Gespräche als frühe Phase, und Maia 200 ist externen Azure-Kunden in keiner kommerziellen Form zugänglich. Die von Microsoft genannten 30 Prozent sind eine Anbieterkennzahl auf einer Last, die der Anbieter durchgängig kontrolliert. Unabhängige Benchmarks gegen Nvidias aktuelle Hopper- oder Blackwell-Generationen existieren öffentlich nicht. Die strategische Optik ist zudem in einer Richtung unangenehm: Microsoft ist der größte Einzelinvestor von OpenAI, Anthropics direktem Rivalen. Maia-Kapazität gleichzeitig an beide Labore zu verkaufen ist eine Konfiguration, die Microsoft nie getestet hat, und die vertragliche Trennung, die das glaubwürdig machen würde, ist nicht trivial.

Was folgt, ist Verfahrenslogik. Kommerzielle Konditionen sind nicht durchgesickert, ein Termin für die allgemeine Verfügbarkeit von Maia 200 außerhalb von Microsofts eigenen Anlagen wurde nicht veröffentlicht, und keines der beiden Unternehmen hat einen Fahrplan bestätigt. Das nächste belastbare Signal kommt mit der nächsten Quartalsbilanz von Microsoft, in der jeder verbindliche externe Kunde von Gewicht offengelegt werden müsste. Bis dahin läuft die finanzielle Choreografie zwischen Redmond und San Francisco dem Silizium selbst voraus.

Diskussion

Es gibt 0 Kommentare.