KI

Meituan trainiert LongCat 2.0 ohne Nvidia-Chips — und übertrifft GPT-5.5 beim Coden

Susan Hill

LongCat 2.0 hat 1,6 Billionen Parameter, verarbeitet ein Kontextfenster von einer Million Tokens und hat GPT-5.5 auf dem maßgeblichen Benchmark für reales Software-Engineering überholt. Entwickelt wurde es von Meituan — einem Unternehmen, das außerhalb Chinas, wenn überhaupt, als Essenslieferdienst bekannt ist.

Das Modell erzielte 59,5 auf SWE-bench Pro, gegenüber 58,6 für GPT-5.5. Der Abstand mag gering wirken. Was ihn bedeutsam macht, ist die Frage, wie dieses System gebaut wurde: Meituan trainierte LongCat 2.0 auf mehr als 50.000 chinesischen KI-Beschleunigerkarten, ohne jede Nvidia-Hardware, die China seit 2022 kaum noch importieren kann. Der Hersteller wurde nicht offiziell bestätigt, die Fachwelt vermutet jedoch Huaweis Ascend 910B. Sollte das stimmen, wäre es das erste Mal, dass ein auf Huawei-Chips trainiertes Modell Frontier-Leistung in transparenten öffentlichen Benchmarks erreicht.

LongCat 2.0 nutzt eine Mixture-of-Experts-Architektur: Pro Anfrage werden nur zwischen 33 und 56 Milliarden Parameter aktiviert. Das hält die Inferenz schnell, ohne Hochleistungshardware vorauszusetzen. Das Kontextfenster von einer Million Tokens erlaubt es, eine komplette Codebasis in einer einzigen Sitzung zu lesen. Auf SWE-bench Multilingual erzielte das Modell 77,3; auf Terminal-Bench, das die Navigation in einer echten Unix-Umgebung testet, erreichte es 70,8.

Vor der offiziellen Ankündigung lief das Modell rund zwei Monate unter dem Codenamen „Owl Alpha“ auf OpenRouter. Entwickler, die es nutzten, stellten ungewöhnliche Coding-Fähigkeiten fest, wussten aber nicht, woher das Modell stammte. Meituan bestätigte nach dem Launch, dass Owl Alpha LongCat 2.0 in einer früheren Evaluierungsphase war.

Die MIT-Lizenz erzählt nur einen Teil der Geschichte. Trotz ihrer offenen und kommerziell permissiven Natur sind die Modellgewichte noch nicht veröffentlicht. Sowohl das GitHub-Repository als auch die Hugging-Face-Modellkarte zeigen „demnächst verfügbar“. Derzeit ist LongCat 2.0 nur über eine gehostete API zugänglich — Herunterladen, Fine-Tuning und lokales Ausführen sind noch nicht möglich.

Was Meituan geleistet hat, ist bemerkenswert. Das Unternehmen verarbeitet täglich über 50 Millionen Lebensmittelbestellungen und hatte intern bereits ein Sprachmodell namens Zhichi entwickelt, bevor es sich an externe KI-Entwicklung wagte. LongCat 2.0 ist sein erstes öffentliches Modell und nach Benchmark-Leistung eines der leistungsfähigsten Coding-Systeme unter einer offenen Lizenz.

Sobald die Gewichte verfügbar sind, tritt LongCat 2.0 in direkten Vergleich mit Metas Llama 4.1 und DeepSeek-V4 Pro. Die Frage, welche chinesischen Chips diese Ergebnisse ermöglicht haben, wird Konsequenzen weit über die KI-Gemeinschaft hinaus haben.

Schlagwörter: , , , , ,

Diskussion

Es gibt 0 Kommentare.