Meituan trainiert LongCat 2.0 ohne Nvidia-Chips — und übertrifft GPT-5.5 beim Coden

LongCat 2.0 hat 1,6 Billionen Parameter, verarbeitet ein Kontextfenster von einer Million Tokens und hat GPT-5.5 auf dem maßgeblichen Benchmark für reales Software-Engineering überholt. Entwickelt wurde es von Meituan — einem Unternehmen, das außerhalb Chinas, wenn überhaupt, als Essenslieferdienst bekannt ist.

Das Modell erzielte 59,5 auf SWE-bench Pro, gegenüber 58,6 für GPT-5.5. Der Abstand mag gering wirken. Was ihn bedeutsam macht, ist die Frage, wie dieses System gebaut wurde: Meituan trainierte LongCat 2.0 auf mehr als 50.000 chinesischen KI-Beschleunigerkarten, ohne jede Nvidia-Hardware, die China seit 2022 kaum noch importieren kann. Der Hersteller wurde nicht offiziell bestätigt, die Fachwelt vermutet jedoch Huaweis Ascend 910B. Sollte das stimmen, wäre es das erste Mal, dass ein auf Huawei-Chips trainiertes Modell Frontier-Leistung in transparenten öffentlichen Benchmarks erreicht.

LongCat 2.0 nutzt eine Mixture-of-Experts-Architektur: Pro Anfrage werden nur zwischen 33 und 56 Milliarden Parameter aktiviert. Das hält die Inferenz schnell, ohne Hochleistungshardware vorauszusetzen. Das Kontextfenster von einer Million Tokens erlaubt es, eine komplette Codebasis in einer einzigen Sitzung zu lesen. Auf SWE-bench Multilingual erzielte das Modell 77,3; auf Terminal-Bench, das die Navigation in einer echten Unix-Umgebung testet, erreichte es 70,8.

Vor der offiziellen Ankündigung lief das Modell rund zwei Monate unter dem Codenamen „Owl Alpha“ auf OpenRouter. Entwickler, die es nutzten, stellten ungewöhnliche Coding-Fähigkeiten fest, wussten aber nicht, woher das Modell stammte. Meituan bestätigte nach dem Launch, dass Owl Alpha LongCat 2.0 in einer früheren Evaluierungsphase war.

Die MIT-Lizenz erzählt nur einen Teil der Geschichte. Trotz ihrer offenen und kommerziell permissiven Natur sind die Modellgewichte noch nicht veröffentlicht. Sowohl das GitHub-Repository als auch die Hugging-Face-Modellkarte zeigen „demnächst verfügbar“. Derzeit ist LongCat 2.0 nur über eine gehostete API zugänglich — Herunterladen, Fine-Tuning und lokales Ausführen sind noch nicht möglich.

Was Meituan geleistet hat, ist bemerkenswert. Das Unternehmen verarbeitet täglich über 50 Millionen Lebensmittelbestellungen und hatte intern bereits ein Sprachmodell namens Zhichi entwickelt, bevor es sich an externe KI-Entwicklung wagte. LongCat 2.0 ist sein erstes öffentliches Modell und nach Benchmark-Leistung eines der leistungsfähigsten Coding-Systeme unter einer offenen Lizenz.

Sobald die Gewichte verfügbar sind, tritt LongCat 2.0 in direkten Vergleich mit Metas Llama 4.1 und DeepSeek-V4 Pro. Die Frage, welche chinesischen Chips diese Ergebnisse ermöglicht haben, wird Konsequenzen weit über die KI-Gemeinschaft hinaus haben.

Schlagwörter: künstliche Intelligenz, Huawei, Open Source, GPT-5.5, LongCat 2.0, Meituan

Meituan trainiert LongCat 2.0 ohne Nvidia-Chips — und übertrifft GPT-5.5 beim Coden

Ähnliche Beiträge

Eustella und die KI-Souveränität: Ihre Daten bleiben in der EU, die Modelle kommen aus China

OpenAIs neues Sprachmodell denkt innerhalb der Audioschleife — und die Pause, die KI verriet, verschwindet

ChatGPT zieht in Excel und Google Sheets ein und schreibt Ihre Formeln, während Sie zusehen

GPT-5.5 ist gerade auf AWS gelandet und beendet Microsofts siebenjährigen Lock-in mit OpenAI

Chinas LineShine übertrifft El Capitan — ohne einen einzigen US-Chip

DeepSeek macht KI billig, und die amerikanische KI-Blase ist auf das Gegenteil gebaut

Diskussion