»Verzweifelter Schachzug«: Chinesische Unternehmen zerlegen High-End-Grafikkarten von Nvidia und setzen sie auf neue Platinen, um ihre KIs zu trainieren

Die RTX 4090 erfreut sich bei chinesischen Unternehmen großer Beliebtheit. Immerhin kommt sie den auf KI spezialisierten A100- und H100-GPUs am nächsten.

Das Bild zeigt ein Kryptomining-Rig, das ganze Grafikkarten verwendet. In China geht man nun viel weiter und zerlegt Grafikkarten in ihre Einzelteile, ehe sie neu zusammengesetzt werden. (Bildquelle: Pixabayrebcenter-moscow) Das Bild zeigt ein Kryptomining-Rig, das ganze Grafikkarten verwendet. In China geht man nun viel weiter und zerlegt Grafikkarten in ihre Einzelteile, ehe sie neu zusammengesetzt werden. (Bildquelle: Pixabay/rebcenter-moscow)

Künstliche Intelligenz respektive Maschinelles Lernen nimmt einen immer wichtigeren Platz in Industrie und Forschung ein. Für die hochpräzisen Berechnungen beispielsweise zum Trainieren von Sprachmodellen braucht es in der Regel Spezialprozessoren. In diesem Segment führend ist Nvidia mit seinen Server-GPUs A100 und H100.

Im Zuge der Exportbeschränkungen, welche die USA gegenüber China verhängt haben, wurde der Verkauf dieser Prozessoren an das Reich der Mitte jedoch bereits im September 2022 gestoppt.

In ihrer Verzweiflung greifen chinesische Unternehmen daher nun auf Chips zurück, die aus Spieleprodukten stammen. Besonders beliebt ist dabei die leistungsfähigste Gaming-Grafikkarte der Welt – die RTX 4090.

Tausende Spielegrafikkarten werden demontiert

Wie die Financial Times (hinter einer Paywall) in Berufung auf zwei Manager berichtet, werden jeden Monat tausende RTX-Grafikkarten in Fabriken und Werkstätten in ihre Kernkomponenten (Grafikeinheit und Speicher) zerlegt und auf neue Platinen verpflanzt, die auf KI-Anwendungen spezialisiert sind.  

Die Nachfrage nach Grafikprozessoren, die aus Spielekarten stammen, sei zudem zuletzt drastisch gestiegen. Allein im Dezember wurden demnach über 4.000 RTX-Beschleuniger demontiert, mehr als viermal so viele wie noch im November. Das passt auch zu einer neuen Betrugsmasche:

Spielegrafikkarten halten den Anforderungen von KI-Anwendungen aber nur bedingt stand, wie Charlie Chai, Analyst bei der auf China spezialisierten Forschungsgruppe 86Research konstatiert (via Financial Times):

Dies ist ein verzweifelter Schachzug chinesischer Unternehmen im Rahmen der Exportkontrollen. Das ist so, als würde man ein Küchenmesser benutzen, um ein Kunstwerk zu erschaffen. Es ist machbar, aber der Effekt ist suboptimal.

Abnehmer für die umgebauten Grafikeinheiten sind Financial Times zufolge öffentliche Unternehmen und kleine KI-Labors, die vor Inkrafttreten der US-Exportkontrollen nicht genügend Nvidia-Server-GPUs auf Lager hatten.

Die RTX 4090 wurde möglicherweise auch deshalb mittlerweile für den Verkauf nach China gesperrt. Das wiederum hat Nvidia bewogen, eine leicht abgeschwächte Variante des Flaggschiffs für den chinesischen Markt zu entwerfen – die RTX 4090D.

Die RTX 4090D soll sich allerdings nicht so gut für KI-Anwendungen eignen wie die normale RTX 4090, heißt es in dem Bericht der Financial Times. Hier die Specs im Vergleich zur RTX 4090 ohne D:

ModellShadereinheitenTensorkerneTaktrateSpeicher
RTX 409016.3845122.235/2.520 MHz24 GB GDDR6X (21 Gbps)
RTX 4090D14.5924562.280/2.520 MHz24 GB GDDR6X (21 Gbps)

Unserer Ansicht nach sollten die Unterschiede mit Blick auf KI-Anwendungen aber nur minimal ausfallen. Schließlich weichen die beiden Modelle nur unwesentlich voneinander ab und die grundlegende Architektur ist ohnehin dieselbe. Wir sind daher gespannt, ob demnächst auch die RTX 4090D ihren Weg in chinesische KI-Server findet.

Warum werden überhaupt RTX 4090 und nicht etwa A100 oder H100 verwendet?

Die hoch spezialisierten A100- und H100-Beschleuniger werden nur von Nvidia selbst vertrieben. Exportkontrollen aufrechtzuerhalten, fällt daher leicht. Dementsprechend gelangen nur noch kleine Mengen der Server-GPUs in die Hände chinesischer Unternehmen (via Walllstreet Online).

Ganz anders sieht es bei Spielegrafikkarten aus. Sie gelangen abseits von Nvidia auch über diverse Custom-Hersteller und Händler auf den Markt. Beschränkungen können somit deutlich leichter umgangen werden.

Was ist der Unterschied zwischen RTX 4090, A100 und H100?

Die wohl größten Unterschiede zwischen RTX 4090, A100 und H100 liegen in der Architektur und der Speicherbestückung. Wo die RTX 4090 nur 24 GByte GDDR6X vorzuweisen hat (was für Spiele mehr als ausreichend ist), sind es bei den anderen beiden Modellen jeweils 80 GByte - und das noch dazu vom schnelleren Typ HBM2e.

ModellArchitekturShadereinheitenSpeicherSpeicherbandbreite
RTX 4090Ada Lovelace16.38424 GB GDDR6X1.008 GB/s
H100Tesla Hopper14.59280 GB HBM2e2.039 GB/s
A100Tesla Ampere6.91280 GB HBM2e2.039 GB/s

Die H100 kann zudem das neue PCIe 5.0 nutzen, während die RTX 4090 ebenso wie die A100 auf PCIe 4.0 beschränkt sind. Das ist deshalb besonders wichtig, weil A100 und H100 als Server-GPUs mit anderen Grafikkarten zu einem Cluster zusammengeschaltet werden können.

Außerdem basiert H100 auf einer anderen Architektur (Tesla Hopper) als die RTX 4090 (Ada Lovelace).

Was seht ihr das? Habt ihr überhaupt schon davon gehört, dass die RTX 4090 derart umfunktioniert wird? Oder ist euch das völlig neu? Schreibt es uns gerne in die Kommentare!

zu den Kommentaren (40)

Kommentare(40)
Kommentar-Regeln von GameStar
Bitte lies unsere Kommentar-Regeln, bevor Du einen Kommentar verfasst.

Nur angemeldete Benutzer können kommentieren und bewerten.