Das Bild zeigt ein Kryptomining-Rig, das ganze Grafikkarten verwendet. In China geht man nun viel weiter und zerlegt Grafikkarten in ihre Einzelteile, ehe sie neu zusammengesetzt werden. (Bildquelle: Pixabay/rebcenter-moscow)

Künstliche Intelligenz respektive Maschinelles Lernen nimmt einen immer wichtigeren Platz in Industrie und Forschung ein. Für die hochpräzisen Berechnungen beispielsweise zum Trainieren von Sprachmodellen braucht es in der Regel Spezialprozessoren. In diesem Segment führend ist Nvidia mit seinen Server-GPUs A100 und H100.

Im Zuge der Exportbeschränkungen, welche die USA gegenüber China verhängt haben, wurde der Verkauf dieser Prozessoren an das Reich der Mitte jedoch bereits im September 2022 gestoppt.

In ihrer Verzweiflung greifen chinesische Unternehmen daher nun auf Chips zurück, die aus Spieleprodukten stammen. Besonders beliebt ist dabei die leistungsfähigste Gaming-Grafikkarte der Welt – die RTX 4090.

Tausende Spielegrafikkarten werden demontiert

Wie die Financial Times (hinter einer Paywall) in Berufung auf zwei Manager berichtet, werden jeden Monat tausende RTX-Grafikkarten in Fabriken und Werkstätten in ihre Kernkomponenten (Grafikeinheit und Speicher) zerlegt und auf neue Platinen verpflanzt, die auf KI-Anwendungen spezialisiert sind.

Die Nachfrage nach Grafikprozessoren, die aus Spielekarten stammen, sei zudem zuletzt drastisch gestiegen. Allein im Dezember wurden demnach über 4.000 RTX-Beschleuniger demontiert, mehr als viermal so viele wie noch im November. Das passt auch zu einer neuen Betrugsmasche:

Mehr zum Thema

Warum ausgerechnet Käufer der schnellsten Gaming-GPU von Nvidia in China gerade besonders vorsichtig sein müssen

von Alexander Köpf

Spielegrafikkarten halten den Anforderungen von KI-Anwendungen aber nur bedingt stand, wie Charlie Chai, Analyst bei der auf China spezialisierten Forschungsgruppe 86Research konstatiert (via Financial Times):

Dies ist ein verzweifelter Schachzug chinesischer Unternehmen im Rahmen der Exportkontrollen. Das ist so, als würde man ein Küchenmesser benutzen, um ein Kunstwerk zu erschaffen. Es ist machbar, aber der Effekt ist suboptimal.

Abnehmer für die umgebauten Grafikeinheiten sind Financial Times zufolge öffentliche Unternehmen und kleine KI-Labors, die vor Inkrafttreten der US-Exportkontrollen nicht genügend Nvidia-Server-GPUs auf Lager hatten.

Die RTX 4090 wurde möglicherweise auch deshalb mittlerweile für den Verkauf nach China gesperrt. Das wiederum hat Nvidia bewogen, eine leicht abgeschwächte Variante des Flaggschiffs für den chinesischen Markt zu entwerfen – die RTX 4090D.

Die RTX 4090D soll sich allerdings nicht so gut für KI-Anwendungen eignen wie die normale RTX 4090, heißt es in dem Bericht der Financial Times. Hier die Specs im Vergleich zur RTX 4090 ohne D:

Modell	Shadereinheiten	Tensorkerne	Taktrate	Speicher
RTX 4090	16.384	512	2.235/2.520 MHz	24 GB GDDR6X (21 Gbps)
RTX 4090D	14.592	456	2.280/2.520 MHz	24 GB GDDR6X (21 Gbps)

Unserer Ansicht nach sollten die Unterschiede mit Blick auf KI-Anwendungen aber nur minimal ausfallen. Schließlich weichen die beiden Modelle nur unwesentlich voneinander ab und die grundlegende Architektur ist ohnehin dieselbe. Wir sind daher gespannt, ob demnächst auch die RTX 4090D ihren Weg in chinesische KI-Server findet.

Warum werden überhaupt RTX 4090 und nicht etwa A100 oder H100 verwendet?

Die hoch spezialisierten A100- und H100-Beschleuniger werden nur von Nvidia selbst vertrieben. Exportkontrollen aufrechtzuerhalten, fällt daher leicht. Dementsprechend gelangen nur noch kleine Mengen der Server-GPUs in die Hände chinesischer Unternehmen (via Walllstreet Online).

Beliebt bei GameStar Tech

Was das N-Symbol auf Eurem Handy bedeutet und warum es interessant sein kann, es aktiviert zu haben

von Nils Raettig

Eine Bauernfamilie fand auf ihrem Land Spuren von Kohlenstofffasern – es stellte sich heraus, dass sie Teil eines bisher unbekannten »Raumschiffs« waren

von Jan Stahnke

Ganz anders sieht es bei Spielegrafikkarten aus. Sie gelangen abseits von Nvidia auch über diverse Custom-Hersteller und Händler auf den Markt. Beschränkungen können somit deutlich leichter umgangen werden.

Was ist der Unterschied zwischen RTX 4090, A100 und H100?

Die wohl größten Unterschiede zwischen RTX 4090, A100 und H100 liegen in der Architektur und der Speicherbestückung. Wo die RTX 4090 nur 24 GByte GDDR6X vorzuweisen hat (was für Spiele mehr als ausreichend ist), sind es bei den anderen beiden Modellen jeweils 80 GByte - und das noch dazu vom schnelleren Typ HBM2e.

Modell	Architektur	Shadereinheiten	Speicher	Speicherbandbreite
RTX 4090	Ada Lovelace	16.384	24 GB GDDR6X	1.008 GB/s
H100	Tesla Hopper	14.592	80 GB HBM2e	2.039 GB/s
A100	Tesla Ampere	6.912	80 GB HBM2e	2.039 GB/s

Die H100 kann zudem das neue PCIe 5.0 nutzen, während die RTX 4090 ebenso wie die A100 auf PCIe 4.0 beschränkt sind. Das ist deshalb besonders wichtig, weil A100 und H100 als Server-GPUs mit anderen Grafikkarten zu einem Cluster zusammengeschaltet werden können.

Außerdem basiert H100 auf einer anderen Architektur (Tesla Hopper) als die RTX 4090 (Ada Lovelace).

Was seht ihr das? Habt ihr überhaupt schon davon gehört, dass die RTX 4090 derart umfunktioniert wird? Oder ist euch das völlig neu? Schreibt es uns gerne in die Kommentare!