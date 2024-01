Das Bild zeigt ein Kryptomining-Rig, das ganze Grafikkarten verwendet. In China geht man nun viel weiter und zerlegt Grafikkarten in ihre Einzelteile, ehe sie neu zusammengesetzt werden. (Bildquelle: Pixabay/rebcenter-moscow)

Künstliche Intelligenz respektive Maschinelles Lernen nimmt einen immer wichtigeren Platz in Industrie und Forschung ein. Für die hochpräzisen Berechnungen beispielsweise zum Trainieren von Sprachmodellen braucht es in der Regel Spezialprozessoren. In diesem Segment führend ist Nvidia mit seinen Server-GPUs A100 und H100.

Im Zuge der Handelsbeschränkungen zwischen den USA und China wurde der Verkauf von diesen Prozessoren an das Reich der Mitte seitens der Vereinigten Staaten jedoch bereits im September 2022 gestoppt.

In ihrer Verzweiflung greifen chinesische Unternehmen nun auf Chips zurück, die aus Spieleprodukten stammen. Besonders beliebt ist dabei die leistungsfähigste Gaming-Grafikkarte der Welt – die RTX 4090.

Tausende Spielegrafikkarten werden demontiert

Wie die Financial Times (hinter einer Paywall) in Berufung auf zwei Manager berichtet, werden jeden Monat tausende RTX-Grafikkarten in Fabriken und Werkstätten in ihre Kernkomponenten (Grafikeinheit und Speicher) zerlegt und auf neue Platinen installiert, die auf KI-Anwendungen spezialisiert sind.

Die Nachfrage nach Grafikprozessoren, die aus Spielekarten stammen, sei zuletzt drastisch gestiegen. Allein im Dezember wurden demnach über 4.000 RTX-Beschleuniger demontiert, mehr als viermal so viele wie noch im November. Das passt auch zu einer neuen Betrugsmasche:

Spielegrafikkarten halten den Anforderungen von KI-Anwendungen aber nur bedingt statt, wie Charlie Chai, Analyst bei der auf China spezialisierten Forschungsgruppe 86Research konstatiert (via Financial Times):

Dies ist ein verzweifelter Schachzug chinesischer Unternehmen im Rahmen der Exportkontrollen. Das ist so, als würde man ein Küchenmesser benutzen, um ein Kunstwerk zu erschaffen. Es ist machbar, aber der Effekt ist suboptimal.

Abnehmer für die umgebauten Grafikeinheiten sind Financial Times zufolge öffentliche Unternehmen und kleine KI-Labors, die vor Inkrafttreten der US-Exportkontrollen nicht genügend Nvidia-Server-GPUs auf Lager hatten.

Die RTX 4090 wurde möglicherweise auch deshalb mittlerweile für den Verkauf nach China gesperrt. Das wiederum hat Nvidia bewogen, eine leicht abgeschwächte Variante des Flaggschiffs für den chinesischen Markt zu entwerfen – die RTX 4090D.

Die RTX 4090D soll sich allerdings nicht so gut für KI-Anwendungen eignen wie die normale RTX 4090, heißt es in dem Bericht der Financial Times. Hier die Specs im Vergleich zur RTX 4090 ohne D :

Modell Shadereinheiten Tensorkerne Taktrate Speicher RTX 4090 16.384 512 2.235/2.520 MHz 24 GB GDDR6X (21 Gbps) RTX 4090D 14.592 456 2.280/2.520 MHz 24 GB GDDR6X (21 Gbps)

Unserer Ansicht nach sollten die Unterschiede auch mit Blick auf KI-Anwendungen aber nur minimal ausfallen. Schließlich weichen die beiden Modelle nur unwesentlich voneinander ab und die grundlegende Architektur ist ohnehin dieselbe. Wir sind daher gespannt zu sehen, ob demnächst auch die RTX 4090D ihren Weg in chinesische KI-Server findet.

Warum werden überhaupt RTX 4090 und nicht etwa A100 oder H100 verwendet?

Die hochspezialisierten A100- und H100-Beschleuniger werden nur von Nvidia selbst vertrieben. Exportkontrollen aufrechtzuerhalten, fällt daher leicht. Dementsprechend gelangen nur noch kleine Mengen der Server-GPUs in die Hände chinesischer Unternehmen (via Walllstreet Online).

Ganz anders sieht es bei Spielegrafikkarten aus. Sie gelangen abseits von Nvidia auch über diverse Custom-Hersteller und Händler auf den Markt.

Was ist der Unterschied zwischen RTX 4090, A100 und H100?

Der wohl größte Unterschied zwischen RTX 4090, A100 und H100 liegt in der Architektur und der Speicherbestücken. Wo die RTX 4090 nur 24 GByte GDDR6X vorzuweisen hat (was für Spiele mehr als ausreichend ist), sind es bei den anderen beiden Modellen jeweils 80 GByte - und das noch dazu vom schnelleren Typ HBM2e.

Modell Architektur Shadereinheiten Speicher Speicherbandbreite RTX 4090 Ada Lovelace 16.384 24 GB GDDR6X 1.008 GB/s H100 Tesla Hopper 14.592 80 GB HBM2e 2.039 GB/s A100 Tesla Ampere 6.912 80 GB HBM2e 2.039 GB/s

Die H100 kann zudem das neue PCIe 5.0 nutzen, während die RTX 4090 ebenso wie die A100 auf PCIe 4.0 beschränkt sind. Das ist deshalb besonders wichtig, weil A100 und H100 als Server-GPUs mit anderen Grafikkarten zu einem Cluster zusammengeschaltet werden können.

Außerdem basiert H100 auf einer anderen Architektur (Tesla Hopper) als die RTX 4090 (Ada Lovelace).

Was seht ihr das? Habt ihr überhaupt schon davon gehört, dass die RTX 4090 derart umfunktioniert wird? Oder ist euch das völlig neu? Schreibt es uns gerne in die Kommentare!