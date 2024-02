Geht es um Chips für KI-Berechnungen, schnellen die Preise schnell in die Höhe. (Bild: Nvidia / Pixabay)

Nvidia verdient bekanntermaßen sehr viel Geld mit KI-Beschleunigern, auch (oder gerade) in China. Handelsbeschränkungen der USA haben aber zur Folge, dass die schnellsten Modelle nicht dort verkauft werden dürfen. Dieser Umstand sorgt nun einmal mehr für neue beschnittene GPUs von Nvidia.

Angepasste KI-Chips: Wie Reuters berichtet, geht es insgesamt um drei Modelle. Zum einen H20 mit Hopper-Architektur, zum anderen L20 und L2 mit Ada-Lovelace-Architektur.

Das H20-Modell kommt laut der von Wccftech veröffentlichten Übersicht (siehe folgende Abbildung) unter anderem auf 96 GByte HMB3-Speicher mit 4,0 TByte/s Bandbreite und eine Rechenleistung von 296 FP8-Teraflops.

An sich beeindruckende technische Eckdaten. Flankiert werden sie von einem Preis von bis zu 15.000 Dollar, der zunächst ebenfalls extrem wirkt. Doch in einer entscheidenden Disziplin hinkt H20 den bereits erhältlichen (und viel teureren) Top-Modellen von Nvidia technisch weit hinterher.

Die Daten der neuen Nvidia-GPUs für den chinesischen Markt laut Wccftech.com.

Der bewusste Rückschritt in Zahlen

Nvidia hat erst Ende 2023 mit H200 die laut eigenen Angaben schnellste GPU der Welt auf den Markt gebracht.

Bereits der Vorgänger H100 war für die Handelsbeschränkungen und den Verkauf nach China zu viel. Also kam dort ein beschnittenes H800-Modell auf den Markt. Doch auch der Handel mit dieser GPU wurde inzwischen verboten.

Wie viel langsamer die immer noch extrem schnelle H20-GPU im Vergleich ist, zeigt die folgende Tabelle. Entscheidend ist dabei die für KI-Berechnungen wichtige Kerndisziplin der FP8-Rechenleistung:

H20 H800 H100 H200 FP8 Tensor Core 296 TFLOPS 3.958 TFLOPS 3.958 TFLOPS 3.958 TFLOPS FP32 44 TFLOPS 67 TFLOPS 67 TFLOPS 67 TFLOPS Speicher 96 GByte HBM3 80 GByte HBM2e 80 GByte HBM3 141 GByte HBM3e Speicherbandbreite 4,0 TByte/s 2,0 TByte/s 3,35 TByte/s 4,8 TByte/s TDP bis zu 400 Watt bis zu 350 Watt bis zu 700 Watt bis zu 700 Watt Interconnect 900 GByte/s 400 GByte/s 900 GByte/s 900 GByte/s

Ein hoher Preis, der im Vergleich fast gering wirkt

Mit offiziellen Preisangaben zu den KI-Chips hält Nvidia selbst sich zurück, Schätzungen gibt es aber. So soll der H100-Chip laut CNBC im Bereich von 25.000 bis 40.000 Dollar liegen. Der H200-Chip ist logischerweise ein gutes Stück darüber anzusiedeln.

Die H800-Modelle wurden in China trotz ihrer Beschneidung gegenüber H100 (und damit auch H200) bei der Speicherbandbreite und dem Interconnect zeitweise sogar für 69.000 Dollar verkauft, wie PC Games Hardware berichtet hat.

Zur Erinnerung: H20 soll bei 12.000 bis 15.000 Dollar liegen. Zu dem technischen Rückschritt gesellt sich für Nvidia also auch ein Rückschritt bei den Verdienstmöglichkeiten hinzu.

Wie Reuters angibt, muss Nvidia dabei auch die Konkurrenz vor Ort durch KI-Chips von Huawei berücksichtigen. Genauer gesagt geht es um das preislich ähnlich aufgestellte Modell Ascend 910B. Aber man muss sich wohl so oder so keine Sorge darum machen, dass Nvidia zu wenig verdient.

Hintergrund: Auch wenn die Basis der Gaming- und KI-Karten von Nvidia sich ähnelt, werden doch sehr unterschiedliche Ansprüche an sie gestellt. So kommt es bei den KI-Chips besonders auf einen großen und schnellen Speicher an sowie auf die Möglichkeit, Daten zwischen einzelnen Chips flott übertragen zu können. Gaming-GPUs setzen dagegen primär auf viele Shader-Einheiten und hohe Taktraten.

Was haltet ihr von diesen Neuigkeiten aus dem Hause Nvidia? Und wie steht ihr zu der Tatsache, dass Handelsbeschränkungen der USA verhindern, dass die schnellsten Modelle nicht in China verkauft werden können? Oder ganz prosaisch gefragt: Steckt bei euch eine Grafikkarte von AMD oder Nvidia im Rechner - und welche Karte ganz konkret? Schreibt uns dazu wie immer gerne in die Kommentare, wenn ihr mögt.