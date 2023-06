80 Mrd. Transistoren befinden sich auf Nvidias H100-Chip, doch in Gaming-Benchmarks schlägt sich das nicht nieder. (Quelle: Nvidia)

Und wir dachten, die RTX 4090 wäre teuer: Zur GTC 2022 präsentierte Nvidia mit dem H100 die erste GPU auf Basis der neuen Hopper-Architektur, welche in der damaligen Pressemitteilung als neuer Motor der weltweiten KI-Infrastruktur angepriesen wurde.

Kostenpunkt: Stolze 40.000 US-Dollar.

Grundsätzlich werden solche Grafikkarten in Datenzentren mit exorbitant hohen Workloads eingesetzt und die sich den ebenso exorbitant hohen Preis auch leisten können.

Dem Youtuber Geekerwan gelang es aber, gleich vier der H100-Grafikkarten zur Verfügung gestellt zu bekommen und testete diese unter anderem im beliebten Benchmark-Tool 3DMark. Als Standardtest gilt hier der TimeSpy-Score, mit dem sich ein zuverlässiger Vergleichswert ermitteln lässt.

80 Milliarden Transistoren, aber kein Raytracing

Fangen wir zunächst mit den schwindelerregenden technischen Daten der H100-GPU an: Mit einer Fertigung von vier Nanometern und ganzen 80 Milliarden Transistoren stellte Nvidia die Grafikkarte als leistungsfähigsten Beschleuniger der Welt vor.

Dank 80 Gigabyte HBM3-Speicher ist eine Speicherbandbreite von bis zu drei Terabyte pro Sekunde möglich.

Mit HBM3 ist eine neue Speicherspezifikation gemeint, wodurch 12 statt 8 SDRAM-Chips gestapelt werden können. Ein einzelner dieser Stacks schafft bis zu 819 Gigabyte pro Sekunde; im H100 sitzen insgesamt sechs dieser Stapel.

Einer davon ist allerdings deaktiviert, was folglich eine theoretische Übertragungsrate von maximal 4,1 Terabyte pro Sekunde ergibt. Vermutlich aufgrund von nicht näher aufgeschlüsselten Taktfrequenzen kann der Nvidia H100 dieses Maximum allerdings nicht erreichen.

Je nachdem, ob der SXM-Formfaktor oder das aus den klassischen Heim-PCs bekannte PCI-Express vorliegt, schafft der H100 zwischen 756 und 989 teraFLOPS Tensor-FP32-Rechenleistung; in Tensor-FP16 sind es hingegen zwischen 1.513 und 1.979 teraFLOPS.

Zum Vergleich: Die Geforce RTX 4090, das aktuelle Nvidia-Flaggschiff für den Heimgebrauch, schafft in den Disziplinen »nur« 330,4 respektive 165,2 TFLOPS.

But can it run Crysis ? Wohl eher nicht

Kehren wir zurück zum Benchmark des Youtubers Geekerwan. Dieser musste sich zunächst um eine adäquate Kühllösung kümmern, denn die H100 hat als klassische Datenzentren-GPU keine eigene Lösung verbaut.

Weitere Tricks sind etwa beim Display-Output notwendig, damit das PC-System die Grafikkarten überhaupt erkennt. Mit dem TimeSpy-Test des Benchmark-Tools 3DMark wurden anschließend die Gaming-Kapazitäten der H100-Grafikkarte getestet.

Das auf ersten Blick ernüchternde Ergebnis: Mit 2.681 Punkten reiht sich die H100 unterhalb integrierter Grafikchips wie der Radeon 680M (2.710 Punkte), vom Vergleich mit aktuellen Spitzen-GPUs ganz zu schweigen.

Der technische Hintergrund hierzu liefert allerdings schnell eine simple Begründung: Mit deutlich weniger Rasterizing-Units als die RTX 4090 (24 statt 160) sowie nur vier zum Rendern fähige Texture-Processing-Cluster ist die H100 schlicht nicht auf Gaming-Arbeiten ausgelegt.

Wer die 40.000 US-Dollar für eine Grafikkarte übrig hat, sollte also von der H100 eher Abstand nehmen, wenn man nicht gerade hochaufwändige KI-Berechnungen durchführen will. Für's Gaming empfehlen wir stattdessen in unsere GPU-Kaufberatung:

20 Mal teurer als die RTX 4090 und trotzdem so wenig Gaming-Leistung - wer von euch hätt's gedacht? Welche Grafikkarte steckt bei euch in den Rechnern und wie hoch fällt ihr TimeSpy-Score aus? Um wie viel Prozent könnt ihr die 40.000 Euro-Grafikkarte von Nvidia hier schlagen? Lasst es uns gerne in den Kommentaren wissen!