Nach Blackwell: Nvidia zeigt den Grundstein für die nächsten GPU-Architekturen

Nvidia treibt seine Profi-Lösungen auf neue Spitzen: Mit »Blackwell Ultra« und »Rubin« zeigt das Unternehmen seine neuen KI-Lösungen auf der GTC 2025.

Was folgt auf Nvidia Blackwell? Diese Frage hat CEO Jensen Huang auf der GTC 2025 ausführlich beantwortet. (Bildquelle: Nvidia via YouTube) Was folgt auf Nvidia Blackwell? Diese Frage hat CEO Jensen Huang auf der GTC 2025 ausführlich beantwortet. (Bildquelle: Nvidia via YouTube)

Die GTC 2025 (»GPU Technology Conference«) ist noch in vollem Gange. Vom 17. bis zum 20. März lädt GPU-Riese Nvidia nach San José, Kalifornien ein, wo ein Ausblick auf kommende Grafikchips gegeben wird.

Natürlich zeigt auch Nvidia selbst seine nächsten Generationen, die auf Blackwell folgen sollen. Den Anfang macht hierbei »Blackwell Ultra«, das als Weiterentwicklung des auf der vergangenen GTC gestarteten B200-Chips dient.

Empfohlener redaktioneller Inhalt

An dieser Stelle findest du einen externen Inhalt von YouTube, der den Artikel ergänzt.
Du kannst ihn dir mit einem Klick anzeigen lassen und wieder ausblenden.

Ich bin damit einverstanden, dass mir Inhalte von YouTube angezeigt werden.

Personenbezogene Daten können an Drittplattformen übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Link zum YouTube-Inhalt

Entsprechend handelt es sich auch bei der gezeigten B300-GPU um eine Dual-Die-GPU, die namensgetreu zwei Dies per Die-to-Die-Link miteinander verknüpft. Insgesamt kommt Blackwell Ultra so auf folgende Spezifikationen:

  • 288 GByte HBM3e-Speicher (+ 50 Prozent ggü. Blackwell)
  • 15 PetaFLOPS für FP4 Dense und 30 PetaFLOPS für FP4 Sparsity
  • Anderthalbfache FP4-Inferencing-Leistung ggü. Blackwell

Sein Debüt feiert Blackwell Ultra im neuen Supercomputer GB300 NVL72, der ebenfalls analog zum Blackwell-Vorgänger aufgebaut ist. So werden 72 der Blackwell-Ultra-Einheiten mit 36 Grace-CPUs in einem Rack kombiniert.

Daraus folgen ungeheuer wirkende Spezifikationen: Mit 21 TByte HBM3e-Speicher, 40 TByte LPDDRX5-Arbeitsspeicher und 2.592 Prozessorkernen vom Typ ARM Neoverse V2 erreicht der Supercomputer eine FP4-Rechenleistung von 1,1 ExaFLOPS.

Über eine NVLink-Domäne können die Zahlen noch absurder werden, denn so lassen sich bis zu acht der GB300 NVL72-Rechner zu einem Monsterserver zusammenfassen.

Video starten 2:23 Ich wünschte, bei der wichtigsten Grafikoption würde es jedes Spiel so genau nehmen wie AC Shadows

Auf Blackwell Ultra folgen Rubin und Feynman

Auch auf die Zeit nach Blackwell Ultra gab Nvidia im Rahmen der GTC-Keynote einen Ausblick. Für 2026 ist CEO Jensen Huang zufolge die »Rubin«-Generation geplant; ein Jahr später ist »Rubin Ultra« an der Reihe. Zum für 2028 geplanten »Feynman« gibt es indes noch wenige Details.

Die Namensgebung folgt Nvidias Tradition, Chips nach Wissenschaftlern zu benennen – »Rubin« bezieht sich auf die Physikerin Vera Rubin, die Dunkle Materie erforschte, während »Feynman« auf den Quantenphysiker Richard Feynman verweist.

  • Auch bei Rubin wird es sich laut der Präsentation um eine Dual-Die-GPU handeln, die dafür aber mit 288 GByte HBM4-Speicher ausgestattet ist.
  • Der »echte« Sprung soll im Anschluss mit Rubin Ultra folgen: Als Quad-Die-GPU setzt sich die überübernächste Nvidia-Generation aus vier Dies zusammen, die zusammen auf 2.048 GByte HBM4e-Speicher kommen.

Entsprechend geht es auch mit den Rechenleistungen aufwärts. Die vorhin so absurd klingenden 15 FP4-PetaFLOPS von Blackwell Ultra wirken bei den prognostizierten Zahlen lächerlich: Rubin soll mit 50 FP4-PetaFLOPS; Rubin Ultra mit 100 (!) FP4-PetaFLOPS aufwarten.

Einen ähnlich exorbitanten Sprung soll der Durchsatz erleben, der durch ein Upgrade von der fünften auf die sechste/siebte Generation von Nvlink mal eben von 1,8 auf 3,6 TByte/s verdoppelt wird.

zu den Kommentaren (0)

Kommentare(0)
Kommentar-Regeln von GameStar
Bitte lies unsere Kommentar-Regeln, bevor Du einen Kommentar verfasst.

Nur angemeldete Benutzer können kommentieren und bewerten.