Die GTC 2025 (»GPU Technology Conference«) ist noch in vollem Gange. Vom 17. bis zum 20. März lädt GPU-Riese Nvidia nach San José, Kalifornien ein, wo ein Ausblick auf kommende Grafikchips gegeben wird.
Natürlich zeigt auch Nvidia selbst seine nächsten Generationen, die auf Blackwell folgen sollen. Den Anfang macht hierbei »Blackwell Ultra«, das als Weiterentwicklung des auf der vergangenen GTC gestarteten B200-Chips dient.
Link zum YouTube-Inhalt
Entsprechend handelt es sich auch bei der gezeigten B300-GPU um eine Dual-Die-GPU, die namensgetreu zwei Dies per Die-to-Die-Link miteinander verknüpft. Insgesamt kommt Blackwell Ultra so auf folgende Spezifikationen:
- 288 GByte HBM3e-Speicher (+ 50 Prozent ggü. Blackwell)
- 15 PetaFLOPS für FP4 Dense und 30 PetaFLOPS für FP4 Sparsity
- Anderthalbfache FP4-Inferencing-Leistung ggü. Blackwell
Sein Debüt feiert Blackwell Ultra im neuen Supercomputer GB300 NVL72, der ebenfalls analog zum Blackwell-Vorgänger aufgebaut ist. So werden 72 der Blackwell-Ultra-Einheiten mit 36 Grace-CPUs in einem Rack kombiniert.
Daraus folgen ungeheuer wirkende Spezifikationen: Mit 21 TByte HBM3e-Speicher, 40 TByte LPDDRX5-Arbeitsspeicher und 2.592 Prozessorkernen vom Typ ARM Neoverse V2 erreicht der Supercomputer eine FP4-Rechenleistung von 1,1 ExaFLOPS.
Über eine NVLink-Domäne können die Zahlen noch absurder werden, denn so lassen sich bis zu acht der GB300 NVL72-Rechner zu einem Monsterserver zusammenfassen.
2:23
Ich wünschte, bei der wichtigsten Grafikoption würde es jedes Spiel so genau nehmen wie AC Shadows
Auf Blackwell Ultra folgen Rubin und Feynman
Auch auf die Zeit nach Blackwell Ultra gab Nvidia im Rahmen der GTC-Keynote einen Ausblick. Für 2026 ist CEO Jensen Huang zufolge die »Rubin«-Generation geplant; ein Jahr später ist »Rubin Ultra« an der Reihe. Zum für 2028 geplanten »Feynman« gibt es indes noch wenige Details.
Die Namensgebung folgt Nvidias Tradition, Chips nach Wissenschaftlern zu benennen – »Rubin« bezieht sich auf die Physikerin Vera Rubin, die Dunkle Materie erforschte, während »Feynman« auf den Quantenphysiker Richard Feynman verweist.
- Auch bei Rubin wird es sich laut der Präsentation um eine Dual-Die-GPU handeln, die dafür aber mit 288 GByte HBM4-Speicher ausgestattet ist.
- Der »echte« Sprung soll im Anschluss mit Rubin Ultra folgen: Als Quad-Die-GPU setzt sich die überübernächste Nvidia-Generation aus vier Dies zusammen, die zusammen auf 2.048 GByte HBM4e-Speicher kommen.
Entsprechend geht es auch mit den Rechenleistungen aufwärts. Die vorhin so absurd klingenden 15 FP4-PetaFLOPS von Blackwell Ultra wirken bei den prognostizierten Zahlen lächerlich: Rubin soll mit 50 FP4-PetaFLOPS; Rubin Ultra mit 100 (!) FP4-PetaFLOPS aufwarten.
Einen ähnlich exorbitanten Sprung soll der Durchsatz erleben, der durch ein Upgrade von der fünften auf die sechste/siebte Generation von Nvlink mal eben von 1,8 auf 3,6 TByte/s verdoppelt wird.
Nur angemeldete Benutzer können kommentieren und bewerten.
Dein Kommentar wurde nicht gespeichert. Dies kann folgende Ursachen haben:
1. Der Kommentar ist länger als 4000 Zeichen.
2. Du hast versucht, einen Kommentar innerhalb der 10-Sekunden-Schreibsperre zu senden.
3. Dein Kommentar wurde als Spam identifiziert. Bitte beachte unsere Richtlinien zum Erstellen von Kommentaren.
4. Du verfügst nicht über die nötigen Schreibrechte bzw. wurdest gebannt.
Bei Fragen oder Problemen nutze bitte das Kontakt-Formular.
Nur angemeldete Benutzer können kommentieren und bewerten.
Nur angemeldete Plus-Mitglieder können Plus-Inhalte kommentieren und bewerten.