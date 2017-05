Nvidia hat den Pascal-Nachfolger Volta offiziell vorgestellt: Die neue GPU beeindruckt mit ihren technischen Daten und bietet im Vollausbau 5376 Shader bei 15 TFLOPs (FP32). Dazu kommt zumindest im professionellen Bereich eine spezielle Recheneinheit für Deep Learning.

Nvidias Volta V100 ist ein speziell für Deep Learning und High Performance Computing entwickelter Chip - eine Gamer-Variante wird auf einige Bestandteile verzichten.

Nvidia nutzte die Gelegenheit der eigenen Fachmesse GTC um zahlreiche Details über die neue Volta-GPU-Architektur zu verkünden. Dazu gehörte auch das Flaggschiff der kommenden GPU-Generation, der GV100. Ein Grafikchip, der primär auf finanzstarke Kunden aus dem HPC-Bereich ausgerichtet ist. Denn sonderlich preiswert wird Nvidia einen beeindruckende 815 mm² großen Chip nicht anbieten können - die Chipfläche entspricht laut Nvidias CEO Huang der Anzeigefläche einer Apple Watch.

21,1 Milliarden Transistoren

Damit geht Nvidia laut eigener Aussage an die Grenzen der optischen Lithographie, noch mehr Transistoren lassen sich aktuell nicht ohne weiteres auf einem Hochleistungschip unterbringen. Satte 21 Milliarden Transistoren finden hier Platz, das Pascal-Flaggschiff GP100 besteht aus 15,3 Milliarden. Nvidia lässt den GV100 in 12nm bei TSMC fertigen, dabei handelt es sich allerdings nur um einen weiter optimierten 16nm-Prozess.

Im Vollausbau trägt der Chip 5.376 FP32-Shader in sich, um die Ausbeute bei der Produktion zu steigern werden davon aber nur 5.120 im GV100 genutzt. Nvidia spricht dabei von 15 TFLOPs FP32-Leistung und 7,5 TFLOPs FP64-Leistung. Der Takt wird bei diesen Werten bei 1.455 MHz liegen. Beeindruckend: Die theoretische Rechenleistung steigt gegenüber Pascal (Tesla P100) um 41 Prozent.

HBM 2 für die professionelle Karte

Überraschend war die Vorstellung der GV100 mit 16 GByte HBM2-Speicher. Einerseits, da eine Ankündigung einer Karte mit GDDR6 erwartet wurde (dabei dürfte es sich dann um das Gamer-Flaggschiff mit Volta-GPU handeln, das noch nicht vorgestellt wurde), andererseits da Nvidia lediglich 16 GByte auf vier HBM2-Stacks verspricht während AMD bereits eine Vega-GPU mit 32 GByte in Aussicht gestellt hat. Der voraussichtlich mit 900 MHz getaktete und mit 4.096 Bit angebundene Speicher soll eine Bandbreite von 900 GB/s erreichen. Gefertigt wird der Speicher bei Samsung, mit denen Nvidia eng zusammenarbeitet.

Auch wenn GV100 ein für High Performance Computing (HPC) ausgelegter Chip ist wird er auch Grafik berechnen können. Den GTX-Karten dürfte Nvidia aber zumindest die sogenannten Tensor-Recheneinheiten (Tensor-Cores) streichen. Diese (im GV100 sind es 640) Einheiten eignen sich besonders gut für Deep Learning und erreichen bei den richtigen Rechenaufgaben eine Leistung von beeindruckenden 120 TFLOPs. Das allerdings ist für Gamer eher uninteressant, dennoch sind die Tensor-Einheiten nicht unwesentlich für die Größe und den voraussichtlichen Preis von GV100 verantwortlich.

GTX für Gamer kommt später

Während Nvidia die ersten professionellen Volta-Karten zu hohen Preisen an professionelle Anbieter verkauft - auf der GTC ließ sich ein »Supercomputer in a box« mit vier Volta-Karten für 69.000 US-Dollar vorbestellen - wird die GPU-Architektur später auch in Gamer-Karten genutzt werden. Auf die Tensor-Einheiten sowie die Fähigkeit zur FP64-Berechnung wird die GTX-Volta wohl verzichten müssen, dennoch dürfte angesichts der optimierten Ausführungseinheiten und der puren Shadermenge ein spürbarer Leistungsschub auch in Spielen zu erwarten sein. Während Nvidia die Tesla V100 noch im Laufe des dritten Quartals 2017 verkaufen möchte, werden Gamer wohl bis Anfang 2018 auf Volta-GTX-Karten warten müssen. Diese dürften dann auf preiswerteren GDDR6-Speicher anstelle des knappen HBM2-Speichers aufwarten.

