RTX 3080: Warum wohl noch mehr Leistung möglich gewesen wäre

War die Entscheidung von Nvidia, bei Samsung in 8nm fertigen zu lassen ein Fehler? Oder war es zugunsten moderater Preise die richtige Wahl?

von Alexander Köpf,
17.09.2020 16:39 Uhr

Hat sich Nvidia aufgrund eines günstigeren Preises für ein sogenannte Half-Node entschieden? Hat sich Nvidia aufgrund eines günstigeren Preises für ein sogenannte Half-Node entschieden?

Nvidias RTX 3080 ist viel schneller als die RTX 2080, so viel steht fest. Laut GameStar-Test zur RTX 3080 legt das neue Spieler-Flaggschiff in 4K-Auflösung durchschnittlich 66 Prozent gegenüber seinem nominellen Vorgänger zu. So weit so beeindruckend - doch es hätte vermutlich auch mehr sein können.

Im Folgenden klären wir, warum die RTX 3080 potenziell hätte flotter sein können und welche Rolle die enorm gestiegenen Zahl der CUDA-Kerne bei der Leistung einnimmt.

An dieser Stelle gleich ein ausdrücklicher Dank an die Kollegen von AdoredTV, die eine ausführliche Analyse zu dem Thema samt detaillierter Berechnungen geliefert und uns damit zu dem Thema inspiriert haben. Das komplette Video haben wir euch verlinkt, es ist jedoch in englischer Sprache:

Link zum YouTube-Inhalt

8 Nanometer versus 7 Nanometer

Knackpunkt Fertigung: Angesichts der hohen Performance der RTX 3080 ist die Frage nach der Fertigung etwas in den Hintergrund gerückt - sie erfolgt bei Samsung in einem 8-nm-Verfahren. Noch vor der Präsentation der Ampere-Grafikkarten wurde allerdings gemutmaßt, die High-End-Modelle würden bei TSMC in deren 7-nm-Verfahren gefertigt und alle anderen Modelle bei Samsung.

Mit Blick auf Samsung war zudem lange Zeit ebenfalls von einem 7-nm-Verfahren die Rede, konkret sogar von dem besonders effizienten 7-nm-EUV-Prozess.

Ein Nanometer ist nicht gleich ein Nanometer: Wer jetzt denkt, dass da doch nur ein Nanometer dazwischen liegt, der irrt. Und gleich vorweg: Klar ist, dass es sich bei den Angaben zur Strukturbreite lediglich um eine Festlegung handelt, eine sogenannte Node, die nur bedingt Rückschlüsse auf die tatsächlichen Strukturbreiten zulässt.

Viel aussagekräftiger ist da die Dichte der verbauten Transistoren, die sogenannte Logikdichte. Die unterscheidet sich trotz des nominell einen Nanometers nämlich enorm:

Chip

Fertigung

Zahl der Transistoren

Chipfläche

Logikdichte

GA100

7 nm (TMSC)

54 Milliarden

826 mm²

65,37 MT/mm²*

GA102

8 nm (Samsung)

28 Milliarden

682,4 mm²

44,56 MT/mm²*

GA104

8 nm (Samsung)

17,4 Milliarden

392,5 mm²

44,33 MT/mm²*

TU102

12 nm (TSMC)

18,6 Milliarden

754 mm²

24,67 MT/mm²*

*MT/mm² = Millionen Transistoren pro Quadratmillimeter

Der Grund für die enormen Unterschiede liegt in der etwas irreführenden Bezeichnung. Samsungs 8-nm-Verfahren ist lediglich eine Weiterentwicklung von deren 10-nm-Verfahren - eine sogenannte Half-Node. Bei TSMCs 7 Nanometer hingegen handelt es sich um eine Full-Node, wenn man so will »echte« 7 Nanometer.

Was bedeutet das für die Leistung?

Knackpunkt Taktraten: Nun kommen wir zum entscheidenden Punkt, der eigentlich auch schon durch Nvidias Präsentation bekannt war - die Taktraten. Offenbar können mit Samsungs-Chips die Taktraten gegenüber RTX 2000 (Turing) nicht gesteigert werden.

In der Regel geht mit der Verringerung der Strukturbreite aber auch eine Steigerung der Taktraten einher. Kurz gesagt deshalb, weil kleinere Strukturen schneller schalten.

In der Folge, so argumentiert auch AdoredTV, bleibt für eine Leistungssteigerung nur noch eine Steigerung der Zahl der Recheneinheiten. Das ist im Übrigen auch ein wichtiger Punkt mit Blick auf die Frage, warum die RTX 3080 gerade bei 4K-Auflösung am meisten zulegt gegenüber den RTX 2000.

Je höher die Auflösung, umso mehr kommt es auf die Zahl der Rechenkerne an. Natürlich spielen hier aber auch noch etwaige CPU-Limits eine Rolle.

Wie Nvidia überhaupt so viele Recheneinheiten realisieren konnte und was es genau damit auf sich hat, könnt ihr im folgenden Artikel nachlesen:

RTX 3090 mit 10.496 Kernen   64     4

Mehr zum Thema

RTX 3090 mit 10.496 Kernen

Warum wechselte Nvidia zu Samsung?

Aus der Vergangenheit gelernt? Das kann natürlich nicht ohne Weiteres beantwortet werden und ist in erster Linie Spekulation. Aber zumindest liegt der Schluss nahe, dass es schlicht um die Kosten geht.

Die RTX-2000-Generation stand in dem Ruf, sehr teuer zu sein, bei gleichzeitig überschaubaren Leistungszuwächsen gegenüber GTX 1000 - vor allem, wenn man die Leistung nach dem Preis normiert und Raytracing und DLSS außen vor lässt.

Insofern könnte es für Nvidia wichtig gewesen sein, sowohl in niedrige Preise als auch in normale Renderin (Rasterisation)-Leistung zu investieren. Genau so denkbar ist es aber, dass schlicht nicht genügend Kapazitäten bei TSMC bereitstanden, die auch AMDs Chips herstellen.

Was die Preise anbelangt ist einer der wichtigsten Faktoren die Ausbeute bei der Produktion. Um genau zu sein, wie viele Chips in welcher Qualitätsstufe aus einem Wafer herausgeholt werden können.

Hierzu hat AdoredTV interessante Berechnungen angestellt und kommt letztlich zu dem Ergebnis, dass die Kosten pro Chip bei Samsungs 8-nm-Verfahren deutlich geringer ausfallen als bei TSMCs 7-nm-Verfahren.

Die Differenz soll demnach rund 26 US-Dollar oder 35,5 Prozent betragen. Andersrum ausgedrückt soll ein TSMC-Chip in 7 Nanometer rund 55 Prozent teurer sein als ein 8-nm-Chip von Samsung (73,57 versus 47,46 US-Dollar).

Wäre mehr Performance möglich gewesen? Hätte Nvidia in 7 Nanometer fertigen lassen, egal ob bei TSMC oder Samsung, und gleichzeitig die Kernzahl ebenfalls so massiv angehoben, hätten wir wahrscheinlich höhere Taktraten und dadurch auch eine noch bessere Performance gesehen.

Nichtsdestotrotz ist Nvidia mit der RTX 3080 eine sehr schnelle Grafikkarte gelungen. Das sehen auch die Kollegen der nationalen und internationalen Fachpresse so:

Nvidia RTX 3080 im Pressespiegel   33     3

Mehr zum Thema

Nvidia RTX 3080 im Pressespiegel

Wie schätzt ihr die Lage ein? Hatte Nvidia die Wahl zwischen TSMC und Samsung? Und falls ja: Wurde die richtige Entscheidung getroffen? Schreibt es gerne in die Kommentare!

zu den Kommentaren (103)

Kommentare(103)

Nur angemeldete Benutzer können kommentieren und bewerten.