Geforce RTX 2000 - Turing-Architektur im Vergleich zu Pascal, Raytracing und DLSS

Weiter mit GameStar Plus

Wenn dir gute Spiele wichtig sind.

Besondere Reportagen, Analysen und Hintergründe für Rollenspiel-Helden, Hobbygeneräle und Singleplayer-Fans – von Experten, die wissen, was gespielt wird. Deine Vorteile:

Alle Artikel, Videos & Podcasts von GameStar

Frei von Banner- und Video-Werbung

Einfach online kündbar

Jetzt weiter

Inhaltsverzeichnis

Einleitung
Drei Grafikkarten, drei Grafikchips
GDDR6 und RTX-OPS

Raytracing
Deep Learning Super Sampling (DLSS)

Die neue Founders Edition
Nvidia Scanner: Overclocking per Mausklick
Geforce Expierence fit für Turing

Fazit

Die neuen Nvidia-Grafikkarten wie die Geforce RTX 2080 basieren auf der Turing-Architektur, beschleunigen Raytracing und besitzen in der Founders Edition eine komplett überarbeitete Kühlung.

Nvidia löst mit der neuen Mikroarchitektur Turing in der RTX-2000-Serie die über zwei Jahre alte Pascal-Generation rund um die Geforce GTX-1000-Serie ab. Turing stellt dabei keine simple Überarbeitung wie in den Jahren zuvor dar, sondern bringt viele Neuerungen, die bislang kaum bis gar nicht in der Spiele-Industrie eingesetzt werden. So zum Beispiel Raytracing in Echtzeit für korrekte Darstellung von Licht, Schatten und Reflektionen sowie Deep Learning für effizientes Kantenglätten / Antialiasing. Davon profitieren Spiele aber nicht automatisch, Entwickler müssen diese Feature in ihre Spiele implementieren.

In diesem Artikel beschäftigen wir uns mit der Architektur und den Fähigkeiten von Turing im Vergleich zu Pascal, werfen einen weiteren, detaillierten Blick auf die Referenzkarten (Founders Edition) und gehen auf das Overclocking-Feature Nvidia Scanner ein.

Unsere Tests inklusive Benchmarks zu den am 20. September erhältlichen Grafikkarten Geforce RTX 2080 Ti und Geforce RTX 2080 sind nun veröffentlicht. Die angekündigte Geforce RTx 2070 soll laut Nvidia nach wie vor im Oktober erscheinen.

Nvidia Geforce RTX 2080 Ti und RTX 2080 im Test - Mehr als Raytracing?

Drei Grafikkarten, drei Grafikchips

Alle drei Turing-Chips (TU102, TU104 und TU106) besitzen sowohl RT-Kerne für Raytracing, als auch Tensor-Kerne für KI-Berechnungen.

Die drei angekündigten Turing-Grafikkarten Geforce RTX 2080 Ti, RTX 2080 und RTX 2070 besitzen alle unterschiedliche Grafikchips. Der leistungsfähigste Chip TU102 sitzt auf der RTX 2080 Ti, der TU104 auf der RTX 2080 und der TU106 beschleunigt die RTX 2070. Das sah bei Pascal noch anders aus, wo sich beispielsweise GTX 1080, GTX 1070 Ti und GTX 1070 den selben GP104-Chip in unterschiedlichen Ausführungen teilen.

Das Topmodell der Turing-Generation Geforce RTX 2080 Ti ist mit einem leicht beschnittenen TU102-Chip bestückt. Der Vollausbau dieses Chips setzt sich wie der GP102-Vorgänger auf der GTX 1080 Ti aus sechs Graphics Processor Clustern (GPC) zusammen. Die Anzahl der jeweiligen Streaming Multiprozessoren (SM) pro Cluster steigt jedoch von fünf auf 12 Einheiten stark an, sodass der TU102 in insgesamt 72 Streaming Multiprozessoren aufgeteilt ist. Das liegt vor allem an den RT- und Tensor-Kernen, die innerhalb eines SM viel Platz belegen.

TU102 folgt auf GP102: Der Vollausbau von Turing beherbergt 18,6 Milliarden Transistoren, 4.608 Shader, 288 TMUs und 96 ROPs.

Auf einer vergleichsweise riesigen Chip-Fläche von 754 Quadratmillimetern befinden sich auf dem TU102 18,6 Milliarden Transistoren, 4.608 Shadereinheiten (ALUs), 288 Textureinheiten (TMUs) und 96 ROPs. Dazu gesellen sich 576 Tensor-Kerne und 72 für Raytracing-Berechnungen zuständige RT-Kerne. Im Vergleich zum größten Pascal-Chip für Spieler (GP102 / GTX 1080 Ti) mit 12 Milliarden Transistoren und einer Die-Fläche von 471 Quadratmillimeter wächst die Anzahl der Transistoren somit um 55 Prozent an, die Fläche um 60 Prozent. Gefertigt wird Turing im Unterscheid zu Pascal nicht mehr in 16 sondern in 12 Nanometern.

Ebenfalls leicht beschnitten ist der TU104-Chip auf der Geforce RTX 2080, er beherbergt 13,6 Milliarden Transistoren (GTX 1080 7,2 Milliarden) und ist mit einer Chipgröße von 525 Quadratmillimetern über 67 Prozent größer als der GP104 des direkten Vorgängers.

Das Blockdiagramm zum Streaming Multiprozessor (SM) verdeutlicht, dass RT- und Tensor-Kerne viel Platz belegen und Nvidia deshalb deutlich mehr SMs pro Chip verbauen muss, um die hohe Shaderzahl von Pascal aufrechtzuerhalten.

Einzig die im Oktober erscheinende Geforce RTX 2070 besitzt einen voll aktivierten Chip namens TU106. Die Namensgebung des Chips erinnert an den GP106 auf der Mittelklasse-Grafikkarte GTX 1060. Laut Nvidia misst sich die RTX 2070 samt 10,8 Milliarden Transistoren und einer Die-Fläche von 445 Quadratmillimetern allerdings an der GTX 1070.

Nvidia Grafikkarten Historie - Die Gaming-Modelle von 1995 bis heute

Dass einige Modelle keine vollaktivierten Grafikchips haben, ist seit Jahren gelebte Praxis. Das dürfte vor allem die Ausbeute bei der Produktion erhöhen, da nicht alle Chips mit allen Einheiten fehlerfrei laufen. Nvidia könnte sich so aber auch die Möglichkeit wahren, weitere Turing-Modelle mit weniger stark beschnittenen Chips später zwischen dem bisherigen Aufgebot zu platzieren.

GDDR6 und RTX-OPS

Dank der höheren Taktraten von GDDR6 sowie Änderungen am Speichersystem und bessere Kompression, soll eine um 50% höhere effektive Speicherbandbreite gegeben sein. Das werden Tests erst noch bestätigen müssen.

Zu den neuen Grafikchips gesellt sich auch ein neuer Speichertyp: Nvidia verabschiedet sich von GDDR5(X) und setzt nun auf GDDR6, das mit effektiven 14 GHz arbeitet, dadurch einige Megahertz schneller taktet, und gegenüber GDDR5X um 20 Prozent stromsparender agieren soll. Angebunden wird der VRAM über ein im Vollausbau 384 Bit breites Speicherinterface.

Ferner weist Turing eine überarbeitete Cache-Struktur mit höherer Bandbreite und doppelt so großem L2-Cache auf und besitzt außerdem neue Shader-Techniken wie Mesh-Shading, Variable Rate Shading, Texture-Space Shading und Multi-View Rendering, die effizienter und intelligenter arbeiten.

Durch eine neue Rechnung will Nvidia die Leistungsfähigkeit der RTX-Karten verdeutlichen. Dabei werden RT- und Tensor-Kerne berücksichtigt. Die Rechnung geht für alte Karten entsprechend nicht auf.

Um die Leistungsfähigkeit der RTX-Modelle besser zu verdeutlichen, hat Nvidia neben der herkömmlichen Performance-Angabe in TFLOPS auch eine eigene Performance-Einheit aufgestellt, die sich RTX-OPS nennt und bei der Leistungsangabe einer Grafikkarten nicht nur die traditionellen Einheiten, sondern auch RT-Kerne mit 40 Prozent und Tensor-Kerne mit 20 Prozent berücksichtigt. Noch sind die RTX-OPS aber arg theoretisch, denn die Unterstützung der Spieleindustrie lässt noch auf sich warten und ein Vergleich zu Grafikkarten ohne diese Spezialkerne fällt ebenfalls schwer, solange es keine geeigneten Spiele oder Benchmarks gibt.

Einen etwas aufschlussreicheren Vergleich zeigt Nvidia indes bei der allgemeinen Shader-Performance zwischen Turing und Pascal. Durch die Änderungen am Streaming Multiprozessor soll die traditionelle Leistung der RTX-Karten im Vergleich zu den Pascal-Vorgängern in Anwendungen und Spielen um rund 50 Prozent höher ausfallen.

Mehr zu den technischen Eckdaten der Turing-Grafikkarten erfahrt ihr in unserem Übersichtsartikel zur RTX-2000-Serie und in kommenden Tests.

Durch die Veränderungen innerhalb des Streaming Multiprozessors soll jeder Turing-Shader gegenüber Pascal 50% mehr Leistung bieten.