Pascal im Detail
Beim Blick auf das Block-Diagramm der GP104-GPU der GTX 1080 wird klar, dass sich die Chip-Struktur von Pascal nicht grundlegend von Maxwell (GTX 900) unterscheidet, sondern eher eine optimierte Variante der Architektur darstellt. Die für die Grafikberechnung zuständigen Shader-Einheiten schließen sich weiterhin in »Streaming Multiprozessoren« (SM) zusammen.
Im Vergleich zur GTX 980 teilen sich bei der GTX 1080 jetzt 20 statt 16 dieser SMs auf weiterhin vier »Graphics Processing Cluster« (GPC) auf. Jeder SM umfasst wie bei Maxwell 128 Shader-Einheiten, wodurch die GTX 1080 insgesamt auf 2.560 Shader kommt (20x128). Einen grundlegend überarbeitete Mikro-Architektur erwarten wir erst mit der »Volta«-Architektur, die Nvidia für 2018 angekündigt hat.
Bei Pascal teilen sich je zwei Streaming Multiprozessoren eine »PolyMorph Engine«, die sich um Geometrie-Aufgaben wie Tesselation und die Viewport-Transformation, also die Ausrichtung und Anpassung an die Perspektive kümmert. Diese PolyMorph Engines wurden jetzt um »Simultaneous Multi-Projection Engines« (SMP) ergänzt.
Diese SMPs ermöglichen es Pascal-Karten wie der GTX 1080, bis zu 16 Viewports darzustellen. Dafür gibt es verschiedene Einsatzmöglichkeiten. So lässt sich etwa die Darstellung auf mehreren Monitoren verbessern. Teilen sich zum Beispiel drei Monitore einen Viewport, ist die Perspektive durch die Breite auf dem linken und rechten Bildschirm verzerrt.
Mit mehreren Viewports kann jedem Display sozusagen eine eigene, virtuelle »Kamera« zugeteilt werden, was die Perspektive korrigiert. Auch für Virtual Reality lässt sich SMP nutzen, um etwa die Verzerrung durch die Linsen in den Headsets zu korrigieren. Statt die verfälschte Darstellung aufwändig durch Berechnungen anzupassen, wird das Bild nicht nur über einen, sondern über vier Viewports angezeigt.
Auch die Performance in VR soll durch die Simultaneous Multi-Projection Engines steigen. So erlauben sie es der Grafikeinheit, zwei Stereo-Bilder in einem Berechnungsschritt darzustellen. Diese Funktion nennt Nvidia »Single Pass Stereo«.
DirectX 12 und Asynchronous Compute
Was der Pascal-Architektur weiterhin fehlt, sind die von AMD bekannten »Asynchronous Shader« (beziehungsweise ein Pendant zu AMDs »Asynchronous Compute Engines«). Allerdings beherrscht auch die GTX 1080 asynchronous compute, also die Fähigkeit verschiedene Aufgaben innerhalb der Render-Pipeline gleichzeitig und unabhängig voneinander durchzuführen. Dieses Feature ist erst durch Grafikschnittstellen wie DirectX 12 und Vulkan (OpenGL-Nachfolger) möglich geworden und wichtig, um die GPU voll auszulasten, etwa indem sich die Grafikkarte neben der Darstellung der Bilder auch um die Physik-Berechnung oder das Nachbearbeiten der Frames (Postprocessing) kümmert.
Ohne asynchronous compute müssen diese Vorgänge nacheinander abgearbeitet werden und dauern insgesamt entsprechend länger. Mit Maxwell hat Nvidia daher »static partitioning« eingeführt. Das bedeutet, dass die GPU asynchronous compute beherrscht und sowohl Grafik- als auch Compute-Aufgaben parallel bearbeiten kann. Dadurch lässt sich die Effizienz der GPU zwar bereits deutlich steigern, allerdings gibt es verschenktes Potenzial, wenn etwa die Compute-Aufgabe länger dauert als die Grafik-Berechnung. Dann bleiben die für die Grafik eingeteilten Shader-Einheiten solange ungenutzt, bis die Compute-Shader ihre Berechnungen beendet haben.
Für diesen Fall bringt Pascal »dynamic load balancing«. Das bedeutet, dass die »frei« gewordenen Grafik-Shader nach der Berechnung für die Compute-Aufgabe genutzt werden. Durch die bessere Auslastung der GPU verkürzt sich die benötigte Zeit, um die komplette Szene zu rendern und die Performance steigt. Entsprechend sollte die Geforce GTX 1080 in DX12-Spielen besser abschneiden als Maxwell-Modelle wie die GTX 980.
Nur angemeldete Benutzer können kommentieren und bewerten.
Dein Kommentar wurde nicht gespeichert. Dies kann folgende Ursachen haben:
1. Der Kommentar ist länger als 4000 Zeichen.
2. Du hast versucht, einen Kommentar innerhalb der 10-Sekunden-Schreibsperre zu senden.
3. Dein Kommentar wurde als Spam identifiziert. Bitte beachte unsere Richtlinien zum Erstellen von Kommentaren.
4. Du verfügst nicht über die nötigen Schreibrechte bzw. wurdest gebannt.
Bei Fragen oder Problemen nutze bitte das Kontakt-Formular.
Nur angemeldete Benutzer können kommentieren und bewerten.
Nur angemeldete Plus-Mitglieder können Plus-Inhalte kommentieren und bewerten.