Jetzt mit Plus alles auf einer Seite lesen

Jahres-Abo
4,99€

pro Monat

12 Monate

Günstigster Preis
Zugang zu allen exklusiven Artikeln, Videos & Podcast-Folgen
Werbefreiheit auf GameStar.de & GamePro.de
Auf geht's
Quartals-Abo
5,99€

pro Monat

3 Monate

14% gegenüber Flexi-Abo sparen
Zugang zu allen exklusiven Artikeln, Videos & Podcast-Folgen
Werbefreiheit auf GameStar.de & GamePro.de
Auf geht's
Flexi-Abo
6,99€

pro Monat

1 Monat

Monatlich kündbar
Zugang zu allen exklusiven Artikeln, Videos & Podcast-Folgen
Werbefreiheit auf GameStar.de & GamePro.de
Auf geht's

Seite 2: Geforce GTX 1080 - Spiele-Benchmarks, Lautstärke und Stromverbrauch

Pascal im Detail

GP-104-Blockdiagramm Insgesamt verfügt die GTX 1080 über 2.560 Shader-, 160 Textur- und 64 ROP-Einheiten. Die GP104-Grafikeinheit ist nur 314 mm² groß und umfasst 7,2 Milliarden Transitoren.

Simultaneous Multi Projection Im Gegensatz zu Maxwell verfügt die Pascal-Architektur über »Simultaneous Multi-Projection Engines«. Die ermöglichen die Darstellung des berechneten Bilds auf mehreren Viewports (beziehungsweise die Betrachtung in verschiedenen Perspektiven).

Beim Blick auf das Block-Diagramm der GP104-GPU der GTX 1080 wird klar, dass sich die Chip-Struktur von Pascal nicht grundlegend von Maxwell (GTX 900) unterscheidet, sondern eher eine optimierte Variante der Architektur darstellt. Die für die Grafikberechnung zuständigen Shader-Einheiten schließen sich weiterhin in »Streaming Multiprozessoren« (SM) zusammen.

Im Vergleich zur GTX 980 teilen sich bei der GTX 1080 jetzt 20 statt 16 dieser SMs auf weiterhin vier »Graphics Processing Cluster« (GPC) auf. Jeder SM umfasst wie bei Maxwell 128 Shader-Einheiten, wodurch die GTX 1080 insgesamt auf 2.560 Shader kommt (20x128). Einen grundlegend überarbeitete Mikro-Architektur erwarten wir erst mit der »Volta«-Architektur, die Nvidia für 2018 angekündigt hat.

Bei Pascal teilen sich je zwei Streaming Multiprozessoren eine »PolyMorph Engine«, die sich um Geometrie-Aufgaben wie Tesselation und die Viewport-Transformation, also die Ausrichtung und Anpassung an die Perspektive kümmert. Diese PolyMorph Engines wurden jetzt um »Simultaneous Multi-Projection Engines« (SMP) ergänzt.

Diese SMPs ermöglichen es Pascal-Karten wie der GTX 1080, bis zu 16 Viewports darzustellen. Dafür gibt es verschiedene Einsatzmöglichkeiten. So lässt sich etwa die Darstellung auf mehreren Monitoren verbessern. Teilen sich zum Beispiel drei Monitore einen Viewport, ist die Perspektive durch die Breite auf dem linken und rechten Bildschirm verzerrt.

Mit mehreren Viewports kann jedem Display sozusagen eine eigene, virtuelle »Kamera« zugeteilt werden, was die Perspektive korrigiert. Auch für Virtual Reality lässt sich SMP nutzen, um etwa die Verzerrung durch die Linsen in den Headsets zu korrigieren. Statt die verfälschte Darstellung aufwändig durch Berechnungen anzupassen, wird das Bild nicht nur über einen, sondern über vier Viewports angezeigt.

Auch die Performance in VR soll durch die Simultaneous Multi-Projection Engines steigen. So erlauben sie es der Grafikeinheit, zwei Stereo-Bilder in einem Berechnungsschritt darzustellen. Diese Funktion nennt Nvidia »Single Pass Stereo«.

DirectX 12 und Asynchronous Compute

Mit Pascal hat Nvidia laut eigenen Aussagen die Fähigkeit der GPU zur parallelen und asynchronen Berechnung optimiert und damit die Performance unter DX12 verbessert. Mit Pascal hat Nvidia laut eigenen Aussagen die Fähigkeit der GPU zur parallelen und asynchronen Berechnung optimiert und damit die Performance unter DX12 verbessert.

Was der Pascal-Architektur weiterhin fehlt, sind die von AMD bekannten »Asynchronous Shader« (beziehungsweise ein Pendant zu AMDs »Asynchronous Compute Engines«). Allerdings beherrscht auch die GTX 1080 asynchronous compute, also die Fähigkeit verschiedene Aufgaben innerhalb der Render-Pipeline gleichzeitig und unabhängig voneinander durchzuführen. Dieses Feature ist erst durch Grafikschnittstellen wie DirectX 12 und Vulkan (OpenGL-Nachfolger) möglich geworden und wichtig, um die GPU voll auszulasten, etwa indem sich die Grafikkarte neben der Darstellung der Bilder auch um die Physik-Berechnung oder das Nachbearbeiten der Frames (Postprocessing) kümmert.

Ohne asynchronous compute müssen diese Vorgänge nacheinander abgearbeitet werden und dauern insgesamt entsprechend länger. Mit Maxwell hat Nvidia daher »static partitioning« eingeführt. Das bedeutet, dass die GPU asynchronous compute beherrscht und sowohl Grafik- als auch Compute-Aufgaben parallel bearbeiten kann. Dadurch lässt sich die Effizienz der GPU zwar bereits deutlich steigern, allerdings gibt es verschenktes Potenzial, wenn etwa die Compute-Aufgabe länger dauert als die Grafik-Berechnung. Dann bleiben die für die Grafik eingeteilten Shader-Einheiten solange ungenutzt, bis die Compute-Shader ihre Berechnungen beendet haben.

Für diesen Fall bringt Pascal »dynamic load balancing«. Das bedeutet, dass die »frei« gewordenen Grafik-Shader nach der Berechnung für die Compute-Aufgabe genutzt werden. Durch die bessere Auslastung der GPU verkürzt sich die benötigte Zeit, um die komplette Szene zu rendern und die Performance steigt. Entsprechend sollte die Geforce GTX 1080 in DX12-Spielen besser abschneiden als Maxwell-Modelle wie die GTX 980.

2 von 7

nächste Seite



Kommentare(163)

Nur angemeldete Benutzer können kommentieren und bewerten.

Cookies optimieren die Bereitstellung unserer Dienste. Mit der Nutzung unserer Dienste erklärst du dich damit einverstanden, dass wir Cookies verwenden. Weitere Informationen oder schließen