Maxwell im Detail
Neben einer Performance-Steigerung war laut Aussage von Nvidia auch eine deutlich verbesserte Energieeffizienz eines der Hauptziele bei der Entwicklung von Maxwell. Möglich soll das die umstrukturierte Mikro-Architektur des Grafikkerns machen. Die für die Grafikberechnung zuständigen Shader-Einheiten schließen sich in sogenannten »Streaming Multiprozessoren« (SM) zusammen. Bei Kepler-Karten liegt das Limit für Streaming Multiprozessoren bei 14 (Geforce GTX 780 Ti), die jeweils über 192 Shader-Einheiten verfügen (14 x 192 = 2.688). Der neue Maxwell-GM204-Grafikkern in der Geforce GTX 980 besitzt vier »GPCs« (Graphics Processing Cluster), auf die sich 16 Streaming Multiprozessoren verteilen. Damit verfügt die Geforce GTX 980 zwar über mehr SMs als die GTX 780 Ti, allerdings beherbergt bei Maxwell jeder Multiprozessor statt 192 nur noch 128 Shader-Einheiten, wodurch die GTX 980 insgesamt nur 2.048 Shader-Einheiten besitzt (16 x 128 =2.048). Da die Geforce GTX 970 nur über 13 SMs verfügt, besitzt sie dementsprechend 1.664 Cuda-Cores.
Die einzelnen Streaming Multiprozessoren sind wiederum in vier Cluster unterteilt, mit jeweils 32 Shader-Einheiten und einer eigenen Kontrolllogik. Durch die zusätzliche Aufteilung in Cluster verfügt bei Maxwell jeder Streaming Multiprozessor über vier Kontrolllogiken, statt wie bei Kepler nur über eine. Dadurch können anfallende Rechenaufgaben besser auf die einzelnen Shader-Einheiten verteilt und effizienter bearbeitet werden. Laut Nvidia leistet jeder Cuda-Kern im Vergleich zu Kepler rund 50 Prozent mehr, was gleichzeitig den Stromverbrauch insgesamt senkt. Eine weiterer Ansatz um Strom zu sparen liegt bei Maxwell im stark vergrößerten L2-Cache. Der steigt auf 2,0 MByte bei der Geforce GTX 980 und liegt damit höher als bei der Geforce GTX 780 Ti (1,5 MByte). Im erheblich größeren Cache-Speicher können mehr Informationen abgelegt werden, stehen somit auch schneller zur Verfügung und die GPU muss seltener auf den langsameren Videospeicher zurückgreifen.
Daneben hat Nvidia das Backend des GM204-Grafikkerns gegenüber des GK104-Chips von 32 auf 64 »Raster Operation Prozessoren« (ROPS) erhöht. Dadurch verbessert sich besonders die Performance in hohen Auflösungen und mit mehrfacher Kantenglättung. An der Menge an Textur-Einheiten hat sich mit 128 nichts geändert, allerdings konnte Nvidia die Textur-Füllrate durch die höheren Taktfrequenzen der Geforce GTX 980 dennoch um 12 Prozent steigern. Gleiches gilt für die Pixelfüllrate, die durch den höheren Takt und die verdoppelten ROPs von 32,2 Gpixels/s bei der Geforce GTX 680 auf 72 Gpixels/s bei der Geforce GTX 980 steigt.
Um die Speicherbandbreite und die Effizienz gegenüber der Geforce GTX 780 zu erhöhen, besitzt die Geforce GTX 980 jetzt mit 4,0 GByte mehr Videospeicher, der zudem mit effektiv 7,0 GHz um 1,0 GHz schneller arbeitet als bei der Geforce GTX 780. Außerdem hat Nvidia die Algorithmen zur Farb-Kompression verbessert.
Die sogenannte »Delta Color Compression«-Technologie reduziert (durch verlustfreie Kompression) die Datenmenge, die für das Zeichnen eines jeden Frames benötigt wird, um 25 Prozent. Dadurch soll die Speicherbandbreite trotz des im Vergleich zu Kepler schmaleren Speicher-Interfaces (256 statt 384 Bit) effektiv identisch ausfallen.
Nur angemeldete Benutzer können kommentieren und bewerten.
Dein Kommentar wurde nicht gespeichert. Dies kann folgende Ursachen haben:
1. Der Kommentar ist länger als 4000 Zeichen.
2. Du hast versucht, einen Kommentar innerhalb der 10-Sekunden-Schreibsperre zu senden.
3. Dein Kommentar wurde als Spam identifiziert. Bitte beachte unsere Richtlinien zum Erstellen von Kommentaren.
4. Du verfügst nicht über die nötigen Schreibrechte bzw. wurdest gebannt.
Bei Fragen oder Problemen nutze bitte das Kontakt-Formular.
Nur angemeldete Benutzer können kommentieren und bewerten.
Nur angemeldete Plus-Mitglieder können Plus-Inhalte kommentieren und bewerten.