Portal: Prelude RTX bringt eine klassische Source-Mod an die Spitze der Grafiktechnologie

portal prelude rtx screenshot rtx on 001

Entdecke jetzt die heißesten PS5 Angebote

Portal: Prelude RTX ist ein beeindruckendes Beispiel für die RTX Remix-Technologie von Nvidia, die eine ehemalige Source-Mod für Portal mit visuellen Funktionen und Technologien ausstattet, die mit High-End-AAA-Veröffentlichungen konkurrieren und diese sogar übertreffen. Es ist wirklich spektakulär – und hoffentlich eines von vielen pfadgetreuen Remastern, die in Zukunft kommen werden, wenn die RTX Remix Modding-Tools kurz vor der Veröffentlichung stehen.

Interessanter ist jedoch, dass Prelude auch das erste Spiel ist, das RTX IO unterstützt, ein GPU-beschleunigtes Dekomprimierungsverfahren, das unter Vulkan läuft. Dabei handelt es sich im Wesentlichen um eine von Nvidia entwickelte Version von Direct Storage 1.2, die auch in Ratchet and Clank enthalten ist: Rift Apart enthalten ist, das Ende des Monats für den PC auf den Markt kommt. Es dient dazu, das Laden von Spielen und das Streaming von Inhalten auf der PC-Plattform zu beschleunigen, und die Aufnahme in dieses Programm gibt uns eine gute Gelegenheit zu sehen, wie die Technologie funktioniert.

In der Vergangenheit wurden beim Laden von Spielen Daten wie Texturen oder Modelle von der Festplatte in den Systemspeicher und dann unter der Kontrolle der CPU auf den Grafikprozessor übertragen. Das war ein ziemlich latenzintensiver, serieller Ansatz, da die Festplatte die Spindel physisch hochdrehen, die Daten finden und dann Block für Block laden musste, um den Suchaufwand zu minimieren.


Hier ist die vollständige Videopräsentation von Alex Battaglia über RTX IO in Portal: Prelude RTX.

Diese Technik hat bei relativ kleinen Spielinhalten, die von Festplatten geladen wurden, gut funktioniert, aber bei Spielen, die mittlerweile Hunderte von Gigabyte groß sind und extrem detaillierte Inhalte haben, müssen all diese Daten komprimiert werden, um den verfügbaren Speicherplatz und die Bandbreite optimal zu nutzen. Das bedeutet, dass die Daten von der CPU dekomprimiert werden müssen, bevor sie auf dem Grafikprozessor verwendet werden können, und der damit verbundene zusätzliche Zeitaufwand und die CPU-Belastung führen dazu, dass der herkömmliche Ansatz nicht mehr funktioniert.

Glücklicherweise bedeutet das Aufkommen von schnellem Flash-Speicher mit niedriger Latenz in SSDs, dass wir die Daten nicht mehr sequentiell lesen müssen, um die Suchzeiten zu minimieren – wir können einen neuen Standard schaffen. Erstens wollen wir parallel auf Daten zugreifen, um die Ladezeiten im Vergleich zum alten Windows-I/O-Standard massiv zu reduzieren. Zweitens wollen wir sicherstellen, dass die Daten vom Speicher zum Grafikprozessor übertragen werden vor es dekomprimiert wird. GPUs haben viele Kerne und erledigen massiv parallele Aufgaben wie die Dekomprimierung besser als CPUs, sodass dieser Ansatz viel Zeit spart. Das ist das neue System, das für RTX IO und Direct Storage 1.2 vorgesehen ist. Es sorgt für schnellere Ladezeiten und, wenn es im Spiel zu Streaming-Zwecken eingesetzt wird, für eine geringere CPU-Belastung, was die Leistung potenziell verbessern kann.

Bei RTX IO, wie hier in Portal Prelude RTX, werden die Daten auf der Festplatte mit dem GDeflate-Format komprimiert und vorübergehend in den Systemspeicher verschoben, dann in den VRAM und dort von der GPU dekomprimiert. Das GDeflate-Format ist ein offener GPU-Komprimierungsstandard von Nvidia, der an Microsoft und die Kronos Group übergeben wurde. Ich erwarte, dass dieses Format in Direct Storage 1.2-Spielen, die DirectX auf dem PC verwenden, verwendet wird – wobei GPUs von Nvidia, AMD und Intel unterstützt werden.

Portal Prelude RTX bringt eine klassische Source Mod an die Spitze

Diese Erklärung funktioniert besser im Video, aber die Hauptidee bei RTX IO ist, dass wir die CPU-Belastung reduzieren, indem wir die Daten direkt auf der GPU dekomprimieren und die Ladezeiten beschleunigen, indem wir die Daten parallel von der SSD lesen.

Im Gegensatz dazu verwendet Portal: Prelude RTX die Vulkan-Grafik-API, für die es keine vereinbarten herstellerunabhängigen Standardaufrufe für die GPU-Dekomprimierung gibt; soweit ich weiß, gibt es derzeit nur die vorgeschlagenen Erweiterungen von Nvidia. Diese Erweiterungen von Nvidia für die GPU-Dekomprimierung könnten die sein, die von der Kronos-Gruppe für das Direct Storage Equivalent von Vulkan übernommen werden. In der Zwischenzeit wird die schnelle GPU-Dekomprimierung in Portal Prelude: RTX nur auf Treibern funktionieren, die diese speziellen Erweiterungen unterstützen, also auf Nvidia RTX-Grafikkarten.

Portal Prelude RTX arbeitet jedoch immer noch mit einem herkömmlichen Ladeparadigma, was bedeutet, dass RTX IO die Bildwiederholrate nicht erhöht. Schließlich ersetzt RTX Remix nicht die Spiel-Engine und ändert auch nicht, wie die Levels aufgeteilt und geladen werden; stattdessen ändert RTX Remix nur die Art und Weise, wie gerendert wird und wie die Assets für das Rendering geladen werden. Das ist etwas anderes als bei Ratchet and Clank: Rift Apart, das ebenfalls die GPU-Dekomprimierung nutzen sollte, um das Gameplay zu beschleunigen. Portal Prelude RTX profitiert also vor allem in Bezug auf die Ladezeiten der Assets und der sichtbaren Texturen.

Um zu testen, wie stark sich die Technologie hier auswirkt, habe ich eine Version des Spiels getestet, die mit deaktivierter RTX IO und einer auf 500 MB/s begrenzten SATA-SSD läuft. Das Spiel lädt relativ schnell, aber die Texturen brauchen einige Zeit, um ihre höchste Qualität zu erreichen – ohne RTXIOs GDeflate-Kompression ist das Spiel auf der Festplatte völlig unkomprimiert und ~60 Prozent größer. Dementsprechend wird die Bandbreite beansprucht, um die Texturen in den VRAM zu verschieben, und es dauert etwas mehr als eine Sekunde, bis die letzte Textur geladen ist. Mit aktivierter RTX IO wird die gleiche Textur auf einer SATA-SSD in weniger als der Hälfte der Zeit geladen.

Konfiguration Ins Spiel laden Textur laden
12900K + 500MB/s SATA SSD + RTX IO aus 1.13s 2.36s
12900K + 500MB/s SATA SSD + RTX IO an 0.67s 1.16s
12900K + 3,5GB/s NVMe SSD + RTX IO aus 0.57s 1.45s
12900K + 3,5GB/s NVMe SSD + RTX IO an 0.53s 1.07s

Das ist zwar nicht gerade der größte Unterschied in der Realität, da eine halbe Sekunde im Nu weg ist, aber die Halbierung der Zeit ist trotzdem beeindruckend. Nachdem ich eine Reihe von Tests in verschiedenen Konfigurationen durchgeführt habe, habe ich zwei interessante Erkenntnisse gewonnen. Erstens schlägt ein SATA-Laufwerk mit 500 MB/s und aktiviertem RTX IO ein NVMe-Laufwerk mit 3,5 GB/s und deaktiviertem RTX IO – das ist ziemlich beeindruckend. Zweitens hatten die Unterschiede zwischen CPU- und GPU-Hardware keine dramatischen Auswirkungen auf die Ladezeiten. Das System mit RTX 2060 Super und Core i9 12900K schnitt fast genauso gut ab wie die gleiche CPU mit dem Flaggschiff RTX 4090; ein System mit RTX 4070 und Ryzen 5 3600 lag in Bezug auf die Ladezeiten ebenfalls sehr nah beieinander.

Also ist Portal: Prelude RTX ist ein vielversprechender erster Einsatz dieser Technologie auf dem PC, aber gleichzeitig ist sie banal, da sie auf ein Spiel angewendet wird, das von vornherein ein altes Ladeparadigma verwendet. Bei Spielen, die aktives Streaming und keinerlei Ladebildschirme verwenden, wie Ratchet and Clank: Rift Apart und andere zukünftige Spiele, wird diese Technologie ihre Stärken am besten ausspielen können. Natürlich freuen wir uns darauf, schon bald über diesen Titel zu berichten, denn das Spiel erscheint am 26. Juli für den PC – also bleib dran.



Entdecke jetzt die neuesten PS5 Spiele auf Amazon

Source link

Schreibe einen Kommentar