Testy Ray-tracing a DLSS
Výkon grafické karty NVIDIA RTX 3080 Founders Edition v klasických „rasterizačních“ hrách je tedy vskutku vynikají, ale abychom měli o výkonu přehled úplný, je potřeba tuto novou grafickou kartu podrobit také testům raytracingu a DLSS (Deep Learni Super Sampling). Pokud jste totiž četli stránku o architektuře grafických karet Ampere, jistě vám neuniklo, že jednotek pro výpočet real-time raytracingu (RT Cores) či strojového učení (Tensor Cores) zas až tak moc nepřibylo, nebo jich je v případě tensorů dokonce ještě méně nežli u Turingu. Na druhou stranu zas tyto výpočetní jednotky prošly generační obměnou. U grafických karet Ampere tak máme nyní výpočetní jednotky RT Cores druhé generace a v případě Tensor Cores dokonce generace třetí. Jak se tedy tato generační změna projevila v praxi? Tak to si otestujeme právě v této kapitole.
K vlastním testům raytracingu a DLSS jsem dnes využil nástroj 3DMark a jeho speciální „NVIDIA DLSS feature test“, který obě tyto technologie šikovně spojuje v jediném testu Port Royal. Pravda, testuje se zde DLSS ve verzi 1 (namísto současné DLSS 2.0), nicméně protože nám dnes nejde ani tak o kvalitu obrazu ale jen o výkon, bude nám to myslím docela stačit. Testoval jsem samozřejmě ve všech rozlišeních a výsledky byly následující:
NVIDIA DLSS feature test
Pro jistotu raději uvádím, že pro výstupní rozlišení 1920x1080 v tomto testu grafická karta renderuje DLSS ve „vnitřním“ rozlišení 1440x810, v rozlišení 2560x1440 pak 1920x1080 a pro rozlišení 3840x2160 pak DLSS využívá 2560x1440. Pojďme si tedy výsledky nějak shrnout v procentuální podobě:
Ray-tracing |
RTX 2080 SUPER |
RTX 2080 Ti |
RTX 3080 |
1920x1080 (FullHD) |
100 % |
128 % |
161 % |
2560x1440 (WQHD) |
100 % |
129 % |
162 % |
3840x2160 (4K UHD) |
100 % |
131 % |
168 % |
Ray-tracing + DLSS |
RTX 2080 SUPER |
RTX 2080 Ti |
RTX 3080 |
1920x1080 (FullHD) |
100 % |
124 % |
148 % |
2560x1440 (WQHD) |
100 % |
128 % |
155 % |
3840x2160 (4K UHD) |
100 % |
129 % |
156 % |
Jak můžete vidět, jak výkon v samotném raytracingu, tak i při současném využití technologie DLSS nám u grafické karty GeForce RTX 3080 pěkně škáluje a nechává za sebou nejen svého předchůdce GeForce RTX 2080 SUPER, ale také doposud nejvýkonnější GeForce RTX 2080 Ti, která má navíc k dispozici dvojnásobný počet tensorů.
Simultaneous Compute and Graphics (Async Compute)
Pokud mluvíme o raytracingu a DLLS, nesmíme také zapomenout na jednu novinku, kterou s sebou přináší tato nové generace grafických karet - Simultaneous Compute and Graphics (SCG). Jedná se o na první pohled nám již dobře známou technologii Async Compute, tedy souběžného zpracování grafických a výpočetních úloh. Právě tato technologie byla „naroubována“ také na úlohy raytracingu a DLSS, kde všechny druhy výpočetních jednotek grafické karty mohou pracovat souběžně, čímž se zkracuje potřebná doba na rendering snímku.
Technologie SCG je v současné době využita pouze v jediné hře a to Wolfenstein Youngblood, a to navíc jen v neveřejné beta verzi. A protože jsem měl k této beta verzi také přístup, hnedle jsem otestoval, jaký vliv na snímkovou frekvenci tato technologie má a s čím tedy můžeme v budoucnu počítat.
Jak můžete vidět, asynchronní zpracování operací SCG v případě počítačové hry Wolfenstein Youngblood zvedá snímkovou frekvenci o nějakých 12%. Nárůst výkonu je tedy měřitelný a jedinou nevýhodou SCG je to, že musí být vždy implementován přímo do hry.
Co tedy říci na závěr této kapitoly? Snad jen to, že jak nové výpočetní jednotky RT Cores druhé generace, tak také jednotky Tensor Cores generace třetí u grafické karty GeForce RTX 3080 přinášejí navíc další výkon, který můžete využít v herních titulech podporujících raytracing a DLSS. A docela určitě se vám tam hodit bude!