Paměťový subsystém
Asi víte, že počítačová hra vlastně „jen“ vytváří data potřebná k tomu, aby z nich grafická karta mohla vykreslit (renderovat) finální snímek ze hry na monitoru počítače. Aby grafický čip mohl pracovat na plný výkon a renderoval tak snímky co nejvyšší rychlostí je zapotřebí, aby se k němu tato tolik potřebná data dostala včas. Pokud totiž dojde ke zdržení a vykreslovací příkazy (Command buffers) nebo data (Constant buffers, surfaces …) se ke grafickému čipu včas nedostanou, grafický čip musí svou práci přerušit, na tato data vyčkat a výsledná snímková frekvence tak klesá. O rychlý přísun dat ke/z grafickému čipu se stará paměťový subsystém, který je tvořen operační pamětí RAM, grafickou pamětí VRAM a samozřejmě také sběrnicemi, po kterých tato data tečou. Jak RAM, tak VRAM musejí mít dostatečnou kapacitu, aby se do nich všechna potřebná data vešla, sběrnice pak musejí mít dostatečnou propustnost (Bandwidth), aby se potřebná data také bez zbytečného zdržení přenesla.
Zatímco o přenos dat mezi GPU a systémem PC (CPU, RAM) se stará sběrnice PCI Express s obousměrnou propustností „pouhých“ 32 GB/s, samotný grafický čip pak komunikuje s VRAM s propustností násobně vyšší 480 GB/s (Vega64, GTX 1080 Ti). Jak vidíte, je tedy velmi důležité, aby všechny potřebná data pro rendering (Working set) byla uhnízděna právě ve VRAM. Pokud totiž VRAM nemá dostatečnou kapacitu a working set se tak do ní nevejde celý, musejí být zbylá data dotahována z RAM po pomalé sběrnici PCI Express a samozřejmě snímková frekvence klesá.
Pokud jsme si alespoň ve stručnosti vysvětlili úlohu paměťového subsystému, můžeme se zase vrátit zpět k dnešnímu tématu a popsat si jednotlivé položky z rozhraní Incredible Benchmarks.
Položka RAM usage zobrazuje informace o využití operační paměti RAM jak v hodnotě absolutní (Value) v jednotkách GB, tak také relativní k celkové maximální kapacitě RAM (Progress). Testovací sestava na GPUreport disponuje operační pamětí RAM o kapacitě 16 GB.
VRAM usage zobrazuje informace o využití grafické paměti VRAM u GPU. Opět, jak v hodnotě absolutní (Value) v jednotkách GB, tak také relativně k celkové kapacitě VRAM grafické karty (Progress). Využití VRAM je velmi důležitou informací, která ukazuje, o kolik GB grafické paměti si daná hra říká a jestli je kapacita VRAM vaší grafické karty pro tuto hru vůbec dostatečná.
Položka PCIE usage zobrazuje procentuální využití sběrnice PCIE, tedy vlastně jak intenzivně se data přesouvají mezi PC a samotnou grafickou kartou. Za normálních okolností, kdy grafická karta disponuje dostatečnou kapacitou VRAM, je vytížení této sběrnice velmi malé. Pokud však grafická karta disponuje VRAM s kapacitou nižší, a celý working set se do ní nevejde, vytížení PCIE rázem stoupá, protože zbylá data, která se do VRAM již nevešla, musejí být dodatečně dotahována z operační paměti právě skrz sběrnici PCI Express. Položka PCIE usage je tak skvělým indikátorem toho, jestli je kapacita grafické paměti VRAM pro danou hru dostatečná, či nikoliv. Bohužel tato hodnota je v rozhraní Incredible Benchmarks uváděna pouze u grafických karet GeForce. Radeony totiž counter pro sledování vytížení PCIE nemají a proto se u nich bude vždy zobrazovat "n/a".
VRAM bandwidth ukazuje okamžitou propustnost dat mezi grafickým čipem a grafickou pamětí VRAM. Její hodnota je pak dána vlastní frekvencí a šířkou sběrnice mezi GPU a VRAM. Čím vyšší tato propustnost je, tím lépe a data se tak přesouvají rychleji. Proto také můžeme vidět, že u výkonnějších grafických karet je tato hodnota vyšší, nežli u těch karet méně výkonných. Pro přenos některých speciálních dat mezi GPU a VRAM se dnes využívají také kompresní algoritmy (např. delta komprese), které tuto propustnost násobně zvyšují. To ale dnes řešit vůbec nebudeme, protože to se nijak zobrazit ani nedá.