Grafický čip GP102
Tím nejvýkonnějším, čím se rodina grafických karet generace Pascal společnosti Nvidia může ode dneška pochlubit, je grafická karta GeForce GTX 1080 Ti, která je založena na grafickém čipu GP102, známém spíše z profesionálních karet Titan X. Úpravou tohoto „Titánského“ grafického čipu pak vznikl čip nový s označením GP102-350-K1-A1, který je srdcem a motorem právě grafických karet GeForce GTX 1080 Ti. Pojďme si tedy tento „nový“ grafický čip nejdříve tak trochu představit.
My jsme si novou architekturu grafických čipů Pascal popsali v článku Asus Strix GTX 1070 O8G Gaming: Pascal ve velkém testu a proto asi nemá valného významu zde vše popisovat znovu. Zaměřím se proto dnes pouze na organizaci Graphics Processing Cluster (GPC), tedy na jednotky, ve kterých jsou jednotlivá 3D primitiva přeměňována na pixely 2D obrazu a jejich počet je tak přímo úměrný samotnému výkonu grafické karty.
Jak můžete vidět, u grafického čipu GP102 nám počet jednotek GPC narostl na rovných 6 kousků, což je o 50 % více, nežli u dosavadního nejvýkonnějšího čipu GP104, na kterém jsou založeny grafické karty GeForce GTX 1080/1070. Znamená to tedy, že také grafická karta GeForce GTX 1080 Ti by měla být o 50 % výkonnější nežli GTX 1080? Čistě po teoretické stránce by tomu tak být mělo, ale samozřejmě je zde ještě mnoho faktorů, které se do konečného výkonu GTX 1080 Ti mohou promítnout také. Pojďme se tedy alespoň ve stručnosti nejdříve podívat do útrob samotné jednotky GPC.
Každý modul GPC se skládá vždy z jednoho rasterizéru a až 5 jednotek TPC (Texture/Processor Cluster). Zatímco rasterizér se stará o rasterizaci 3D objektů, kdy jsou 3D primitiva převáděna do ploché rastrové mřížky a vytvářeny fragmenty (bezbarevné pixely), úlohou TPC je pak těmto fragmentům přiřazení (vypočítání) té správné barvy.
Součástí každého bloku TPC je jednak fixní jednotka Polymorph Engine (PE), která se stará o věci jako je Vertech Fetch, teselaci apod. a nově také o funkcionalitu s názvem Simultaneous Multi-Projection, ale hlavně také jeden programovatelný výpočetní blok SM (Streaming Multiprocessors), který se stará o vlastní výpočty a práci s texturami.
Protože barva každého fragmentu se musí někde vzít a vypočítat, není asi moc velkým překvapením, že každá jednotka SM disponuje jednak vlastními výpočetními jednotkami s názvem CUDA Cores (CC) v celkovém počtu 128 CC (4x 32), na kterých běží vlastní programy s výpočty (shadery), ale disponuje také celkem 8 jednotkami TMU (Texture Mapping Units), které zase pro výpočty barev dodávají ty správné hodnoty Texelů (barev pixelů z textury).
Suma sumárum, pokud každá jednotka TPC obsahuje 1x PE, 128x CC a 8x TMU, pak jeden blok GPC s pěti TPC disponuje 5x PE, 640x CC a 40x TMU. Při celkovém počtu 6x GPC by grafický čip GP102 měl disponovat celkem 30x PE, 3840x CC a 240x TMU.
Při pohledu na blokové schéma grafického čipu GP102-350-K1-A1 však zjistíme, že ne všechny bloky GPC jsou plně obsazeny a v některých nám nějaké jednotky TPC chybí. S největší pravděpodobností s ohledem na výtěžnost grafického čipu byly dvě jednotky TPC „obětovány“, takže konečné specifikace grafického čipu GP102-350-K1-A1 jsou 28x PE, 3584x CC, 224 TMU. To vše v šesti blocích GPC se šesti rasterizéry (16 pix), které zajišťují teoretickou geometrickou propustnost až 6 triangles na takt (96 pix/takt).
Při pohledu na počet paměťových řadičů je jasné, že pro vyšší výtěžnost nebyly „obětovány“ pouze dvě jednotky TPC, ale také jeden řadič paměti (32 bit), na který je navázáno nejen 1 GB grafické paměti, ale také 256 KB L2 Cache a 8 ROP (Raster Operations Pipeline) jednotek, o které tedy grafický čip GP102-350-K1-A1 definitivně přišel také. Na druhou stranu, pro kompenzaci nižšího počtu těchto jednotek paměťových operací byla grafická karta GeForce GTX 1080 Ti vybavena rychlejšími 11 Gbps grafickými paměťmi GDDR5X.
Projeví se ale vůbec nějak tyto lehké „řezy“ grafického čipu GP102 na výkonu GeForce GTX 1080 Ti? Osobně se domnívám, že nikoliv, snad jen v případě, kdy obě chybějící jednotky TPC spadnou do jediného bloku GPC by mohlo mít za následek nižší vytížení příslušných ROP jednotek. Myslím ale, že i tento výjimečně smolný případ by mohl mít poměrně nevýznamný dopad na celkový výkon této „nadupané“ grafické karty. Nyní se již pojďme podívat na finální specifikace grafické karty GeForce 1080 Ti.
Specifikace
|
GTX 1080 Ti |
GTX 1080 |
GTX 1070 |
GTX 980 Ti |
Chip |
GP102 |
GP104 |
GP104 |
GM200 |
CUDA Cores |
3584 |
2560 |
1920 |
2816 |
TMUs |
224 |
160 |
120 |
176 |
ROPs |
88 |
64 |
64 |
96 |
GPU Clock |
1480 MHz |
1607 MHz |
1506 MHz |
1000 MHz |
Boost Clock |
1582 MHz |
1733 MHz |
1683 MHz |
1075 MHz |
VRAM Clock |
11Gbps
GDDR5X |
10 Gbps
GDDR5X |
8 Gbps
GDDR5 |
7 Gbps
GDDR5 |
VRAM Bus |
352-bit |
256-bit |
256-bit |
384-bit |
TDP |
250 W |
180 W |
150 W |
250 W |
Transistors |
12B |
7,2B |
7,2B |
8B |
Process |
16nm FinFET |
16nm FinFET |
16nm FinFET |
28nm |
Nové technologie, které s sebou architektura Pascal přinesla jako je podpora Asynchronních shaderů, Simultaneous Multi-Projection, Single Pass Stereo, Lens Matched Shading a Fast Sync, které jsme si popsali v našem předchozím článku, jsou samozřejmě platné také pro grafické karty GeForce GTX 1080 Ti a nám už tedy nezbývá nic jiného, nežli se pustit do dnešní recenze grafické karty Nvidia GTX 1080 Ti Founders Edition.