Gigabyte
MSI GeForce RTX 3060 Gaming X TRIO 12G (RECENZE)
Embargo na informace kolem nových grafických karet GeForce RTX 3060 společnosti NVIDIA právě vypršelo a já vám tak mohu na GPUreport konečně představit prvního zástupce, kterým je grafická karta MSI GeForce RTX 3060 Gaming X TRIO 12G. A jak se této horké novince vedlo ve zdejších testech?
gpureport.cz  Pavel Šantrůček  25.02.2021

OBSAH:
1. Architektura Ampere (GA106)          
7. Porovnání provozních vlastností          
2. MSI RTX 3060 Gaming X TRIO          
8. Porovnání výkonu          
3. MSI Dragon Center          
9. Testy Raytracing a DLSS          
4. Jak se testují grafické karty          
10. Přetaktování          
5. Testy provozních vlastností          
11. Hodnocení          
6. Zaostřeno na spotřebu          
 

Architektura Ampere GA106

Dříve, nežli si dnes grafickou kartu MSI RTX 3060 Gaming X TRIO 12G představíme a také řádně otestujeme, nebylo by asi od věci si grafický čip GA106 ve verzi GA106-300-A1, na kterém jsou založeny právě grafické karty GeForce RTX 3060, trochu popsat a osvětlit. A že to nebude nic složitého, o tom vás přesvědčím hnedle a budou mi k tomu stačit pouze dvě bloková schémata grafického čipu GA106. Pojďme se na to tedy podívat.

 

Blokové schéma
Blokové schéma GA106

 

Frontend

Stejně jako u předchozích generací, každý grafický čip musí nějaká data přijímat, následně rozdělovat úkoly a řídit práci podřízených jednotek. Tuto činnost má na starosti Frontend grafického čipu, který je již od dob architektury Fermi tvořen jednotkami Host Interface a GigaThread engine. Zatímco pomocí Host Interface jsou přenášeny příkazy z CPU pomocí PCI Express, Gigathread engine je zodpovědný za vlastní logiku přenosu dat z RAM do VRAM a především také za plánování a rozdělování práce na jednotlivé další podřízené jednotky. Vlastní řízení grafického čipu je pak práce velmi sofistikovaná a ne nepodobná práci CPU. Každý výrobce se tedy o bližší informace jen nerad dělí a nejinak tomu je právě v případě NVIDIA.

První změnou, které jsme se v generaci Ampere dočkali, je povýšení sběrnice PCI Express na výkonnější verzi PCIe 4.0. Toho mohou samozřejmě využít všichni majitelé základních desek právě s podporou PCIe 4.0 (v současnosti jen AMD Ryzen).

Graphics Processing Cluster (GPC)

V hierarchii blokového schéma je první podřízenou jednotkou Gigathread engine jednotka s názvem Graphics Processing Cluster, neboli GPC. Grafický čip GA106 se skládá celkem ze tří GPC, které mají obdobnou funkci jako Shader Array v konkurenční architektuře GCN. Kdo četl popis grafické pipeline, jistě již ví, že se jedná o jakousi kompletní grafickou pipeline, kde se primitiva přeměňují v pixely, ze kterých je pak složen celý hotový snímek a zobrazen na vašem monitoru.

 

GA104 Graphics Processing Cluster (GPC)

 

Každý GPC obsahuje jednu rasterizační jednotku (Raster engine), která spolupracuje s celkem 5 bloky TPC (Texture/Processor Cluster), ve kterých jsou sdruženy jednotky Polymorph Engine a vždy po dvou jednotkách Streaming Multiprocessors (SM).

Zatímco Polymorph Engine obsahuje fixní jednotky, které se starají o geometrii (Vertex Fetch, Tessellator, Stream Output atd.), SM jednotky jsou jednotkami naopak programovatelnými, na kterých je možné spouštět shadery (programy běžící na GPU).

Streaming Multiprocessor (SM)

GA104 Streaming Multiprocessor (SM)

 

Každá jednotka SM se (krom jiného) skládá ze čtyř bloků po 32 výpočetních jednotkách FP32 (CUDA Core), 16 jednotkách INT32 a jedné výpočetní jednotky Tensor Core třetí generace, určené pro tensor/maticové operace strojového učení. Všechny tyto bloky jsou pak propojeny přes sdílenou pamětí $L1 Data Cache (128KB).

Počet jednotek TMU (Texture Mapping Units), které využívají právě shadery k bezstarostnější práci s texturami, nebo raději 2D obrázky obecně, zůstal ve stejném počtu (4x TMU) a stejně tak je zde přítomna i jediná výpočetní jednotka RT Core, která je určena speciálně na výpočty Raytracingu, tedy na výpočty dráhy paprsku a detekci kolizí s 3D objekty scény.

Jak můžete vidět, právě v těchto výpočetních jednotkách došlo asi k té nejdramatičtější změně. Počet výpočetních jednotek FP32 (CUDA Cores) se nám totiž oproti generaci Turing zdvojnásobil. Má to však jeden háček, přidané jednotky FP32 sdílejí datapath (propojení) s jednotkami INT32, takže v jednom taktu mohou být využity buďto jednotky FP32 nebo jednotky INT32. Další změnou jsou pak výpočetní jednotky Tensor Cores, které by měly být v této třetí generaci 2x výkonnější, a stejně tak by měly být dvakrát výkonnější i výpočetní jednotky RT Cores druhé generace.

Spočítáme-li to dohromady, pak každá jednotka SM jako celek tedy disponuje 128x CUDA Cores, 4x Tensor Cores, 1x RT Core a 4x TMU. Pokud tedy GPC obsahuje celkem 5 bloků TPC, můžeme říci, že každý GPC obsahuje jeden rasterizér, 5x Polymorph Engine a 10x SM s 1280x CUDA Cores, 40x TMUs, 40x Tensor Cores a konečně také 10x RT Cores.

Každý GPC se může na vstupu postarat v jednom taktu o jeden primitivní trojúhelník (Triangle) a jeho výstupem jsou pak pixely, které je ale třeba ještě nějakým způsobem finalizovat (Blending, Z buffering atd.) a následně zapsat do framebufferu (Render Target). O tuto finalizaci a ukládání se starají jednotky s názvem Raster Operations Pipeline (ROP), které v generaci Ampere doznaly také změny a nyní jsou přímou součástí bloku GPC (u Turingu byly součástí framebufferu). Každý GPC obsahuje dva samostatné bloky po 8 ROPs, tedy celkem 16 ROPs, které se tedy umí postarat o 16 pixelů na takt.

Framebuffer (VRAM)

Grafický čip GA106 disponuje celkem šeti 32-bit řadiči paměti (192-bit celkem) a 3MB $L2 Cache. Paměťové řadiče jistě podporují nejnovější paměti typu GDDR6X, které byly vyvinuty v kooperaci se společností Micron a podporují technologii PAM4 (Pulse Amplitude Modulation-4), ale grafické karty GeForce RTX 3060 jsou ve finále vybaveny "jen" paměťmi typu GDDR6 o efektivní frekvenci 15000 MHz.

Pokud tedy víme, co vše obsahuje jeden blok GPC, vlastně si již sami můžeme spočítat, co obsahuje celý grafický čip GA106, který má v plné konfiguraci takovýchto GPC bloků celkem 3.

  • GPC: 3x
  • TPC: 15x
  • SM: 30x
  • CUDA Cores: 3 840x
  • Tensor Cores: 120x
  • RT Cores: 30x
  • TMUs: 120x
  • ROPs: 48x

Bohužel, grafická karta GeForce RTX 3060 na trh nepřichází s čipem v plné konfiguraci. Grafický čip GA106-300-A1 byl „oříznut“ o jeden celý blok TPC (případně o dva bloky SM v různých TPC). Ve finále tak musíme ze specifikací odečíst 1x TPC s celkem 512x Cuda Cores, 8x Tensor Cores, 2x RT Cores a 8x TMUs. Všechny paměťové řadiče zůstaly. Jak tedy vypadají konečné specifikace grafické karty GeForce RTX 3060?

 

SPECIFIKACE NVIDIA GEFORCE RTX 3060
  RTX 3060 Ti RTX 3060 RTX 2060S
CUDA Cores 4864 3584 2176
RT Cores 38 28 34
Tensor Cores 152 112 272
TMUs 152 112 136
ROPs 80 48 64
Base Clock 1410 MHz 1320 MHz 1470 MHz
Boost Clock 1665 MHz 1777 MHz 1650** MHz
Memory Clock 14Gbps GDDR6 15Gbps GDDR6 14 Gbps GDDR6
Memory Bus Width 256-bit 192-bit 256-bit
VRAM 8GB 12GB 8GB
TDP 200 W 170 W 175** W
Transistors 17.4B 13.25.6B 10.8B
Architecture Ampere Ampere Turing
Manufacturing Process Samsung 8nm Samsung 8nm TSMC 12nm FinFET
* reference ** founders

 

Jak můžete vidět, oproti GeForce RTX 3060 Ti je grafická karta GeForce RTX 3060 poměrně dost "ořezána" a krom vyššího počtu CUDA Cores na tom není o mnoho lépe ani proti GeForce RTX 2060 SUPER z předchozí generace Turing. Nesmíte ale zapomenout, že jednotek RT a Tensor Cores je u GeForce RTX 3060 sice méně, ale mají oproti stejným Turingovým jednotkám prakticky dvojnásobný výkon. Ale nepředbíhejme, to vše si dnes samozřejmě otestujeme.

Ampere a nové technologie

Grafické karty GeForce RTX 30 přinášejí také nějaké nové technologie, i když to samozřejmě není nic tak přelomového, jako tomu bylo v případě grafických karet Turing, které s sebou přinesly jako první podporu výpočtů real-time raytracingu a DLSS (Deep Lerning Super Sampling). Ať už se ale jedná o technologie nové či starší věřte, že grafické karty generace Ampere jsou na budoucích pár let hraní vybaveny velmi dobře. Tady je takový stručný výpis toho, s čím budete moci u grafických karet Ampere počítat:

  • úplná podpora DirectX 12 Ultimate (Ray-tracing, VRS, Mesh shader, sampler Feedback)
  • podpora DLSS (proprietární technologie NVIDIA )
  • hardwarová akcelerace RT Motion blur (novinka v RT)
  • Simultaneous Compute and Graphics (SCG) - souběžné zpracování Graphics + RT + DLSS operací
  • RTX IO (podpora Microsoft DirectStorage)
  • HDMI 2.1 (přednos signálu až 8K/60Hz)
  • DisplayPort 1.4a (přednos signálu až 8K/60Hz)
  • NVDEC (s podporou formátů HEVC, VP9, H264 a AV1)

Nové ovladače

Současně s vydáním grafických karet GeForce RTX 3060 vydává společnost NVIDIA také nové ovladače, které přinášejí zejména dvě novinky. Tou první je (a jistě jste o ní již slyšeli) softwarové omezení výkonu na těžbu kryptoměn (Ethereum). Společnost NVIDIA tak vyšla vstříc všem hráčům počítačových her, kteří by si grafické karty Ampere rádi koupili, ale díky velké poptávce ze strany minerů tyto grafické karty téměř zmizeli z pultů obchodů. Díky softwarovému omezení výkonu v ovladačích a BIOSu grafických karet by se tak většina grafických karet GeForce RTX 3060 měla dostat právě do hráčské komunity. Jak se to v praxi projeví (jestli těžaři nepřejdou na nějaký jiný altcoin), to teprve uvidíme, ale v každém případě si minimálně za snahu společnost NVIDIA zaslouží velkou pochvalu.

NVIDIA Resizable BAR

Druhou novinkou v nových ovladačích grafických karet GeForce je pak podpora Resizable BAR, kterou již známe z grafických karet Radeon RX 6000 pod názvem SAM (Smart Access Memory ). Resizable BAR dovoluje procesoru využívat nejen určitou část kapacity grafické paměti (doposud jen 256MB), ale díky přenastavení základních adres registru PCI (Reziable Base Address Register) může grafickou paměť využívat úplně celou. V některých optimalizovaných hrách byste se tak měli dostat k vyšší snímkové frekvenci. Tady je ale nutno poznamenat, že podpora Resizable BAR vyžaduje optimalizaci ovladačů pro konkrétní hry a tady driver-team společnosti NVIDIA vlastně teprve začíná. Berte tedy tuto podporu Resizable BAR jako takovou první vlaštovku, protože optimalizace ovladačů pro jednotlivé hry vlastně teprve začala. Výkonnostní zisky z této technologie tedy nebudou prozatím nijak závratné, časem se ale jistě dočkáme výkonnostní zisků vyšších a také ve vícero hrách. Podpora Resizable BAR je v současnosti povolena pouze pro grafické karty GeForce RTX 3060!

Tak, to by bylo na úvod dnešní recenze asi vše a teď si již pojďme konečně představit grafickou kartu MSI RTX 3060 Gaming X TRIO 12G.

         
  Další kapitola
         
Gigabyte

SPONSORS & PARTNERS

Asus  Alza  MSI  Gigabyte
AMD  Sapphire  Gainward  Nvidia

Copyright (c) 2024 InfoTrade Powered by ASP.NET & MS SQL Server