Další novinky o NVIDIA RTX 3000, reálném srovnání s AMD atd. Bude to zajímavé!
NVIDIA poskytla o něco málo detailnější informace ke svým novým AMPERE grafickým kartám. Dozvídáme se tedy podrobnosti o jednotlivých jádrech, ale také o architektuře a multimediální výbavě. Také víme, kdy se dočkáme skutečných testů a recenzí. A velmi neochotně se NVIDIA podělila také o reálný herní výkon. Ovšem jen okrajově.
Co jsme se dozvěděli, jsou podrobnosti o nových 8nm čipech, které NVIDIA použila pro herní grafiky RTX 3090/3080/3070. Na rozdíl od velkého AMPERE, tedy A100 pro HPC a výpočty, které je vyráběno 7nm u TSMC, pro herní grafiky NVIDIA musela použít výrobu společnosti SAMSUNG. Jednoduše u TSMC na NVIDIA nezbylo místo. Bohužel 8nm výroba SAMSUNG má několik zásadních nevýhod. V první řadě jde vlastně o variaci na starší 10nm výrobu, která nikdy nebyla zamýšlena pro tak velké čipy, jakými jsou AMPERE. Pozitivní vlastností je dosahování vysoké hustoty tranzistorů, jenže v kombinaci se starší technologií výroby je to za cenu výrazných energetických nároků. Prostě 8nm SAMSUNG ani náhodou nemůže technicky konkurovat 7nm natož 7nm+ výrobě TSMC. NVIDIA se okatě vyhýbá v oficiálních materiálech objektivnímu srovnání efektivity se svou předchozí generací (ukazuje 1,9x zlepší, ovšem jen díky tomu že srovnává kartu v případě aktivního RT+DLSS) a vlastně řečem o spotřebě nových karet obecně. AMPERE série totiž zcela určitě velmi zklame všechny, kteří si zvykli na relativně nízkou spotřebu a zahřívání herních grafik NVIDIA. Ostatně byl to jeden z velkých argumentů příznivců NVIDIA proti AMD. U nových generací to ale vypadá na kompletní otočení situace …
(Zdroj: videocardz.com)
Dosud byly představeny dva čipy. Ten největší herní GA102 je určený pro RTX 3090 a RTX 3080. A je to poprvé po mnoha generacích, konkrétně od GTX 780 a GTX 780Ti modelů, kdy NVIDIA musela použít největší jádro i pro nižší model. Menší GA104, který je nástupcem GP104 na RTX 2080/2070, se zatím objevil jen na slabší RTX 3070. A v obou případech jsou to ovšem stále pořádní cvalíci.
V případě menšího GA104 se bavíme pořád o 392mm2 se 17,4 miliardami tranzistorů. Což je stále mnohem větší čip, než největší GPU od AMD v posledních letech, kterým je 2 roky staré 7nm VEGA 20 na Radeon VII s velikostí jen 331mm2 a 13,2 miliardou tranzistorů. NVIDIA GA104 tedy stále velké GPU, ale vzhledem k tomu, že by RTX 3070 s ním měla mít výkon jako RTX 2080Ti, je tu slušný posun. TURING grafika totiž měla TU102 jádro (12nm, reálně 16nm výroba TSMC) se 754mm2 a 18,6 miliardami tranzistorů. Je zde samozřejmě mimo jiného rozdíl ve sběrnicích, kdy GA104 je jen 256-bit. Každopádně NVIDIA prakticky zdvojnásobila počet tranzistorů na 1mm2, nicméně zdá se, že celková energetická efektivita zůstala velmi podobná, a proto se firma o ní nechce moc bavit. 18,6 miliardy tranzistorů u TU102 na RTX 2080Ti mělo spotřebu 250W (karta má ale širší sběrnici a více paměti), u nové podobně výkonné RTX 3070 se 17,4miliardou tranzistorů je spotřeba 220W (při jen 256-bit a 8GB).
V případě většího GA102 se bavíme o 628mm2 a 28 miliardách tranzistorů. Tedy fyzicky není jádro o moc menší, než TU102. A informace z výroby hovoří o velmi nízké výtěžnosti, ačkoliv speciálně pro RTX 3080 grafiku, je zhruba 25% čipu neaktivní proti plné verzi. Spotřeba je přesto 320W a u výkonnější RTX 3090 dokonce 350W. Jde tak s přehledem o nejnáročnějších jednojádrové karty, které NVIDIA představila. Musela pro ně tedy udělat ta nová velká referenční chlazení, protože s klasickými chladiči by byly příliš hlučné a žhavé. NVIDIA říká, že nové chladiče jsou o třetinu účinnější než ty staré.
Referenční PCB má také velmi zvláštní tvarování, na poměry NVIDIA používá i velmi kvalitní napájení a komponenty, které jsme obvyklé vídali výhradně na referenčních Radeon kartách. Vše je však nutností s ohledem na náročnost nové generace AMPERE GPU. Současně je ale nepravděpodobné, že by se tahle PCB objevila na běžných nereferenčních grafikách.
- Jak je to se zdvojnásobením CUDA jednotek?
AMPERE přináší výraznou změnu architektury, kdy NVIDIA zdvojnásobila počet Integer jednotek na blok. Každý SM blok nese u AMPEREE tedy fyzicky 64 FP32 jednotek k tomu 64 FP32 jednotek + 64 Int32 jednotek, přičemž druhá a třetí skupina mají sdílené datové cesty a nemohou být použity současně. Co to znamená v praxi?
Že bohužel NVIDIA sice nově uvádí u GA104 na RTX 3070 těch 5888 CUDA jednotek, což se jeví jako obrovský posun, ale je to jen marketing. Funkčně má totiž nadále 5888 děleno 2, tedy 2944 CUDA jednotek. Zdvojnásobení platí pouze pro případy, kdy není vyžadována žádná Int32 operace. Takových případů v praxi je minimum a speciálně nejsou u herního vytížení. Z toho důvodu se AMPERE chová vlastně podobně jako TURING a platí tedy ten poloviční udávaný počet jednotek. Z e stejného důvodu sice narostl na papíře ten výpočetní výkon z proti TURING na dvojnásobek, ale herní výkon zdaleka ne.
Dá se říci, že je to obdoba situace jako u AMD a jejích starší GPU, které také disponovaly vysokým FP32 výkonem a výpočetním výkonem obecně, ale pokud jde o herní výkon, zdaleka to tomu neodpovídalo. Jednoduše proto, že aby ten herní výkon narostl, musely by tomu být přizpůsobeny i další části GPU, což nejsou. A platí to i u AMPERE. NVIDIA tedy bude uvádět z marketingových důvodů ty zdvojnásobené počty CUDA jednotek, ale v drtivé většině případů (speciálně u her) to jádro funguje jako předchozí generace, tedy má reálně polovinu těch uváděných jednotek. Jinými slovy NVIDIA sice zdvojnásobila FP32 jednotky, ale už nezdvojnásobila ROP, texturovací jednotky atd. Takže prostě neočekávejte nárůst herního výkonu odpovídající nárůstu udávanému počtu CUDA a toho FP32 výpočetního výkonu.
NVIDIA dále vylepšovala i TENSOR jádra a také RayTracing jádra. Nicméně se zdá, že nedošlo k výraznému zlepšení výkonu, jak jsme očekávali. Skoro to vypadá, že výkon narostl jen o tolik, o kolik vzrostl výkon samotné grafiky ve hrách jako takové. Nezdá se tedy, že by RT nebo TENSOR jednotky byly proti TURINGU nějak výrazně efektivnější a výkonnější
Samozřejmě k nějakým změnám došlo, umí toho technicky více. Milovníci rozmazávací technologie Motion Blure se například teoreticky mohou těžit z HW akcelerace skrze RT jednotky :).
RTX 3000 grafiky nabízejí nové HDMI 2.1 a DP 1.4a konektory. Bohužel už nemají USB Type-C port, který měly RTX 2000 karty. Důvodem je nezájem vývojářů VR, pro jejichž sety byl primárně orientován. NVIDIA se tedy už neobtěžovala s tím jinak zbytečně prodražujícím prvkem v případě nových AMPERE karet.
Díky novému HDMI 2.1 je možné provozovat také 8K HDR rozlišení při 60Hz. Což se bude hodit, protože nová generace TV s 8K rozlišením je na cestě :).
- Reálný výkon karet a srovnání s AMD
NVIDIA se opravdu důkladně snaží vyhnout výkonovému srovnání mimo ty vzácné, výborně optimalizované ale marketingově zaplacené RT+DLSS hry a nenabízí tak obvykle bohaté srovnání výkonu v různých hrách, které u starších prezentací minulých generací měla. Tohle bohužel není dobré znamení. A pokaždé, kdy se výrobce snaží vyhnout se zveřejnění reálného výkonu i ve hrách, které nejsou dobře optimalizovány pro jeho GPU, má k tomu „špatný“ důvod a je třeba se mít na pozoru. Jedinou hrou, kde se tak dá něco odvozovat o reálném výkonu v drtivé většině her z materiálů, které NVIDIA zveřejnila, je Borderlands 3 (jediný test bez DLSS a RT).
Pro RTX 3080 uvádí ve 4K rozlišení výkon zhruba 61FPS, RTX 2080 má zhruba 35FPS. Tedy se bavíme o 74% nárůstu výkonu. V našem testování měla RTX 2080 FE zhruba 37FPS, takže by to mělo odpovídat. NVIDIA se vyhnula srovnání s výkonnější RTX 2080S, kterou vlastně nahrazuje, takže proti ní bude posun zhruba lehce přes 60%. Nesmíme ale zapomínat, že RTX 3080 má jádro o třídu větší. Vzhledem k tomu, že NVIDIA určitě vybrala pro sebe ten nejvýhodnější test, reálný nárůst výkonu napříč různými tituly u RTX 3080 proti RTX 2080S bude nižší, odhaduji tak v průměru kolem 50%.
Pro RTX 3070, která asi zajímá více uživatelů, ve 2160x1440 rozlišení NVIDIA uvádí výkon zhruba 82FPS. RTX 2070 má podle NVIDIA zhruba 52FPS. Rozdíl výkonu je tedy téměř 58%. Hru jsme testovali i u nás, víme že v RTX 2060 SUPER, což je vlastně téměř RTX 2070, má v tomhle rozlišení zhruba 51FPS, takže by ta čísla od NV mohla zhruba sedět. NVIDIA se záměrně vyhnula uvedení výsledku RTX 2070S, která za 499 dolarů je to, co RTX 3070 na trhu přímo nahrazuje. Jenže ten nárůst výkonu by proti ní nevypadal tak hezky. RTX 2070S má totiž ve stejném testu zhruba 62FPS. Nárůst výkonu u nové RTX 3070 se tak smrskl na pouhých 32%, což už jako standardní mezigenerační nárůst není zdaleka tak ohromující. A tady už značně zavání tvrzení NVIDIA, že AMPERE je největší posunem v její historii. PASCAL nabídl podstatně víc. A jen tak na okraj, srovnání Radeon RX 5700 XT. Ten má zhruba 58FPS, takže proti němu je RTX 3070 o nějakých 40% výkonnější v téhle konkrétní hře. Jenže Radeon RX 5700 XT dnes běžně koupíte za 10 tisíc a RTX 3070 bude začínat v říjnu na 14 tisících, takže rozdíl ceny naprosto odpovídá tomu rozdílu výkonu (RTX 3070 je v Borderlands o 40% výkonnější a o 40% dražší). Poměr cena/výkon tak bude přinejlepším úplně stejný, horší, když vezmeme v úvahu, že průměr zlepšení výkonu napříč hrami bude asi nižší než těch 40%).
Vůbec srovnání RTX 3070 a RX 5700XT je zajímavé. Obě karty mají 256-bit sběrnici a GDDR6 paměti (AMD má 14GHz, NV na 16GHz). NVIDIA se svou novinkou k dosažení toho až o 40% vyššího výkonu, potřebuje ale jádro o velikosti 392mm2 a 17,4 miliardách tranzistorů s výkonem 20,3TFLOPS. Už skoro 2 roky staré AMD NAVI 10 jádro (na Radeon RX 5700 XT) vyráběné první generací 7nm TSMC, má ovšem velikost pouhých 251 mm2, má 10,3 miliardy tranzistorů a výpočetní výkon 9,7 TFLOPS. Takže zbrusu nová NVIDIA potřebuje na těch svých 40% výkonu navíc v Borderlands 3 o 56% větší čip, o 69% více tranzistorů a dvojnásobný výpočetní FP32 výkon!!! Obě karty přitom mají TPB podobné (220 vs 225W) a NVIDIA karta stojí o 40% více …. Hmmm, to nepůsobí jako dobrá startovní pozice pro souboj s RX 6700XT s nástupcem NAVI 10 …
Už asi chápu, proč se NVIDIA vyhýbá zveřejnit skutečný objektivní měření výkonu nových karet napříč mnoha hrami, což v minulosti dělala. Ano, RTX 3070 bude pravděpodobně v průměru o 35% výkonnější než RX 5700XT, jenže když se podíváme na to srovnání těch parametrů jader, nepřijde mě to jako odpovídající nárůst, odpovídající rozdíl, či velký úspěch u o dva roky mladší novinky za vyšší cenu. Tím spíše, že srovnáváme s malým a dnes už starým NAVI 10. Jeho nástupce je totiž na cestě, AMD jej uvede buď ještě letos nebo v lednu hned po velkém NAVI 21. A schválně, co si myslíte, že nabídne nástupce malého NAVI 10, který ale bude stavět na vylepšené RDNA 2 architektuře a 7nm+ EUV výrobě? Asi těžko bude stagnovat a zůstane u toho, co teď nabízí NAVI 10 na RX 5700XT. Myslím si, že NVIDIA moc dobře ví, proč musela nastavit u RTX 3070 cenu zdánlivě „jen“ 499 dolarů a udělat hodně svých skalních fandů s RTX 2080Ti nešťastných …
Recenze RTX 3090/3080 jsou naplánovány na konec září. Nejdříve půjdou 14.9. testy výhradně NVIDIA FE verzí karet, až od 17.9. mohou být zveřejněny testy nereferencí. V září se ale dočkáme jen RTX 3080/3090, kdy v obchodech to nevypadá na velké dodávky. RTX 3070 pak bude výrazně později až někdy v průběhu října. Do té doby už možná budeme vědět, co proti tomu postaví AMD a je pravděpodobné, že RTX 3000 nemusí být nutně tak zajímavé, jak se nyní tváří …
AUTOR: Jan "DD" Stach |
---|
Radši dělám věci pomaleji a pořádně, než rychle a špatně. |
|