Strana 2 z 3
- Radeon RX 7900 XT/XTX jsou konkurencí RTX 4080,
díky čipletu a ten je revolucí
Důvodem, proč jsou inženýři kolem novinek tak nadšení, jsou revoluční čiplety. NAVI 31 je první herní GPU, které není monolit. Tedy není tvořeno klasicky jako jeden kus křemíkového čipu. Jde o čiplet, kde najdete jeden hlavní 5nm GPU čip (GCD) uprostřed, a kolem něho několik malých 6nm MCD čipů:
Hlavní přínos tohoto řešení je zejména výrobní efektivita. Je stále náročnější vyrábět novými procesy větší čipy. Hlavně je to ukrutně drahé, což se odráží v cenách produktů. Stále navíc platí, že exponenciálně klesá výtěžnost s velikostí čipu. Jiným slovy čím větší čip uděláte, tím méně jich budete mít funkčních z jednoho křemíkového waferu, nejen proto, že se jich tam méně vejde, ale také chybovost se exponenciálně zvyšuje. A to se hodně odráží ve výsledné ceně. NVIDIA i AMD vyrábí nové čipy stejným 5nm procesem u TSMC. Ovšem obě firmy ale mají jinou cenu za wafer, důvody jsou jistě obecně známé. I rozdíl 5% může znamenat hodně. Hlavní rozdíl je ale v tom, kolik čipů na ten stejný wafer oba výrobci dostanou.
RTX 4090 a její AD102 má 608mm2, RTX 4080 s AD103 má 379mm2. AMD a jeho nové NAVI 31 je ovšem tvořeno 5nm GCD, které má pouze 306mm2! Ano, jsou zde ještě 6x MCD čipy, ale to jsou jednoduché cache čipy na mnohem levnější 6nm výrobě a mají velikost jen 37,5mm, takže jejich výrobní náklady jsou velmi malé. Co to znamená? Že i s extra náklady na pouzdření a vytvoření kompletního čipletu, je nákladově NAVI 31 zhruba na úrovni AD103 (RTX 4080), zatímco AD102 (RTX 4090) je o desítky % dražší! Je to podobné jako u procesorů, kde výhoda čipletů roste s počtem jader. Zatímco 8jádrový čiplet je jen zanedbatelně levnější než 8jádrový monolit, u 16jader už jsou to desítky % díky lepší výtěžnosti a u 32jádrových CPU se bavíme klidně o polovičních nákladech a nesrovnatelně lepší výtěžnosti. Pro GPU platí to samé. Pokud by AMD udělalo klasický monolit, mělo by celé tohle řešení minimálně přes 500mm2, což by na 5nm znamenalo také podstatně vyšší náklady. Ten přínos čipletu je i v tom, že některé části tradičního GPU, speciálně větší cache a řadiče apod. nemá smysl vyrábět nejlepším a nejdražším procesem. Protože ony neškálují. Nemají žádný přínos z toho, že jsou na novém procesu a jejich tranzistory nezabírají o moc menší plochu. Největší přínos a zmenšení tranzistorů je totiž u těch pro výpočetní jednotky. Tranzistory pro cache a výbavu z lepšího výrobního procesu těží minimálně, naopak jak dělají ten čip větší, tak podstatně zhoršují výtěžnost. Takže proto jsou ty MCD vyráběny „jen“ 6nm a jsou maličké.
To znamená, že na jeden 6nm wafer AMD naskládá stovky MCD a v případě toho 306mm GCD čipu na 5nm wafer velké desítky kusů. A z toho většina bude funkční a použitelná, u těch MCD hodně přes 95%, u těch GDC možná 80%. Ve srovnání s tím třeba už 400mm2 čipů se na ten stejný wafer vejde fyzicky méně a díky velikosti budou mít i exponenciálně horší výtěžnost. Takže NVIDIA těch AD103 vytříská ze stejného waferu na stejné výrobě u TSMC, prostě méně, a tak budou logicky dražší (navíc když za tu výrobu platí TSMC více než AMD dnes). A to se bude odrážet v ceně karet, nejen RTX 4080 ale i nějaký nižší model, na který by osekaný čip AD103 použilo. Výrobní náklady na ten čip tady budou stejně vysoké.
AMD i tady předvedlo onu flexibilitu, který čipletový design přináší. Doposud, když jste právě chtěli udělat nižší levnější model karty s osekanými parametry, stejně jste museli použít ten samý kus drahého čipu. Takže třeba RTX 3080 10GB a více než 2x dražší RTX 3090 Ti 24GB mají stejný GA102 čip. Nebo RX 6800 a o téměř polovinu dražší RX 6900 XT, obě mají fyzicky stejné NAVI 21. A ten čip tedy stál výrobně stejně, ale ty nižší modely mají prostě část neaktivní.
U RX 7900 XT a 7900 XTX verzí, se ten čiplet ale liší. To 5nm GCD je samozřejmě stejný čip u obou, u XT má tradičně tedy méně aktivních jednotek, ale už nemá všech těch 6 MCD! Tedy fyzicky tam 6 čipů na XT verzi je, kvůli fyzickým aspektům výroby i osazení chlazení. Ve skutečnosti to jedno MCD u XT ovšem není jen vypnuté, ono je falešné. Je tam jen kus nefunkčního křemíku, aby tam fyzicky byl materiál, ale není to ono funkční MCD. AMD prostě ušetřilo jeden takový funkční čip. Takže NAVI 31 verze na XT modelu je skutečně výrobně levnější než NAVI 31 na XTX. To je kouzlo čipletové konstrukce. Zde samozřejmě v tom nejjednodušším provedení, s nejmenším možným přínosem. Ale prostě jde o první generaci podobného řešení a AMD zkouší a demonstruje jeho možnosti. A bude se to nabalovat s mnohem větším přínosem v dalších generacích.
RDNA 3 je celé hlavně o té implementaci na čipletový design a kombinaci dvou různých výrobních procesů a oddělení cache od GCD. Sama architektura je víceméně „RDNA 2 na steroidech“. Jsou zde ale novinky, výrazně přepracované jednotky s dvojnásobným počtem FP32, proto některé spekulace dlouho uváděly více než zdvojnásobení výpočetních jednotek. Je to jako NVIDIA, když zdvojnásobila FP32, tak začala udávat ten dvojnásobný počet CUDA jednotek u RTX karet, protože prostě větší číslo. Fakticky tam ale těch velkých výpočetních jednotek byl stále poloviční počet. AMD se rozhodlo nebýt jako NVIDIA, a i když by tedy mohla uvádět marketingově hezkých 12 288 jednotek, protože tolik je tam skutečně nově FP32 jednotek, uvádí to nadále jako 6144 Stream Procesorů. A to je pouhé 20% zvýšení proti NAVI 21 s 5120 SP! Došlo ale k jejich posílení, kdy IPC mají o cca 17% lepší a mají i další vylepšení.
Ovšem třeba Infinity Cache je překvapivě dokonce mezigeneračně menší. Má „jen“ 96MB proti 128MB u předchůdce. Ovšem propustnost je násobně větší, protože tady AMD udělalo velká vylepšení. A také takty RX 7900 XT jsou nižší, než se čekalo. Což je překvapení s ohledem na možnosti 5nm výroby a to, že AMD udává že RDNA 3 je dělané pro 3GHz. XTX má boost „jen“ 2,5GHz, což je pouze o 9% výše, než 7nm 6950 XTX! Také pamětí je sice více na širší sběrnici 24GB a 384-bit proti 16GB na 256-bit, ale jsou to jen 20GHz GDDR6. Prakticky základ nabídky současných GDDR6 dnes. To je zajímavé hlavně s ohledem na konkurenci.
Radeon RX 7900 XTX 24GB je totiž v praxi výrobními náklady srovnatelná s RTX 4080 16GB! 5nm část GPU je menší, se znatelně lepší výtěžností a lepšími cenami u TSMC je nepochybně znatelně levnější než AD103. Ty MCD jsou jen 6nm a náklady na ně i výroba čipletu jako celku maximálně srovnají dohromady to, co NV stojí výroba toho téměř 400mm2 5nm čipu. AMD sice použilo 24GB paměti, ale jen levné GDDR6 20GHz, základ nabídky. NV používá 24GHz GDDR6X stažené na 22,4GHz! GDDR6X jsou ovšem minimálně o 1/3 dražší než srovnatelné GDDR6! V případě 20GHz GDDR6 a 24GHz GDDR6X by měl být rozdíl i větší. Takže RX 7900 XTX má sice o polovinu více paměti než RTX 4080, ale z hlediska nákladů to bude srovnatelné. Výsledek? AMD a jeho Radeon RX 7900 XTX je konkurencí k RTX 4080, protože nákladově tomu naprosto odpovídá. Nižší model RX 7900 XT je dokonce i levnější, nemá ten jeden MCD a má jen 20GB paměti, takže nákladově bude pod RTX 4080. Ten rozdíl ve výsledné ceně karet bude dělat hlavně marže, které jsou samozřejmě u AMD a NVIDIA rozdílné.
AMD se tedy hodně soustředilo na rozumnou cenu a tou odpovídající design karet. Co by se ale stalo, kdyby se „při zemi“ nedrželo a zkusilo vytvořit svou nekompromisní kartu?
|