„Těžařskou“ mánii střídá mánie po „AI“. Oba výrobce mají obří objednávky pro svá HPC řešení.
Jak NVIDIA, tak AMD hlásí velký zájem o jejich HPC řešení pro AI, tedy hlavně výpočetních GPU. Honba firem za vývojem vlastních AI nástrojů a vůbec umělé inteligence jako takové, vyžaduje velmi specifický a extrémně výkonný HW. Takový však dnes nabízí pouze NVIDIA a AMD. První jmenovaná je v lepší pozici, protože svůj aktuální H100 představila už dříve a nyní jej začíná běžně dodávat, i když hlavní vlna dostupnosti bude až v dalších měsících.
To samé se dá říci i o AMD. Ta své nejnovější Instinct Mi300 HPC řešení, které v mnoha směrech ještě překonává výkonem NVIDIA H100 pokud jde o výkon díky čipletové konstrukci. Současně nabízí více variant, včetně verze s výkonným „integrovaným“ EPYC procesorem, nemluvě o tom, že AMD na rozdíl od NVIDIA má i vlastní komplexní HPC/serverovou platformu s nejvýkonnějšími procesory na světě. Nicméně zatímco NV již H100 dodává, AMD začne ve stejné míře dodávat Mi300 až v dalších měsících tohoto roku.
- TSMC pod tlakem, omezením nejsou hlavní čipy samotné
Obě firmy tak musí výrazně navýšit objednávky kapacit, protože zájem o jejich AI HPC řešení dalece překonává všechny plány a očekávání obou. TSMC, které exkluzivně hlavní HPC čipy AMD a NVIDIA vyrábí, tak dostalo opravdu velké objednávky na N5/N4 kapacitách. Nicméně výrobní kapacity nejsou nafukovací. Určitým omezením je jednak produkce samotných čipů, což prý ale není takový problém, jako následná operace tzv. „pouzdření“, kdy TSMC tedy „lepí“ u něj vyrobené čipy (případně více čipů v rámci čipletu jako má AMD s Mi300) a k nim HBM paměti. Právě kapacity linek, které se o tuhle operaci starají, jsou omezené, stejně tak jiné elektro komponenty, která k produkci funkčních NVIDIA H100 a AMD Instinct Mi300 musíte také zajistit.
Jednoduše tak velká produkce takto náročných HPC řešení nebyla plánována, a tak nejde jen o ty hlavní čipy, které vyrábí TSMC, ale i o produkci dalších komponent, kterou však navýšit není a nebude „tak jednoduché“. TSMC tedy samo o sobě nemělo problém „dát“ AMD a NVIDIA další kapacity na svých N5/N4 linkách. Podle zdrojů kolem TSMC jen AMD objednalo pro svá Mi300 polovinu celkových kapacit, které má NVIDIA u TSMC pro produkci všech svých GPU, a to NV také zvedla objednávky kapacit. Asi tak už někteří tušíte, že to má jeden háček …
- Výroba herních GPU bude omezována = vyšší ceny!
Ano, bohužel dopady „AI mánie“ už se projevují a budou v mnoha věcech podobné, jako měla „těžařská mánie“. Velkým rozdílem ovšem bude to, že produkce herních grafik je odsunuta na vedlejší kolej, protože až na výjimky se běžné herní grafické karty nehodí firmám, které to s AI opravdu myslí vážně. Jednoduše, herní grafiky nemají dost výkonu a hlavně paměti, kdy H100 nebo Mi300 jsou úplně jinde. Druhá věc je samozřejmě vlastní provoz těchto systémů, kdy jsou to HPC/serverové jednotky s tomu odpovídající infrastrukturou.
Některé menší firmy zkouší používat klasické herní grafiky, populární je AMD Radeon RX 7900 XTX díky tomu, že má vedle výpočetně velmi výkonného GPU, hlavně 24GB paměti. A je zdaleka nejlevnější podobnou kartou, kdy za cenu jedné 24GB RTX 4090, můžete mít prostě až dvě RX 7900 XTX, tedy 2x takový výkon a hlavně paměť. Jenže mnoho firem zjišťuje, že provoz takového systému s herními GPU není právě ideální proti HPC řešeni pro AI použití. Speciálně když systémy pro AI a strojové učení potřebují pro skutečně velké průmyslové použití tisíce těch GPU. Takže na rozdíl od těžařů, kteří klidně herní grafické karty používali (ba je dokonce preferovali), „těžaři AI“ chtějí specializovaná řešení, tedy řešení jako Mi300 a H100 s tomu odpovídajícími serverovými umístěními atd.
Jenže NVIDIA ani AMD jednoduše nemají dost kapacit výroby u TSMC pro všechny své produkty. Jednak pro čipy samotné, ale hlavně kapacity pro to náročné pouzdření a kapacity dodávek dalších komponent, která tahle HPC řešení potřebují. NVIDIA tak již prakticky zastavila produkci RTX 4000 grafických karet a neplánuje ji ve velkém rozjíždět, ani kdyby se výrazněji obnovila poptávka. Alespoň ne dokud bude trvat AI mánie a bude mít objednávky pro HPC GPU. Řídí také distribuci čipů pro RTX grafiky, kdy výrobci mohou dodat na trh do prodeje jen omezené množství karet v daném čase. U některých modelů tak je, i při té nízké poptávce, problém s dostupností, což udržuje ceny nahoře a udržovat bude. NVIDIA nemá žádný důvod produkci RTX 4000 navýšit, protože i přes ty absurdní ceny mnoha modelů, má na výrobě herních GPU zanedbatelnou marži ve srovnání s produkcí H100, které jedno jediné vychází na desítky tisíc dolarů!
Takže pokud si máte jako NV vybrat, zda vyrobit na N4 ze stejně drahého kusu křemíku třeba 50x GPU na kartu za 1200 dolarů kus (a zákazníci=hráči držkují, že je to předražené), nebo z toho samého kusu křemíku nasekat 25x GPU na HPC „karty“ za 40 000 dolarů (a zákazníci vás uhání, že chtějí další), volba je celkem snadná. Tím spíše, že ten zájem o AI HPC produkty v tuto chvílí překonává prostě nabídku a už stávající objednávky bude NVIDIA vyřizovat hodně dlouho.
AMD je na tom podobně. Poptávka po jeho Mi300 trhla všechna očekává a plány. AMD je nadšené, protože za normálních okolností by zájem o jeho výpočetní HPC řešení rostl pomalu proti NVIDIA, kdy ta má výhodu SW platformy a nechuti firem a vývojářů učit se něco jiného než CUDA. AI je však tak velké lákadlo, že firmy i vývojáři jsou ochotni s AMD pracovat a obejít se bez CUDA. Zájem je tak velký, že firma musela změnit interní plány. Produkce HPC GPU řešení Instinct dostala stejnou prioritu, jako výroba EPYC procesorů. I v tomto případě to také postihne produkci herních GPU Radeon, které jsou, speciálně ty velké, nejméně finančně výnosné pro AMD ze všeho, co vyrábí. Zabírají hodně místa, a hlavně v případě čipletových řešení RX 7900 série, také ty cenné výrobní kapacity na pouzdřících linkách. AMD tak změnilo plány, pokud jde o nadcházející RDNA 4 generaci, která bude podle nejnovějších spekulací upozaděna, a naopak firma začíná veřejně mluvit o urychlení Mi400, které se tak bude snažit představit už ke konci příštího roku. Už Mi300 řešení je přitom extrém, kdy jako čiplet tvořený několika „GCD“ a paměťovými HBM3 čipy, má přes 1000mm2 křemíku! Není se tak co divit, že také AMD bude muset omezit produkci některých jiných svých řešení.
- Herní GPU jsou odsunuty na vedlejší kolej?
NVIDIA už svými kroky jasně dala najevo, že výrobu herních GPU minimalizuje jakkoliv, pokud bude kvůli AI produktům muset. Stále má sice v plánu RTX 5000 generaci, ale za současné situace už dávají smysl zprávy, že firma odložila vydání novinek až nejméně do roku 2025 a současně zrušila plány s vydáním vylepšených RTX 4000 karet včetně RTX 4090 Ti a „SUPER“ série. Jinými slovy se pohodlně usaďte současné RTX 4000 karty se současným výkonem a hlavně cenami, zde zůstanou velmi, velmi dlouho. A jejich ceny klidně mohou i růst. Nějakých RTX 5000 novinek se evidentně dočkáme nejdříve tak za 2 roky! A to jen pokud to AI mánie dovolí …
Situace u AMD je komplikovanější. AMD totiž nemůže, na rozdíl od NVIDIA, hodit herní GPU přes palubu stejným stylem. Jednak kvůli SONY a Microsoft a jejich konzolím, a pak AMD je hlavně v jiné pozici než NV. AMD je výrobce komplexní PC platformy, takže Radeon grafiky ke svým RYZEN procesorům a platformách prostě potřebuje mít. A musí mít. Pravda, nemusí být nutně ve všech segmentech. Každopádně žádné zastavení nebo výrazné omezování výroby Radeon RDNA 3 nehrozí. Bohužel, plány se změnily, pokud jde o RDNA 4, které sice dorazí, ale ne v podobě, jaké mělo. A důvodem není jen nastalá situaci kolem AI HPC produktů Mi300/400.
Jak a co se kolem Radeon RX 8000 změní? Na to se podíváme v dalším článku. Bohužel příznivce výkonných herních GPU vůbec nepotěším.
AUTOR: Jan "DD" Stach |
---|
Radši dělám věci pomaleji a pořádně, než rychle a špatně. |
|