Nová generace výpočetních produktů AMD a NVIDIA je na trhu a z hlediska výkonu je to jasné?
NVIDIA měla zhruba 5-6 měsíců časové výhody, kdy začala dodávat svou aktuální H100 generaci výkonného HPC GPU řešení zákazníkům. Soudobá konkurence od AMD vyráží k zákazníkům teprve v těchto týdnech, ale pro mnohé stálo za to si počkat. Mi300X je technologicky i výkonově úplně někde jinde. AMD těží z technologického náskoku na poli čipletů a jeho novinka je absolutní výkonový král výpočetních GPU a speciálně pro AI nasazení.
Generačně jde také o obrovský posun. Jak víte, tak Mi300 je postavená na výpočetní GPU architektuře CDNA 3, zatímco starší Mi200 používá CDNA 2. Ve srovnání nejvýkonnější Mi250X variantou má nové Mi300X téměř 3x více tranzistorů a násobně vyšší výkon v různých operacích. AMD se soustředilo speciální na „tensor“ oblast výkonu, kde je nárůst výkonu ve stovkách %.
Technologicky je Mi300X nejpokročilejší řešení svého druhu na světě. I NVIDIA H100 vedle toho vypadá poněkud zaostale, zejména výrobní konstrukcí a efektivitou. AMD zde využívá plné výhody čipletů, tedy Mi300X na rozdíl od konkurenční H100 není monolit. Výrobní i provozní efektivita bude mnohem lepší. Tvoří jej mnoho samostatných čipů vyráběných 5nm i 6nm, „poslepované“ na jediný čiplet. Najdeme zde výpočetní xCD s celkem 304 CU tedy 19 456 FP32 jednotek, to doplňují Infinity Cache a HBM 3 čipy, včetně vrstvených řešení. TOP verze disponuje tedy 192GB HBM3 pamětí více jak 5,3TB/s propustností.
V tradičních aplikacích a úlohách Mi300X naprosto deklasuje NVIDIA a její H100 řešení, v AI úlohách i násobně. Samozřejmě tahle výkonová srovnání je poněkud obtížné udělat, protože moc vyloženě nezávislých jednotných benchmarky s jasnými pravidly pro HPC úplně není, a samozřejmě existují aplikace na míru napsané pro daný HW, které mohou věci zkreslovat. Takže NV po několika dnech tápání přišla s vlastními benchmarky, kde dokázala alespoň někde Mi300X v pohodě konkurovat. Nicméně v drtivé většině operací a úloh poměrně výrazně zaostává, takže NV už oznámila H200 pro příští rok, což jsou fakticky dvě H100 vedle sebe.
Není pochyb o tom, že v řadě věcí má nyní AMD výrazně lepší a silnější a hlavně efektivnější řešení. Jednou z výhod AMD je i komplexní platforma, kdy zákazníkům může vedle Mi300 série produktů nabídnout také odpovídající serverovou a síťovou platformu s procesory EPYC a XILINX řešeními. Na tomto poli nemůže NVIDIA dnes AMD plně konkurovat, její ARM čipy jsou samozřejmě omezenější z hlediska univerzality a použití. Nicméně o nedostatek zákazníků se rozhodně nemusí bát ani jedna z firem, ačkoliv lze očekávat, že také některá výkonnější AMD řešení dostanou zákaz prodeje na některých trzích. Zejména Čínském, stejně jako to platí pro NVIDIA. Ovšem zákazníků je hromada i na jiných trzích a obě firmy spíše řešení velikost produkce. I zde má AMD mírnou výhodu, kdy jeho čipletová řešení a spojení menších čipů je mnohem efektivnější než NVIDIA a její větší monolity. Na druhou stranu obě firmy se potýkají se stejným omezením, kterým v současné době není ani tak kapacita výroby samotných čipů, jako kapacita linek pro tzv. pouzdření. To je dnes hlavní potíž.
Jinak AMD vedle Mi300X nabízí také zajímavé Mi300A, které má sice méně výpočetních CDNA 3 jednotek, za to nese hned 3 procesorové čipy s celkem 24 jádry ZEN 4! Vše v jednom řešení, tedy velmi zajímavé pro určité typy operací a aplikací.
Není tak divu, že AMD očekává velký zájem a svůj růst v oblasti HPC. Prakticky všichni, kteří v oblasti HPC něco znamenají, také již testují a mají produkty založené na nejnovějších AMD Instinct a EPYC řešení, což je rozhodně velký posun proti ještě nedávné minulosti. Ale vzhledem k tomu, že AMD dnes má objektivně v mnoha směrech nejvýkonnější a nejefektivnější HW, speciálně v HPC oblastech, a na jeho základech jsou postavené nejvýkonnější superpočítače na světě, včetně toho vůbec nejvýkonnějšího, nikdo už si dnes nemůže dovolit AMD ignorovat jako kdysi. Otázkou je, zda to AMD zvládne kapacitně, kdy se o kapacity u TSMC dnes dělí s NVIDIA, Apple, Intelem atd., což samozřejmě omezuje jeho celkové možnosti růstu. A bojíme se také jistých omezení výroby některých tradičních CPU či herních GPU, ke kterým přistoupila NVIDIA. AMD ale zdá se zatím má velký zájem ve všech oblastech a nechce žádnou opouštět nebo omezovat. A jakkoliv nejsou Mi300 apod. produkty určené pro nás, budou hrát velkou roli v mnoha věcech, které používáme, protože pohání AI, Cloud služby a vzdálený výkon apod. Současně za ně firmy neváhají utrácet násobně více, než za běžné CPU nebo GPU, takže pro AMD, NVIDIA i Intel apod. jde o zdaleka nejlukrativnější, a tudíž nejzajímavější segment produktů, kde poptávka také setrvale roste a není divu, že se na něj všichni soustředí.
Vývoj SKYNETU a AI schopných prakticky čehokoliv je tedy v plném plánu a ano, AI bude využívána i pro vývoj a design následujících generací CPU, GPU a dalších čipů. Není pochyb o tom, že už probíhá nová a jedna z největších technických a průmyslových generací v historii lidstva.
AUTOR: Jan "DD" Stach |
---|
Radši dělám věci pomaleji a pořádně, než rychle a špatně. |
|