Na hranici možností monolitického designu, posune NVIDIA věci s 5nm GH100.
Budoucnost GPU jsou čiplety, tedy MCM, nebo-li vícečipový design. Na tom se zcela bez výhrad shodují AMD, Intel i NVIDIA a všichni pracují na těchto řešeních. Zkrátka není možné hnát velikost jednotlivých čipů do stále větších rozměrů ve snaze zvýšit výkon. Intel na to dnes doplácí u procesorů, kdy není schopen ničím konkurovat se svými klasickými monolity čipletovým řešením AMD EPYC a ThreadRipper. AMD má na trhu dokonce už i první čipletové GPU v podobě výpočetního Instinc Mi200, postaveném na 6nm CDNA 2 architektuře, které má výrazně vyšší výkon než stávající monolitické NVIDIA GA100 řešení:
Očekávalo se tedy, že NVIDIA s novou generací již 5nm HOPPER, odpoví vlastním čipletovým alias MCM designem. Ostatně NV se nijak netají, že takové řešení připravuje. Z aktuálních informací, protože HOPPER alias GH100 se má představit už letos, ovšem uniká, že NVIDIA se ale do MCM vyloženě nežene a jde na to pomalu. Což je ale celkem logické vzhledem k tomu, jaký náskok v této oblasti má AMD a jak moc let pracovalo na čipletech samo, kdy NV začala výrazně později.
Nový NVIDIA GH100 čip nebude sám o sobě čipletem (MCM) jako konkurenční AMD CDNA 2, ale čip bude stále monolit. Ovšem opravdu obří monolit. Podle dvou spolehlivých leakerů má nový GA100 čip plochu bezmála 1000mm2 (velkou část zabírá cache)! A žene tedy možnosti monolitických čipů na absolutní limit. Pravda, pomáhá tomu fakt, že NVIDIA asi bude upřednostňovat počet výpočetních jednotek a hlavně velikost cache, před vysokými takty tohoto výpočetního „GPU“, ale stejně. Téměř 1000mm2 plochy křemíku na pravděpodobně 5nm TSMC výrobě, to je dost maso. Výtěžnost asi nebude velká a cena bude astronomická.
Asi nepřekvapí, že se očekává velmi vysoká spotřeba podobného řešení. Zákulisní zdroje mluví o TDP atakující 1000W(!) v případě GH100, kdy tedy bude vyžadovat pravděpodobně vodní chlazení apod. Takové už ale NVIDIA nabízí v rámci speciálních systémů i u stávající generace AMPERE. A vysoká spotřeba u nových HPC produktů není nic nového. Ostatně aktuální čipletový (6nm) AMD Instinct Mi250X má při až 5x vyšším výkonu než stávající 400W NVIDIA A100 řešení, rovnou 560W spotřebu. Pravda, hodně dělají paměti, kdy NVIDIA A100 má „jen“ maximálně 80GB HBM2e, zatímco AMD Mi250X má rovnou 128GB HBM2e. Očekává se, že NVIDIA GH100 bude mít minimálně 128GB, spíše více a tomu bude také část spotřeby odpovídat.
NVIDIA pravděpodobně nebude mít šanci konkurovat čipletovým AMD CDNA (speciálně letos chystanému 5nm CDNA 3) efektivitou, kdy to je jedna z hlavních výhod čipletů, tedy spojení menších čipů. Nejen provozní, ale hlavně výrobní efektivita, kdy výtěžnost zhruba 500mm2 proti 1000m2 čipů, nebude ani ve stejné galaxii. AMD má ale také nyní mnohem větší zkušenosti s čipletovou konstrukcí, NVIDIA s ní teprve začíná. Jinak se očekává, že NVIDIA odhalí HOPPER (GH100) již za několik týdnů na GTX 2022 v březnu, i proto začínají unikat nějaké podrobnosti. Neočekává se, že by GH100 dorazilo do klasického herního desktopu, podobně jako GA100 se nikdy neobjevila jako klasická RTX grafika.
NVIDIA potřebuje s 5nm GH100 HOPPER odpovědět na nový 6nm Instinct Mi200x (CNDA 2), ovšem konkurovat bude muset hlavně již 5nm Instinc Mi300x (CDNA3), který AMD odhalí koncem roku a ještě bude zcela novou generací s rozšířením čipletového designu. Očekává se tedy, že NVIDIA se bez nějaké formy MCM nebo MultiGPU řešení, jednoduše neobjede u HOPPER, protože bez toho nemá ani s 1000mm2 5nm GPU šanci konkurovat druhé generaci čipletů 5nm CDNA 3 od AMD … a to své chce říci na tomto poli také Intel. Brzy.
Hlavním problémem pro NVIDIA pak bude především fakt, že AMD a Intel mají kompletní HPC platformy, tedy včetně propojených architektur CPU, desek, sběrnic, řadičů a vůbec kompletních systémů a architektur propojených a postavených jako jeden funkční celek (nejdále je v tomhle AMD). Něco takového NV nedokáže bez vlastní platformy a CPU nabídnout a díky tomu prohrává řadu zakázek o stavby superpočítačů v posledních letech. A pokud ke GH100 nenabídne vlastní sofistikovanou platformu, bude mít stále větší potíže. Speciálně když všichni ví, co dnes na tomto poli už má (a chystá) AMD a také Intel, kdy se pomalu ale jistě blížíme do bodu, kdy osadit do specializovaných HPC platforem AMD a Intelu jiné GPU řešení než to od AMD a Intel, nebude technicky ani trochu vhodné, nebo dokonce možné …
AUTOR: Jan "DD" Stach |
---|
Radši dělám věci pomaleji a pořádně, než rychle a špatně. |
|