Jeho řešení ovšem současně má přes 500W spotřebu a vyžaduje výkonné vodní chlazení.
Na poli výkonných HPC výpočetních GPU řešení vládnou zatím NVIDIA a AMD. Zejména NVIDIA se na tomto poli angažuje poslední roky a považuje jej za naprostou prioritu. A vděčí mu také za většinu svých zisků (i když většinu příjmů stále dělají klasická GPU). To je ovšem, trnem v oku už roky společnosti Intel, která se ráda označuje za technologického leadera, ale v oblasti výpočetního výkonu a technologií jím už mnoho let jednoznačně není. Žádné supervýkonné výpočetní GPU totiž nenabízí. To se ovšem změní. Stejně jako AMD, které již má a nabízí komplexní výkonnou platformu složenou ze supervýkonných serverových procesorů EPYC a architekturou k tomu přímo navržených výpočetních Instinct MI grafik, chce i Intel svou komplexní platformou.
O nových procesorech (Sapphire Rapids) pro tuto oblast ještě bude řeč, ale hlavní novinkou v nabídce Intelu jsou pochopitelně ta velká výpočetní GPU. Ty nikdy, přes několik opakovaných pokusů, do finále dříve nedotáhl. Tentokrát už je ale dotáhne, to si buďte jistí. Ponte Vecchio je očekávaná první generace těchto řešení. Postavena je na komplexních čipletech, a jde o první čipletové řešení od Intelu, i když první svého druhu na trhu nebude. Toto prvenství si letos převezme AMD s jeho Instinct MI 200 založenou na druhé generaci CDNA architektury s dvoučipovým čipletovým MCM řešením. AMD již má Instinct MI 200 karty hotové a dodává je prvním partnerům, oficiálně jej pak uvede a představí za několik týdnů.
Ponte Vecchio od Intelu je tedy přímo konkurenční řešení, které ovšem dorazí na trh až nejdříve během příštího roku, přičemž prioritu má pro projekt superpočítače AURORA. Ten sice zdaleka nebude nejvýkonnější na světě (minimálně 2 superpočítače stavěné na AMD jej výrazně předčí), ale Intel jej slíbil už před časem a celá věc má zpoždění, takže jej musí dodělat primárně. Ponte Vecchio samotné není monolitické jedno GPU v tomto případě. Skládá z několika různých čipů na čipletu. Intel sice čiplety okopíroval důsledně od AMD, ale radši jim říká dlaždice „tiles“. Kromě samotných výpočetních GPU jader jsou tam také HBM paměti a další co-procesory. Některé čipy jsou vyráběny 10nm u Intelu, jiné 7nm u TSMC a tzv. „Compute Tile“ jsou dokonce prý již 5nm od TSMC. Na rozdíl od konkurenčních NVIDIA A100 a AMD Instinc MI je tam také grafická výbava, tedy schopnost zpracovávat grafiku jako „klasická grafická karta“. To konkurenční HPC řešení standardně nemají. Nicméně šance, že se Ponte Vecchio objeví na klasické grafické kartě, se limitně blíží nule. Zaměření celého produktu je velmi specifické, jeho výroba bude extrémně drahá. A jeho provoz a nasazení do praxe ještě dražší.
Ponte Vecchio je produkt nové generace pro příští roky, dorazí na trh až tak za rok touhle dobou, i když jej Intel nepochybně ohlásí o něco dříve. Už teď ale samozřejmě běhá v základních vzorcích. Využívá HBM2e paměti a PCIe 5.0. Má nabídnout zhruba 45TFLOPS výkonu ve FP32.
To se jeví více než konkurenceschopné proti AMD a NVIDIA. V současnosti už nějakou dobu prodávaná řešení, tedy NVIDIA A100 nabízí 19,5 TFLOPS (FP32) a 9,7 TFLOPS (FP64). AMD s Instinct MI100 (CDNA1) dává 23,1 TFLOPS (FP32) a 11,5 TFLOPS (FP64). Nicméně srovnání je samozřejmě trochu nefér, protože A100 a MI 100 jsou produkty z roku 2020, zatímco Intel Xe HPC je produkt pro rok 2022, takže je mezi nimi minimálně generační rozdíl. Mnohem zajímavější tak bude srovnání s NVIDIA H100 (5nm HOPPER) a AMD Instinct MI 200 (CNDA 2), což obojí budou také čipletová MCM řešení. Zatímco novinka od NVIDIA bude uvedena a představena také nejdříve příští rok, AMD svou novinku už dodává a brzy oficiálně představí.
Instinct MI 200 je první čipletové (MCM) GPU na světě, obsahuje kromě jiného dvojici CDNA 2 čipů. pravděpodobně má kolem 14 tisíc výpočetních jednotek a 128GB HBM2e paměti. Zatím nevíme, jakého výkonu dosahuje, ale odhady kolem 40 TFLOPS pro FP32 jsou vzhledem k parametrům určitě reálné. Řešení AMD by navíc mělo být o poznání efektivnější, než Ponte Vecchio Xe HPC od Intelu. U AMD se počítá se zhruba 300 – 400W včetně variant s pasivním chlazením. U Intelu ale současné vzorky mají přes 500W, a počítá se s nimi výhradně do systémů vybavených výkonným vodním chlazením.
Každopádně Intel to s výkonným Xe HPC myslí tedy vážně, ale pravděpodobně se tahle řešení neobjeví příští rok ve formě nějaké klasické grafické karty, co by high end. Na poli grafických karet jako takových, si Intel bude muset vystačit s o poznání slabšími a efektivnějšími Xe grafikam ARC, které chystá začít uvádět v Q1 2022.
AUTOR: Jan "DD" Stach |
---|
Radši dělám věci pomaleji a pořádně, než rychle a špatně. |
|