Konečně nějaká novinka ze světa GPU. NVIDIA oficiálně zve na představení nové architektury.
NVIDIA se tedy konečně rozhoupala a rozhodla, že uspořádá letošní GTC 2020 alespoň online. A zve tedy na svou prezentaci. Ta se uskuteční 14.5.2020, bude vysílána na Youtube kanálu společnosti a šéf firmy na ní představí zbrusu novou výpočetní architekturu a generaci GPU. Zatím oficiálně nebyl prozrazen název, ale v pozvánce se jasně píše, „Get Amped“, takže dlouho propíraný název AMPERE je velmi pravděpodobný.
V každém případě, pokud čekáte novou generaci herních GPU a nástupce RTX 2000 série, tak tohle není ono. S pravděpodobností blížící se jistotě, je AMPERE (asi tedy s označením A100) nástupce VOLTA (V100), tedy směřuje do profesionální a výpočetní oblasti. Ano, existuje Titan V jako grafická karta, ale vzhledem k ceně to normální herní grafika určitě není :). Sama NVIDIA zve v pozvánce na přestavení nové platformy pro AI, Deep Learning, robotiku a profesionální grafiku, takže přesně zaměření VOLTA a jejího nástupce. O hrách tam není ani slovo, takže nové herní grafiky nečekejte.
Navíc VOLTA V100 je na trhu už velmi velmi dlouho, představena v první verzi byla už na GTC v květnu 2017(!), tedy před dlouhými 3 lety. Je to stále jediné GPU od NVIDIA, které používá HBM paměti a tedy interposer atd. Existuje jen jediný čip (prodávaný v různých variantách) GV100, který na speciální verzi 12nm TSMC výroby speciálně optimalizované pro potřeby NVIDIA, má velikost ohromných 815mm2. Disponuje 5120 CUDA jednotkami, 640 Tensor jádry a až 4096-bit sběrnicí a 32GB HBM2. Nejlevnější varianta dostupná v podobě grafické karty TITAN V 12GB stojí 2999 dolarů, Quadro verze s 32GB je za 9000 dolarů a výpočetní varianty jsou klidně ještě dražší.
Otázkou tedy je, co NVIDIA dělala poslední 3 roky a co tedy za tuhle dobu vymyslela pro nástupce. Nějaké úniky už byly. A informovali jsme o nich. Některé naznačují, že nová generace bude až 2x výpočetně výkonnější, což zase vzhledem k dlouhým 3 letům odstupu, by nebylo až tak omračující. Přeci jen není to 100% výkonu za 1 rok, ale za 3 roky a navíc musíme brát, že NVIDIA měla maximální klid a prostor na práci, miliardy dolarů na vývoj, takže to snad bude stát za to. Stále není jasné, jaký výrobní proces bude používat, ve hře je 10/8nm SAMSUNG, ale v tuto chvíli je asi pravděpodobnější 7nm EUV od TSMC. Samozřejmě NVIDIA bude muset nabídnout na těchto drahých a pokročilých procesech podobně velké jádro, jako je dnes 12nm VOLTA, aby vůbec nějaký nárůst výkonu, daný i nutným nárůstem počtu jednotek, mohl být. Současně má dnes možnost použít lepší a rychlejší HBM paměti nové generace (HBM2E) s 2x větší propustností a kapacitou, což udělá také hodně. Ať to bude cokoliv, bude to určitě hodně rychlé a extrémně drahé výpočetní GPU řešení, tedy nástupce VOLTA se vším všudy. Ale nic pro běžné hráče. NVIDIA i AMD zcela zjevně oddělily GPU řešení pro výpočetní sféru a hráče a očekávejte, že rozdíl mezi těmito GPU řešeními poroste.
- Co očekávat od nové generace NVIDIA HPC GPU?
Osobně neočekáváme zásadní odklon od současné konstrukce a zaměření. Překvapilo by mě jedině snad, kdyby NV ohlásila novinku jako MCM produkt. Tedy multičip, na kterém pracuje, ale u téhle generace bych ho ještě neočekával. Kromě výrazného posunu v klasickém GPU výkonu (klidně na dvojnásobek), očekávám ještě výraznější posun v oblasti výkonu pro RayTracing (několikanásobek) a AI. A klíčová je také propustnost a rychlost a kapacita pamětí. Zde počítám, že NV využije nejnovější HBM2E technologii, takže v této oblasti bude 2x lepší než HBM u VOLTA.
Co je zajímavé, že NVIDIA bude mít (na rozdíl od současnosti) v této generaci HPC GPU konkurenci, která už dokonce uspěla v několika posledních oznámených projektech nejvýkonnějších superpočítačů světa. AMD dokázala svou stále ještě neoznámenou výpočetní novou CDNA GPU architekturu a karty prosadit do několika zásadních projektů superpočítačů, což bylo velkým překvapením pro všechny, že NVIDIA se do žádného z nových projektů se svým řešením nedostala. Několik z nově budovaných nejvýkonnějších počítačů světa staví výhradně na neoznámených nových generacích AMD CPU a GPU. Tady hraje pravděpodobně zásadní úlohu fakt, že AMD to celé nabízí jako celek, tedy jednotnými sběrnicemi a funkčně propojené CPU a GPU HPC řešení, což NVIDIA samozřejmě nemá. Disponuje jen GPU, nemá CPU ani komplexní platformu jako má AMD a jakou buduje dnes i Intel. A to se stává hlavním problémem, který NV musí řešit, protože už nelze oddělovat CPU od GPU v HPC oblasti, ale musíte to stavět jako celek. NVIDIA se tedy bez spolupráce s Intelem či AMD zdá se neobjede.
U AMPERE jsem tedy docela zvědav, jak to bude, protože NVIDIA musí odpovědět, že AMD propojuje CPU i GPU jako celý systém jednou superrychlou sběrnicí a funguje to jako celek. A to se u nových systémů ukazuje jako klíčové. A fakt že NVIDIA neuspěla, co by dodavatel hned u několika projektů nejvýkonnějších superpočítačů v poslední době, překvapil hodně analytiků. Speciálně když v těchto projektech určitě nabízela svou zatím neoznámenou novinku a nástupce VOLTA. NVIDIA se ale stále může opírat o svou velmi rozšířenou a uzavřenou CUDA platformu, a tedy menší výpočetní systémy a pracovní stanice, kde pro uživatele CUDA není snadné z této platformy vycouvat a změnit dodavatele HW a celý SW k tomu, takže NVIDIA má odbyt nových karet jistý a tam se nejspíše bude s novinkou soustředit.
Samozřejmě vás o všech novinkách budeme informovat.
AUTOR: Jan "DD" Stach |
---|
Radši dělám věci pomaleji a pořádně, než rychle a špatně. |
|