Největší GPU všech dob a hranice současných technologií. A spousta novinek s ním už letos.
Na GTC NVIDIA představila to, co se čekalo … novou generaci svých GPU, kterou je VOLTA. U té došlo k výraznému přepracování a posílení vlastních výpočetních jednotek (tvorbě nového typu), která dokáží nově více operací (v některých ohledech a případech použití jsou až 2-3x výkonnější). A v souladu s očekáváním ukázala také první reálný produkt, nástupce čistě výpočetní TESLA P100 … a je to opravdu něco!
- Největší GPU světa … VOLTA V100
Mysleli jste si, že 500-600mm2 velikost GPU, což je velikost dnešních VEGA 20 a TESLA P100 je hodně a maximum možností? Není. NVIDIA se rozhodla plácnout se přes kapsu, vykašlat se na to, co je finančně rozumné a udělat GPU tak velké, jak jen je to vůbec technicky možné. Výsledkem je VOLTA V100, vyráběné 12nm TSMC s plochou ohromných 815mm2, na které je 21,1 miliard tranzistorů! Šéf NVIDIA tvrdí, že větší monolitický čp a s více tranzistory už prostě nejde vyrobit, aby vůbec fungoval a tohle je prý současné maximum litografické technologie. Jádro má i část jednotek deaktivovaných, protože počet plně funkčních kusů tohoto GPU se nejspíše počítá na jednotky.
Proti 610mm velkému TESLA P100 je tak o 34% větší, má o 43% více výpočetních jednotek (5120 vs 3584) a to celé má o 42% vyšší výkon s 15TFLOPS vs 10,6TFLOPS (FP32). Co zůstalo je 16GB HBM2 (což potvrzuje mou domněnku že u high endu už místo GDDR6 budou HBM), ale mají propustnost ne „jen“ 720GB/s, ale 900GB/s. Mimochodem ve skutečnosti má V100 plných 5376 jednotek, ale aktivních je „jen“ 5120. Počet tranzistorů pak stoupl z 15,3 na 21,1 miliardy (38% nárůst), což znamená, že počet tranzistorů na 1mm proti současným NVIDIA PASCAL GPU na 16nm proti 12nm příliš nenarostl a AMD má v tomto ohledu výrazný náskok. Nicméně chápeme, že by to nejspíše s více tranzistory už nejspíše nefungovalo. TDP celé věci má být přes 300W.
Šéf NVIDIA také prozradil cenu a nabídl prezentované GPU k prodeji. Za kolik? Pouhé 3 miliardy dolarů! Tolik zatím stál celý vývoj a je to prý nejdražší a nejsložitější projekt, který NV kdy udělala. Než se zeptáte, ano, technicky je možné toto GPU použít pro klasickou herní GTX grafickou kartu, ale obávám se, že reálné výrobní náklady a náročnost tohoto GPU je úplně mimo současná měřítka a to i TOP high endu. Neumím si představit, že se V100 objeví na běžné GTX grafice, její cena by šla minimálně do několika statisíců korun. Celé řešení je jednoznačně určeno a postaveno pro HPC, speciálně pro systémy AI, deeplearning apod. A NVIDIA rovnou představila i produkty, které budou dostupné už v Q3 tento rok!
- NVIDIA DGX-1 (8x TESLA V100)
Serverové HPC řešení, rack s 8 TESLA V100 s celkem 960 Tensor TFLOPS je první z možností. Výkon? To co spočítá TITAN X grafika za 8 dní, tohle dokáže za 8 hodin! NVIDIA říká, že je to 400 serverů v jednom.
Objednávat můžete už nyní za 149 tisíc dolarů (3,65 milionu korun bez DPH) s dodáním prý v Q3 tento rok!
Tak tohle je hodně zajímavé! Osobní HPC na stůl s vodním chlazením. Obsahuje Intel platformu X99/299 a k tomu 4x TESLA V100 16GB se 480 Tensor.
Má to 1500W spotřebu, ale je to velmi tiché a prý to chce a má každý inženýr v NV na stole :). A můžete to mít také za pouhých 69 tisíc dolarů, tedy 1,69 milionu korun (bez DPH). NVIDIA chystá i další řešení.
- NVIDIA našla zlatý důl a posouvá hranice!?
Z celé prezentace bylo rozhodně cítit, že NVIDIA se v AI a datacentrech našla (a to můžeme říci i z ohledem na finanční výsledky divize). VOLTA je velmi přímočaře zaměřena, kdy některé aplikace a použití ovšem dokáže urychlit a zefektivnit mnohonásobně, takže NVIDIA udělá nejspíše velkou díru do světa se svým řešením, které urychlí výrazně mnohé věci, ušetří spoustu energie, místa i peněz a může se těšit na miliardy dolarů (ohlášena spolupráce s TOYOTA v automobilovém průmyslu!). NVIDIA samozřejmě nebude zanedbávat i další segmenty, ale vývoj výpočetních řešení pro AI a deeplearning je naprostá priorita. Z prezentace však bylo také jasně znát, že NVIDIA má více peněz, než kdykoliv v historii a může si tak dovolit věci, kterými by se dříve vůbec nezabývala, protože by prostě nebyly finančně efektivní (jako výroba 800mm2 velkého GPU). Proč to říkám, konkurence to bude mít samozřejmě velmi těžké, ale docela chápeme, proč se Intel tak výrazně obrací do této oblasti. Nicméně jediným, kdo je dnes schopen konkurovat NV na poli samotných GPU je AMD. Bohužel zatímco NV si může dovolit utratit 3 miliardy dolarů na tvorbu TESLA V100, AMD má zlomeček částky na vývoj své VEGA/NAVI generace, která je ovšem v mnoha směrech podobně zaměřena. AMD také není úplně bez šance, ale to se bavíme jen a čistě o fyzických produktech samotných.
TESLA V100 s 15TFLOPS vypadá velmi impozantně. 815mm2 a 21,1 miliardy tranzistorů je ale vážně hodně, ale sluší se připomenout, že nová 14nm VEGA 20 má při velikosti kolem 550mm2 nemalých 12,5TFLOPS! NVIDIA je tak o 48% větší, mnohonásobně výrobně náročnější a dražší a jen o 20% výkonnější. Nicméně NVIDIA má kolem svých produktů postavené komplexní řešení, podporu a zajištěný dobyt. AMD sice dokáže postavit levněji zajímavější hardware a mnohem menším rozpočtem, ale jeho prosazení na trhu bude problém, tím spíše, když nechala NVIDIA v posledním roce vydělat stamiliony či spíše miliardy dolarů nad plán. Je na místě se opravdu obávat o konkurenční prostředí, protože NVIDIA představila hotová zajímavé a velmi unikátní věci, které prostě budou vydělávat miliony a bude dál utíkat AMD pokud jde o finanční možnosti a věci s tím související.
Nicméně má to i dobrou stránku, alespoň v současnosti. Obrovský nárůst výkonu, specializačního nasazení, efektivity díky novým NVIDIA produktům bude znát v mnoha oblastech i věcech, které používáme (tedy CLOUD služby, AI asistenti, databáze, Youtube, apod.). NVIDIA má rozhodně v těchto věcech velký náskok. A to ani ne tak díky GPU samotným, jako dlouhodobě budované strategii a ekosystému kolem CUDA, což AMD prostě nemá. A to i proto, že prostě v posledních letech řešila problémy s vlastní existencí, vedení se měnila, strategická rozhodnutí také a prostě AMD není v pozici, aby mohla dělat vše, co dělá NV ve stejném měřítku. Bude extrémně těžké NVIDIA dohnat, protože ta rozhodně nezpomaluje, má stabilní vedení, strategii a to je klíčové. O finanční stránce radši ani nemluvíme. Výhodou AMD je nicméně fakt, že má jak ona GPU, tak CPU, tedy kompletní platformu, což nikdo jiný nemá – dosud toho ale nedokázal firma výrazně využít. Postavení podobného ekosystému kolem, včetně SW aplikací a vývoje, podobný jako má NVIDA se vším kolem CUDA, je práce na mnoho let za miliardy a miliardy dolarů a s desítkami tisíc lidí, kteří jsou ovšem vytíženi spoluprací s NVIDIA.
Někteří začnou zase vykřikovat něco o mé údajné zaujatosti pro AMD a proti NV. Nicméně to opravdu není nic proti NV. Osobně jsem velmi nadšen (tedy mám i jisté obavy o nás vzhledem k tomu, jak rychle postupuje vývoj AI a učení AI) tím, co NVIDIA předvádí na poli produktů i vývoje. Jen bych rád, kdyby se někteří v NVIDIA začali chovat rozumněji a objektivněji. Osobně mám prostě jen obavu o trh jako celek, tedy o to, co tohle znamená pro nás zákazníky, protože nemít výběr na trhu je prostě problém i když chápu, proč to lidé v jedné společnosti tak nevidí. NVIDIA za to také rozhodně nijak nemůže. Takže to opravdu není výpad proti ní. Jen povzdech nad tím, že jediná konkurence je ve zcela jiné pozici a nedokáže výrazněji uspět ani tam, kde má o něco lepší nabídku, což prostě už v některých segmentech trhu je znát na cenách i přístupu …
Každopádně jsem nadšen technologiemi NVIDIA i produkty, jen bych prostě rád, aby tady byla nějaká větší konkurence. Na druhou stranu chci říci i, že na rozdíl od jiné oblasti PC trhu, kde díky absenci konkurence se podmínky pro nás výrazně zhoršily a jediný výrobce téměř zastavil vývoj a nové generace produktů přinášely jednotky % za vyšší cenu, NVIDIA rozhodně nezpomaluje a nárůst výkonu atd. jsou parádní :). Myslím, že můžeme v klidu očekávat, že výkon 12nm GTX 2070/2080/2080Ti pro Q1 2018 bude někde kolem 30% při stejné spotřebě ve srovnání se současnými produkty.
AUTOR: Jan "DD" Stach |
---|
Radši dělám věci pomaleji a pořádně, než rychle a špatně. |
|