NVIDIA AMPERE – nová generace GPU zatím trochu zaostává za očekáváním? Co herní verze? Tisk E-mail
Napsal Jan "DD" Stach   
Neděle, 17 květen 2020
Přejít na obsah
NVIDIA AMPERE – nová generace GPU zatím trochu zaostává za očekáváním? Co herní verze?
Jaké budou herní 7nm grafiky NVIDIA AMPERE
alt

 

 

 

 

  • NVIDIA AMPERE – nová generace GPU

                          zatím trochu zaostává za očekáváním? Co herní verze?

Přesně 3 roky od nástupu 12nm VOLTA V100, přichází nová generace v podobě 7nm AMPERE A100. A zatím není ve všech ohledech zdaleka takovým pokrokem, jak se od nové generace po 3 letech čekalo. Jedno pozitivní překvapení doplňuje několik méně pozitivních. Je ovšem nutné zdůraznit, že herní verze AMPERE (kdy NVIDIA už oficiálně potvrdila, že architektura bude tentokrát stejná pro TESLA i GTX/RTX karty), budou přeci jen trochu jinak řešené. A100 řešení je speciálně orientované pro AI výpočty a strojové učení. Tam NVIDIA směřovala vylepšení a nárůsty výkonu (kdy mluví o násobcích, zatímco klasický výkon GPU se ve skutečnosti posunul jen o 24%). To ovšem neznamená, že by GA100 nebylo možné použít na normální grafickou kartu. Je to stále vlastně „normální“ GPU.

  • GA100 – první generace 7nm GPU od NVIDIA

NVIDIA se dlouho vyjadřovala proti 7nm výrobě. Speciálně proti 7nm od TSMC. Proč a jaké to mělo následky, jsme se nedávno dozvěděli:

Společnost totiž ani nepočítala s TSMC, co by primárním partnerem pro výrobu nové generace GPU. Nezajistila si včas ani potřebné výrobní kapacity. Myslela si, že SAMSUNG přesvědčí ke spolupráci, a hlavně lepším cenám. Jenže to se nestalo a tlak na TSMC také nevyšel. NVIDIA tak 7nm GPU uvádí na trh až teď v polovině roku 2020, kdy AMD s TSMC začaly vyrábět 7nm GPU téměř před 2 lety, v druhé polovině roku 2018. NVIDIA jednoduše nemá zdaleka tak velké zkušenosti se 7nm výrobou, a stále jí vadí i vysoká cena výroba proti její optimalizované 12nm TSMC výrobě. Obojí se projevilo u první AMPERE a bude téměř určitě projevovat i nadále.

GA100 čip není takový, jaký se očekával. Začněme tím pozitivnějším. Je překvapivě mnohem větší. Většina zdrojů počítala sice s velkými rozměry nad 600mm2, ale nikdo neuváděl, že by bylo větší, než 12nm obří VOLTA (815mm2). Jenže je, a má tedy rekordních 826mm2, což jsme na 7nm ještě neviděli. Ukazuje to, že možnosti 7nm výroby TSMC už první generace, jsou opravdu mnohem dál, než jsme si mysleli. Mimochodem, to že jde o první generace 7nm výroby a nikoliv tu EUV, je také překvapení.

Největší 7nm GPU, které na trhu dosud bylo na trhu, a které je ale technicky už právě 2 roky staré, je AMD VEGA 20 (Radeon VII a Instinct série) s „pouhými“ 331mm2. AMD přitom pro Microsoft Xbox X vyrobila už více než 400mm2 velké SoC (8jádrový ZEN2 + NAVI 2), ale tohle zatím není na trhu a určitě nebude zdaleka tak drahé. Překvapivě, NVIDIA zvolila starší verzi 7nm výroby (nikoliv tedy novější 7nm EUV) a její čip je tedy 2,5x větší než dosud největší 7nm grafické jádro na trhu, 2 roky stará VEGA 20, současně má vyšší hustotu tranzistorů a to 65 milionů na 1mm2 proti 40milionům, To ovšem vytvořilo několik zjevných praktických problémů.

NVIDIA zvolila starší verzi 7nm výroby kvůli ceně. 7nm EUV je totiž ještě výrazně dražší a výtěžnost takto velkého čipu bude v každém případě tragická. Bavíme se o několika málo čipech na 1 waffer, který stojí dnes mnoho tisíc dolarů, což bude znamenat astronomickou cenu výsledných čipů. GA100 bylo představeno na špičkové A100 „kartě“ s aktivními 6912 jednotkami a 5120-bit sběrnicí. A tady máme první méně pozitivní aspekt novinky. Čip má ve skutečnosti v sobě 8192 jednotek a 6144-bit sběrnici. Takže u A100 verze je osmina čipu deaktivovaná, což je nezvykle mnoho, speciálně u TOP verze produktu (už jen dle označení A100). Důvodem je zkrátka výtěžnost. Nutno říci, že těch 8192 jednotek u GA100 se očekávalo, a tady tak byly už velmi staré úniky správné. A existuje testovací plně aktivní verze, ovšem jednoduše uvést ji teď na trh, kvůli výtěžnosti není možné.

12nm VOLTA V100 má jen 5120 jednotek a 4096-bit sběrnici, ale i tak dosahuje výkonu 15,7TFLOPS. Očekávalo se, že vzhledem k tříletému odstupu a 7nm výrobě, nová AMPERE bude v klasickém výkonu alespoň 2x lepší. Jenže zdaleka není. A100 v představené verzi opravdu hodně zaostalo za očekáváním, kdy s 6912 jednotkami má nakonec „jen“ 19,5 TFLOPS výkonu. To je sice nárůst, a velmi vysoký výkon, ale jen o 24%, což je jeden z nejmenších mezigeneračních nárůstů. Speciálně když si uvědomíme ty 3 dlouhé roky odstupu. Celé řešení má navíc velmi vysokou spotřebu a TDP je ohromných 400W proti 250-300W u předchůdce. Zde samozřejmě hraje roli fakt, že GA100 jádro má neuvěřitelných 54 miliard tranzistorů, zatímco 12nm VOLTA „jen“ 21,1 miliardy. V tomhle ohledu efektivita a technologie tedy špatná není. Ale ta hustota, která je tedy ještě vyšší než u 2 roky starého VEGA řešení, se někde musela projevit. Prostě tahle enormní hustota komplikuje fungování čipu, chlazení, napájení atd.

A100 má tak nečekaně nízké takty (což je alarmující vzhledem k tomu, že už tak má 400W TDP). Běží totiž jen 1410MHz v boostu, zatímco 12nm VOLTA měla až 1600MHz. Těch 1410MHz je opravdu hodně nízko, speciálně na finální 7nm produkt. A100 má navíc širší sběrnici a mnohem lepší paměti s celkovou propustnosti 1134GB/s. Kdyby bylo 7nm GA100 jádro plně aktivní, tedy s 8192 jednotkami na těch 1410MHz, dosahovala by karta výkonu zhruba 23,1 TFLOPS. Tedy to už by byl generačně zajímavější a standardnější 47% nárůst výkonu proti VOLTA. Jestli by to ovšem spolu s větší pamětí znamenalo brutální 500W TDP či více, to je těžké odhadovat. Je asi jasné, proč se NVIDIA moc nechlubí těmi běžnými hodnotami výkonu, a radši mluví o svém „tensor“ výkonu, které ve speciální AI případech a aplikacích může nastat, a kde je novinka opravdu násobně lepší, než VOLTA. NVIDIA ale sama přiznává, že její 370 TFLOPS v nejlepším případě v praxi nejspíše nenastane. Nicméně je jasné, proč je novinka orientována hlavně pro AI a trénování umělé inteligence. Jako klasické GPU je to sice jasně nové nejvýkonnější samostatné GPU, ale od TOP modelu nové generace AMPERE se očekávalo přeci jen více, zejména vzhledem k dlouhému 3letému odstupu a 7nm výrobě. 24% nárůst výkonu není prostě příliš zajímavý k prezentaci. A i když by evidentně GPU dokázalo nabídnout o pár desítky % více výkonu, nelze to rozumně vyrábět, ani napájet a chladit.

Co to znamená pro herní AMPERE grafiky? Zatím nelze dělat závěry …



 

Najdete nás na Facebooku

.... a také na Twitteru

RSS

DDWorld.cz

DDWorld - Blogy a videa

DDWorld - Magazín

Poslední příspěvky v diskuzích


Videa
Prusa Core One – nová uzavřená 3D tiskárna
Prusa Core One – nová uzavřená 3D tiskárnaStředa, 20 listopad 2024
Vložil: aDDmin
Kategorie: PC a IT
Spuštěno: 506x
Komentářů: 1
Star Wars Outlaws dostává Update 1.4 – zásadní herní změny!
Star Wars Outlaws dostává Update 1.4 – zásadní herní změny!Středa, 20 listopad 2024
Vložil: aDDmin
Kategorie: Počítačové hry
Spuštěno: 339x
Komentářů: 0
Jak to vypadá v uvnitř DATACENTRA?
Jak to vypadá v uvnitř DATACENTRA?Pondělí, 18 listopad 2024
Vložil: aDDmin
Kategorie: PC a IT
Spuštěno: 878x
Komentářů: 0
Vychází LEGO Horizon Adventures – další zábavná LEGO hra?
Vychází LEGO Horizon Adventures – další zábavná LEGO hra?Úterý, 12 listopad 2024
Vložil: aDDmin
Kategorie: Počítačové hry
Spuštěno: 1163x
Komentářů: 0
Indiana Jones and the Great Circle hra ala film?
Indiana Jones and the Great Circle hra ala film?Pondělí, 11 listopad 2024
Vložil: aDDmin
Kategorie: Počítačové hry
Spuštěno: 1484x
Komentářů: 0
Nový Captain America nevypadá dobře. Thunderbolts* jsou na tom lépe.
Nový Captain America nevypadá dobře. Thunderbolts* jsou na tom lépe.Pátek, 08 listopad 2024
Vložil: aDDmin
Kategorie: Film
Spuštěno: 1324x
Komentářů: 6