AMD VEGA rozhodně má zpoždění, to nebudeme zastírat a pokud nás čtete déle, tak víte, že já osobně jsem čekal uvedení VEGA prostě na konci roku 2016. A podle plánu přijít tak i měla. Nicméně zase jsme u toho, že vznikala za situace podfinancovaného AMD, kdy se obnovovala (Raja ji budoval fakticky od začátku) grafická divize a současné vedení AMD ji zdědilo a prostě už muselo dokončit. Proč? Protože jinak by dnes bylo i bez nástupce POLARIS architektury a minimálně další 1-2 roky bez výkonného GPU až do vydání NAVI (to je kompletně dítkem současného „Raja teamu“). Situaci rozhodně nepomohla maximální orientace na HBM paměti, tedy koncept, který samo AMD pomáhalo stvořit jako ovšem naprosto nutnou reakci na zcela stagnující GDDR technologii. HBM je klíčovou komponentou a nedílnou součástí minimálně současné VEGA 10 a tak AMD musí mít nejen samotné GPU ale i potřebné paměti. GPU už sice mělo do výroby plně připravené v průběhu roku 2016, ale potřebné HBM paměti měly zpoždění. Oba výrobci (HYNIX i SAMSUNG) narazily na nespecifikovaný problém ve velkovýrobě a než jej vyřešili, uplynulo dalších několik měsíců. Ve výrobě pak byly jen dražší 8GB moduly, které používá i NVIDIA ale jen v TOP produktech pro HPC segment. Ze stejného důvodu mohlo AMD představit jen výpočetní 16GB modely Instinct, či VEGA FE a další. Až na konci Q2 se podařilo nastartovat výrobu levnějších 4GB HBM2 pamětí, které lze konečně dát i na RX VEGA, tedy spotřební modely grafik.
Jenže tady „problémy“ s HBM nekončí. Tyto paměti jsou nadále velmi drahé, dražší než GDDR5X a výrazně dražší než GDDR5 stejných kapacit. Stejně tak pokročilejší konstrukce vyžadující GPU + HBM na jednom interposeru (malém PCB) je dražší než klasická konstrukce. Do toho navíc HBM je nový druh pamětí a celý koncept práce s nimi a vysoké latence vyhovuje jen určitým oblastem. Pro HCP segment, AI a některá výpočetní nasazení v serverech a datových farmách, kde VEGA umožňuje adresovat jednoduše až 512TB, je opravdu zásadním přínosem. Jenže na běžné spotřební grafice je tento potenciál většinově samozřejmě k ničemu, a zůstává tak jen vyšší náročnost na výrobu a cenu a fakt, že celá konstrukce je kompaktnější a efektivnější, to těžko vyváží.
Celá AMD VEGA má pro nás zatím podobu jediného čipu (VEGA 10), protože AMD prostě nemělo peníze na vývoj a vydání souběžně dalších (ale budou), a je jasně orientována do výpočetního segmentu – tedy přesně v souladu s novou strategií AMD, které chce podíl ze zisků v těchto oblastech s vysokými maržemi. S tím souvisí bohužel rozporuplný výkon současné RX VEGA ve hrách, které nás však primárně zajímají, jako domácí uživatele. A zde tak plně chápu rozčarování, kdy se nyní RX VEGA 64 se pohybuje výkonem pravděpodobně na úrovni GTX 1080 – možná GTX 1080 OC, která však vyšla na trh už před více než rokem a skoro stejně dlouho existuje i větší čip pro výkonnější TITAN X a hlavně GTX 1080Ti. AMD navíc stále nechce ten výkon plně odhalit, protože stále pracuje na jeho dokončení, což ale jen dokazuje, že hlavním trhem a zaměřením aktuální VEGA je profesionální a výpočetní segment. Tam je i s vyladěním a výkonem v mnohem lepší pozici i vůči konkurenční NVIDIA. Herní RX VEGA se ale trápí s mnoha věcmi. Pozitivem je, že prý nemá žádný problém s tím, že by tam bylo něco „rozbitého“! Vše souvisí s pokročilostí architektury jako takové.
VEGA NCU architektura je nástupcem úspěšné a zdaleka nejuniverzálnější GPU architektury na trhu posledních let, tedy GCN, i když mnozí kritizují tu univerzálnost, jako škodlivou, kdy i herní karty mají prvky, které by mít nemuseli, které jim zvyšují spotřebu a tak dále. Jenže řada věcí u RX VEGA buď nefunguje proto, že zkrátka současný software to neumí využít, anebo to není stále ještě optimalizováno. Výčet těch věcí je opravdu dlouhý. Takže jen stručně:
Tohle je velké téma už delší dobu. AMD přechází na nový způsob zpracování dat, který teoreticky může být až 2x výkonnější proti předchozímu způsobu u GCN a také energeticky efektivnější. Technologie je také u AMD navázána na HBM pro větší efektivitu. Jenže AMD se to nedaří vyladit s trvalým přínosem, protože to bohužel nezáleží jen na AMD. Problém je, že tato technologie nemá vždy a všude pro všechna data stejný přínos a za určitých okolností může mít u některých dat a operací i opačný efekt (tedy ztrátu výkonu). Vše záleží na konkrétním grafickém engine a konkrétní technologii, kterou pro datové zpracování přes GPU vývojář používá. A tak, zjednodušeně řečeno, AMD musí udělat vše tak, aby fungovala jen tehdy, pokud je skutečně přínosem a aby se vypínala, když by nebyla přínosem. A to se snadno řekne, hůře udělá.
AMD tak potvrzuje, že tento nový prvek vůbec není a nebyl v ovladačích pro VEGA FE aktivní a bude aktivní až pro RX VEGA. Nicméně význam a přínos bude růst až když hry a herní engine budou používat technologie z toho těžící s navýšením výkonu u některých operací od několika % do několika desítek % proti současnému způsobu. Nutno dodat, že podobnou technologii umí i NVIDIA s PASCAL, VEGA ji jen rozvíjí a podporuje v pokročilejší formě a zapracováním do celé architektury.
NCU, geometrický výkon a FP16 výpočty
Správnou poznámkou mnohých u minulé generace GPU od AMD bylo, že grafický výkon je občas nižší proti NVIDIA díky obecně nižšímu geometrickému výkonu u AMD GPU (ale AMD to naháněla jinde). AMD se tuto záležitost u VEGA jala řešit jinak. V základním zpracování polygonů je VEGA více než o polovinu výkonnější než FIJI, v dalších způsobech a oblastech je už VEGA i několikanásobně výkonnější. AMD také proto předělalo výpočetní jednotky, kdy z GCN přecházíme na NCU, které jsou efektivnější, v moha oblastech výkonnější, zvládají více instrukcí za takt a umí i další novinky. Zde by tedy měl ležet zajímavý herní výkonový nárůst proti minulé generaci. Jenže má to háček … herní engine a tedy herní vývojáři musí tyto technologie aktivně využívat! Bez toho tam ten přínos a využití architektury nebude. S tím souvisí i další zajímavá věc …
Podpora FP16 výpočtů i pro grafiku a hry! Tady leží další zajímavý výkonový potenciál, protože FP16 je rychlejší proti dnes běžně používané FP32, jejíž použití není vždy nutné. Až dosud však podporu FP16 ve hrách nenabízela ani NV ani AMD. VEGA ji umí (hlavně na žádost vývojářů). Vývojáři tak u některých prvků mohou tyto výpočty využít a také již využívají! Podpora FP16 je součástí VULKAN i DX12 API v základu a využívat FP16 budou nové hry Wolfenstein 2: New Colossus (VULKAN) a také Far Cry 5 (DirectX12), které vyjdou v dalších měsících. Mimochodem FP16 funguje i na nových konzolích (protože je tam AMD GPU) a bude využíváno i u dalších her. Vývojáři her uvádí, že pro určité věci je FP16 v praxi zhruba o 15 až 30% reálně výkonnější než se stávajícím FP32. Tohle je tak jedna z věcí, které VEGA přináší a která může znamenat zajímavý výkonový nárůst proti současným grafikám, ovšem musíme si zase počkat na hru/aplikaci, která FP16 opravdu bude používat. Nebudeme čekat dlouho, ale na recenze RX VEGA žádná hra, pokud víme, nebude, což samozřejmě bude znamenat mínus pro VEGA, která tak nemůže ukázat, co skutečně umí.
Dalo by se pokračovat dál, jednou z klíčových věcí, kterou AMD řeší, je vlastní využití HBM a vůbec přínosu celého zcela přepracovaného paměťového systému, a to, jak vůbec GPU s pamětí pracuje. Jedním z reálných přínosů už nyní v současných hrách, by měly být právě lepší „průběhy FPS“ tedy vyšší minimální FPS. Což zejména když je FPS tak akorát, tedy třeba u vyššího rozlišení a v kombinaci s FreeSync, má reálný přínos pro plynulost hraní. Další věcí je pak fakt, že VEGA je první 100% DirectX12 GPU se 100% podporou všeho, co DX12 (i VULKAN) obsahuje. Včetně technologií, které opět mohou navyšovat výrazně výkon ve hrách, tedy obecně při zpracování grafiky. Ale zase, musí je herní vývojáři u své hry ve svém herním engine podporovat, jinak z toho těžko může VEGA těžit. Je toho mnohem více, ale prostě řekněme, že VEGA má na to být opravdu masivně výkonnější než FIJI (FURY X), jenže pokud to budeme testovat tak, že použijeme hry a aplikace, které nic z toho neumí a dokonce je část nových optimalizací věcí vypnutá i ze strany AMD, tak se nemůžeme divit, že rozdíl výkonu proti FIJI bude maximálně odpovídat rozdílu taktů = a tomu přesně odpovídá výkon VEGA FE ve hrách. Výkon RX VEGA by tady měl být opravdu v praxi lepší i s jen základními optimalizacemi a zlepšovat se dál u nové generace her, na jejíž vývoj má naštěstí AMD velký vliv.
AMD v těch svých „marketingových“ videí opravdu nelže, pokud máte zájem tak tady jich je celá řada a mnoho věcí o kterých jsem stručně a zjednodušeně mluvil výše, rozebírají a prezentují lépe a ukazují i další věci:
VEGA je tedy velmi technologicky pokročilé GPU a opět typický AMD GPU produkt, který dělá velký skok a předbíhá výrazně dobu a spoléhá na věci, které zatím současné vydané hry nemají, kdy stávající věci i tak dělá o něco lépe a rychleji. Ono zase se není co divit, VEGA nebude stát jen proti PASCAL generaci konkurence, ale také proti VOLTA a samozřejmě NVIDIA řadu z těch věcí bude postupně umět a implementovat také. Nedělá to prostě nárazově jako AMD (nemusí) – kromě toho, že NIVIDA vždy byla konzervativnější ohledně nasazování nových věcí (třeba i nových typů pamětí), tak považuje za výhodnější dělat ta GPU sice ne tak pokročilá, ale výkonná na aktuální věci s tím, že sice soudobá konkurenční AMD ji třeba už po roce nakonec předběhnou, ale to už nebude důležité, protože na trh bude mířit další generace karet. A tak je tomu už několik posledních generací. Vidíme to i dnes, POLARIS tedy RX 400/500 grafiky při vydání vůči GTX 1060 dokonce mírně zaostávaly, dnes když to změříte teď v novějších hrách, tak už někdy docela výrazně RX 580 uniká GTX 1060. To samé platilo ještě výrazněji o GTX 960 vs R9 280/380 atd. mezi kterými je dnes rozdíl i desítky %, přitom když vyšly byly ty karty výkonem na stejno! Jenže k čemu to teď AMD je, že? :). Jinými slovy, blíží se zjevně čas, kdy NVIDIA vydá nové VOLTA GTX 2060 a další karty, a těm bude muset VEGA konkurovat i jako architektura v dalších chystaných čipech. A tak je technologicky prostě dál.