Nová generace grafických karet NVIDIA už má zpoždění, ale dočkáme se. Nejspíše až na CES.
Původně měla být nová generace grafických karet NVIDIA uvedena už kolem poloviny tohoto roku, ovšem jisté problémy v designu nových čipů vedly ke zpoždění. Původně také RTX 50 série měla být postavena už na čipletové konstrukci, ale od toho NV ustoupila už před 2 lety, protože zjistila, že takovou věc technologicky zatím nedokáže zvládnout. Bylo rozhodnuto, že RTX 50 bude nakonec jen menší evolucí klasických monolitických řešení na kterých staví současná RTX 40. Architektura se zásadně měnit nebude, výrobní proces také ne, prostě se využije standardních posunů a vývoje především k „prostému“ navýšení počtu výpočetních jednotek v GPU a navýšení silových parametrů karet (např. širší sběrnice). A k tomu se využije zcela nová generace grafických paměti GDDR7. Prioritou pro NVIDIA do dalších let z hlediska vývoje GPU a výkonných výpočetních řešení jako takových, je totiž stejně jako pro AMD, čipletová konstrukce a konkrétně MCM konstrukce více „menších“ GPU tvořící jeden funkční celek.
V HPC oblasti tahle konstrukce už funguje. A bez čipletů by nebyli schopni u AMD ani NV produkovat současný výkon AI řešení. Ovšem jen AMD dokázalo uvést funkční čiplety na běžný GPU trh, nicméně zatím bez MCM. Aktuální NAVI 31 na RX 7900 sérii a NAVI 32 na RX 7700/7800 sérii karet, jsou jediné funkční čipletové herní GPU a zatím jedinými ještě minimálně rok zůstanou. Nástupce už měl být MCM konstrukce, tedy malá GPU (GCD), která měly být osazena až tři na jednom čipletu. Ovšem plánované NAVI 41, 42 a 43 v rámci RDNA 4, nikdy nedorazí. AMD kvůli nepřekvapivým průtahům s vývojem a vyladěním složitého MCM konceptu, zrušilo jejich plánované letošní uvedení. A dočkáme se tak těchto prvních čipletových MCM pro klasické herní grafiky až u další generace. Tedy „RDNA 5“ postavené na „NAVI 51, 52, 53“. Ovšem to až nejdříve v závěru roku 2025.
- NVIDIA ví, že nebude mít v high endu (dočasně) konkurenci
Stejný záměr s čipletovou konstrukcí klasických výkonných grafických karet má i NVIDIA. U RTX 50 to ale zrušila, protože to také nestíhala. Ovšem budoucí RTX 60 karty už by čipletové být měly. V každém případě to znamená, že nastupující RDNA 4 generace grafických karet AMD, nebude vůbec obsahovat high endové modely, což AMD již oficiálně potvrdila. Prostě AMD v nové generaci nebude mít nic nad 600 možná spíše nic nad 500 dolarů. Výkonově nejlepší řešení bude jen malý monolit, který by měl nabídnout rasterizačně výkon zhruba v úrovni RX 7900 XT, v RT ale překonávat 7900 XTX. Nicméně je to řešení pro segment grafik kolem 400 až 500 dolarů maximálně. Nic nad ním v rámci RDNA 4 a Radeon RX 8000 série prostě nebude. NVIDIA tak ví, že nemusí s uvedením svých nových high endových RTX 5090 a 5080 vůbec spěchat. V tuto chvíli má už jistotu, že minimálně jeden celý rok nebude mít ve výkonném grafickém segmentu žádnou konkurenci.
NVIDIA tak nakonec nijak nevadí vlastní zpoždění způsobené určitými problémy v designu a výrobě nových čipů, kdy stejný problém se projevil i u nové generace AI produktů, která nakonec sice letos dorazí, ovšem mnohem později a v omezeném množství, než původně slibovala a byl původní plán (a AI GPU jsou priorita i proti RTX 50). V tuto chvíli už se blížíme plným dvěma letům, kdy je RTX 4090 beze změny na trhu (v prodeji je od října 2022) a RTX 4080 je v prodeji od listopadu 2022. Tedy nejdelší období mezi dvěma generacemi grafických karet v novodobé historii NVIDIA. A vypadá to, že letošní uvedení se nejspíše už ani nestihne …
- RTX 5090 a RTX 5080 se finalizují, vydání asi až na CES
V tuto chvíli už stále více věcí naznačuje, že právě RTX 5090 a 5080 jsou opravdu blíže představení a uvedení. V první řadě v mnoha částech světa docházejí RTX 4090 a mizí z nabídek obchodů. Důvodem je, že se nepočítalo že by byla tak dlouho ve výrobě a k tomu se přidaly i problémy s dostupností GDDR6X, které nikdo kromě NV nepoužívá. Nicméně plné jsou stále sklady RTX 4080 série karet, kde je to způsobeno od počátku mizerným zájmem o ně, protože za ty peníze ta karta nedává prostě smysl. A výrobci karet a distribuce se tak stále potřebuje zbavit toho velkého množství 4080tek před tím, než by dorazila 5080.
OEM výrobci PC pak už v zákulisí mluví o novinkách postavených na nových platformách AMD, ale hlavně Intelu a součástí jejich prezentací jsou i řeči o tom, že ty nové sestavy mají obsahovat RTX 50 karty. S ohledem na to, že Intel ARROW LAKE procesory, alias Core Ultra 200 série s novou Z890 platformou se objeví na konci října s pravděpodobnou velmi omezenou dostupností v listopadu, je listopad první realistický termín, kdy by se RTX 50 mohly objevit. Obecně však není moc jasné, jestli ono letošní vydání ARROW LAKE platformy nebude jen víceméně papírová záležitost s velmi omezenou reálnou dostupností na trhu. Takže nelze vyloučit, že v praxi se ty nové OEM sestavy objeví až v tom lednu.
Vedle výše uvedeného máme také aktuální informace od dlouhodobě spolehlivého zdroje úniků informací kolem NVIDIA produktů. A ten říká, že RTX 5090 a 5080 jsou parametrově finalizované a NV se snažila informace o nich udržet, jenže jako obvykle neúspěšně. Vedení firmy teď naštvaně pátrá, kdo to zase pustil ven, protože tentokrát se prý opravdu snažili, aby nic neuniklo na rozdíl od předchozích generací, kde jsme detailní parametry, výkony a dokonce obrázky karet měli v ruce týdny před jejich oznámením. Já však mohu prozradit, že už jsem obrázky prototypů viděl a finální parametry, které se tento týden objevily, plně korespondují s testovanými variantami. Takže podle všeho se NV nepodařilo ani u této generace nic utajit. A to jsme stále řadu týdnů od představení a uvedení karet.
O tom, jaké čipy budou karty používat, víme ale už více než rok. A v tomto ohledu tedy nic nového. Otázkou byly jen parametry, tedy kolik jednotek v těch čipech bude nakonec na obou kartách aktivní a s jakou sběrnicí a s jakým TDP nastavením půjdou na trh.
- RTX 5090 má mít 512-bit, ale stále bude mít ořezané GPU
TOP model, tedy RTX 5090 používá velké monolitické 4nm GB202 jádro ve specifikaci GB202-300. Což znamená, že ačkoliv fyzicky má čip těch 24 576 FP32 výpočetních jednotek, pro tuhle kartu bude částečně neaktivní. Plně aktivní čip má totiž označení GB202-400, ovšem stejně jako u současné RTX 4090, bude v této vrcholné specifikaci dostupné jen pro výpočetní/profesionální modely s jinou konfigurací taktů, TDP a pamětí než herní karty.
Z těch fyzicky přítomných 24 576 FP32 jednotek jich tedy má zůstat v provozu u RTX 5090 „jen“ 21 760, což znamená zhruba 13% ořez (zcela standardní u podobně velkého čipu u NV, bylo tomu tak i u starších generací, důvodem je hlavně výtěžnost, kdy už tak velkého čipu jich je jen málo bez vad a plně funkčních, takže když NV akceptuje i takové, které mají drobné vady, má jich k dispozici mnohem více). Co naopak nakonec nemá být osekáno, je paměťová sběrnice. NVIDIA totiž testovala a uvažovala, že oseká i tu. A místo plně aktivní 512-bit mohla mít herní karta 448-bit. S tím souvisí i kapacita paměti, kdy ta 448-bit karta mohla mít méně paměti (28GB), což by se kladně podepsalo mimo jiné na už tak vysoké spotřebě. V plné specifikaci 512-bit sběrnice má však nakonec novinka mít rovnou 32GB GDDR7 na 28Gbps, což si vyžádá extra porci energie navíc. Ale ani to už není překvapení, protože poslední týdny se v zákulisí objevují zprávy, že RTX 5090 bude mít mnohem více než „jen“ 450W jak je tomu u současné RTX 4090. Nakonec by tak nová karta měla mít i v FE verzi šílených až 600W. S ohledem na to, že výrobní 4nm technologie čipu se nemění, počet jednotek však znatelně narostl, paměti jsou rychlejší a je jich více, je těch 600W proti 450W RTX 4090, bohužel velmi realistických.
S ohledem na fakt, že NVIDIA ví, že minimálně rok nebude mít konkurenci, současně ovšem chce RTX 50 karty mít opět 2 roky na trhu, musí přeci jen počítat s konkrečním AMD a jeho budoucími RDNA 5 modely postavenými na MCM čipletech. A pokud se to AMD podaří zprovoznit, což se nepochybně podaří, NVIDIA si je moc dobře vědoma potenciálu čipletového high end multi-GPU. A rozhodně nebude dělat stejnou chybu jako Intel, který se „slepencům AMD“, také dříve smál. Sama NV prostě ví, že klasické monolity v high endu stačit už v dalších letech nebudou a je velmi pravděpodobné, že nástupce Radeon RX 7900 XTX postavený na MCM RDNA 5 bude i výkonem nejen konkurenceschopný, ale pravděpodobně i lepší než monolitická RTX 5090. Takže NVIDIA se prostě nemůže s novou RTX 5090 držet úplně zpět. Nyní sice konkurenta nemá, ale to se za rok může velmi rychle a zásadně změnit. Takže jde prakticky „all in“ hned. Ovšem cena tomu také bude odpovídat. Ostatně ani ten čipletový multiGPU nástupce RX 7900 XTX nebude stát jen 900 dolarů, co stojí na dnešní high end vlastně supervýhodná 24GB RX 7900 XTX dnes. To si řekněme rovnou. Obávám se, že RTX 5090 bude stát pravděpodobně těch 2000 dolarů (cca 55 tisíc korun vč. DPH). Pokud NV jo zneužije současné bezkonkurenční situace, tak realisticky může nastavit až 3000+ dolarů (82 tisíc korun). Minimálně do příchodu RDNA 5 na konci 2025, prostě nebude mít ani papírovou konkurenci …
- RTX 5080 je parametrově mainstream za cenu ultra high endu
Ano, RTX 5080 bude mít parametry spíše mainstreamové karty. V první řadě bude mít mnohem menší 4nm čip proti tomu na RTX 5090, kde ten GB202 má mít kolem 600mm2. V případě RTX 5080 a jejího GB203 má jít prakticky o jeho polovinu, tedy jen něco přes 300mm2, což je obvyklá velikost GPU výkonnějšího mainstreamu. Odpovídá tomu také jen 256-bit sběrnice.
Co je překvapením, že nakonec by RTX 5080 měla mít od počátku plnou specifikaci čipu, tedy GB203-400 verzi s plně aktivními 10 752 FP32 jednotkami (výroba jen 300mm2 velkého 4nm čipu je o poznaní jednodušší a dosahuje snadno vysoké výtěžnosti). To je samozřejmě podstatně méně než těch 21 760 FP32 stejné architektury u RTX 5090. Nemluvě o té poloviční sběrnici s jinak stejnými 28Gbps GDDR7 paměťmi. Jen jich bude 16GB proti 32GB (později se může objevit i verze se 24GB, protože GDDR7 budou kromě obvyklých 2GB čipů dostupné později i ve 3GB na čip). Výkonově však bude RTX 5080 podstatně, o desítky % slabší než 5090. Stále by však měla mít v praxi výkon na úrovni dnešní RTX 4090, či ideálně podle plánů NV o 5 až o 10% lepší. Bohužel, protože zůstáváme u 4nm výroby a nárůst výkonu je v tomto případě hnán mimo počtu jednotek i nárůstem taktů atd. bude tomu výkonu odpovídat i spotřeba. RTX 5080 by měla mít nakonec tedy v základu 400W TDP. Bude sice efektivnější než stávající RTX 4090 se 450W (ovšem ta má mnohem více paměti). Generačně je to však značný a velmi nepříjemný posun z 320W u současné RTX 4080 série karet. Můžeme také myslím bezpečně předpokládat, že stejný čip GB203 bude použit i později u RTX 5070 Ti, samozřejmě v nějaké osekanější verzi (méně aktivních jednotek) a pravděpodobně také jen se 192-bit sběrnicí a 12GB GDDR7. Ovšem ta dorazí až později během roku 2025.
Bohužel je jasné, že ani RTX 5080 minimálně do uvedení RDNA 5, nebude mít také výkonově konkurenci. Takže i v jejím případě tomu asi bude bohužel negativně odpovídat cena. Přinejlepším si NVIDIA řekne u RTX 5080 podle mě o těch 1000 dolarů (cca 27 tisíc korun vč. DPH), ale to jsem za současného stavu věcí možná hodně velký optimista. Realisticky se obávám, že to bude spíše blíže 1500 dolarů (41 tisíc korun). Jediné, co tomu může zabránit jsou výrobci karet a OEM a jejich tlak na NV, aby to nepřeháněla na základě zkušeností se stávající RTX 4080 sérií. Ta není vůbec populární a jde o historicky nejhůře prodávanou generaci karet NV této třídy. Zkrátka 1000 dolarů je moc pro potenciální cílovou skupinu uživatelů. Ti, co mají tyhle peníze, mají i na 4090/5090. A chtít 1000+ dolarů za 256-bit 16GB grafiku je prostě nesmysl. NV však bude muset na 256-bit RTX 5080 spoléhat částečně i jako na TOP model, protože v některých částech světa nebude smět kvůli embargům vůbec prodávat 5090 …
Pro NV samotnou nevelký zájem o 4080, bohatě v končící generaci vyvážily vysoké prodeje RTX 4090, kdy však není tajemstvím, že drtivou většinu těchto karet nekoupili hráči, ale nakoupili je zejména čínské firmy pro následné úpravy a použití v AI a HPC. Ovšem tahle skupina zákazníků může být v nové generaci produktů v nadcházejícím roce pro NVIDIA mnohem hůře dosažitelná.
- Máme se vůbec na co těšit?
Samozřejmě jako technologický nadšenec do PC a hardware se na novinky NVIDIA těším. Ovšem hodně se obávám jejich cen, kdy je jednoduše všechno špatně pro nás uživatele a zákazníky. Ceny N4 a N3 výroby čipů jsou dnes obecně vysoko díky zájmu o AI a faktu, že TSMC nemá technologicky výrobně žádnou konkurenci a všichni na něj spoléhají (nově včetně Intelu a jeho CPU a GPU). A díky tomu AI šílenství ještě vysoko zůstanou. Současně ceny pamětí jsou obecně výrazně výše (hlavně díky poptávce po AI) a novinky NV navíc mají používat GDDR7, jejichž výroba byla výrazně pozdržena, a tedy množství těchto už tak výrazně dražších pamětí, než jsou GDDR6, je a bude omezené. Současně mezinárodní situace se rychle zhoršuje, kvůli tomu, že se západní svět a jeho polici snaží problémy jen vysedět místo jejich skutečného řešení. Což ale zjevně vede jen ke zhoršení situace. Malou nadějí je snaha západu přeci jen omezit přístup diktátorů a nepřátelských států k vyspělým technologiím, které přímo a nepřímo používají v hybridní i otevřené válce proti nám.
Sankce a embarga na Čínu a její podporovatele, tak budou nejen pokračovat, ale mluví se o výrazném zpřísnění. To může být značný problém nejen pro NV, ale hlavně pro ni, protože právě do Číny přímo i nepřímo směřuje velká část NVIDIA produkce. Dnes zejména přes překupníky nebo v systému půjčování systémů, kterými se Čína snaží sankce obejít. Západní vlády a zejména ta USA, toho ale mají dost a ty mezery ucpávají. Pro NVIDIA i další je navíc jedno, kdo vyhraje v USA (či EU) volby, protože embarga a sankce budou nejen pokračovat, ale zpřísňovat se, což jasně deklarují všechny hlavní strany potenciálních nových vlád (a jde o jednu z mála věcí, kde se všichni shodnou).
NVIDIA tak téměř určitě nebude moci přímo prodávat RTX 5090 na pro ni nejdůležitější trh do Číny a dalších zemí. A jistotu už nemá v příštím roce s potenciálně přísnějšími novými nařízeními, ani s RTX 5080. Nejvíce se bojí zpřísnění pravidel pro AI produkty, kdy jí reálně hrozí, že žádný z nové generace výkonných AI produktů by nesměl do Číny. A to ani na pronájem! Zda tohle bude hrát roli v cenotvorbě nových grafických karet NV, je otázkou. Možná ano, zatím však ne. Zatím dojí AI jak může a využívá všechny mezery v pravidlech a mají naprostou prioritu, což je jeden z důvodů, proč s uvedením RTX 50 vůbec nespěchá a dává přednost AI produktům. V každém případě díky již oficiálně potvrzené absenci high endu AMD v nastupující RDNA 4 generaci, má NV nyní zcela volné pole na už tak prakticky nefunkčním trhu s GPU. Minimálně tedy do nástupu výkonných RDNA 5 nejdříve za rok v závěru 2025. A pokud se ty výše uvedené parametry RTX 50 potvrdí, je evidentní, že NV přeci jen s konkurenceschopným AMD produktem za ten rok počítá a nebude tedy už nyní parametrově držet zpět. Ovšem z pohledu úvodních cen svých RTX 5090 a 5080 s AMD počítat nemusí a nebude.
Současně spotřeba těch grafik je jednoznačně nad rozumným praktickým limitem domácích herních PC a pro mnoho herních nadšenců. Grafickou kartu se 400+W do PC prostě nechcete. V běžně velké místnosti je PC s ní nepříjemný, v létě vedro v zimě musíte větrat. Je tak otázkou, zda se je v případě nových RTX 5080 a 5090, vůbec na co se těšit, když ceny budou téměř určitě příšerné a spotřeba taky. Ano výkon bude nepochybně úžasný, ale stojí za to? NVIDIA tou extrémní cenou a spotřebou svých výkonných herních grafik zabíjí zajímavost herní PC platformy jako takové a prakticky slouží jako anti reklama na herní PC, kdy posiluje argumenty o tom, že herní PC je drahé a náročné … už u RTX 40 série to je zjevné a dlouhodobě kritizované, u RTX 50 to může být ještě horší. Pokud se potvrdí očekávané ceny a spotřeba, není na kartách RTX 5090/5080 vlastně vůbec nic zajímavého a jako předražené a produkty s přehnanou spotřebou je bude drtivá většina i herních a PC nadšenců ignorovat. Nadějí pro nás je, že pokud NV dostane zákaz je prodávat v Číně, a tedy budou mimo dosah tamních AI firem, rázem může být poptávka po 5090 mnohem nižší než po 4090 v končící generaci, a ceny by se tomu mohly přizpůsobit. Ale to je opravdu jen malá naděje za současné situace a pořád to neřeší tu šílenou nepraktickou spotřebu, kdy prostě z mnoha dobrých důvodů záměrně ignorujeme grafické karty se spotřebou nad 400W. Nerad je používám už jen pro testování, moc to prostě topí v běžné místnosti. Takže 400W u nové RTX 5080 je moc a 600W u RTX 5090 je rovnou šílenost, bez ohledu na cenu.
AUTOR: Jan "DD" Stach |
---|
Radši dělám věci pomaleji a pořádně, než rychle a špatně. |
|