Strana 3 z 5
Je čas se na ten zázrak podívat. Jádro Fermi zatím nemá jasné označení. Tedy pokud jde o číselné označení, zda to bude GT300, což se nyní jeví dost nepravděpodobně, nebo GF100 se teprve ukáže. Jasno v tom ještě nemá ani NVIDIA, stejně jako u řady jiných věcí. Jádro FERMI je totiž horká novinka a v současnosti jeho výroba ještě ani neběží a všeho všudy existuje pár testovacích kusů pro účely samotné NVIDIA.
NVDIA ale odtajnila některé specifikace. Potvrzuje se to, že jádro nese celkem 3,2 miliardy tranzistorů, což je 2x tolik, co mělo GT200. Jádro je vyráběno 40nm, stejně jako konkurenční RV870, které nese na ploše 330mm2 celých 2,15 miliardy, což není o moc méně. Přesto ale bude jádro Fermi opět větší a tedy nepochybně i výrobně o dost dražší a náročnější než to od ATI.
V jádru je nově 512 SP jednotek, které už se nejmenují SP, ale CUDA procesory. V GT200 jich bylo 240. Celé jádro se dělí na 16 SM jednotek po 32 CUDA procesorech a 4 SFU procesory. Tohle nás ale jako běžné uživatele moc zajímat nemusí, snad jen se hodí vědět to, že s jádra FERMI se 16 SM jednotkami se časem budou rekrutovat menší čipy pro levnější grafiky. Můžeme očekávat jádra třeba jen s 12/8/6/4 SM jednotkami po 32 CUDA procesorech což nám dá nějakých 384/256/192/128 jednotek v každém jádru.
Jádro FERMI má v základu 384bit sběrnici a řadič pamětí je samozřejmě nativně GDDR5 a jádro jich nese hned 6. Umí maximálně obsloužit 6GB pamětí. 384bit sběrnice byla zvolena proto, že jádro už je samo o sobě dost drahé a NVIDIA se poučila z GT200 a jeho 512bit, kdy prostě výroba PCB s takovou sběrnicí se výrazně prodražuje a protože Radeon HD 5000 má stále jen 256bit, nechce opakovat stejnou chybu jako u GT200 vs RV770. Navíc použije konečně rychlé GDDR5 paměti a 384bit sběrnice je v tomto případě více než dostatečná a je lepším řešením než GDDR3+512bit. U herních modelů můžete počítat s pamětí o velikosti 1,5GB.
A teď něco k výkonu. Samotná NVIDIA toho v této oblasti mnoho neprozradila, což je proto, že toho sama zatím o moc víc neví. Jádro je příliš nové a zatím se vše zjišťuje. V zásadě se ale NVIDIA soustředila hlavně na zvýšení výpočetního výkonu a to zejména v Double Precision výpočetním výkonu, který je pro ni a vědecké aplikace, kam chce proniknout důležitější. Ten by měl být podle informací, které NVIDIA zveřejnila, asi 4x vyšší než u GT200 a tato informace velké ovace nevyvolala. Výkon GT200 v režimu double precision je totiž pouze 78GFLOPS, FERMI tak má nějakých 312GFLOPS. Proti GT200 velký pokrok, jenže konkurenční RV870 má na HD 5870 výkon celých 544 GFLOPS v Double precision! A to vůbec nemluvíme o Singl precision, který je u HD 5870 plných 2730GFLOPS a FERMI má „jen“ nějakých 1536GFLOPS. Bohužel tyto hodnoty výpočetních výkonů jsou u FERMI dosti nejasné, NVIDIA uvádí jen to, že výkon Double precision je u FERMI asi 4x lepší než u GT200, zbytek jsou jen dopočty. 4x lepší než u GT200 znamená konkrétně tedy něco přes zmiňovaných 300GFLOPS, ale slyšel jsem i čísla kolem 712, 1250 i více než 2000GFLOPS, jenže o jaké základy se opírají, těžko říci. Čistě teoreticky pokud 30 jednotek v GT200 zvládne výkon 78GFLOPS, pak 256 ve FERMI zvládne 665GFLOPS, pokud by mělo být FERMI 4 lepší, pak by to mohlo být až 2660GFLOPS! Ale to je spíš výpočetní fantazie než reálné výpočty.
V současnosti to už jsou spíše jen babské řeči – neznáme totiž takty jádra, pamětí ani nic další a ty zatím vůbec jasné nejsou, protože karty se ještě ani do finální výroby nepřipravují! Zatím se hodnoty kolem 1,6TFLOPS / 330GFLOPS jeví jako nejpřesnější a to není proti ATI RV870 na HD 5870 s jeho současnými 2,73TFLOPS / 544GFLOPS zrovna výkonová drtička.
Záležet tak evidentně bude i na dalších schopnostech architektury FERMI, které jsou pro určitá použití a oblasti opravdu přelomové. Podívejme se tedy na to, co konkrétně FERMI umí a dokáže.
|