Disková pole v praxi #6 - Něco padlo, pomóóóc! Tisk E-mail
Napsal Jan Kořínek   
Pátek, 19 březen 2010
altTak už jdeme do finále a poslední tóny zní. Jak to jde, už víme, ale co když to nejde?

 

 

 

Dostali jsme se konečně k poslednímu dílu, kde se koukneme na možnosti řešení některých problémů u typů polí, které byste si mohli doma nejspíš postavit.

Nejprve si dáme malé rychlíkové shrnutí všech běžných typů a jejich hlavních vlastností, výhod a nevýhod:

  • RAID0 - Stripe set
    • Typické použití: Dočasné úložiště s vysokou porpustností (například videostřižna)
    • Alespoň 2 disky
    • + Ultimátní rychlost za neměřitelnou cenu systémových zdrojů
    • + Propustnost a kapacita roste úměrně s počtem disků
    • + Latence klesá úměrně s počtem disků
    • - Žádná ochrana uložených dat, pádem jednoho disku jsou data v podstatě neobnovitelná
  • RAID1 - Mirror (zrcadlo)
    • Typické použití: Vytvoření spolehlivého disku spojením 2 běžných (například rychlý spolehlivý systémový disk)
    • Alespoň 2 disky
    • + Ochrana dat plnou redundancí uložených dat (kolik disků, tolik kopiií dat)
    • + Vysoká rychlost čtení za neměřitelnou cenu systémových zdrojů
    • + Propustnost při čtení roste úměrně s počtem disků
    • + Latence čtení klesá úměrně s počtem disků
    • - Propustnost při zápisu je stejná jako u nejpomalejšího disku v poli
    • - Kapacita je přeplacená tolikrát, kolik je disků v poli
  • RAID5 - Stripe set s distribuovanou paritou
    • Typické použití: Vytvoření velkokapacitního spolehlivého úložiště se slušnou rychlostí (například skladiště filmů, fotografií a další multimediálních dat)
    • Alespoň 3 disky, pro zvýšení výkonu je použito vždy N-1 disků (tedy u tří disků je dvojnásobná, u čtyř trojnásobná a tak dále)
    • + Ochrana dat paritou (kapacita o velikost jednoho disku je využita na redundanci)
    • + Vysoká rychlost čtení za (do pádu jednoho disku v poli) neměřitelnou cenu systémových zdrojů
    • + Propustnost a kapacita roste úměrně s počtem disků
    • + Latence klesá úměrně s počtem disků
    • - Při zápisu dat je nutné spočítat paritu, která stojí několik procentu výkonu CPU
    • - Zápis dat je kvůli paritě nutné zarovnat na velikost stripe a vynutí si tedy i čtení z paritního disku
  • RAID10 - Stripované zrcadlo
    • Typické použití: Extrémně rychlé spolehlivé úložiště (například databázový server)
    • Alespoň 4 disky
    • + Ochrana dat plnou redundancí uložených dat (každý druhý disk je redundantní)
    • + Vysoká rychlost za neměřitelnou cenu systémových zdrojů
    • + Latence klesá lineárně s každou přidanou dvojicí disků
    • + Propustnost čtení roste lineárně s každým přidaným diskem
    • + Propustnot zápisu roste lineárně s každou přidanou dvojicí disků
    • - Využitelná kapacita je vždy 50% použité kapacity disků

Takže už máme pole vybudované, spokojeně ho používáme a najednou se objevil problém:

Jeden disk v poli zemřel

Je to možná trochu zvláštní, ale tohle je nejtriviálnější situace, se kterou si snadno poradíte.

Většina polí, která jsem potkal, totiž pracuje se SMART informací z disku a ta chytřejší ještě vyhodnocují další parametry, jako je průměrná doba zápisu na disk, rychlost čtení a především ohlášená chyba zápisu dat. Pokud taková událost nastane, systém vypíše varování a nebo disk rovnou odepíše jako vadný. Jelikož odepsání způsobí přímo ovladač pole, jedná se o konzistentní odpojení a data zůstávají v pořádku a nedotčená. Stejně tak, pokud disk odejde na elektronické úrovni. Ve všech případech nejspíš dojde ke krátkodobému pozastavení práce OS, jelikož se systém nejdříve pokusí udělat reset sběrnice. To platí především pokud disk sám odejde a přestane odpovídat. Zažil jsem, že mi systém vytuhnul na cca 3 minuty, než opakovanými resety SATA sběrnice dospěl k závěru, že tudy cesta opravdu nevede. Jakmile prohlásil disk za mrtvý, vše se zase rozběhlo a v logu se mi objevila hláška, abych s tím něco udělal ;o).

Král je tedy mrtev, ať žije nový král! Postup doporučuji následující:

  1. Vypněte počítač
  2. Vyndejte padlý disk (dejte pozor, že je to opravdu on)
  3. Připojte nový disk
  4. Proveďte rebuild pole v BIOSu (pokud máte pole vybudované s jeho pomocí)
  5. nebo rebuildujte pole pomocí OS (pokud je to pole na úrovni operačního systému)

Výše uvedný postup aplikujte, pokud máte po ruce náhradní disk a nebo pokud se nebojíte, že by vám v době vyřizování reklamace padnul nějaký další disk. Ve všech případech ale doporučuji, pokud ji nemáte, okamžitě udělat zálohu.

Jeden disk v poli postupně umírá na elektrické úrovni

Tohle taky není žádná katastrofa, i když docela leze na nervy. Nejpíš se vám bude totiž stávat, že disk vypadne z pole, ale když rebootujete počítač, tak se bude zase tvářit v pořádku. Po přidání do pole se pole obnoví a vše zase nějakou dobu poběží. Postup je stejný, jako v předešlém bodě. Zkrátka disk vyměníte a máte zase klid.

Disku v poli se postupně ničí magnetická vrstva

Tohle je problém, který obyčejně nemá automatické řešení. Pokud disk nekontroluje, že zapsaná data odpovídají datům přečteným (nehledejte v eShopech, nekontroluje) a pokud není chyba takového ražení, že zápis vysloveně selže (například se nepodaří aktualizovat tabulku interních dat disku), data se prostě na toto místo nezapíší a projeví se až chyba při jejich čtení a to dokonce může být jenom ve formě poškození obsahu!

Abyste nemuseli panikařit nijak dlouho, tahle chyba hrozí v podstatě jen u velmi starých disků a u disků, které se na nějakou signifikantní dobu přehřívaly (tou hranicí by mělo být 60°C na plotně disku) po dobu alespoň několika hodin.

Nicméně jak z toho dovnitř? Nejtěžší je u tohoto problému vůbec přijít na to, že se to děje. K tomu by vám ale možná trochu překvapivě mohl pomoct nějaký diskový katalog. Nejdůležitější vlastností takového katalogu je možnost ohlásit, že ač se nezměnila velikost ani čas souboru, došlo ke změně kontrolního součtu (v angličtině se používá checksum a nebo CRC). Takovým varováním běžně disponují antivirové programy, ale ty se zase obyčejně nezaměřují na obrázky, filmy a další média.

Důvod vysvětlím na RAID1, ale ostatní redundantní pole mají logiku stejnou, jen RAID5 to bude mít o něco jednodušší. V předchozím přehledu je řečeno, že rychlost čtení roste s každým přidaným diskem. Data jsou totiž zapsána alespoň na 2 disky zároveň, ale čtení může proběhnout z kteréhokoliv z disků (až na RAID5). Tím pádem se zákonitě musí čas od času stát, že se jednou načte správná verze obsahu a jednou špatná. Tím se změní kontrolní součet souboru, aniž by se ale podle dalších dat (čast souboru, velikost) ten soubor vůbec měnil.

Takže víme, že je něco shnilého ve státě dánském, a co s tím teď?

Máte-li obyčejný RAID1, je situace jednoduchá. Disky jsou si rovnocenné, takže stačí udělat toto:

  1. Vypněte počítač
  2. Odpojte disk, na který máte větší podezření
  3. Zapněte počítač
  4. Zkontrolujte původně padlý soubor
  5. Je v pořádku? OK, máte nejspíš odpojený ten vadný disk, udělejet kontrolu zbylých dat a reklamujte ten špatný disk.
  6. Není to v pořádku?
  7. Tak počítač vypněte, odpojte ten aktuální disk, připojte ten odpojený
  8. Zapněte počítač
  9. Nyní by už data měla být OK a vy byste měli v ruce držet disk určený k reklamaci

Rozhodně, pokud se nechcete dozvědět spoustu nových věcí o diskových polích, nedoporučuji prohlásit jeden disk za vadný na úrovni správce pole. Mohli byste se totiž snadno dostat do situace, že budete muset na nejnižší možné úrovni přeeditovat metadata pole, kam se ta informace o vadném disku zapíše! Pokud zvolíte postup uvedený výše, tak u odpojeného disku nejde k žádné modifikaci jeko obsahu, jen u disku, z kterého nabootujete si správce pole nejspíš poznamená, že jeho bratříček je vadný a tím pádem se po jeho připojení bude muset udělat rebuild pole. Ale to by se musel udělat v případě výměny disku tak jako tak. A pokud jste se napoprvé netrefili, nabootování z druhého disku bude bez problémové stejně, jako u toho prvního. Opět se v něm poznačí, že je bratříček vadný, a vy budete držet dvě rovnocenné verze dat, o kterých se můžete rozhodnout, která je ta platná.

U pole typu RAID10 doporučuji postupovat obdobně, jen s tím rozdílem, že rozdělíte všechny zrcadlené disky, a získáte tak opět dvě rovnocenné verze dat a můžete se v klidu rozhodnout, která je ta opravdu platná.

U pole typu RAID5 je situace o něco jednodušší, tam byste totiž neměli mít až tak zásadní problém identifikovat ten správný špatný disk. Co je ovšem klíčové, že si musíte být opravdu jistí. Díky paritní redundanci totiž nemáte šanci získat rovnocenné verze dat, jako to bylo u RAID1 a RAID10! Jakmile tedy odpojíte nějaký disk, máte šanci získat data jen z dopočítané parity a pokud vyjmete špatný disk, může být výsledek katastrofální.

Postup je ale po objevení pachatele stejný s tím, že nemusíte (a vlastně ani nemůžete) volit mezi rovnocenými verzemi dat, ale rovnou zařizujete reklamaci.

Komplexnější způsoby opravy dat doporučuji svěřit odborníkům. Pokud jsou data opravdu cenná, pak zcela jistě profesionálové začnou s pokusem okopírovat binárně data disk po disku na jiné disky a jakékoliv restaurování pak budou dělat na těchto kopiích. V žádném případě tedy nevěřte nikomu, kdo vám bude slibovat, že to dostane rovnou z těch donesených disků.

Ať už se rozhodnete řešit tyto situace externě a nebo sami, vždy se připravte na to, že jde o docela zdlouhavý proces. Jen zkopírování třeba 500GB disku na jiný disk zabere nějakou tu hodinu (při průměrné rychlosti 50MB/s by to bylo kolem 3 hodin) a to se vám snadno může stát, že zvolená cesta je slepá ulička a budete to celé opakovat znovu.

A tím vám všem děkuji za přízeň a s naším seriálkem o diskových polích se tímto dílem loučíme. Pokud máte zájem, prosím vás o hlasování v anketce pod článkem, abych mohl případně nachystat další článek na tém, které vás z nabídnutých zajímá nejvíc.

Kořen




Na co se mám zaměřit u dalších článků/seriálů?


AUTOR: Jan Kořínek
V IT jsem už 18 let a z toho jsem posledních 5 let vedl webhostingovou divizi. V tuto chvíli už působím jen jako externí konzultant - specialista na Linux, počítačové sítě a bezpečnost. A jelikož si od IT odpočívám, otevřeli jsme si se ženou kavárničku.

Starší články


Komentáře
Přidat Nový
Kastan42 [Zobrazit profil] [Poslat zprávu] 2010-03-19 17:18:51
avatar
Díky za super články.
Chtěl jsem se akorát zeptat, když mám pole RAID1 a vyměním tam 1HDD, tak se startem systému vše samo pozná, že jeden disk byl vyměněn a data se začnou automaticky kopírovat nebo je to třeba udělat vvždy rebuild v BIOSu?

A u RAID5 píšete "neměli byste mít až tak zásadní problém identifikovat ten správný špatný disk". Mohl by jste to prosím popsat jak to udělat? Je to opět metoda jeden vyndám, zkusím, jde/nejde spustit systém nebo je v tom něco jiného?

Doufám, že to nejsou moc hloupé dotazy, nikdy jsem pole neměl, ale přemýšlím o RAID5 na filmy/fotky.
Díky za odpověď
Bosnak [Zobrazit profil] [Poslat zprávu] 2010-03-19 17:42:00

Tady záleží na tom, jak mmoc je chytrej ten RAIDovej řadič. Chytřejší ti sám ukáže který disk je vadný, umožní ho vyměnit (i za chodu), nebo ho automaticky nahradí hotswapovým a po výměně disku rebulduje z hotswapu zpět.
Jinak se připojuju k chvále článků
koren [Zobrazit profil] [Poslat zprávu] 2010-03-19 17:56:45
avatar
velmi správná poznámka, díky za ni i za tu chválu ;o)
koren [Zobrazit profil] [Poslat zprávu] 2010-03-19 17:52:14
avatar
Každý řadič pole si na disk a nebo oddíl zapisuje metadata, která obsahují identifikátor pole (obyčejně pojmenovaný UUID), typ pole, pořadí disku/oddílu v poli, velikost stripe, datum a čas posledního připojení z OS a tak. Podle toho také dokáže poznat, že je pole kompletní a nebo degradované. Pokud je degradované, nastávají korektivní operace. Jak kolega přede mnou napsal, chytrá pole se chopí aktivity sama, pokud je nový disk čistý (neobsahuje jinou signaturu pole, někde nesmí ani obsahovat partition table) a má dostatečnou velikost.
Pokud řadič pole tuto inteligenci nemá a nebo nejsou splněny vstupní podmínky, je třeba ruční zásah.
koren [Zobrazit profil] [Poslat zprávu] 2010-03-19 17:56:20
avatar
Detekci v RAID5 odpovím zvlášť: RAID5 nemůžete testovat metodou pokus/omyl. To by vedlo spíše ke katastrofě, než k úspěchu. Už při 3 discích máte totiž 2x vytší pravděpodobnost, že vytáhnete dobrý disk, než že vytáhnete špatný (dobrých jsou 2/3, špatných je 1/3). Takže jakmile u RAID5 nastane problém, který není vidět jinak, než padáním obsahů souborů, musíte najít přesné umístění chybného sektoru v logickém disku (tedy v disku pole) a tento blok pak namapovat pomocí velikosti stripe na fyzický disk. Proto jsem v článku spal, že to je u RAID5 největší problém. Ale jakmile už máte nalezený ten fyzický blok, už nemusíte bádat, který ze dvou disků je to vlastně ten špatný.
]mh[ Virtek [Zobrazit profil] [Poslat zprávu] - RAID 5 ? 2010-03-21 23:39:03

RAID5: bych pro domaci prostredi vubec nedoporucoval

P.S.: nezapominejme, ze RAID a zaloha jsou dve ruzne veci, a nesnazme se je zastupovat
koren [Zobrazit profil] [Poslat zprávu] 2010-03-22 07:01:23
avatar
Mohl byste Vaše důvody proti nějak blíže rozvést?

S Vaším PS naprosto souhlasím.
]mh[ Virtek [Zobrazit profil] [Poslat zprávu] - zkusim to 2010-03-22 12:40:44

RAID5: hromada disku a "jeden na paritu"
cteni: read-DATA,read-CRC
zapis: read-DATA,read-CRC,write-DATA,write-CRC

RAID5: muzeme si dovolit vypadek vzdy JEN 1 disk
RAID1: muze IDEALNE odejit polovina disku

tady se snazim naznacit za zatez na RAID5 je vyssi nezli u ostatnich konfiguraci,

pokud se tedy koupim 3 NOVE disky a budu stavet RAID5, nezalohuji tak si kupte jeste provaz, protoze paklize zazlobi jeden disk - uz jste jednou nohou v pekle( pri rebuildu muze odejit dalsi)

P.S.: pozor na problemy s intel chipsety ICH10R
koren [Zobrazit profil] [Poslat zprávu] 2010-03-22 14:53:11
avatar
Aha, ano, zmiňujete vlastně důvody, které jsem popisoval v článku, jen opravím:
Čtení: read-DATA
Zápis: read-DATA-pro zarovnání stripe, vypočti paritu, write-DATA

Neříkám, že RAID5 nemá žádné nároky na CPU, ale není to tak strašné. Můj Phenom 4X je schopen generovat jedním jádrem XOR o datovém toku 8995.600 MB/sec, když tedy vezmu velmi výkonné pole klasických disků s maximální propustností 200MB/sec, zabere mi zápis plnou rychlostí 2,2% jednoho jádra.

Pokud si ze dvou disků postavím RAID1, také si mohu dovolit výpadek jen jednoho disku.

Díky za varování před vadným chipsetem, co přesně dělají?
]mh[ Virtek [Zobrazit profil] [Poslat zprávu] - urcite ? 2010-03-22 21:24:48

mam raid5 3 disky (A,B,C) budu pocitat ze vzdy pracuji s daty ktera se vejdou na jeden strip=jeden disk

pro cteni tedy prectu vse a zjistim jestli jsou data platna
read: read-A,read-B,read-C (CRC), vypocet/kontrola CRC

pro zapis bud tedy predpokladam ze jsou data OK (to bych nedelal)
write A: read-B,vypocitat CRC,write-A,write-CRC
nebo takto
write A: read-oldA,read-oldCRC,CRC=oldCRC xor oldA xor A,write-A,write-CRC

podivejte na google ich10r delali desynchro a rebuild problemy

P.S.: RAID5 bez batery modulu = nekonzistetni parita a kde jsi marycko magdonova
koren [Zobrazit profil] [Poslat zprávu] 2010-03-23 09:29:21
avatar
Aha, už vím, kde se rozcházíme ;o)
Nenašel jsem implementaci RAID5, která by při čtení kontrolovala paritu. Tím by se v podstatě ztratila jakákoliv výhoda RAID5. Stejně tak jsem nenašel implementaci, která dělá kontrolu parity před zápisem.

Jelikož se stripe size obyčejně nastavuje na cca 64kb (pokud neoptimalizuji pole na zápis velkých souborů), nemyslím si ani, že by byla většina souborů/transakcí jenom takto velká a tím ani zápisový scénář nevypadá tak pesimisticky, jak ho popisujete Vy. A i kdyby to tak bylo, nic Vám nebrání si dát stripe třeba 4kB, což je mimochodem i strandardní velikost FS bloku pro většinu OS.

Ohledně battery packu souhlasím ale platí to jenom pro dedikovaný HW řadič s vlastní cache, u SW implementace OS vždy ví, jestli je transakce na disku a nebo není a jelikož má jak Linux, tak Windows žurnál, dokáže vynutit u SW implementace kontrolu konzistence dat při nekonzistentním flush. Při pádu systému natvrdo tedy je možné přijít o poslední rozpracovaná data, ale k pádu celého FS dochází jen velmi zřídka kdy. (A jsme zase u zálohování ;o)

PS: S tímhle chováním teď zápasím na BIOS RAID1 i nVidia (nForce 7), ještě pár neúspěšných pokusů o resync a prohlásím to za nepoužitelné. :-(
c.Data [Zobrazit profil] [Poslat zprávu] 2010-04-09 13:34:00
avatar
Tak lidi a právě se ze znalého člověka deklasuji na tele

O čem to sakra melete??? Jinak díky za velice přínosné články
Derryk [Zobrazit profil] [Poslat zprávu] 2010-03-23 19:18:49

Mám pár dotazů:

1.
Uvádíte:
[i]"RAID 1
+ Vysoká rychlost čtení za neměřitelnou cenu systémových zdrojů"[/i]

To platí snad jen v případě SW Raid jen v Linuxu. V prostředí Win je rychlost čtení z RAIDu totožná s rychlostí čtení ze samostatného disku. Linux v případě čtení čte z obou disků kdežto Windows jen z jednoho. Je tato informace platná, nebo vycházím ze špatných údajů ?

2.
"Můj Phenom 4X je schopen generovat jedním jádrem XOR o datovém toku 8995.600 MB/sec."
Předpokládám, že se jedná o případ se SW RAID5, jelikož v HW RAID 5, by XOR počítal řadič. Zkoušel jsem RAID5 na ICH10R a dosažený výkon byl tristní cca 12MB/s zápis a 17MB/s čtení na CPU C2Q 9300@3.5GHz. Kde by mohla být příčina takto nízkého výkonu? Předpokládám že v ICH10R, ale ,že by byl tak vysoký rozdlíl proti čipsetu pro AMD se mi nezdá. Nebo obcházíte(nepoužíváte) pseudo HW RAID čipsetu základní desky a řežii RAID5 necháváte na OS ?

Předem děkuji za odpověď.
koren [Zobrazit profil] [Poslat zprávu] 2010-03-23 20:48:59
avatar
1. Ano, podle toho, co jsem si zatím zjistil o fungování Windows polích, nedochází u SW raidu k rozdělení zátěže čtení na disky. Je to pro mě tristní zjištění, ale je to podle všeho tak. V takovém případě bych asi šáhnul po levném HW řadiči. Pokud se nepletu, tak tohle by mohlo udlělat hodně práce: Odkaz

2. Ano, píšu příklad pro SW RAID. U otázky k výkonu nepíšete nic o platformě, takže předpokládám Windows a BIOS RAID 5. V takovém případě bych podezříval špatně napsané ovladače (Intel si udělal dost jméno) a nebo i vlastní řadič, ale to by se nejlépe dalo vyzkoušet testem v Linuxu.

3. Předem není zač ;o)
koren [Zobrazit profil] [Poslat zprávu] 2010-03-23 20:55:19
avatar
Až teď jsem si všiml, že ten Kouwel v odkazu je čistě port expadner s funkcí RAID, tak to je hodně super. Tím pádem byste si mohli udělat takové hodně výkoné políčko typu RAID50 tím, že si uděláte RAID5 na úrovni toho řadiče a ty vzniklé disky pak sestripujete na úrovni OS.
NRX [Zobrazit profil] [Poslat zprávu] 2010-03-25 08:33:28

"... musíte najít přesné umístění chybného sektoru v logickém disku (tedy v disku pole) a tento blok pak namapovat pomocí velikosti stripe na fyzický disk..."

Dalo by sa to nejako širšie popísať?

Pravdepodobne na základe prepočtov vo FAT tabuľkách a podobne. Skôr mi ide o to, či sa to nedá nejako zautomatizovať, alebo či neexistujú na to SW prostriedky, ktoré by automaticky určili tú polohu a tým pádom aj disk.

Ešte by ma zaujímalo, či sa nedá nejako povedať radiču, aby súbor, ktorý je poškodený čítal s dopočítavaním parity a tým by bo schopný ho prečítať.
koren [Zobrazit profil] [Poslat zprávu] 2010-03-25 10:56:49
avatar
Je klíčové si uvědomit, že procento případů, kdy vám disk a řadič bude hlásit, že je vše v pořádku, je opravdu minimální.
Když ale už k něčemu takovému dojde a vy máte RAID5, bude nejjednodušší přehrát data jinam a zkusit to metodou pokus/omyl. Pokud jsou Vaše technické znalosti vyšší, pak si pomocí nějakého FS debuggeru nebo jiného nástroje, který pracuje přímo se souborovým systémem zjistit všechny segmenty toho vadného souboru (fyzické adresy místa na disku všech jeho obsahů). Pak musíte identifikovat, která přesně část toho souboru je vadná a tím určíte fyzický sektor disku, který vykazuje chybu. Pak musíte zjistit, jak řadič pole distribuuje paritu, abyste znal počáteční stripe využitelného prostoru a pak už jen stačí něco násoblky velikosti stripe a velikosti diskového bloku OS, abyste určil, který disk je vadný.
Příklad: Disk má logický blok 4kB (4096 byte), má 100,000.000 bloků (~400GB), a stripe 64kB, tři disky A. B a C a počáteční datový disk je A. Vadný sektor je 57635778.
Takže rozděleno na stripe je vada na datovém stripe číslo 3602236.125, tedy 3602237 (57635778*4096/65536 - číslo sektoru * velikost sektoru v OS / velikost stripe). Z principu chování RAID 5 víme, že na jedno patro zapíšeme 2 stripe a další je distribuovaná parita. Takže každé patro se zbytkem po dělení 1 má data na A+B, zbytek 2 má data na A+C a beze zbytku má data na B+C, víme tedy, že náš zbytek je 2, chyba je tedy na disku A nebo C. Dále víme, že se na jedno patro zapíší 2 datové bloky, takže když je zbytek po dělení 2 jedna, je to disk vlevo, beze zbytku v pravo. Náš stripe je lichý, chyba je tedy na disku A. Teď už nezbývá, než si to ověřit v low-level editoru disků a můžeme odpojovat.
koren [Zobrazit profil] [Poslat zprávu] 2010-03-25 11:03:09
avatar
Automatické nástroje na tuto chybu neznám, ale nejspíš by fungoval nějaký off-line surface test, který by načetl obsah bloku, zapsal náhodná data, porovnal úspěšnost zápisu a pak nakonec zapsal původní verzi dat.
Neznám implementaci RAID5, která by toto dovedla bez prohlášení disku za vadný. Respektive se tím dostáváme k enterprise řešením velkých SAN polí typu IBM Shark, Symmetrix, HP EVA a tak. Tam ale máte skoro vždycky možnost odlít data na jinou sadu a navíc už slušné HW řadiče mají zabudouvanou kontrolu povrchu disku. Mám to vyzkoušeno třeba na Promise ST EX8650, který jsme měli na hostingu. Odkaz
NRX [Zobrazit profil] [Poslat zprávu] 2010-03-25 11:49:49

Pôvodne som nad EX8650 uvažoval, i keď skôr nad novším EX8760T.
No nakoľko zatiaľ nie sú u nás nikde skladom a po tom ako ma ukecal známy na Adaptec, tak som od neho upustil a skončil u AAR-5805.
koren [Zobrazit profil] [Poslat zprávu] 2010-03-25 12:29:51
avatar
My jsme ho koupili, jelikož nabízí srovnatelnou kvalitu za trochu nižší cenu, než Adaptec. Navíc jsme potřebovali bezproblémovou podporu v Linuxu a to také omezilo výběr.
Ale ono těch parametrů pro výběr je moc. Snadnost reklamace, dostupnost, podpora, cena, kvalita ovladačů v požadovaném OS a tak.
Nicméně určitě si nainstalujte ten dodávaný management software. Umožní Vám dělt většinu kouzel přímo z OS, navíc upgrade firmware, časovaně spouštěné úkoly, jako je kontrola povrchu, no zkrátka profesionální železo s profi rozhraním...
KoHHHnA [Zobrazit profil] [Poslat zprávu] 2010-03-19 20:42:55
avatar
Všechny tvé články o RAID polích jsou výborně zpracované a myslím si, že nejen pro mne mají vysokou užitnou hodnotu. Takže díky ti za pěkné (a hlavně poučné :d) čtení a navnadění mne ke stavbě mého osobního RAID pole na všemožnej bo*del ;-).
koren [Zobrazit profil] [Poslat zprávu] 2010-03-19 20:47:19
avatar
Rádo se stalo ;o)
domino2301 [Zobrazit profil] [Poslat zprávu] 2010-03-20 12:59:04

články o RAID som prečítal každý jeden a čerpal som z nich aj pri mojej práci do školy. Je to asi najprehľadnejšie vysvetlenie fungovania RAID aký som čítal a je to fakt perfektne spracované, len tak ďalej.

Chcem sa tiež opýtať že či je možné v jednom PC prevádzkovať RAID pole a zároveň samostatné disky, alebo dve odlišné RAID polia
koren [Zobrazit profil] [Poslat zprávu] 2010-03-20 15:58:31
avatar
Pokud máte HW pole, záleží na tvůrci, ale všechna pole, co jsem potkal se omezovala jen na celý disk a uměla v tomto rámci kombinovat. Nic tedy na osmiportovém řadiči nebránilo udělat jeden logický svazek typu RAID5 ze 3 disků (zálohy), pak udělat jeden RAID0 ze dvou disků (redo logy), a jeden RAID1 na systém a operační data a poslední disk nastavit jako global hot spare.
U SW polí je to spíše dané limity daného OS. Windows jsou na neserverových verzích omezeny tuším na RAID0 a RAID1. A jak už jsem i tuším někde psal, SW pole mají výhodu, že mohou pracovat jak s celým diskem, tak s oddíly (doporučuji).
Takže já jsem měl kdysi v počítačí 2 disky 500GB, 2 disky 320GB a měl jsem je rozdělené asi následovně:
4x 64MB RAID1 pro 64MB boot disk/boot oddíl
4x 4GB RAID10 pro 8GB swap
4x 64GB RAID10 pro 128GB root
4x 250GB RAID5 pro 750GB filmy/fotky/hudba
2x 180GB RAID1 pro 180GB weby/databáze
Takže flexibilita maximální, jen využít fantazii :-)
petresl [Zobrazit profil] [Poslat zprávu] - SW či HW RAID 1? 2010-03-21 08:50:20

Jsem laik, a proto se chci zeptat, jestli byste mi doporučili při přechodu na Win 7 zůstat u "chipsetového" HW RAID 1(není systémový), či použít SW (znamenalo by to použít dynamické svazky, se kterými nemám absolutně zkušenosti - výhody a nevýhody?). Ptám se zejména proto, abych si ujasnil možnost 100% jistoty získání dat při poruše. A to u "chipsetového" RAID1 porucha řadiče a u SW přeinstalace instalace OS (je u dynamických svazků nějaké úskalí, kdybych již data nevydoloval)? Ještě doplním, že na desce s X48 mám pouze jeden SATA řadič (ICH9R). Děkuji.
koren [Zobrazit profil] [Poslat zprávu] 2010-03-21 09:34:22
avatar
Já jsem se o to ve Windows pokoušel jen jednou a nedělal jsem disaster testy, takže přesnou radu neznám. Jen se to chystám vyzkoušet někdy teď v nejbližší době, abych neradil jen tak akademicky. Jak moc spěcháte?
petresl [Zobrazit profil] [Poslat zprávu] 2010-03-21 09:46:22

Nespěchám, jistota je přednější než čas :-)
koren [Zobrazit profil] [Poslat zprávu] 2010-03-21 12:28:57
avatar
Před chvílí jsem přidal další disk do Win72/32 Home Premium a nepodařilo se mi přepnout existující disk do režimu zrcadla.
Jelikož vím, že Windows mají mě nepochopitelný problém při zrcadlení systémového disku, zkouším rovnou postup instalace na BIOS RAID. Zpráva bude počítám do večera.
koren [Zobrazit profil] [Poslat zprávu] 2010-03-21 20:32:59
avatar
Situace se poněkud zkomplikovala, Win7 mi odmítlo přijmout product key, se kterým jsem to předtím bez potíží nainstaloval. Takže bohužel, ale zpráva o instalaci Windows na BIOS RAID bude, až s MS dořeším důvody.
]mh[ Virtek [Zobrazit profil] [Poslat zprávu] - dynamicky disk 2010-03-21 23:22:46

mame tu dve(1) moznosti

a, format c:
a, dynamicky disk

P.S.: zapomente, ze tam takova moznost je opravdu
petresl [Zobrazit profil] [Poslat zprávu] 2010-03-21 13:47:11

Nechci dělat ukvapené závěry, ale přeci jenom asi bude chipsetový RAID jistější. U SW mne lákala vyšší variabilita v použitých discích (použití rozdílně velkých fyzických disků s možností využití celé kapacity většího z nich další partition), ale pokud RAID 1 nesplňuje to základní, proč je sestavován a to spolehlivost, zbývá HW (tedy v mém případě chipsetový, uvědomuji si rozdíl mezi zkutečným HW řadičem a těmi použivanými v chipsetech na deskách). Ještě se zeptám profesionála, jakou vidíte šanci (zkušenost) na obnovu dat z disků v RAID 1 pokud odejde řadič (potencionálně někdy v budoucnu) a já nebudu mít k dispozici desku s totožným řadičem? Lze doufat v možnost zkopírování na uplně jiném HW (omlouvám se, jsem laik). A ještě, jaké máte zkušenosti s Intel Matrix Storage Managerem (drivery)?
Jinak velmi děkuji za povedené články o RAID, jsou konkrétnější než ostatní (těch povšechných je relativně dost, ale neřeší možné problémy při provozu a konkrétní kroky při jejich odstraňování) a tudíž pro mne neznalého jsou velmi užitečné. Ono, když dojde k poruše, není moc chuť na experimentování, když to již někdo znalejší řešil a hlavně úspěšně vyřešil.
koren [Zobrazit profil] [Poslat zprávu] 2010-03-21 15:23:00
avatar
Většina BIOS RAID by měla být schopná zpracovat existující pole. U některých řadičů to jde až tak daleko, že převezmou i ID, což se mi stalo u jednoho pole vytvořeného na nVidia chipsetu a přeneseného na HT1000. Přinejhorším budete muset pole vytvořit znovu, v tom případě si ale dejte pozor, aby vám nové pole nesmazalo MBR a part. table, jako se to stalo jednou mě. Nalezení původní správné konfigurace PT mi trvalo asi 2 dny s low-level editorem.
S Intel MSM zkušnosti bohužel nemám.
Jen bych nerad, abyste si z mého komentáře udělal špatný závěr. MS Mirror funguje, jak má, spolehlivost nabízí, jen je to IMHO implementováno nešťastně. Především jde o bootování, které vyžaduje nějaké extra kroky. Navíc mám pocit, že u sys disku dochází pouze k odklonění zápisu, ale nedochází k paralelizaci čtení, to probíhá vždycky jen z master disku, ale ještě jsem to nestudoval do hloubky, takže jistý si nejsem.
jardop [Zobrazit profil] [Poslat zprávu] 2010-03-23 14:04:17

tesime sa na dalsie clanky..
koren [Zobrazit profil] [Poslat zprávu] 2010-03-23 14:19:53
avatar
No, však už taky běží hlasování na další téma ;o)
NRX [Zobrazit profil] [Poslat zprávu] 2010-03-25 08:38:33

Inak dík za články, sú super. Škoda, že nevychádzali v menších časových odstupoch.

Nakoniec som to čakanie nevydržal s kúpil HW radič. Dúfam, že som nesekol moc vedľa a bude stáť za to
Odkaz
koren [Zobrazit profil] [Poslat zprávu] 2010-03-25 10:09:10
avatar
Z mých zkušeností se HW řadiči Adaptec neseknete nikdy. Já se s nimi setkávám už od roku 1993 a byly vždycky v pohodě.
Principy fungování polí jsou identické a jak jsem teď zjistil při pokusech s BIOS polem, zbavíte se mnoha problémů, jelikož u HW řadiče to prostě funguje a tečka. Jen doporučuji zkontrolovat aktuálnost firmware.
NRX [Zobrazit profil] [Poslat zprávu] 2010-03-25 10:51:49

Zaujímal by ma ešte názor na prídavnú batériu k radiču.

Nejaké info som pozeral na Webe a zatiaľ mám v pláne používať záložný zdroj.

Či má ešte význam uvažovať nad touto batériou?
koren [Zobrazit profil] [Poslat zprávu] 2010-03-25 11:29:45
avatar
Pokud budete používat záložní zdroj a nastavíte ho tak, aby vyvolal shutdown včas, mělo by být všechno OK i bez battery packu. Ten vám zálohuje jen obsah diskové cache na řadiči, jelikož je to jediná paměť, nad kterou nemá OS kontrolu a tak by její neuložení mohlo mít zásadní důsledky.
NRX [Zobrazit profil] [Poslat zprávu] 2010-03-25 11:39:43

Takto nejak som si to predstavoval
Dik za info.
LutteR [Zobrazit profil] [Poslat zprávu] - Poděkování a otázka 2010-03-27 13:12:57

Přeji krásný den,
prvně bych Vám rád poděkoval za naproto dokonalou sérii článků a těším se na pokračování. Musím se přiznat, že DD world sleduji od jeho úplného začátku a zatím mě žádný článek nedonutil k registraci, až ten Váš
a nyní k mé otázce:

Mám průměrné PC (Phenom II X4, 4 GB ram, ATI 5770, ... a jeden disk 320 GB) trochu mě překvapilo, že nový "stroj" ani při čisté instalaci není rychlý(možná je to můj subjektivní pocit a mé staré PC nebylo zase tak pomalé, jak jsem si myslel). Předpokládám, že nestíhá disk.

Napadla mě tedy tato konfigurace se 4x HDD 1500GB, na nich vytvořím partition 300 GB + zbytek a to v rychlé oblasti disku (na vnější straně ploten je vyšší rychlost). Tím bych měl získat 4 "velmi" rychlé disky a 4 "velmi" pomalé a velké. Z rychlých vytvořím jedno pole RAID 0 o cca 1200 GB určených pro systém, zbylé pomalé části budou určeny jen na data, a opět bych je spojil do RAID 10 (to už je celkem jedno).

Zajímal by mě Váš názor jako odborníka, tedy:
- Chci zrychlit sytém, jeho start a načítání programů, splní to toto uspořádání? Rychlost čtení a zápisu by měla být teoeticky až 400 MB/s, obdobně přístupová doba, ... problém může nastat v okamžiku kdy budu přesouvat data z disku na disk, kdy bude kopírování srovnatelné jako nyní (jeden disk - více částí)
- Protože mám 4 disky zvýší se mi pravděpodobnost poruchy 4x, proto chci svá důležitá data chrátit (RAID 1 nebo vyšší)
- Náročnost na správu pole (jsem vůbec schopen jako laik a začátečník takové pole efektivně spravovat a využít?)
- Stojí to moc a umí málo, navrhuji lepší řešení (RAID5, ...)
- Jak raid vytvořit? Za pomoci řadiče na desce (umí deska pracovat s částí disku), programem z Windows (Linux bohužel neovládám, windows údajně s disky nepracují zároveň, ale vždy jen s jedním diskem, takže přínos žádný (Win 7)), přídavným řadičem (řadiče nad 10 tis. jsou mimo - stál by téměř stejně co zbytek sestavy ).

Omlouvám se za rozsáhlost příspěvku
Za reakci předem děkuji

ps: 4 disky jsou z důvodu, že původně jsem chtěl z malých oddílů vytvořit RAID 10, ale myslím, že systém a nainstalované programy nepotřebuji zálohovat
koren [Zobrazit profil] [Poslat zprávu] 2010-03-27 15:02:46
avatar
Dobrý den.

Díky za chválu :-)

Ale k otázce. Rychlost je vždy subjektivní záležitost, ale ohledně Windows je důležité si uvědomit, že jsou na disk docela náročné. Byl jsem u Mountfiledu "odměněn" jedním z netbooků s nechvalně pomalým SSD diskem a výkonostní rozdíl mezi Windows a Linuxem byl propastný. Windows každou chvíli rozsvítili HDD LED a já mohl jít na kafe. Takže máte-li podezření na disk, já se k němu přikláním též.
Ohledně rozložení: vámi popisovanou strukturu rozložení dosáhnete pouze pomocí SW/OS disku a nevím, jestli vůbec a pokud ano, tak od jaké verze Windows podporují RAID0 na systémový disk. Nicméně pokud mohu doporučit, já si hodně vážím svého času a vím, že mě každá reinstalace byť i hloupého HTPC stojí cca den práce, takže já bych neriskoval ztrátu byť i jen OS a programů. Vzhledem k tomu, že vám jde o výkon a cena disků navíc vás asi trápí míň, než výkon samotného PC, koupil bych si HW řadič, sestavil na něm RAID10 a výsledný disk pak rozdělil na systém a data. Jak velký systém uděláte, už je jenom na vás. Já osobně nevidím moc důvodů, mít sysDisk větší, než 300-400GB.
Přesouvání dat ze systémového disku na datový počítám neděláte tak často, takže tam by to zpomalení nemuselo být kritické.
LutteR [Zobrazit profil] [Poslat zprávu] 2010-03-27 16:06:18

Děkuji za rychlou odpověď.

Ano, máte pravdu, bohužel mám pocit, že bych u nového PC měl kafe až příliš často

Pokud se tedy rozhodnu pro řadič, mohl byste mi poradit podle čeho vybírat?
V některém vlákně výše jste uváděl odkaz na jeden kvalitní ředič za příznivou cenu. Musím se přiznat, že mě trochu překvapilo, že není do PCI-E, ale má S-ATA vstup. To tedy znamená, že na jeden s-ATA konektor na desce připojím více disků a na výsledné rychlosti se to nijak neprojeví?
Tento řadič ale RAID 10 neumí.

Původní nápad byl koupit 4 disky Seagate, u nich přes program snížit velikost na 300GB a následně z nich vytvořit RAID 10, pak jsem se ale pod článkem dozvěděl, že to lze v podstatě z kteréhokoliv disku bez ztráty kapacity a měl jsem o 4x 1200 GB více
V původním návrhu byly tedy pouze 4 disky na systém a RAID 10 s kapacitou 600 GB (jak píšete 400 na systém a zbytek jako rezerva do budoucna ...).
S novým nápadem, kde využiji celou kapacitu disku, jsem si nebyl úplně jist, a proto jsem se zeptal
Mimochodem co si myslíte o uvedeném snížení kapacity disku a využití tak pouze rychlých oblastí? Článek, který jsem o tomto tématu nalezl, zněl celkem fantasticky, diskuze "odborníků" pod ním už méně. Je možné aby došlo k takovému zvýšení výkonu?
A na konec: To že Windows je chopen zapisovat pouze na jeden disk v jeden čas je záležitost pouze pole vytvořeného po OS, a u polí vytvořených přes řadič či chipset již běží vše jak má - tedy souběžný zápis i čtení ze všech dotčených disků?

Ještě jednou děkuji
koren [Zobrazit profil] [Poslat zprávu] 2010-03-27 20:25:17
avatar
To záleží, kolik do toho chcete investovat. Na alze je mraky řadičů, které nabízejí slušnou implementaci RAID10 BIOS RAID, ale jestli hledáte řešení na delší dobu, koupil bych HW řadič. Slušný mi přijde tenhle: Odkaz
Jen pozor, HW pole Adaptec poznáte podle uvedené velikosti cache řadiče a obyčejně i procesoru a myslím, že mají produkt code AAR-2xxx, HostRAID je BIOS RAID.

Rozdělení na relativně úzký pruh systémového disku na vnějším okraji a zbytek je IMHO výborný nápad, kterým dosáhnete s malým rozdílem to samé, jako oříznutím kapacity na úrovni firmware disku. Tím rozdílem je umístení relokačních sektorů v případě kolapsu datového bloku.

Jen bych rád vypíchnul rozdíl mezi rychlým SSD diskem a touto výkonostní fintou. Takto spojené disky (RAID10) budou mít velmi vysokou zápisovou rychlost (~200MB/s), extrémní rychlost čtení (~400MB/s), ale průměrná přístupová doba zůstane pořád na úrovni někde kolem 3ms.

Nicméně toto řešení nebude trpět známou slabinou SSD disků, z nichž za nejzávažnější považuji omezení počtu zápisů, a získáte i do budoucna (řekněme 2 let) velmi slušné řešení.
NRX [Zobrazit profil] [Poslat zprávu] 2010-03-29 08:46:53

Mohol by som poprosiť o link na spomínaný článok?

Niektoré skutočnosti, ktoré spomínate sa mi tam nepozdávajú ...
koren [Zobrazit profil] [Poslat zprávu] 2010-03-30 09:57:20
avatar
Jestli myslíte tu výkonostní fintu, tak tady prosím ;o)
Odkaz
NRX [Zobrazit profil] [Poslat zprávu] 2010-03-31 10:03:44

Dík, vidím to na znovuobjavenie Ameriky

HDD rozdeľujem na partície snáď už 10 rokov, pričom systém bol vždy na 1. particií a posledných 5 rokov to používam v spojení s RAID kedy sa ten výkon sa ešte zvyšuje...

Myslel som, že to bude niečo nové ...
koren [Zobrazit profil] [Poslat zprávu] 2010-03-31 10:54:56
avatar
No vidíte, a ne ;) Často se mi stává, že intuitivně a někdy i čirou náhodou udělám něco, co se později ukáže jako vhodné řešení. Nepřekvapuje mě tedy, že se to samé děje i někomu dalšímu.
koren [Zobrazit profil] [Poslat zprávu] 2010-03-31 10:54:49
avatar
Ooops, zapomněl jsem kliknout na odpovědět....
Pouze registrovaní uživatelé mohou přidat komentář!
 
Poslední příspěvky v diskuzích


Videa
Prusa Core One – nová uzavřená 3D tiskárna
Prusa Core One – nová uzavřená 3D tiskárnaWednesday, 20 November 2024
Vložil: aDDmin
Kategorie: PC a IT
Spuštěno: 81x
Komentářů: 0
Star Wars Outlaws dostává Update 1.4 – zásadní herní změny!
Star Wars Outlaws dostává Update 1.4 – zásadní herní změny!Wednesday, 20 November 2024
Vložil: aDDmin
Kategorie: Počítačové hry
Spuštěno: 87x
Komentářů: 0
Jak to vypadá v uvnitř DATACENTRA?
Jak to vypadá v uvnitř DATACENTRA?Monday, 18 November 2024
Vložil: aDDmin
Kategorie: PC a IT
Spuštěno: 801x
Komentářů: 0
Vychází LEGO Horizon Adventures – další zábavná LEGO hra?
Vychází LEGO Horizon Adventures – další zábavná LEGO hra?Tuesday, 12 November 2024
Vložil: aDDmin
Kategorie: Počítačové hry
Spuštěno: 1141x
Komentářů: 0
Indiana Jones and the Great Circle hra ala film?
Indiana Jones and the Great Circle hra ala film?Monday, 11 November 2024
Vložil: aDDmin
Kategorie: Počítačové hry
Spuštěno: 1455x
Komentářů: 0
Nový Captain America nevypadá dobře. Thunderbolts* jsou na tom lépe.
Nový Captain America nevypadá dobře. Thunderbolts* jsou na tom lépe.Friday, 08 November 2024
Vložil: aDDmin
Kategorie: Film
Spuštěno: 1309x
Komentářů: 6