Strana 2 z 2
TAR - asi vůbec nejstarší dnes používaný formát. Zkratka TAR znamená "tape archiver" a vznikl již v raných dobách unixu právě pro zálohování na magnetickou pásku. TAR je archivační program. To znamená výsledný .tar archiv je větší, než původní data. Stručně řečeno, TAR jen sloučí několik souborů/adresářů do jednoho. Přesto se dnes hojně využívá, jak si řekneme za chvíli.
BZip2 - svobodný komprimační algoritmus a program vyvinutý Julianem Sewardem. První verzi (0.15) vydal v červenci 1996. Stabilita a popularita programu od té doby značně vzrostla. Verze 1.0 byla vydána na konci roku 2000. Bzip2 používá Burrows-Wheelerovu transformaci, která konvertuje často se opakující znakové sekvence do řetězců ze stejných písmen a poté použije move-to-front transformaci a nakonec Huffmanovo kódování. Původně používal předek bzip2 - bzip - aritmetické kódování, které má lepší kompresní poměr. To ale muselo být vyměněno za méně výkonné Huffmanovo kódování, protože aritmetické kódování je patentováno.
Bzip2 neumí pracovat s více soubory, zkomprimovat dokáže pouze jeden soubor. Tento princip vychází z principů fungování unixu, kdy na každou činnost existuje samostatný program. Programy jako TAR tedy spojí více souborů dohromady a bzip2 tento soubor pak zkomprimuje. V praxi se tedy setkáte se souborem s příponou tar.bz2 což znamená Bzipovaný tar archiv. Neznamená to ovšem, že by uživatel musel dělat archivaci a kompresi zvlášť. Většina programů pro kompresi a archivaci vám rovnou nabídne formát tar.bz.
Gzip - Gzip je zkratka pro GNU zip; program je free software náhradou za kompresní program používaný již v raném Unixovém systému, určený pro projekt GNU. Gzip je založený na algoritmu DEFLATE, který je kombinací LZ77 a Huffmanova kódování. Podobně jako Bzip2 i gzip je normálně používán ke kompresi jednotlivých souborů. V praxi se tedy opět soubory archivují programem Tar a následně zkomprimují pomocí Gzip. Výsledné soubory nesou příponu tar.gz nebo .tgz a bývají nazývány jako "tarball"
RAR - je populární proprietární souborový formát pro kompresi dat a archivaci vyvinutý ruským programátorem Jevgenijem Rošalem (odtud pojmenování RAR: Roshal ARchive). Autor WinRARu dal k dispozici zdrojové kódy dekomprimačního programu, díky tomu je možné RAR dekomprimovat i v jiných programech na různých platformách. RAR na rozdíl od předchozích formátů je šířen jako shareware. To znamená, že po uplynutí zkušební lhůty musíte program buď zaplatit a nebo odinstalovat.
ZIP - je populární, nicméně už několik let překonaný souborový formát pro kompresi a archivaci dat. Jeho největší výhodou je právě jeho rozšířenost.
7Zip - je komprimační program určený pro různé operační systémy. 7-Zip je svobodný software, vyvíjený Igorem Pavlovem a distribuován pod licencí GNU LGPL. 7-zip používá přednostně kompresní algoritmus LZMA, nabízí však také kompresní algoritmy PPMD, bzip2, Deflate, a „store“, tedy uloženi souborů bez komprese.
Za účelem testu jsem vybral různé skupiny běžných dat, které se mi za posledních pár let hromadí na disku. Předvedeme si archivaci dokumentů a textových souborů, videí, hudby a obrázků v některých běžných kombinacích. Ukážeme si, kdy komprimace smysl má, a kdy nikoli.
Test 1: MIDI – 3254 souborů /195 složek / 132,6 MB
MIDI soubory z velké části podobné jednoduchým .txt souborům. Z tohoto důvodu jsou data velmi dobře komprimovatelná, jak ukazuje graf. Jako nejlepší se ukazuje formát 7zip, s odstupem následovaný čtveřicí Rar, Tar.gz, Zip, Tar.bz2. Přestože se tyto programy liší metodou komprese, výsledky jsou v podstatě porovnatelné. Jak je vidět, velikost Tar archivu je stejná jako velikost původních dat.
Test 2: Směs multimédií – 105 souborů / 10 složek / 173,5 MB
směs souborů .avi, .mpg, .swf, .wma, .mp3, .pps, .gif, .exe, .bmp, .jpg, Nyní zkusíme komprimovat složku s velmi různorodou směsicí souborů videa, obrázků, hudby a prezentací:
Všechny tyto soubory jsou již v komprimovaném formátu. Jak je vidět dodatečnou kompresí téměř nic nezískáme. Nejlepší je opět formát 7zip. Ovšem jeho náskok je v tomto případě minimální. Rozdíly mezi ostatní čtveřicí je plně zanedbatelný.
Test 3: Směs videa – 29s souborů / 341,8 MB
Následující graf snad ani nepotřebuje komentář. Video je samo o sobě komprimovaný formát, nehledě na to, že klasické komprimační nástroje se na něj nehodí.
Test 4: Směs dokumentů – 1375 souborů / 264 složek/ 388,5MB
soubory formátů: .doc, .xls, .pdf, .tif, .jpg, .txt
Moderní kancelářské balíky ve svých formátech dokumentů již nějakou kompresi používají. Soubory .jpg, .tiff, a pdf jsou pak rovněž komprimované. Přesto se velikost těchto dat nezanedbatelně zmenšila. Exceluje opět formát 7zip následovaný opět vyrovnanou čtveřicí .rar, .zip, .tar.gz a .tar.bz2.
Test 5: Dokumenty s obrázky – 65 souborů / 5 složek / 164,8MB
dokumenty typu .doc a .ppt s vloženými obrázky .jpg a .tif
Opět je vidět, že kancelářské formáty jsou již částečně komprimované a velkého snížení se už nedočkáme. Je to také způsobenou vloženými obrázky, které jsou takřka nekomprimovatelné. V tomto případě jsou výsledky vyrovnané, nepatrně opět vede 7zip
Test 6: Složka Mp3 – 41 souborů 188,3MB:
Mp3 je naprosto nejrozšířenější (nikoli však nejlepší) ztrátový kompresní formát pro hudbu. Data jsou již tedy komprimována. Jak to vypadá, pokud takovouto složku zkomprimujeme si můžete domyslet.
Naše hodnocení je třeba rozdělit do dvou kategorií:
V případě dokumentů, .txt souborů a souborů MIDI je nejlepším formátem 7zip. Naproti tomu, ostatní kompresní formáty Rar, Zip, Gzip a Bzip2 podávají velmi podobné výsledky. Nejhůře proto hodnotím formát Rar protože ačkoliv je placený, nepřináší uživateli v podstatě nic navíc oproti svým volně šiřitelným konkurentům. V absolutním hodnocení kompresního poměru formátu by se sice umístil na druhém místě s velkým odstupem za 7z, ale rozdíly mezi 2 a 5 místem jsou naprosto minimální a jeho konkurenti jsou distriubováni pod vstřícnější licencí.
V případě audio-video souborů bych označil za nejvhodnějšího kandidáta archivní formát Tar. Jak je vidět z testů, jakákoli komprese v tomto případě nemá smysl a výsledky se vůbec neliší. Je proto zhola zbytečné audio-video takto komprimovat neboť se stejným výsledkem lze za zlomek času a výkonu procesoru vytvořit podobně veliký Tar archív. Zcela absurdně v rozporu s tímto zjištěním však valná část videí a hudby je na internetu publikována v .rar a .zip archivech, přestože to nemá vůbec žádný smysl (rapidshare.com, uschovna.cz). Autor zbytečně data komprimuje a adresát zbytečně data dekomprimuje. Přitom pouhá archivace, v našem testu zastoupena programem Tar, vytvoří lehce přenositelný jediný soubor podobné velikosti, ale bez nároků na kompresi.
Nejlepším kompresním formátem v testu byl nezpochyby 7zip. Je šířen zdrama pod licencí GNU GPL. Domovské stránky projektu naleznete na stránkách: http://www.7-zip.org/cs/ Program je multiplatformní a je dostupný pro Windows, Mac i Linux. EDIT: 26. 1. 2008. - Všechny komprese byly provedeny na základním nástavení, pouze příkazem zkomprimovat - tedy tak, jak to dělá největší část uživatel. - Doba komprese nepřesáhla 30s v žádném z případů. Subjektivně vůbec nejpomalejší byl RAR. Nejrychhlejší TAR (bez komprese) následovaný Tar.gz a Zip (s kompresí). - podrobné srovnání lze nalézt zde: http://en.wikipedia.org/wiki/Comparison_of_file_archivers
|