Protože valná část uživatel zaměňuje pojmy "archivace" a "komprese" případně považuje obě činnosti za totéž, a nerozumí ani dalším pojmům, pojďme si, alespoň pro potřeby tohoto článku, nadefinovat, co všechny ty pojmy kolem archivace a komprese znamenají:
archivace - znamená umístění souboru/souborů, případně nějaké části adresářové struktury včetně uživatelských práv a dalších informací do jediného archivu(souboru). Takovýto archiv není komprimován. To znamená, že má větší velikost, než původně archivovaná data, protože k samotným datům je třeba připočítat nějakou režii archivu.
komprese - aplikace kompresního algoritmu na daný archiv (soubor), za účelem zmenšení jeho velikosti. Podotýkám, že se bavíme o kompresi bezztrátové (na rozdíl třeba od .mp3). Nikomu by se asi nelíbilo, kdyby si svůj důležitý dokument zkomprimoval a následně zjistil, že někdo přeházel písmenka, či umazal slova :-) Velká část dnes používaných programů provádí archivaci a následnou kompresi najednou a uživatel o tom ani neví.
kompresní algoritmus - tzv. Matematická transformace, v našem případě obousměrná a zcela jednoznačná. Musí být zaručeno, že transformací tam a zpět dosáhneme 100% původní data, bez jakékoli změny. V tomto ohledu je komprese dat a šifrování příbuzná činnost.
kompresní poměr - celou dobu tady hovořím o kvalitě komprese. Kvalitou komprese jsem nemyslel nic jiného než právě kompresní poměr. Stanovuje se jako poměr velikosti původních dat a zkomprimovaných dat. Pokud například 8MB zkomprimujeme na 2MB, pak kompresní poměr je právě 4. To znamená, že zkomprimovaný archiv zabírá 1/4 (25%) původní velikosti.
souborový formát pro kompresi a archivaci dat - to je v podstatě výsledek předchozích činností. Data se archivují, pomocí nějakého algoritmu zkomprimují a výsledkem je pak soubor s příponou .zip, .rar, .gz atd.... Hovoříme tak o formátu RAR, ZIP....atd
Dnes se tedy podíváme na archivaci a kompresi do jednotlivých souborových formátů a pokusíme se vybrat ten nejlepší. Do hodnocení zahrneme nejen kvalitu komprese, nebo chcete-li kompresní poměr, ale také dostupnost a licenční podmínky.