Je mnoho různých situací, kdy potřebujeme, aby určitá data zabírala co nejméně místa. Například pokud posíláme e:mail, umisťujeme soubory na internet nebo chceme na disketě k někomu donést určité soubory. Ve všech těchto případech můžeme použít jako řešení komprimaci dat. Jedná se o zmenšení jejich objemu a rozlišujeme komprimaci bezztrátovou (ZIP, Rar ...), při které nedojde k žádné informační ztrátě obsahu a komprimaci ztrátovou, při které dojde k zmenšení souboru spolu se zhoršením kvality (např. obrázek je méně barevný, z hudby můžou být odstraněny tóny, které není člověk schopen zaznamenat apod.) a setkáme se s ní např. u hudebního formátu MP3, videoformátu MPEG a oblíbených grafických formátů JPEG neboli JPG.
Zkuste si třeba představit obrázek, jehož velkou část zabírá jednobarevné pozadí. Ve standardním formátu (např. bmp) je každý bod pozadí zapsán samostatně, takže se v něm budou vyskytovat velké oblasti s opakující se informací. Jednou z možností, jak takový obrázek zkomprimovat je, uvést u kódu barvy pozadí číslo, kolikrát se má opakovat. Např. aaaaa se dá zapsat 5a a ušetříme hned tři místa. Je však jasné, že běžný text by takhle asi nevypadal a mohlo by se stát, že by se místo nazdar kód zapsal jako 1n1a1z1d1a1r. Naštěstí je tato nejjednodušší metoda jmenující se RLE (Run-Length Encoding) propracovaná tak, že se to nestane. Používá se hlavně na obrázky, např. z programu malování a může dosáhnout docela dobrých poměrů.
Další metodou je LZW nazvaná podle svých tvůrců. Je již o poznání složitější a pracuje na několikrát se opakující posloupnosti znaků. Je využívána tzv. slovníková metoda. Program si vytvoří slovník, který je možno po zkomprimování souboru možné smazat, jelikož jej není k rozbalení potřeba, protože je sám automaticky vytvořen.
Nejnovějším způsobem je tzv. Aritmetické kódování. Pracuje na četnosti výskytu jednotlivých znaků. Vychází z Huffmanova a Shannon-Fanova kódování. Princip spočívá v tom, že je zjištěn nejčastěji se opakující znak, dále ten druhý nejčastější, třetí atd. a přiřadí jim určitý počet bitů (8bitů je jeden bajt, bit se skládá z jedniček a nul, takže jeden bajt obsahuje 256 možných kombinací bitů) a tomu znaku, který je obsažen nejvíce přiřadí bitů nejméně, tomu znaku co je přítomen o něco méně přidělí více atd. až tomu, který je obsažen nejméně přidělí bitů nejvíce. Tato metoda sama o sobě není příliš účinná, avšak v kombinaci např. se slovníkovou metodou jsou již výsledky docela dobré.
Programů použitelných ke komprimování a dekomprimování je několik. Nejznámější je WinZIP, ačkoli nedosahuje nejlepších výsledků. Lepší je WinRar a užívá jej také slušné množství lidí. Dalšími méně rozšířenými jsou ARJ, TAR, ACE a JAR.
Výhodou komprimace je možnost zmenšit soubor, je-li to potřeba a nevýhody jsou nutnost mít program, který je schopen s tímto souborem dále pracovat (buď jej dekomprimovat - ZIP, Rar ... ; nebo rovnou číst - MP3,JPG ...) a případně také zhoršení kvality, ale obecně se vyplatí komprimaci využívat.
HHPZ