Arkistoijat ovat ohjelmia, jotka voivat pakata tietoja tiedostoihin. Nykyaikaisen arkistoijan avulla voit yhdistää useita tiedostoja yhdeksi arkistoksi ja tarkastella tällaisten arkistojen sisältöä. Heidän avullaan luodun arkiston koko osoittautuu paljon pienemmäksi kuin alkuperäisen tiedoston koko.
Ohjeet
Vaihe 1
Useimpien arkistojen yleinen toimintaperiaate perustuu algoritmiin, jonka tutkijat A. Lampel ja J. Ziv ovat kehittäneet viime vuosisadan 80-luvulla. Zivin ja Lampelin luoman algoritmin avulla voit laskea tiedoston kaksoiskoodin ja pienentää siten sen kokoa. Tätä varten datasekvensseistä kootaan sanakirja. Esimerkiksi tiedoston binaarikoodi sisältää seuraavan yhdistelmän: 10111011101110110011. On helppo nähdä, että koodi 1011 toistetaan siinä useita kertoja. Arkistoija havaitsee tällaisen koodin ja kirjoittaa sen arkistoon vain yhden kerran, ja purkamalla sen taas korvaa koodin tarvittavissa paikoissa tiedostossa.
Vaihe 2
Kuinka hyvin arkistoija pakkaa tiedoston, riippuu lähdesanakirjan koosta. Jos sanakirja on liian suuri, se vaikuttaa arkiston kokoon. Jos sanakirjan koko on liian pieni, luotussa arkistossa voi esiintyä virheitä. Voit lisätä tiedoston pakkaussuhdetta entropiakoodauksella (ns. Huffman-menetelmä). Entropiakoodauksella toistuvat binaaripalat kirjoitetaan lyhytkoodilla. Nykyaikaisissa arkistoissa entropiakoodausta käytetään lisäkoodausmenetelmänä.
Vaihe 3
Unix-järjestelmissä gzip on suosituin arkistoija. Tämä arkistoija pakkaa dataa häviöttömästi ja perustuu Deflate-algoritmiin. Tiedostot pakataan täällä kahdella tavalla - ensin korvataan kaksoiskoodit ja sitten niiden merkit korvataan uusilla merkkeillä Huffman-menetelmällä. Unix-järjestelmien arkistoilla on useita haittoja. Ne on suunnattu ensisijaisesti arkistoihin, jotka koostuvat monista tiedostoista, joten yksittäisen tiedoston purkaminen on vaikeaa. Tämä johtuu siitä, että Unix-arkistoijat katsovat arkistoa jatkuvana ryhmänä kaikista siihen pakatuista tiedostoista. Arkisto muodostetaan kuhunkin tiedostoon sisältyvien tietojen perusteella.
Vaihe 4
Windows-järjestelmissä sellaiset arkistoijat kuin WinZip, 7-zip ja WinRAR ovat yleisiä. Toisin kuin Unix-järjestelmät, nämä arkistoijat keskittyvät työskentelemään sekä yksittäisten tiedostojen että jatkuvien, monista tiedostoista koostuvien arkistojen kanssa. Suurin osa nykyaikaisista Windows-arkistoista "ymmärtää" monia arkistomuotoja, tukee salausta ja pystyy pakkaamaan erittäin suuria tiedostoja (esimerkiksi WinRAR-arkistoijan suurin tiedostokoko on yli kahdeksan miljardia gigatavua).