Arkiv (datavetenskap)

Den aktuella versionen av sidan har ännu inte granskats av erfarna bidragsgivare och kan skilja sig väsentligt från versionen som granskades den 20 april 2015; kontroller kräver 30 redigeringar .

Ett arkiv  är en fil som innehåller en eller flera andra filer och/eller mappar, samt metadata . Arkiv används för att kombinera vilken uppsättning filer som helst till en enda containerfil i syfte att bekvämt lagra och överföra information, eller helt enkelt för att komprimera data . Arkiveringsprogram används för att skapa arkiv och arbeta med dem .

Arkiven kan behålla mappstrukturen, innehålla serviceinformation för att upptäcka och korrigera fel, kommentarer och annan information. I vissa arkivformat kan data krypteras med ett lösenord.

Applikation

Arkiv är särskilt användbart som ett sätt att paketera filsystemdata och metadata till en enda fil för lagring på en dator eller för distribution över endast filkanaler, som att skicka en mappstruktur via e-post.

Förutom att arkivera sig själv, används arkiv ofta för att distribuera mjukvarupaket; i det här fallet kallas arkivet ofta för ett distributionspaket. Exempel på distributionsarkiv: deb för Debian, JAR för Java, APK för Android.

Funktioner

Beroende på typ stöder arkiv sammanslagning av filer till en, datakomprimering , kryptering , multi-volym (ett arkiv av flera delar), kontrollsummor för att kontrollera integriteten av innehållet i arkivet, självextrahering, självinstallation, information om källvolymen och media, information om mappstrukturen, anteckningar och kommentarer, samt annan metadata. Formatet på en arkivfil bestäms av filtillägget och/eller av titeln i filen. För att skapa arkiv används program - arkiverare , programvara för att skapa optiska skivor och program för att arbeta med skivbilder.

Arkivformat

Arkivformatet  är filformatet för en arkivfil. Det finns många arkivformat, men bara ett fåtal av dem har fått bred acceptans och stöd från programvaruleverantörer och användargemenskaper. Så bland de mest populära i Windows-miljön är ZIP, RAR, 7z och i macOS - SIT-formatet.

Arkivtyper

Undertyper av arkiv

Självextraherande arkiv (SFX)

Självextraherande arkiv kallas ofta även för SFX-arkiv (från engelskan. Self-eXtracting - self-extraction). Till skillnad från ett vanligt arkiv har ett självextraherande arkiv ett körbart filformat (i Windows är det en fil med filtillägget .EXE), för att extrahera data från vilken (och ofta för att testa och visa en innehållsförteckning) ett separat program är krävs inte - allt görs med hjälp av själva SFX-arkivet. Med andra ord packar du helt enkelt informationen i ett SFX-arkiv, och mottagaren behöver bara köra detta SFX-arkiv (på ett liknande OS) för att ta emot den uppackade informationen. Notera. Faktum är att SFX-arkiv är vanliga arkiv som en liten körbar uppackningsfil är kopplad till, så om det behövs (till exempel på grund av rädslan för att den här körbara filen kan vara infekterad med ett virus), kan du använda lämplig extern arkiverare för att arbeta med SFX-arkiv, utan att köra själva SFX-filen.

Arkiv med flera volymer

Flervolymsarkiv är arkiv som består av flera delar. Sådana arkiv stöds i ett antal populära arkivformat - i RAR, ZIP, 7z, etc. För att skapa ett arkiv med flera volymer behöver du bara välja storleken på de delar som det resulterande arkivet ska delas i när filerna packas . Arkiv med flera volymer är särskilt lämpliga för att paketera även dåligt komprimerbara stora filer (till exempel bilder på videoskivor), eftersom de låter dig spara dem på mindre media. Vissa arkiverare (till exempel RAR) kan automatiskt bestämma storleken på varje volym beroende på det lediga utrymmet på det aktuella mediet som används för arkivering, vilket gör att du kan använda arkiv med flera volymer på bästa sätt, till exempel för att överföra data från dator till dator på flera flashenheter av olika storlekar.

Kontinuerliga arkiv

Solid arkivering är en typ av arkivering där alla filer som läggs till i arkivet behandlas av arkivaren som en kontinuerlig dataström. Tack vare detta tillvägagångssätt är det möjligt att uppnå en avsevärd ökning av komprimeringsförhållandet, särskilt när man packar ett stort antal filer av samma typ i en relativt liten storlek (med storleken på "sliding dictionary" i arkivet). Förutom den uppenbara fördelen (högre komprimering) har kontinuerliga arkiv också sina nackdelar. Eftersom data i ett kontinuerligt arkiv är en kontinuerlig ström, för att extrahera en fil måste du först packa upp alla filer som finns i arkivet före den här filen, så att extrahera filer som finns i slutet av arkivet går långsammare. Också långsammare än i ett vanligt (icke-solid) arkiv utförs operationer som ändrar innehållet i arkivet (lägga till och ta bort filer). Dessutom, om arkivet av någon anledning visar sig vara skadat, kommer det att vara möjligt att extrahera från det endast filerna som ligger före skadeplatsen, och all information efter denna plats kommer att gå förlorad. Beständiga arkiv är med andra ord bra för att packa och lagra data som sällan behöver modifieras.

Metadata

Ett arkiv innehåller nästan alltid metadata. Dessa inkluderar:

Felsökning och korrigering

Arkiv innehåller vanligtvis paritet och andra kontrollsummor för feldetektering , till exempel använder ZIP -arkiv cyklisk redundanskod (CRC) och RAR-arkiv (version 5 och senare) kan också använda de mer tillförlitliga BLAKE2-summorna. RAR- arkiv kan lägga till redundant felkorrigeringsinformation ("återställningsdata"). Dessutom stöds speciella "återställningsvolymer" i RAR-formatet, vilket gör att du kan återställa inte bara skadade, utan till och med saknade volymer i ett arkiv med flera volymer. För samma ändamål med andra arkivformat används ibland PAR-filer skapade av tredjepartsverktyg.

Se även

Litteratur