DJVu | |
---|---|
Förlängning | .djvu[3] eller [3].djv |
MIME -typ |
image/vnd.djvu image/x-djvu |
Signatur | AT&TFORM |
Utvecklaren | AT&T Labs-Research, LizardTech (sedan mars 2000 [1] ) |
publiceras | 1998 |
Senaste släppningen | 27 (juli 2006 [2] ) |
Formattyp | Elektroniskt dokument |
öppet format ? | Ja |
Hemsida | djvu.org |
Mediafiler på Wikimedia Commons |
DjVu (från franska déjà vu - "redan sett") är en teknik för att presentera och lagra dokument (böcker, tidskrifter, manuskript och liknande, främst skannade), med hjälp av bildkomprimering med förlust .
Tekniken utvecklades ursprungligen av Jan LeCun , Leon Bothu och Patrick Heffner vid AT&T Labs från 1996 till 2001.
Formatet är optimerat för nätverksöverföring så att sidan kan ses innan filnedladdningen är klar. En DjVu-fil kan innehålla ett textlager ( OCR ) som tillåter fulltextsökning i filen. Dessutom kan en DjVu-fil innehålla en inbyggd interaktiv innehållsförteckning och hotspots - länkar, som låter dig implementera bekväm navigering i DjVu-böcker.
För att komprimera färgbilder i DjVu används en speciell teknik som separerar originalbilden i tre lager: förgrund, bakgrund och svartvit (enbits) mask. Masken sparas med originalfilens upplösning; den innehåller bilden av texten och andra tydliga detaljer. Bakgrundsupplösningen, som behåller illustrationer och sidstruktur, sänks som standard för att spara utrymme. Förgrunden innehåller färginformation om masken; dess upplösning reduceras vanligtvis ytterligare. Sedan komprimeras bakgrunden och förgrunden med hjälp av wavelet-transformen , och masken komprimeras med JB2- algoritmen .
En egenskap hos JB2-algoritmen är att den letar efter upprepade tecken på sidan och sparar deras bild endast en gång. I flersidiga dokument delar varannan på varandra följande sidor en gemensam "ordbok" med bilder.
För att komprimera de flesta böcker kan du klara dig med bara två färger. I det här fallet används endast ett lager, vilket gör det möjligt att uppnå ett rekordkompressionsförhållande. I en typisk bok med svartvita illustrationer, skannad med 600 dpi , är den genomsnittliga sidstorleken cirka 15 KB , det vill säga cirka 100 gånger mindre än originalfilen. I närvaro av en komplex bakgrund är förstärkningen i volym vanligtvis 4-10 gånger. Men med standardinställningar använder DjVu förlustfri datakomprimering , så förlustfria komprimeringsformat används vanligtvis för särskilt viktiga dokument : PNG , JPEG 2000 , TIFF , etc. Till exempel tillhandahålls förlustfri komprimering av CJB2-verktyget från DjVuLibre -paketet .
DjVu-formatet är baserat på flera tekniker, inklusive de som utvecklats av AT&T Labs:
DjVu-formatet tillhandahåller ett textlager som innehåller text från sidan (används för att söka efter och enkelt kopiera text när man arbetar med den). Om textlagret inte är tillgängligt är den enda metoden för att få texten att utföra OCR i tredjepartsprogram.
I mars 2000 [1] sålde AT&T tekniken till LizardTech [4] som försökte utnyttja den kommersiellt, men på grund av formatets öppenhet [5] finns det gratis programvara tillgänglig för att skapa och visa DjVu-dokument för olika plattformar. Den 1 juli 2008 överförde LizardTech ledningen för DjVu till moderbolaget Celartem [6] , och den 10 juni 2009 överförde Celartem rättigheterna till DjVu -teknologin till Cuminas (tidigare Caminova [7] ) [8] .
Det finns ett öppet bibliotek DjVuLibre publicerat under GNU GPL -licensen och programkodare och tittare på det.
mediebehållare | |
---|---|
Video/ljud | |
Audio | |
musik |
|
Raster | |
Vektor | |
Komplex |
enheter och dokument ) | E-böcker (|
---|---|
Enhetsserie | |
Filformat | |
Kataloger | |
Bibliotek | |
se även |