DJVu

Den aktuella versionen av sidan har ännu inte granskats av erfarna bidragsgivare och kan skilja sig väsentligt från versionen som granskades den 4 januari 2021; kontroller kräver 4 redigeringar .
DJVu
Förlängning .djvu[3] eller [3].djv
MIME -typ image/vnd.djvu
image/x-djvu
Signatur AT&TFORM
Utvecklaren AT&T Labs-Research, LizardTech (sedan mars 2000 [1] )
publiceras 1998
Senaste släppningen 27 (juli 2006 [2] )
Formattyp Elektroniskt dokument
öppet format ? Ja
Hemsida djvu.org
 Mediafiler på Wikimedia Commons

DjVu (från franska  déjà vu  - "redan sett") är en teknik för att presentera och lagra dokument (böcker, tidskrifter, manuskript och liknande, främst skannade), med hjälp av bildkomprimering med förlust .

Tekniken utvecklades ursprungligen av Jan LeCun , Leon Bothu och Patrick Heffner vid AT&T Labs från 1996 till 2001.

Formatet är optimerat för nätverksöverföring så att sidan kan ses innan filnedladdningen är klar. En DjVu-fil kan innehålla ett textlager ( OCR ) som tillåter fulltextsökning i filen. Dessutom kan en DjVu-fil innehålla en inbyggd interaktiv innehållsförteckning och hotspots - länkar, som låter dig implementera bekväm navigering i DjVu-böcker.

Teknik som används

För att komprimera färgbilder i DjVu används en speciell teknik som separerar originalbilden i tre lager: förgrund, bakgrund och svartvit (enbits) mask. Masken sparas med originalfilens upplösning; den innehåller bilden av texten och andra tydliga detaljer. Bakgrundsupplösningen, som behåller illustrationer och sidstruktur, sänks som standard för att spara utrymme. Förgrunden innehåller färginformation om masken; dess upplösning reduceras vanligtvis ytterligare. Sedan komprimeras bakgrunden och förgrunden med hjälp av wavelet-transformen , och masken komprimeras med JB2- algoritmen .

En egenskap hos JB2-algoritmen är att den letar efter upprepade tecken på sidan och sparar deras bild endast en gång. I flersidiga dokument delar varannan på varandra följande sidor en gemensam "ordbok" med bilder.

För att komprimera de flesta böcker kan du klara dig med bara två färger. I det här fallet används endast ett lager, vilket gör det möjligt att uppnå ett rekordkompressionsförhållande. I en typisk bok med svartvita illustrationer, skannad med 600 dpi , är den genomsnittliga sidstorleken cirka 15 KB , det vill säga cirka 100 gånger mindre än originalfilen. I närvaro av en komplex bakgrund är förstärkningen i volym vanligtvis 4-10 gånger. Men med standardinställningar använder DjVu förlustfri datakomprimering , så förlustfria komprimeringsformat används vanligtvis för särskilt viktiga dokument : PNG , JPEG 2000 , TIFF , etc. Till exempel tillhandahålls förlustfri komprimering av CJB2-verktyget från DjVuLibre -paketet .

DjVu-formatet är baserat på flera tekniker, inklusive de som utvecklats av AT&T Labs:

Textrepresentation av DjVu-bilder

DjVu-formatet tillhandahåller ett textlager som innehåller text från sidan (används för att söka efter och enkelt kopiera text när man arbetar med den). Om textlagret inte är tillgängligt är den enda metoden för att få texten att utföra OCR i tredjepartsprogram.

Licensinformation

I mars 2000 [1] sålde AT&T tekniken till LizardTech [4] som försökte utnyttja den kommersiellt, men på grund av formatets öppenhet [5] finns det gratis programvara tillgänglig för att skapa och visa DjVu-dokument för olika plattformar. Den 1 juli 2008 överförde LizardTech ledningen för DjVu till moderbolaget Celartem [6] , och den 10 juni 2009 överförde Celartem rättigheterna till DjVu -teknologin till Cuminas (tidigare Caminova [7] ) [8] .

Det finns ett öppet bibliotek DjVuLibre publicerat under GNU GPL -licensen och programkodare och tittare på det.

Se även

Anteckningar

  1. 1 2 Se readme-filen för DjVuLibre -paketet -3.5.27.tar.gz
  2. DjVu-filformatversioner . DjVu-utvecklare (juli 2006). Datum för åtkomst: 16 januari 2010. Arkiverad från originalet den 13 juni 2010.
  3. 1 2 TriID - 2003.
  4. DjVuLibre Historia och krediter arkiverade 9 september 2017 på Wayback Machine 
  5. Licens . Hämtad 28 maj 2009. Arkiverad från originalet 2 maj 2009.
  6. LizardTech pressmeddelande (länk ej tillgänglig) . Hämtad 4 oktober 2008. Arkiverad från originalet 28 september 2008. 
  7. Caminova - Cuminas övergång (nedlänk) . Hämtad 25 oktober 2014. Arkiverad från originalet 5 oktober 2014. 
  8. LizardTech pressmeddelande (länk ej tillgänglig) . Hämtad 17 juli 2009. Arkiverad från originalet 16 juli 2009. 

Länkar