Projekt Gutenberg | |
---|---|
engelsk Projekt Gutenberg | |
URL | gutenberg.org |
Kommersiell | Inte |
Webbplatstyp | Digitalt bibliotek |
Registrering | är gratis |
Språk) | engelsk |
Ägare | Projekt Gutenberg |
Författare | Michael Hart |
Början av arbetet | 1971 |
Nuvarande status | Arbetar |
Land | |
Mediafiler på Wikimedia Commons |
Project Gutenberg ( engelska Project Gutenberg , eller PG ) är ett offentligt ideellt initiativ som syftar till att skapa och distribuera en digital samling verk i det offentliga området . Gutenberg anses vara det äldsta digitala biblioteket i världen. De flesta av verken har digitaliserats av frivilliga och finns tillgängliga för gratis nedladdning.
Projektet skapades den 4 juli 1971, när University of Illinois -studenten Michael Hart skrev texten i USA:s självständighetsförklaring för hand och skickade den till andra användare av sitt nätverk, som vid den tiden bestod av 15 noder i ARPANET - stamfader till Internet [1] [2] . Under de kommande 20 åren tryckte Hart om cirka 100 böcker. I och med Internets spridning i början av 1990-talet gick universitetsvolontärer och redan på 2000-talet de distribuerade korrekturläsarnas organisationer med i digitaliseringen av verk . Hart skötte administrativt arbete och insamlingar för att hålla hemsidan igång. 1997 var antalet verk i samlingen 1000, 2003 - 10 000 , 2011 - 40 000 . För 2021 har projektet över 60 000 böcker i sin samling [1] .
Alla elektroniska texter är digitaliserade i 7-bitars American Standard ASCII -kod som kallas Plain Vanilla. Detta format är läsbart på alla enheter och är kompatibelt med 99 % av alla program. För böcker med tecken med accent, som de på tyska och franska, skapar Project Gutenberg också en 7-bitars ASCII-version med accenter [3] . Förutom Plain Vanilla ASCII använder Gutenberg andra format, inklusive HTML , XML , RTF , Unicode [3] .
Det formella datumet för skapandet av projektet är den 4 juli 1971, då en student vid University of Illinois, Michael Hart , manuellt skrev om texten i USA:s självständighetsförklaring och skickade den till andra användare av ARPANET -nätverket , som bestod av av 15 noder och cirka 100 registrerade användare [2] . Vid den tiden skulle skicka en 5 kilobyte fil ha orsakat ett nätverksavbrott, så Hart skickade ut en digital textlagringsplats, varefter den laddades ner av sex användare [3] [4] .
Genomförandet av projektet blev möjligt på grund av det faktum att Hart fick möjligheten att arbeta med Xerox Sigma 5 stordator - senare ansåg skaparen av projektet att datortiden som tilldelats honom var värd cirka 100 miljoner dollar . Studenten ville spendera den här tiden på ett "värdigt" projekt, men han attraherades inte av databehandling - huvudområdet för datorer vid den tiden [5] [6] .
Från en skriftlig intervju med Michael Hart [4]Jag stannade av misstag längs vägen vid vår lokala IGA livsmedelsbutik. Firandet av Amerikas tvåhundraårsjubileum var precis på väg att äga rum , och tillsammans med produkterna lade de historiska dokument gjorda av konstgjorda pergament åt mig. Så medan jag rotade i min ryggsäck efter något att äta, hittade jag USA:s självständighetsförklaring och en idé dök upp i mitt huvud. Ett tag undrade jag om jag kunde komma på något som jag kunde göra med en dator som skulle vara viktigare än att utfärda självständighetsförklaringen – något som fortfarande skulle finnas kvar om 100 år. Jag kunde dock inte komma på någonting, och Project Gutenberg föddes.
Hart kallas "den första informationsleverantören" för att ha börjat förstå webben som en ny typ av massmedia nästan 20 år innan Tim Berners-Lee formulerade konceptet World Wide Web [7] . Självständighetsförklaringen var den första e-boken i världen [4] . Därefter började Hart söka efter och digitalisera biblioteksböcker som redan var offentliga . I grund och botten var dessa grundläggande verk för USA:s historia - Bill of Rights , the Constitution , King James Bible , the Complete Works of William Shakespeare , " Alice in Wonderland " av Lewis Carroll , " Peter Pan " av James Barry och andra verk. Alla dessa böcker digitaliserades för hand, maskinskrivna av Hart och frivilliga [8] [7] [3] [9] .
Projektets filosofi bygger på tron att datorteknikens största värde ligger i bevarande och spridning av information. Det ursprungliga målet med projektet var att digitalisera de 10 000 mest populära böckerna [10] .
Med utvecklingen och den omfattande introduktionen av Internet i slutet av 1980-talet fick projektet stor popularitet. År 1990 skapades en volontärcirkel vid University of Illinois för att hjälpa Hart att skriva texter. Hastigheten på deras arbete ökade gradvis, och 1995 fylldes samlingen av projektet på med i genomsnitt 16 texter per månad. Samtidigt introducerades optisk teckenigenkänningsteknik . På 1990-talet skapades projektets första webbplats och en överenskommelse gjordes med Carnegie Mellon University i Pittsburgh om att ta över projektets ekonomi [7] .
I början av 2000-talet började Distributed Proofreaders- rörelsen, bildad av Charles Franks 2000, hjälpa projektet . Mer än tusen volontärer i flera länder arbetade med att producera och publicera texter på nätet i det offentliga rummet som hade betydande kulturell betydelse. Tack vare detta samarbete fick Gutenberg-katalogen för 2017 från 150 till 200 böcker per månad [7] . Som jämförelse, under de första 11 veckorna av 2004, lade Project Gutenberg till 313 nya e-böcker, medan de första 313 e-böckerna tog ungefär 26 år att färdigställa [4] . Under våren 2002 innehöll projektets samling nästan en fjärdedel av alla offentliga verk som var tillgängliga på Internet [3] . Redan i oktober 2003 hade projektet 10 000 e-böcker [11] .
2007 utvecklade och lanserade Wattpad och Gutenberg ett projekt tillsammans som gjorde 17 000 böcker tillgängliga för nedladdning på de flesta mobiltelefoner [12] .
I början av 2000-talet försökte Michael Hart tillsammans med grundaren av World eBook Library, John Guallardo, lansera Project Gutenberg 2. Initiativet genomfördes dock inte eftersom projektet innebar betalda nedladdningar av enskilda verk, vilket inte väckte entusiasm bland användare [10] .
Hart gick bort 2011. För 2021 var VD för projektet Gregory Newby [13] [14] .
Projektet är engagerat i digitalisering av offentligt tillgängliga verk. Processen att fylla på samlingen utförs i tre huvudsteg - genom skanning, igenkänning och korrigering. Efter att ha löst problemet med verkets juridiska status och dess licensierade renhet, skannade projektdeltagarna dokumentet och kör det optiska teckenigenkänningsprogrammet . Volontärer kontrollerar, läser och korrigerar sedan texten och jämför den med både den skannade versionen och originalsidan. I genomsnitt, även med förbättrad OCR-programvara, hittar volontärer cirka 10 fel per sida. Varje bok granskas av två olika volontärer som gör nödvändiga korrigeringar. Om originalverket är i dåligt skick, vilket ofta händer med gamla böcker, skrivs texten in manuellt. Projektpersonalen är övertygad om att korrigeringsstadiet av människor är ett av de viktigaste, eftersom att bara skanna verket och placera det i det offentliga området inte tillåter sökning i texterna [3] [15] . I genomsnitt tar det cirka 50 timmar att arbeta med en text [3] .
Alla elektroniska texter är digitaliserade i 7-bitars American Standard ASCII -kod som kallas Plain Vanilla. Detta format är läsbart på alla enheter och är kompatibelt med 99 % av alla program. För böcker med tecken med accent, som de på tyska och franska, skapar Project Gutenberg också en 7-bitars ASCII-version med accenter [3] . Förutom Plain Vanilla ASCII använder Gutenberg andra format, inklusive HTML , XML , RTF , Unicode [3] .
Vi ser e-böcker som ett nytt medium som inte har någon egentlig relation till papper, förutom att presentera samma innehåll. Jag ser dock inte hur papper kan konkurrera med elektroniska versioner, särskilt om alla hittar sitt eget bekväma sätt att använda elektroniska texter, särskilt i skolor.Michael Hart [3]
Med textigenkänning kan användare söka i litteraturen med en sökfunktion som är tillgänglig i vilken webbläsare som helst och vilken ordbehandlingsprogram som helst. I den avancerade sökningen kan du fylla i flera fält: författare, titel, ämne, språk, kategori (valfri, ljudbok, musik, bilder), LoCC ( Library of Congress katalogklassificering ), filtyp (text, PDF, HTML, XML , JPEG, etc.) e.) och numret på den elektroniska texten/e-boken [3] . Ingen avgift eller registrering krävs för att läsa online eller ladda ner verket [10] .
Portalservrarna är placerade och registrerade i USA. Av denna anledning används amerikansk lag för att fastställa upphovsrätt . Upphovsrättslagstiftningen är dock fragmenterad och kan variera avsevärt beroende på jurisdiktion. Detta kan leda till att en bok som är allmän egendom i USA är upphovsrättsskyddad i ett annat land. Portalen beskriver specifikt "användarvillkor", som anger att användare utanför USA bör kontrollera upphovsrättsvillkoren i sina länder innan de laddar ner eller distribuerar e-böcker från projektet [16] .
Lås2015 väcktes en stämningsansökan mot projektet i Tyskland på grund av bristande efterlevnad av upphovsrätten i förhållande till 18 tyska publikationer i bibliotekets samling, som var fritt tillgängliga i USA, men samtidigt skyddades av upphovsrätten i Tyskland [16] . Stämningen lämnades in på uppdrag av förlagen S. Fischer Verlag och GmbH., som ägs av Holtzbrinck Publishing Group [17] . Den 9 februari 2018 beslutade en tysk domstol att Gutenberg måste blockera tillgången till 18 verk, tillhandahålla en lista över användare som laddat upp dessa verk och betala en del av kärandens rättegångskostnader. Som svar blockerade webbplatsen tillfälligt alla IP-adresser från Tyskland [18] [19] .
2020 blockerades Project Gutenberg av internetleverantörer i Italien efter anklagelser om upphovsrättsintrång [20] .
År | Digitaliserade böcker |
---|---|
1997 | 1000 |
1999 | 2000 |
2000 | 3000 |
2001 | 4000 |
2002 | 5 000 |
2003 | 10 000 |
2005 | 15 000 |
2008 | 24 000 |
2009 | 34 000 |
2015 | 48 000 |
2018 | 56 000 |
2021 | 60 000 |
Från 1991 till 1996 fördubblades antalet publicerade verk ungefär. Förutom att digitalisera böckerna började Michael Hart koordinera arbetet för dussintals volontärer [3] . I augusti 1998 satte Hart sig som mål att lägga ut cirka 10 000 elektroniska texter på webben och i oktober 2003 hade han uppnått det. Nästa mål var digitaliseringen av 1 000 000 verk [3] .
1993 delades samlingen in i tre huvudkategorier: "lättlitteratur" (mest skönlitteratur); "tung litteratur" som Bibeln , Shakespeare eller Moby Dick ; såväl som "referenslitteratur" - Rogers synonymordbok , såväl som en uppsättning uppslagsverk och ordböcker [3] [9] .
I januari 2005 omfattade projektets samling 15 000 e-böcker och 2015 över 49 200 gratis e-böcker, som alla tidigare publicerats av prestigefyllda förlag [10] .
Eftersom projektet är baserat i USA var det ursprungligen riktat till den engelsktalande allmänheten och digitaliserade böcker uteslutande på engelska. Men sedan oktober 1997 har Hart beslutat att utöka samlingen och släppa e-böcker på andra språk, främst på engelska, franska, tyska, spanska, finska, holländska och kinesiska [3] . Redan 2004 presenterades samlingens verk på 25 språk, och i juli 2005 - på 42, inklusive Iroquois , Sanskrit , Mayaspråk [3] .
I april 1995 dök de första bilderna upp i Gutenberg-samlingen - franska grottmålningar , som i november 2000 blev tillgängliga för allmänheten i XHTML -format [3] .
CD och DVDI augusti 2003 släppte Gutenberg cd :n "Best of Gutenberg" med 600 av de mest populära verken i bibliotekets samling. I december 2003 sammanställdes DVD :n "Project Gutenberg" med 9 400 titlar - vilket vid den tiden uppgick till nästan hela samlingen av "Gutenberg". I juli 2007 släpptes en ny DVD-version med 17 000 böcker och i april 2010 släpptes en uppdaterad dubbellagers DVD med 30 000 verk. Användare kan ladda ner ISO-bilder eller begära en gratis kopia via post. Från och med oktober 2010 har projektet skickat ut cirka 40 000 skivor. För 2021 finns ISO-bilder tillgängliga för nedladdning, men gratis CD-leverans har upphört [21] [22] .
Projektets samling anses vara världens äldsta elektroniska bibliotek, och Michael Hart är skaparen av den första digitala boken [3] [9] . Biblioteket fungerade som en prototyp för ett antal andra projekt, inklusive [23] [3] :
Gutenberg samarbetar också med Internet Archive och LibriVox [31] .
Ett antal initiativ har redan avslutats - Project Gutenberg i Filippinerna, Project Europe, som drivs av det serbiska Rastko-projektet, Project Gutenberg Ryssland (även kallat "Rutenberg" efter Rysslands medeltida europeiska namn för Ruthenia ), Project Gutenberg i Taiwan , övervaka en samling e-böcker på engelska och kinesiska [32] [3] .
2016 släpptes en Android- applikation baserad på Gutenberg-samlingen [33] .
Separata projekt sysslar med konvertering av verk som digitaliserats av projektet till andra elektroniska format. Således konverterar Blackmask Online verk i åtta olika format baserat på Open eBook . Manybooks.net har konverterat projektets e-böcker till PDA -läsbara format . Bookshare , det främsta digitala biblioteket för synskadade i USA, konverterar böcker till punktskrift och DAISY [3] . Många texter används av LibriVox- projektet för att skapa ljudböcker [34] .
![]() | ||||
---|---|---|---|---|
Tematiska platser | ||||
Ordböcker och uppslagsverk | ||||
|
enheter och dokument ) | E-böcker (|
---|---|
Enhetsserie | |
Filformat | |
Kataloger | |
Bibliotek | |
se även |