Dbpedia

Dbpedia
URL dbpedia.org
Kommersiell Nej
Webbplatstyp kunskapsbas , onlinedatabas [d] , databas härledd från Wikimedia-projekt [d] och kunskapsdiagram [d]
Språk) Scala , Java , Virtuoso Server Pages
Programmeringsspråk Java och Scala
Ägare Universitetet i Leipzig och universitetet i Mannheim
Författare Universitetet i Leipzig , Universitetet i Mannheim och Hasso Platner-institutet [d]
Början av arbetet 10 januari 2007
 Mediafiler på Wikimedia Commons

DBpedia  är ett crowdsourced projekt som syftar till att extrahera strukturerad information från data skapad av Wikipedia- projektet och publicera den som datauppsättningar tillgängliga under en fri licens . Projektet har citerats av Tim Berners-Lee som en av de mest kända implementeringarna av konceptet länkad data [1] .

Projektet startades av en grupp volontärer från Free University of Berlin och University of Leipzig , i samarbete med OpenLink Software , med den första datamängden publicerad 2007 . Sedan 2012 har universitetet i Mannheim varit en aktiv deltagare i projektet .

Databaser

I april 2016 beskriver DBpedia-databaser mer än 6 miljoner koncept, varav 5,2 miljoner är klassificerade enligt ontologin , inklusive 1,5 miljoner personligheter, 810 tusen geografiska objekt, 135 tusen musikalbum, 106 tusen filmer, 20 000 videospel, 275 000 organisationer , 201 000 taxa och 5 000 sjukdomar. DBpedia innehåller 38 miljoner taggar och kommentarer på 125 språk; 25,2 miljoner länkar till bilder och 29,8 miljoner länkar till externa webbsidor; 50 miljoner externa länkar till andra RDF- databaser , 80,9 miljoner Wikipedia-kategorier.

Projektet använder Resource Description Framework (RDF) för att representera extraherad information, från och med september 2014 består baserna av mer än 9,5 miljarder RDF-trippel, varav 1,3 miljarder är hämtade från engelska Wikipedia och 5,0 miljarder är extraherade från avsnitt om andra språk .

Ett av problemen med att utvinna information från Wikipedia är att samma begrepp kan uttryckas i mallar på olika sätt, till exempel kan begreppet "födelseplats" formuleras på engelska som "födelseplats" och som "födelseplats". På grund av denna tvetydighet passerar frågan igenom båda alternativen för att få ett mer tillförlitligt resultat. För att underlätta sökning och samtidigt minska antalet synonymer utvecklades ett speciellt språk - DBpedia Mapping Language, och DBpedia-användare har möjlighet att förbättra kvaliteten på datautvinningen med hjälp av Mapping-tjänsten.

Exempel

DBpedia extraherar faktainformation från Wikipedia-sidor, vilket gör att användare kan hitta svar på frågor i situationer där den nödvändiga informationen finns i flera olika Wikipedia-artiklar. Till exempel, för att hitta alla verk av mangaillustratören Tokyo Mew Mew , är det möjligt att utföra följande SPARQL- fråga [2] :

PREFIX dbprop : < http : // dbpedia . org / property /> PREFIX db : < http : // dbpedia . org / resurs /> VÄLJ ? vem ? arbeta ? genre VAR { db : Tokyo_Mew_Mew dbprop : illustratör ? vem . ? arbete dbprop : författare ? vem . VALFRITT { ? arbete dbprop : genre ? genre } . }

Anteckningar

  1. Avskrift: Sir Tim Berners-Lee pratar med Talis om den semantiska webben Arkiverad 10 maj 2013.
  2. [1] Arkiverad 29 juli 2020 på Wayback Machine  - begäran om SPARQL till DBPedia