WordNet är en engelsk lexikal databas utvecklad vid Princeton University och släppt med tillhörande programvara under en fri licens utan copyleft . Det är en elektronisk ordbok -thesaurus och en uppsättning semantiska nätverk för det engelska språket.
Ordboken består av fyra nätverk för de viktigaste delarna av talet: substantiv, verb, adjektiv och adverb. Den grundläggande vokabulärenheten i WordNet är inte ett enda ord, utan en synonym serie, det så kallade " synset " , som kombinerar nätverkets ord med liknande betydelse till en nod i det semantiska nätverket. För att underlätta för en person att använda ordboken kompletteras varje synset med en definition och exempel på användning av ord i sammanhang. Ett ord eller en fras kan förekomma i mer än ett synset och ha mer än en kategori av ordled . Varje synset innehåller en lista med synonymer eller synonyma fraser och pekare som beskriver förhållandet mellan det och andra synset. Ord som har flera betydelser ingår i flera synset och kan tilldelas olika syntaktiska och lexikaliska klasser.
Synset i WordNet är länkade av olika semantiska relationer:
WordNet beskriver även andra typer av länkar. Bland dem spelar hyponymi en speciell roll: det gör det möjligt att organisera synset i form av semantiska nätverk. För olika delar av talet kan generiska relationer ha ytterligare egenskaper och skilja sig åt i omfattning.
WordNet är gratis att använda för kommersiella och vetenskapliga ändamål. För att arbeta med det finns det flera program, många gränssnitt och API :er implementerade på de flesta möjliga språk, samt att använda DICT- protokollet , GoldenDict- programmet och andra. Dessutom finns WordNet-paket i vissa programvarulager för GNU och Linux och deras distributioner.