Semantisk webb

Den aktuella versionen av sidan har ännu inte granskats av erfarna bidragsgivare och kan skilja sig väsentligt från versionen som granskades den 22 mars 2022; kontroller kräver 2 redigeringar .

Det semantiska nätverket  är en informationsmodell av ämnesområdet , har formen av en riktad graf . Grafens hörn motsvarar objekten i ämnesområdet, och bågarna (kanterna) definierar förhållandet mellan dem. Objekt kan vara: koncept , händelser , egenskaper, processer [1] . Således är den semantiska webben ett av sätten att representera kunskap .

Namnet kombinerar termer från två vetenskaper: semantik i lingvistik studerar betydelsen av språkenheter, och ett nätverk i matematik är en slags graf  - en uppsättning hörn sammankopplade med bågar (kanter), som tilldelas ett visst nummer. I det semantiska nätverket spelas nodernas roll av kunskapsbasens begrepp , och bågarna (för övrigt riktade) definierar förhållandet mellan dem. Det semantiska nätverket speglar alltså ämnesområdets semantik i form av begrepp och relationer.

Det är fel att sätta likhetstecken mellan begreppen "Semantic Network" ( eng.  Semantic Network ) och " Semantic Web " ( eng.  Semantic Web ). Även om dessa begrepp inte är likvärdiga, är de ändå relaterade (se nedan ).

Historik

Idén om systematisering på grundval av alla semantiska relationer föreslogs av forskare inom tidig vetenskap. Ett exempel på detta är Carl Linnés biologiska klassificering från 1735. Betraktad som ett semantiskt nätverk använder denna klassificering en delmängdsrelation, modern AKO (från engelskan "A Kind Of", "variety").

Förfäderna till moderna semantiska nätverk kan betraktas som existentiella grafer som föreslagits av Charles Pierce 1909 . De användes för att representera logiska påståenden i form av speciella diagram. Peirce kallade denna metod för "framtidens logik".

En viktig riktning i studiet av nätverk var den tyske psykologen Otto Selz arbete 1913 och 1922. I dem, för att organisera strukturerna för begrepp och föreningar, samt för att studera metoderna för arv av egenskaper, använde han grafer och semantiska relationer. Forskarna M. Anderson (1973), D. Norman (1975) och andra använde dessa verk för att modellera mänskligt minne och intellektuella egenskaper.

Computer Semantic Networks utvecklades i detalj av Richard Richens  1956 som en del av Cambridge Language Learning Centers maskinöversättningsprojekt . Processen för maskinöversättning är uppdelad i 2 delar: översättning av källtexten till en mellanform av representation, och sedan översätts denna mellanform till önskat språk. Semantiska nätverk var just en sådan mellanform. 1961 dök Masterman upp där hon bland annat definierade en grundläggande vokabulär för 15 000 begrepp. Dessa studier fortsattes av Robert Simmons (1966), J. Wilkes (1972) och andra vetenskapsmän.  

Verk om semantiska nätverk hänvisar ofta till den amerikanske psykologen Ross Quillians arbete om " semantiskt minne " [2] .

Struktur

Matematik låter dig beskriva de flesta fenomen i omvärlden i form av logiska påståenden. Semantiska nätverk uppstod som ett försök att visualisera matematiska formler. Den huvudsakliga representationen för den semantiska webben är grafen . Glöm dock inte att bakom den grafiska bilden finns det verkligen en strikt matematisk notation och att båda dessa former visar samma sak.

Grafisk representation

Den huvudsakliga formen för representation av det semantiska nätverket är en graf. Begreppen i det semantiska nätverket är skrivna i ovaler eller rektanglar och är förbundna med pilar med bildtexter - bågar (se fig.). Detta är den mest bekväma formen som uppfattas av en person. Dess brister visar sig när vi börjar bygga mer komplexa nätverk eller försöker ta hänsyn till det naturliga språkets egenskaper. Scheman av semantiska nätverk, på vilka riktningarna för navigeringsrelationer anges, kallas kunskapskartor, och deras helhet, som gör det möjligt att täcka stora delar av det semantiska nätverket, kallas en kunskapsatlas.

Matematisk notation

I matematik representeras en graf av en uppsättning hörn V och en uppsättning relationer mellan dem E. Med hjälp av matematisk logiks apparat drar vi slutsatsen att varje hörn motsvarar ett element i objektmängden, och bågen motsvarar ett predikat .

Språklig notation

Inom lingvistik registreras relationer i ordböcker och synonymordböcker . I ordböcker, i definitioner genom genus och specifik skillnad, intar det generiska begreppet en viss plats. I synonymordboken, i artikeln för varje term, kan alla möjliga samband med andra relaterade termer anges. Från sådana tesaurier är det nödvändigt att särskilja tesauri för informationsinhämtning med listor över nyckelord i artiklar som är avsedda för drift av deskriptorsökmotorer.

Klassificering av semantiska nätverk

För alla semantiska nätverk är uppdelningen efter aritet och antalet typer av relationer rättvis.

Förutom konceptuella grafer finns det andra modifieringar av semantiska nätverk, detta är en annan grund för klassificering ( genom implementering ). Se relevant avsnitt nedan för mer information .

Semantiska relationer

Antalet typer av relationer i det semantiska nätverket bestäms av dess skapare, baserat på specifika mål. I den verkliga världen tenderar deras antal till oändlighet. Varje relation är i själva verket ett predikat, enkelt eller sammansatt. Hur snabbt man arbetar med kunskapsbasen beror på hur effektivt programmen för bearbetning av nödvändiga relationer implementeras.

Hierarkisk

Oftast finns det ett behov av att beskriva sambanden mellan element, mängder och delar av objekt. Relationen mellan ett objekt och en mängd, som anger att objektet tillhör denna mängd, kallas en klassificeringsrelation ( ISA ). En uppsättning (klass) sägs klassificera sina instanser . [3] (exempel: "Ballongen är en hund" = Ballongen är ett objekt av typen hund ). Ibland kallas denna relation också MemberOf, InstanceOf eller liknande. ISA-kommunikation förutsätter att egenskaperna hos ett objekt ärvs från en uppsättning. Det omvända förhållandet till ISA används för att beteckna exempel, varför det kallas "Exempel" eller på ryska "Exempel". Hierarkiska relationer bildar en trädstruktur .

Ofta i semantiska nätverk krävs det att man definierar förhållandet mellan synonymi och antonymi . Dessa anslutningar dupliceras antingen explicit i själva nätverket eller bestäms av den algoritmiska komponenten.

Extra

I semantiska nätverk används också ofta följande relationer :

Den här listan kan fortsätta i all oändlighet: i den verkliga världen är antalet relationer enormt. Till exempel kan relationen ”helt andra saker” eller liknande användas mellan begrepp: Не_имеют_отношения_друг_к_другу(Солнце, Кухонный_чайник).

Funktioner för att använda vissa typer av relationer

I det semantiska nätverket kan begrepp vara både instanser av objekt och deras uppsättningar. Att använda samma relationer för både element och samlingar kan leda till förvirring. Liknande fel i driften av vissa tidiga system beskrevs i Drew McDermottsArtificial Intelligence Faces Natural Stupidity "

Låt oss ta en titt på fyra meningar:

  1. Pavel har en pappa som heter Alexei.
  2. För Paul finns en far från många män.
  3. Det finns en person för vilken Alexei är en far.
  4. Varje person har en far till många män.

För en person är innebörden av dessa fraser tydlig, och många skulle utan att tveka sätta i alla fyra fallen att förhållandet är far . Detta är dock ett misstag: i det första fallet beskrivs faktiskt förhållandet mellan två instanser, men i det andra och tredje - mellan en instans och en uppsättning, och i det fjärde - ett förhållande mellan representanter från två uppsättningar. I matematisk notation ser det ut så här för meningarna 1-4:

I. ∃ pavel & ∃ alexey: far (alexey, paul); IIa. ∃ paul → ∃ x ∈ män : far(x, paul); IIb. ∃ alexey → ∃ y ∈ människor : far(alexey, y); III. ∀ y ∈ människor → ∃ x ∈ män : far(x, y);

Vi ser att fall IIa och IIb skiljer sig endast i ordningen av variablerna i predikatet, men detta kan spela en viktig roll för nätverkets riktighet. I exemplet är endast fyra typer av relationer listade, men det finns nio av dem för ett binärt nätverk. De skiljer sig åt i kvantifierarna ∃ och ∀, samt ordningen på variablerna.

Grafiskt, för att särskilja alla dessa fall, används speciella former av märkningsrelationer på grafen: till exempel lämnas relationer av det första slaget oförändrade, det andra slaget är skisserat med en rektangulär ram av prickar, den tredje är ett streck, och den fjärde är en streckprick. Eller så kan du bara skriva relationstypindexet bredvid.

Den vanligaste förvirringen uppstår om ISA- relationen . Därför är det i många moderna verk accepterat att ISA betecknar förhållandet mellan en instans och en mängd (ovanstående fall IIb): Murka ISA cat . En enda ram används inte i detta fall. Om det krävs att definiera en ekvivalensrelation (fall I) kan en speciell relation införas för detta (även om det för den semantiska webben finns lite behov av det). ISA kan användas för att indikera förekomsten av element från en uppsättning i en annan (fall III), men detta rekommenderas inte. För att beteckna delmängder används en annan speciell relation - AKO . Skillnaden mellan ISA in a box och AKO är att den senare också är ansvarig för att ärva egenskaperna för själva seten, och inte bara elementen.

Användning av semantiska nätverk

Semantisering

Semantisering är processen att förändra texter där semantiska relationer urskiljs utan att ändra deras innehåll. Wikipedia har projekt för att semantisera artiklar och kategoriträdet.

Den semantiska webben

Konceptet med hypertextorganisation liknar ett homogent binärt semantiskt nätverk, men det finns en betydande skillnad:

  1. Kopplingen som görs av en hyperlänk har ingen semantik, det vill säga den beskriver inte innebörden av denna koppling. Syftet med det semantiska nätverket är att beskriva objektens relationer , och inte ytterligare information om ämnesområdet. En person kan ta reda på varför den eller den hyperlänken behövs, men denna anslutning är inte tydlig för datorn.
  2. Hyperlänkade sidor är dokument som i regel beskriver problemsituationen som helhet. I en semantisk nät representerar hörn (vilka relationer länkar) verkliga begrepp eller objekt .

Ett försök att skapa en semantisk webb baserad på World Wide Web har kallats Semantic Web . Detta koncept involverar användningen av RDF (ett XML-baserat märkningsspråk ) och är avsett att ge länkar en mening som datorsystem kan förstå. Detta kommer att göra Internet till en distribuerad kunskapsbas på global nivå.

Programvara

Se även

Anteckningar

  1. Roussopoulos ND En semantisk nätverksmodell av databaser.  — TR nr 104, Institutionen för datavetenskap, University of Toronto, 1976.
  2. Quillian, M. R. (1968). semantiskt minne. Semantisk informationsbehandling, 227-270.
  3. Grundläggande begrepp . Hämtad 15 april 2007. Arkiverad från originalet 25 januari 2007.