Det semantiska nätverket är en informationsmodell av ämnesområdet , har formen av en riktad graf . Grafens hörn motsvarar objekten i ämnesområdet, och bågarna (kanterna) definierar förhållandet mellan dem. Objekt kan vara: koncept , händelser , egenskaper, processer [1] . Således är den semantiska webben ett av sätten att representera kunskap .
Namnet kombinerar termer från två vetenskaper: semantik i lingvistik studerar betydelsen av språkenheter, och ett nätverk i matematik är en slags graf - en uppsättning hörn sammankopplade med bågar (kanter), som tilldelas ett visst nummer. I det semantiska nätverket spelas nodernas roll av kunskapsbasens begrepp , och bågarna (för övrigt riktade) definierar förhållandet mellan dem. Det semantiska nätverket speglar alltså ämnesområdets semantik i form av begrepp och relationer.
Det är fel att sätta likhetstecken mellan begreppen "Semantic Network" ( eng. Semantic Network ) och " Semantic Web " ( eng. Semantic Web ). Även om dessa begrepp inte är likvärdiga, är de ändå relaterade (se nedan ).
Idén om systematisering på grundval av alla semantiska relationer föreslogs av forskare inom tidig vetenskap. Ett exempel på detta är Carl Linnés biologiska klassificering från 1735. Betraktad som ett semantiskt nätverk använder denna klassificering en delmängdsrelation, modern AKO (från engelskan "A Kind Of", "variety").
Förfäderna till moderna semantiska nätverk kan betraktas som existentiella grafer som föreslagits av Charles Pierce 1909 . De användes för att representera logiska påståenden i form av speciella diagram. Peirce kallade denna metod för "framtidens logik".
En viktig riktning i studiet av nätverk var den tyske psykologen Otto Selz arbete 1913 och 1922. I dem, för att organisera strukturerna för begrepp och föreningar, samt för att studera metoderna för arv av egenskaper, använde han grafer och semantiska relationer. Forskarna M. Anderson (1973), D. Norman (1975) och andra använde dessa verk för att modellera mänskligt minne och intellektuella egenskaper.
Computer Semantic Networks utvecklades i detalj av Richard Richens 1956 som en del av Cambridge Language Learning Centers maskinöversättningsprojekt . Processen för maskinöversättning är uppdelad i 2 delar: översättning av källtexten till en mellanform av representation, och sedan översätts denna mellanform till önskat språk. Semantiska nätverk var just en sådan mellanform. 1961 dök Masterman upp där hon bland annat definierade en grundläggande vokabulär för 15 000 begrepp. Dessa studier fortsattes av Robert Simmons (1966), J. Wilkes (1972) och andra vetenskapsmän.
Verk om semantiska nätverk hänvisar ofta till den amerikanske psykologen Ross Quillians arbete om " semantiskt minne " [2] .
Matematik låter dig beskriva de flesta fenomen i omvärlden i form av logiska påståenden. Semantiska nätverk uppstod som ett försök att visualisera matematiska formler. Den huvudsakliga representationen för den semantiska webben är grafen . Glöm dock inte att bakom den grafiska bilden finns det verkligen en strikt matematisk notation och att båda dessa former visar samma sak.
Den huvudsakliga formen för representation av det semantiska nätverket är en graf. Begreppen i det semantiska nätverket är skrivna i ovaler eller rektanglar och är förbundna med pilar med bildtexter - bågar (se fig.). Detta är den mest bekväma formen som uppfattas av en person. Dess brister visar sig när vi börjar bygga mer komplexa nätverk eller försöker ta hänsyn till det naturliga språkets egenskaper. Scheman av semantiska nätverk, på vilka riktningarna för navigeringsrelationer anges, kallas kunskapskartor, och deras helhet, som gör det möjligt att täcka stora delar av det semantiska nätverket, kallas en kunskapsatlas.
I matematik representeras en graf av en uppsättning hörn V och en uppsättning relationer mellan dem E. Med hjälp av matematisk logiks apparat drar vi slutsatsen att varje hörn motsvarar ett element i objektmängden, och bågen motsvarar ett predikat .
Inom lingvistik registreras relationer i ordböcker och synonymordböcker . I ordböcker, i definitioner genom genus och specifik skillnad, intar det generiska begreppet en viss plats. I synonymordboken, i artikeln för varje term, kan alla möjliga samband med andra relaterade termer anges. Från sådana tesaurier är det nödvändigt att särskilja tesauri för informationsinhämtning med listor över nyckelord i artiklar som är avsedda för drift av deskriptorsökmotorer.
För alla semantiska nätverk är uppdelningen efter aritet och antalet typer av relationer rättvis.
Förutom konceptuella grafer finns det andra modifieringar av semantiska nätverk, detta är en annan grund för klassificering ( genom implementering ). Se relevant avsnitt nedan för mer information .
Antalet typer av relationer i det semantiska nätverket bestäms av dess skapare, baserat på specifika mål. I den verkliga världen tenderar deras antal till oändlighet. Varje relation är i själva verket ett predikat, enkelt eller sammansatt. Hur snabbt man arbetar med kunskapsbasen beror på hur effektivt programmen för bearbetning av nödvändiga relationer implementeras.
Oftast finns det ett behov av att beskriva sambanden mellan element, mängder och delar av objekt. Relationen mellan ett objekt och en mängd, som anger att objektet tillhör denna mängd, kallas en klassificeringsrelation ( ISA ). En uppsättning (klass) sägs klassificera sina instanser . [3] (exempel: "Ballongen är en hund" = Ballongen är ett objekt av typen hund ). Ibland kallas denna relation också MemberOf, InstanceOf eller liknande. ISA-kommunikation förutsätter att egenskaperna hos ett objekt ärvs från en uppsättning. Det omvända förhållandet till ISA används för att beteckna exempel, varför det kallas "Exempel" eller på ryska "Exempel". Hierarkiska relationer bildar en trädstruktur .
Ofta i semantiska nätverk krävs det att man definierar förhållandet mellan synonymi och antonymi . Dessa anslutningar dupliceras antingen explicit i själva nätverket eller bestäms av den algoritmiska komponenten.
I semantiska nätverk används också ofta följande relationer :
Den här listan kan fortsätta i all oändlighet: i den verkliga världen är antalet relationer enormt. Till exempel kan relationen ”helt andra saker” eller liknande användas mellan begrepp: Не_имеют_отношения_друг_к_другу(Солнце, Кухонный_чайник).
I det semantiska nätverket kan begrepp vara både instanser av objekt och deras uppsättningar. Att använda samma relationer för både element och samlingar kan leda till förvirring. Liknande fel i driften av vissa tidiga system beskrevs i Drew McDermottsArtificial Intelligence Faces Natural Stupidity "
Låt oss ta en titt på fyra meningar:
För en person är innebörden av dessa fraser tydlig, och många skulle utan att tveka sätta i alla fyra fallen att förhållandet är far . Detta är dock ett misstag: i det första fallet beskrivs faktiskt förhållandet mellan två instanser, men i det andra och tredje - mellan en instans och en uppsättning, och i det fjärde - ett förhållande mellan representanter från två uppsättningar. I matematisk notation ser det ut så här för meningarna 1-4:
I. ∃ pavel & ∃ alexey: far (alexey, paul); IIa. ∃ paul → ∃ x ∈ män : far(x, paul); IIb. ∃ alexey → ∃ y ∈ människor : far(alexey, y); III. ∀ y ∈ människor → ∃ x ∈ män : far(x, y);Vi ser att fall IIa och IIb skiljer sig endast i ordningen av variablerna i predikatet, men detta kan spela en viktig roll för nätverkets riktighet. I exemplet är endast fyra typer av relationer listade, men det finns nio av dem för ett binärt nätverk. De skiljer sig åt i kvantifierarna ∃ och ∀, samt ordningen på variablerna.
Grafiskt, för att särskilja alla dessa fall, används speciella former av märkningsrelationer på grafen: till exempel lämnas relationer av det första slaget oförändrade, det andra slaget är skisserat med en rektangulär ram av prickar, den tredje är ett streck, och den fjärde är en streckprick. Eller så kan du bara skriva relationstypindexet bredvid.
Den vanligaste förvirringen uppstår om ISA- relationen . Därför är det i många moderna verk accepterat att ISA betecknar förhållandet mellan en instans och en mängd (ovanstående fall IIb): Murka ISA cat . En enda ram används inte i detta fall. Om det krävs att definiera en ekvivalensrelation (fall I) kan en speciell relation införas för detta (även om det för den semantiska webben finns lite behov av det). ISA kan användas för att indikera förekomsten av element från en uppsättning i en annan (fall III), men detta rekommenderas inte. För att beteckna delmängder används en annan speciell relation - AKO . Skillnaden mellan ISA in a box och AKO är att den senare också är ansvarig för att ärva egenskaperna för själva seten, och inte bara elementen.
Semantisering är processen att förändra texter där semantiska relationer urskiljs utan att ändra deras innehåll. Wikipedia har projekt för att semantisera artiklar och kategoriträdet.
Konceptet med hypertextorganisation liknar ett homogent binärt semantiskt nätverk, men det finns en betydande skillnad:
Ett försök att skapa en semantisk webb baserad på World Wide Web har kallats Semantic Web . Detta koncept involverar användningen av RDF (ett XML-baserat märkningsspråk ) och är avsett att ge länkar en mening som datorsystem kan förstå. Detta kommer att göra Internet till en distribuerad kunskapsbas på global nivå.
Kunskapsteknik | |
---|---|
Allmänna begrepp | |
Stela modeller | |
Mjuka metoder | |
Ansökningar | |
semantisk webb | |
---|---|
Grunderna | |
Underavsnitt |
|
Ansökningar |
|
Relaterade ämnen | |
Standarder |
|