Semantisk webb

Den aktuella versionen av sidan har ännu inte granskats av erfarna bidragsgivare och kan skilja sig väsentligt från versionen som granskades den 22 mars 2022; kontroller kräver 2 redigeringar .

Det semantiska nätverket är en informationsmodell av ämnesområdet , har formen av en riktad graf . Grafens hörn motsvarar objekten i ämnesområdet, och bågarna (kanterna) definierar förhållandet mellan dem. Objekt kan vara: koncept , händelser , egenskaper, processer [1] . Således är den semantiska webben ett av sätten att representera kunskap .

Namnet kombinerar termer från två vetenskaper: semantik i lingvistik studerar betydelsen av språkenheter, och ett nätverk i matematik är en slags graf - en uppsättning hörn sammankopplade med bågar (kanter), som tilldelas ett visst nummer. I det semantiska nätverket spelas nodernas roll av kunskapsbasens begrepp , och bågarna (för övrigt riktade) definierar förhållandet mellan dem. Det semantiska nätverket speglar alltså ämnesområdets semantik i form av begrepp och relationer.

Det är fel att sätta likhetstecken mellan begreppen "Semantic Network" ( eng. Semantic Network ) och " Semantic Web " ( eng. Semantic Web ). Även om dessa begrepp inte är likvärdiga, är de ändå relaterade (se nedan ).

Historik

Idén om systematisering på grundval av alla semantiska relationer föreslogs av forskare inom tidig vetenskap. Ett exempel på detta är Carl Linnés biologiska klassificering från 1735. Betraktad som ett semantiskt nätverk använder denna klassificering en delmängdsrelation, modern AKO (från engelskan "A Kind Of", "variety").

Förfäderna till moderna semantiska nätverk kan betraktas som existentiella grafer som föreslagits av Charles Pierce 1909 . De användes för att representera logiska påståenden i form av speciella diagram. Peirce kallade denna metod för "framtidens logik".

En viktig riktning i studiet av nätverk var den tyske psykologen Otto Selz arbete 1913 och 1922. I dem, för att organisera strukturerna för begrepp och föreningar, samt för att studera metoderna för arv av egenskaper, använde han grafer och semantiska relationer. Forskarna M. Anderson (1973), D. Norman (1975) och andra använde dessa verk för att modellera mänskligt minne och intellektuella egenskaper.

Computer Semantic Networks utvecklades i detalj av Richard Richens 1956 som en del av Cambridge Language Learning Centers maskinöversättningsprojekt . Processen för maskinöversättning är uppdelad i 2 delar: översättning av källtexten till en mellanform av representation, och sedan översätts denna mellanform till önskat språk. Semantiska nätverk var just en sådan mellanform. 1961 dök Masterman upp där hon bland annat definierade en grundläggande vokabulär för 15 000 begrepp. Dessa studier fortsattes av Robert Simmons (1966), J. Wilkes (1972) och andra vetenskapsmän.

Verk om semantiska nätverk hänvisar ofta till den amerikanske psykologen Ross Quillians arbete om " semantiskt minne " [2] .

Struktur

Matematik låter dig beskriva de flesta fenomen i omvärlden i form av logiska påståenden. Semantiska nätverk uppstod som ett försök att visualisera matematiska formler. Den huvudsakliga representationen för den semantiska webben är grafen . Glöm dock inte att bakom den grafiska bilden finns det verkligen en strikt matematisk notation och att båda dessa former visar samma sak.

Grafisk representation

Den huvudsakliga formen för representation av det semantiska nätverket är en graf. Begreppen i det semantiska nätverket är skrivna i ovaler eller rektanglar och är förbundna med pilar med bildtexter - bågar (se fig.). Detta är den mest bekväma formen som uppfattas av en person. Dess brister visar sig när vi börjar bygga mer komplexa nätverk eller försöker ta hänsyn till det naturliga språkets egenskaper. Scheman av semantiska nätverk, på vilka riktningarna för navigeringsrelationer anges, kallas kunskapskartor, och deras helhet, som gör det möjligt att täcka stora delar av det semantiska nätverket, kallas en kunskapsatlas.

Matematisk notation

I matematik representeras en graf av en uppsättning hörn V och en uppsättning relationer mellan dem E. Med hjälp av matematisk logiks apparat drar vi slutsatsen att varje hörn motsvarar ett element i objektmängden, och bågen motsvarar ett predikat .

Språklig notation

Inom lingvistik registreras relationer i ordböcker och synonymordböcker . I ordböcker, i definitioner genom genus och specifik skillnad, intar det generiska begreppet en viss plats. I synonymordboken, i artikeln för varje term, kan alla möjliga samband med andra relaterade termer anges. Från sådana tesaurier är det nödvändigt att särskilja tesauri för informationsinhämtning med listor över nyckelord i artiklar som är avsedda för drift av deskriptorsökmotorer.

Klassificering av semantiska nätverk

För alla semantiska nätverk är uppdelningen efter aritet och antalet typer av relationer rättvis.

Genom antalet typer av relationer kan nätverk vara homogena och heterogena .
- Homogena nätverk har bara en typ av släktskap (pilar), såsom den tidigare nämnda artklassificeringen (med ett enda släktskap AKO ).
- I heterogena nätverk är antalet relationstyper fler än en. Klassiska illustrationer av denna modell för kunskapsrepresentation representerar just sådana nätverk. Heterogena nätverk är av mer intresse för praktiska ändamål, men också svårare för forskning. Heterogena nätverk kan representeras som en sammanvävning av trädliknande flerskiktsstrukturer. Ett exempel på ett sådant nätverk skulle vara Wikipedia Semantic Network.
Efter aritet:
- nätverk med binära relationer (som länkar exakt två begrepp) är typiska . Binära relationer är mycket enkla och bekvämt avbildade på en graf som en pil mellan två begrepp. Dessutom spelar de en exceptionell roll i matematik.
- I praktiken kan du dock behöva relationer som kopplar samman fler än två objekt - N-ary . I det här fallet uppstår svårigheter - hur man skildra en sådan anslutning på en graf för att inte bli förvirrad. Konceptuella grafer (se nedan ) tar bort denna svårighet genom att representera varje samband som en separat nod.
Till storlek:
- För att lösa specifika problem, till exempel de som löses av artificiell intelligenssystem.
- En semantisk webb i branschskala bör fungera som grund för skapandet av specifika system, utan att göra anspråk på att vara av universell betydelse.
- Globalt semantiskt nätverk. Teoretiskt sett borde ett sådant nätverk finnas, eftersom allt i världen är sammankopplat . Kanske kommer World Wide Web en dag att bli ett sådant nätverk .

Förutom konceptuella grafer finns det andra modifieringar av semantiska nätverk, detta är en annan grund för klassificering ( genom implementering ). Se relevant avsnitt nedan för mer information .

Semantiska relationer

Antalet typer av relationer i det semantiska nätverket bestäms av dess skapare, baserat på specifika mål. I den verkliga världen tenderar deras antal till oändlighet. Varje relation är i själva verket ett predikat, enkelt eller sammansatt. Hur snabbt man arbetar med kunskapsbasen beror på hur effektivt programmen för bearbetning av nödvändiga relationer implementeras.

Hierarkisk

Oftast finns det ett behov av att beskriva sambanden mellan element, mängder och delar av objekt. Relationen mellan ett objekt och en mängd, som anger att objektet tillhör denna mängd, kallas en klassificeringsrelation ( ISA ). En uppsättning (klass) sägs klassificera sina instanser . [3] (exempel: "Ballongen är en hund" = Ballongen är ett objekt av typen hund ). Ibland kallas denna relation också MemberOf, InstanceOf eller liknande. ISA-kommunikation förutsätter att egenskaperna hos ett objekt ärvs från en uppsättning. Det omvända förhållandet till ISA används för att beteckna exempel, varför det kallas "Exempel" eller på ryska "Exempel". Hierarkiska relationer bildar en trädstruktur .

Förhållandet mellan en supermängd och en delmängd (kallad AKO - "A Kind Of", "variety"). (Exempel: "hund är ett djur" = typen med namnet hund är en undertyp av typen djur ). Ett element i en delmängd kallas hyponym ( hund ), och en supermängd kallas hypernym ( djur ), och själva relationen kallas hyponym relation . Alternativa namn är "SubsetOf" och "Subset". Denna relation bestämmer att varje element i den första uppsättningen ingår i den andra (ISA utförs för varje element), såväl som en logisk koppling mellan delmängderna själva: att den första inte är större än den andra och egenskaperna för den första set ärvs från den andra. AKO-relationen (Rod-View) används ofta för navigering i informationsutrymmet.

Ett objekt består som regel av flera delar, eller element. En dator består till exempel av en systemenhet, bildskärm, tangentbord, mus etc. En viktig relation är HasPart , som beskriver sambandet mellan delar och helheten - meronymirelationen . I det här fallet ärvs inte egenskaperna för den första uppsättningen av den andra. Meronym och holonym är motsatta begrepp:
- En meronym är ett föremål som är en del för en annan. ( Motor är en meronym för en bil .)
- En holonym är ett objekt som innehåller något annat. (Till exempel, ett hus har ett tak. Hus är en holonym för ett tak . En dator är en holonym för en bildskärm .)

Ofta i semantiska nätverk krävs det att man definierar förhållandet mellan synonymi och antonymi . Dessa anslutningar dupliceras antingen explicit i själva nätverket eller bestäms av den algoritmiska komponenten.

Extra

I semantiska nätverk används också ofta följande relationer :

funktionella anslutningar (definieras vanligtvis av verben "producerar", "influerar" ...);
kvantitativ (större än, mindre än, lika med...);
rumslig (långt ifrån, nära, bakom, under, över ...);
tillfällig (tidigare, senare, under ...);
attributiv (att ha en egenskap, att ha ett värde);
logisk (OCH, ELLER, INTE);
språklig.

Den här listan kan fortsätta i all oändlighet: i den verkliga världen är antalet relationer enormt. Till exempel kan relationen ”helt andra saker” eller liknande användas mellan begrepp: Не_имеют_отношения_друг_к_другу(Солнце, Кухонный_чайник).

Funktioner för att använda vissa typer av relationer

I det semantiska nätverket kan begrepp vara både instanser av objekt och deras uppsättningar. Att använda samma relationer för både element och samlingar kan leda till förvirring. Liknande fel i driften av vissa tidiga system beskrevs i Drew McDermottsArtificial Intelligence Faces Natural Stupidity "

Låt oss ta en titt på fyra meningar:

Pavel har en pappa som heter Alexei.
För Paul finns en far från många män.
Det finns en person för vilken Alexei är en far.
Varje person har en far till många män.

För en person är innebörden av dessa fraser tydlig, och många skulle utan att tveka sätta i alla fyra fallen att förhållandet är far . Detta är dock ett misstag: i det första fallet beskrivs faktiskt förhållandet mellan två instanser, men i det andra och tredje - mellan en instans och en uppsättning, och i det fjärde - ett förhållande mellan representanter från två uppsättningar. I matematisk notation ser det ut så här för meningarna 1-4:

I. ∃ pavel & ∃ alexey: far (alexey, paul); IIa. ∃ paul → ∃ x ∈ män : far(x, paul); IIb. ∃ alexey → ∃ y ∈ människor : far(alexey, y); III. ∀ y ∈ människor → ∃ x ∈ män : far(x, y);

Vi ser att fall IIa och IIb skiljer sig endast i ordningen av variablerna i predikatet, men detta kan spela en viktig roll för nätverkets riktighet. I exemplet är endast fyra typer av relationer listade, men det finns nio av dem för ett binärt nätverk. De skiljer sig åt i kvantifierarna ∃ och ∀, samt ordningen på variablerna.

Grafiskt, för att särskilja alla dessa fall, används speciella former av märkningsrelationer på grafen: till exempel lämnas relationer av det första slaget oförändrade, det andra slaget är skisserat med en rektangulär ram av prickar, den tredje är ett streck, och den fjärde är en streckprick. Eller så kan du bara skriva relationstypindexet bredvid.

Den vanligaste förvirringen uppstår om ISA- relationen . Därför är det i många moderna verk accepterat att ISA betecknar förhållandet mellan en instans och en mängd (ovanstående fall IIb): Murka ISA cat . En enda ram används inte i detta fall. Om det krävs att definiera en ekvivalensrelation (fall I) kan en speciell relation införas för detta (även om det för den semantiska webben finns lite behov av det). ISA kan användas för att indikera förekomsten av element från en uppsättning i en annan (fall III), men detta rekommenderas inte. För att beteckna delmängder används en annan speciell relation - AKO . Skillnaden mellan ISA in a box och AKO är att den senare också är ansvarig för att ärva egenskaperna för själva seten, och inte bara elementen.

Användning av semantiska nätverk

Semantisering

Semantisering är processen att förändra texter där semantiska relationer urskiljs utan att ändra deras innehåll. Wikipedia har projekt för att semantisera artiklar och kategoriträdet.

Artiklar semantiseras huvudsakligen med hjälp av mallar, med vissa kategorier som skapas automatiskt.
Semantiseringen av kategoriträdet består i att observera transitivitet , skapa metakategorier och organisera strukturen av underkategorier med hjälp av meningsfulla kriterier.

Den semantiska webben

Konceptet med hypertextorganisation liknar ett homogent binärt semantiskt nätverk, men det finns en betydande skillnad:

Kopplingen som görs av en hyperlänk har ingen semantik, det vill säga den beskriver inte innebörden av denna koppling. Syftet med det semantiska nätverket är att beskriva objektens relationer , och inte ytterligare information om ämnesområdet. En person kan ta reda på varför den eller den hyperlänken behövs, men denna anslutning är inte tydlig för datorn.
Hyperlänkade sidor är dokument som i regel beskriver problemsituationen som helhet. I en semantisk nät representerar hörn (vilka relationer länkar) verkliga begrepp eller objekt .

Ett försök att skapa en semantisk webb baserad på World Wide Web har kallats Semantic Web . Detta koncept involverar användningen av RDF (ett XML-baserat märkningsspråk ) och är avsett att ge länkar en mening som datorsystem kan förstå. Detta kommer att göra Internet till en distribuerad kunskapsbas på global nivå.

Programvara

Se även

Anteckningar

↑ Roussopoulos ND En semantisk nätverksmodell av databaser. — TR nr 104, Institutionen för datavetenskap, University of Toronto, 1976.
↑ Quillian, M. R. (1968). semantiskt minne. Semantisk informationsbehandling, 227-270.
↑ Grundläggande begrepp . Hämtad 15 april 2007. Arkiverad från originalet 25 januari 2007. (obestämd)

Kunskapsteknik
Allmänna begrepp	Data metadata Kunskap metakunskap Kunskapsrepresentation Kunskapsbas Ontologi semantisk webb
Stela modeller	Produkter Semantiska nätverk Ramar Logisk modell
Mjuka metoder	Neuralt nätverk evolutionär modellering rolig logik
Ansökningar	Expert system Data mining Informationsextraktion Virtuella samtalspartner Hybrid intelligenta system
Artificiell intelligens Maskininlärning naturlig språkbehandling

semantisk webb
Grunderna	World Wide Web Internet Hypertext Databas Semantiska nätverk Ontologier Beskrivningslogik
Underavsnitt	Länkad data datawebb Hyperdata Server för exekvering av affärsregel Datautrymmen
Ansökningar	Semantisk Wiki Semantisk publicering Semantisk sökning Semantisk beräkning semantisk reklam Semantisk resonemangsmekanism semantisk matchning semantisk kartläggare semantisk mäklare semantisk analys semantisk tjänsteorienterad arkitektur
Relaterade ämnen	Folksonomi Bibliotek 2.0 Webb 2.0 Länkar Informationsarkitektur Kunskapshantering kollektiv intelligens Tematiska kartor Att göra tankekartor metadata Geotaggning webbvetenskap
Standarder	Syntax : RDF RDF/XML Notation 3 Sköldpadda N-trippel JSON-LD SPARQL URI http XML Schema, ontologier : RDFS UGGLA Regelutbytesformat Semantisk webbregelspråk gemensam logik Schema.org Semantisk anteckning : RDFa eRDF GRDDL Mikroformat Mikrodata Ordböcker : DOAP FOAF SIOC Dublins kärna SKOS FLOCK Historik : Vanlig gammal semantisk HTML DAML+OLJA