Kunskapsrepresentation

Kunskapsrepresentation är en fråga som uppstår inom kognitologi (vetenskapen om tänkande) och datavetenskap , såväl som i studiet av frågor relaterade till artificiell intelligens . Inom kognitionsvetenskap handlar det om hur människor lagrar och bearbetar information. Inom datavetenskap - med urval av representationer av specifik och generaliserad kunskap , information och fakta för ackumulering och bearbetning av information i en dator . Huvuduppgiften inom artificiell intelligens (AI) är att lära sig att lagra kunskap på ett sådant sätt att program på ett meningsfullt sätt kan bearbeta den och uppnå något som liknar mänsklig intelligens .

Termen "kunskapsrepresentation" syftar oftast på metoder för kunskapsrepresentation orienterade mot automatisk bearbetning av moderna datorer , och i synnerhet representationer som består av explicita objekt ('klass av alla elefanter', 'Clyde är en individ') och av bedömningar eller uttalanden om dem ('Clyde är en elefant', 'alla elefanter är grå'). Genom att representera kunskap i denna explicita form kan datorer dra deduktiva slutsatser från tidigare lagrad kunskap ('Clyde är grå').

Kunskapsrepresentation i AI

AI-forskare använder kunskapsrepresentationsteorier från kognitionsvetenskap. Tekniker som ramar , slutledningsregler och semantiska nätverk kom till AI från teorier om mänsklig informationsbehandling. Eftersom kunskap används för att uppnå intelligent beteende, är det grundläggande målet för disciplinen kunskapsrepresentation att hitta sätt att representera som möjliggör slutledningsprocessen, det vill säga skapandet av kunskap från kunskap.

Några frågor som uppstår i kunskapsrepresentation ur ett AI-perspektiv är:

Hur representerar människor kunskap?
Vad är kunskapens natur och hur representerar vi den?
Ska presentationsschemat associeras med ett privat kunskapsområde, eller ska det vara ett generellt?
Hur uttrycksfullt är detta representationsschema?
Ska schemat vara deklarativt eller procedurmässigt?

Det har varit väldigt lite rigorös, top-down diskussion om kunskapsrepresentation, och forskningen på detta område har inte gjort några framsteg de senaste åren. Det finns välkända problem som "spridningsaktivering" (uppgiften att navigera i ett nätverk av noder), kategorisering (detta beror på selektivt arv; till exempel kan ett terrängfordon betraktas som en specialisering (specialfall) av en bil, men den ärver bara vissa egenskaper) och klassificering . Till exempel kan en tomat betraktas som både ett bär och en grönsak.

Att lösa komplexa problem kan ofta förenklas genom rätt val av kunskapsrepresentationsmetod. En viss metod kan göra vilket kunskapsområde som helst lätt representerat. Till exempel använde det diagnostiska expertsystemet MYCIN ett regelbaserat kunskapsrepresentationssystem. Fel val av presentationsmetod försvårar bearbetningen. Som en analogi kan man ta beräkningar i den indo-arabiska eller romerska notationen. Longitudinell division är lättare i det första fallet och svårare i det andra. Likaså finns det inget sätt att presentera som kan användas i alla uppgifter, eller att göra alla uppgifter lika enkla.

Historik

För att strukturera information, samt organisera kunskapsbaser och expertsystem har flera sätt att representera kunskap föreslagits. En av dem är presentationen av data och information inom den logiska modellen för kunskapsbaser.

På 1960 -talet och början av 1980 -talet föreslogs och prövades många metoder för kunskapsrepresentation med varierande framgång, såsom heuristiska frågesvarssystem , neurala nätverk , teorembevisande och expertsystem . Deras huvudsakliga användningsområde vid den tiden var medicinsk diagnostik ( MYCIN ) och spel (som schack ).

På 1980-talet uppstod formella datorspråk för kunskapsrepresentation. De viktigaste projekten på den tiden försökte koda (sätta in i sina kunskapsbaser) enorma mängder av universell kunskap. Till exempel i Cyc- projektet bearbetades ett stort uppslagsverk, och inte själva informationen som lagrades i den kodades, utan kunskapen som läsaren skulle behöva för att förstå detta uppslagsverk: naiv fysik, begreppen tid, kausalitet och motivation, typiska föremål och deras klasser. Cyc - projektet utvecklas av Cycorp, Inc. ; de flesta (men inte alla) av deras databas är fritt tillgänglig.

Detta arbete har lett till en mer korrekt bedömning av kunskapsrepresentationsuppgiftens komplexitet. Samtidigt skapades mycket större baser av språklig information inom matematisk lingvistik , och de, tillsammans med en enorm ökning av datorernas hastighet och minne, gjorde en djupare representation av kunskap mer verklig.

Flera programmeringsspråk har också utvecklats som fokuserar på kunskapsrepresentation. Prologen (utvecklad 1972, [1] men blev populär mycket senare) beskriver propositioner och grundläggande logik och kan dra slutsatser från kända premisser. KL-ONE- språket (1980-talet) är ännu mer inriktat på att representera kunskap .

Inom området elektroniska dokument har språk utvecklats som uttryckligen uttrycker strukturen för lagrade dokument, såsom SGML (och senare XML ). De har underlättat uppgifterna att söka och utvinna information , som på senare tid alltmer förknippas med uppgiften att representera kunskap. Det finns ett stort intresse för Semantic Web- teknologin , där XML-baserade kunskapsrepresentationsspråk som RDF , Topic Map och andra används för att öka tillgängligheten av information som lagras på webben till datorsystem.

Anslutningar och strukturer

Hyperlänkar används i stor utsträckning idag , men det närbesläktade begreppet semantisk länk ( en:semantic link ) har ännu inte kommit till stor användning. Matematiska tabeller har använts sedan Babylons tid . Senare användes dessa tabeller för att representera resultaten av logiska operationer, till exempel användes sanningstabeller för att studera och modellera boolesk logik . Tabellprocessorer är också ett exempel på en tabellformig representation av kunskap. Träd är en annan metod för kunskapsrepresentation , som kan användas för att visa samband mellan grundläggande begrepp och deras derivator.

En relativt ny metod för kunskapshantering är visuella representationer, som de som utvecklats av TheBrain Technologies Corp. "plex". De ger användaren ett sätt att visualisera hur en tanke eller idé relaterar till andra idéer, så att de kan flytta från en tanke till en annan i jakt på den information som krävs. Detta tillvägagångssätt utvecklas av flera företag. Andra visuella sökverktyg är från Convera , Entopia , Inc. , Epeople Inc. , och Inxight Software Inc.

Lagring och bearbetning av kunskap

En av utmaningarna i kunskapsrepresentation är hur man lagrar och bearbetar kunskap i informationssystem på ett formellt sätt så att maskiner kan använda den för att nå sina mål. Tillämpningsexempel är expertsystem , maskinöversättning , datoriserat underhåll och system för informationshämtning och -hämtning (inklusive databasanvändargränssnitt).

Semantiska nätverk

Semantiska nätverk kan användas för att representera kunskap. Varje nod i ett sådant nätverk representerar ett koncept, och bågar används för att definiera relationer mellan koncept.

Ett av de mest uttrycksfulla och detaljerade kunskapsrepresentationsparadigmen baserade på semantiska nätverk är MultiNet (en akronym för Multilayered Extended Semantic Networks ) .

Ramar

Från och med 1960 -talet användes begreppet kunskapsram, eller helt enkelt en ram . Varje ram har sitt eget namn och en uppsättning attribut , eller platser som innehåller värden; till exempel kan en husram innehålla platser för färg , antal våningar och så vidare.

Användningen av ramar i expertsystem är ett exempel på objektorienterad programmering med egenskapsarv , vilket beskrivs av förhållandet "is-a" ("är"). Det har dock förekommit många kontroverser i användningen av "är-en"-länken : Ronald Brachman skrev en artikel med titeln "Vad är och inte är IS-A", där 29 olika semantiker av "är-en"-länken var finns i projekt vars kunskapsrepresentationsscheman inkluderade kopplingen "is-a". Andra anslutningar inkluderar till exempel " har-del " ("har sin del").

Ramstrukturer är väl lämpade för att representera kunskap i form av scheman och stereotypa kognitiva mönster. Element av sådana mönster har olika vikt, med högre vikter tilldelas de element som matchar det aktuella kognitiva schemat ( schema ). Mönstret aktiveras under vissa förhållanden: om en person ser en stor fågel, förutsatt att hans "havsschema" för närvarande är aktivt, men hans "landbaserade system" inte är det, klassificerar han det mer som en havsörn, snarare än en landgyllene Örn.

Ramrepresentationer är objektcentrerade i samma mening som den semantiska webben : alla fakta och egenskaper som är förknippade med ett koncept finns på ett ställe, så det finns inget behov av att spendera resurser på att söka i databasen.

Ett script är en typ av ram som beskriver en sekvens av händelser över tid; ett typiskt exempel är en beskrivning av att gå på restaurang . Händelser här inkluderar att vänta på en plats, läsa menyn, göra en beställning och så vidare.

Olika lösningar, beroende på deras semantiska uttrycksförmåga, kan organiseras i det så kallade semantiska spektrumet .

Språk och notation

Vissa människor känner att det är bäst att representera kunskap som den är i det mänskliga sinnet , vilket är det enda fungerande sinne känt hittills , eller att representera kunskap i form av naturligt språk . Dr. Richard Ballard, till exempel, har utvecklat ett " teoribaserat semantiskt system " som är oberoende av språket, som härleder syfte och resonemang i samma begrepp och teorier som människor. Formeln som ligger till grund för denna semantik är: Kunskap=Teori+Information. De vanligaste applikationerna och databassystemen är baserade på språk. Tyvärr vet vi inte hur kunskap representeras i det mänskliga sinnet, eller hur man manipulerar naturliga språk på samma sätt som människor gör. En ledtråd är att primater vet hur man använder peka-och-klicka- användargränssnitt ; sålunda verkar det gesturala gränssnittet vara en del av vår kognitiva apparat, en modalitet som inte är knuten till talat språk och som finns hos andra djur än människor .

Därför har olika konstgjorda språk och notationer föreslagits för att representera kunskap . De är vanligtvis baserade på logik och matematik och har en lättläst grammatik för att underlätta maskinell bearbetning . De faller vanligtvis inom den breda domänen av ontologier .

Notation

Det senaste modet inom kunskapsrepresentationsspråk är att använda XML som en syntax på låg nivå. Detta resulterar i att maskiner enkelt kan analysera och mata ut dessa kunskapsrepresentationsspråk, på bekostnad av mänsklig läsbarhet.

Första ordningens logik och Prolog-språket används ofta som den matematiska basen för dessa system för att undvika överdriven komplexitet. Men även enkla system baserade på denna enkla logik kan användas för att representera data som är mycket överlägsen bearbetningsförmågan hos nuvarande datorsystem: orsakerna avslöjas i beräkningsbarhetsteorin .

Notationsexempel:

DATR är ett exempel på lexikal kunskapsrepresentation
RDF är en enkel notation för att representera relationer mellan och mellan objekt .

Språk

Språk är indelade i konstgjorda och naturliga.

Naturliga språk bildades och formas av nationella eller professionella grupper av människor. Kunskap överförs från en person till en annan efter översättningen till ett språk som förstås av den som är källan till kunskap och den som är mottagaren av kunskap.

Konstgjorda språk har skapats och skapas för att koppla ihop människor med maskiner.

Exempel på konstgjorda språk som främst används för att representera kunskap:

CykelL
IKL
KIF
VÄVSTOL
UGGLA
KM : Knowledge Machine ( ett ramspråk som används för kunskapsrepresentationsuppgifter)
språkprolog _

Metoder och formalismer

Metoder och formalismer för kunskapsrepresentation är namnet på avsnitt I.2.4 i ACM Computing Classification System .

Denna sektion finns under:

Den översta kategorin, I Beräkningsmetoder och
Andra nivån kategori, I.2 Artificiell intelligens .

Den innehåller följande ämnen:

ramar och skript
modal logik
Första beställningslogik
Relationssystem
Presentationsspråk
Visningar (procedurmässiga och regelbaserade)
Semantiska nätverk
Temporal logik
språkprolog _
Logisk programmering
Kunskapsbas
Expert system
Kognitiv modellering
Konvergerad förvaltning

Se även

Anteckningar

↑ AI-ämnen . Hämtad 13 april 2007. Arkiverad från originalet 29 januari 2007. (obestämd)

Litteratur

Joseph Giarratano, Gary Riley. Kapitel 2. Kunskapsrepresentation (i PDF) // Expertsystem: Principer för utveckling och programmering = Expertsystem: Principer och programmering. - 4:e uppl. - M. : "Williams" , 2006. - S. 1152. - ISBN 978-5-8459-1156-8 .
Amaravadi, CS, "Knowledge Management for Administrative Knowledge," Expert Systems, 25(2), s 53-61, maj 2005.
Ronald J. Brachman ; Vad IS-A är och inte är. En analys av taxonomiska länkar i semantiska nätverk; IEEE Computer, 16(10); oktober 1983 [1]
Jean-Luc Hainaut, Jean-Marc Hick, Vincent Englebert, Jean Henrard, Didier Roland: Understanding Implementations of IS-A Relations. ER 1996: 42-57 [2]
Hermann Helbig: Knowledge Representation and the Semantics of Natural Language , Springer, Berlin, Heidelberg, New York 2006
Arthur B. Markman: Knowledge Representation Lawrence Erlbaum Associates, 1998
Michael Negnevitsky: Artificiell intelligens, A Guide to Intelligent Systems , Pearson Education Limited, 2002
John F. Sowa: Kunskapsrepresentation : logiska, filosofiska och beräkningsgrunder. Brooks/Cole: New York, 2000
Adrian Walker, Michael McCord, John F. Sowa och Walter G. Wilson: Knowledge Systems and Prolog , andra upplagan, Addison-Wesley, 1990
Subbotin S. O. Databearbetning av kunskap i systemen för styckeintelligens och förbättring av lösningen: Manual. - Zaporizhzhya: ZNTU, 2008. - 341 sid.

Länkar

Vad är kunskapsrepresentation? Arkiverad 7 november 2005 på Wayback Machine av Randal Davis och andra (EN)
An Introduction to Knowledge Modeling Arkiverad 2 april 2007 på Pizhman Mahfi 's Wayback Machine (EN)
Introduktion till beskrivande logik Arkiverad 9 februari 2009 på Wayback Machine Enrico Franconi, fakulteten för datavetenskap, Fria universitetet i Bolzano, Italien
DATR Representationsspråk för lexikalisk kunskap Arkiverad 17 februari 2016 på Wayback Machine
Project Loom hemsida Arkiverad 5 april 2007 på Wayback Machine
Beskrivning Logik i praktiken: EN KLASSISK applikation arkiverad 4 april 2006 på Wayback Machine
Rule Markup Initiative
Schema
Nelements KOS Arkiverad 1 mars 2021 på Wayback Machine - ett generiskt 3d-kunskapsrepresentationssystem
Representation av kunskap i intelligenta system
Kognitionsvetenskap Arkiverad 10 maj 2009 på Wayback Machine

Kunskapsteknik
Allmänna begrepp	Data metadata Kunskap metakunskap Kunskapsrepresentation Kunskapsbas Ontologi semantisk webb
Stela modeller	Produkter Semantiska nätverk Ramar Logisk modell
Mjuka metoder	Neuralt nätverk evolutionär modellering rolig logik
Ansökningar	Expert system Data mining Informationsextraktion Virtuella samtalspartner Hybrid intelligenta system
Artificiell intelligens Maskininlärning naturlig språkbehandling