Kunskapsrepresentation är en fråga som uppstår inom kognitologi (vetenskapen om tänkande) och datavetenskap , såväl som i studiet av frågor relaterade till artificiell intelligens . Inom kognitionsvetenskap handlar det om hur människor lagrar och bearbetar information. Inom datavetenskap - med urval av representationer av specifik och generaliserad kunskap , information och fakta för ackumulering och bearbetning av information i en dator . Huvuduppgiften inom artificiell intelligens (AI) är att lära sig att lagra kunskap på ett sådant sätt att program på ett meningsfullt sätt kan bearbeta den och uppnå något som liknar mänsklig intelligens .
Termen "kunskapsrepresentation" syftar oftast på metoder för kunskapsrepresentation orienterade mot automatisk bearbetning av moderna datorer , och i synnerhet representationer som består av explicita objekt ('klass av alla elefanter', 'Clyde är en individ') och av bedömningar eller uttalanden om dem ('Clyde är en elefant', 'alla elefanter är grå'). Genom att representera kunskap i denna explicita form kan datorer dra deduktiva slutsatser från tidigare lagrad kunskap ('Clyde är grå').
AI-forskare använder kunskapsrepresentationsteorier från kognitionsvetenskap. Tekniker som ramar , slutledningsregler och semantiska nätverk kom till AI från teorier om mänsklig informationsbehandling. Eftersom kunskap används för att uppnå intelligent beteende, är det grundläggande målet för disciplinen kunskapsrepresentation att hitta sätt att representera som möjliggör slutledningsprocessen, det vill säga skapandet av kunskap från kunskap.
Några frågor som uppstår i kunskapsrepresentation ur ett AI-perspektiv är:
Det har varit väldigt lite rigorös, top-down diskussion om kunskapsrepresentation, och forskningen på detta område har inte gjort några framsteg de senaste åren. Det finns välkända problem som "spridningsaktivering" (uppgiften att navigera i ett nätverk av noder), kategorisering (detta beror på selektivt arv; till exempel kan ett terrängfordon betraktas som en specialisering (specialfall) av en bil, men den ärver bara vissa egenskaper) och klassificering . Till exempel kan en tomat betraktas som både ett bär och en grönsak.
Att lösa komplexa problem kan ofta förenklas genom rätt val av kunskapsrepresentationsmetod. En viss metod kan göra vilket kunskapsområde som helst lätt representerat. Till exempel använde det diagnostiska expertsystemet MYCIN ett regelbaserat kunskapsrepresentationssystem. Fel val av presentationsmetod försvårar bearbetningen. Som en analogi kan man ta beräkningar i den indo-arabiska eller romerska notationen. Longitudinell division är lättare i det första fallet och svårare i det andra. Likaså finns det inget sätt att presentera som kan användas i alla uppgifter, eller att göra alla uppgifter lika enkla.
För att strukturera information, samt organisera kunskapsbaser och expertsystem har flera sätt att representera kunskap föreslagits. En av dem är presentationen av data och information inom den logiska modellen för kunskapsbaser.
På 1960 -talet och början av 1980 -talet föreslogs och prövades många metoder för kunskapsrepresentation med varierande framgång, såsom heuristiska frågesvarssystem , neurala nätverk , teorembevisande och expertsystem . Deras huvudsakliga användningsområde vid den tiden var medicinsk diagnostik ( MYCIN ) och spel (som schack ).
På 1980-talet uppstod formella datorspråk för kunskapsrepresentation. De viktigaste projekten på den tiden försökte koda (sätta in i sina kunskapsbaser) enorma mängder av universell kunskap. Till exempel i Cyc- projektet bearbetades ett stort uppslagsverk, och inte själva informationen som lagrades i den kodades, utan kunskapen som läsaren skulle behöva för att förstå detta uppslagsverk: naiv fysik, begreppen tid, kausalitet och motivation, typiska föremål och deras klasser. Cyc - projektet utvecklas av Cycorp, Inc. ; de flesta (men inte alla) av deras databas är fritt tillgänglig.
Detta arbete har lett till en mer korrekt bedömning av kunskapsrepresentationsuppgiftens komplexitet. Samtidigt skapades mycket större baser av språklig information inom matematisk lingvistik , och de, tillsammans med en enorm ökning av datorernas hastighet och minne, gjorde en djupare representation av kunskap mer verklig.
Flera programmeringsspråk har också utvecklats som fokuserar på kunskapsrepresentation. Prologen (utvecklad 1972, [1] men blev populär mycket senare) beskriver propositioner och grundläggande logik och kan dra slutsatser från kända premisser. KL-ONE- språket (1980-talet) är ännu mer inriktat på att representera kunskap .
Inom området elektroniska dokument har språk utvecklats som uttryckligen uttrycker strukturen för lagrade dokument, såsom SGML (och senare XML ). De har underlättat uppgifterna att söka och utvinna information , som på senare tid alltmer förknippas med uppgiften att representera kunskap. Det finns ett stort intresse för Semantic Web- teknologin , där XML-baserade kunskapsrepresentationsspråk som RDF , Topic Map och andra används för att öka tillgängligheten av information som lagras på webben till datorsystem.
Hyperlänkar används i stor utsträckning idag , men det närbesläktade begreppet semantisk länk ( en:semantic link ) har ännu inte kommit till stor användning. Matematiska tabeller har använts sedan Babylons tid . Senare användes dessa tabeller för att representera resultaten av logiska operationer, till exempel användes sanningstabeller för att studera och modellera boolesk logik . Tabellprocessorer är också ett exempel på en tabellformig representation av kunskap. Träd är en annan metod för kunskapsrepresentation , som kan användas för att visa samband mellan grundläggande begrepp och deras derivator.
En relativt ny metod för kunskapshantering är visuella representationer, som de som utvecklats av TheBrain Technologies Corp. "plex". De ger användaren ett sätt att visualisera hur en tanke eller idé relaterar till andra idéer, så att de kan flytta från en tanke till en annan i jakt på den information som krävs. Detta tillvägagångssätt utvecklas av flera företag. Andra visuella sökverktyg är från Convera , Entopia , Inc. , Epeople Inc. , och Inxight Software Inc.
En av utmaningarna i kunskapsrepresentation är hur man lagrar och bearbetar kunskap i informationssystem på ett formellt sätt så att maskiner kan använda den för att nå sina mål. Tillämpningsexempel är expertsystem , maskinöversättning , datoriserat underhåll och system för informationshämtning och -hämtning (inklusive databasanvändargränssnitt).
Semantiska nätverk kan användas för att representera kunskap. Varje nod i ett sådant nätverk representerar ett koncept, och bågar används för att definiera relationer mellan koncept.
Ett av de mest uttrycksfulla och detaljerade kunskapsrepresentationsparadigmen baserade på semantiska nätverk är MultiNet (en akronym för Multilayered Extended Semantic Networks ) .
Från och med 1960 -talet användes begreppet kunskapsram, eller helt enkelt en ram . Varje ram har sitt eget namn och en uppsättning attribut , eller platser som innehåller värden; till exempel kan en husram innehålla platser för färg , antal våningar och så vidare.
Användningen av ramar i expertsystem är ett exempel på objektorienterad programmering med egenskapsarv , vilket beskrivs av förhållandet "is-a" ("är"). Det har dock förekommit många kontroverser i användningen av "är-en"-länken : Ronald Brachman skrev en artikel med titeln "Vad är och inte är IS-A", där 29 olika semantiker av "är-en"-länken var finns i projekt vars kunskapsrepresentationsscheman inkluderade kopplingen "is-a". Andra anslutningar inkluderar till exempel " har-del " ("har sin del").
Ramstrukturer är väl lämpade för att representera kunskap i form av scheman och stereotypa kognitiva mönster. Element av sådana mönster har olika vikt, med högre vikter tilldelas de element som matchar det aktuella kognitiva schemat ( schema ). Mönstret aktiveras under vissa förhållanden: om en person ser en stor fågel, förutsatt att hans "havsschema" för närvarande är aktivt, men hans "landbaserade system" inte är det, klassificerar han det mer som en havsörn, snarare än en landgyllene Örn.
Ramrepresentationer är objektcentrerade i samma mening som den semantiska webben : alla fakta och egenskaper som är förknippade med ett koncept finns på ett ställe, så det finns inget behov av att spendera resurser på att söka i databasen.
Ett script är en typ av ram som beskriver en sekvens av händelser över tid; ett typiskt exempel är en beskrivning av att gå på restaurang . Händelser här inkluderar att vänta på en plats, läsa menyn, göra en beställning och så vidare.
Olika lösningar, beroende på deras semantiska uttrycksförmåga, kan organiseras i det så kallade semantiska spektrumet .
Vissa människor känner att det är bäst att representera kunskap som den är i det mänskliga sinnet , vilket är det enda fungerande sinne känt hittills , eller att representera kunskap i form av naturligt språk . Dr. Richard Ballard, till exempel, har utvecklat ett " teoribaserat semantiskt system " som är oberoende av språket, som härleder syfte och resonemang i samma begrepp och teorier som människor. Formeln som ligger till grund för denna semantik är: Kunskap=Teori+Information. De vanligaste applikationerna och databassystemen är baserade på språk. Tyvärr vet vi inte hur kunskap representeras i det mänskliga sinnet, eller hur man manipulerar naturliga språk på samma sätt som människor gör. En ledtråd är att primater vet hur man använder peka-och-klicka- användargränssnitt ; sålunda verkar det gesturala gränssnittet vara en del av vår kognitiva apparat, en modalitet som inte är knuten till talat språk och som finns hos andra djur än människor .
Därför har olika konstgjorda språk och notationer föreslagits för att representera kunskap . De är vanligtvis baserade på logik och matematik och har en lättläst grammatik för att underlätta maskinell bearbetning . De faller vanligtvis inom den breda domänen av ontologier .
NotationDet senaste modet inom kunskapsrepresentationsspråk är att använda XML som en syntax på låg nivå. Detta resulterar i att maskiner enkelt kan analysera och mata ut dessa kunskapsrepresentationsspråk, på bekostnad av mänsklig läsbarhet.
Första ordningens logik och Prolog-språket används ofta som den matematiska basen för dessa system för att undvika överdriven komplexitet. Men även enkla system baserade på denna enkla logik kan användas för att representera data som är mycket överlägsen bearbetningsförmågan hos nuvarande datorsystem: orsakerna avslöjas i beräkningsbarhetsteorin .
Notationsexempel:
Språk är indelade i konstgjorda och naturliga.
Naturliga språk bildades och formas av nationella eller professionella grupper av människor. Kunskap överförs från en person till en annan efter översättningen till ett språk som förstås av den som är källan till kunskap och den som är mottagaren av kunskap.
Konstgjorda språk har skapats och skapas för att koppla ihop människor med maskiner.
Exempel på konstgjorda språk som främst används för att representera kunskap:
Metoder och formalismer för kunskapsrepresentation är namnet på avsnitt I.2.4 i ACM Computing Classification System .
Denna sektion finns under:
Den innehåller följande ämnen:
Kunskapsteknik | |
---|---|
Allmänna begrepp | |
Stela modeller | |
Mjuka metoder | |
Ansökningar | |