Frågesvarssystem ( QA-system ; från engelska QA - English Question-answering system ) är ett informationssystem som kan ta emot frågor och besvara dem på naturligt språk , med andra ord är det ett system med ett naturligt språkgränssnitt.
Frågesvarssystem kan delas in i:
De första QA-systemen [1] utvecklades på 1960 -talet och var naturliga språkskal för domänspecifika expertsystem . Moderna system är utformade för att söka efter svar på frågor i tillhandahållna dokument med hjälp av NLP-tekniker ( natural language processing ).
Moderna QA-system inkluderar vanligtvis en speciell modul - frågeklassificerare , som bestämmer typen av fråga och följaktligen det förväntade svaret. Efter denna analys tillämpar systemet gradvis mer och mer komplexa och subtila NLP-metoder på de tillhandahållna dokumenten, vilket kasserar onödig information. Den grovaste metoden, dokumentsökningar , innebär att man använder ett informationshämtningssystem för att välja delar av text som potentiellt innehåller ett svar. Filtret markerar sedan fraser som liknar det förväntade svaret (till exempel för frågan "Vem ..." kommer filtret att returnera bitar av text som innehåller personers namn). Och slutligen kommer svarsmarkeringsmodulen att hitta det korrekta svaret bland dessa fraser.
Prestandan hos ett fråge-svar-system beror på effektiviteten hos de textanalysmetoder som används och på textbasens kvalitet - om det inte finns några svar på frågor i det kommer QA-systemet inte att kunna hitta mycket. Ju större databasen är, desto bättre, men bara om den innehåller nödvändig information. Stora arkiv (som Internet) innehåller mycket redundant information [2] . Detta leder till följande punkter:
2002 skrev en grupp forskare en forskningsplan för frågesvarssystem [3] . Det föreslogs att ta upp följande frågor:
Frågetyper Olika frågor kräver olika metoder för att hitta svar. Därför är det nödvändigt att sammanställa eller förbättra metodologiska listor över typer av möjliga frågor. Frågehantering Samma information kan begäras på olika sätt. Det krävs för att skapa effektiva metoder för att förstå och bearbeta meningens semantik (betydelse). Det är viktigt att programmet känner igen frågor som är likvärdiga i betydelse, oavsett stil , ord, syntaktiska relationer och idiom som används . Jag skulle vilja att QA-systemet delar upp komplexa frågor i flera enkla, och korrekt tolkar sammanhangskänsliga fraser, eventuellt förtydligar dem med användaren under dialogen. Kontextuella frågor Frågor ställs i ett specifikt sammanhang . Kontext kan förfina en fråga, ta bort oklarheter eller följa användarens tankegångar genom en rad frågor. Kunskapskällor för ett QA-system Innan du svarar på frågan skulle det vara trevligt att fråga om de tillgängliga textbaserna. Vilka textbehandlingsmetoder som än används kommer vi inte att hitta rätt svar om det inte finns i databaserna. Markera svar Det korrekta utförandet av denna procedur beror på frågans komplexitet, dess typ, sammanhang, kvaliteten på de tillgängliga texterna, sökmetoden etc. - ett stort antal faktorer. Därför är det nödvändigt att närma sig studiet av textbehandlingsmetoder med all försiktighet, och detta problem förtjänar särskild uppmärksamhet. Svarsformulering Svaret bör vara så naturligt som möjligt. I vissa fall räcker det att bara markera det från texten. Till exempel, om ett namn krävs (namn på en person, namn på en enhet, sjukdom), värde (valutakurs, längd, storlek) eller datum ("När föddes Ivan the Terrible?") - det räcker med ett direkt svar . Men ibland måste du hantera komplexa frågor, och här behöver du speciella algoritmer för att slå samman svar från olika dokument. Svara på frågor i realtid Det är nödvändigt att skapa ett system som kan hitta svar i arkiv på några sekunder, oavsett frågans komplexitet och oklarhet, storleken och viddigheten av dokumentbasen. Flerspråkiga frågor Utveckling av system för att arbeta och söka på andra språk (inklusive automatisk översättning ). interaktivitet Ofta är informationen som ett QA-system erbjuder som svar ofullständig. Kanske har systemet felidentifierat frågetypen eller missuppfattat den. I det här fallet kanske användaren inte bara vill omformulera sin begäran, utan också "förklara" med programmet med hjälp av en dialog. Resonemangsmekanism (inferens) Vissa användare vill ha ett svar som går utöver de tillgängliga texterna. För att göra detta är det nödvändigt att till QA-systemet lägga till kunskap som är gemensam för de flesta områden (se Allmänna ontologier inom datavetenskap ), samt verktyg för att automatiskt härleda ny kunskap. Användarprofiler för QA-system Information om användaren, såsom intresseområde, sätt att tala och resonemang, standardfakta, kan avsevärt öka systemets prestanda.Sedan uppkomsten av de första prototyperna av frågesvarssystem har deras omfattning utökats avsevärt [4] . De används till exempel i svar på frågor relaterade till tid, geolokaliseringsfrågor, definitionsfrågor, bibliografiska, flerspråkiga frågor, frågor relaterade till multimedia (visuell, ljud- och videoinformation). Närliggande områden studeras, såsom att bygga interaktiva QA-system (förtydliga frågor som krävs för att förtydliga originalet), återanvända svar och representera kunskap, använda slutsatser från tillgänglig information för att få svar på frågor, etc., förutsäga vilka frågor som kan ställas, sentiment analys.
Frågesvarssystem diskuteras löpande inom ramen för projekt: TREC [5] , CLEF[6] , NTCIR [7] , ROMIP [8] .
naturlig språkbehandling | |
---|---|
Allmänna definitioner | |
Textanalys |
|
Refererar |
|
Maskinöversätta |
|
Identifiering och datainsamling | |
Tematisk modell | |
Peer review |
|
Naturligt språkgränssnitt |
Webb och hemsidor | |
---|---|
globalt | |
Lokalt | |
Typer av webbplatser och tjänster |
|
Skapande och underhåll | |
Typer av layouter, sidor, webbplatser | |
Teknisk | |
Marknadsföring | |
Samhälle och kultur |