Corereference eller referensidentitet är förhållandet mellan namn - komponenter i påståendet, där namnen refererar till samma objekt (situation) av extralingvistisk verklighet ( referent ) [1] .
Tack vare coreference kan en text göras sammanhängande, ofta, men inte nödvändigtvis, i form av en anaforisk relation (ett pronominellt ord eller en bestämd betydelse - ett pronomen ).
Anaforiskt förhållande "pronominalord - pronomen": " Boken ligger på bordet. Hon är tung."
Anaforisk relation "betydelsen av visshet är ett pronomen": " Boken ligger på bordet. Tom är tung."
Metonymi : " Författaren fick allmänheten att läsa sig själv ." (här själv - författarens verk)
Ett namn i informationssystem med en tabellform av informationspresentation ( databaser , webbplatser , kalkylblad , etc.) representeras av ett attribut eller en uppsättning attribut för en tupel (för substantivfraser). Karaktär-för-symbol olika namn i sådana system kan vara coreferential, och attributen som innehåller dem kan vara semantiskt ekvivalenta . Till exempel är namnet "rengöringsmedel" en koppling till namnet "rengöringsmedel" . [2]
Utan tvekan, i avsaknad av särskilda regler, kommer centrala namn att skrivas in av operatörer av olika informationssystem olika tecken för tecken. Vanligtvis anses problemet med att bestämma den semantiska ekvivalensen för symboliska attribut vara algoritmiskt olösligt. På nivån för individuella mjukvarulösningar använder stater och världssamfundet som helhet teknologier som gör det möjligt att implicit överföra namnjämförelsefunktionen till datoroperatören och presentera resultatet i form av en kod, eller på annat algoritmiskt bekvämt sätt. form.
Framsteg inom datoranalys av naturliga språk gör det möjligt att skapa informationssystem för att lösa sådana problem där införandet av kodbeteckningar eller namnstandarder är omöjligt. Price.ru- systemet för att söka information om varor kan betraktas som en pionjär i Runet för automatisk jämförelse av semantiken för namn . Den använder metoderna för informationshämtningssystem, vilket gör att du kan fastställa den semantiska toleransen för olika namn.
De flesta av forskningen och publikationerna är relaterade till automatiseringen av upprättandet av coreferential relations i en naturlig språktext. Användningen av domänspecifika semantiska modeller gör det möjligt att effektivt utföra semantisk jämförelse av tecken-för-tecken-namn i databaser för olika tillämpade ändamål.