Automatisk abstrahering, anteckning eller summering är skapandet av en kort version ( abstrakt , annotering ) av ett textdokument med hjälp av ett datorprogram.
Det första arbetet med automatisk referens gjordes av den amerikanske vetenskapsmannen G.P. Lun 1958 på det engelska språkets material. [1] [2] [3] Principerna för extraktiv abstraktion formulerades av J. Salton i slutet av 50-talet och början av 60-talet. [2] [4]
I Sovjetunionen var pionjärerna inom området automatisk referens V. E. Berzon, I. P. Sevbo , E. F. Skorokhodko , D. G. Lakhuti , R. G. Piotrovsky , och andra [5] [2]
Det finns två huvudsakliga tillvägagångssätt för automatisk referens: extrahera (extrahera, ytligt) och generera (abstrahera, djupt). [6] [1] [5] [2]
De viktigaste fraserna, meningarna eller styckena väljs från källtexten, vars helhet bildar ett visst utdrag, en kvasi-abstrakt. [5] I detta fall bearbetas inte dessa fragment, utan extraheras i den ordning och form som de anges i källtexten. [6]
Fördelar med tillvägagångssättet: oberoende av ämnesområdet, jämförande enkel utveckling. [1] Nackdelar: osammanhängande resultat. [ett]
Genereringsmetoder är baserade på de språkliga reglerna för naturlig språkbehandling eller artificiell intelligens. [6] De generaliserar källdokumentet väsentligt och skapar text som inte uttryckligen presenteras i det. [6]
Fördelar med metoden: den bästa kvaliteten på resultatet. [1] Nackdelar: komplexiteten i praktiskt genomförande, behovet av att samla in en stor mängd språkkunskaper. [ett]
naturlig språkbehandling | |
---|---|
Allmänna definitioner | |
Textanalys |
|
Refererar |
|
Maskinöversätta |
|
Identifiering och datainsamling | |
Tematisk modell | |
Peer review |
|
Naturligt språkgränssnitt |