Automatisk referens

Den aktuella versionen av sidan har ännu inte granskats av erfarna bidragsgivare och kan skilja sig väsentligt från versionen som granskades den 21 oktober 2020; kontroller kräver 3 redigeringar .

Automatisk abstrahering, anteckning eller summering  är skapandet av en kort version ( abstrakt , annotering ) av ett textdokument med hjälp av ett datorprogram.

Historik

Det första arbetet med automatisk referens gjordes av den amerikanske vetenskapsmannen G.P. Lun 1958 på det engelska språkets material. [1] [2] [3] Principerna för extraktiv abstraktion formulerades av J. Salton i slutet av 50-talet och början av 60-talet. [2] [4]

I Sovjetunionen var pionjärerna inom området automatisk referens V. E. Berzon, I. P. Sevbo , E. F. Skorokhodko , D. G. Lakhuti , R. G. Piotrovsky , och andra [5] [2]

Tillvägagångssätt

Det finns två huvudsakliga tillvägagångssätt för automatisk referens: extrahera (extrahera, ytligt) och generera (abstrahera, djupt). [6] [1] [5] [2]

Extraktiv (extraktion)

De viktigaste fraserna, meningarna eller styckena väljs från källtexten, vars helhet bildar ett visst utdrag, en kvasi-abstrakt. [5] I detta fall bearbetas inte dessa fragment, utan extraheras i den ordning och form som de anges i källtexten. [6]

Fördelar med tillvägagångssättet: oberoende av ämnesområdet, jämförande enkel utveckling. [1] Nackdelar: osammanhängande resultat. [ett]

Genererar (abstraktion)

Genereringsmetoder är baserade på de språkliga reglerna för naturlig språkbehandling eller artificiell intelligens. [6] De generaliserar källdokumentet väsentligt och skapar text som inte uttryckligen presenteras i det. [6]

Fördelar med metoden: den bästa kvaliteten på resultatet. [1] Nackdelar: komplexiteten i praktiskt genomförande, behovet av att samla in en stor mängd språkkunskaper. [ett]

Anteckningar

  1. 1 2 3 4 5 6 Batura T. V., Bakieva A. M. Metoder och system för automatisk sammanfattning av texter - Novosibirsk : 2019. - 110 s. - 100 exemplar. — ISBN 978-5-4437-0974-1
  2. 1 2 3 4 Sedova E.P. Automatisk abstraktion av vetenskapliga publikationer med hjälp av syntaktisk analys baserad på moderna artiklar om datorsyntax - St Petersburg. : 2018. - 49 sid.
  3. Luhn H. P. The Automatic Creation of Literature Abstracts  (Eng.) // IBM Journal of Research and Development / C. A. Pickover - IBM Corporation , IEEE , 1958. - Vol. 2, Iss. 2. - S. 159-165. — ISSN 0018-8646 ; 2151-8556 - doi:10.1147/RD.22.0159
  4. Salton G. Dynamisk information och biblioteksbearbetning  (engelska) - 1975. - 523 sid.
  5. 1 2 3 Trevgoda S. A. Metoder och algoritmer för automatisk textabstrahering baserad på analys av funktionella relationer - St. Petersburg. : 2009. - 157 sid. - 100 exemplar.
  6. 1 2 3 4 Osminin P. G. Moderna metoder för automatisk referens och anteckning // Bulletin of the South Ural State University - Chelyabinsk : 2012. - vol. 25. - S. 134-135.