Beräkningslingvistik

Den aktuella versionen av sidan har ännu inte granskats av erfarna bidragsgivare och kan skilja sig väsentligt från versionen som granskades den 21 december 2021; kontroller kräver 2 redigeringar .

Datorlingvistik (även: matematisk eller beräkningslingvistik , engelsk  beräkningslingvistik ) är en vetenskaplig riktning inom området matematisk och datormodellering av intellektuella processer hos människor och djur vid skapandet av artificiella intelligenssystem , som syftar till att använda matematiska modeller för att beskriva naturliga språk .

Beräkningslingvistik överlappar naturlig språkbehandling . I det senare ligger dock inte tyngdpunkten på abstrakta modeller, utan på tillämpade metoder för att beskriva och bearbeta språk för datorsystem.

Beräkningslingvisters verksamhetsområde är utveckling av algoritmer och tillämpningsprogram för bearbetning av språklig information.

Origins

Matematisk lingvistik är en gren av vetenskapen om artificiell intelligens . Dess historia började i USA på 1950-talet. Med uppfinningen av transistorn och tillkomsten av en ny generation datorer, såväl som de första programmeringsspråken, började experiment med maskinöversättning , särskilt av ryska vetenskapliga tidskrifter. På 1960-talet utfördes liknande studier i Sovjetunionen (till exempel en artikel om översättning från ryska till armeniska i samlingen "Problems of Cybernetics" för 1964 ). Men kvaliteten på maskinöversättning är fortfarande mycket sämre än kvaliteten på mänsklig översättning. År 2021 var kvaliteten på Googles översättares maskinöversättning inte längre lika sämre än kvaliteten på mänsklig översättning. .

Från den 15 maj till den 21 maj 1958 hölls den första fackliga konferensen om maskinöversättning vid 1:a Moskvas statliga institut för främmande språk. Organisationskommittén leddes av V. Yu. Rozentsveig och verkställande sekreterare för organisationskommittén G.V. Chernov . Konferensens fullständiga program publiceras i samlingen "Machine Translation and Applied Linguistics", vol. 1, 1959 (a.k.a. Bulletin of the Machine Translation Association nr 8). Som V. Yu. Rozentsweig minns kom den publicerade samlingen av konferenssammandrag till USA och gjorde ett stort intryck där.

I april 1959 hölls den första fackliga konferensen om matematisk lingvistik i Leningrad, sammankallad av Leningrads universitet och kommittén för tillämpad lingvistik. Huvudarrangören av konferensen var N. D. Andreev . Ett antal framstående matematiker deltog i mötet, i synnerhet S. L. Sobolev , L. V. Kantorovich (senare nobelpristagare) och A. A. Markov (de två sista talade i debatten). På konferensens öppningsdag höll V. Yu. Rozentsveig ett huvudtal "General Linguistic Theory of Translation and Mathematical Linguistics".

Instruktioner för beräkningslingvistik

Beräkningslingvistikens uppgifter och riktningar inkluderar:

  1. Korpuslingvistik , skapande och användning av elektroniska textkorpus.
  2. Skapande av elektroniska ordböcker , tesaurier , ontologier . Till exempel Lingvo . Ordböcker används till exempel för automatisk översättning, stavningskontroll.
  3. Automatisk översättning av texter. Promt är populärt bland ryska översättare . Bland de gratis, är Google translate translator känd .
  4. Automatisk extraktion av fakta från text (informationsextraktion) ( engelsk  faktaextraktion, text mining )
  5. Auto -referencing ( eng.  automatisk textsammanfattning ). Denna funktion ingår i till exempel Microsoft Word .
  6. Bygga kunskapshanteringssystem . Se expertsystem .
  7. Skapande av frågesvarssystem ( engelska  frågesvarssystem ).

Stora föreningar och konferenser

Se även

Anteckningar

  1. ACL (nedlänk) . Hämtad 15 september 2010. Arkiverad från originalet 4 september 2010. 
  2. Dialog 2020/Computational Linguistics Conference . www.dialog-21.ru Hämtad 27 december 2019. Arkiverad från originalet 26 december 2019.

Länkar