Lemma (lingvistik)

Lemma ( engelska  lemma ) är den initiala, ordboksformen av ordet [1] . På ryska, för substantiv och adjektiv, är detta nominativ singularform, för verb och verbformer är det infinitivformen. Grundbegrepp inom området korpuslingvistik och automatisk naturlig språkbehandling . Processen med automatisk reduktion av textord till lemman kallas lemmatisering .

Till exempel kommer frasen " Tidigt på morgonen, Milas mamma tvättade ramen med tvål " efter lemmatisering se ut så här: morgon, tidigt, mamma, Mila, tvätta, ram, tvål .

Lemma i korpuslingvistik

Inom korpuslingvistik ger en sökning på lemma sammanhang med omnämnandet av alla ordformer av ett givet lexem . Till exempel, sökning på lemma katt kommer att returnera sammanhang som innehåller katt, katt, katt, katter, katter etc. Denna typ av sökning står i motsats till ordformssökning : i det här fallet kommer sökning på ordformen katt att returnera sammanhang som innehåller exakt denna grammatiska form av dativfallets singularis [2] .

Lemma i informationssökning och SEO

Anteckningar

  1. Bolshakova E. I., Vorontsov K. V., Efremova N. E., Klyshinsky E. S., Lukashevich N. V., Sapin A. S. Automatisk textbehandling och dataanalys av naturligt språk: lärobok. bidrag . - M. : NRU HSE, 2017. Arkiverad kopia av 21 januari 2022 på Wayback Machine
  2. Lemma sökbeskrivning  (engelska)  ? . skissmotor . Hämtad 31 mars 2021. Arkiverad från originalet 3 mars 2021.
  3. Lemmatisering i SEO  (ryska)  ? .

Litteratur