Lemma ( engelska lemma ) är den initiala, ordboksformen av ordet [1] . På ryska, för substantiv och adjektiv, är detta nominativ singularform, för verb och verbformer är det infinitivformen. Grundbegrepp inom området korpuslingvistik och automatisk naturlig språkbehandling . Processen med automatisk reduktion av textord till lemman kallas lemmatisering .
Till exempel kommer frasen " Tidigt på morgonen, Milas mamma tvättade ramen med tvål " efter lemmatisering se ut så här: morgon, tidigt, mamma, Mila, tvätta, ram, tvål .
Inom korpuslingvistik ger en sökning på lemma sammanhang med omnämnandet av alla ordformer av ett givet lexem . Till exempel, sökning på lemma katt kommer att returnera sammanhang som innehåller katt, katt, katt, katter, katter etc. Denna typ av sökning står i motsats till ordformssökning : i det här fallet kommer sökning på ordformen katt att returnera sammanhang som innehåller exakt denna grammatiska form av dativfallets singularis [2] .