Bullerord

Stoppord , eller brusord , är en term från teorin om informationsinhämtning genom nyckelord .

Stoppord kan delas in i allmänna och beroende .

Vanliga sådana inkluderar prepositioner , suffix , particip , interjektioner , siffror , partiklar etc. Vanliga brusord exkluderas alltid från sökfrågan (förutom sökning med strikt matchning av sökfrasen), de ignoreras också när man bygger ett inverterat index . Man tror att vart och ett av de vanliga stopporden finns i nästan alla dokument i samlingen .

Beroende stoppord beror på sökfrasen. Tanken är att ta hänsyn till frånvaron av enkla ord från frågan och beroende stoppord från frågan på ett annat sätt i det hittade dokumentet.

Till exempel, när du söker efter Pushkin Alexander Sergeevich , är det vettigt att visa alla dokument som innehåller:

Men det är knappast meningsfullt att visa dokument som bara innehåller:

Det vill säga i den här frågan är brusorden Alexander och Sergeevich .

Beroende stoppord skiljer sig åt genom att de bör beaktas i sökfrågan endast om det finns betydande nyckelord i det sökta dokumentet.

Se även

Litteratur