Stoppord , eller brusord , är en term från teorin om informationsinhämtning genom nyckelord .
Stoppord kan delas in i allmänna och beroende .
Vanliga sådana inkluderar prepositioner , suffix , particip , interjektioner , siffror , partiklar etc. Vanliga brusord exkluderas alltid från sökfrågan (förutom sökning med strikt matchning av sökfrasen), de ignoreras också när man bygger ett inverterat index . Man tror att vart och ett av de vanliga stopporden finns i nästan alla dokument i samlingen .
Beroende stoppord beror på sökfrasen. Tanken är att ta hänsyn till frånvaron av enkla ord från frågan och beroende stoppord från frågan på ett annat sätt i det hittade dokumentet.
Till exempel, när du söker efter Pushkin Alexander Sergeevich , är det vettigt att visa alla dokument som innehåller:
Men det är knappast meningsfullt att visa dokument som bara innehåller:
Det vill säga i den här frågan är brusorden Alexander och Sergeevich .
Beroende stoppord skiljer sig åt genom att de bör beaktas i sökfrågan endast om det finns betydande nyckelord i det sökta dokumentet.
sökmotoroptimering | |
---|---|
Undantag | |
Marknadsföring |
|
Sökmarknadsföring _ |
|
Spam |
|
Länkar |
|
Övrig |
|
naturlig språkbehandling | |
---|---|
Allmänna definitioner | |
Textanalys |
|
Refererar |
|
Maskinöversätta |
|
Identifiering och datainsamling | |
Tematisk modell | |
Peer review |
|
Naturligt språkgränssnitt |