Slumpmässig indexering

Slumpmässig indexering  är en dimensionsreduktionsmetod och ett av tillvägagångssätten inom distributiv semantik , baserat på tron ​​att högdimensionella varianter av vektorrymdmodellen är till liten användning i praktiken och att modeller inte bör öka dimensionen när objekt (termer, dokument) ) som inte har setts tidigare dyker upp etc.) Det antas att det är möjligt att projicera en modell med högre dimensioner i ett utrymme med mindre - utan att det påverkar L2-måtten, om de slutliga måtten väljs korrekt, vilket är huvudinställningen till slumpmässiga projektioner som en dimensionsreduktionsmetod, formulerad som Johnsons lemma - Lindenstrauss .

LSH är liknande. Slumpmässig indexering som en representation av naturliga språkobjekt föreslås först i Pentti Kanervas artikel om Sparse Distributed Memory och kan beskrivas som en inkrementell konstruktion av slumpmässiga projektioner.

Det kan också visas att slumpmässig indexering är en variant av slumpmässiga projektioner för att konstruera euklidiska rum.