Provtagning med avvikelse

Den aktuella versionen av sidan har ännu inte granskats av erfarna bidragsgivare och kan skilja sig väsentligt från versionen som granskades den 24 juni 2017; verifiering kräver 1 redigering .

Outlier-sampling är en teknik som används för att ta ett urval av komplexa sannolikhetsfördelningar .

Förklaring av problemet

För sannolikhetsfördelningssampling används variansurval när formen gör urvalet direkt svårt.

Genereringen av sampel sker med en enklare hjälpfördelning som vi kan sampla och som uppfyller följande villkor:

, var .

Algoritm

  1. Ta ett prov genom distribution ;
  2. Välj ett slumpmässigt tal enhetligt från intervallet ;
  3. Beräkna ;
    • Om , då läggs till proverna;
    • Om , då avvisas (därav namnet på metoden).

Algoritmen väljer punkter enhetligt från området under grafen , vilket innebär att prover erhålls .

Exempel

Vi ger ett enkelt geometriskt exempel. Anta att vi vill välja en slumpmässig punkt inuti en cirkel med enhetsradie.

Låt oss generera en punkt genom att välja och som oberoende godtyckliga tal från segmentet . Om det visar sig att , betyder det att punkten ligger innanför cirkeln och bör accepteras. Annars förkastas punkten och nästa genereras.

Som ett annat exempel kan du överväga Ziggurat-algoritmen , som är baserad på partisk sampling. Denna algoritm används för att generera olikformigt fördelade slumptal.

Problem

Problem uppstår som regel när man löser högdimensionella problem .

Detta kommer att vara mycket stort (exponentiellt i dimension), och nästan alla prover kommer att avvisas.

Länkar

Nikolenko S. Probabilistisk inlärningskurs .