Bayes koefficient

Den Bayesianska koefficienten  är ett Bayesianskt alternativ till statistisk hypotestestning [1] [2] . Bayesian Model Comparison  är en metod för att välja modeller baserat på Bayes-koefficienter. De modeller som diskuteras är statistiska modeller [3] . Syftet med Bayes-koefficienten är att kvantifiera stödet för en modell över en annan modell, oavsett om modellerna är korrekta eller inte [4] . Den tekniska definitionen av "stöd" i samband med Bayesiansk slutledning ges nedan.

Definition

Bayes-koefficienten är sannolikhetskvoten för den marginella sannolikheten för två hypoteser, vanligtvis nollhypotesen och alternativet [5] .

Den bakre sannolikheten för en modell M som ges av data D ges av Bayes teorem :

Den nyckeldataberoende termen är sannolikheten för modell M givet data D , och den representerar sannolikheten att en del av data erhålls förutsatt att modell M accepteras . Den korrekta beräkningen av denna term är nyckeln till Bayesiansk jämförelse av modeller.

Givet ett modellvalsproblem där vi måste välja mellan två modeller baserat på observerade data D , ges den relativa sannolikheten för två olika modeller M 1 och M 2 , parametriserade av parametervektorerna och , av Bayes-koefficienten K , definierad som

Om två modeller a priori är lika sannolika, så är Bayes-koefficienten lika med förhållandet mellan de bakre sannolikheterna för modellerna M 1 och M 2 . Om sannolikheten som motsvarar den maximala sannolikhetsuppskattningen av parametern för varje statistisk modell används istället för Bayes-koefficientintegralen , blir testet ett klassiskt sannolikhetskvotstest . Till skillnad från sannolikhetskvotstestet, beror jämförelsen av Bayesiansk modell inte på någon speciell uppsättning parametrar, eftersom den beräknas genom att integrera över alla parametrar i varje modell (med hänsyn till tidigare sannolikheter ). Fördelen med att använda Bayes-koefficienter är dock att de automatiskt och helt naturligt inkluderar en straffavgift för överintegrering av modellstruktur [6] . Detta skyddar mot överträning . I fallet med modeller för vilka den explicita formen av sannolikhetsfunktionen är okänd eller dess beräkning är för dyr, kan ungefärliga Bayesianska beräkningar [7] användas för Bayesiansk modellval [en] [7] , även om det bör vara beaktas att den ungefärliga Bayesianska uppskattningen av Bayes koefficienter ofta är partisk [8] .

Andra tillvägagångssätt:

Tolkning

Ett värde på K > 1 betyder att hypotes M 1 stöds starkare av data än hypotes M 2 . Observera att klassiska statistiska hypotestestning är standard till en enstaka hypotes (eller modell) (" nollhypotesen ") och endast beaktar bevisen mot den. Harold Jeffries ger en tabell för tolkning av det erhållna värdet på K [9] :

K dhart bitar Vikt av bevis
< 10 0 0 Negativ (stöder M 2 )
10 0 ...10 1/2 0...5 0...1,6 Knappt anmärkningsvärt
10 1/2 ...10 1 5...10 1.6...3.3 Signifikant
10 1 ...10 3/2 10...15 3,3...5,0 stark
10 3/2 ...10 2 15...20 5.0...6.6 Väldigt stark
> 10 2 > 20 > 6,6 övertygande

Den andra kolumnen ger motsvarande stödvikter i enheter av decihartli (även känd som decibans ), bitar som läggs till i den tredje kolumnen för tydlighetens skull. Enligt I. J. Good kan människor i vardagen knappast rimligen uppskatta skillnaden i graden av förtroende för hypotesen som motsvarar en viktförändring med 1 deciban eller 1/3 bit (till exempel ett utfallsförhållande på 4:5 i 9 försök med två möjliga utfall) [10] .

En alternativ brett citerad tabell har föreslagits av Kass och Raftery (1995) [6] :

logga 10 K K Vikt av bevis
0 till 1⁄2 _ _ 1 till 3.2 Värt att bara nämna
från 1⁄2 till 1 _ från 3,2 till 10 Positiv
1 till 2 från 10 till 100 stark
> 2 > 100 Väldigt stark

Användningen av Bayes-koefficienter eller klassisk statistisk hypotestestning sker i samband med slutledning , inte beslutsfattande under osäkerhet . Det vill säga att vi bara vill hitta vilken hypotes som är korrekt, snarare än att ta ett riktigt beslut baserat på den informationen. Frekvensstatistik gör en strikt åtskillnad mellan de två tillvägagångssätten, eftersom klassiska hypotestestmetoder inte är koherenta i Bayesiansk mening. Bayesianska procedurer, inklusive Bayes-koefficienter, är koherenta, så det finns ingen anledning att göra denna distinktion. Slutledning ses då helt enkelt som ett specialfall av beslutsfattande under osäkerhet, där den slutliga åtgärden är att returnera ett värde. För beslutsfattande kan statistiker som använder Bayesian-metoden använda Bayes-koefficienten tillsammans med en förfördelning och en förlustfunktion . I samband med utdata kommer förlustfunktionen att ha formen av regeln för beräkning av resultatet . Att använda den logaritmiska poängregeln , till exempel, resulterar i förväntad nytta , som tar formen av Kullback-Leibler-divergensen .

Exempel

Låt oss säga att vi har en slumpvariabel som kräver antingen framgång eller misslyckande. Vi vill jämföra en modell M 1 , där sannolikheten för framgång är q = ½ , och en annan modell M 2 , där värdet på q är okänt, och vi tar som den tidigare fördelningen för q den enhetliga fördelningen på [0,1 ]. Vi gör 200 försök och får 115 framgångar och 85 misslyckanden. Sannolikheten kan beräknas enligt binomialfördelningen :

Sedan har vi för hypotesen M 1

medan för M 2

Förhållandet mellan dessa värden är 1,197..., därför är skillnaden "knappt anmärkningsvärd", även om valet lutar något mot M 1 .

Att testa dessa statistiska hypoteser på basis av frekvensinferensen M 1 (här betraktad som nollhypotesen ) kommer att ge ett helt annat resultat. Ett sådant test anger att M1-hypotesen ska förkastas vid 5 % signifikansnivå, eftersom sannolikheten för att få 115 eller fler framgångar från ett urval av 200 objekt vid q = ½ är 0,0200, och det tvåsidiga testet för att erhålla ett extremum på 115 eller mer ger 0,0400. Observera att 115 skiljer sig från 100 med mer än två standardavvikelser . Således, medan testning av en statistisk hypotes baserad på frekvensinferens ger statistisk signifikans på 5%-nivån, är det osannolikt att Bayes koefficient accepterar detta som ett extremt resultat. Observera dock att en icke-homogen tidigare fördelning (till exempel en som återspeglar förväntningarna att antalet framgångar och misslyckanden kommer att vara av samma storleksordning) kan resultera i en Bayesiansk koefficient som är mer överensstämmande med frekvensinferenstestning .

I ett klassiskt sannolikhetsförhållandetest skulle den maximala sannolikhetsuppskattningen för q befinnas vara 115 200 = 0,575 , varav

(istället för att ta ett medelvärde över alla möjliga q ). Detta ger ett sannolikhetsförhållande på 0,1045 och pekar på M 2 - hypotesen .

M 2 är en mer komplex modell än M 1 eftersom den har en fri parameter som gör att du kan beskriva data mer konsekvent. Förmågan hos Bayes-koefficienter att ta hänsyn till detta är anledningen till att Bayesiansk slutledning framförs som en teoretisk motivering och generalisering av Occams rakhyvel , där typ I-fel reduceras [11] .

Å andra sidan tar den moderna relativa sannolikhetsmetoden hänsyn till antalet fria modellparametrar, i motsats till det klassiska sannolikhetsförhållandet. Den relativa sannolikhetsmetoden kan tillämpas enligt följande. Modell M 1 har 0 parametrar, och därför är dess Akaike Information Criterion (AIC) värde 2 · 0 − 2 ln 0,005956 ≈ 10,2467 . Modell M 2 har 1 parameter, och därför är dess AIC-värde 2 · 1 − 2 ln 0,056991 ≈ 7,7297 . Därför är det mindre sannolikt att M 1 minimerar informationsförlust än M 2 , ungefär med en faktor exp((7,7297 − 10,2467)/2) ≈ 0,284 gånger. Sålunda är M2 något att föredra, men M1 kan inte kasseras.

Applikation

Se även

Statistiska indikatorer

Anteckningar

  1. Goodman (1), 1999 , sid. 995–1004.
  2. Goodman (2), 1999 , sid. 1005–13.
  3. Morey, Romeijn, Rouder, 2016 , sid. 6–18.
  4. Ly, Verhagen, Wagenmakers, 2016 , sid. 19-32.
  5. Bra, Hardin, 2012 , sid. 129-131.
  6. 1 2 Kass, Raftery, 1995 , sid. 791.
  7. Toni, Stumpf, 2009 , sid. 104–10.
  8. Robert, Cornuet, Marin, Pillai, 2011 , sid. 15112–15117.
  9. Jeffreys, 1961 , sid. 432.
  10. Bra, 1979 , sid. 393-396.
  11. ↑ Att skärpa Ockhams rakkniv på en Bayesian Strop . Hämtad 5 januari 2019. Arkiverad från originalet 12 september 2015.
  12. Hajiramezanali, Dadaneh, Figueiredo, Sze, Zhou, Qian, 2018 .

Litteratur

Länk