Lindleys paradox

Lindleys paradox är en situation i statistik där de Bayesianska och frekventistiska inställningen till problemet med att testa hypoteser ger olika resultat för vissa val av den tidigare fördelningen . Frågan om oenighet mellan de två synsätten diskuterades i en bok från 1939 av Harold Jeffreys [1] . Problemet blev känt som Lindleys paradox efter att Dennis Lindley inte höll med paradoxen i en tidning från 1957 [2] .

Även om situationen beskrivs som en paradox , kan skillnaden mellan Bayesianska och frekventistiska tillvägagångssätt förklaras som att de används för att svara på fundamentalt olika frågor, snarare än en faktisk oenighet mellan de två metoderna.

Hur det än må vara, för en stor klass beror de a priori skillnaderna mellan de frekventistiska och Bayesianska synsätten på bevarandet av signifikansnivån. Som Lindley förstod, "kan teorin inte motivera praktiken att upprätthålla signifikansnivån" och till och med "en del av beräkningarna som professor Pearson gjorde i diskussionen om denna artikel belyser hur mycket signifikansnivån kan förändras med urvalsstorleken om förluster och tidigare sannolikheter förblir oförändrade" [2] . Faktum är att om det kritiska värdet växer tillräckligt snabbt med urvalsstorleken, blir oöverensstämmelsen mellan frekventistiska och Bayesianska tillvägagångssätt försumbar [3] [4] .

Beskrivning av paradoxen

Tänk på resultatet av ett experiment med två möjliga förklaringar, hypoteser och , och viss tidigare fördelning , som representerar osäkerheten om vilken hypotes som är mer exakt innan du överväger .

Lindleys paradox finns i fallet med:

  1. Resultatet visar sig vara "signifikant" för frekvenshypotestestet , vilket visar betydande bevis för att förkasta hypotesen , säg på 5%-nivån.
  2. Den bakre sannolikheten för hypotesen som ges av resultatet är hög, vilket starkt tyder på att hypotesen överensstämmer mer med än hypotesen .

Dessa resultat kan hända samtidigt om de är mycket specifika, mer otydliga och den tidigare fördelningen inte gynnar någon av dem, som visas nedan.

Numeriskt exempel

Vi kan illustrera Lindleys paradox med ett numeriskt exempel. Föreställ dig en stad där 49 581 pojkar och 48 870 flickor föddes under en viss tid. Den observerade andelen pojkar är 49581/98451 ≈ 0,5036. Vi antar att antalet pojkfödslar är en binomial variabel med parameter . Vi vill kontrollera om det är lika med 0,5 eller något annat värde. Det vill säga vår nollhypotes är: , och den alternativa hypotesen är .

Frequency approach

Frekvenstestmetoden går ut på att beräkna ett p-värde , sannolikheten för att observera en andel pojkar åtminstone förutsatt att hypotesen är sann. Eftersom antalet födslar är stort kan vi använda den normala approximationen för andelen pojkfödslar , med och för att beräkna

Vi skulle också bli förvånade om vi överväger födelsen av 48870 flickor, det vill säga , så frekvenstestet skulle normalt göra ett tvåsidigt test, för vilket p-värdet skulle vara . I båda fallen är p-värdet mindre än signifikansnivån på 5 %, så att det frekventistiska tillvägagångssättet förkastar hypotesen som oförenlig med de observerade data.

Bayesian approach

Förutsatt att det inte finns någon anledning att föredra en hypotes framför en annan, är den Bayesianska metoden att tilldela tidigare sannolikheter , en enhetlig fördelning, till hypotesen , och sedan beräkna den bakre sannolikheten för att använda Bayes sats .

Efter att ha observerat födelsen av pojkar från nyfödda kan vi beräkna den bakre sannolikheten för varje hypotes med hjälp av massfördelningsfunktionen för den binomiala variabeln,

var är betafunktionen för .

Från dessa värden finner vi den bakre sannolikheten , som starkt föredrar över .

De två synsätten, frekventistiska och bayesianska, är i konflikt, och detta är "paradoxen".

Försoning av Bayesianska och frekventistiska tillvägagångssätt

Men, åtminstone i Lindleys exempel, om vi tar en sekvens av signifikansnivåer så att c , så tenderar den bakre sannolikheten för nollhypotesen till 0, vilket är förenligt med förkastandet av nollhypotesen [3] . I vårt numeriska exempel, om vi tar , är resultatet en signifikansnivå på 0,00318, så frekvensmetoden kommer inte att förkasta nollhypotesen, vilket i stort sett överensstämmer med den Bayesianska metoden.

Om en informativ förfördelning används och en hypotes testas som mer liknar hypotesen i frekvensansatsen försvinner paradoxen.

Till exempel, om vi beräknar den bakre fördelningen med hjälp av den enhetliga före med (dvs. ), får vi

Om vi ​​använder detta för att testa sannolikheten för att den nyfödda är mer sannolikt att vara en pojke än en flicka, det vill säga, får vi:

Det är med andra ord mycket troligt att födelsetalen för pojkar är över 0,5.

Ingen av analyserna ger en uppskattning av effektstorlek direkt, men båda kan användas för att till exempel avgöra om andelen födslar till pojkar ligger över någon angiven tröskel.

Ingen riktig paradox

Den uppenbara skillnaden mellan de två metoderna beror på en kombination av faktorer. Först kontrollerar frekvensmetoden ovan utan att ta hänsyn till . Den Bayesianska metoden beräknar som ett alternativ till k och finner att den första hypotesen överensstämmer mer med observationer. Detta beror på att den senare hypotesen är betydligt mer suddig, eftersom värdet kan vara vad som helst i intervallet , vilket resulterar i en mycket låg posterior sannolikhet. För att förstå varför är det användbart att överväga två hypoteser som genererar observationer:

De flesta av de möjliga värdena för under hypotesen stöds mycket dåligt av observationer. Som sådan är uppenbar oenighet mellan metoder inte en oenighet alls, utan två olika påståenden om data:

Könsförhållandet 50/50 för nyfödda (pojkar/flickor) enligt frekvenstestet är osannolikt. Ändå är förhållandet 50/50 en bättre approximation än de flesta, men inte alla, andra förhållanden. Hypotesen skulle passa observationerna mycket bättre än alla andra förhållanden, inklusive .


Till exempel [5] , från detta val av hypotes och tidigare sannolikhet följer påståendet: "Om > 0,49 och < 0,51, då är den tidigare sannolikheten att vara exakt 0,5 0,50/0,51 98 %". Med tanke på en så stark preferens för , är det lätt att se att den bayesianska metoden gynnar , med tanke på att , även när det observerade värdet ligger inom 0,5. En avvikelse större än från anses signifikant i det frekventistiska tillvägagångssättet, men signifikans avvisas av a priori i det Bayesianska synsättet.

Om vi ​​tittar åt andra hållet kan vi se att den tidigare fördelningen är i huvudsak platt med en deltafunktion vid . Det är klart att det är tveksamt. Faktum är att om du försöker rita reella tal som kontinuerliga, skulle det vara logiskt att anta att det inte är möjligt för en given parameter .

En mer realistisk fördelning för den alternativa hypotesen ger mindre överraskande resultat för hypotesens bakre sannolikhet . Till exempel, om vi ersätter , det vill säga den maximala sannolikhetsuppskattningen för , är den bakre sannolikheten för hypotesen endast 0,07 jämfört med 0,93 för hypotesen (naturligtvis kan man faktiskt inte använda maximal sannolikhetsuppskattning som en del av den tidigare fördelningen ).

Modern diskussion

Paradoxen fortsätter att diskuteras aktivt [3] [6] [7] .

Se även

Anteckningar

  1. Jeffreys, 1939 .
  2. 1 2 Lindley, 1957 , sid. 187–192.
  3. 1 2 3 Spanos, 2013 , sid. 73–93.
  4. Naaman, 2016 , sid. 1526–1550
  5. Detta avsnitt i den engelska versionen kritiseras för att kräva en fullständig omskrivning.
  6. Sprenger, 2013 , sid. 733–744.
  7. Robert, 2014 .

Litteratur