Fishers exakta test

Fishers exakta test  är ett statistiskt signifikanstest som används vid analys av korstabeller för små provstorlekar . Gäller exakta signifikanstest, eftersom det inte använder stora urvalsapproximationer (asymptotik när urvalsstorleken tenderar till oändlighet).

Uppkallad efter uppfinnaren - Ronald Fisher , skapades författaren av uttalandet från Muriel Bristol ( eng.  Muriel Bristol ), som hävdade att hon kunde upptäcka i vilken ordning te och mjölk hälldes i hennes kopp.

Utnämning

Testet används vanligtvis för att undersöka signifikansen av sambandet mellan två variabler i en faktoriell dimensionstabell ( kontingenstabell ). Testsannolikhetsvärdet beräknas som om värdena vid tabellens gränser är kända. Till exempel, när det gäller teprovning, vet Bristol antalet koppar med varje beredning (mjölk eller te först), så förmodligen ger hon rätt antal gissningar i varje kategori. Som påpekat av Fisher, med antagande av nollhypotesen om testoberoende, leder detta till att man använder en hypergeometrisk fördelning för en given poäng i tabellen.

Med stora prover kan chi-kvadrattestet användas i denna situation . Detta test är dock inte lämpligt när medelvärdet av värdena i någon av cellerna i tabellen med givna gränser är under 10: den beräknade provfördelningen för statistiken som testas är endast ungefär lika med den teoretiska chi-kvadratfördelningen , och approximationen är otillräcklig under dessa förhållanden (som uppstår när stickproverna är små, eller när data är mycket ojämnt fördelade mellan tabellcellerna). Fisher-testet är, som namnet antyder, korrekt och kan därför användas oavsett provets egenskaper. Testet blir svårt att beräkna för stora urval eller välbalanserade tabeller, men lyckligtvis är det för dessa förhållanden som Pearson-kriteriet ( ) är väl tillämpligt.

För manuella beräkningar kan testet endast utföras när det gäller dimensionen av faktortabeller . Principen för testet kan dock utvidgas till det allmänna fallet med tabeller , och vissa statistiska paket tillhandahåller sådana beräkningar (ibland med en Monte Carlo-metod för att få en approximation).

Exempel

Noggranna tester gör att du kan få mer exakt analys för små prover eller data som är gles. Noggranna tester av icke-parametriska studier är ett lämpligt statistiskt verktyg för att hantera obalanserade data. Obalanserade data analyserade med asymptotiska metoder tenderar att leda till otillförlitliga resultat. För stora och välbalanserade datamängder är de exakta och asymptotiska sannolikhetsuppskattningarna mycket lika. Men för små, glesa eller obalanserade data kan de exakta och asymptotiska uppskattningarna vara ganska olika och till och med leda till motsatta slutsatser om hypotesen som utvecklas [1] [2] [3] .

Behovet av Fisher-testet uppstår när vi har data indelade i två kategorier på två olika sätt. Exempelvis kan ett urval av ungdomar delas in i kategorier å ena sidan efter kön (pojkar och flickor) och å andra sidan genom att gå på diet eller inte. Det kan antas att andelen personer som går på diet är högre bland flickor än bland pojkar, och vi vill utröna om någon observerad skillnad i proportioner är statistiskt signifikant.

Uppgifterna kan se ut som följande:

unga män flickor Total
bantning ett 9 tio
inte på diet elva 3 fjorton
Total 12 12 24

Sådana data är inte lämpliga för chi-kvadratanalys eftersom de förväntade värdena i tabellen alltid är under 10, och antalet frihetsgrader i den faktoriella storlekstabellen är alltid en.

Frågan vi ställer om dessa uppgifter är: med tanke på att 10 av 24 tonåringar är dieter och att 12 av dessa 24 är flickor, vad är sannolikheten att 10 bantare är så ojämnt fördelade mellan könen? Om vi ​​skulle välja 10 tonåringar slumpmässigt, vad är sannolikheten att 9 av dem drogs från en uppsättning av 12 kvinnor och bara 1 från en uppsättning av 12 pojkar?

Innan vi fortsätter studien av Fisher-testet, låt oss introducera den nödvändiga notationen. Låt oss beteckna siffrorna i cellerna med bokstäver , , och , följaktligen, kalla summan av summering av rader och kolumner för marginella (gräns)summor och representera summan med bokstaven .

Nu ser tabellen ut så här:

Ungdomar Flickor Total
Bantning
Inte på diet
Total

Fisher visade att sannolikheten för att erhålla en sådan mängd kvantiteter ges av den hypergeometriska fördelningen:

där kolumnerna inom parentes är de binomiska koefficienterna och symbolen " " är faktoroperatorn .

Denna formel ger den exakta sannolikheten att observera någon specifik uppsättning data givet marginalutfallen, totalsumman och nollhypotesen om samma benägenhet att äta oavsett kön (förhållandet mellan dieter och icke-bantare är detsamma för pojkar som för tjejer).

Fisher visade att vi bara kan hantera fall där marginalsummorna är  desamma som i tabellen ovan. I exemplet ovan finns det 11 sådana fall. Av dessa är bara ett så "skev" (i riktning mot en kvinnlig benägenhet att äta) som demon:

Ungdomar Flickor Total
Bantning 0 tio tio
Inte på diet 12 2 fjorton
Total 12 12 24

För att bedöma den statistiska signifikansen av de observerade data, det vill säga den totala sannolikheten för samma eller mer uttalade "skev" mot flickor på diet, med antagande av nollhypotesen , måste vi beräkna värdesannolikheterna för båda dessa tabeller och lägg till dem. Detta ger det så kallade ensidiga testet; för ett dubbelsidigt test måste vi också överväga tabeller som är lika sneda, men i motsatt riktning (det vill säga överväga fallet med huvudsakligen manlig bantning).

Att klassificera tabeller efter om de är "extremt skeva" är dock problematiskt. Tillvägagångssättet som används av programmeringsspråket R föreslår att man beräknar kriterievärdet genom att summera sannolikheterna för alla tabeller med sannolikheter mindre än eller lika med sannolikheterna för den observerade tabellen. För tabeller med små cellantal kan det tvåsidiga testresultatet skilja sig väsentligt från två gånger det ensidiga poängen, till skillnad från fallet med statistik som har en symmetrisk samplingsfördelning.

De flesta moderna statistiska paket beräknar värdet av Fisher-tester, i vissa fall även där en chi-kvadratapproximation också skulle vara acceptabel. Faktiska beräkningar som utförs av statistiska programvarupaket skiljer sig i allmänhet från de som beskrivs. Särskilt numeriska svårigheter kan bero på stora factorials. Enkla men ännu mer effektiva beräkningsmetoder baseras på användningen av gammafunktionen eller den logaritmiska gammafunktionen, men den exakta beräkningen av hypergeometriska och binomiska sannolikheter är ett område av aktuell forskning.

Anteckningar

  1. Mehta, CR 1995. SPSS 6.1 Exakt test för Windows. Englewood Cliffs, NJ: Prentice Hall
  2. Mehta, CR, Patel, NR, & Tsiatis, AA 1984. Exakt signifikanstestning för att fastställa behandlingsekvivalens med ordnade kategoriska data. Biometrics, 40(3), 819-825
  3. Mehta, CR, Patel, NR 1997. Exakt slutsats i kategoriska data. Biometrics, 53(1), 112-117

Litteratur

Länkar