Statistisk signifikans

I statistiken kallas värdet (värdet) av en variabel statistiskt signifikant , om sannolikheten för slumpmässig förekomst av detta eller ännu mer extrema värden är liten. Här förstås det extrema som graden av avvikelse hos teststatistiken från nollhypotesen .

En skillnad sägs vara statistiskt signifikant om förekomsten av tillgängliga data (eller ännu mer extrema data) skulle vara osannolik, om man antar att denna skillnad saknas; detta uttryck betyder inte att denna skillnad ska vara stor, viktig eller signifikant i ordets allmänna bemärkelse.

Den allmänna bilden av problemet är följande: ges ett urval från ett visst utrymme av elementära händelser (till exempel en lista över patienter som har undersökts för en viss sjukdom) och, möjligen, värden på detta urval av några variabler (funktioner av t.ex. patientens ålder, rökintensitet, antal timmar fysisk träning etc.). Sannolikhetsfördelningen är inte känd, men är tvärtom huvudobjektet för sökning här.

Olika hypoteser motsvarar olika möjliga sannolikhetsfördelningar på . Den exakta innebörden av termen "hypotes" är en uppsättning påståenden som innehåller en fullständig beskrivning av någon sannolikhetsfördelning .

Hypotestestning

Att testa hypotesen (specificera sannolikhetsfördelningen ) är som följer. En händelse väljs (kallas ett statistiskt test ) som (av någon anledning) är "nästan inkonsekvent" med hypotesen , i den meningen att den villkorade sannolikheten för händelsen (förutsatt att hypotesen är sann) inte överstiger någon liten (jämfört med enhet) nummer , kallad signifikansnivå : . Därefter genomförs experimentet. Om händelsen inträffar förkastas hypotesen (det sägs att det finns en avvikelse från hypotesen på signifikansnivån ). I annat fall förkastas inte hypotesen (dock kan ingen statistikmetod, inte ens vetenskapen i allmänhet, "avgjort bevisa" hypotesen).

Således är signifikansnivån för ett test sannolikheten att förkasta en hypotes om den faktiskt är sann (ett beslut känt som ett typ I -fel eller falskt positivt beslut).

Populära signifikansnivåer är 10 %, 5 %, 1 % och 0,1 %.

Olika värden på α-nivån har sina fördelar och nackdelar. Mindre α-nivåer ger mer förtroende för att den alternativa hypotesen som redan etablerats är signifikant, men det finns en större risk att inte förkasta en falsk nollhypotes (eller förkasta en sann alternativ) hypotes ( typ II-fel eller " falskt negativt beslut"), och alltså mindre statistisk styrka . Valet av α-nivå kräver oundvikligen en avvägning mellan signifikans och makt, och därmed mellan typ I och typ II felsannolikheter .

Vid användning av test för statistisk signifikans måste man tänka på att testet inte alls ger skäl att acceptera hypotesen [1] .

Se även

Anteckningar

  1. Keith M. Bower och James A. Colton. Varför vi inte "accepterar" nollhypotesen arkiverad 22 december 2015 på Wayback Machine // American Society for Quality, Six Sigma Forum, juli 2003.

Litteratur

Länkar