Elevens t-test

Den aktuella versionen av sidan har ännu inte granskats av erfarna bidragsgivare och kan skilja sig väsentligt från versionen som granskades den 4 november 2020; kontroller kräver 3 redigeringar .

Elevens t-test  är ett allmänt namn för en klass av metoder för statistisk testning av hypoteser ( statistiska test ) baserade på Elevens fördelning . De vanligaste fallen av att tillämpa t-testet är relaterade till att kontrollera jämlikheten mellan medelvärdena i två prover .

t -statistik byggs vanligtvis enligt följande allmänna princip: i täljaren - en slumpvariabel med noll matematisk förväntan (när nollhypotesen är uppfylld ), och i nämnaren - stickprovets standardavvikelse för denna slumpvariabel, erhållen som kvadratroten av den opartiska uppskattningen av variansen.

Historik

Detta kriterium utvecklades av William Gosset för att utvärdera kvaliteten på öl hos Guinness . I samband med skyldigheterna gentemot företaget för att inte avslöja affärshemligheter (Guinness-ledningen övervägde sådan användning av den statistiska apparaten i sitt arbete), publicerades Gossets artikel 1908 i tidskriften "Biometrics" under pseudonymen "Student" ( Studerande).

Datakrav

För att tillämpa detta kriterium är det nödvändigt att originaldata har en normalfördelning . Vid tillämpning av ett tvåprovstest för oberoende stickprov är det också nödvändigt att uppfylla villkoret om varianslikhet . Det finns dock alternativ till Students t-test för situationer med ojämna varianser.

Kravet att datafördelningen är normal är nödvändigt för ett exakt -test. Men även med andra datadistributioner är det möjligt att använda -statistik. I många fall har denna statistik asymptotiskt en standardnormalfördelning - , så du kan använda kvantilerna för denna fördelning. Men ofta även i detta fall används kvantilerna inte av standardnormalfördelningen, utan av motsvarande Students fördelning, som i det exakta testet. De är asymptotiskt ekvivalenta, men på små urval är konfidensintervallen för elevens distribution bredare och mer tillförlitliga.

Om dessa villkor inte är uppfyllda, när man jämför urvalsmedelvärden, bör liknande metoder för icke-parametrisk statistik användas , bland vilka de mest kända är Mann-Whitneys U-test (som ett tvåprovstest för oberoende urval), samt teckentest och Wilcoxon-testet (används i fall av beroende prover).

Ett prov t-test

Den används för att testa nollhypotesen om den matematiska förväntningens jämlikhet med något känt värde .

Uppenbarligen när nollhypotesen är uppfylld . Med hänsyn till observationers antagna oberoende . Genom att använda den opartiska variansuppskattningen får vi följande t-statistik:

Under nollhypotesen är fördelningen av denna statistik . Därför, om det statistiska värdet överstiger (i absoluta tal) det kritiska värdet för denna fördelning (vid en given signifikansnivå), förkastas nollhypotesen.

Två-samplings t-test för oberoende prover

Låt det finnas två oberoende stickprov med volymer av normalfördelade slumpvariabler . Det är nödvändigt att testa nollhypotesen om likheten mellan de matematiska förväntningarna på dessa slumpvariabler med hjälp av provdata .

Tänk på skillnaden mellan provmedelvärdena . Uppenbarligen, om nollhypotesen är uppfylld, . Baserat på provernas oberoende är variansen för denna skillnad lika med: . Sedan, med hjälp av den opartiska uppskattningen av variansen , får vi en opartisk uppskattning av variansen av skillnaden mellan urvalets medelvärden: . Därför är t-statistiken för att testa nollhypotesen

Denna statistik, under nollhypotesens giltighet, har en fördelning , där .

Lika variansfall

Om urvalsvariationerna antas vara desamma, då

Då är t-statistiken:

Denna statistik har en fördelning .

Två-prov t-test för beroende sampel

För att beräkna det empiriska värdet av -kriteriet i en situation där man testar en hypotes om skillnaderna mellan två beroende prover (till exempel två prover av samma test med ett tidsintervall), används följande formel:

där  är medelskillnaden mellan värdena,  är standardavvikelsen för skillnaderna och n är antalet observationer.

Denna statistik har en fördelning .

Linjärt begränsningstest på linjära regressionsparametrar

Med hjälp av t-testet kan du också testa en godtycklig (enkel) linjär begränsning på parametrarna för en linjär regression uppskattad med den vanliga minsta kvadratmetoden . Låt det bli nödvändigt att testa hypotesen . Uppenbarligen när nollhypotesen är uppfylld . Här används egenskapen för opartiska LSM-uppskattningar av modellparametrar . Dessutom . Genom att använda dess opartiska uppskattning istället för den okända variansen får vi följande t-statistik:

Denna statistik, när nollhypotesen är uppfylld, har en fördelning , så om värdet på statistiken är högre än det kritiska värdet förkastas nollhypotesen om en linjär begränsning.

Hypotestestning av den linjära regressionskoefficienten

Ett specialfall av en linjär begränsning är att testa hypotesen att regressionskoefficienten är lika med ett visst värde . I det här fallet är motsvarande t-statistik:

där  är standardfelet för koefficientuppskattningen och är kvadratroten av motsvarande diagonalelement i kovariansmatrisen för koefficientuppskattningar.

Om nollhypotesen är sann är fördelningen av denna statistik . Om det absoluta värdet av statistiken är högre än det kritiska värdet, så är skillnaden mellan koefficienten från statistiskt signifikant (icke-slumpmässig), annars är den insignifikant (slumpmässig, det vill säga den sanna koefficienten är förmodligen lika med eller mycket nära till det förväntade värdet ).

Notera

Enprovstestet för matematiska förväntningar kan reduceras till att testa en linjär restriktion på de linjära regressionsparametrarna. I ett enprovstest är detta en "regression" på en konstant. Därför är regression en provuppskattning av variansen för den slumpmässiga variabeln som studeras, matrisen är och uppskattningen av modellens "koefficient" är lika med urvalets medelvärde. Från detta får vi uttrycket för t-statistiken som ges ovan för det allmänna fallet.

På liknande sätt kan det visas att ett tvåprovstest med lika urvalsvarianser också reducerar till att testa linjära begränsningar. I ett tvåprovstest är detta en "regression" på en konstant och en dummyvariabel som identifierar ett delprov beroende på värdet (0 eller 1): . Hypotesen om likheten mellan de matematiska förväntningarna på proverna kan formuleras som en hypotes om likheten mellan koefficienten b för denna modell och noll. Det kan visas att motsvarande t-statistik för att testa denna hypotes är lika med den t-statistik som ges för tvåprovstestet.

Det kan också reduceras till att kontrollera den linjära begränsningen vid olika varianser. I det här fallet tar variansen av modellfel två värden. Utifrån detta kan man också få fram t-statistik liknande den som ges för tvåprovstestet.

Icke-parametriska analoger

En analog till tvåprovstestet för oberoende prover är Mann-Whitneys U-test . För situationen med beroende prover är analogerna teckentestet och Wilcoxon T-testet .

Litteratur

studerande. Det troliga felet för ett medelvärde. // Biometrika. 1908. N:o 6 (1). S. 1-25.

Länkar

Om kriterierna för att testa hypoteser om homogeniteten hos medel på webbplatsen för Novosibirsk State Technical University