distribution . Pearson distribution | |
---|---|
Beteckning | eller |
alternativ | är antalet frihetsgrader |
Bärare | |
Sannolikhetstäthet | |
distributionsfunktion | |
Förväntat värde | |
Median | handla om |
Mode |
0 för if |
Dispersion | |
Asymmetrikoefficient | |
Kurtos koefficient | |
Differentialentropi |
|
Genererande funktion av moment | , om |
karakteristisk funktion |
Fördelning (chi-kvadrat) med frihetsgrader - fördelning av summan av kvadrater av oberoende standard normala slumpvariabler .
Låta vara gemensamt oberoende standard normala slumpvariabler, det vill säga: . Sedan den slumpmässiga variabeln
har en chi-kvadratfördelning med frihetsgrader, d.v.s. , eller skrivs annorlunda:
.Chi-kvadratfördelningen är ett specialfall av gammafördelningen och dess densitet är:
,var är gammafördelningen och är gammafunktionen .
Distributionsfunktionen har följande form:
,där och betecknar de fullständiga respektive ofullständiga gammafunktionerna.
har en distribution .
har en Fisher-distribution med frihetsgrader .
En ytterligare generalisering av chi-kvadratfördelningen är den så kallade icke-centrala chi-kvadratfördelningen som förekommer i vissa statistiska problem.
En kvantil är ett tal (argument) där fördelningsfunktionen är lika med en given, erforderlig sannolikhet. Grovt sett är en kvantil resultatet av att invertera en fördelningsfunktion, men det finns subtiliteter med diskontinuerliga fördelningsfunktioner.
Kriteriet föreslogs av Karl Pearson 1900 [1] . Hans arbete anses vara grunden för modern matematisk statistik. Pearsons föregångare ritade helt enkelt experimentella resultat och hävdade att de var korrekta. I sin artikel gav Pearson några intressanta exempel på missbruk av statistik. Han bevisade också att några av observationerna på roulettehjulet (som han experimenterade på i två veckor i Monte Carlo 1892) var så långt från de förväntade frekvenserna att chanserna att få dem igen, förutsatt att roulettehjulet är samvetsgrant arrangerat, är lika med 1 av 10 29 .
En allmän diskussion av kriteriet och en omfattande bibliografi kan hittas i granskningspapperet av William J. Cochran [2] .
Chi-kvadratfördelningen har många tillämpningar för statistisk slutledning, som att använda chi-kvadrattestet och uppskatta varianser. Det används i problemet med att uppskatta medelvärdet för en normalfördelad population och problemet med att uppskatta lutningen för en regressionslinje på grund av dess roll i studentens t-fördelning . Det används i variansanalysen .
Följande är exempel på situationer där en chi-kvadratfördelning uppstår från ett normalt urval:
namn | Statistik |
---|---|
chi-kvadratfördelning | |
icke-central chi-kvadratfördelning | |
chi distribution | |
icke-central chi-distribution |
För vilket tal p som helst mellan 0 och 1 definieras ett p -värde - sannolikheten att för en given probabilistisk modell av fördelningen av värden för en slumpvariabel erhåller samma eller mer extremvärde av statistik (aritmetiskt medelvärde, median, etc.), jämfört med den observerade, förutsatt att nollhypotesen är sann . I det här fallet är det distributionen . Eftersom fördelningsfunktionens värde vid en punkt för motsvarande frihetsgrader ger sannolikheten att få ett statistiskt värde mindre extremt än denna punkt, kan p -värdet erhållas genom att subtrahera fördelningsfunktionens värde från enhet. Ett litet p -värde – under den valda signifikansnivån – betyder statistisk signifikans . Detta kommer att vara tillräckligt för att förkasta nollhypotesen. För att skilja mellan signifikanta och icke-signifikanta resultat används vanligtvis en nivå på 0,05.
Tabellen ger p -värden för motsvarande värden för de första tio frihetsgraderna.
Frihetsgrader ( df ) | Värde [3] | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
ett | 0,004 | 0,02 | 0,06 | 0,15 | 0,46 | 1.07 | 1,64 | 2,71 | 3,84 | 6,63 | 10,83 |
2 | 0,10 | 0,21 | 0,45 | 0,71 | 1,39 | 2,41 | 3.22 | 4,61 | 5,99 | 9.21 | 13,82 |
3 | 0,35 | 0,58 | 1.01 | 1,42 | 2,37 | 3,66 | 4,64 | 6,25 | 7,81 | 11.34 | 16.27 |
fyra | 0,71 | 1,06 | 1,65 | 2.20 | 3,36 | 4,88 | 5,99 | 7,78 | 9,49 | 13.28 | 18.47 |
5 | 1.14 | 1,61 | 2,34 | 3.00 | 4,35 | 6.06 | 7,29 | 9.24 | 11.07 | 15.09 | 20.52 |
6 | 1,63 | 2.20 | 3.07 | 3,83 | 5,35 | 7.23 | 8,56 | 10,64 | 12.59 | 16,81 | 22.46 |
7 | 2.17 | 2,83 | 3,82 | 4,67 | 6,35 | 8,38 | 9,80 | 12.02 | 14.07 | 18.48 | 24.32 |
åtta | 2,73 | 3,49 | 4,59 | 5,53 | 7,34 | 9,52 | 11.03 | 13.36 | 15.51 | 20.09 | 26.12 |
9 | 3,32 | 4.17 | 5,38 | 6,39 | 8,34 | 10,66 | 12.24 | 14,68 | 16,92 | 21,67 | 27,88 |
tio | 3,94 | 4,87 | 6.18 | 7,27 | 9,34 | 11,78 | 13.44 | 15,99 | 18.31 | 23.21 | 29,59 |
p -värde | 0,95 | 0,90 | 0,80 | 0,70 | 0,50 | 0,30 | 0,20 | 0,10 | 0,05 | 0,01 | 0,001 |
Dessa värden kan beräknas i termer av kvantilen (invers fördelningsfunktion) av chi-kvadratfördelningen [4] . Till exempel ger kvantilen för p = 0,05 och df = 7 = 14,06714 ≈ 14,07 , som i tabellen ovan. Detta innebär att för den experimentella observationen av sju oberoende slumpvariabler , med nollhypotesens giltighet "varje variabel beskrivs av en normal standardfördelning med en median på 0 och en standardavvikelse på 1", kan värdet endast erhållas i 5 % av implementeringarna. Att erhålla ett större värde kan vanligtvis anses vara tillräckligt skäl för att förkasta denna nollhypotes.
Tabellen ger avrundning till hundradelar; för mer exakta tabeller för mer frihetsgrader se t ex här [5] .
Sannolikhetsfördelningar | |
---|---|
Diskret | |
Absolut kontinuerligt |