Chi-kvadratfördelning

distribution . Pearson distribution
Sannolikhetstäthet
distributionsfunktion
Beteckning eller
alternativ är antalet frihetsgrader
Bärare
Sannolikhetstäthet
distributionsfunktion
Förväntat värde
Median handla om
Mode 0 för if
Dispersion
Asymmetrikoefficient
Kurtos koefficient
Differentialentropi

Genererande funktion av moment , om
karakteristisk funktion

Fördelning (chi-kvadrat) med frihetsgrader  - fördelning av summan av kvadrater av oberoende standard normala slumpvariabler .

Definition

Låta vara  gemensamt oberoende standard normala slumpvariabler, det vill säga: . Sedan den slumpmässiga variabeln

har en chi-kvadratfördelning med frihetsgrader, d.v.s. , eller skrivs annorlunda:

.

Chi-kvadratfördelningen är ett specialfall av gammafördelningen och dess densitet är:

,

var är gammafördelningen och  är gammafunktionen .

Distributionsfunktionen har följande form:

,

där och betecknar de fullständiga respektive ofullständiga gammafunktionerna.

Egenskaper för chi-kvadratfördelningen

, . genom utdelning kl .

Relation med andra distributioner

har en distribution .

.

har en Fisher-distribution med frihetsgrader .

Variationer och generaliseringar

En ytterligare generalisering av chi-kvadratfördelningen är den så kallade icke-centrala chi-kvadratfördelningen som förekommer i vissa statistiska problem.

Kvantiler

En kvantil är ett tal (argument) där fördelningsfunktionen är lika med en given, erforderlig sannolikhet. Grovt sett är en kvantil resultatet av att invertera en fördelningsfunktion, men det finns subtiliteter med diskontinuerliga fördelningsfunktioner.

Historik

Kriteriet föreslogs av Karl Pearson 1900 [1] . Hans arbete anses vara grunden för modern matematisk statistik. Pearsons föregångare ritade helt enkelt experimentella resultat och hävdade att de var korrekta. I sin artikel gav Pearson några intressanta exempel på missbruk av statistik. Han bevisade också att några av observationerna på roulettehjulet (som han experimenterade på i två veckor i Monte Carlo 1892) var så långt från de förväntade frekvenserna att chanserna att få dem igen, förutsatt att roulettehjulet är samvetsgrant arrangerat, är lika med 1 av 10 29 .

En allmän diskussion av kriteriet och en omfattande bibliografi kan hittas i granskningspapperet av William J. Cochran [2] .

Applikationer

Chi-kvadratfördelningen har många tillämpningar för statistisk slutledning, som att använda chi-kvadrattestet och uppskatta varianser. Det används i problemet med att uppskatta medelvärdet för en normalfördelad population och problemet med att uppskatta lutningen för en regressionslinje på grund av dess roll i studentens t-fördelning . Det används i variansanalysen .

Följande är exempel på situationer där en chi-kvadratfördelning uppstår från ett normalt urval:

namn Statistik
chi-kvadratfördelning
icke-central chi-kvadratfördelning
chi distribution
icke-central chi-distribution


Tabell över χ 2 och p - värden

För vilket tal p som helst mellan 0 och 1 definieras ett p -värde - sannolikheten att för en given probabilistisk modell av fördelningen av värden  för en slumpvariabel erhåller samma eller mer extremvärde av statistik (aritmetiskt medelvärde, median, etc.), jämfört med den observerade, förutsatt att nollhypotesen är sann . I det här fallet är det distributionen . Eftersom fördelningsfunktionens värde vid en punkt för motsvarande frihetsgrader ger sannolikheten att få ett statistiskt värde mindre extremt än denna punkt, kan p -värdet erhållas genom att subtrahera fördelningsfunktionens värde från enhet. Ett litet p -värde – under den valda signifikansnivån – betyder statistisk signifikans . Detta kommer att vara tillräckligt för att förkasta nollhypotesen. För att skilja mellan signifikanta och icke-signifikanta resultat används vanligtvis en nivå på 0,05.

Tabellen ger p -värden för motsvarande värden för de första tio frihetsgraderna.

Frihetsgrader ( df ) Värde [3]
ett 0,004 0,02 0,06 0,15 0,46 1.07 1,64 2,71 3,84 6,63 10,83
2 0,10 0,21 0,45 0,71 1,39 2,41 3.22 4,61 5,99 9.21 13,82
3 0,35 0,58 1.01 1,42 2,37 3,66 4,64 6,25 7,81 11.34 16.27
fyra 0,71 1,06 1,65 2.20 3,36 4,88 5,99 7,78 9,49 13.28 18.47
5 1.14 1,61 2,34 3.00 4,35 6.06 7,29 9.24 11.07 15.09 20.52
6 1,63 2.20 3.07 3,83 5,35 7.23 8,56 10,64 12.59 16,81 22.46
7 2.17 2,83 3,82 4,67 6,35 8,38 9,80 12.02 14.07 18.48 24.32
åtta 2,73 3,49 4,59 5,53 7,34 9,52 11.03 13.36 15.51 20.09 26.12
9 3,32 4.17 5,38 6,39 8,34 10,66 12.24 14,68 16,92 21,67 27,88
tio 3,94 4,87 6.18 7,27 9,34 11,78 13.44 15,99 18.31 23.21 29,59
p -värde 0,95 0,90 0,80 0,70 0,50 0,30 0,20 0,10 0,05 0,01 0,001

Dessa värden kan beräknas i termer av kvantilen (invers fördelningsfunktion) av chi-kvadratfördelningen [4] . Till exempel ger kvantilen för p = 0,05 och df = 7 = 14,06714 ≈ 14,07 , som i tabellen ovan. Detta innebär att för den experimentella observationen av sju oberoende slumpvariabler , med nollhypotesens giltighet "varje variabel beskrivs av en normal standardfördelning med en median på 0 och en standardavvikelse på 1", kan värdet endast erhållas i 5 % av implementeringarna. Att erhålla ett större värde kan vanligtvis anses vara tillräckligt skäl för att förkasta denna nollhypotes.

Tabellen ger avrundning till hundradelar; för mer exakta tabeller för mer frihetsgrader se t ex här [5] .

Se även

Anteckningar

  1. Pearson K. På kriteriet att ett givet system av avvikelser från det sannolika i fallet med ett korrelerat system av variabler är sådant att det rimligen kan antas ha uppstått från slumpmässigt urval  //  Philosophical Magazine, Series 5 - Vol. 50 , nej. 302 . - S. 157-175 . - doi : 10.1080/14786440009463897 .
  2. Cochran WG The Test of Goodness of Fit  //  Annals Math. statistik. - 1952. - Vol. 23 , nr. 3 . - s. 315-345 .
  3. Chi-Squared Test Arkiverad 18 november 2013 på Wayback Machine Table B.2. Dr. Jacqueline S. McLaughlin vid Pennsylvania State University. Denna källa citerar i sin tur: RA Fisher och F. Yates , Statistical Tables for Biological Agricultural and Medical Research, 6:e upplagan, Tabell IV. Två värden har korrigerats, 7,82 gånger 7,81 och 4,60 gånger 4,61.
  4. R Handledning: Chi-kvadratfördelning . Datum för åtkomst: 19 november 2019. Arkiverad från originalet den 16 februari 2021.
  5. StatSoft: Fördelningstabeller - Chi-kvadratfördelning . Hämtad 29 januari 2020. Arkiverad från originalet 26 januari 2020.