Normal distribution

Den aktuella versionen av sidan har ännu inte granskats av erfarna bidragsgivare och kan skilja sig väsentligt från versionen som granskades den 20 oktober 2022; kontroller kräver 2 redigeringar .
Normal distribution

Den gröna linjen motsvarar standardnormalfördelningenSannolikhetstäthet

Färgerna i detta diagram matchar diagrammet ovan.distributionsfunktion
Beteckning
alternativ μ  - skiftfaktor ( real ) σ > 0  - skalfaktor (real, strikt positiv)
Bärare
Sannolikhetstäthet
distributionsfunktion
Förväntat värde
Median
Mode
Dispersion
Asymmetrikoefficient
Kurtos koefficient
Differentialentropi
Genererande funktion av moment
karakteristisk funktion

Normalfördelningen [1] [2] , även kallad Gauss- eller Gauss- Laplace - fördelningen [3]  är en sannolikhetsfördelning , som i det endimensionella fallet ges av en sannolikhetstäthetsfunktion , som sammanfaller med den Gaussiska funktionen :

, där parametern  är den matematiska förväntan (medelvärde), medianen och fördelningsläget, och parametern  är standardavvikelsen ,  är distributionsvariansen .

Den endimensionella normalfördelningen är alltså en tvåparameterfamilj av distributioner som tillhör den exponentiella klassen av distributioner [4] . Det multivariata fallet beskrivs i artikeln " Multivariat normalfördelning ".

Standardnormalfördelningen är en normalfördelning med medelvärde och standardavvikelse

Allmän information

Om en kvantitet är summan av många slumpmässiga, svagt beroende storheter, som var och en ger ett litet bidrag i förhållande till den totala summan, tenderar den centrerade och normaliserade fördelningen av en sådan kvantitet till en normalfördelning med ett tillräckligt stort antal termer .

Detta följer av sannolikhetsteorems centrala gränssats . I världen omkring oss finns det ofta mängder vars värde bestäms av en kombination av många oberoende faktorer. Detta faktum, liksom att fördelningen ansågs typisk, vanlig, ledde till att man i slutet av 1800-talet började använda begreppet ”normalfördelning”. Normalfördelningen spelar en framträdande roll inom många vetenskapsområden, såsom matematisk statistik och statistisk fysik .

En slumpvariabel som har en normalfördelning kallas en normal, eller Gaussisk, slumpvariabel.

Definitioner

Standard normalfördelning

Det enklaste fallet av en normalfördelning - standardnormalfördelningen  - är ett specialfall när och dess sannolikhetstäthet är:

Faktorn i uttrycket ger villkoret för normalisering av integralen [5] . Eftersom faktorn i exponenten ger en spridning lika med ett, är standardavvikelsen lika med 1. Funktionen är symmetrisk vid punkten , dess värde i den är maximal och lika med funktionens Böjningspunkter : och

Gauss kallade standardnormalfördelningen med det är:

Normalfördelning med parametrar

Varje normalfördelning är en variant av standardnormalfördelningen vars intervall sträcks ut med en faktor (standardavvikelse) och överförs till (förväntning):

är parametrar för normalfördelningen. Sannolikhetstätheten måste normaliseras så att integralen är lika med 1.

Om  är en normal normal slumpvariabel kommer värdet att ha en normalfördelning med matematisk förväntan och standardavvikelse Tvärtom, if  är en normalvariabel med parametrar och då kommer det att ha en standardnormalfördelning.

Om vi ​​öppnar parenteserna i sannolikhetstäthetsexponenten och tar hänsyn till att , då:

Således är sannolikhetstätheten för varje normalfördelning exponenten för en kvadratisk funktion :

var

Härifrån kan man uttrycka medelvärdet som a och variansen som För standardnormalfördelningen och

Beteckning

Sannolikhetstätheten för standardnormalfördelningen (med nollmedelvärde och enhetsvarians) betecknas ofta med den grekiska bokstaven ( phi ) [6] . En alternativ form av den grekiska bokstaven phi är också ganska vanlig .

Normalfördelningen betecknas ofta med eller [7] . Om den slumpmässiga variabeln är fördelad enligt normallagen med medelvärde och variation, så skriver vi:

Distributionsfunktion

Fördelningsfunktionen för standardnormalfördelningen betecknas vanligtvis med en grekisk stor bokstav ( phi ) och är en integral:

Felfunktionen (sannolikhetsintegralen) är associerad med den, vilket ger sannolikheten att en normal slumpvariabel med medelvärde 0 och variation 1/2 kommer att falla in i segmentet :

Dessa integraler uttrycks inte i elementära funktioner utan kallas specialfunktioner . Många av deras numeriska uppskattningar är kända. Se nedan .

Funktionerna är särskilt relaterade till förhållandet:

.

En normalfördelning med densitetsmedelvärde och varians har följande fördelningsfunktion:

Du kan använda funktionen  - den ger sannolikheten att värdet på den normala normala slumpvariabeln kommer att överstiga :

.

Grafen för standardnormalfördelningsfunktionen har 2-faldig rotationssymmetri kring punkten (0; 1/2), det vill säga dess obestämda integral är:

Fördelningsfunktionen för en normal normal slumpvariabel kan utökas med hjälp av integrationsmetoden med delar i en serie:

där tecknet betyder dubbelfaktorial .

Den asymptotiska expansionen av distributionsfunktionen för stora värden kan också göras genom att integrera med delar.

Standardavvikelse

Cirka 68% av värdena från normalfördelningen ligger på ett avstånd av högst en standardavvikelse σ från medelvärdet; cirka 95% av värdena ligger på ett avstånd av högst två standardavvikelser; och 99,7 % högst tre. Detta faktum är ett specialfall av 3 sigma-regeln för ett normalt prov.

Mer exakt är sannolikheten att få ett normalt tal mellan och :

Med en noggrannhet på 12 signifikanta siffror anges värdena för i tabellen [8] :

OEIS
ett 0,682689492137 0,317310507863
3,15148718753
A178647
2 0,954499736104 0,045500263896
21,9778945080
A110894
3 0,997300203937 0,002699796063
370.398347345
A270712
fyra 0,999936657516 0,000063342484
15787.1927673
5 0,999999426697 0,000000573303
1744277.89362
6 0,999999998027 0,000000001973
506797345.897

Egenskaper

Moments

Moment och absoluta moment för en slumpvariabel kallas de matematiska förväntningarna på slumpvariabler resp . Om den matematiska förväntan är en slumpvariabel kallas dessa parametrar för centrala moment . I de flesta fall är momenten för heltal av intresse.

Om den har en normalfördelning så har den (ändliga) moment för alla med reell del större än −1. För icke-negativa heltal är de centrala momenten:

Här  är ett naturligt tal, och notationen betyder dubbelfaktorialen av talet, det vill säga (eftersom det är udda i det här fallet) produkten av alla udda tal från  1 till

De centrala absoluta momenten för icke-negativa heltal är:

Den sista formeln är också giltig för godtycklig .

Fouriertransform och karakteristisk funktion

Fouriertransformen av den normala sannolikhetstätheten med genomsnittlig standardavvikelse är [9] :

var är den imaginära enheten .

Om förväntan är den första faktorn 1, och Fouriertransformen, upp till en konstant, är den normala sannolikhetstätheten över frekvensintervall, med förväntan lika med 0 och standardavvikelse . I synnerhet är standardnormalfördelningen en egenfunktion av Fouriern . omvandla.

I sannolikhetsteorin är Fouriertransformen av fördelningsdensiteten för en reell slumpvariabel nära relaterad till den karakteristiska funktionen för denna variabel, som definieras som den matematiska förväntan av och är en funktion av en reell variabel (Fourierns frekvensparameter omvandla). Definitionen kan utökas till en komplex variabel [10] . Förhållandet är skrivet så här:

Oändlig delbarhet

Normalfördelningen är oändligt delbar .

Om de slumpmässiga variablerna och är oberoende och har en normalfördelning med medelvärde och och varianser respektive , så har den också en normalfördelning med medelvärde och varians

Detta innebär att en normal slumpvariabel kan representeras som summan av ett godtyckligt antal oberoende normala slumpvariabler.

Maximal entropi

Normalfördelningen har den maximala differentialentropin bland alla kontinuerliga distributioner vars varians inte överstiger ett givet värde [11] [12] .

Tre sigma-regeln för en Gaussisk slumpvariabel

Regeln om tre sigma ( ) - nästan alla värden för en normalfördelad slumpvariabel ligger i intervallet:

var  är den matematiska förväntan och parametern för en normal stokastisk variabel.

Mer exakt, med ungefär en sannolikhet på 0,9973, ligger värdet av en normalfördelad stokastisk variabel i det angivna intervallet.

Simulering av normala pseudo-slumpvariabler

I datorsimuleringar, speciellt vid tillämpning av Monte Carlo-metoden , är det önskvärt att använda kvantiteter fördelade enligt normallagen. Många algoritmer ger standardnormala värden, eftersom normalvärdet kan erhållas som:

där Z är standardnormalvärdet.

Algoritmerna använder också olika transformationer av enhetliga storheter. De enklaste ungefärliga modelleringsmetoderna är baserade på den centrala gränssatsen . Om vi ​​lägger till ett tillräckligt stort antal oberoende identiskt fördelade kvantiteter med en ändlig varians , kommer summan att ha en fördelning nära det normala. Till exempel, om du lägger till 100 oberoende standard, enhetligt fördelade slumpvariabler, kommer fördelningen av summan att vara ungefär normal .

För programmatisk generering av normalfördelade pseudoslumpvariabler är det att föredra att använda Box-Muller-transformen . Det låter dig generera ett normalfördelat värde baserat på ett enhetligt fördelat värde.

Det finns också Ziggurat-algoritmen , som är ännu snabbare än Box-Muller-transformen. Det är dock svårare att implementera, men användningen är motiverad i de fall där det krävs att generera ett mycket stort antal ojämnt fördelade slumptal.

Normalfördelning i natur och applikationer

Normalfördelningen finns ofta i naturen. Till exempel är följande slumpvariabler väl modellerade av normalfördelningen:

  • avvikelse under fotografering;
  • mätfel (dock har felen i vissa mätinstrument en annan fördelning);
  • vissa egenskaper hos levande organismer i en population.

Denna fördelning är så utbredd eftersom det är en oändligt delbar kontinuerlig fördelning med ändlig varians. Därför närmar sig vissa andra det i gränsen, som binomial och Poisson . Denna fördelning modellerar många icke-deterministiska fysiska processer [13] .

Multivariat normalfördelning används i studien av multivariata slumpvariabler (slumpvektorer). Ett av många exempel på sådana tillämpningar är studiet av mänskliga personlighetsparametrar inom psykologi och psykiatri .

Relation med andra distributioner

  • Normalfördelningen är en Pearsonfördelning av typ XI [14] .
  • Förhållandet mellan ett par oberoende standard normalfördelade stokastiska variabler har en Cauchy-fördelning [15] . Det vill säga, om en slumpvariabel är ett förhållande (där och  är oberoende standard normala slumpvariabler), så kommer den att ha en Cauchy-fördelning.
  • Om  är gemensamt oberoende standard normala slumpvariabler, det vill säga så har slumpvariabeln en chi-kvadratfördelning med k  frihetsgrader.
  • Om en slumpvariabel har en lognormalfördelning har dess naturliga logaritm en normalfördelning . Det vill säga om då Och vice versa, om då
  • Om oberoende normalfördelade slumpvariabler med matematiska förväntningar och varianser, så är deras urvalsmedelvärde oberoende av urvalets standardavvikelse [16] , och förhållandet mellan följande två variabler kommer att ha en t-fördelning med frihetsgrader:
  • Om oberoende standard normala slumpvariabler kommer förhållandet mellan normaliserade summor av kvadrater att ha en Fisher-fördelning med ( ) frihetsgrader [17] :

Historik

För första gången dök normalfördelningen som gränsen för binomialfördelningen vid upp 1738 i den andra upplagan av De Moivres "The Doctrine of Chance" [18] . Detta var det första beviset på ett specialfall av den centrala gränssatsen . År 1809 introducerade Gauss, i The Theory of the Motion of Celestial Bodies, denna fördelning som härrörande från upprepade mätningar av himlakropparnas rörelse. Gauss härledde dock en formel för verkliga slumpvariabler från principen att maximera fogdensiteten för alla mätningar vid en punkt med koordinater lika med medelvärdet av alla mätningar. Denna princip har senare kritiserats. År 1812 generaliserade Laplace i Moivre-Laplace-satsen resultatet av Moivre för en godtycklig binomialfördelning, det vill säga för summor av identiskt fördelade oberoende binära storheter [3] .

Se även

Anteckningar

  1. Wentzel E. S. Sannolikhetsteori. - 10:e upplagan, stereotyp .. - M . : Academia , 2005. - 576 sid. — ISBN 5-7695-2311-5 .
  2. Shiryaev A.N. Sannolikhet. — M .: Nauka, 1980.
  3. 1 2 Mathematical Encyclopedic Dictionary . - M .: Soviet Encyclopedia , 1988. - S.  139 -140.
  4. ^ Wasserman L. All statistik . - New York, NY: Springer, 2004. - S.  142 . — 433 sid. — ISBN 978-1-4419-2322-6 .
  5. Bevis, se Gaussisk integral
  6. Halperin, Hartley & Hoel, 1965 , punkt 7.
  7. McPherson (1990 )
  8. Wolfram|Alpha: Computational Knowledge Engine . Wolframalpha.com . Hämtad: 3 mars 2017.
  9. Bryc (1995 , s. 23)
  10. Bryc (1995 , s. 24)
  11. Omslag, Thomas M.; Thomas, Joy A. Elements of Information Theory. - John Wiley and Sons , 2006. - S. 254.
  12. Park, Sung Y.; Bera, Anil K. Maximum Entropy Autoregressive Conditional Heteroskedasticity Model  //  Journal of Econometrics : journal. - Elsevier, 2009. - S. 219-230 . Arkiverad från originalet den 7 mars 2016.
  13. Taleb N. N. Black Swan. Under oförutsägbarhetens tecken = The Black Swan: The Impact of the Highly Improbable. - Hummingbird, 2012. - 525 sid. - ISBN 978-5-389-00573-0 .
  14. Korolyuk, 1985 , sid. 135.
  15. Galkin V. M., Erofeeva L. N., Leshcheva S. V. Estimations of the Cauchy distribution parameter // Proceedings of the Nizhny Novgorod State Technical University. R.E. Alekseeva . - 2014. - Nr 2 (104). - S. 314-319. - UDC  513.015.2 .
  16. Lukacs, Eugene. En karakterisering av normalfördelningen  //  The Annals of Mathematical Statistics : journal. - 1942. - Vol. 13 , nr. 1 . - S. 91-3 . — ISSN 0003-4851 . - doi : 10.1214/aoms/1177731647 . — .
  17. Lehmann, E. L. Testa statistiska hypoteser . — 2:a. — Springer, 1997. - S.  199 . — ISBN 978-0-387-94919-2 .
  18. Läran om chanser; eller, en metod för att beräkna sannolikheten för händelser i spel, L., 1718, 1738, 1756; L., 1967 (återgiven utg.); Miscellanea analytica de scriebus et quadraturis, L., 1730.

Litteratur

  • Korolyuk V. S. , Portenko N. I. , Skorokhod A. V. , Turbin A. F. Handbok för sannolikhetsteori och matematisk statistik. - M. : Nauka, 1985. - 640 sid.
  • Halperin, Max; Hartley, Herman O.; Hoel, Paul G. Rekommenderade standarder för statistiska symboler och notation. COPSS Committee on Symbols and Notation  //  The American Statistician : journal. - 1965. - Vol. 19 , nr. 3 . - S. 12-14 . - doi : 10.2307/2681417 . — .
  • McPherson, Glen. Statistik i vetenskaplig undersökning : dess grund, tillämpning och tolkning  . - Springer-Verlag , 1990. - ISBN 978-0-387-97137-7 .
  • Bryc, Wlodzimierz. Normalfördelningen: Karakteriseringar med  applikationer . - Springer-Verlag , 1995. - ISBN 978-0-387-97990-8 .

Länkar