Normal distribution | |
---|---|
Den gröna linjen motsvarar standardnormalfördelningen | |
Färgerna i detta diagram matchar diagrammet ovan. | |
Beteckning | |
alternativ |
μ - skiftfaktor ( real ) σ > 0 - skalfaktor (real, strikt positiv) |
Bärare | |
Sannolikhetstäthet | |
distributionsfunktion | |
Förväntat värde | |
Median | |
Mode | |
Dispersion | |
Asymmetrikoefficient | |
Kurtos koefficient | |
Differentialentropi | |
Genererande funktion av moment | |
karakteristisk funktion |
Normalfördelningen [1] [2] , även kallad Gauss- eller Gauss- Laplace - fördelningen [3] är en sannolikhetsfördelning , som i det endimensionella fallet ges av en sannolikhetstäthetsfunktion , som sammanfaller med den Gaussiska funktionen :
, där parametern är den matematiska förväntan (medelvärde), medianen och fördelningsläget, och parametern är standardavvikelsen , är distributionsvariansen .Den endimensionella normalfördelningen är alltså en tvåparameterfamilj av distributioner som tillhör den exponentiella klassen av distributioner [4] . Det multivariata fallet beskrivs i artikeln " Multivariat normalfördelning ".
Standardnormalfördelningen är en normalfördelning med medelvärde och standardavvikelse
Om en kvantitet är summan av många slumpmässiga, svagt beroende storheter, som var och en ger ett litet bidrag i förhållande till den totala summan, tenderar den centrerade och normaliserade fördelningen av en sådan kvantitet till en normalfördelning med ett tillräckligt stort antal termer .
Detta följer av sannolikhetsteorems centrala gränssats . I världen omkring oss finns det ofta mängder vars värde bestäms av en kombination av många oberoende faktorer. Detta faktum, liksom att fördelningen ansågs typisk, vanlig, ledde till att man i slutet av 1800-talet började använda begreppet ”normalfördelning”. Normalfördelningen spelar en framträdande roll inom många vetenskapsområden, såsom matematisk statistik och statistisk fysik .
En slumpvariabel som har en normalfördelning kallas en normal, eller Gaussisk, slumpvariabel.
Det enklaste fallet av en normalfördelning - standardnormalfördelningen - är ett specialfall när och dess sannolikhetstäthet är:
Faktorn i uttrycket ger villkoret för normalisering av integralen [5] . Eftersom faktorn i exponenten ger en spridning lika med ett, är standardavvikelsen lika med 1. Funktionen är symmetrisk vid punkten , dess värde i den är maximal och lika med funktionens Böjningspunkter : och
Gauss kallade standardnormalfördelningen med det är:
Varje normalfördelning är en variant av standardnormalfördelningen vars intervall sträcks ut med en faktor (standardavvikelse) och överförs till (förväntning):
är parametrar för normalfördelningen. Sannolikhetstätheten måste normaliseras så att integralen är lika med 1.
Om är en normal normal slumpvariabel kommer värdet att ha en normalfördelning med matematisk förväntan och standardavvikelse Tvärtom, if är en normalvariabel med parametrar och då kommer det att ha en standardnormalfördelning.
Om vi öppnar parenteserna i sannolikhetstäthetsexponenten och tar hänsyn till att , då:
Således är sannolikhetstätheten för varje normalfördelning exponenten för en kvadratisk funktion :
varHärifrån kan man uttrycka medelvärdet som a och variansen som För standardnormalfördelningen och
Sannolikhetstätheten för standardnormalfördelningen (med nollmedelvärde och enhetsvarians) betecknas ofta med den grekiska bokstaven ( phi ) [6] . En alternativ form av den grekiska bokstaven phi är också ganska vanlig .
Normalfördelningen betecknas ofta med eller [7] . Om den slumpmässiga variabeln är fördelad enligt normallagen med medelvärde och variation, så skriver vi:
Fördelningsfunktionen för standardnormalfördelningen betecknas vanligtvis med en grekisk stor bokstav ( phi ) och är en integral:
Felfunktionen (sannolikhetsintegralen) är associerad med den, vilket ger sannolikheten att en normal slumpvariabel med medelvärde 0 och variation 1/2 kommer att falla in i segmentet :
Dessa integraler uttrycks inte i elementära funktioner utan kallas specialfunktioner . Många av deras numeriska uppskattningar är kända. Se nedan .
Funktionerna är särskilt relaterade till förhållandet:
.En normalfördelning med densitetsmedelvärde och varians har följande fördelningsfunktion:
Du kan använda funktionen - den ger sannolikheten att värdet på den normala normala slumpvariabeln kommer att överstiga :
.Grafen för standardnormalfördelningsfunktionen har 2-faldig rotationssymmetri kring punkten (0; 1/2), det vill säga dess obestämda integral är:
Fördelningsfunktionen för en normal normal slumpvariabel kan utökas med hjälp av integrationsmetoden med delar i en serie:
där tecknet betyder dubbelfaktorial .
Den asymptotiska expansionen av distributionsfunktionen för stora värden kan också göras genom att integrera med delar.
StandardavvikelseCirka 68% av värdena från normalfördelningen ligger på ett avstånd av högst en standardavvikelse σ från medelvärdet; cirka 95% av värdena ligger på ett avstånd av högst två standardavvikelser; och 99,7 % högst tre. Detta faktum är ett specialfall av 3 sigma-regeln för ett normalt prov.
Mer exakt är sannolikheten att få ett normalt tal mellan och :
Med en noggrannhet på 12 signifikanta siffror anges värdena för i tabellen [8] :
OEIS | |||||
---|---|---|---|---|---|
ett | 0,682689492137 | 0,317310507863 |
|
A178647 | |
2 | 0,954499736104 | 0,045500263896 |
|
A110894 | |
3 | 0,997300203937 | 0,002699796063 |
|
A270712 | |
fyra | 0,999936657516 | 0,000063342484 |
| ||
5 | 0,999999426697 | 0,000000573303 |
| ||
6 | 0,999999998027 | 0,000000001973 |
|
Moment och absoluta moment för en slumpvariabel kallas de matematiska förväntningarna på slumpvariabler resp . Om den matematiska förväntan är en slumpvariabel kallas dessa parametrar för centrala moment . I de flesta fall är momenten för heltal av intresse.
Om den har en normalfördelning så har den (ändliga) moment för alla med reell del större än −1. För icke-negativa heltal är de centrala momenten:
Här är ett naturligt tal, och notationen betyder dubbelfaktorialen av talet, det vill säga (eftersom det är udda i det här fallet) produkten av alla udda tal från 1 till
De centrala absoluta momenten för icke-negativa heltal är:
Den sista formeln är också giltig för godtycklig .
Fouriertransformen av den normala sannolikhetstätheten med genomsnittlig standardavvikelse är [9] :
var är den imaginära enheten .Om förväntan är den första faktorn 1, och Fouriertransformen, upp till en konstant, är den normala sannolikhetstätheten över frekvensintervall, med förväntan lika med 0 och standardavvikelse . I synnerhet är standardnormalfördelningen en egenfunktion av Fouriern . omvandla.
I sannolikhetsteorin är Fouriertransformen av fördelningsdensiteten för en reell slumpvariabel nära relaterad till den karakteristiska funktionen för denna variabel, som definieras som den matematiska förväntan av och är en funktion av en reell variabel (Fourierns frekvensparameter omvandla). Definitionen kan utökas till en komplex variabel [10] . Förhållandet är skrivet så här:
Normalfördelningen är oändligt delbar .
Om de slumpmässiga variablerna och är oberoende och har en normalfördelning med medelvärde och och varianser respektive , så har den också en normalfördelning med medelvärde och varians
Detta innebär att en normal slumpvariabel kan representeras som summan av ett godtyckligt antal oberoende normala slumpvariabler.
Normalfördelningen har den maximala differentialentropin bland alla kontinuerliga distributioner vars varians inte överstiger ett givet värde [11] [12] .
Regeln om tre sigma ( ) - nästan alla värden för en normalfördelad slumpvariabel ligger i intervallet:
var är den matematiska förväntan och parametern för en normal stokastisk variabel.Mer exakt, med ungefär en sannolikhet på 0,9973, ligger värdet av en normalfördelad stokastisk variabel i det angivna intervallet.
I datorsimuleringar, speciellt vid tillämpning av Monte Carlo-metoden , är det önskvärt att använda kvantiteter fördelade enligt normallagen. Många algoritmer ger standardnormala värden, eftersom normalvärdet kan erhållas som:
där Z är standardnormalvärdet.Algoritmerna använder också olika transformationer av enhetliga storheter. De enklaste ungefärliga modelleringsmetoderna är baserade på den centrala gränssatsen . Om vi lägger till ett tillräckligt stort antal oberoende identiskt fördelade kvantiteter med en ändlig varians , kommer summan att ha en fördelning nära det normala. Till exempel, om du lägger till 100 oberoende standard, enhetligt fördelade slumpvariabler, kommer fördelningen av summan att vara ungefär normal .
För programmatisk generering av normalfördelade pseudoslumpvariabler är det att föredra att använda Box-Muller-transformen . Det låter dig generera ett normalfördelat värde baserat på ett enhetligt fördelat värde.
Det finns också Ziggurat-algoritmen , som är ännu snabbare än Box-Muller-transformen. Det är dock svårare att implementera, men användningen är motiverad i de fall där det krävs att generera ett mycket stort antal ojämnt fördelade slumptal.
Normalfördelningen finns ofta i naturen. Till exempel är följande slumpvariabler väl modellerade av normalfördelningen:
Denna fördelning är så utbredd eftersom det är en oändligt delbar kontinuerlig fördelning med ändlig varians. Därför närmar sig vissa andra det i gränsen, som binomial och Poisson . Denna fördelning modellerar många icke-deterministiska fysiska processer [13] .
Multivariat normalfördelning används i studien av multivariata slumpvariabler (slumpvektorer). Ett av många exempel på sådana tillämpningar är studiet av mänskliga personlighetsparametrar inom psykologi och psykiatri .
För första gången dök normalfördelningen som gränsen för binomialfördelningen vid upp 1738 i den andra upplagan av De Moivres "The Doctrine of Chance" [18] . Detta var det första beviset på ett specialfall av den centrala gränssatsen . År 1809 introducerade Gauss, i The Theory of the Motion of Celestial Bodies, denna fördelning som härrörande från upprepade mätningar av himlakropparnas rörelse. Gauss härledde dock en formel för verkliga slumpvariabler från principen att maximera fogdensiteten för alla mätningar vid en punkt med koordinater lika med medelvärdet av alla mätningar. Denna princip har senare kritiserats. År 1812 generaliserade Laplace i Moivre-Laplace-satsen resultatet av Moivre för en godtycklig binomialfördelning, det vill säga för summor av identiskt fördelade oberoende binära storheter [3] .
Ordböcker och uppslagsverk | |
---|---|
I bibliografiska kataloger |
|
Sannolikhetsfördelningar | |
---|---|
Diskret | |
Absolut kontinuerligt |