Multivariat normalfördelning
Den aktuella versionen av sidan har ännu inte granskats av erfarna bidragsgivare och kan skilja sig väsentligt från
versionen som granskades den 7 april 2020; kontroller kräver
5 redigeringar .
Multivariat normalfördelning (eller multivariat Gaussfördelning ) i sannolikhetsteorin är en generalisering av endimensionell normalfördelning . En slumpmässig vektor som har en multivariat normalfördelning kallas en Gaussisk vektor [1] .
Definitioner
En slumpmässig vektor har en multivariat normalfördelning om ett av följande ekvivalenta villkor är sant:

- En godtycklig linjär kombination av vektorkomponenter har en normalfördelning eller är en konstant (detta påstående fungerar bara om den matematiska förväntan är 0).

- Det finns en vektor med oberoende standard normala slumpvariabler , en reell vektor och en dimensionsmatris , så att:




.

.
Densiteten för den icke-degenererade normalfördelningen
- Om vi endast betraktar distributioner med en icke-singular kovariansmatris , kommer följande definition också att vara ekvivalent:
Det finns en vektor och
en positiv-definitiv symmetrisk matris med dimension , så att vektorns
sannolikhetstäthet har formen
[2] ::




,
där är
matrisens determinant och är matrisen
invers mot


- Vektorn är medelvektorn och är dess kovariansmatris .


- I fallet med minskar den multivariata normalfördelningen till den vanliga normalfördelningen.

- Om den slumpmässiga vektorn har en multivariat normalfördelning, skriv .


Bivariat normalfördelning
Ett specialfall av den multivariata normalfördelningen är den bivariata normalfördelningen. I det här fallet har vi två slumpvariabler med matematiska förväntningar , varianser och kovarians . I detta fall har kovariansmatrisen storlek 2, och dess determinant är




var är korrelationskoefficienten för stokastiska variabler.

Då kan tätheten för en tvådimensionell icke-degenererad (korrelationskoefficient i absolut värde är inte lika med enhet) normalfördelning skrivas som:
![{\displaystyle f(x_{1},x_{2})={\frac {1}{2\pi \sigma _{1}\sigma _{2}{\sqrt {1-\rho ^{2} }}}}\exp \left\{-{\frac {1}{2(1-\rho ^{2})}}\left[{\frac {(x_{1}-\mu _{1} )^{2)){\sigma _{1}^{2))}-\rho {\frac {2(x_{1}-\mu _{1})(x_{2}-\mu _{ 2})}{\sigma _{1}\sigma _{2}}}+{\frac {(x_{2}-\mu _{2})^{2}}{\sigma _{2}^ {2}}}\right]\right\}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ad56b776c5aab19eaea123cc9ef5c1c2e0157de4)
.
I händelse av att (det vill säga de är beroende) är deras summa fortfarande normalfördelad, men ytterligare en term förekommer i variansen : .



Egenskaper för den multivariata normalfördelningen
- Om en vektor har en multivariat normalfördelning, så har dess komponenter en univariat normalfördelning. Det omvända är sant när komponenterna är oberoende [3] .


- Om de slumpmässiga variablerna har en univariat normalfördelning och är gemensamt oberoende , har slumpvektorn en multivariat normalfördelning. Kovariansmatrisen för en sådan vektor är diagonal.



- Om har en multivariat normalfördelning och dess komponenter är parvis okorrelerade , då är de oberoende. Men om några slumpvariabler har endimensionella normalfördelningar och inte parvis korrelerar, så följer det inte att de är oberoende och har en multivariat normalfördelning.


Exempel. Låt , och med lika sannolikheter och vara oberoende av det angivna normalvärdet. Sedan om , då är korrelationen och lika med noll. Dessa slumpvariabler är dock beroende och har, i kraft av det första påståendet i stycket, ingen multivariat normalfördelning.




- Den multivariata normalfördelningen är stabil under linjära transformationer . Om , och är en godtycklig matris av dimension , då




Genom en sådan transformation och förskjutning kan varje icke-degenererad normalfördelning reduceras till en vektor med oberoende
standardnormalvärden .
Moment i den multivariata normalfördelningen
Låt vara centrerade (med noll matematisk förväntan) slumpvariabler som har en multivariat normalfördelning, då är momenten för udda lika med noll, och för jämna de beräknas det med formeln




där summeringen utförs över alla möjliga uppdelningar av index i par. Antalet faktorer i varje term är , antalet termer är
Till exempel, för moment av fjärde ordningen i varje term finns det två faktorer och det totala antalet termer kommer att vara lika med . Motsvarande allmänna formel för momenten av fjärde ordningen är:

I synnerhet om
På
På
Villkorlig tilldelning
Låt slumpmässiga vektorer och ha en gemensam normalfördelning med matematiska förväntningar , kovariansmatriser och kovariansmatris . Detta innebär att den kombinerade slumpmässiga vektorn
följer en multivariat normalfördelning med en förväntansvektor
och en kovariansmatris, som kan representeras som följande blockmatris








,
var .

Då har den slumpmässiga vektorn , givet värdet av den slumpmässiga vektorn, en (multivariat) normal villkorlig fördelning med följande villkorliga medelvärde och villkorlig kovariansmatris


.
Den första likheten definierar den linjära regressionsfunktionen (beroendet av vektorns villkorliga förväntan på det givna värdet x för den slumpmässiga vektorn ), och matrisen är matrisen av regressionskoefficienter.



Den villkorliga kovariansmatrisen är den slumpmässiga felkovariansmatrisen för linjära regressioner av komponenterna i vektor för vektor . I fallet där är en vanlig slumpvariabel (enkomponentvektor), är den villkorliga kovariansmatrisen den villkorliga variansen (i huvudsak variansen av det slumpmässiga felet för regressionen på vektorn )





Anteckningar
- ↑ A. N. Shiryaev. Sannolikhet. Volym 1. MTSNMO, 2007.
- ↑ Groot, 1974 , sid. 58-63.
- ↑ A.A. Novoselov. Favoriter: Normaliteten hos en ledfördelning . Moderna risksystem (28 mars 2014). Hämtad 8 maj 2017. Arkiverad från originalet 17 maj 2017. (obestämd)
Litteratur
- M. de Groot Optimal Statistical Decisions = Optimal Statistical Decisions. —M.: Mir, 1974. — 492 sid.