Multipelkorrelationskoefficient - Karakteriserar tätheten av den linjära korrelationen mellan en slumpvariabel och någon uppsättning slumpvariabler. Närmare bestämt, om (ξ 1 ,ξ 2 ,...,ξ k ) är en slumpmässig vektor från Rk , så är den multipla korrelationskoefficienten mellan ξ 1 och ξ 2 ,...,ξ k numeriskt lika med paret linjär korrelationskoefficient mellan värdet ξ 1 och dess bästa linjära approximation i variablerna ξ 2 ...,ξ k , vilket är en linjär regression av ξ 1 på ξ 2 ,...,ξ k .
Multipelkorrelationskoefficienten har egenskapen att under villkoret
när är en regression av ξ 1 på ξ 2 ,...,ξ k ,
bland alla linjära kombinationer av variabler kommer ξ 2 ,...,ξ k variabeln ξ 1 att ha den maximala korrelationskoefficienten med ξ 1 * , sammanfallande med . I denna mening är den multipla korrelationskoefficienten ett specialfall av den kanoniska korrelationskoefficienten . Vid k = 2 sammanfaller multipelkorrelationskoefficienten i absolut värde med den parvisa linjära korrelationskoefficienten ρ 12 mellan ξ 1 och ξ 2 .
Multipelkorrelationskoefficienten beräknas med hjälp av korrelationsmatrisen enligt formeln
,
där är determinanten för korrelationsmatrisen och är det algebraiska komplementet av elementet ρ 11 = 1 ; här . Om , då med sannolikhet 1 sammanfaller värdena på ξ 1 med den linjära kombinationen ξ 2 ,...,ξ k , därför ligger den gemensamma fördelningen ξ 1 ,ξ 2 ,...,ξ k på ett hyperplan i utrymmet R k . Å andra sidan, för alla parkorrelationskoefficienter är ρ 12 = ρ 13 = ... = ρ 1k = 0 lika med noll, därför korrelerar värdena på ξ 1 inte med värdena på ξ 2 , ...,ξ k . Det omvända är också sant. Multipelkorrelationskoefficienten kan också beräknas med hjälp av formeln
,
där är variansen av ξ 1 och är variansen av ξ 1 i förhållande till regressionen.
Provanalogen för multipelkorrelationskoefficienten är värdet , där och är uppskattningar för och erhållna från ett urval av storlek n . Fördelningen av statistiken används för att testa nollhypotesen om inget samband . Förutsatt att provet tas från en multivariat normalfördelning kommer värdet att ha en betafördelning med parametrar om . För fallet är typen av distribution känd, men används praktiskt taget inte på grund av dess krånglighet.