Aritmetiskt medelvärde (i matematik och statistik ) är ett slags medelvärde . Det definieras som ett tal lika med summan av alla tal i uppsättningen dividerat med deras antal. Det är ett av de vanligaste måtten på central tendens .
Det föreslogs (tillsammans med det geometriska medelvärdet och det harmoniska medelvärdet ) av pytagoreerna [1] .
Särskilda fall av det aritmetiska medelvärdet är medelvärdet ( av den allmänna populationen ) och urvalsmedelvärdet ( av urvalet ).
I händelse av att antalet element i uppsättningen av siffror i en stationär slumpmässig process är oändligt, spelar den matematiska förväntan av en slumpmässig variabel rollen som det aritmetiska medelvärdet .
Låt oss beteckna uppsättningen av siffror X = ( x 1 , x 2 , …, x n ) - då betecknas provmedelvärdet vanligtvis med en horisontell stapel över variabeln ( , uttalas " x med en stapel").
Den grekiska bokstaven μ används vanligtvis för att beteckna det aritmetiska medelvärdet av hela populationen av siffror . För en slumpvariabel , för vilken medelvärdet är definierat, är μ sannolikhetsmedelvärdet , eller den matematiska förväntan av slumpvariabeln. Om mängden X är en uppsättning slumptal med sannolikhetsmedelvärde μ, så är för varje urval x i från denna mängd μ = E{ x i } förväntan på detta urval.
I praktiken är skillnaden mellan μ och μ att μ är en typisk variabel, eftersom du kan se urvalet snarare än hela populationen . Därför, om urvalet presenteras slumpmässigt (i termer av sannolikhetsteori ), kan (men inte μ) behandlas som en slumpvariabel med en sannolikhetsfördelning på urvalet (sannolikhetsfördelning av medelvärdet).
Båda dessa kvantiteter beräknas på samma sätt:
Om X är en slumpvariabel kan medelvärdet av X ses som det aritmetiska medelvärdet av värdena i upprepade mätningar av X. Detta är en manifestation av lagen om stora tal . Därför används urvalsmedelvärdet för att uppskatta den okända matematiska förväntan.
I elementär algebra är det bevisat att medelvärdet av n + 1 tal är större än medelvärdet av n tal om och endast om det nya talet är större än det gamla medelvärdet, mindre om och endast om det nya talet är mindre än medelvärdet , och ändras inte om och endast om det nya talet är genomsnittet. Ju större n , desto mindre är skillnaden mellan de nya och gamla medelvärdena.
Observera att det finns flera andra "medelvärden" tillgängliga, inklusive potensmedelvärde , Kolmogorov-medelvärde , harmoniskt medelvärde , aritmetiskt-geometriskt medelvärde och olika viktade medelvärden (t.ex. aritmetiskt vägt medelvärde , geometriskt viktat medelvärde , viktat övertonsmedelvärde ).
Om det finns en integral av någon funktion av en variabel, så bestäms det aritmetiska medelvärdet för denna funktion på segmentet genom en bestämd integral :
Här, för att bestämma segmentet , är det underförstått att dessutom att nämnaren inte är lika med 0.
En linjärt transformerad datauppsättning kan erhållas genom att tillämpa en linjär mappning på en metriskt skalad datauppsättning enligt följande: . Då blir det nya medelvärdet för datamängden , eftersom .
Även om det aritmetiska medelvärdet ofta används som medelvärden eller centrala trender, gäller inte detta begrepp för robust statistik, det vill säga det aritmetiska medelvärdet är starkt påverkat av "stora avvikelser". Det är anmärkningsvärt att för distributioner med en stor skevhet kanske det aritmetiska medelvärdet inte motsvarar begreppet "genomsnitt", och värdena för medelvärdet från robust statistik (till exempel medianen ) kan bättre beskriva den centrala trenden.
Det klassiska exemplet är beräkningen av medelinkomsten. Det aritmetiska medelvärdet kan misstolkas som medianen , vilket kan leda till slutsatsen att det finns fler personer med högre inkomst än vad det egentligen är. "Mean" inkomst tolkas så att de flesta människors inkomster ligger nära denna siffra. Denna "genomsnittliga" (i betydelsen av det aritmetiska medelvärdet) är högre än inkomsten för de flesta, eftersom en hög inkomst med stor avvikelse från genomsnittet gör det aritmetiska medelvärdet kraftigt skevt (i motsats härtill "motstår" medianinkomsten) en sådan skevhet). Denna "genomsnittliga" inkomst säger dock ingenting om antalet personer nära medianinkomsten (och säger inget om antalet personer nära den modala inkomsten). Men om begreppen "genomsnitt" och "majoritet" tas lätt på, så kan man felaktigt dra slutsatsen att de flesta människor har högre inkomster än de faktiskt har. Till exempel kommer en rapport om den "genomsnittliga" nettoinkomsten i Medina, Washington , beräknad som det aritmetiska genomsnittet av alla invånares årliga nettoinkomster, att ge ett förvånansvärt stort antal - på grund av Bill Gates . Betrakta provet (1, 2, 2, 2, 3, 9). Det aritmetiska medelvärdet är 3,17, men fem av de sex värdena ligger under detta medelvärde.
Om tal multipliceras , inte adderas , måste det geometriska medelvärdet användas , inte det aritmetiska medelvärdet. Oftast inträffar denna incident när man beräknar avkastningen på investeringar i finans.
Till exempel, om aktier föll med 10 % under det första året och steg med 30 % under det andra året , beräkna den "genomsnittliga" ökningen under dessa två år som det aritmetiska medelvärdet ( -10 % + 30 % ) / 2 = 10 % är felaktigt, och det korrekta genomsnittet i detta fall ges av den sammansatta årliga tillväxttakten : den årliga tillväxten är cirka 8,16653826392% ≈ 8,2% .
Anledningen till detta är att räntan har en ny utgångspunkt varje gång: 30% är 30% av det lägre antalet än priset i början av det första året: om aktien började på $30 och föll med 10% , är den värd till början av det andra året 27 $. Om aktien är upp 30 % är den värd 35,1 USD i slutet av det andra året. Det aritmetiska genomsnittet för denna tillväxt är 10 % , men eftersom aktien bara har stigit med 5,1 USD på 2 år ger en genomsnittlig ökning på 8,2 % ett slutresultat på 35,1 USD:
30 USD × (1 – 0,1) (1 + 0,3) = 30 USD × (1 + 0,082) (1 + 0,082) = 35,1 USD. Om vi använder det aritmetiska medelvärdet på 10 % på samma sätt får vi inte det faktiska värdet: $30 × (1 + 0,1) (1 + 0,1) = $36,3.
Sammansatt ränta i slutet av år 2: 90% * 130% = 117% , det vill säga en total ökning med 17% , och den genomsnittliga årliga sammansatta räntan , det vill säga en genomsnittlig årlig ökning med 8,2% .
Vid beräkning av det aritmetiska medelvärdet för någon variabel som ändras cykliskt (till exempel fas eller vinkel ), bör särskild försiktighet iakttas. Till exempel skulle medelvärdet av 1 ° och 359 ° vara 180 ° . Detta resultat är felaktigt av två skäl.
Medelvärdet för en cyklisk variabel, beräknat enligt ovanstående formel, kommer att förskjutas artificiellt i förhållande till det verkliga medelvärdet till mitten av det numeriska intervallet. På grund av detta beräknas medelvärdet på ett annat sätt, nämligen talet med den minsta variansen (mittpunkten) väljs som medelvärde. I stället för att subtrahera, används också modulo-avstånd (dvs periferiellt avstånd). Till exempel är det modulära avståndet mellan 1° och 359° 2°, inte 358° (på en cirkel mellan 359° och 360° = 0° - en grad, mellan 0° och 1° - även 1°, totalt - 2°).
Betyda | |
---|---|
Matte | Effektmedelvärde ( viktad ) harmoniskt medelvärde viktad geometriskt medelvärde viktad Medel viktad effektivvärdet Genomsnittlig kubik glidande medelvärde Aritmetiskt-geometriskt medelvärde Funktion Mean Kolmogorov menar |
Geometri | |
Sannolikhetsteori och matematisk statistik | |
Informationsteknologi | |
Satser | |
Övrig |