Beskrivande statistik

Den aktuella versionen av sidan har ännu inte granskats av erfarna bidragsgivare och kan skilja sig väsentligt från versionen som granskades den 19 oktober 2017; kontroller kräver 16 redigeringar .

Beskrivande statistik eller beskrivande statistik ( eng.  beskrivande statistik ) handlar om bearbetning av empirisk data, deras systematisering, visuell presentation i form av grafer och tabeller samt deras kvantitativa beskrivning genom de statistiska huvudindikatorerna.

Kontrasterad med statistisk slutledning i den meningen att den inte drar slutsatser om den allmänna befolkningen baserat på resultaten av studien av specialfall. Statistisk slutledning, å andra sidan, antar att egenskaperna och mönstren som identifierats i studien av provobjekt också är inneboende i den allmänna populationen.

Dataaggregationsmetoder

Beskrivande statistik använder tre huvudmetoder för dataaggregering :

  1. Tabellvy
  2. Grafisk bild
  3. Beräkning av statistiska indikatorer

Tabellvy

Statistisk tabell  - ett system av rader och kolumner där statistisk information om socioekonomiska fenomen presenteras i en viss sekvens.

Sammanfattningsstatistik

Det finns två huvudformer för att beskriva en slumpvariabel: fördelningsfunktionen och sannolikhetstätheten (den ena är differentiell, den andra är integral).

Sammanfattande statistik är ytterligare eller alternativa deskriptorer av histogram och kumulativa distributioner.

Statistiska egenskaper är sammanfattande värden som beräknas från ett urval av observationer, vilket vanligtvis, men inte nödvändigtvis, är en uppskattning av någon populationsparameter.

Generellt faller sammanfattande statistik in i tre kategorier:

  1. mått på plats eller centralitet (om fördelningen är symmetrisk är alla tre egenskaper lika med varandra)
    1. Betyda
    2. Förväntat värde
    3. Median (inte föremål för "avvikande värden", verktyg för att bli av med "avvikande")
    4. Mode
  1. spridnings- eller spridnings-/lokaliseringsåtgärder
    1. Variansen för en slumpvariabel är medelkvadraten på medelvärdet, eftersom det kvadratiska måttet är det minst tillförlitliga (både medelvärdet är inte en stabil egenskap och variansen, "outliers påverkar" variansen)
    2. Standardavvikelse (nästan lika med spridning)
    3. Minimum , Maximum (extrema värden)
    4. Interkvantil räckvidd
    5. Spännvidd variation
    6. Intervall
    7. Konfidensintervall
  1. formmått
    1. Asymmetrikoefficient
    2. Skevningsfaktor

Diskreta och kontinuerliga distributioner

Fördelningen kan vara både diskret och kontinuerlig. I fallet med en diskret fördelning är detta en sådan fördelning när sannolikheten för vart och ett av värdena för den slumpmässiga variabeln är densamma. Om det finns N antal möjliga värden.

Ett exempel på enhetlig distributionsmodellering. Vi står vid busshållplatsen, det är ett trafikintervall på 10 minuter. Vid varje slumpmässigt ögonblick (när vi stannar) är sannolikheten att bussen går inom 1 minut 1/10. Vad är sannolikheten att bussen går inom 4 minuter? Exakt samma - 1/10. För att ställa in en slumpvariabel måste du ställa in sannolikhetsfördelningstätheten på ett givet segment.

Se även

Litteratur

Länkar