Histogram (statistik)

Den aktuella versionen av sidan har ännu inte granskats av erfarna bidragsgivare och kan skilja sig väsentligt från versionen som granskades den 27 april 2016; kontroller kräver 10 redigeringar .

Ett histogram i matematisk statistik  är en av de grafiska metoderna för att studera fördelningsserien av värden för en slumpvariabel. [B:1]

Bland de grafiska metoderna för att studera distributionsserier anges följande [1] :

Stegpolygoner och frekvenspolygoner kallas gemensamt för distributionspolygoner . Spridningsdiagrammet, stegpolygonen och frekvenspolygonen anges som de mest bekväma. [ett]

För det tvådimensionella fallet, istället för en distributionsserie, konstrueras en distributionstabell, och den motsvarande grafiska konstruktionen kallas ett prismogram . [ett]

Definition

Enligt GOST

GOST R 50779.10-2000 erbjöd följande definitioner:

2.17 histogram
En grafisk representation av frekvensfördelningen för en kvantitativ egenskap, bildad av sammanhängande rektanglar vars baser är klassintervall och vars ytor är proportionella mot frekvenserna för dessa klasser

. 2.18 stapeldiagram
En grafisk representation av frekvensfördelningen för en diskret slumpvariabel, bildas av en uppsättning kolumner med lika bredd, vars höjder är proportionella mot frekvenserna[D:1]

Alternativ definition

Låt vara ett exempel från någon distribution . Låt oss definiera en partition av den verkliga linjen . Låta

är antalet provelement som faller inom det th intervallet. Sedan en styckvis konstant funktion , som har formen:

, kallas ett normaliserat histogram.[2]

Histogram för en perfekt kontinuerlig fördelning

Låt fördelningen av stokastiska variabler vara absolut kontinuerlig och ges av sannolikhetstätheten . Sedan

med sannolikhet kl . [3]

Procedur för att konstruera ett histogram

När man ritar enligt metoden för rektanglar är den horisontella axeln uppdelad i lika segment som motsvarar raden ; på dessa segment, som på baserna, byggs rektanglar med en höjd som är proportionell mot frekvensen av en given urladdning. [fyra]

Låt oss beskriva denna procedur mer i detalj. Först delas uppsättningen värden som provelementet kan ta upp i flera bitar (bins). Oftast tas dessa intervaller på samma sätt, men detta är inget strikt krav. Dessa intervall plottas på den horisontella axeln, sedan ritas en rektangel ovanför varje. Om alla intervall var lika, då är höjden på varje rektangel proportionell mot antalet provelement som faller in i motsvarande intervall. Om intervallen är olika, väljs rektangelns höjd så att dess area är proportionell mot antalet provelement som faller in i detta intervall.

Det är väsentligt för att konstruera ett histogram att välja den optimala partitionen, eftersom när intervallen ökar, minskar detaljen i uppskattningen av distributionstätheten, och när intervallen minskar, minskar noggrannheten i dess värde. För att välja det optimala antalet intervaller används ofta Sturges-regeln .

,

där är det totala antalet observationer av kvantiteten, är basen 2-logaritmen och är heltalsdelen av .

Ofta hittas också en regel som uppskattar det optimala antalet intervall som kvadratroten av det totala antalet mätningar:

Användning

Representation av distributionsserierna i transformerad form är en nödvändig förutsättning när man jämför dessa serier med varandra [1] .

Studiet av distributionsserier underlättas avsevärt genom användningen av den grafiska metoden . Vid avbildning av distributionsserier plottas värdena för urladdningarna eller de observerade värdena för den slumpmässiga variabeln på den horisontella axeln respektive på den vertikala axeln bitfrekvenserna eller de observerade frekvenserna [1] .

Konstruktionen av histogram används för att få en empirisk uppskattning av distributionstätheten för en slumpvariabel [5] .

I den mest allmänna formen är en av de viktigaste uppgifterna formulerad enligt följande: vid en given signifikansnivå, testa hypotesen att fördelningen som presenteras på histogrammet är monomodal [A: 1] .

Användningsexempel

Histogramanalys anses traditionellt bland geologer vara en tydlig och informativ metod för att lösa geologiska problem, eftersom histogramanalys gör det möjligt att testa geologiska hypoteser formulerade på statistikens språk [A: 1] .

Inom kardiologi är konstruktionen och beskrivningen av ett histogram en obligatorisk geometrisk metod för analys av hjärtfrekvensvariabilitet , föreslagen av 1996 [A: 2] [B: 2] standarder . Som ytterligare sätt att beskriva hjärtfrekvenshistogram, används metoder för deras triangulära tolkning , såsom St. George-indexet och det triangulära indexet [6] .

I produktionen, när man analyserar tillståndet för den tekniska processen, anses konstruktionen av histogram vara ett effektivt sätt att bedöma situationen och genomföra en analys i det första steget av att studera stabiliteten i den tekniska processen, och anses också vara en av de effektiva kvalitetsstyrningsverktyg i stadiet för kvalitetskontroll av den färdiga produkten och analys av det aktuella läget för den tekniska processen [A :3] .

Se även

Anteckningar

  1. 1 2 3 4 5 Mitropolsky, 1971 , § 2 Rader och fördelningstabeller, sid. 20-43.
  2. Ett normaliserat histogram är en sannolikhetstäthet. Särskilt:
    • .
    • .
  3. Således närmar sig området för figuren under det normaliserade histogrammet, begränsat av intervallet , sannolikheten för att acceptera värden inom detta intervall för någon av de slumpmässiga variablerna . Det normaliserade histogrammet konvergerar dock inte punktvis till den teoretiska distributionstätheten för dessa slumpvariabler.
  4. Mitropolsky, 1971 , sid. 32.
  5. För att konstruera ett histogram delas det observerade variationsintervallet för en slumpvariabel upp i flera intervall och andelen av alla mätningar som faller inom vart och ett av intervallen beräknas. Värdet på varje aktie tas som en uppskattning av sannolikheten för att en slumpvariabel faller in i motsvarande intervall. Det är fel att tala om sannolikhetstätheten i samband med ett histogram, eftersom histogrammering omvandlar en fördelning av vilket slag som helst till en diskret (händelsen av ett värde som faller in i ett visst intervall beaktas, vars antal kan räknas), och för en diskret slumpvariabel finns det ingen sannolikhetstäthetsfunktion.
  6. Ryabykina, 1998 , § 3.6. Geometriska metoder för analys av rytmografi, sid. 43-49.

Litteratur

Böcker

  1. Mitropolsky A. K. . Teknik för statistiska beräkningar. - 2:a uppl., reviderad. och ytterligare .. - M . : Nauka, 1971. - 576 sid. - (En ingenjörs fysikalisk-matematiska bibliotek). - 19 500 exemplar.
  2. Ryabykina G.V. , Sobolev A.V. Hjärtfrekvensvariabilitet. - M . : "Star'Ko", 1998. - 200 s. — ISBN 5-85493-032-3 .

Artiklar

  1. 1 2 Tkachev Yu. A. Studie av histogram av geologiska särdrag genom datormodellering  // Bulletin från Institute of Geology vid Komi Scientific Center i Ural-grenen av Ryska Vetenskapsakademin: tidskrift. - 2004. - Nr 2 . - S. 7-11 .
  2. Arbetsgrupp för European Society of Cardiology och North American Society of Stimulation and Electrophysiology. Hjärtslagsvariation. Standarder för mätning, fysiologisk tolkning och klinisk användning Bulletin of Arhythmology  : Journal  . - 1999. - Nr 11 . - S. 53-78 .
  3. Abdullin I. A. , Beloborodova O. I. , Laptev N. I. , Moskvicheva E. L. , Goryainov A. D. Tillämpning av statistiska metoder för att bedöma den teknologiska processen för produktion av formade laddningar  // Bulletin of the Kazan Technological University: journal. - 2010. - Nr 12 . - S. 477-482 .

Normativa dokument

  1. GOST R 50779.10-2000 (ISO 3534-1-93) Statistiska metoder. Sannolikhet och statistikbas. Termer och definitioner . docs.cntd.ru. Hämtad 27 maj 2020. Arkiverad från originalet 19 maj 2020.

Länkar

  • Canva Online Bar Chart Builder
  • Online kartverktyg för webbtjänsten ChartBlocks