Ett histogram i matematisk statistik är en av de grafiska metoderna för att studera fördelningsserien av värden för en slumpvariabel. [B:1]
Bland de grafiska metoderna för att studera distributionsserier anges följande [1] :
Stegpolygoner och frekvenspolygoner kallas gemensamt för distributionspolygoner . Spridningsdiagrammet, stegpolygonen och frekvenspolygonen anges som de mest bekväma. [ett]
För det tvådimensionella fallet, istället för en distributionsserie, konstrueras en distributionstabell, och den motsvarande grafiska konstruktionen kallas ett prismogram . [ett]
GOST R 50779.10-2000 erbjöd följande definitioner:
2.17 histogram
En grafisk representation av frekvensfördelningen för en kvantitativ egenskap, bildad av sammanhängande rektanglar vars baser är klassintervall och vars ytor är proportionella mot frekvenserna för dessa klasser
. 2.18 stapeldiagram
En grafisk representation av frekvensfördelningen för en diskret slumpvariabel, bildas av en uppsättning kolumner med lika bredd, vars höjder är proportionella mot frekvenserna[D:1]
Låt vara ett exempel från någon distribution . Låt oss definiera en partition av den verkliga linjen . Låta
är antalet provelement som faller inom det th intervallet. Sedan en styckvis konstant funktion , som har formen:
, kallas ett normaliserat histogram.[2]Låt fördelningen av stokastiska variabler vara absolut kontinuerlig och ges av sannolikhetstätheten . Sedan
med sannolikhet kl . [3]När man ritar enligt metoden för rektanglar är den horisontella axeln uppdelad i lika segment som motsvarar raden ; på dessa segment, som på baserna, byggs rektanglar med en höjd som är proportionell mot frekvensen av en given urladdning. [fyra]
Låt oss beskriva denna procedur mer i detalj. Först delas uppsättningen värden som provelementet kan ta upp i flera bitar (bins). Oftast tas dessa intervaller på samma sätt, men detta är inget strikt krav. Dessa intervall plottas på den horisontella axeln, sedan ritas en rektangel ovanför varje. Om alla intervall var lika, då är höjden på varje rektangel proportionell mot antalet provelement som faller in i motsvarande intervall. Om intervallen är olika, väljs rektangelns höjd så att dess area är proportionell mot antalet provelement som faller in i detta intervall.
Det är väsentligt för att konstruera ett histogram att välja den optimala partitionen, eftersom när intervallen ökar, minskar detaljen i uppskattningen av distributionstätheten, och när intervallen minskar, minskar noggrannheten i dess värde. För att välja det optimala antalet intervaller används ofta Sturges-regeln .
,där är det totala antalet observationer av kvantiteten, är basen 2-logaritmen och är heltalsdelen av .
Ofta hittas också en regel som uppskattar det optimala antalet intervall som kvadratroten av det totala antalet mätningar:
Representation av distributionsserierna i transformerad form är en nödvändig förutsättning när man jämför dessa serier med varandra [1] .
Studiet av distributionsserier underlättas avsevärt genom användningen av den grafiska metoden . Vid avbildning av distributionsserier plottas värdena för urladdningarna eller de observerade värdena för den slumpmässiga variabeln på den horisontella axeln respektive på den vertikala axeln bitfrekvenserna eller de observerade frekvenserna [1] .
Konstruktionen av histogram används för att få en empirisk uppskattning av distributionstätheten för en slumpvariabel [5] .
I den mest allmänna formen är en av de viktigaste uppgifterna formulerad enligt följande: vid en given signifikansnivå, testa hypotesen att fördelningen som presenteras på histogrammet är monomodal [A: 1] .
Histogramanalys anses traditionellt bland geologer vara en tydlig och informativ metod för att lösa geologiska problem, eftersom histogramanalys gör det möjligt att testa geologiska hypoteser formulerade på statistikens språk [A: 1] .
Inom kardiologi är konstruktionen och beskrivningen av ett histogram en obligatorisk geometrisk metod för analys av hjärtfrekvensvariabilitet , föreslagen av 1996 [A: 2] [B: 2] standarder . Som ytterligare sätt att beskriva hjärtfrekvenshistogram, används metoder för deras triangulära tolkning , såsom St. George-indexet och det triangulära indexet [6] .
I produktionen, när man analyserar tillståndet för den tekniska processen, anses konstruktionen av histogram vara ett effektivt sätt att bedöma situationen och genomföra en analys i det första steget av att studera stabiliteten i den tekniska processen, och anses också vara en av de effektiva kvalitetsstyrningsverktyg i stadiet för kvalitetskontroll av den färdiga produkten och analys av det aktuella läget för den tekniska processen [A :3] .