Sturges-regeln är en empirisk regel för att bestämma det optimala antalet intervall i vilka det observerade variationsintervallet för en slumpvariabel delas upp när man konstruerar ett histogram av dess distributionstäthet. Uppkallad efter den amerikanske statistikern Herbert Sturges ( 1882-1958 ).
Antalet intervall definieras som:
,där är det totala antalet observationer av kvantiteten, är basen 2-logaritmen och är heltalsdelen av .
Hittas ofta skrivet i termer av decimallogaritmen:
,Grunden för den är en uppskattning av antalet händelser med olika sannolikheter i Bernoullis testschema med en varaktighet på ett steg. Om det finns testserier med 2 alternativa utfall med en konstant sannolikhet för varje, då är antalet typer av serier, där sammansättningen innehåller utfall som tar det första av de alternativa värdena, och följaktligen tar det andra, lika med: (från till ), och det totala antalet serier .
Om vi approximerar värdena för den observerade slumpvariabeln genom att addera värdena för två tal som slumpmässigt faller ut i en serie tester och (till exempel och ) som motsvarar resultaten av Bernoulli-schemat, då kommer varje serie av tester som innehåller utfall med ett resultat och utfall med ett resultat att motsvara summan . Antalet olika värden (i det aktuella fallet: , för paret - ) kommer att vara lika med antalet sekvenser med olika antal utfall . Således, om vi ställer in uppgiften så att det för varje intervall mellan och i genomsnitt finns minst ett värde av summan, och därmed minst en serie tester som simulerar mottagandet av en slumpmässig variabel, då antalet steg i serien är lika med antalet intervall för vilka intervallet av observerade värden är uppdelat, bör inte vara mer än
Fördelningen av de resulterande kvantiteterna ( Bernoulli-fördelningen ) approximeras i stort genom en normalfördelning enligt Moivre-Laplace-satsen , vilket ger anledning, under antagandet att fördelningen av den studerade kvantiteten är nära normal och följaktligen till binomial approximerad av den, för att tillämpa en uppskattning av antalet partitionsintervall enligt antalet förväntade diskreta värden för fördelningen Bernoulli, vilket leder till Sturges-regeln.