Bayesiansk statistik är en teori inom statistikområdet baserad på den Bayesianska tolkningen av sannolikhet , där sannolikheten speglar graden av tillförlitlighet i en händelse , som kan förändras när ny information samlas in, till skillnad från ett fast värde baserat på en frekvensansats. [1] . Graden av förtroende kan baseras på a priori kunskap om händelsen, såsom resultat från tidigare experiment eller personligt förtroende för händelsen. Detta skiljer sig från ett antal andra tolkningar av sannolikhet , såsom frekvenstolkningen , som ser sannolikhet som en gräns för den relativa frekvensen av en händelse som inträffar efter ett stort antal försök [2] .
Bayesianska statistiska metoder använder Bayes teorem för att beräkna och uppdatera sannolikheter när nya data tas emot. Bayes sats beskriver den villkorade sannolikheten för en händelse baserat på både data och a priori-information, eller förtroende för händelsen eller förhållandena som är förknippade med händelsen. Till exempel, i Bayesiansk inferens kan Bayes sats användas för att uppskatta en parameter för en sannolikhetsfördelning eller en statistisk modell . Eftersom Bayesiansk statistik behandlar sannolikhet som en grad av konfidens, kan Bayes sats direkt tilldela en sannolikhetsfördelning som kvantifierar en parameter eller en uppsättning parametrar [2] .
Bayesiansk statistik är uppkallad efter Thomas Bayes , som formulerade ett specialfall av Bayes teorem i sin artikel publicerad 1763. I flera artiklar publicerade från slutet av 1700-talet till början av 1800-talet utvecklade Pierre-Simon Laplace den Bayesianska tolkningen av sannolikhet . Laplace använde vad som nu anses vara Bayesianska metoder för att lösa ett antal statistiska problem. Många Bayesianska metoder utvecklades av senare författare, men termen användes inte för att beskriva sådana metoder förrän på 1950-talet. Under större delen av 1900-talet var Bayesianska metoder oönskade för de flesta statistiker av filosofiska och praktiska skäl. Många Bayesianska metoder är beräkningsintensiva och de flesta av de metoder som har använts i över ett sekel har baserats på frekvenstolkning. Men med tillkomsten av kraftfulla datorer och nya algoritmer , såsom Monte Carlo-metoden för Markov-kedjor , börjar Bayesianska metoder att användas med ökande intensitet med tillkomsten av 2000-talet [2] [3] .
Bayes sats är en grundläggande sats i Bayesiansk statistik eftersom den används av Bayesianska metoder för att uppdatera sannolikheter, som är grader av konfidens, när nya data tas emot. Med tanke på två händelser och , den villkorade sannolikheten , förutsatt att det är sant, uttrycks med formeln [4] :
var . Även om Bayes teorem är ett grundläggande resultat av sannolikhetsteorin , har den en specifik tolkning i Bayesiansk statistik. I ekvationen ovan representerar det vanligtvis ett påstående (som påståendet att ett mynt kommer upp i topp femtio procent av gångerna) och representerar en logik eller ny data som ska beaktas (som resultatet av en serie av myntkast). är den tidigare sannolikheten för händelsen , vilket uttrycker förtroende för händelsen innan motivering beaktas. Tidigare sannolikhet kan också kvantifiera kunskap eller information om en händelse . är sannolikhetsfunktionen , som kan tolkas som sannolikheten för bevis , givet att händelsen har inträffat . Sannolikhet kvantifierar i vilken utsträckning bevis stöder ett påstående . är den bakre sannolikheten , sannolikheten för påståendet efter att ha övervägt bevisningen . I huvudsak uppdaterar Bayes teorem a priori säkerhet efter att ha övervägt nya bevis [2] .
Sannolikheten för bevis kan beräknas med hjälp av formeln för total sannolikhet . Om är en uppdelning av utrymmet för elementära händelser , vilket är mängden av alla resultat av experimentet, då [2] [4]
Om det finns ett oändligt antal utfall är det nödvändigt att integrera över alla utfall för att beräkna med den totala sannolikhetsformeln. Det är ofta svårt att beräkna eftersom man måste involvera summering eller integration, vilket är tidskrävande så att ofta bara produkten av föregående och sannolikheten beaktas. Den bakre sannolikheten är proportionell mot denna produkt [2] :
Den maximala bakre uppskattningen , som är läget för den bakre uppskattningen och ofta beräknas i Bayesiansk statistik med hjälp av matematiska optimeringsmetoder , förblir densamma. Den bakre sannolikheten kan approximeras även utan exakt beräkning av värdet med metoder som Monte Carlo för Markov-kedjor eller variationsmässiga Bayesianska metoder [2] .
Den allmänna uppsättningen av statistiska tekniker kan delas in i ett antal grenar, av vilka många har speciella Bayesianska versioner.
Bayesiansk inferens hänvisar till statistisk inferens , där osäkerheten i inferensen kvantifieras med hjälp av sannolikhet. I klassisk frekvensinferens antas modell- och hypotesparametrar vara fixerade, och sannolikheter tilldelas inte parametrar eller hypoteser i frekvensinferens. Till exempel är det inte meningsfullt i frekvensinferens att uttryckligen ange sannolikheten för en händelse som bara kan inträffa en gång, till exempel resultatet av nästa kast av ett symmetriskt mynt. Det skulle dock vara vettigt att säga att andelen huvuden som kommer upp konvergerar till hälften när antalet myntkast ökar [5] .
Statistiska modeller definierar en uppsättning statistiska antaganden och processer som representerar hur provdata genereras. Statistiska modeller har en uppsättning parametrar som kan ändras. Till exempel kan ett mynt representeras som försök med en Bernoulli-fördelning som simulerar två möjliga utfall. Bernoulli-fördelningen har en parameter lika med sannolikheten för ett utfall, vilket i de flesta fall är lika med sannolikheten att få huvuden [6] . Att bygga en bra modell för data är centralt för Bayesiansk slutledning. I de flesta fall approximerar modellerna endast verkliga processer och tar kanske inte hänsyn till vissa faktorer som påverkar data [2] . I Bayesiansk slutledning kan sannolikheter tilldelas modellparametrar. Parametrarna kan representeras som slumpvariabler . Bayesiansk inferens använder Bayes teorem för att uppdatera sannolikheter efter att ha mottagit mer data [2] [7] .
Formuleringen av statistisk modellering med användning av Bayesiansk statistik har den utmärkande egenskapen att kräva tidigare sannolikheter för alla okända parametrar. Dessutom kan de tidigare sannolikhetsparametrarna själva ha tidigare sannolikheter, vilket resulterar i Bayesiansk hierarkisk modellering [8] , eller kan vara beroende av varandra, vilket resulterar i Bayesianska nätverk .
Bayesiansk design av experiment inkluderar ett koncept som kallas "förtroendeinflytande". Detta tillvägagångssätt använder statistisk analysteknik för att införliva resultaten av tidigare experiment i utformningen av nästa experiment. Detta uppnås genom att uppdatera "förtroendet" genom användning av tidigare och bakre distributioner . Detta gör att du kan använda resurser av alla slag när du planerar experiment. Ett exempel är det flerarmade banditproblemet .
Statistiska diagram inkluderar metoder för datautforskning, validering av modelltillräcklighet, etc. Användningen av vissa moderna datortekniker för Bayesiansk slutledning, särskilt olika typer av Monte Carlo-tekniker för Markov-kedjor , har lett till behovet av att verifiera, ofta grafiskt, lämpligheten av sådana beräkningar, vilket återspeglar den nödvändiga posteriora sannolikheten.