Marginal sannolikhetsfunktion eller integrerad sannolikhet är en sannolikhetsfunktion där vissa variabla parametrar är exkluderade . I samband med Bayesiansk statistik kan en funktion kallas bevis eller modellbevis .
Givet en uppsättning oberoende identiskt fördelade datapunkter , där parametern är enligt någon sannolikhetsfördelning med parametern , där parametern i sig är en slumpvariabel som ges av fördelningen, det vill säga . Den marginella sannolikhetsfunktionen frågar i allmänhet vad är sannolikheten för händelsen , där den exkluderas (genom att integrera över denna parameter):
Definitionen ovan är formulerad i samband med Bayesiansk statistik . I klassisk ( frekvens ) statistik förekommer begreppet marginal sannolikhet istället i sammanhanget med den gemensamma parametern , där är den faktiska parametern och är störningsparametern . Om det finns en sannolikhetsfördelning för är det ofta önskvärt att betrakta sannolikhetsfunktionen endast i termer av eliminering :
Tyvärr är marginella sannolikheter i allmänhet svåra att beräkna. Exakta lösningar är kända för en liten klass av distributioner, i synnerhet när den uteslutna parametern är den konjugerade föregående distributionen av datadistributionen. I andra fall behövs någon numerisk integrationsmetod , antingen en generell integrationsmetod som Gauss- metoden eller Monte Carlo- metoden, eller en metod som utvecklats specifikt för statistiska problem som Laplace-approximationen , Gibbs / Metropolis -sampling eller EM-algoritmen .
Det är också möjligt att tillämpa ovanstående konventioner på en enda slumpvariabel (datapunkt) x snarare än på en uppsättning observationer. I samband med Bayesiansk teori är detta ekvivalent med den tidigare förutsagda fördelningen av en datapunkt.
När man jämför Bayesianska modeller är de uteslutna variablerna parametrar för en viss typ av modell, och de återstående variablerna är kännetecken för modellen. I det här fallet är den marginella sannolikheten sannolikheten för data givet typen av modell utan att anta värdena för några speciella parametrar. Den marginella sannolikhetsfunktionen för modell M är
Det är i detta sammanhang som termen modellvaliditet är vanligt förekommande . Detta värde är viktigt eftersom förhållandet mellan de bakre oddsen för modell M 1 och en annan modell M 2 involverar förhållandet mellan de marginala sannolikhetsfunktionerna, den så kallade Bayes-koefficienten :
som schematiskt kan uttryckas som
posterior odds = föregående odds × Bayes koefficient