Bias på grund av utelämnade variabler

Den aktuella versionen av sidan har ännu inte granskats av erfarna bidragsgivare och kan skilja sig väsentligt från versionen som granskades den 21 juni 2018; verifiering kräver 1 redigering .

Utelämnad variabel bias är ett  fenomen i regressionsanalys som är förknippat med att få partiska och inkonsekventa uppskattningar av regressionskoefficienter på grund av felaktig modellspecifikation, nämligen att oberoende variabler som har en orsakseffekt på den beroende variabeln inte ingår i den skattade modellen . oförmåga att inkludera någon oobserverad oberoende variabel i den.

Formell härledning

Föreställ dig att den sanna regressionsmodellen ser ut så här:

där är svarsvektorn och är matrisen och vektorn för oberoende variabler. Förutsatt att och , då kommer uppskattningarna respektive att vara minsta kvadraters uppskattningar av svarets regressionsberoende på oberoende variabler. I synnerhet (var är den kombinerade matrisen av oberoende variabler).

För att modellera bias på grund av utelämnade variabler utelämnar vi prediktorn genom att inkludera den i den okorrelerade delen av modellen:

var .

Då kommer minsta kvadraters uppskattningar av prediktorkoefficienterna att vara inkonsekventa i jämförelse med den sanna koefficienten :

Eftersom, enligt antagandet om den ursprungliga modellen, , då , medan

varifrån .

Litteratur