Metoden för instrumentella variabler (IP, IV - Instrumental Variables) är en metod för att uppskatta parametrarna för regressionsmodeller , baserad på användning av ytterligare, inte deltagande i modellen, så kallade instrumentella variabler . Metoden används när faktorerna i regressionsmodellen inte uppfyller det exogena villkoret , det vill säga de är beroende med slumpmässiga fel. I det här fallet är uppskattningarna av minsta kvadrater partiska och inkonsekventa .
Tydligen formulerades metoden för instrumentella variabler först av Wright (Wright) 1928 som en metod för att uppskatta utbuds- och efterfråganskurvor . Själva termen "instrumentvariabler" användes först i en artikel från 1941 av Riersol när man diskuterade fel i variabler. Metoden utvecklades vidare i verk av Durbin (1954), Sargan (1958) och andra. I samband med system av simultane ekvationer utvecklades metoden parallellt under namnet "tvåstegsmetod för minsta kvadrater (LSM) )".
Låt det finnas en linjär regressionsmodell
Standard OLS estimator
var .
Denna uppskattning är uppenbarligen konsistent om den konvergerar i sannolikhet till någon icke-singulär matris och konvergerar i sannolikhet till nollvektorn. Det andra villkoret är uppfyllt om faktorerna och de slumpmässiga felen är okorrelerade.
Om faktorerna och de slumpmässiga felen är korrelerade, är det andra villkoret inte uppfyllt och därför är OLS-uppskattningarna inte konsekventa. Det vill säga att även med ett mycket stort antal observationer kanske uppskattningarna inte kommer i närheten av de verkliga värdena.
Låt det finnas Z-faktorer okorrelerade med slumpmässiga fel, vars antal är lika med antalet initiala faktorer. Dessa variabler kallas instrumentella variabler . Bland dem kan finnas både "rent" instrumentella variabler (frånvarande i modellen) och modellvariabler (de senare antas i sig vara exogena). Då är skattningen av metoden för instrumentella variabler uppskattningen av följande form:
Om matrisen i sannolikhet konvergerar till en icke degenererad och till en nollvektor, är uppskattningen av IP-metoden konsekvent.
För IP-modellen är uppskattningen av koefficienten b lika med
Trots konsekvensen är IP-uppskattningarna i det allmänna fallet partiska och ineffektiva. IP-uppskattningar är bättre ju starkare de instrumentella variablerna är korrelerade med modellens ursprungliga faktorer (medan de förblir okorrelerade med slumpmässiga fel). Valet av instrumentella variabler är ett separat ganska komplicerat problem. Det finns inga strikta rekommendationer om val av verktyg.
Det kan visas att uppskattning av IP-metoden kan reduceras till en tvåstegsprocedur: för det första behöver vanliga minsta kvadrater uppskatta insatsfaktorernas beroende av verktygen och använda de erhållna uppskattningarna av faktorerna istället för faktorerna själva för att uppskatta parametrarna för den ursprungliga modellen. Detta är den så kallade tvåstegs MNC.
Som instrumentella variabler kan OLS-uppskattningar av faktorers regression på vissa andra Z-variabler, vars antal inte är mindre än antalet initiala faktorer, väljas. Det vill säga, i det första steget är det nödvändigt att utvärdera regression med konventionella minsta kvadrater:
.
Då kommer matrisen av instrumentella variabler i detta fall att vara lika med
I det andra steget tillämpar vi metoden för instrumentella variabler med de resulterande instrumenten :
Om kovariansmatrisen för slumpmässiga fel i modellen är proportionell mot enhet , är kovariansmatrisen för dessa uppskattningar lika med
Om antalet verktyg z är detsamma som antalet ursprungliga variabler (det exakta identifieringsfallet ), så är matriserna kvadratiska. Följaktligen
Det vill säga, vi får den klassiska formeln för metoden för instrumentella variabler. Således, trots att denna metod härleds som ett specialfall, kan den ändå betraktas som en generalisering av den klassiska IP-metoden. Detta är den så kallade generaliserade metoden för instrumentella variabler (GIVE - Generalized Instrumental Variables Estimator) .
Det kan visas att om vi i det andra steget inte tillämpar metoden för instrumentella variabler, utan den vanliga minsta kvadratmetoden, så kommer vi att få exakt samma formel, eftersom
Följaktligen
Således är den generaliserade metoden för instrumentella variabler ekvivalent med tvåstegs minsta kvadratmetoden ( DMNC, TSLS, 2SLS - Two-Stage Least Squares ).