Syntetisk kontrollmetod ( SCM ) är en ekonometrisk metod för dataanalys inom Rubins kausala modell , som tillåter kausal slutledning i jämförande fallstudier . Metoden syftar till att bedöma effekterna av den påverkan som studeras (till exempel ekonomisk reform ) på exemplet med ett litet antal fall genom att modellera deras kvantitativa indikatorer i en hypotetisk situation där effekten inte gjordes, baserat på ett begränsat intervall liknande kontrollobservationer genom att tilldela dessa variabler vissa vikter.
Tänk på den e regionen, eller något annat observationsobjekt, och , var är antalet regioner, bland vilka 1 upplevde den studerade effekten och resten inte, eftersom det är kontrollgruppen (deras helhet kallas "donatorpoolen", engelsk donatorpool ), under tidsperioden , där .
Låt den studerade effekten ges under perioden , var och sedan - antalet perioder före påverkan. Låt oss beteckna svaret från indikatorn i regionen under tidsperioden i frånvaro av den studerade effekten som , och i dess närvaro - . Låt oss anta att vid , : före påverkan som studeras har det ingen effekt på responsen i den valda regionen. Vi antar också att påverkan som skett i den aktuella regionen inte påverkar regionerna från kontrollgruppen. Effekten av den studerade effekten kommer att betecknas som . Eftersom påverkan endast inträffar i och , är målet med SCM att bestämma , var den observerade indikatorn finns i den aktuella regionen och är den oobserverade responsen, som kan representeras som följande faktormodell :
där är en faktor som är gemensam för alla regioner, är en vektor av observerbara faktorer som är oberoende av effekterna av kovariater, är en vektor av deras koefficienter uppskattade för ett givet urval av regioner, är en vektor av oobserverade latenta faktorer, är en vektor av faktor belastningar som motsvarar dem, och är specificitet eller brus. Denna modell kan skrivas om som:
var är det -: te värdet av vektorn så att . Den syntetiska kontrollmetoden består i att välja en sådan uppsättning vikter som för , (det vill säga före exponering, håller vikterna de observerade svarsvärdena oförändrade) och (och samtidigt tillåter dessa vikter oss att noggrant modellera kovariaterna av regionen i fråga genom kovariaterna för regionerna i kontrollgruppen).
Det har visats i litteraturen att om specificitetsavvikelser är försumbara för en given förbehandlingsperiods storlek, så är skillnaden mellan ett modellerat, oobserverbart svar i frånvaro av en stimulus och ett viktat men observerat svar i dess närvaro försumbar under sådana förhållanden. . Följaktligen föreslås följande bedömning av effekteffekten ( ) [2] :494-495 :
Ur beräkningssynpunkt är beräkningen av de önskade vikterna förknippad med minimering av normens viktvektor , där är vektorn av kovariatvärden för regionen som studeras fram till ögonblicket , och är matrisen för kovariat värden för kontrollregionerna. Oavsett forskarens val av en positiv bestämd matris , avslöjas den optimerade normen som [2] :496 .
För att få ett slutvärde på görs en extern optimering på parametern med en diskonteringsfaktor som ökar vikten av de senaste observationerna. Denna optimering kan beskrivas enligt följande: , där är minimiviktsvektorn som erhölls i föregående steg [3] :616 .
Bestämning av den statistiska signifikansen för de erhållna uppskattningarna kan utföras med olika tekniker. I en artikel från 2003 som utvärderade effekterna av terrorism och andra yttringar av politiskt våld på ekonomin i Baskien , utsattes den beräknade effekten för den så kallade. ett placebotest (placebotest), som bestod i implementeringen av en identisk syntetisk kontrollalgoritm som Katalonien , även känd för sin betydande separatistiska rörelse , men som inte upplever problem med denna rörelses terroristiska manifestationer [4] .
Placebo-tester i litteraturen som använder den syntetiska kontrollmetoden är ett exempel på icke-parametriska permutationstester . Syntetisk svarsmodellering för alla kontrollfall i urvalet gör att du explicit kan arbeta med sannolikhetsfördelningen och testa nollhypotesen om frånvaron av orsakseffekter i det aktuella fallet. Samtidigt finns det inget behov av att asymptotiskt approximera fördelningen av dessa effekter i kontrollfall till en viss fördelning, vilket gör tester av denna typ permutationella [5] .
I litteraturen har det föreslagits att använda SCM inte bara för att bedöma orsakssamband, utan också för att göra förutsägelser. Som en del av en pilotstudie gjordes ett försök att förutsäga den ekonomiska tillväxten i USA , men den "givarpool" som användes för att få vikter bestod inte längre av länder med liknande egenskaper, utan av ekonomiska tillväxtindikatorer med en viss tidsfördröjning [ 3] :616 .
Syntetisk kontroll kombinerar element från andra kausala statistiska metoder: skillnaden mellan skillnader och matchande .
Jämfört med skillnader, erbjuder syntetisk kontroll en mer strömlinjeformad procedur för att anpassa vikter för observationer från kontrollgruppen, använder ett längre tidsintervall före exponering och kräver att kontrollgruppens egenskaper ligger så nära objektets egenskaper som möjligt. under studie under valet av vikter.
Den syntetiska styrmetoden har en uppsättning likheter med linjär regression . På liknande sätt förutsätter både syntetisk kontroll och regressionsanalys en linjär kombination av vikter och variabler (i de senare brukar vikterna kallas regressionskoefficienter), med summan av vikterna lika med 1. Den största skillnaden är att i SCM , värdena för dessa vikter är inneslutna i , medan det i regressionsanalys inte finns någon sådan begränsning och koefficienterna [ 1 ] : 498-499 överskottsprodukt från Österrike (42%), USA (22 ) %), Japan (16 %), Schweiz (11 %) och Nederländerna (9 %) [6] .
Simuleringar har visat att panel Xiao-metoden (Fixed Effects with Interaction Effects ) för att undersöka orsakseffekter är mindre robust mot förändringar i donatorpoolen än den syntetiska kontrollen, även om båda metoderna leder till tillfredsställande resultat. Det har noterats att en syntetisk kontroll är att föredra om utredaren har data om ytterligare tidsperioder [7] :1001 [8] .
Omfattningen av den syntetiska kontrollmetoden omfattar hälsopolitisk forskning [9] , kriminologi [10] , statsvetenskap [1] , olika delar av ekonomin .
Inom statsvetenskap ses SCM som en kompromiss mellan konventionella kvantitativa och kvalitativa metoder, vilket gör att du kan kombinera fokus på ett eller flera fall med strikta kriterier för urvalet. Med hjälp av denna metod studerade vi: den ekonomiska effekten av Tysklands enande för själva FRG [1] , konsekvenserna av den federala reformen i Belgien för socialförsäkringsutgifterna [ 11] .
Inom geografi används SCM i studier av antropogena landskap (inom landsystemvetenskap ) [12] :513 .
Det finns paket för att analysera data genom den syntetiska kontrollmetoden i statistisk programvara . Ett paket [13] har utvecklats för språket R . Synth