Galtonproblemet , uppkallat efter Sir Francis Galton , är problemet med att dra slutsatser från tvärkulturella data baserat på ett statistiskt fenomen som idag kallas nätverksautokorrelation . Problemet är nu erkänt som ett allmänt problem som gäller all icke-experimentell forskning såväl som experimentell design. Det kan enklast beskrivas som ett yttre problem i statistiska beräkningar där de valda posterna inte är statistiskt oberoende. Om du till exempel frågar två personer i samma hus om de tittar på tv, får du inga statistiskt oberoende svar. Urvalsstorleken, n, för oberoende observationer i detta fall är en, inte två. Efter att ha gjort ordentliga justeringar kommer detta redan att ta itu med externa beroenden, och då kommer sannolikhetsteorin angående statistiskt beroende att tillämpas. Sådana axiom är viktiga för att sätta kriterier för variabilitet (till exempel) eller testa för statistisk signifikans .
1888 var Galton närvarande när Sir Edward Tylor presenterade sitt arbete på Royal Anthropological Institute. Tylor samlade in information om institutionerna för äktenskap och arv för 350 kulturer, och undersökte även sambandet mellan dessa institutioner och utvecklingsnivån för samhällets struktur. Tylor tolkade hans resultat som att de indikerar en allmän evolutionär sekvens där institutioner flyttade sitt fokus från moder till fader allt eftersom samhällets sociala struktur utvecklades. Galton höll inte med och påpekade att likheter mellan kulturer kan bero på adoption, gemensam härkomst eller evolutionär utveckling; han stödde idén att utan att kontrollera parametrarna för lån och gemensamma anor kan man inte dra tillförlitliga slutsatser om evolutionär utveckling. Galtons kritik blev känd som det eponyma Galtonproblemet [ 1] :175 , som det kallades av Raul Naroll [ 2] [3] som föreslog de första statistiska lösningarna.
I början av 1900-talet hade teorin om unilinjär evolution glömts bort, liksom att dra direkta slutsatser från evolutionära sekvenskorrelationer. Galtons kritik har dock visat sin giltighet för att sluta funktionella samband från korrelationer. Problemet med autokorrelation kvarstod fortfarande.
År 1914 utvecklade statistikern William S. Gosset metoder för att eliminera falska samband baserat på hur plats i tid och rum påverkar graden av likhet. Samtida undersökningar av den allmänna befolkningen om val visar ett liknande problem: ju närmare valet är, desto färre människor tänker självständigt, och desto högre är opålitligheten i enkätresultaten, särskilt felmarginalen eller konfidensgränserna . Prestandan för n oberoende fall från deras urvalspopulation sjunker när valet närmar sig.
Statistisk signifikans faller i takt med lägre effektiva urvalsstorlekar.
Ett problem uppstår i urvalsundersökningar, när sociologer, för att minska intervjutiden, delar upp befolkningen i lokala kluster och slumpmässigt stickprov över kluster, och sedan återigen stickprov inom kluster. Om de undersöker n antal personer i ett kluster av storlek m, kommer den effektiva urvalsstorleken (efs) att ha en nedre gräns på 1 + (n − 1) / m om alla i klustret är identiska. Om det bara finns partiell likhet inom ett kluster, kommer m i den aktuella formeln att minska i enlighet med detta. Denna typ av formel är 1 + d (n − 1), där d är intraklasskorrelationen för den aktuella statistiken. [fyra]
I allmänhet beror uppskattningen av motsvarande efs på den uppskattade statistiken, såsom medelvärde, chi-kvadrat, korrelation , regressionskoefficient och deras variationer . För tvärkulturella studier uppskattade Murdoch och White [5] storleken på likhetsfläckar i deras urval av 186 samhällen. De fyra variablerna de undersökte – språk, ekonomi, politisk integration och arv – hade likhetsfläckar som sträckte sig från storlek 3 till storlek 10. En tumregel kan användas för att dividera kvadratroten ur likhetsfläckstorlekar med n, så att effektiv är provstorlekarna 58 respektive 107 för de givna lapparna . Återigen sjunker statistisk signifikans med lägre effektiva provstorlekar.
I modern analys modelleras rumsliga eftersläpningar för att bedöma nivån på globaliseringen i moderna samhällen. [6]
Rumslig korrelation, eller autokorrelation , är ett grundläggande begrepp inom geografi. De metoder som utvecklats av geografer och som används för att mäta och övervaka rumslig autokorrelation [7] [8] gör mycket mer än att bara reducera det effektiva värdet av n för att testa för betydelsen av en korrelation. Ett exempel är en sofistikerad hypotes att "närvaron av spel i ett samhälle är direkt proportionell mot förekomsten av kommersiella medel och närvaron av betydande socioekonomiska skillnader, och är omvänt relaterad till huruvida samhället är ett nomadiskt herdesamhälle eller inte. Tester av denna hypotes i ett urval av 60 samhällen kunde de inte förkasta nollhypotesen , men autokorrelationsanalys visade en signifikant effekt av socioekonomiska skillnader. [9]
Hur vanlig är autokorrelation bland de variabler som beaktas i en tvärkulturell studie? Anton Eff testade mot 1 700 variabler i en poolad databas för Standard Cross-Cultural Sample publicerad i World Cultures och mätte Morans I-index för rumslig autokorrelation (avstånd), språklig autokorrelation (gemensam härkomst) och kulturell komplexitet autokorrelation (grundläggande evolution). "Resultaten tyder på att ... det skulle vara värt att testa för rumslig och fylogenetisk autokorrelation när man utför regressionsanalyser med standard tvärkulturell sampling." [tio]
Användningen av autokorrelationstester i explorativa dataanalyser illustreras, vilket återspeglar hur variablerna i en given studie kan bedömas i frånvaro av falloberoende med avseende på avstånd, språk och kulturell komplexitet. Metoder för att utvärdera dessa autokorrelationseffekter förklaras och illustreras sedan för vanlig minsta kvadratregression med användning av ett mått på signifikansen av Morans I autokorrelationsindex.
Om det finns autokorrelation kan det ofta elimineras att få en opartisk uppskattning av regressionskoefficienterna och deras variabler genom att konstruera en återställningsberoende variabel som "lagrar" genom att omvikta den beroende variabeln på andra ställen där vikten är graden av samband. En sådan eftersläpande beroende variabel är endogen, och uppskattningen kräver antingen en minsta kvadratmetod i två steg eller en metod med maximal sannolikhet. [elva]
Den offentliga servern, när den används externt på http://SocSciCompute.ss.uci.edu , erbjuder etnografiska data, variabler och inferensverktyg med R-skript av Dow (2007) och Eff & Dow (2009) i NSF-stödda projekt ( http://getgalaxy.org ) och ( https://www.xsede.org ) för lärare, studenter och forskare att genomföra CoSSci (Integrated Social Science) Cross-Cultural Research Simulations, som kontrollerar problemet Galton genom att använda standardvariabler för tvärkulturella samplingsvariabler tillgängliga på https://web.archive.org/web/20160402201432/https://dl.dropboxusercontent.com/u/9256203/SCCScodebook.txt .
Inom antropologin, där Tylorproblemet först erkändes av statistikern Galton 1889, är det fortfarande inte allmänt accepterat att det finns statistiska standardjusteringar för problemet med likhetsfläckar i observerade exempel, och inte heller möjligheten till nya upptäckter med hjälp av autokorrelationsmetoder. Vissa tvärkulturella forskare (se t.ex. Korotaev och de Munk, 2003) [12] drar slutsatsen att bevis på distribution, historiskt ursprung och andra källor till likhet mellan relaterade samhällen och individer bör döpas om till Galton Opportunity eller Galton Resource. snarare än att kallas Galton-problemet. Forskare använder nu analyser av longitudinella, tvärkulturella och regionala variationer för att rutinmässigt utforska konkurrerande hypoteser: funktionella relationer, distribution, gemensamma historiska härkomster, multilineage-evolution, samanpassning med miljön och dynamiken i komplex social interaktion . [13]
Inom antropologin nämns ofta Galtons problem som ett skäl till att jämförande studier förkastas. Eftersom problemet är av allmän karaktär, gemensamt för vetenskaperna och statistisk slutledning i allmänhet, leder en sådan specifik kritik av tvärkulturella eller jämförande studier – och det finns många av dem – logiskt sett till ett avvisande av vetenskap och statistik sammantaget. All data som till exempel samlas in och analyseras av etnografer är också föremål för Galtons problem, uppfattad i vid mening. Kritiken av anti-jämförande kritik är inte begränsad till statistisk jämförelse, eftersom den kommer att gälla även för textanalys. Det vill säga analysen och användningen av texten i argumentationen är föremål för kritik när det gäller slutsatsernas evidensbas. Att enbart förlita sig på retorik är inte ett försvar mot kritik av ett arguments giltighet och dess bevisbas.
Det råder dock knappast någon tvekan om att det tvärkulturella forskarsamhället slentrianmässigt ignorerar Galtons problem. Expertforskning i ämnet visar fynd som "starkt tyder på att omfattande rapporter om naiva tester av ömsesidigt oberoende i chi-kvadraten med hjälp av tvärkulturella data under de senaste decennierna har felaktigt avvisat nollteorier på nivåer som är betydligt högre än förutspått 5 %". [14] :247
Forskaren drar slutsatsen att "Inkorrekta teorier som har "bevarats" genom naiva tester av ömsesidigt chi-kvadratoberoende med hjälp av jämförande data kan fortfarande noggrant testas vetenskapligt i framtiden." [14] :270 Återigen, den justerade klusterprovvariabeln ges som sådan multiplicerad med 1 + d (k + 1), där k är den genomsnittliga klusterstorleken, och den mer komplexa justeringen ges som korrelationsvariabeln för kors- tabeller med r rader och kolumner. Sedan den aktuella kritiken publicerades 1993, liksom andra liknande uttalanden, har fler författare börjat anpassa korrelationerna för Galtonproblemet, men de flesta specialister som arbetar inom det tvärkulturella området gör det inte. Följaktligen är de flesta publicerade resultat som bygger på naiva signifikanstester och anpassar P < 0,05 snarare än P < 0,005-standarden sannolikt felaktiga, eftersom de är mer benägna för typ I-fel, vilket förkastar nollhypotesen när den är Sann.
Vissa tvärkulturella forskare avfärdar allvaret i Galtons problem eftersom de tror att korrelationsuppskattningar och medel kan vara objektiva även om det finns autokorrelation (oavsett om det är svag eller stark). Utan en autokorrelationsstudie kan de dock fortfarande felbedöma statistik om samband mellan variabler. I regressionsanalys kan till exempel att undersöka mönster av autokorrelerade residualer ge viktiga ledtrådar till tredje faktorer som kan påverka sambanden mellan variabler men som inte ingick i regressionsmodellen. För det andra, om det finns kluster av liknande eller besläktade samhällen i urvalet, kommer variansmått att underskattas, vilket leder till missvisande statistiska slutsatser, som att överskatta den statistiska signifikansen av korrelationer. För det tredje, underskattning av varians gör det svårt att kontrollera efter replikering av resultat från två olika prov, eftersom resultaten ofta avfärdas som liknande.