Urvalsbias i statistik är en sådan bias där urvalet tas på ett sådant sätt att vissa medlemmar av den avsedda populationen , jämfört med andra, har en lägre eller högre urvalssannolikhet . Som ett resultat finns det ett partiskt urval [1] av befolkningen (eller icke-mänsklig faktor), där alla försökspersoner eller prover valdes ut med olika sannolikheter. [2] Om denna snedvridning inte beaktas kan resultaten felaktigt betraktas som det fenomen som studeras och inte som en provtagningsmetod .
Urvalsfel inom medicinområdet betraktas ibland som en bedömningsfel [3] [4] . Faktum är att förtydligandefel är detsamma som provtagningsbias, [5] [6] men ibland särskiljs det fortfarande som en separat typ av statistiska fel [5] .
Urvalsbias karakteriseras vanligtvis som en undertyp av urvalsbias , [7] även ibland specifikt definierad som urvalsbias, [8] [9] [10] men andra definierar det som en separat typ av statistiskt fel. [11] Deras skillnad, även om den inte erkänns av majoriteten, är att samplingsbias är det fel som kan ifrågasätta testets externa validitet (förmågan hos dess resultat att gälla för hela populationen), medan urvalsfelet är korrelerat endast med intern giltigheten av de skillnader eller likheter som hittades under testerna. Därför kan fel som uppstår under urvalet eller kohortdefinitionen leda till urvalsbias, och fel som uppstår efter det kan leda till urvalsbias.
Men samplingsbias och urvalsfel används ofta omväxlande. [12]
När du studerar medicinska rapporter hamnar du ofrivilligt i ett paradoxalt-anekdotiskt tillstånd. I sin struktur innehåller sådana rapporter endast information om metoderna för behandling och diagnos. Ett barn som har problem med studierna och livet i skolan har stor sannolikhet att få diagnosen dyslexi , men ett barn som försöker, studerar men inte gör det bra. Ett tidigare undersökt barn med diagnos kommer oftare att omprövas och få nya tillstånd, vilket förvränger statistiken över samsjuklighet . Människor, efter att ha hört sådana diagnoser, är mer benägna att associera dem med beteendestörningar eller mental retardation , medan föräldrar försöker skydda sina barn från sådana etiketter, vilket framkallar ännu större partiskhet mot dem. Noggrant utvalda och studerade forskningsrapporter visar i sin tur att sådana tillstånd är mycket vanligare och inte så grymma mot sin bärare som man tidigare trott.
Genetiker är begränsade i sin förmåga att samla in data från människor. Så till exempel uppgifter om någon egenskap hos en person. Vi är intresserade av att veta om denna egenskap är medfödd, som enkel arv enligt Mendel säger . Jag följer reglerna i denna lag, om föräldrarna inte har denna egenskap, men det finns en allel som bär den, då kan de potentiellt föra den vidare genom arv (det vill säga, heterozygoten är inte definierad). I det här scenariot är chansen att ett barn ärver den här funktionen 25 %. Men följande fråga uppstår: kan vi säga i vilka familjer båda föräldrarna är bärare (heterozygota), om det inte bedöms av ett barn som kanske redan har dessa egenskaper. Beskrivningen är hämtad från Suttons lärobok. [13]
Figuren visar stamtavlor för alla möjliga familjer med två barn, där föräldrarna är bärare (Aa).
Figuren visar också sannolikheten för vilken familjeselektion kan ske, samt urvalsfrekvensen av sjuka barn. Beroende på vilken typ av trunkerat urval som används kommer forskaren att välja en frekvens på 4 ⁄ 7 eller 5 ⁄ 8 när egenskapen är närvarande.
Ett observerbart exempel på urvalsbias är grottmanseffekten. De flesta moderna idéer om förhistoriska folk bygger på grottritningar som färdigställdes för cirka 40 000 år sedan. På samma sätt kommer eldgropar, hålor , begravningar etc. att förbli intakta. Om människor målade på träd, djurhudar eller sluttningar, skulle all denna information gå förlorad. Vi associerar förhistoriska människor med grottor inte för att de alla bott i grottor hela sina liv, utan för att bara informationen i grottornas ritningar har kommit till oss. [13]
På grund av förekomsten av provtagningsbias uppstår problem eftersom det finns en möjlighet att statistiken som samlas in för analys av provet är systematiskt felaktig. Provtagningsbias kan leda till en systematisk över- eller underskattning av den relevanta populationsparametern . Urvalsbias uppstår eftersom det är nästan omöjligt att säkerställa ren slumpmässighet i urvalet. Om andelen underrepresentation är liten kan urvalet betraktas som ett rimligt medelvärde för ett slumpmässigt urval. Dessutom, om urvalet inte skiljer sig signifikant i parametern som studeras, kan ett partiskt urval också fortfarande fungera som en acceptabel uppskattning.
Ordet fördom har en uttalad negativ klang. Så det händer att fel ibland uppstår som ett resultat av en förutfattad avsikt att förvränga resultaten av forskning eller vetenskapligt bedrägeri . I statistisk analys är systematiska fel en vanlig matematisk egenskap, oavsett om de är avsiktliga eller inte, eller som en konsekvens av ofullständig forskningsutrustning. Även om vissa individer medvetet kan använda partisk provtagning för att snedvrida forskningsresultat, är provtagningsfördomen i sig ofta en svårighet att tillhandahålla inhemsk representativ data eller okunnighet om möjligheten till partiskhet genom hela forsknings- och analysprocessen. Ett exempel på att man inte känner till faktumet av partiskhet är det ofta använda förhållandet (även känt som veckförändring ) som ett mått på skillnaden i biologi. Eftersom det är lättare att få ett stort förhållande av två små tal med en given skillnad än ett stort förhållande av två stora tal med en signifikant skillnad, ignoreras signifikanta skillnader, i vilket fall två relativt stora numeriska mätningar jämförs. Ibland, på grund av användningen av ett förhållande (division) istället för en skillnad (subtraktion), kan en "avgränsningsbias" höras, vilket gör att forskningsresultat förskjuts från vetenskapens område till pseudovetenskap (se " Demarkationsproblemet ").
Vissa prover använder en partisk statistisk beräkning, som ändå låter dig uppskatta parametern. U.S. National Center for Health Statistics , till exempel, översamplar medvetet mindre populationer i de flesta av sina rikstäckande undersökningar för att få tillräcklig noggrannhet i att uppskatta dessa grupper. [14] De nämnda undersökningarna använder en urvalsvikt (se nedan). Det möjliggör en korrekt utvärdering av alla etniska grupper. Om alla individuella villkor är uppfyllda (främst med korrekt beräkning och användning av koefficienten), representerar detta urval en korrekt uppskattning av populationsparametern som studeras.
Ett klassiskt exempel på provbias och därav följande felaktig framställning inträffade 1936. Under valundersökningens tidiga dagar samlade forskare i den amerikanska tidskriften Literary Digest in nästan två miljoner insända enkäter som förutspådde en svepande majoritetsseger för den republikanske kandidaten Alfred Landon i det kommande amerikanska presidentvalet över dåvarande president Franklin Roosevelt . Faktum är att allt var precis tvärtom. Enkätpopulationen som samlats in av journalisterna från Literary Digest bestod av läsare av denna tidning, såväl som personer som äger registrerade bilar och användare av telefoner. Detta urval var en överrepresentation av rika människor som, som en separat grupp, var mer benägna att rösta på den republikanska kandidaten. Å andra sidan förutspådde George Gallups undersökning av endast 50 000 medborgare framgångsrikt resultatet av det kommande valet, vilket säkerställde Gallup -undersökningarnas popularitet i framtiden .
Ett annat klassiskt exempel inträffade i presidentvalet 1948 . Natten före valet drev Chicago Tribune en tidning med rubriken "Dew Beats Truman", vilket senare visade sig vara en lögn. På morgonen fotograferades den tillträdande presidenten Harry S. Truman , med tidningen, med ett hånfullt leende. Anledningen till att Tribune fick fel visade sig vara att deras redaktör, som gjorde researchen, bara gjorde en telefonundersökning. Tekniken för undersökningar var då fortfarande i sin linda, och därför visste få forskare inte att representativiteten för urvalet som gjorts per telefon tenderar att vara noll, eftersom det inte tar hänsyn till hela befolkningens intressen som helhet. Telefoner var ännu inte utbredda på den tiden, och därför var de som hade dem med största sannolikhet förmögna personer med fast bostad. (I de flesta städer innehöll Bell-systemets telefonbok samma namn som Society Almanac.) Journalister baserade sina antaganden på Gallup-undersökningen, men förbise det faktum att den var två veckor gammal. [16]
Luftkvalitetsanalyser undersöker föroreningar ( kolmonoxid , kväveoxid , kvävedioxid eller ozon ), som ofta visar en hög korrelation eftersom de alla produceras av samma kemiska process. Denna korrelation beror på plats (dvs plats) och tid (dvs period). Därför är fördelningen av en viss förorening inte nödvändigtvis representerad överallt och alltid lika. Om en billig mätanordning kalibreras i fält mot flerdimensionella data, nämligen genom jämförelse med ett referensinstrument, så används förhållandet mellan de olika föreningarna redan när modellen standardiseras. Vid förflyttning av mätverktyget kan felaktiga data erhållas. [17]
Det tidigaste exemplet på provtagningsbias är covid-19-pandemin , när man analyserade dödlighet och åldersfördelning av fall mellan länder, det fanns skillnader i data på grund av partiskhet i urvalet av personer som just testades för covid-19 . [18] [19]
Om hela kohorter av populationen exkluderas från urvalet, så finns det inga justeringar på basis av vilka hela populationen skattas. Men om några av grupperna är i majoritet och deras nivå av överrepresentation kan uppskattas, kan urvalsvikten kompensera för biasen. Möjligheten till framgångsrik korrigering begränsas dock av urvalsmodellen. Om värdena för vissa variabler saknas, kan de metoder som vanligtvis används för att korrigera för bias slå tillbaka. [tjugo]
Till exempel omfattar den figurativa befolkningen 10 miljoner män och 10 miljoner kvinnor. Antag att det partiska urvalet är 100 personer: 20 är män och 80 är kvinnor. Forskaren kan kompensera för denna obalans genom att använda en viktfaktor på 2,5 för varje hane och 0,625 för varje hona. Dessa manipulationer kommer att justera uppskattningen till nivån av samma resultat som om urvalet bestod av 50 män och 50 kvinnor, förutom i de fall där sannolikheten för deltagande av män eller kvinnor i studien är slumpmässigt eller inte lika.