Ett urval eller urvalsuppsättning är en del av den allmänna uppsättningen av element som omfattas av ett experiment (observation, undersökning).
Exempelegenskaper:
En sekvens av oberoende slumpvariabler som motsvarar alla möjliga resultat av statistiska experiment och som har samma sannolikhetsfördelningslag med en slumpvariabel kallas en urvalsstorlek genererad av en slumpvariabel [1] . Om är en diskret slumpmässig variabel , då är ett urval av volym en delmängd av objekt av den allmänna volympopulationen , vald med lika sannolikhet bland alla sådana delmängder [1] .
Urvalsstorlek är antalet fall som ingår i urvalet.
Urval kan villkorligt delas in i stora och små, eftersom olika tillvägagångssätt används i matematisk statistik beroende på urvalets storlek. Man tror att prover större än 30 kan klassificeras som stora [2] .
När man jämför två (eller flera) prov är deras beroende en viktig parameter. Om det är möjligt att fastställa ett homomorft par (det vill säga när ett fall från prov X motsvarar ett och endast ett fall från prov Y och vice versa) för varje fall i två prov (och denna relationsgrund är viktig för egenskapen mätt i proverna), kallas sådana prover beroende . Exempel på beroende val:
Om det inte finns något sådant förhållande mellan proverna anses dessa prover vara oberoende , till exempel:
Följaktligen har beroende urval alltid samma storlek, medan storleken på oberoende urval kan skilja sig åt.
Prover jämförs med olika statistiska kriterier :
Urvalet kan anses representativt eller icke-representativt. Urvalet kommer att vara representativt vid undersökning av en stor grupp människor, om det inom denna grupp finns representanter för olika undergrupper, endast på detta sätt kan korrekta slutsatser dras.
I USA är ett av de mest kända historiska exemplen på icke-representativ provtagning fallet som inträffade under presidentvalet 1936 [ 3] . The Litrery Digest, som framgångsrikt hade förutspått händelserna i flera tidigare val, missbedömde sina förutsägelser genom att skicka ut tio miljoner provröstsedlar till sina prenumeranter, såväl som till personer som valts ut från telefonböckerna i hela landet och personer från bilregistreringslistor. I 25 % av de returnerade valsedlarna (nästan 2,5 miljoner) fördelade sig rösterna enligt följande:
Roosevelt vann som bekant själva valet med mer än 60 % av rösterna. The Litreary Digests misstag var detta: de ville öka urvalets representativitet – eftersom de visste att de flesta av deras prenumeranter ansåg sig vara republikaner – utökade de urvalet med personer som valts ut från telefonböcker och registreringslistor. De tog dock inte hänsyn till samtida realiteter och rekryterade faktiskt ännu fler republikaner: under den stora depressionen var det mest medel- och överklassen (det vill säga de flesta republikaner, inte demokrater) som hade råd att äga telefoner och bilar .
Det finns flera huvudtyper av gruppbyggnadsplan [4] :
Proverna är indelade i två typer:
Användningen av ett sådant urval bygger på antagandet att varje respondent är lika sannolikt att ingå i urvalet. Baserat på listan över den allmänna befolkningen sammanställs kort med antalet svarande. De placeras i en kortlek, blandas, och ett kort tas slumpmässigt ur dem, ett nummer skrivs ner och returneras sedan. Vidare upprepas proceduren så många gånger som provstorleken vi behöver. Minus: upprepning av urvalsenheter.
Proceduren för att konstruera ett enkelt slumpmässigt urval inkluderar följande steg:
1) det är nödvändigt att skaffa en fullständig lista över medlemmar av den allmänna befolkningen och numrera denna lista. En sådan lista, minns, kallas samplingsramen;
2) bestämma den förväntade urvalsstorleken, det vill säga det förväntade antalet svarande;
3) extrahera så många tal från tabellen med slumptal som vi behöver provenheter. Om urvalet ska omfatta 100 personer tas 100 slumptal från tabellen. Dessa slumptal kan genereras av ett datorprogram.
4) välj från baslistan de observationer vars nummer motsvarar de skrivna slumptalen
1) det är ofta svårt att skapa en urvalsram som skulle möjliggöra ett enkelt slumpmässigt urval.
2) resultatet av att använda ett enkelt slumpmässigt urval kan vara en stor population, eller en population fördelad över ett stort geografiskt område, vilket avsevärt ökar tiden och kostnaderna för datainsamling.
3) resultaten av att tillämpa ett enkelt slumpmässigt urval kännetecknas ofta av låg noggrannhet och ett större standardfel än resultaten från tillämpning av andra probabilistiska metoder.
4) som ett resultat av tillämpningen av SRS kan ett icke-representativt urval bildas. Även om de stickprov som erhållits genom ett enkelt slumpmässigt urval i genomsnitt representerar den allmänna befolkningen adekvat, representerar vissa av dem extremt felaktigt den studerade populationen. Sannolikheten för detta är särskilt hög med en liten urvalsstorlek.
Enkel hämtning utan omspelningProceduren för att konstruera provet är densamma, bara korten med de svarandes nummer återförs inte tillbaka till leken.
Urvalet i ett sådant urval utförs inte enligt principerna om slumpen, utan enligt subjektiva kriterier - tillgänglighet, typiskhet, lika representation, etc.
Urvalet av grupper för deras deltagande i ett psykologiskt experiment utförs med hjälp av olika strategier som behövs för att säkerställa högsta möjliga överensstämmelse med intern och extern validitet [5] .
Randomisering , eller slumpmässigt urval , används för att skapa enkla slumpmässiga urval. Användningen av ett sådant urval bygger på antagandet att varje medlem av befolkningen är lika sannolikt att ingå i urvalet. Till exempel, för att göra ett slumpmässigt urval av 100 universitetsstudenter , kan du lägga papper med namnen på alla universitetsstudenter i en hatt och sedan ta 100 stycken papper ur det - detta kommer att vara slumpmässigt urval (Goodwin J., s. . 147)……
parvis urval är en strategi för att konstruera provgrupper, där grupper av försökspersoner är uppbyggda av försökspersoner som är likvärdiga vad gäller sidoparametrar som är viktiga för experimentet. Denna strategi är effektiv för experiment med experimentella grupper och kontrollgrupper med det bästa alternativet - attrahera tvillingpar ( mono- och tvåäggstuga ).
Stratometriskt urval - randomisering med urval av strata (eller kluster ). Med denna urvalsmetod delas den allmänna befolkningen in i grupper (strata) som har vissa egenskaper ( kön , ålder , politiska preferenser, utbildning , inkomstnivå, etc.), och ämnen med motsvarande egenskaper väljs ut.
Ungefärlig modellering - ta fram begränsade urval och generalisera slutsatserna om detta urval till en större population. Till exempel, när du deltar i en studie av andra året universitetsstudenter , utvidgas uppgifterna i denna studie till "personer i åldern 17 till 21 år". Tillåtligheten av sådana generaliseringar är ytterst begränsad.
Approximativ modellering är bildandet av en modell som, för en tydligt definierad klass av system (processer), beskriver dess beteende (eller önskade fenomen) med acceptabel noggrannhet.