Pojke-tjej-paradoxen är också känd inom sannolikhetsteorin som pojke-tjej-paradoxen, Mr Smiths barn och Mrs Smiths problem. Problemet formulerades första gången 1959, när Martin Gardner publicerade en av de tidigaste versionerna av denna paradox i Scientific American kallad "The Two Children Problem", där han gav följande formulering:
Gardner själv gav först svaret 1/2 respektive 1/3, men insåg senare att situationen i det andra fallet är tvetydig. [1] Svaret på den andra frågan kan vara 1/2, beroende på hur man fick reda på att ett av barnen är en pojke. Tvetydighet beroende på problemets specifika tillstånd och de antaganden som gjordes bekräftades senare 1982 (Maya Bar-Hillel och Ruma Falk "Some teasers concerning conditional probabilities" [2] ) och i maj 2004 (Raymond S. Nickerson "Cognition and Chance" : The Psychology of Probabilistic Reasoning" [3] ). Andra varianter av denna paradox, med varierande grad av osäkerhet, har nyligen[ vad? ] tiden vunnit popularitet. Till exempel i Ask Marilyn i Parade Magazine , [4] John Tierney i The New York Times , [5] och Leonard Mlodinow i Drunkard's Walk. [6] Den psykologiska uppfattningen av denna paradox är också intressant. En vetenskaplig studie från 2004 (Craig R. Fox & Jonathan Levav (2004) [7] . "Partition-Edit-Count: Naive Extension Reasoning in Judgment of Conditional Probability) fann att givet identisk ingångsinformation men olika Med variationer i formuleringen av problem som uppmuntrar valet av en viss synvinkel varierar andelen MBA- studenter som gav 1/2 svar på den andra frågan från 85 % till 39 %. Paradoxen orsakar ofta mycket kontrovers.3 Många människor är ivriga anhängare av vart och ett av alternativen svar, medan de förnekar och ibland föraktar den motsatta synvinkeln. Paradoxen är att med olika tillvägagångssätt för analys, är den önskade sannolikheten olika. [6] [7] Det mest uppenbara svaret på båda frågorna är 1/2. [7] Men detta är svaret uppenbart endast när det följer av var och en av frågorna att det finns två lika sannolika utfall för det andra barnets kön (pojke eller flicka) [7] [8] och att sannolikheterna för dessa utfall är ovillkorliga [9]
Vi väljer en slumpmässig familj som uppfyller villkoren i den första frågan. Sedan finns det 4 lika sannolika utfall.
äldre barn | Yngsta barnet |
---|---|
Flicka | Flicka |
Flicka | Pojke |
Pojke | Pojke |
Pojke | Flicka |
Och endast 2 av de möjliga resultaten uppfyller kriteriet som anges i frågan (detta är alternativ för DD, DM). På grund av det faktum att båda utfallen från den nya uppsättningen elementära utfall {DD, DM} är lika sannolika, och endast ett av utfallen innehåller två flickor - DD - är sannolikheten att båda barnen är flickor 1/2.
Den andra frågan liknar den första, men istället för att säga att det äldsta barnet är en pojke, säger frågan att minst ett av barnen är en pojke. Som svar på kritik från läsare håller Gardner med om att på grund av "omöjligheten att beskriva randomiseringsproceduren i detalj", har hans ursprungliga formulering två sätt att tolka familjevalsmetoden:
Uppenbarligen har varje Mr Smith en son (detta är ett nödvändigt villkor), men det är inte klart om varje Mr Smith med en son kommer att komma under vår övervägande. Däri ligger problemet: uttalandet säger inte att att ha en son är ett tillräckligt villkor för att inkludera Mr Smith i "provet". Samtidigt noterar Bar-Hillel & Falk [2] , som kommenterar Gardners arbete, att "Mrs. Smith, till skillnad från läsaren, naturligtvis vet vilket kön hennes barn har när hon påstår något. Och med utgångspunkt från svaret: " Jag har två barn och minst ett av dem är en pojke" - det korrekta svaret, enligt deras åsikt, kommer att vara 1/3, som Gardner ursprungligen föreslog.
Om vi antar att familjen väljs enligt principen att den har minst ett barn-pojke och närvaron av en pojke accepteras som ett nödvändigt och tillräckligt villkor , så återstår tre av fyra lika sannolika utfall för en familj med två barn bland de elementära resultat som beskrivs ovan.
äldre barn | Yngsta barnet |
---|---|
Flicka | Flicka |
Flicka | Pojke |
Pojke | Flicka |
Pojke | Pojke |
Om man antar att båda barnen beaktas i sökandet efter en pojke är svaret på den andra frågan 1/3. Men om en familj valdes först och sedan könet på ett av barnen kontrollerades, skulle det korrekta sättet att beräkna inte längre vara att räkna de lämpliga alternativen, utan att beräkna den villkorade sannolikheten för varje fall.
äldre barn | Yngsta barnet | P (det här fallet) | P("testade visade sig vara en pojke") | P(det här fallet, och "testade visade sig vara en pojke") |
---|---|---|---|---|
Flicka | Flicka | 1/4 | 0 | 0 |
Flicka | Pojke | 1/4 | 1/2 | 1/8 |
Pojke | Flicka | 1/4 | 1/2 | 1/8 |
Pojke | Pojke | 1/4 | ett | 1/4 |
Svaret erhålls genom att beräkna den betingade sannolikheten (1/4)/(0+1/8+1/8+1/4)=1/2. Observera att när du väljer ett specifikt barn kommer allt att hända lite annorlunda, och ett liknande svar kommer att erhållas med andra beräkningar. Om vi till exempel först tar reda på könet på det yngsta barnet, då
Äldsta barn (känd kön) | Yngsta barnet | P (det här fallet) | P("andra barnet är en pojke") | P(det här fallet, och "det andra barnet är en pojke") |
---|---|---|---|---|
Flicka | Flicka | 1/4 | 0 | 0 |
Flicka | Pojke | 1/4 | ett | 1/4 |
Pojke | Flicka | 1/4 | 0 | 0 |
Pojke | Pojke | 1/4 | ett | 1/4 |
(1/4)/(0+1/4+0+1/4)=1/2.
Sedan Gardners paradox blev populär har den diskuterats flitigt och olika former av den andra frågan har utarbetats. Den första versionen föreslogs av Bar-Hillel och Falk [2] och den lät så här:
Mr Smith är far till två barn. Vi mötte honom gå nerför gatan med en liten pojke, som han stolt presenterade för oss som sin son. Vad är sannolikheten att Mr Smiths andra barn också är en pojke?Bar-Hillel och Falk använde denna variation för att betona vikten av att uppmärksamma underliggande antaganden. I det här fallet är det uppenbara svaret ½ korrekt. Men någon kan vara oense och säga att innan Mr Smith presenterade pojken för oss vet vi att han är far till antingen två DD-flickor, eller två MM-pojkar, eller en pojke och en flicka, där den äldsta är antingen MD pojke eller tjej DM. Med tanke på händelsernas lika sannolikhet börjar vi alltså återigen med en sannolikhet på 1/4 att Smith har två pojkar. När vi får reda på att han har minst en pojke, avvisar vi automatiskt alternativet med två flickor. Och från det faktum att de återstående tre utfallen är lika sannolika drar vi slutsatsen att sannolikheten för MM är 1/3.
Bar-Hillel och Falk [2] säger att det finns ett naturligt antagande att Mr Smith slumpmässigt valde ett barn att gå ut med, men i det här fallet är kombinationerna av MM, MD och MM inte längre lika sannolika. I det här fallet, i MM-situationen, är valet av en pojke som sällskap garanterat, och i de återstående två fallen skiljer sig sannolikheten från 1. Om vi utför beräkningar med hänsyn till denna faktor visar det sig att sannolikheten att andra barnet är en pojke är 1/2.
Men Bar-Hillel och Falk föreslog ett alternativt scenario. De föreslog att det fanns en kultur där en pojke valdes att gå ändå. Under detta antagande är barnparen MM, MD och DM lika sannolika, även om vi vet att en pojke gick en promenad, av vilket vi kan få att sannolikheten att det andra barnet också är en pojke är 1/3 . [2]
1991 svarade Marilyn vos Savant , i sin "Fråga Marilyn"-kolumn i Parade magazine, på en läsare som bad henne lösa en variant av valpparadoxen. Och 1996 dök en annan variant av den andra frågan upp:
Vos Savant gav själv ett klassiskt svar på denna fråga. Men samtidigt gjorde hon en undersökning där läsare med 2 barn, varav minst en son, svarade på frågan om vilket kön deras barn hade. 35,9 % av nästan 18 000 personer svarade att de hade 2 pojkar. [10] Denna anteckning av Vos Savant [4] granskades i detalj av Carleton och Stansfield [10] i en artikel 2005 i The American Statistician. Författarna diskuterar inte den möjliga tvetydigheten i denna fråga och drar slutsatsen att hennes svar är matematiskt korrekt, givet premissen att sannolikheterna för att få en pojke och en flicka är lika, och att könet på det andra barnet inte beror på den förstas kön. Angående hennes forskning säger de att "i alla fall bekräftar vi att Vos Savants påstående att sannolikheterna som presenterades i den ursprungliga frågan inte är lika är sant, och att sannolikheten för två pojkar är närmare 1/3 än 1/2 ".
Carlton och Stansfield går sedan vidare för att diskutera paradoxen med en pojke och en flicka i livet. De visar att i den verkliga världen är pojkar något vanligare än flickor, och att oberoendet av det andra barnets kön från könet på det första inte är så uppenbart. Författarna drar slutsatsen att även om premissen för frågan motsäger verkliga observationer, har paradoxen ett stort pedagogiskt värde eftersom den "illustrerar en av de mest spännande tillämpningarna av betingad sannolikhet." Faktum är att de faktiska sannolikhetsvärdena inte är viktiga; trots allt är syftet med paradoxen att visa till synes motsägelsefulla logiker , och inte den faktiska födelsetalen.
Ur statistisk analyssynpunkt är ovanstående frågor ofta tvetydiga och har som sådan inte ett "rätt" svar. Men paradoxen med det andra barnet slutar inte här, och de möjligheter som det öppnar för att utforska den intuitiva sannolikhetsuppfattningen hos en person är också användbara. Studier som de utförda av Vos Savant säger att om människor var konsekventa skulle de vara mer benägna att komma med ett 1/3-svar, men ett 1/2-svar är vanligare. Tvetydigheten i denna andra fråga, samtidigt som den skapar paradoxer i klassisk matematik, är grunden för att studera människors intuitiva uppfattning om sannolikhet. Fox & Levav 2004 [7] använde denna paradox för att studera hur människor utvärderar betingad sannolikhet. I denna studie presenterades paradoxen för människor på två sätt:
Författarna menar att den första formuleringen ger läsaren det felaktiga intrycket att det finns två lika sannolika möjligheter för det "andra barnet" [7] , medan den andra formuleringen ger läsaren intrycket att det finns fyra möjliga utfall, varav ett var exkluderas (som ett resultat är sannolikheten för två pojkar 1/3, eftersom det finns tre möjliga återstående elementära utfall, varav endast ett har båda barnen pojkar).
Enligt resultaten av detta experiment visade det sig att dessa två formuleringar förvirrar människor. Så i det första fallet gavs svaret 1/2 av 85% av de tillfrågade, medan i det andra fallet endast 39%. Författarna menar att anledningen till att människor svarar olika på dessa 2 frågor är att människor fattar beslut med hjälp av heuristik som involverar användning av informella metoder, i motsats till beslutsmetoder baserade på tydliga matematiska modeller .