Hur man ljuger med statistik
Hur man ljuger med statistik |
Författare |
Darell Huff |
Originalspråk |
engelsk |
Original publicerat |
1954 |
Dekor |
Irving Geis |
Utgivare |
W. W. Norton & Company Inc. |
Sidor |
142 |
ISBN |
0-393-31072-8 |
How to Lie with Statistics är en bok skriven av Darell Huff .år 1954. Hon berättar om de olika sätt som statistik kan missbrukas för att lura publiken och manipulera deras åsikter. Många specifika exempel övervägs, främst från det amerikanska livet (reklam, politik, propaganda och agitation).
Den första epigrafen till boken är ett citat från greve Beaconsfield (B. Disraeli) om statistik: "Det finns tre typer av lögner: lögner, uppenbara lögner och statistik."
Boken vänder sig till den icke-specialistläsare och är försedd med levande illustrationer. Materialet presenteras levande och i en tillgänglig form, vilket säkerställde bokens höga popularitet - det är en av de mest spridda publikationerna om statistik under andra hälften av 1900-talet [1] .
Innehåll
Provet är i sig partiskt
En förklaring av vad urval är , hur intervjuare omedvetet väljer ut intervjupersoner och påverkar deras svar.
Ett väl valt medelvärde
Typerna av genomsnitt övervägs:
Exemplen visar hur valet av typ av medelvärde påverkar dess värde för samma prover. Uppmärksamhet dras till möjligheten att manipulera en oförberedd läsare genom att välja en "bekväm" (för manipulatorn) typ av medelvärde.
Nyanser som är blygsamt tysta
I detta kapitel tar författaren upp viktiga nyanser av statistisk forskning som ofta avsiktligt eller omedvetet utelämnas i artiklar avsedda för allmänheten.
Vikten av urvalsstorleken och dess samband med typen av population förklaras. Exempel på provstorleksmanipulationer ges:
- Testa effektiviteten av tandkräm. Laboratorietester av effekten av att använda tandkräm på sex försökspersoner genomförs. Ibland genomförs ett antal sådana studier, och studien som visade ett fördelaktigt resultat för kunden (pastatillverkaren) används i reklamkampanjer.
- Poliovaccintest. 450 barn vaccinerades, 680 var inte vaccinerade (kontrollgrupp). Kort därefter bröt en epidemi ut i området, de vaccinerade barnen hade inte ett enda fall av polioinfektion. Inte heller någon av medlemmarna i kontrollgruppen. Experimentet gjordes värdelöst redan från början på grund av fel val av antal deltagare, eftersom inte mer än två fall av infektion kan förväntas i en grupp av denna storlek.
Begreppen introduceras:
På exemplet med Hessel utvecklingsskalantalar om faran med att uppfatta en punkt (utom intervall) bedömning av medelvärdet - föräldrar börjar få panik om deras barn inte uppfyller normen (medelvärde).
Uppmärksamhet uppmärksammas på vikten av formuleringar i artiklar baserade på statistik. Som ett exempel, ta elförsörjningsföretagens uttalande (1948): "Elektrisk kraft är tillgänglig för mer än 3/4 av gårdarna i USA." Ordet "tillgänglig", som inte definieras på något sätt i applikationen, gör det meningslöst - det betyder vanligtvis att kraftledningen ligger på ett avstånd av 10-100 miles (16-160 km) från gården, men något annat kan förstås som tillgänglighet. Författaren noterar också att när man tolkar samma data kan man lägga motsatt betoning och skriva: "Elektrisk kraft är inte tillgänglig för en fjärdedel av amerikanska gårdar."
Kapitlet avslutas med en påminnelse om vikten av att ha siffror på diagram – ett diagram över ett företags vinsttillväxt under flera år (publicerat i Fortune magazine) säger ingenting för läsaren eftersom y-axeln saknar numeriska etiketter. Från en sådan graf är det omöjligt att avgöra om vinsttillväxten var signifikant, genomsnittlig eller nära noll.
Mycket väsen om ingenting
Begreppen konfidensintervall och konfidensnivå illustreras med verkliga exempel:
- Skillnaden i IQ-testresultat mellan 98 och 101 gör det omöjligt att avgöra vilken person som har en högre IQ, vilket kan ses av den fullständiga registreringen av testresultaten: 98 ± 3 respektive 101 ± 3.
- Mätning av innehållet av skadliga ämnen i olika märken av cigaretter visade att det inte fanns någon signifikant skillnad mellan dem. Ändå låg ett av varumärkena på sista plats vad gäller innehållet av skadliga ämnen (om än med en försumbar marginal från första början!). Tillverkaren av dessa cigaretter (Old Gold) lanserade en reklamkampanj där de hävdade att Old Gold-cigaretter innehöll de minst skadliga ämnena, enligt ett oberoende laboratorium.
Schemat är hur bra som helst
Det första av kapitlen ägnas åt övervägande av sätt att manipulera med hjälp av grafisk information.
Överväger sätt att förvränga uppfattningen av grafer:
- "Komprimera" en del av koordinatnätet, skenbart för att spara utrymme. I verkligheten leder det till svårigheter i uppfattningen av skalan
- Skalförändring längs abskissan och ordinatan. Denna metod låter dig "vända" (visuellt) tillväxt, nära noll, i en uttalad hållbar. Som ett exempel ges det statsbidragstillväxtdiagram som ges i ett av kungörelserna. Ökningen var bara 4 %, men såg visuellt ut nästan som 400 % på grund av ökningen av skalan längs y-axeln.
Schematisk bild
Förstå sätt att lura publiken med hjälp av infografik .
Användningen av grafiska objekt kopplade till den information som presenteras öppnar stora möjligheter för missbruk. Detta uttalande illustreras av ett antal exempel:
- För att jämföra två löner kan du använda infografik och dra två påsar med pengar. Om den andra lönen är dubbelt så hög som den första, kommer den andra påsen inte bara att vara högre utan också dubbelt så bred (vilket är nödvändigt för att bibehålla proportionen). Och eftersom påsen är ett tredimensionellt föremål kommer konturen på den andra påsen att vara dubbelt så tjock som den första. Som ett resultat uppfattar vår vision den andra påsen som en påse 8 (inte 2!) gånger större än den första. Denna teknik användes av tidningen Newsweek.
- En annons för American Institute of Steel and Alloys använde en infografik för att visa en ökning av stålproduktionen mellan 1930 och 1940 med 4,25 miljoner ton (från 10 miljoner till 14,25 miljoner). Den infografiska tekniken (avsiktlig förvrängning av proportioner lades till de tidigare diskuterade metoderna) ledde till att den indikerade ökningen av smältning visuellt uppfattades som 1500%. Författaren noterar att så är fallet när "arithmetik förvandlas till fantasi."
- Använder bilder av kor i olika storlekar för att visa olika mjölkavkastning genom åren. Utöver de effekter som redan diskuterats leder denna metod till ytterligare ett missförstånd - läsaren kanske tror att inte bara mjölkavkastningen har blivit högre, utan korna är också större.
Bilden nedan visar ett exempel på infografiskt missbruk - det andra objektet är visuellt 8 gånger större:
Pseudo-justerad figur
Kapitlet inleds med en svidande rekommendation, "Om du inte kan bevisa vad du vill, visa då något annat och låtsas att dessa saker är desamma."
Det finns många exempel på sådana bedrägerier. Särskilt:
- Utfärdandet av en undersökning av människors åsikter om lika möjligheter för vita och afroamerikaner att få ett jobb för den verkliga situationen på arbetsmarknaden. Denna undersökning kan visa bättre resultat ju fler personer med rasfördomar mot afroamerikaner deltar i den, eftersom sådana respondenter tenderar att tro att det inte förekommer någon rasdiskriminering på arbetsmarknaden.
- Cigarettannonser använde följande argument: "Mer än 27 % av ett stort urval av välkända läkare röker Throaties, den högsta andelen av något cigarettmärke." Annonsen antydde implicit att läkarna visste något speciellt, okänt för resten, om den skada som olika cigarettmärken orsakade. Men det är inte.
- En annons för en juicepress hävdade att laboratorietester visade att den pressar 26 % mer juice. När frågan ställdes - "än vad?", mottogs svaret - "än en manuell konjuicer." Även om det ursprungliga påståendet är sant, tillåter det dig inte att jämföra den annonserade produkten med konkurrenters produkter. Det kan vara det sämsta på marknaden, men ändå överträffa en manuell juicepress med 26% i extraktionseffektivitet.
- Dödligheten i flottan under det spansk-amerikanska kriget var 0,09 %. För civila i New York under samma period var det 0,16%. Marinen använde dessa siffror för att kampanja för militärtjänst. Men det är felaktigt att jämföra dessa indikatorer - unga och friska människor rekryteras till flottan, och spädbarn, gamla människor, sjuka människor rekryteras till civilbefolkningen.
Återigen, "efter beror på"
Detta kapitel talar om begreppet korrelation och den förvirring som ofta uppstår mellan orsak och verkan. Om fenomen A och B inträffar tillsammans kan detta förklaras på tre sätt:
- Fenomen A är en konsekvens av fenomen B
- Fenomen B är en konsekvens av fenomen A
- Fenomen A och B är konsekvenser av en annan/andra fenomen(er)
Ett antal exempel på felaktiga bedömningar om orsakssamband ges. Särskilt:
- Studier har visat att det är fler dåligt presterande bland studenter som röker än bland icke-rökare. Detta faktum användes i kampanjen mot tobak. Men man kan inte av detta resultat dra slutsatsen att rökning har en negativ effekt på elevernas förmågor. Det är möjligt att elever började röka på grund av dåliga akademiska prestationer, eller så studerar de dåligt och röker på grund av någon tredje anledning (till exempel svåra levnadsförhållanden).
- Forskning visar ett positivt samband mellan utbildningsnivå och inkomst. Man kan inte dra slutsatsen av detta faktum att om du (din son, dotter etc.) får en högre utbildning, så kommer de säkert och nödvändigtvis att ha en högre inkomst än om de inte fick den. Dessutom tillåter denna korrelation oss inte som en allmän regel att dra slutsatsen att det är högre utbildning som leder till högre inkomst – kanske kommer de som har fått den från rika familjer och det är därför de får en högre inkomst i vuxen ålder. Här är ett exempel på ett post hoc-felSe även Logiska fel .
- En studie av 1 500 typiska medelålders universitetsstudenter visade att 93 % av männen var gifta (mot 83 % för den allmänna befolkningen), medan endast 65 % av kvinnorna var gifta. Av detta dras slutsatsen att en utbildad kvinna är mindre benägen att gifta sig än en outbildad. Men studien visar inget orsakssamband mellan dessa fenomen. Kanske skulle dessa ogifta kvinnor ha förblivit ogifta även om de inte hade tagit examen från universitetet.
Kapitlet avslutas med ett nästan anekdotiskt (men verkligt) exempel på förvirringen av orsak och verkan hos de infödda på Nya Hebriderna. De trodde att närvaron av löss leder till hälsa. Denna slutsats gjordes på grundval av att lössen lämnade den sjuke (eftersom på grund av den ökade kroppstemperaturen blev levnadsförhållandena för dem obekväma), medan alla friska människor hade dem (med andra ord, det fanns en positiv korrelation mellan hälsa och förekomst av löss).
Hur man producerar statistik
Statistik är statistiska manipulationer. I det här kapitlet visar författaren återigen hur man manipulerar statistisk data med hjälp av specifika exempel. Han uppmanar dock att inte urskillningslöst förkasta statistiska uppgifter, utan att studera dem eftertänksamt, grundligt, med försiktig otrohet, innan han noterar dem.
Hur man sätter statistik på plats
Författaren föreslår att man kontrollerar de statistiska uppgifterna med hjälp av fem enkla frågor:
- Vem talar?
- Hur vet han detta?
- Vad saknas?
- Ändras studieobjektet?
- Verkar det vettigt?
Upplagor på andra språk
På ryska
- Darell Huff. Hur man ljuger med statistik = How to Lie with Statistics. — M .: Alpina Publisher , 2015. — 163 sid. — ISBN 978-5-9614-5212-9 .
Anteckningar
- ↑ "Under de senaste femtio åren har How to Lie with Statistics sålt fler exemplar än någon annan statistisk text." JM Steele. " Darrell Huff and Fifty Years of How to Lie with Statistics Arkiverade 23 februari 2021 på Wayback Machine . Statistical Science , 20(3), 2005, 205-209.
Länkar