En skala (mätskala) är ett teckensystem för vilket en display ( mätoperation ) är inställd, som associerar ett eller annat element (värde) på skalan med verkliga objekt, situationer, händelser eller processer . Formellt är en skala en tupel , ⟨ X , φ, Y ⟩, där X är en uppsättning verkliga objekt, situationer, händelser eller processer, φ är en avbildning, Y är en uppsättning element (värden) i ett teckensystem [ 1] [2] .
Olika typer av mätskalor används i stor utsträckning i teoretisk och praktisk mänsklig aktivitet , inom vetenskap och teknologi - inklusive inom många humanitära vetenskapliga områden, såsom ekonomi , psykometri , sociologi och andra [3] [4] för den symboliska ( formella ) representationen av objekt (händelser), deras egenskaper (egenskaper) och relationer.
Mätskalor klassificeras enligt de typer av data som mäts, vilket bestämmer de samband som tillåts för en given skala, inklusive de som motsvarar matematiska transformationer av skalvärdena [2] [5] . Klassificeringen i modern skala föreslogs 1946 av Stanley Smith Stevens .
Namnskala (nominell, klassificering) Används för att mäta värdena för kvalitativa egenskaper. Värdet av en sådan egenskap är namnet på den ekvivalensklass som objektet i fråga tillhör. Exempel på värden för kvalitativa egenskaper är namnen på stater, färger, bilmärken etc. Sådana egenskaper uppfyller identitetens axiom:Av de övervägda skalorna är de två första icke-metriska , och resten är metriska .
Problemet med lämpligheten av metoder för matematisk bearbetning av mätresultat är direkt relaterat till frågan om typen av skala. I det allmänna fallet är adekvat statistik den som är invariant med avseende på tillåtna transformationer av den använda mätskalan.
Typer av vågar och deras egenskaper enligt klassificeringen av Stanley Smith StevensNominell skala |
ordningsskala _ |
Intervallskala _ |
Relationsskala _ | ||
---|---|---|---|---|---|
Logik / matematik operationer |
× ÷ |
Inte | Inte | Inte | Ja |
+ − |
Inte | Inte | Ja | Ja | |
< > |
Inte | Ja | Ja | Ja | |
= ≠ |
Ja | Ja | Ja | Ja | |
Exempel ( dikotoma och icke- dikotoma variabler) |
Dikotom: kön (man/kvinna) Icke-dikotom: |
Dikotom: hälsotillstånd (frisk/sjuk), skönhet (vacker/ful) Icke-dikotom: |
Datum (från 1457 f.Kr. till 2013 e.Kr.), latitud temperatur |
Ålder (från 0 till 99 år) | |
Mått på central tendens | Mode | Median | Medel | geometriskt medelvärde | |
Metrisk eller inte | Icke- metrisk (kvalitet) |
Icke- metrisk (kvalitet) |
Metrisk (kvantitativ) |
Metrisk (kvantitativ) |
Genom att analysera olika typer av skalor kommer F.N. Ilyasov till slutsatsen att de nominella och intervallskalorna är forskningsartefakter [7][ förtydliga ] .
Även om Stevens typologi fortfarande är allmänt användbar, är den fortfarande föremål för kritik från teoretiker, i synnerhet när det gäller den nominella och ordinala skalan. [åtta]
Huvudpunkterna för kritiken av Stevenson-skalan:
herre[ vad? ] kritiserade Stevens argument genom att visa att valet av giltiga statistiska test för en given datauppsättning inte beror på problem med representation eller unikhet, utan beror på meningsfullhet. [9]
Baker, Hardik och Petrinovich, såväl som Borgatta och Bornstedt, har betonat att följa Stevens begränsningar ofta tvingar forskare att ta till rangordning av data och därmed överge användningen av parametriska tester. Deras argument var mer av ad hoc- karaktär och slutade med ett förslag om att använda standardparametriska procedurer istället för att engagera sig i problemet med robusthet. [10] [11]
Guttmann hävdade mer generellt att den statistiska tolkningen av data beror på vilken fråga som ställs till data och vilka bevis vi är villiga att acceptera som svar på den frågan. Han definierade detta bevis i termer av den förlustfunktion som valts för att testa modellens kvalitet. [12]
John Tukey kritiserade också Stevens begränsningar som farliga för bra statistisk analys. Precis som Lord och Guttman noterade Tukey vikten av betydelsen av data för att bestämma både skalan och det lämpliga analyssättet. Eftersom Stevens skaltyper är absoluta, i en situation där till exempel data inte kan betraktas som helt intervall, bör de nedgraderas till ordinal.
Till och med Stevens själv reserverade sig och anmärkte: "Faktum är att de flesta av de skalor som ofta och effektivt används av psykologer är ordningsskalor. Vanlig statistik, inklusive medel och standardavvikelser, bör inte strikt användas när man arbetar med dessa skalor, men en viss pragmatisk motivering kan ges till sådan obehörig användning: i många fall leder det till fruktbara resultat.
Duncan[ vad? ] (1986) motsatte sig användningen av ordet "mått" i beskrivningen av den nominella skalan, men Stevens (1975) gav då sin egen definition av "mätning", vilket låter som "att tillskriva en egenskap enligt någon regel. Den enda regel som inte kan användas för dessa ändamål är oavsiktlig tillskrivning. Den så kallade "nominella dimensionen" inkluderar dock forskarens värdebedömning, och de möjliga omvandlingarna av denna dimension är oändliga. Detta är en av de kommentarer Lord gjorde 1953 i den satiriska artikeln On the Statistical Treatment of Football Numbers [13]
Användningen av "medelvärde" som ett mått på central tendens för ordinaltyp är fortfarande kontroversiellt bland dem som accepterar Stevens typologi. Trots detta använder många beteendevetare medelvärdet för ordinaldata. Den vanliga motiveringen för detta är att ordinaltypen inom beteendevetenskapen ligger någonstans mellan den sanna ordinaltypen och intervalltypen. Även om avståndsskillnaden mellan två ordningssiffror inte är konstant, är den ofta av samma ordning.
Till exempel visar tillämpningen av mätmodeller i utbildningssammanhang att övergripande betyg har ett ganska linjärt samband med mätningar inom betygsintervallet. Således hävdar vissa att så länge skillnaden i avstånd mellan ordningssiffror inte är särskilt stor, kan statistiken för intervallskalor (t.ex. "medelvärde") ha ett meningsfullt resultat för ordningsskalor. Programvara för statistisk analys (t.ex. SPSS ) kräver att användaren specificerar lämplig mätklass för varje variabel. Detta säkerställer att oavsiktliga användarfel inte leder till meningslös analys (exempel: korrelationsanalys med en nominell variabel).
Thurstone[ vad? ] gjort framsteg med att utveckla en motivering för att härleda en intervalltyp baserad på lagen om jämförande bedömning . En vanlig tillämpning av lagen är hierarkins analytiska process . Geogr Rasch har gjort ytterligare framsteg genom att utveckla den probabilistiska Rasch-modellen , som ger den teoretiska grunden och logiken för att härleda intervallmätningar från observationsräkningar (t.ex. totalpoäng för betyg).
Trots all kritik, i ett brett spektrum av situationer, visar erfarenheten att tillämpningen av förbjuden statistik på data leder till vetenskapligt signifikanta resultat som är viktiga för beslutsfattande och värdefulla för vidare forskning.
Det finns andra typologier än Stevens. Till exempel: Mostller Mosteller och Tukey (1977), Nelder (1990) skapade beskrivningar av kontinuerlig räkning, kontinuerliga samband och kategoriska datamodeller. Se även: Chrisman (1998), van den Berg (1991).
Typologi av Mosteller och Tukey (1977)Mostelleroch Tukey märkte att nivå 4 inte var tillräckligt och föreslog följande uppdelning: [14]
Till exempel, procentsatser (en variant av bråk i termer av Mosteller-Tukey) passar inte Stevens teori, eftersom det inte finns några helt giltiga transformationer. [åtta]
Crisman's Typology (1998)Nicholas Crisman har föreslagit en utökad dimensionsnivåsökning för att ta hänsyn till olika dimensioner som inte nödvändigtvis motsvarar de traditionella föreställningarna om dimensionsnivåer. Mätningar relaterade till räckvidd och upprepning (t.ex. radiella grader på en cirkel, timmar, etc.), graderade medlemskategorier och andra typer av mätningar stämmer inte överens med Stevens ursprungliga arbete, vilket resulterar i införandet av sex nya mätnivåer till de befintliga tio :
Utökade mätnivåer används sällan utanför akademisk geografi. [femton]
Skaltypsteori är en sorts "intellektuell tjänare" till Stevens operationella teori om mätning, som har blivit definitiv inom psykologi och beteendevetenskap , trots Michells kritik för att vara oförenlig med mätningar inom naturvetenskap (Michell, 1999). Faktum är att Operational Measurement Theory var en reaktion på resultaten av en kommitté som inrättades av British Association for the Advancement of Science 1932 för att undersöka möjligheten till äkta vetenskaplig mätning inom psykologiska och beteendevetenskapliga vetenskaper. Denna kommitté, som blev känd som "Ferguson-kommittén", publicerade en slutrapport (Ferguson, et al., 1940, s. 245) där Stevens sömnskala (Stevens & Davis, 1938) var föremål för kritik.
… varje lag som är avsedd att uttrycka ett kvantitativt förhållande mellan intensiteten hos en sensation och intensiteten hos en stimulans är inte bara falsk, utan faktiskt meningslös tills begreppet addition som tillämpas på sensation får mening.
Så om Stevens drömskalan mäter intensiteten av en publiks sensationer, måste bevis tas fram för att dessa sensationer är kvantitativa attribut. Det nödvändiga beviset var närvaron av "tillsatsstrukturer" - ett koncept utvecklat av den tyske matematikern Otto Holder (Hölder, 1901). Med fysikern och mätteoretikern Norman Robert Campbell som dominerade diskussionen i Ferguson-kommittén, slogs det fast att mätningar inom samhällsvetenskapen var omöjliga på grund av frånvaron av sammankopplingsoperationen . Därefter erkändes detta beslut som felaktigt efter utvecklingen av teorin om gemensamma mätningar av Debru, såväl som oberoende av Luce och Tukey. Stevens ville dock inte införa ytterligare experiment för att upptäcka additivstrukturer, utan ogiltigförklara Fergusonkommitténs beslut helt och hållet genom att föreslå en ny mätteori.
För att parafrasera N.R. Campbell (Slutrapport, s.340), kan man säga att mätning, i vid bemärkelse, definieras som tilldelning av nummer till objekt och händelser enligt någon regel (Stevens, 1946, s.677).
Stevens var starkt influerad av idéerna från en annan Nobelprisbelönt Harvard-akademiker, fysikern Percy Bridgman (1927), vars "operationism"-doktrin Stevens använde för att definiera termen "mätning". Till exempel använder Stevens definition ett måttband som definierar längd (mätobjekt) som mätbar (därav kvantifierbar). Kritiker av operationalism motsätter sig att den blandar ihop relationer mellan två objekt eller händelser för egenskaper hos ett av objekten eller händelserna (Hardcastle, 1995; Michell, 1999; Moyer, 1981a, b; Rogers, 1989).
Den kanadensiske mätteoretikern William Rozeboom (1966) var en av de första kritikerna som uttalade sig starkt mot Stevens teori om skaltyper.
Variabeltyp beror på sammanhangetEtt annat problem kan vara att samma variabel kan ha olika typer av skalor beroende på hur den mäts och syftet med analysen. Till exempel anses hårfärg vanligtvis vara en nominell variabel eftersom den inte har en specifik ordning. [16] Det är dock möjligt att ordna färger i en viss ordning på flera sätt, inklusive efter nyans, med hjälp av kolorimetri .
Med hjälp av olika skalor är det möjligt att ta fram olika psykologiska mätningar [17] . De allra första metoderna för psykologiska mätningar utvecklades inom psykofysiken . Psykofysikers huvuduppgift var hur man avgör hur de fysiska parametrarna för stimulering korrelerar med de subjektiva bedömningarna av förnimmelser som motsvarar dem. Genom att känna till detta samband kan man förstå vilken känsla som motsvarar ett eller annat tecken. Den psykofysiska funktionen etablerar ett förhållande mellan det numeriska värdet av skalan för det fysiska mätandet av stimulansen och det numeriska värdet av det psykologiska eller subjektiva svaret på denna stimulans.