Skala

En skala (mätskala) är ett teckensystem för vilket en display ( mätoperation ) är inställd, som associerar ett eller annat element (värde) på skalan med verkliga objekt, situationer, händelser eller processer . Formellt är en skala en tupel , ⟨ X , φ, Y ⟩, där X är en uppsättning verkliga objekt, situationer, händelser eller processer, φ är en avbildning, Y är en uppsättning element (värden) i ett teckensystem [ 1] [2] .

Olika typer av mätskalor används i stor utsträckning i teoretisk och praktisk mänsklig aktivitet , inom vetenskap och teknologi - inklusive inom många humanitära vetenskapliga områden, såsom ekonomi , psykometri , sociologi och andra [3] [4] för den symboliska ( formella ) representationen av objekt (händelser), deras egenskaper (egenskaper) och relationer.

Skaltyper

Mätskalor klassificeras enligt de typer av data som mäts, vilket bestämmer de samband som tillåts för en given skala, inklusive de som motsvarar matematiska transformationer av skalvärdena [2] [5] . Klassificeringen i modern skala föreslogs 1946 av Stanley Smith Stevens .

Namnskala (nominell, klassificering) Används för att mäta värdena för kvalitativa egenskaper. Värdet av en sådan egenskap är namnet på den ekvivalensklass som objektet i fråga tillhör. Exempel på värden för kvalitativa egenskaper är namnen på stater, färger, bilmärken etc. Sådana egenskaper uppfyller identitetens axiom:

Antingen A = B eller A ≠ B .
Om A = B så är B = A .
Om A = B och B = C så är A = C .

Med ett stort antal klasser används hierarkiska namnskalor. De mest kända exemplen på sådana skalor är [6] de skalor som används för att klassificera djur och växter. Med värdena uppmätta i namnskalan kan du bara utföra en operation - kontrollera deras sammanträffande eller oöverensstämmelse. Baserat på resultaten av en sådan kontroll är det möjligt att dessutom beräkna fyllningsfrekvenserna (sannolikheterna) för olika klasser, vilket kan användas för att tillämpa olika metoder för statistisk analys [6] - goodness-of-fit test, Cramers test för testa hypotesen om förhållandet mellan kvalitativa egenskaper osv.

\chi ^{2}

Ordinalskala (eller rang) Inkluderar identitet och ordningsrelationer. Objekt i denna skala rangordnas. Men alla objekt kan inte underordnas ordningsförhållandet. Till exempel kan man inte säga vilken som är större - en cirkel eller en triangel, men man kan peka ut en gemensam egenskap i dessa objekt - area, och därmed blir det lättare att upprätta ordningssamband. För denna skala är en monoton transformation tillåten. En sådan skala är grov eftersom den inte tar hänsyn till skillnaden mellan skalobjekt. Ett exempel på en sådan skala: prestationspoäng (otillfredsställande, tillfredsställande, bra, utmärkt), Mohs-skala . Ordinalskalor som används för att representera egenskaperna hos objekt som kan anta extrema, motsatta värden kallas bipolära skalor . Sådana egenskaper inkluderar till exempel ett objekts överensstämmelse med ett visst syfte: från "helt överensstämmer inte" till "överensstämmer fullständigt", och olika grader av partiell överensstämmelse. I det här fallet tilldelas skalans extrema värden till egenskapernas extrema, motsatta värden, de mellanliggande används för att representera den varierande graden av överensstämmelse hos objektet med syftet. Intervallskala (alias skillnadsskala) Här finns en jämförelse med standarden. Konstruktionen av en sådan skala gör att de flesta egenskaperna hos befintliga numeriska system kan tillskrivas siffror som erhållits på basis av subjektiva bedömningar. Till exempel bygga en skala med intervaller för reaktioner. För denna skala är en linjär transformation acceptabel. Detta gör att du kan föra testresultaten till vanliga skalor och på så sätt jämföra indikatorerna. Exempel: Celsius skala. Ursprunget är godtyckligt, måttenheten är inställd. Giltiga transformationer är förskjutningar. Exempel: mätning av tid. Absolut skala (alias ratio skala) Detta är en intervallskala, där det finns en ytterligare egenskap - den naturliga och otvetydiga närvaron av en nollpunkt. Exempel: antalet personer i publiken. I förhållandets skala fungerar förhållandet "så många gånger mer". Det är den enda av de fyra skalorna som har en absolut noll. Nollpunkten kännetecknar frånvaron av mätbar kvalitet. Denna skala tillåter en likhetstransformation (multiplikation med en konstant). Bestämning av nollpunkten är en svår uppgift för psykologisk forskning, vilket innebär en begränsning av användningen av denna skala. Med hjälp av sådana vågar kan massa, längd, styrka, kostnad (pris) mätas. Exempel: Kelvin-skala (temperaturer mätt från absoluta nollpunkten, med måttenheten vald efter överenskommelse med specialister - kelvin).

Av de övervägda skalorna är de två första icke-metriska , och resten är metriska .

Problemet med lämpligheten av metoder för matematisk bearbetning av mätresultat är direkt relaterat till frågan om typen av skala. I det allmänna fallet är adekvat statistik den som är invariant med avseende på tillåtna transformationer av den använda mätskalan.

Typer av vågar och deras egenskaper enligt klassificeringen av Stanley Smith Stevens

		Nominell skala	ordningsskala _	Intervallskala _	Relationsskala _
Logik / matematik operationer	× ÷	Inte	Inte	Inte	Ja
	+ −	Inte	Inte	Ja	Ja
	< >	Inte	Ja	Ja	Ja
	= ≠	Ja	Ja	Ja	Ja
Exempel ( dikotoma och icke- dikotoma variabler)		Dikotom: kön (man/kvinna) Icke-dikotom: nationalitet (amerikansk/kinesisk/etc.)	Dikotom: hälsotillstånd (frisk/sjuk), skönhet (vacker/ful) Icke-dikotom: åsikt (håller helt med / håller ganska med / håller inte med / håller helt med)	Datum (från 1457 f.Kr. till 2013 e.Kr.), latitud (från +90° till −90°), temperatur (från 10 °C till 20 °C)	Ålder (från 0 till 99 år)
Mått på central tendens		Mode	Median	Medel	geometriskt medelvärde
Metrisk eller inte		Icke- metrisk (kvalitet)	Icke- metrisk (kvalitet)	Metrisk (kvantitativ)	Metrisk (kvantitativ)

Kritik av Stevens typologi

Genom att analysera olika typer av skalor kommer F.N. Ilyasov till slutsatsen att de nominella och intervallskalorna är forskningsartefakter [7][ förtydliga ] .

Även om Stevens typologi fortfarande är allmänt användbar, är den fortfarande föremål för kritik från teoretiker, i synnerhet när det gäller den nominella och ordinala skalan. [åtta]

Huvudpunkterna för kritiken av Stevenson-skalan:

Att minska valet till endast de statistiska metoder som "visar invarians som är lämplig för denna typ av skala" verkar vara farligt för dataanalys i praktiken.
Hans taxonomi är för strikt för att kunna tillämpas på riktiga data.
Stevens begränsningar leder ofta till nedgradering av data genom konvertering till rangordning och efterföljande onödig användning av icke-parametriska metoder.

herre[ vad? ] kritiserade Stevens argument genom att visa att valet av giltiga statistiska test för en given datauppsättning inte beror på problem med representation eller unikhet, utan beror på meningsfullhet. [9]

Baker, Hardik och Petrinovich, såväl som Borgatta och Bornstedt, har betonat att följa Stevens begränsningar ofta tvingar forskare att ta till rangordning av data och därmed överge användningen av parametriska tester. Deras argument var mer av ad hoc- karaktär och slutade med ett förslag om att använda standardparametriska procedurer istället för att engagera sig i problemet med robusthet. [10] [11]

Guttmann hävdade mer generellt att den statistiska tolkningen av data beror på vilken fråga som ställs till data och vilka bevis vi är villiga att acceptera som svar på den frågan. Han definierade detta bevis i termer av den förlustfunktion som valts för att testa modellens kvalitet. [12]

John Tukey kritiserade också Stevens begränsningar som farliga för bra statistisk analys. Precis som Lord och Guttman noterade Tukey vikten av betydelsen av data för att bestämma både skalan och det lämpliga analyssättet. Eftersom Stevens skaltyper är absoluta, i en situation där till exempel data inte kan betraktas som helt intervall, bör de nedgraderas till ordinal.

Till och med Stevens själv reserverade sig och anmärkte: "Faktum är att de flesta av de skalor som ofta och effektivt används av psykologer är ordningsskalor. Vanlig statistik, inklusive medel och standardavvikelser, bör inte strikt användas när man arbetar med dessa skalor, men en viss pragmatisk motivering kan ges till sådan obehörig användning: i många fall leder det till fruktbara resultat.

Duncan[ vad? ] (1986) motsatte sig användningen av ordet "mått" i beskrivningen av den nominella skalan, men Stevens (1975) gav då sin egen definition av "mätning", vilket låter som "att tillskriva en egenskap enligt någon regel. Den enda regel som inte kan användas för dessa ändamål är oavsiktlig tillskrivning. Den så kallade "nominella dimensionen" inkluderar dock forskarens värdebedömning, och de möjliga omvandlingarna av denna dimension är oändliga. Detta är en av de kommentarer Lord gjorde 1953 i den satiriska artikeln On the Statistical Treatment of Football Numbers [13]

Användningen av "medelvärde" som ett mått på central tendens för ordinaltyp är fortfarande kontroversiellt bland dem som accepterar Stevens typologi. Trots detta använder många beteendevetare medelvärdet för ordinaldata. Den vanliga motiveringen för detta är att ordinaltypen inom beteendevetenskapen ligger någonstans mellan den sanna ordinaltypen och intervalltypen. Även om avståndsskillnaden mellan två ordningssiffror inte är konstant, är den ofta av samma ordning.

Till exempel visar tillämpningen av mätmodeller i utbildningssammanhang att övergripande betyg har ett ganska linjärt samband med mätningar inom betygsintervallet. Således hävdar vissa att så länge skillnaden i avstånd mellan ordningssiffror inte är särskilt stor, kan statistiken för intervallskalor (t.ex. "medelvärde") ha ett meningsfullt resultat för ordningsskalor. Programvara för statistisk analys (t.ex. SPSS ) kräver att användaren specificerar lämplig mätklass för varje variabel. Detta säkerställer att oavsiktliga användarfel inte leder till meningslös analys (exempel: korrelationsanalys med en nominell variabel).

Thurstone[ vad? ] gjort framsteg med att utveckla en motivering för att härleda en intervalltyp baserad på lagen om jämförande bedömning . En vanlig tillämpning av lagen är hierarkins analytiska process . Geogr Rasch har gjort ytterligare framsteg genom att utveckla den probabilistiska Rasch-modellen , som ger den teoretiska grunden och logiken för att härleda intervallmätningar från observationsräkningar (t.ex. totalpoäng för betyg).

Trots all kritik, i ett brett spektrum av situationer, visar erfarenheten att tillämpningen av förbjuden statistik på data leder till vetenskapligt signifikanta resultat som är viktiga för beslutsfattande och värdefulla för vidare forskning.

Andra föreslagna typologier

Det finns andra typologier än Stevens. Till exempel: Mostller Mosteller och Tukey (1977), Nelder (1990) skapade beskrivningar av kontinuerlig räkning, kontinuerliga samband och kategoriska datamodeller. Se även: Chrisman (1998), van den Berg (1991).

Typologi av Mosteller och Tukey (1977)

Mostelleroch Tukey märkte att nivå 4 inte var tillräckligt och föreslog följande uppdelning: [14]

Namn
Värdebedömningar (t.ex. nybörjare, sophomore etc.)
Betyg begränsade till 0 och 1
Räknebara (positiva heltal)
Naturligt (positiva reella tal)
Balanserad (valfria reella tal)

Till exempel, procentsatser (en variant av bråk i termer av Mosteller-Tukey) passar inte Stevens teori, eftersom det inte finns några helt giltiga transformationer. [åtta]

Crisman's Typology (1998)

Nicholas Crisman har föreslagit en utökad dimensionsnivåsökning för att ta hänsyn till olika dimensioner som inte nödvändigtvis motsvarar de traditionella föreställningarna om dimensionsnivåer. Mätningar relaterade till räckvidd och upprepning (t.ex. radiella grader på en cirkel, timmar, etc.), graderade medlemskategorier och andra typer av mätningar stämmer inte överens med Stevens ursprungliga arbete, vilket resulterar i införandet av sex nya mätnivåer till de befintliga tio :

Betygsatt
Graduerat medlemskap
ordinarie
Intervall
Intervalllogaritmisk
Omfattande relation
Cyklisk relation
Härledd relation
Räkning
Absolut

Utökade mätnivåer används sällan utanför akademisk geografi. [femton]

Skaltyper och Stevens "operational theory of measurement"

Skaltypsteori är en sorts "intellektuell tjänare" till Stevens operationella teori om mätning, som har blivit definitiv inom psykologi och beteendevetenskap , trots Michells kritik för att vara oförenlig med mätningar inom naturvetenskap (Michell, 1999). Faktum är att Operational Measurement Theory var en reaktion på resultaten av en kommitté som inrättades av British Association for the Advancement of Science 1932 för att undersöka möjligheten till äkta vetenskaplig mätning inom psykologiska och beteendevetenskapliga vetenskaper. Denna kommitté, som blev känd som "Ferguson-kommittén", publicerade en slutrapport (Ferguson, et al., 1940, s. 245) där Stevens sömnskala (Stevens & Davis, 1938) var föremål för kritik.

… varje lag som är avsedd att uttrycka ett kvantitativt förhållande mellan intensiteten hos en sensation och intensiteten hos en stimulans är inte bara falsk, utan faktiskt meningslös tills begreppet addition som tillämpas på sensation får mening.

Så om Stevens drömskalan mäter intensiteten av en publiks sensationer, måste bevis tas fram för att dessa sensationer är kvantitativa attribut. Det nödvändiga beviset var närvaron av "tillsatsstrukturer" - ett koncept utvecklat av den tyske matematikern Otto Holder (Hölder, 1901). Med fysikern och mätteoretikern Norman Robert Campbell som dominerade diskussionen i Ferguson-kommittén, slogs det fast att mätningar inom samhällsvetenskapen var omöjliga på grund av frånvaron av sammankopplingsoperationen . Därefter erkändes detta beslut som felaktigt efter utvecklingen av teorin om gemensamma mätningar av Debru, såväl som oberoende av Luce och Tukey. Stevens ville dock inte införa ytterligare experiment för att upptäcka additivstrukturer, utan ogiltigförklara Fergusonkommitténs beslut helt och hållet genom att föreslå en ny mätteori.

För att parafrasera N.R. Campbell (Slutrapport, s.340), kan man säga att mätning, i vid bemärkelse, definieras som tilldelning av nummer till objekt och händelser enligt någon regel (Stevens, 1946, s.677).

Stevens var starkt influerad av idéerna från en annan Nobelprisbelönt Harvard-akademiker, fysikern Percy Bridgman (1927), vars "operationism"-doktrin Stevens använde för att definiera termen "mätning". Till exempel använder Stevens definition ett måttband som definierar längd (mätobjekt) som mätbar (därav kvantifierbar). Kritiker av operationalism motsätter sig att den blandar ihop relationer mellan två objekt eller händelser för egenskaper hos ett av objekten eller händelserna (Hardcastle, 1995; Michell, 1999; Moyer, 1981a, b; Rogers, 1989).

Den kanadensiske mätteoretikern William Rozeboom (1966) var en av de första kritikerna som uttalade sig starkt mot Stevens teori om skaltyper.

Variabeltyp beror på sammanhanget

Ett annat problem kan vara att samma variabel kan ha olika typer av skalor beroende på hur den mäts och syftet med analysen. Till exempel anses hårfärg vanligtvis vara en nominell variabel eftersom den inte har en specifik ordning. [16] Det är dock möjligt att ordna färger i en viss ordning på flera sätt, inklusive efter nyans, med hjälp av kolorimetri .

Använd i psykometri

Med hjälp av olika skalor är det möjligt att ta fram olika psykologiska mätningar [17] . De allra första metoderna för psykologiska mätningar utvecklades inom psykofysiken . Psykofysikers huvuduppgift var hur man avgör hur de fysiska parametrarna för stimulering korrelerar med de subjektiva bedömningarna av förnimmelser som motsvarar dem. Genom att känna till detta samband kan man förstå vilken känsla som motsvarar ett eller annat tecken. Den psykofysiska funktionen etablerar ett förhållande mellan det numeriska värdet av skalan för det fysiska mätandet av stimulansen och det numeriska värdet av det psykologiska eller subjektiva svaret på denna stimulans.

Några vanliga skalor

Temperaturskalor för olika länder och tider (Celsius, Fahrenheit, Kelvin, etc.)
Richterskalan
Beaufort vindhastighetsskala
Mohs-skala - en skala för mineralers hårdhet
Färgpalett , Färgatlas

Se även

Anteckningar

↑ Zhuravlev Yu. I. , Ryazanov V. V., Senko O. V. "Recognition". Matematiska metoder. Mjukvarusystem. Praktiska tillämpningar. - M .: Fazis, 2006. - ISBN 5-7036-0108-8 .
↑ 1 2 Anfilatov V. S., Emelyanov A. A., Kukushkin A. A. Systemanalys i förvaltning. - M. : Finans och statistik, 2002. - 368 sid.
↑ Ekonomi och företagsledning - höga statistiska teknologier .
↑ Statistiska metoder - höga statistiska teknologier .
↑ Peregudov F.I. , Tarasevich F.P. Introduktion till systemanalys. - M . : Högre skola, 1989. - 367 sid.
↑ 1 2 Bakhrushin V. E. Dataanalysmetoder. - Zaporizhzhya, KPU, 2011.
↑ Ilyasov F. N. Skalor och specifikationer för sociologisk mätning // Övervakning av den allmänna opinionen: ekonomiska och sociala förändringar. 2014. Nr 1. S. 3-16.
↑ 1 2 Velleman, Paul F.; Wilkinson, Leland. Typologier för nominell, ordinal, intervall och förhållande är missvisande // The American Statistician : journal. - American Statistical Association, 1993. - Vol. 47 . - S. 65-72 . - doi : 10.2307/2684788 . — .
↑ Skalning: en källbok för beteendevetare (engelska) / Gary Maranell (red.). — Aldine Transaction, [2007]. — ISBN 9780202361758 .
↑ Bela O. Baker, Curtis D. Hardyck, Lewis F. Petrinovich. Svaga mått vs. Strong Statistics: An Empirical Critique of SS Stevens' Proscriptions nn Statistics // Educational and Psychological Measurement. — 1966-07-01. — Vol. 26 , iss. 2 . - S. 291-309 . — ISSN 0013-1644 . - doi : 10.1177/001316446602600204 .
↑ Edgar F. Borgatta, George W. Bohrnstedt. Mätnivå: En gång om igen // Sociologiska metoder & forskning. — 1980-11-01. — Vol. 9 , iss. 2 . - S. 147-160 . — ISSN 0049-1241 . - doi : 10.1177/004912418000900202 .
↑ Louis Guttman. What is Not What in Statistics (engelska) // Journal of the Royal Statistical Society. Serie D (Statistikern). - 1977. - Vol. 26 , iss. 2 . - S. 81-107 . - doi : 10.2307/2987957 .
↑ Lord, Frederic M. Om den statistiska behandlingen av fotbollssiffror // Amerikansk psykolog : tidskrift . - 1953. - December ( vol. 8 ). - s. 750-751 . doi : 10.1037 / h0063675 .
↑ Mosteller, Frederick. Dataanalys och regression: en andra kurs i statistik . — Uppläsning, mässa: Addison-Wesley Pub. Co, 1977. - ISBN 978-0201048544 .
↑ Wolman, Abel G. Mätning och meningsfullhet i bevarandevetenskap (engelska) // Conservation biology : journal. – 2006.
↑ Vad är skillnaden mellan kategoriska, ordinal- och intervallvariabler? . Institutet för digital forskning och utbildning . University of California, Los Angeles. Hämtad: 7 februari 2016. (obestämd)
↑ Suppes P. , Zinnes D. Fundamentals of theory of measurements // Psychological measurements. M.: 1967. S. 9-110.

Litteratur

Gusev A. N., Izmailov C. A., Mikhalevskaya M. B. Mätningar i psykologi. Allmän psykologisk praktik . Serien "Practicum". Nummer 2. - M . : Mening, 1987, - 280 sid.
Kliger S. L., Kosolapov M. S., Tolstova Yu. N. Skalning i insamling och analys av sociologisk information . - M . : Vetenskap. 1978. - 107 sid.