Faktoranalys är en multivariat metod som används för att studera sambanden mellan variablernas värden. De kända variablerna antas bero på färre okända variabler och slumpmässiga fel.
Faktoranalys dök först upp i psykometri och används för närvarande flitigt inte bara inom psykologi , utan också inom neurofysiologi , sociologi , statsvetenskap , ekonomi , statistik och andra vetenskaper. Huvudidéerna för faktoranalys fastställdes av den engelske psykologen och antropologen , grundaren av eugeniken , Galton , som också gjorde ett stort bidrag till studiet av individuella skillnader. Spearman (1904, 1927, 1946), Thurstone (1935, 1947, 1951), Cattell (1946, 1947, 1951), Pearson , Eysenck bidrog också till utvecklingen av faktoranalys . Den matematiska apparaten för faktoranalys utvecklades av Hotelling , Harman, Kaiser, Thurstone, Tucker. Under andra hälften av 1900-talet ingick faktoranalys i alla större statistiska databehandlingspaket, inklusive R , SAS , SPSS , Statistica , Stata .
Faktoranalys gör det möjligt att lösa två viktiga problem för forskaren: att beskriva mätobjektet heltäckande och samtidigt kompakt. Med hjälp av faktoranalys är det möjligt att identifiera dolda variabelfaktorer som är ansvariga för förekomsten av linjära statistiska korrelationer mellan de observerade variablerna.
De två huvudmålen med faktoranalys är:
I analysen kombineras variabler som är starkt korrelerade med varandra till en faktor, som ett resultat av att variansen omfördelas mellan komponenterna och den enklaste och tydligaste strukturen av faktorer erhålls. Efter kombinering kommer korrelationen av komponenterna inom varje faktor med varandra att vara högre än deras korrelation med komponenter från andra faktorer. Denna procedur låter dig också markera latenta variabler , vilket är särskilt viktigt när du analyserar sociala uppfattningar och värderingar. Till exempel, när man analyserar poäng erhållna på flera skalor märker forskaren att de liknar varandra och har en hög korrelationskoefficient, han kan anta att det finns någon latent variabel som kan förklara den observerade likheten mellan de erhållna poängen. Denna latenta variabel kallas en faktor. Denna faktor påverkar många indikatorer på andra variabler, vilket leder oss till möjligheten och nödvändigheten att peka ut den som den mest allmänna, högre ordningen. För att identifiera de viktigaste faktorerna och, som ett resultat, faktorstrukturen, är det mest motiverat att använda metoden för huvudkomponenter (PCA). Kärnan i denna metod är att ersätta korrelerade komponenter med okorrelerade faktorer. En annan viktig egenskap hos metoden är förmågan att begränsa de mest informativa huvudkomponenterna och utesluta resten från analysen, vilket förenklar tolkningen av resultaten. Fördelen med PCA är också att det är den enda matematiskt underbyggda metoden för faktoranalys [1] [3] . Enligt ett antal forskare är PCA inte en metod för faktoranalys, eftersom den inte delar upp variansen av indikatorer i gemensamma och unika [4] än variabler som tillhör olika grupperingar.
Faktoranalys kan vara:
Det praktiska genomförandet av faktoranalys börjar med att kontrollera dess förutsättningar. Förutsättningarna för faktoranalys inkluderar:
Två grundläggande begrepp för faktoranalys: faktor - en latent variabel och belastning - korrelationen mellan den ursprungliga variabeln och faktorn. Huvudkravet för faktorer är kontrollerbarhet. Kontrollerbarhet förstås som fastställandet av det önskade värdet av faktorn och att bibehålla det under hela experimentet. Detta är det speciella med det aktiva experimentet. Faktorer kan vara kvantitativa och kvalitativa . Exempel på kvantitativa faktorer är temperatur, koncentration etc. Deras nivåer motsvarar en numerisk skala. Olika katalysatorer, apparatkonstruktioner, behandlingar, undervisningsmetoder är exempel på kvalitativa faktorer. Nivåerna av sådana faktorer motsvarar inte den numeriska skalan, och deras ordning spelar ingen roll. Utdatavariabler är reaktioner (svar) på påverkan av indatavariabler. Svaret beror på studiens särdrag och kan vara ekonomisk (vinst, lönsamhet), teknologisk (avkastning, tillförlitlighet), psykologisk, statistisk, etc. Optimeringsparametern måste vara effektiv när det gäller att uppnå målet , universell, kvantitativ, uttryckt med ett tal som har fysisk betydelse, vara enkel och lätt att beräkna. Utöver kravet på kontrollerbarheten av de valda faktorerna, finns det flera ytterligare krav: för vilket par av faktorer som helst måste kompatibilitetsvillkoret vara uppfyllt ; faktorer måste vara oberoende och entydiga; faktorer bör direkt påverka optimeringsparametern; faktorer måste bestämmas operativt; noggrannheten för att fastställa gränsvärdena för faktorerna är så hög som möjligt.
Den grafiskt-analytiska metoden för att bestämma betydelsen av faktorer gör det möjligt att genomföra ett screeningförsök med ett minimum av experiment. Det tillåter, endast baserat på experimentella data, att bestämma inte bara graden av påverkan av faktorer på den resulterande funktionen, utan också att dra preliminära slutsatser om hur faktorer påverkar (i riktning mot att öka eller minska den resulterande funktionen).
I den första typen av rotation bestäms varje efterföljande faktor på ett sådant sätt att den återstående variabiliteten från de föregående maximeras, så att faktorerna visar sig vara oberoende, okorrelerade från varandra (PCA tillhör denna typ). Den andra typen är en transformation där faktorerna korrelerar med varandra. Fördelen med snedrotation är att när ortogonala faktorer erhålls som ett resultat av det, kan man vara säker på att denna ortogonalitet verkligen är inneboende i dem, och inte artificiellt införd. Det finns cirka 13 rotationsmetoder i båda lägena, fem finns tillgängliga i statistikprogrammet SPSS 10: tre ortogonala, en snett och en kombinerad, men av alla är den ortogonala metoden " varimax " den vanligaste. Varimax-metoden maximerar spridningen av kvadratlaster för varje faktor, vilket leder till en ökning av stora och en minskning av små värden av faktorbelastningar. Som ett resultat erhålls en enkel struktur för varje faktor separat [1] [3] [2] .
Huvudproblemet med faktoranalys är valet och tolkningen av huvudfaktorerna. Vid val av komponenter stöter forskaren vanligtvis på betydande svårigheter, eftersom det inte finns något entydigt kriterium för att välja faktorer, och därför är subjektiv tolkning av resultaten oundviklig här. Det finns flera ofta använda kriterier för att bestämma antalet faktorer. Vissa av dem är alternativ till andra, och några av dessa kriterier kan användas tillsammans så att det ena kompletterar det andra:
Övning visar att om rotationen inte producerade betydande förändringar i strukturen av faktorutrymmet, indikerar detta dess stabilitet och stabiliteten hos datan. Ytterligare två alternativ är möjliga:
Det senare är möjligt, till exempel när flera sociala grupper kontrolleras för förekomsten av en viss egendom, men endast en av dem har den önskade egenskapen.
Faktorer har två egenskaper: mängden förklarad varians och belastningen. Om vi betraktar dem ur geometrisk analogisynpunkt, så noterar vi när det gäller den första att faktorn som ligger längs OX-axeln kan förklara så mycket som 70% av variansen (den första huvudfaktorn), faktorn som ligger längs OY-axeln kan inte bestämma mer än 30 % (den andra huvudfaktorn). Det vill säga, i en ideal situation kan hela variansen förklaras av två huvudfaktorer med de angivna andelarna [5] . I en typisk situation kan det finnas två eller flera huvudfaktorer, och det finns också en del av den otolkbara variansen (geometrisk distorsion) som utesluts från analysen på grund av obetydlighet. Laster, återigen ur geometrins synvinkel, är projektioner från punkter på OX- och OY-axlarna (med en tre- eller fler faktoriell struktur, även på OZ-axeln). Projektioner är korrelationskoefficienter, punkter är observationer, så faktorbelastningar är mått på association. Eftersom en korrelation med Pearsons koefficient R ≥ 0,7 anses vara stark bör endast starka samband uppmärksammas i laster. Faktorladdningar kan ha egenskapen bipolaritet - närvaron av positiva och negativa indikatorer i en faktor. Om bipolaritet är närvarande är indikatorerna som utgör faktorn dikotoma och ligger i motsatta koordinater [1] .
Ordböcker och uppslagsverk | |
---|---|
I bibliografiska kataloger |
|
Maskininlärning och datautvinning | |
---|---|
Uppgifter | |
Att lära sig med en lärare | |
klusteranalys | |
Dimensionalitetsreduktion | |
Strukturell prognos | |
Anomali upptäckt | |
Grafisk probabilistiska modeller | |
Neurala nätverk | |
Förstärkningsinlärning |
|
Teori | |
Tidskrifter och konferenser |
|