EZ Reader (från engelska "Easy Reader", "Reading easy") är den mest populära modellen för naturlig läsning av en text av en person med en genomsnittlig hastighet för hela ord inom kognitiv psykologi .
Även om denna modell har en hel uppsättning konkurrerande teorier som liknar konceptet, såsom SWIFT, förklarar EZ Reader de experimentellt observerade fakta på det mest kompletta sättet. Bland dem, att hoppa över 30 % eller mer av ord när man läser med ett ballistiskt hopp av ögonglobssackader , preliminär analys av nästa ord i en suddig bild i den parafoveala regionen, möjligheten att läsa ord för ord på grund av preliminär stavningsanalys , och många andra effekter i den komplexa processen av mänsklig läsning. [1] [2] [3] [4]
EZ Reader-modellen har en datorimplementation och är i det här fallet en sorts artificiell intelligens . En experimentell jämförelse av beteendet hos artificiell intelligens implementerad genom EZ Reader med mänskligt beteende gör det möjligt för kognitiva psykologer att få en djupare förståelse av mänskliga läsprocesser. Modellen används i synnerhet för att studera dyslexi och fastställa dess orsaker som en del av stadierna av textbearbetning i EZ Reader. [5] En av de viktigaste upptäckterna som gjorts genom användningen av EZ Reader är att neurala nätverk för lexikalanalys (se L1 och L2 nedan) har ett logaritmiskt beroende av svarstiden på ordens frekvens och om denna tid är längre än maximalt, vilket gör det möjligt att koordinera neurala nätverk som arbetar parallellt vid läsning, då blir det en "kollaps" av snabb läsning enligt en persons ord och en återgång till läsning genom högre nervös aktivitet , det vill säga läsning med stavelser. Denna upptäckt användes i amerikanska federala grundskoleprogram, som introducerade eleverna att memorera stavningen av de 300 vanligaste orden (100 i första klass 1 och ytterligare 200 i andra klass 2). Vetskapen om att L1 inte använder stavelse-för- stavelse -analys , utan använder en ortografisk modell för att analysera vanligtvis i termer av morfem , har lett till att USA:s grundskoleundervisning i stavelseläsning har övergetts till förmån för läsning i hela morfem ( rötter , prefix , suffix ). [6] Baserat på EZ Reader-modellen utvecklades listor med frekvensord för undervisning av skolbarn [7] . EZ Reader-modellen och dess motsvarigheter, såsom SWIFT, motbevisade teorier om att helordsläsning av en frisk person består av en sekventiell analys av bokstäver: i själva verket borde alla bokstäver som hamnar i den gula fläcken dechiffreras parallellt. Brott mot denna normala drift av neurala nätverk tillät oss att formulera namnet på en ny typ av dyslexi - Ytdyslexi .
Modeller som EZ Reader och dess motsvarigheter (SWIFT) har gjort det klart att ögonglobens rörelse, och särskilt extra rörelse för att korrigera läsfel (regression), är den mest kritiska faktorn som begränsar läshastigheten. Dessa data har använts för att utveckla populära lästekniker med fast ögonglobshastighet, såsom Oxford University Spritz-tekniken . [åtta]
Modellen består av en uppsättning "moduler", som i praktiken är grupper av neurala nätverk . Ett tomogram av hjärnan med en analys av saccades, i vilket stadium av läsningen hjärnan befinner sig, visar att även om vanligtvis en "modul" är fysiologiskt identisk med en del av hjärnan, måste i många fall flera delar av hjärnan samarbeta för att slutföra läsningen. Ett hjärntomogram gör det dock möjligt att förstå att EZ Reader och dess analoger inte är en psykologisk abstraktion, utan bevisligen har en fysiologisk förkroppsligande i hjärnan. Modellens moduler motsvarar egentligen specifika neurala nätverk, som naturligtvis kan ordnas något annorlunda i hjärnan, men typerna av nätverk från modellen existerar verkligen och identifieras med MRT . [9]
EZ Reader-modellen implementeras av följande uppsättning neurala nätverk: [9] [10] :
Modulerna utför följande funktioner.
V (visuell) är ett neuralt nätverk för optisk textigenkänning som läser text som en uppsättning streck. Typiskt läses bokstäver inte helt av en person vid normal läshastighet, och ibland är de inte tydligt synliga när man analyserar text i ögats parafoveala region. V-nätverket av neuroner , i samordning med de neurala nätverken i de kommande stadierna, tillåter en normal person att läsa texten, även om halva bokstävernas höjd är maskerad horisontellt.
Både datorexperiment och naturliga experiment med en person bevisar att när man läser med hela ord finns det ingen konsekvent analys av bokstäver. Alla bokstäver som faller in i den gula fläckens zon dechiffreras parallellt. Som regel är det hos en vuxen 6-7 bokstäver, och i ett 5-7-årigt barn är det 3-4 bokstäver. Omkring 7 bokstäver till känner V-nätverket väldigt ungefär med ett stort antal fel genom att se en suddig bild av dessa bokstäver i det parafoveala området runt gula fläcken och överför dessa felaktiga data till L1 neurala nätverk, som, om det kan känna igen ett högfrekvent ord bakom den suddiga bilden av bokstäver ger kommandot att hoppa över att läsa det. De allmänna suddiga konturerna av texten överförs av perifert seende till M1 neurala nätverk för allmän planering av läsning av sidan. [elva]
M1 (Movement 1) är ett neuralt nätverk för att utveckla en sidläsningsplan med utveckling av en algoritm från en serie sackader. Använder en suddig bild av hela sidan från ögonglobens perifera område, som inte kan skilja bokstäver i ord, men om texten är välformad med stora rubriker, olika typsnitt, illustrationer, tabeller, sedan M1, baserat på dessa data , avslöjar vad man ska läsa på sidan, och ger den mest utvecklade snabbläsningen utan att tappa innebörden av texten som läses – översiktlig eller ytlig. M1 utför också ögonblick på det aktuella ordet och tar emot direkta kommandon från ordförstavningsmodulen L1; inklusive den viktigaste egenskapen hos M1 är förmågan att avbryta den algoritm som redan utvecklats av M1 för att läsa nästa ord, om läsning av det nuvarande ordet i L1 visade att textens betydelse kräver ändringar i lässkriptet. Detta är för det första ett sackadhopp genom ett ord som, enligt L1, redan är uppenbart och inte behöver riktas till ögats "gula fläck" för dess tydliga läsning.
M2 (Movement 2) - i EZ Reader-modellen är steget för programmering av ögonglobssackaden markerat separat, vilket observeras experimentellt och består av det faktum att L1-modulen i steg M2 inte längre kan ge ett kommando för att avbryta sin rörelse . Vanligtvis instruerar M2 redan ögonmusklerna att börja röra sig och kan inte stoppa denna process i mitten, så även om ögongloben är missriktad kommer att flytta den till rätt position säkerställs som bearbetning av ett läsfel (regression med en reciprok saccade) ).
L1 (lexikon 1) - EZ Reader-modellen tar hänsyn till det extremt viktiga experimentella faktum att ordanalys består av två separata steg: ordförutvärdering (L1) och ordextraktion från ordboken (L2). Om ögat vet nästa ord, instruerar L1 M1 att hoppa över sackaden. Av denna anledning kallades de första modellerna av EZ Reader L1 för "bekanthetskontrollen". Efterföljande studier har visat att L1 har en inbyggd preliminär lexikal analys, som består i stavningstolkning av ett ord. L1 själv lagrar inte en ordbok med ord, med undantag för en ordbok med 200-300 vanligaste ord och, viktigast av allt, en stavningsordbok med typiska bokstavskombinationer som redan kan dechiffreras som grupper av korrekt uttalade fonem . För många människor bildas inte själva ordets ljudbild i L1, och då kommer en ordbokssökning i L2 att göras på ett lexikalt sätt.
Det är viktigt att förstå att L1 har en djup optimering för saccadeplanering. Kommandot att ballistiskt hoppa till nästa ord kommer att ges även om ordet inte är färdigt, men L1 heuristik anser att L2 kan dechiffrera ordet endast genom sin del. Den andra optimeringen är "parafoveal preview". Efter att ha avslutat faserna L1 och L2, startar hjärnan, utan att röra ögongloben, L1 igen för suddig text som är synlig i det parafoveala området runt den "gula fläcken". Om L1 gissar att ordet är igenkännbart, främst högfrekvent (till exempel prepositioner ), kommer L1 att ge ett kommando till M1 inte bara att inte rikta ögat till att avsluta läsningen av det aktuella ordet, utan också att hoppa över nästa.
Frågan om vad L1 gör om ordet är dåligt känt är diskutabel. Det kan vara både kommandon i M1 för att läsa om (regression) [5] , och ett meddelande i L2 att kvaliteten på stavningsigenkänningen visade sig vara låg och bredare kohorter borde bildas och försöka gissa ordet på ett semantiskt sätt. Återgången av läsning från det undermedvetna till medvetandet med okända ord kommer att ske ytterligare i neurala nätverk I och A.
Studier av dyslektiker visar att inom ramen för EZ Reader-modellen, i de flesta fall, är den vanligaste fonemiska dyslexi (80 % av fallen av dyslexi) förknippad med ett fel i L1 neurala nätverk. [5] Dessutom kan många sådana dyslektiker botas, eftersom före användningen av modeller som EZ Reader, fanns det inga bevis för "medfödd läskunnighet", och ännu mer så fanns det inget förslag på dess samband med dyslexi. L1 neurala nätverk hos dyslektiker kan tränas att läsa stavningen av ord och bilda den korrekta ljudbilden av ett ord genom flera serier av frekvensord med hjälp av speciella flashcards.
L2 (lexikon 2) - i EZ Reader-modellen innebär detta steg att söka efter ett ord i en ordbok i hjärnan (lexikonåtkomst). För sökningen används resultaten av ortografisk avkodning från steg L1. Samtidigt läser L1 inte ordet helt på grund av ögonglobens begränsningar och storleken på dess tydliga syn bara i den "gula fläcken", utan analyserar endast de första 6-7 bokstäverna. L2 neurala nätverk, med hjälp av kohortmetoden att söka i ordboken med de första bokstäverna, väljer kandidatord som passar dem. Detta är den så kallade "kohorten av ord", det vill säga en "grupp av ord" i analogi med huvudbetydelsen av ordet " kohort ". Vidare kasseras extra ord från kohorten av L2 på grund av arbetet med den semantiska analysen av ord och heuristik med antaganden, det vill säga L2 "gissar" ordets betydelse från det allmänna sammanhanget och mycket ofta "uppfinner" ändelserna av ord från lässpråkets grammatik, eftersom det för långa ord finns en "gul fläck" kan inte se hur ordet slutar, och en extra sackad för att läsa klart ordet omedelbart minskar läshastigheten med 2-3 gånger.
Det kan diskuteras bland forskare om den konnektivistiska metoden att extrahera ord från ordboken används i steg L2. Connectivistiska neurala nätverksmodeller är en utveckling av en förenklad "analys genom syntes"-modell som förkastats av forskare, som är grunden för att förklara läsning med bokstavsfonem och stavelser. Mest troligt, när man läser hela ord på undermedveten nivå, används inte konnektivistiska neurala nätverk, eftersom för att de ska fungera måste de tydligt identifiera inte bara den första utan också den betonade stavelsen. Med långa ord ligger den betonade stavelsen med sina bokstäver utanför synvinkeln för den "gula fläcken", och en extra sackad för en sådan stavelse är vanligtvis inte fast. L2 bygger med andra ord främst på analysen från de första bokstäverna i betraktningsvinkeln, det vill säga på kohortmetoden. Av denna anledning använder de flesta implementeringar av EZ Reader och dess motsvarigheter såsom SWIFT endast kohortmodellen för ordigenkänning. [12]
Eftersom modulerna V och L2 gör mycket heuristik med antaganden om vilka bokstäver som finns i texten från bara en del av deras streck, och även härleder ord från deras delar, är fel i dechiffreringen av texten möjliga. Cirka 4% av orden är fellästa. Fel upptäcks av neuralt nätverk I, som utför ytterligare semantisk analys och, om ett fel är uppenbart, börjar läsa ordet, upprepade gånger utfärda kommandon till M1 och L1 för att återställa ögongloben och läsa igen (regression). I-nätverket klargör också den semantiska betydelsen av ett ord i ett allmänt sammanhang, eftersom det kan lägga till flera ord till varandra och få betydelsen av fraser som ett resultat. I-nätverket utfärdar sedan kommandon till A-modulen för uppmärksamhetskontroll.
A (Attention) är ett neuralt nätverk för att kontrollera fokus på uppmärksamhet vid läsning. Styrs vanligtvis av kommandon från I-modulen baserat på semantisk analysdata. Vi använder även data om textgranskning av perifert syn från M1.
Om det enligt I-nätverket är ett fullständigt misslyckande med att förstå textens semantik (betydelse) så kan A-nätverket sluta läsa med ord på undermedveten nivå och återgå läsningen till medvetenhetsnivån. Men som regel, med en sådan återkomst, finns det redan en ljudbild av ordet som erhålls från L1 genom att tillämpa standardstavningsreglerna. Det bör noteras att en sådan återgång kanske inte inträffar när en person har (eller bildas av en aggressiv fonemisk inlärningsmetod genom " fonemisk hörsel ") semantisk dyslexi, det vill säga I-nätverket ignorerar att ord inte känns igen av betydelse, och A-nätverket accepterar att det faktum att bokstäver läses som ljud utan att förstå texten. En semantisk dyslektiker med I- och A-nätverksstörningar läser text ungefär som en musiker läser noter, det vill säga han kan snabbt läsa texten högt utan att förstå vad han läser alls, och kan inte återberätta innebörden av läsningen text.