Lärande utan lärare

Den aktuella versionen av sidan har ännu inte granskats av erfarna bidragsgivare och kan skilja sig väsentligt från versionen som granskades den 11 juli 2021; kontroller kräver 3 redigeringar .

Oövervakat lärande (självlärande, spontant lärande, engelska  Oövervakat lärande ) är en av metoderna för maskininlärning , där systemet som testas spontant lär sig att utföra uppgiften utan ingripande från försöksledaren. Ur cybernetikens synvinkel är detta en av typerna av cybernetiska experiment . Som regel är detta endast lämpligt för uppgifter där beskrivningar av en uppsättning objekt (träningsprov) är kända, och det krävs för att upptäcka interna relationer, beroenden och mönster som finns mellan objekt.

Oövervakat lärande kontrasteras ofta med övervakat lärande , när ett "rätt svar" tvingas fram för varje inlärningsobjekt, och det krävs för att hitta ett samband mellan stimuli och systemsvar.

Samband med fysiologi

Trots många tillämpade framsteg har övervakat lärande kritiserats för sin biologiska osannolikhet. Det är svårt att föreställa sig en inlärningsmekanism i hjärnan som jämför önskade och faktiska utdatavärden, korrigering med feedback. Om vi ​​tillåter en sådan mekanism i hjärnan, var kommer då de önskade uteffekterna ifrån? Oövervakat lärande är en mycket mer rimlig modell för lärande i ett biologiskt system. Utvecklad av Kohonen och många andra, behöver den ingen målvektor för utdata och kräver därför inte jämförelse med fördefinierade idealsvar [1] .

Begreppet "lära utan lärare" i teorin om mönsterigenkänning

För att bygga en teori och komma bort från det cybernetiska experimentet i olika teorier, försöker man formalisera experimentet med oövervakat lärande matematiskt. Det finns många olika underarter av inställning och definition av denna formalisering, varav en återspeglas i teorin om mönsterigenkänning .

En sådan avvikelse från experiment och konstruktionen av en teori är förknippad med olika åsikter från specialister i deras åsikter. Skillnader uppstår i synnerhet när man svarar på frågan: "Är det möjligt att ha enhetliga principer för en adekvat beskrivning av bilder av olika karaktär, eller är en sådan beskrivning varje gång en uppgift för specialister på specifik kunskap?".

I det första fallet bör formuleringen syfta till att identifiera de allmänna principerna för att använda a priori-information för att sammanställa en adekvat beskrivning av bilder. Det är viktigt att här a priori information om bilder av olika karaktär är olika, men principen för deras redovisning är densamma. I det andra fallet tas problemet med att erhålla en beskrivning utanför ramen för det allmänna uttalandet, och teorin om att lära sig maskiner för att känna igen bilder utifrån den statistiska teorin om att lära sig känna igen bilder kan reduceras till problem med att minimera den genomsnittliga risken i en speciell klass av beslutsregler [2] .

I teorin om mönsterigenkänning finns det huvudsakligen tre tillvägagångssätt för detta problem [3] :

Indatatyper

Uppgifter som ska lösas

Ett experimentellt oövervakat inlärningsschema används ofta i mönsterigenkänningsteori , maskininlärning . Samtidigt, beroende på tillvägagångssätt, formaliseras det till ett eller annat matematiskt begrepp. Och bara i teorin om artificiella neurala nätverk löses problemet experimentellt med hjälp av en eller annan typ av neurala nätverk. I det här fallet kan den resulterande modellen som regel inte ha en tolkning, vilket ibland kallas nackdelarna med neurala nätverk. Men ändå är resultaten inte sämre, och om så önskas kan de tolkas med speciella metoder.

Clusterproblem

Ett oövervakat inlärningsexperiment för att lösa ett problem med mönsterigenkänning kan formuleras som ett klusteranalysproblem . Provet av objekt är uppdelat i icke-överlappande delmängder, kallade kluster , så att varje kluster består av liknande objekt, och objekten i olika kluster skiljer sig markant. Den initiala informationen presenteras i form av en avståndsmatris.

Lösningsmetoder

Clustering kan spela en hjälproll för att lösa klassificerings- och regressionsproblem. För att göra detta måste du först dela upp provet i kluster och sedan tillämpa någon mycket enkel metod på varje kluster, till exempel approximera målberoendet med en konstant.

Lösningsmetoder

Generaliseringsproblem

Precis som i fallet med diskrimineringsexperiment , som matematiskt kan formuleras som klustring , kan man vid generalisering av begrepp undersöka spontan generalisering , där likhetskriterier inte introduceras utifrån eller inte påtvingas av försöksledaren.

Samtidigt, i ett "ren generaliserings"-experiment, krävs en modell av hjärnan eller perceptronen för att gå från ett selektivt svar på ett stimulus (till exempel en fyrkant på vänster sida av näthinnan) till en liknande stimulus som inte aktiverar någon av samma sensoriska ändar (fyrkant på höger sida av näthinnan). En generalisering av ett svagare slag innefattar till exempel kravet på att systemets svar utvidgas till element i en klass av liknande stimuli som inte nödvändigtvis är separerade från den tidigare visade (eller hörda, eller uppfattade genom beröring) stimulans.

Uppgifter för att upptäcka avvikelser

Oövervakade inlärningsmetoder är vanliga för att lösa anomalidetekteringsproblem, det vill säga de datasektioner där objektets beteende skiljer sig väsentligt från det typiska (förväntade) beteendet. [fyra]

Problem med att hitta föreningsregler

Den initiala informationen presenteras i form av vägledande beskrivningar. Uppgiften är att hitta sådana uppsättningar av funktioner, och sådana värden av dessa funktioner, som särskilt ofta (inte av en slump ofta) finns i funktionsbeskrivningar av objekt.

Dimensionsreduceringsproblem

Den initiala informationen presenteras i form av funktionsbeskrivningar, och antalet funktioner kan vara ganska stort. Utmaningen är att representera dessa data i ett utrymme med mindre dimensioner, vilket minimerar förlusten av information så mycket som möjligt.

Lösningsmetoder

Datavisualiseringsuppgifter

Vissa metoder för klustring och dimensionalitetsreduktion konstruerar provrepresentationer i ett tvådimensionellt utrymme. Detta gör att du kan visa flerdimensionell data i form av platta grafer och analysera dem visuellt, vilket bidrar till en bättre förståelse av data och själva kärnan i det problem som ska lösas.

Lösningsmetoder

Vissa applikationer

Se även

Anteckningar

  1. Wasserman, F. Neurodatorteknologi: Teori och praktik. — M.: Mir, 1992
  2. Vapnik V. N., Chervonenkis A. Ya., Theory of Pattern Recognition. Statistical Problems of Learning, 1974
  3. Tu J., Gonzalez R. Principles of Pattern Recognition, M. 1978
  4. Chandola, V. Anomali upptäckt: En undersökning  // ACM computing surveys (CSUR). - 2009. - T. 41 , nr 3 . - S. 1-58 . Arkiverad från originalet den 28 juni 2020.

Litteratur

Länkar