Klassificeringsproblem

Den aktuella versionen av sidan har ännu inte granskats av erfarna bidragsgivare och kan skilja sig väsentligt från versionen som granskades den 14 augusti 2019; kontroller kräver 6 redigeringar .

Klassificeringsuppgiften  är en uppgift där det finns många objekt ( situationer ) indelade på något sätt i klasser . En ändlig uppsättning objekt ges för vilka det är känt vilka klasser de tillhör. Denna uppsättning kallas ett prov . Klasstillhörigheten för resten av objekten är okänd. Det krävs att man konstruerar en algoritm som kan klassificera (se nedan) ett godtyckligt objekt från den initiala uppsättningen .

Att klassificera ett objekt innebär att ange numret (eller namnet) på den klass som det givna objektet tillhör.

Objektklassificering - klassens nummer eller namn, utfärdat av klassificeringsalgoritmen som ett resultat av dess tillämpning på detta specifika objekt.

I matematisk statistik kallas klassificeringsproblem även för diskriminantanalysproblem . Inom maskininlärning löses klassificeringsproblemet, särskilt genom att använda metoderna för artificiella neurala nätverk när man sätter upp ett experiment i form av träning med en lärare .

Det finns också andra sätt att sätta upp ett experiment - oövervakat lärande , men de används för att lösa en annan problemklustring eller taxonomi . I dessa problem specificeras inte uppdelningen av träningsprovobjekt i klasser, och det krävs att objekt endast klassificeras utifrån deras likhet med varandra. Inom vissa tillämpade områden, och till och med i själva matematisk statistik, på grund av problemens närhet, skiljer man ofta inte klustringsproblem från klassificeringsproblem.

Vissa algoritmer för att lösa klassificeringsproblem kombinerar övervakat lärande med oövervakat lärande , till exempel är en version av Kohonens neurala nätverk  övervakade vektorkvantiseringsnätverk.

Matematisk beskrivning av problemet

Låt vara en uppsättning beskrivningar av objekt, vara en uppsättning nummer (eller namn) av klasser. Det finns ett okänt målberoende — mappning , vars värden endast är kända för objekten i det slutliga träningsprovet . Det krävs att bygga en algoritm som kan klassificera ett godtyckligt objekt .

Probabilistiskt uttalande av problemet

Det probabilistiska uttalandet av problemet anses vara mer generellt. Det antas att uppsättningen av par "objekt, klass" är ett sannolikhetsutrymme med ett okänt sannolikhetsmått . Det finns en ändlig träningsuppsättning observationer som genereras enligt sannolikhetsmåttet  . Det krävs att bygga en algoritm som kan klassificera ett godtyckligt objekt .  

Funktionsutrymme

Ett tecken är en mappning , där  är uppsättningen av tillåtna värden för ett tecken. Om funktioner är givna kallas vektorn för en egenskapsbeskrivning av objektet . Vägledande beskrivningar kan identifieras med själva objekten. I det här fallet kallas uppsättningen ett funktionsutrymme .

Beroende på uppsättningen är skyltar indelade i följande typer:

Ofta finns det tillämpade problem med olika typer av funktioner, inte alla metoder är lämpliga för deras lösning.

Typologi för klassificeringsproblem

Indatatyper

Klassificeringen av signaler och bilder kallas också för mönsterigenkänning .

Klasstyper

Se även

Länkar

Litteratur