Klassificeringsuppgiften är en uppgift där det finns många objekt ( situationer ) indelade på något sätt i klasser . En ändlig uppsättning objekt ges för vilka det är känt vilka klasser de tillhör. Denna uppsättning kallas ett prov . Klasstillhörigheten för resten av objekten är okänd. Det krävs att man konstruerar en algoritm som kan klassificera (se nedan) ett godtyckligt objekt från den initiala uppsättningen .
Att klassificera ett objekt innebär att ange numret (eller namnet) på den klass som det givna objektet tillhör.
Objektklassificering - klassens nummer eller namn, utfärdat av klassificeringsalgoritmen som ett resultat av dess tillämpning på detta specifika objekt.
I matematisk statistik kallas klassificeringsproblem även för diskriminantanalysproblem . Inom maskininlärning löses klassificeringsproblemet, särskilt genom att använda metoderna för artificiella neurala nätverk när man sätter upp ett experiment i form av träning med en lärare .
Det finns också andra sätt att sätta upp ett experiment - oövervakat lärande , men de används för att lösa en annan problemklustring eller taxonomi . I dessa problem specificeras inte uppdelningen av träningsprovobjekt i klasser, och det krävs att objekt endast klassificeras utifrån deras likhet med varandra. Inom vissa tillämpade områden, och till och med i själva matematisk statistik, på grund av problemens närhet, skiljer man ofta inte klustringsproblem från klassificeringsproblem.
Vissa algoritmer för att lösa klassificeringsproblem kombinerar övervakat lärande med oövervakat lärande , till exempel är en version av Kohonens neurala nätverk övervakade vektorkvantiseringsnätverk.
Låt vara en uppsättning beskrivningar av objekt, vara en uppsättning nummer (eller namn) av klasser. Det finns ett okänt målberoende — mappning , vars värden endast är kända för objekten i det slutliga träningsprovet . Det krävs att bygga en algoritm som kan klassificera ett godtyckligt objekt .
Det probabilistiska uttalandet av problemet anses vara mer generellt. Det antas att uppsättningen av par "objekt, klass" är ett sannolikhetsutrymme med ett okänt sannolikhetsmått . Det finns en ändlig träningsuppsättning observationer som genereras enligt sannolikhetsmåttet . Det krävs att bygga en algoritm som kan klassificera ett godtyckligt objekt .
Ett tecken är en mappning , där är uppsättningen av tillåtna värden för ett tecken. Om funktioner är givna kallas vektorn för en egenskapsbeskrivning av objektet . Vägledande beskrivningar kan identifieras med själva objekten. I det här fallet kallas uppsättningen ett funktionsutrymme .
Beroende på uppsättningen är skyltar indelade i följande typer:
Ofta finns det tillämpade problem med olika typer av funktioner, inte alla metoder är lämpliga för deras lösning.
Klassificeringen av signaler och bilder kallas också för mönsterigenkänning .
Maskininlärning och datautvinning | |
---|---|
Uppgifter | |
Att lära sig med en lärare | |
klusteranalys | |
Dimensionalitetsreduktion | |
Strukturell prognos | |
Anomali upptäckt | |
Grafisk probabilistiska modeller | |
Neurala nätverk | |
Förstärkningsinlärning |
|
Teori | |
Tidskrifter och konferenser |
|