Vägledande beskrivning

Den aktuella versionen av sidan har ännu inte granskats av erfarna bidragsgivare och kan skilja sig väsentligt från versionen som granskades den 2 december 2017; verifiering kräver 1 redigering .

En funktionsbeskrivning av ett objekt ( eng.  feature vector ) är en vektor som är sammansatt av värden som motsvarar en viss uppsättning funktioner för ett givet objekt. Funktionsvärden kan vara av olika, inte nödvändigtvis numeriska, typ . Det är en av de vanligaste datainmatningsmetoderna inom maskininlärning .

Formell definition

Beteckna med X uppsättningen av objekt, situationer, prejudikat för något ämnesområde . Till exempel, i maskininlärningsproblem som uppstår inom medicin, kan prejudikat vara patienter, inom utlåningsområdet när de utför kreditvärdering  - låntagare , i spamfiltreringsproblem -  individuella meddelanden.

Feature ( engelsk  funktion ) är resultatet av att mäta någon egenskap hos ett objekt, det vill säga en display:

,

var  är uppsättningen av tillåtna attributvärden.

Funktionsvärden kan vara texter , grafer , digitaliserade bilder , numeriska sekvenser , databasposter etc. Beroende på uppsättningen är funktioner indelade i följande typer:

Ofta finns det tillämpade problem med olika typer av funktioner, för vilka inte alla metoder är lämpliga.

Om funktioner är givna kallas vektorn för en egenskapsbeskrivning av objektet .

I maskininlärning kan funktionsbeskrivningar identifieras med själva objekten, det vill säga: . I det här fallet kallas uppsättningen ett funktionsutrymme .

En funktion-objektmatris (informationsmatris, indatamatris) är en uppsättning funktionsbeskrivningar av inlärningsexempelobjekt avlängd, skrivna som en storleksmatris(rader,kolumner). Kolumnerna i denna matris motsvarar funktioner, och varje rad är en funktionsbeskrivning av ett inlärningsobjekt. Denna typ av representation är accepterad i problemen med klassificering och regressionsanalys , och ett stort antal inlärningsmetoder innebär en sådan representation av data.

I applikationer

Problem som uppstår i praktiken kanske inte innehåller data som är lämpliga för matematisk bearbetning. Till exempel, i spamfiltreringsuppgiften representeras objekt - meddelanden - av texter av godtycklig längd, kan innehålla bilagor av olika format, etc. För att få data till en standardform används en procedur - funktionsextraktion från data eller funktionsgenerering ( .funktionsgenerering ) . Således kan varje mappning från en uppsättning till en uppsättning värden som är bekväm för bearbetning tas som en funktion. Ingenting hindrar oss från att ta någon klassificerings- (eller regressions-) algoritm som en sådan mappning, vilket gör det möjligt att erhålla komplexa sammansättningar av algoritmer.   

Litteratur

Länkar