En funktionsbeskrivning av ett objekt ( eng. feature vector ) är en vektor som är sammansatt av värden som motsvarar en viss uppsättning funktioner för ett givet objekt. Funktionsvärden kan vara av olika, inte nödvändigtvis numeriska, typ . Det är en av de vanligaste datainmatningsmetoderna inom maskininlärning .
Beteckna med X uppsättningen av objekt, situationer, prejudikat för något ämnesområde . Till exempel, i maskininlärningsproblem som uppstår inom medicin, kan prejudikat vara patienter, inom utlåningsområdet när de utför kreditvärdering - låntagare , i spamfiltreringsproblem - individuella meddelanden.
Feature ( engelsk funktion ) är resultatet av att mäta någon egenskap hos ett objekt, det vill säga en display:
,var är uppsättningen av tillåtna attributvärden.
Funktionsvärden kan vara texter , grafer , digitaliserade bilder , numeriska sekvenser , databasposter etc. Beroende på uppsättningen är funktioner indelade i följande typer:
Ofta finns det tillämpade problem med olika typer av funktioner, för vilka inte alla metoder är lämpliga.
Om funktioner är givna kallas vektorn för en egenskapsbeskrivning av objektet .
I maskininlärning kan funktionsbeskrivningar identifieras med själva objekten, det vill säga: . I det här fallet kallas uppsättningen ett funktionsutrymme .
En funktion-objektmatris (informationsmatris, indatamatris) är en uppsättning funktionsbeskrivningar av inlärningsexempelobjekt avlängd, skrivna som en storleksmatris(rader,kolumner). Kolumnerna i denna matris motsvarar funktioner, och varje rad är en funktionsbeskrivning av ett inlärningsobjekt. Denna typ av representation är accepterad i problemen med klassificering och regressionsanalys , och ett stort antal inlärningsmetoder innebär en sådan representation av data.
Problem som uppstår i praktiken kanske inte innehåller data som är lämpliga för matematisk bearbetning. Till exempel, i spamfiltreringsuppgiften representeras objekt - meddelanden - av texter av godtycklig längd, kan innehålla bilagor av olika format, etc. För att få data till en standardform används en procedur - funktionsextraktion från data eller funktionsgenerering ( .funktionsgenerering ) . Således kan varje mappning från en uppsättning till en uppsättning värden som är bekväm för bearbetning tas som en funktion. Ingenting hindrar oss från att ta någon klassificerings- (eller regressions-) algoritm som en sådan mappning, vilket gör det möjligt att erhålla komplexa sammansättningar av algoritmer.