Funktionsextraktion är en typ av abstraktion , en dimensionsreduktionsprocess där den ursprungliga uppsättningen av initiala variabler reduceras till mer hanterbara grupper (funktioner) för vidare bearbetning, samtidigt som den förblir en tillräcklig uppsättning för att exakt och fullständigt beskriva den ursprungliga datamängden [1] . Funktionsextraktion används i maskininlärning , mönsterigenkänning och vid bildbehandling . Funktionsextraktion startar från den ursprungliga datamängden, härleder sekundära värden ( funktioner ) för vilka de ska vara informativa och inte redundanta, vilket bidrar till den efterföljande processen för maskininlärning och generalisering av steg, och i vissa fall leder till en bättre mänsklig tolkning av uppgifterna.
När indata från en algoritm är för stor för att bearbetas och det finns en misstanke om att datan är redundant (till exempel mäts i både fot och meter, eller repeterbarheten av bilder representeras av pixlar ), då kan de omvandlas till en reducerad egenskapsuppsättning (kallad egenskapsvektor ). Definitionen av en delmängd av initiala funktioner kallas funktionsval [2] . De valda funktionerna kontrolleras mot innehållet i den nödvändiga informationen i indata, så att den önskade uppgiften kan utföras med denna reducerade uppsättning istället för den ursprungliga fullständiga datan.
Funktionsextraktion innebär att minska antalet resurser som behövs för att beskriva en stor uppsättning data. När man analyserar komplexa data orsakas ett av huvudproblemen av antalet involverade variabler. Analyser med ett stort antal variabler kräver i allmänhet mycket minne och processorkraft, och det kan också göra att klassificeringsproblemalgoritmer överanpassas i förhållande till träningsuppsättningen, vilket i allmänhet leder till dåliga resultat för nya prover. Funktionsextraktion är huvudbeteckningen för metoder för att konstruera kombinationer av variabler för att komma runt dessa problem samtidigt som de beskriver data med tillräcklig noggrannhet. Många utövare av maskininlärning tror att korrekt optimerad funktionsextraktion är nyckeln till att bygga en effektiv modell [3] .
Resultaten kan förbättras med hjälp av en uppsättning applikationsspecifika funktioner, vanligtvis byggda av experter. En sådan process kallas funktionsteknik . Alternativt används generella dimensionsreduktionstekniker, såsom:
Ett mycket viktigt område för funktionsextraktionsapplikation är bildbehandling , som använder algoritmer för att upptäcka och isolera olika önskade delar eller former (funktioner) av en digital bild eller videoström . Ett av de viktiga tillämpningsområdena för metoder är optisk teckenigenkänning .
Många aggregeringspaket ger funktionsextraktion och dimensionsreduktion. Vanliga numeriska bearbetningssystem som MATLAB , Scilab , NumPy och R-språket stöder några enkla funktionsextraktionstekniker (som huvudkomponentanalys ) med inbyggda kommandon. Mer specifika algoritmer är ofta tillgängliga som skript för allmän egendom eller utveckling från tredje part. Det finns också paket utformade för specifika maskininlärningsapplikationer specifikt för funktionsextraktion. [fyra]
Maskininlärning och datautvinning | |
---|---|
Uppgifter | |
Att lära sig med en lärare | |
klusteranalys | |
Dimensionalitetsreduktion | |
Strukturell prognos | |
Anomali upptäckt | |
Grafisk probabilistiska modeller | |
Neurala nätverk | |
Förstärkningsinlärning |
|
Teori | |
Tidskrifter och konferenser |
|