Särdragsextraktion

Funktionsextraktion är en typ av abstraktion , en dimensionsreduktionsprocess där den ursprungliga uppsättningen av initiala variabler reduceras till mer hanterbara grupper (funktioner) för vidare bearbetning, samtidigt som den förblir en tillräcklig uppsättning för att exakt och fullständigt beskriva den ursprungliga datamängden [1] . Funktionsextraktion används i maskininlärning , mönsterigenkänning och vid bildbehandling . Funktionsextraktion startar från den ursprungliga datamängden, härleder sekundära värden ( funktioner ) för vilka de ska vara informativa och inte redundanta, vilket bidrar till den efterföljande processen för maskininlärning och generalisering av steg, och i vissa fall leder till en bättre mänsklig tolkning av uppgifterna.

När indata från en algoritm är för stor för att bearbetas och det finns en misstanke om att datan är redundant (till exempel mäts i både fot och meter, eller repeterbarheten av bilder representeras av pixlar ), då kan de omvandlas till en reducerad egenskapsuppsättning (kallad egenskapsvektor ). Definitionen av en delmängd av initiala funktioner kallas funktionsval [2] . De valda funktionerna kontrolleras mot innehållet i den nödvändiga informationen i indata, så att den önskade uppgiften kan utföras med denna reducerade uppsättning istället för den ursprungliga fullständiga datan.

Allmänt tillvägagångssätt

Funktionsextraktion innebär att minska antalet resurser som behövs för att beskriva en stor uppsättning data. När man analyserar komplexa data orsakas ett av huvudproblemen av antalet involverade variabler. Analyser med ett stort antal variabler kräver i allmänhet mycket minne och processorkraft, och det kan också göra att klassificeringsproblemalgoritmer överanpassas i förhållande till träningsuppsättningen, vilket i allmänhet leder till dåliga resultat för nya prover. Funktionsextraktion är huvudbeteckningen för metoder för att konstruera kombinationer av variabler för att komma runt dessa problem samtidigt som de beskriver data med tillräcklig noggrannhet. Många utövare av maskininlärning tror att korrekt optimerad funktionsextraktion är nyckeln till att bygga en effektiv modell [3] .

Resultaten kan förbättras med hjälp av en uppsättning applikationsspecifika funktioner, vanligtvis byggda av experter. En sådan process kallas funktionsteknik . Alternativt används generella dimensionsreduktionstekniker, såsom:

Bildbehandling

Ett mycket viktigt område för funktionsextraktionsapplikation är bildbehandling , som använder algoritmer för att upptäcka och isolera olika önskade delar eller former (funktioner) av en digital bild eller videoström . Ett av de viktiga tillämpningsområdena för metoder är optisk teckenigenkänning .

Lågnivå

Krökning Rörliga bilder
  • Rörelsedetektering . Zonala och differentiella tillvägagångssätt. optiskt flöde .

Formbaserade metoder

  • Tröskelfiltrering
  • Välja objekt
  • Mönstermatchning
  • Algoritm för att hitta singulära punkter och jämföra dem SIFT
  • Hough transformera
    • Direkt
    • Cirklar/ellipser
    • Godtyckliga siffror (generaliserad Hough-transform)
    • Arbeta med alla parametrerbara funktioner (klassparametrar, klusterdetektering, etc..)

Flexibla metoder

  • Deformerbara, parametriserade former
  • Aktiva konturer (slingrande)

Funktionsextraktion i programvara

Många aggregeringspaket ger funktionsextraktion och dimensionsreduktion. Vanliga numeriska bearbetningssystem som MATLAB , Scilab , NumPy och R-språket stöder några enkla funktionsextraktionstekniker (som huvudkomponentanalys ) med inbyggda kommandon. Mer specifika algoritmer är ofta tillgängliga som skript för allmän egendom eller utveckling från tredje part. Det finns också paket utformade för specifika maskininlärningsapplikationer specifikt för funktionsextraktion. [fyra]

Se även

Anteckningar

  1. Vad är funktionsextraktion? . deepai.org . Arkiverad från originalet den 2 mars 2021.
  2. Alpaydin, 2010 , sid. 110.
  3. Reality AI Blog, "Its all about the features", september 2017, https://reality.ai/it-is-all-about-the-features/ Arkiverad 18 augusti 2019 på Wayback Machine
  4. se till exempel https://reality.ai/ Arkiverad 25 mars 2021 på Wayback Machine

Litteratur