Rothwell-operatör

Rothwell-operatören , inom disciplinen datorseende  , är en operatör för kantdetektering som introducerades av Charles Rothwell  vid IEEE Computer Vision Symposium [1] 1995.

Generellt sett är Rothwell-operatorn väldigt lik Canny-operatorn , skillnaden mellan dem är att Rothwell-algoritmen använder Edge detection#Edge thinning istället för Non -Maximum Suppression , och att dynamisk tröskelvärde ( engelsk dynamic thresholding ) används istället för hysteres. .    

Anledningar till skapandet

Författarna till metoden trodde att icke-maximal undertryckning inte fungerar korrekt på övergångar i bilder på grund av utjämningsprocessen. Författarna övergav hysteres på grund av tron ​​att kantljusstyrka inte är av grundläggande betydelse för en högre nivå av visuell bearbetning, i synnerhet vid objektigenkänning. Kontrasten var mycket viktigare för dem.

Huvudstegen i algoritmen

Primär bearbetning. Bilden utjämnas med en diskret sampling av ett tvådimensionellt Gaussiskt filter. Här används separata endimensionella gaussiska kärnor sekventiellt i x- och y-riktningarna. "Svansen" på faltningskärnan är 1,5% av dess centrala värden. Sedan hittas en gradient för varje punkt i bilden. och beräknas med hjälp av centrala finita differenser av operatorer av formen [-1,0,1]. |ΔS| (betecknas med N för enkelhetens skull) och θ beräknas för varje punkt med hjälp av uttryck som liknar de i Canny-operatorn:

Subpixel lokalisering. För varje pixel för vilken N > (där detta är en förutbestämd tröskel), där kantpixlarna ( eng. Edgels ) faktiskt ligger, används tekniken att söka efter lokala maxima för Canny-operatorn. Placeringen av kantpixlarna hittas genom att uppskatta skärningspunkten för andraderivatan med noll i riktningen för normalen till tangentkonturen.  

Definition av bildtröskeln. Efter att ha bestämt N och θ uppstår problemet med att separera kantpixlar och andra punkter. Detta görs med hjälp av dynamisk tröskelvärde , dvs operatören definierar ett tröskelvärde som varierar beroende på bilden .  Yttröskeln ( på diskreta områden av bilden) beräknas och används för att klassificera kantpixlar när > α (användningen av konstanten 0 < α ≤ 1 beskrivs nedan). definieras med hjälp av elementen i mängden Σ . Dessa kanter ger en bra indikation på starka kanter i närområdet. Så vi tilldelar ett värde för varje (x, y) є Σ , och bildar sedan en bitvis plan yta, interpolerad för alla andra (x, y). Valet av bildtröskeln fortsätter genom att jämföra värdet och tröskelfunktionen och klassificera punkten (x, y) som kant om den förra är minst 90 % av den senare. Parametern α införs för att ta hänsyn till fallet då stark kant kan komma lite längre mot övergången. Alla pixlar som klarar tröskeltestet ingår i uppsättningen Σ, det är uppenbart att Σ ingår i Σ.

Gallring. Tröskelprocessen producerar en bild av uppsättningen av element Σ, vars medlemmar är de associerade kantpixlarna. Ett element är en "granne" till ett annat element om det är minst 1 pixel bort från det, det vill säga det tillhör en 3x3 kvadrat centrerad på det andra elementet. Uppsättningens bredd är ofta två eller tre punkter och representerar därför inte topologin för den digitala kurvan. Delmängder tunnas ut till kedjor med enhetstjocklek. Denna process är baserad på Cao-Fu gallringsalgoritmen. Det fungerar på ett sådant sätt att det inte förkortar kanter av kedjor som har en fri ände (det vill säga kanter med bara en kant ansluten till den). Cao-Fus gallring behandlar dock alla element i setet lika, så till exempel en stark kant kan tas bort i motsats till en svagare punkt. Så lokaliseringen av åsarna bevaras, villkoren för Σ ordnas och de svaga elementen tas bort först. Det förtunnade setet kallas Σ

Få en topologisk beskrivning. Givet Σ extraheras en topologisk beskrivning från diskreta bilder och en subpixel geometrisk tolkning är associerad med den. Alla element i Σ utgör ett vertex-edge-face-nätverk. Vertices är belägna på kanter som antingen bara har en granne (i vilket fall de är ändarna på en kantkedja) eller som har mer än två kanter associerade med sig. Topologiskt definieras en hörnpunkt av mötet mellan två kantbanor inneslutna inom samma kant. Kantsegmentering vid sådana hörnpunkter utförs inte. Så snart hörn erhålls, korsas kantkedjorna mellan dem med en mask på 3 x 3. När varje kant bryts skrivs dess underpixlar till listan.

Se även

Anteckningar

  1. IEEE International Symposium on Computer Vision Arkiverad 11 januari 2011 på Wayback Machine , 1995

Litteratur

Länkar