Grafredigeringsavstånd

Grafredigeringsavståndet är koefficienten för likhet (eller olikhet) mellan två grafer . Begreppet grafredigeringsavstånd formulerades först matematiskt av Alberto Sanfeliu och King-San Fu 1983 [1] . Den huvudsakliga tillämpningen av grafredigeringsavstånd är i inexakt grafmatchning , såsom robust mönsterigenkänning i maskininlärning [2] .

Grafredigeringsavståndet mellan två grafer är relaterat till redigeringsavståndet mellan rader . Vid tolkning av sänkor som kopplade riktade acykliska grafer med en maximal grad av två, kan de klassiska definitionerna av redigeringsavstånd, som Levenshtein-avstånd [3] , Hamming-avstånd [4] och Jaro-Winkler-avstånd , tolkas som grafredigeringsavstånd mellan lämpliga grafer. På liknande sätt är grafredigeringsavstånd en generalisering av trädredigeringsavstånd mellan rotade träd [5] [6] [7] [8] .

Formella definitioner och egenskaper

Den matematiska definitionen av grafredigeringsavståndet beror på definitionen av de grafer för vilka avståndet är definierat. Det beror till exempel på om och hur grafens hörn och kanter är märkta , och även på om grafen är riktad . I allmänhet, givet en uppsättning grafredigeringsoperationer (även känd som elementära grafoperationer ), kan grafredigeringsavståndet mellan två grafer och skrivs som , definieras som

,

där betyder uppsättningen av transformationsvägar till ( isomorfisk till grafen) , och är lika med kostnaden för varje redigeringsåtgärd .

Uppsättningen av elementära grafoperationer inkluderar vanligtvis:

vertex infogning — en ny märkt vertex infogas i grafen. vertexborttagning — en (ofta orelaterade) vertex tas bort från grafen. ersätta en vertex - ändra etiketten (eller färgen) för en given vertex. kantinsättning — en ny färgad kant infogas i grafen mellan ett par hörn. kantborttagning — borttagning av en kant mellan ett par hörn. kantsubstitution - ändra etiketten (eller färgen) för en given kant.

Dessutom, men mer sällan, operationer som att dela en kant , som infogar en ny vertex i en kant (vilket resulterar i två kanter), och att krympa en kant , vilket tar bort en vertex av grad två mellan kanterna (av samma färg) medan sammanslagning av de två kanterna ingår i en. Även om sådana komplexa operationer kan definieras i termer av enklare transformationer, tillåter deras användning en bättre parametrisering av kostnadsfunktionen när operatören är billigare än summan av dess delar.

Applikationer

Grafredigeringsavstånd har applikationer inom handskriftsigenkänning [9] , fingeravtrycksigenkänning [10] och kemoinformatik [11] .

Algoritmer och komplexitet

Exakta algoritmer för att beräkna grafredigeringsavståndet mellan ett par grafer omvandlar vanligtvis problemet till ett problem att hitta den minsta transformationsvägen mellan två grafer. Att beräkna den optimala redigeringsvägen reduceras till sökvägssökning eller det kortaste vägproblemet , ofta implementerat som A*-sökalgoritmen .

Förutom exakta algoritmer är många effektiva approximationsalgoritmer kända [12] [13] .

Även om ovanstående algoritmer ibland fungerar bra i praktiken, i allmänhet är problemet med att beräkna redigeringsavståndet för en graf NP-komplett [14] (ett bevis på detta finns tillgängligt i avsnitt 2 på Zeng et al.s webbplats ) och till och med svårt att uppskatta (formellt är det APX -hårt [15] ).

Anteckningar

  1. Sanfeliu, Fu, 1983 , sid. 353–363.
  2. Gao, Xiao, Tao, Li, 2010 , sid. 113-129.
  3. Levenshtein, 1965 , sid. 845–848.
  4. Hamming, 1950 , sid. 147–160.
  5. Shasha och Zhang 1989 , sid. 1245–1262.
  6. Zhang, 1996 , sid. 205–222.
  7. Bille, 2005 , sid. 22–34.
  8. Demaine, Mozes, Rossman, Weimann, 2010 , sid. A2.
  9. Fischer, Suen, Frinken, Riesen, Bunke, 2013 , sid. 194–203.
  10. Neuhaus, Bunke, 2005 , sid. 191–200.
  11. Birchall, Gillet, Harper, Pickett, 2006 , sid. 557–586.
  12. Neuhaus, Bunke, 2007 .
  13. Riesen, 2016 .
  14. Garey, Johnson, 1979 .
  15. Lin, 1994 , sid. 74–82.

Litteratur