Hamming avstånd

Hamming distans (kodavstånd) - antalet positioner där motsvarande tecken i två ord av samma längd är olika [1] . Mer generellt tillämpas Hamming-avstånd på strängar av samma längd som valfritt q -ary- alfabet och fungerar som ett differensmått (en funktion som bestämmer avståndet i ett metriskt utrymme ) för objekt med samma dimension.

Måttet formulerades ursprungligen av Richard Hamming under hans tid på Bell Labs för att definiera ett mått på skillnaden mellan kodord (binära vektorer ) i ett vektorrum av kodord: i detta fall Hamming-avståndet mellan två binära sekvenser (vektorer) och längden är antalet positioner där de är olika. I denna formulering inkluderades Hamming-avståndet i NIST Dictionary of Algorithms and Data Structures . Hamming-avståndet är ett specialfall av Minkowski-måttet (med en lämplig definition av subtraktion):  

.

Två ord med Hamming-avståndet 1 kallas grannar.

I vissa talsystem, som Gray-koden , har kodade heltal som skiljer sig med 1 ett Hamming-avstånd på 1. Sådana tal sägs vara "intilliggande".

Grannkodning är viktig i design av logiska enheter där logiska raser måste undvikas .

Exempel

Egenskaper

En uppsättning ord av lika längd bildar ett metriskt mellanrum , där för varje par av rymdelement ett tal definieras - Hamming-avståndet som uppfyller metrikens axiom:

  1. ( axiom för identitet ).
  2. ( symmetrins axiom ).
  3. ( triangelaxiom eller triangelolikhet ).
då följer symmetriaxiomet av identitetsaxiomet och triangelolikheten.

Hammaravstånd är alltid:

var  är längden på ord i tecken.

Hamming distans inom bioinformatik och genomik

För nukleinsyror ( DNA och RNA ) beror möjligheten till hybridisering av två polynukleotidkedjor med bildandet av en sekundär struktur - en dubbelhelix  - på graden av komplementaritet hos nukleotidsekvenserna för båda kedjorna. När Hamming-avståndet ökar, minskar antalet vätebindningar som bildas av komplementära baspar och följaktligen minskar stabiliteten hos dubbelkedjan. Med utgångspunkt från något Hamming-avstånd, blir hybridisering omöjlig.

I den evolutionära divergensen av homologa DNA-sekvenser är Hamming-avståndet ett mått med vilket man kan bedöma tiden som har förflutit sedan divergensen av homologer, till exempel längden på det evolutionära segmentet som separerar homologa gener och en prekursorgen.

Se även

Anteckningar

  1. Hamming-avstånd: Antalet sifferpositioner där motsvarande siffror i två binära ord av samma längd är olika ( Federal Standard 1037C Arkiverad 2 mars 2009 på Wayback Machine ).

Litteratur