Evolutionärt avstånd är en kvantitet som kännetecknar de genetiska skillnaderna mellan två organismer. Det hittas genom att jämföra nukleotidsekvenserna för homologa gener. Ett mått på genetiska skillnader är procentandelen nukleotidfelparningar i motsvarande positioner av genen [1] .
Det enklaste värdet som kännetecknar det evolutionära avståndet är andelen felmatchade nukleotider i en parvis jämförelse av motsvarande positioner i genen. Denna kvantitet kallas "parvis avstånd" (vanligtvis betecknad med symbolen p ).
Till exempel när man jämför följande två regioner av genen
CAGACAGTCA CA C AC T G C CAdet finns tre felparningar per 10 nukleotider, p = 0,3.
Parvis avstånd beskriver inte tillräckligt de evolutionära skillnaderna mellan organismer:
Nackdelarna med det parvisa avståndet elimineras genom att använda mer komplexa formler för att bestämma avståndet:
och andra metoder.
Jukes-Cantor-metoden [ 2] är det enklaste försöket att utesluta slumpmässiga nukleotidmatchningar från övervägande, vars sannolikhet är 25 %. Detta är en enparametermetod som använder andelen nukleotidfelparningar (d.v.s. parvis avstånd p ) som en parameter. Avståndet beräknas med följande formel
Metoden förutsätter att alla fyra nukleotiderna (A, C, T, D) är närvarande i DNA i samma proportioner, och sannolikheten för att ersätta en nukleotid med en annan är densamma för alla nukleotidpar.
Som framgår av formeln, för p > 0,75, är uttrycket inte meningsfullt (negativt uttryck under logaritmens tecken). Detta är en nackdel med metoden, eftersom situationer med p > 0,75 (mer än 75 % av olika nukleotider) i princip inte är uteslutna.
Formeln föreslogs 1965, i början av forskning inom området molekylärbiologi, av Thomas Jukes , professor i kemi vid University of Californiaoch en student vid samma fakultet, Charles Cantor. I mitten av 1960-talet nådde biokemisk teknik en nivå där det blev möjligt att dechiffrera enskilda fragment av DNA och aminosyrasekvenser av proteiner. Detta gjorde det möjligt att, genom att jämföra nukleotidsekvenser, spåra olika organismers evolutionära närhet och individuella arters evolutionära vägar. Jukes och Kantor var bland pionjärerna i formaliseringen av denna metod, och Kantor blev författare till ett av de första datorprogrammen för analys av nukleotidsekvenser [3] .
Som ett exempel på tillämpningen av formeln kan fragment av gener som kodar för humant a- och P-hemoglobin nämnas. Man tror att för cirka 400 miljoner år sedan härstammade båda generna från samma förfäders gen [3] .
ACCAACGTCAAGGCCGCCTGGGGTAAGGTT (α-hemoglobin) TCTGCCGTTACTGCCCTGTGGGGGAAGGTG (β-hemoglobin)Fragmentjämförelse avslöjar 12 skillnader per 30 nukleotider ( p = 0,4). En enkel avvikelseberäkning tar dock inte hänsyn till sannolikheten att flera mutationer inträffade i vissa positioner, inklusive de som ledde till återställandet av den ursprungliga nukleotiden. Jukes-Cantor-formeln ger avstånd
Således följer det av formeln att, med hänsyn till multipla substitutioner, 0,572·30=17 mutationer inträffade i det betraktade DNA-fragmentet.
Motoo Kimura föreslog en metod för att beräkna avståndet, som kallades "Kimura 2-parameter distance" ( engelska Kimura 2-parameter distance, K2P ). Kimura-modellen antar att olika varianter av nukleotidsubstitutioner inte är lika sannolika och överväger två typer av substitutioner:
Avståndet i Kimura-modellen bestäms av formeln
där P är andelen övergångar, Q är andelen transversioner.
Med tanke på som ett exempel det evolutionära avståndet mellan α- och β-hemoglobingenfragmenten får vi:
ACCAACGTCAAGGCCGCCTGGGGTAAGGTT (α-hemoglobin) TCTGCCGTTACTGCCCTGTGGGGGAAGGTG (β-hemoglobin) Q PPQ P QQ QPQ QQI Tajima- Ney -modellen bestäms avståndet av följande relationer [4] :
var
x ij — relativa frekvenser av nukleotidpar; gi - relativa frekvenser av nukleotider.Som ett exempel, låt oss beräkna avståndet mellan fragment av gener som kodar för humant α- och β-hemoglobin.
ACCAACGTCAAGGCCGCCTGGGGTAAGGTT (α-hemoglobin) TCTGCCGTTACTGCCCTGTGGGGGAAGGTG (β-hemoglobin)Nukleotid _ |
xij _ | gi _ | ||
---|---|---|---|---|
A | T | C | ||
A | 10/60 = 0,167 | |||
T | 1/30 = 0,0333 | 13/60 = 0,217 | ||
C | 2/30 = 0,0667 | 3/30 = 0,100 | 15/60 = 0,250 | |
G | 1/30 = 0,0333 | 3/30 = 0,100 | 2/30 = 0,0667 | 22/60 = 0,367 |
I vissa källor kallas avståndet Tajima-Nei för beräkning med en enklare formel
var
För det fall då alla nukleotider förekommer med samma frekvens ( gi = 0,25 ), sammanfaller denna formel med Jukes-Cantor-formeln ( b = 0,75).
Beräkningar med dessa formler ger samma exempel