Genetisk kod är en uppsättning regler enligt vilka sekvensen av nukleotider ( gener och mRNA ) i levande celler översätts till en sekvens av aminosyror ( proteiner ). Själva translationen ( translationen ) utförs av ribosomen , som förbinder aminosyrorna till en kedja enligt instruktionerna som står i mRNA -kodonen . Motsvarande aminosyror levereras till ribosomen av tRNA- molekyler . Den genetiska koden för alla levande organismer på jorden är densamma (det finns bara mindre variationer), vilket indikerar närvaron av en gemensam förfader .
Reglerna för den genetiska koden avgör vilken aminosyra som motsvarar en triplett (tre på varandra följande nukleotider) i mRNA. Med sällsynta undantag [1] motsvarar varje kodon endast en aminosyra. En viss aminosyra kan kodas för av mer än ett kodon, och det finns även kodon som markerar början och slutet av ett protein. Varianten av den genetiska koden som används av de allra flesta levande organismer kallas standard, eller kanonisk, genetisk kod. Emellertid är flera dussin undantag från den genetiska standardkoden kända, till exempel vid översättning i mitokondrier används lätt modifierade regler för den genetiska koden.
Den enklaste representationen av den genetiska koden är en tabell med 64 celler, där varje cell motsvarar ett av de 64 möjliga kodonen [2] .
Försöken att förstå hur DNA-sekvensen kodar för aminosyrasekvensen hos proteiner började nästan omedelbart efter att DNA-strukturen ( dubbelhelix ) etablerades 1953. Georgy Gamow föreslog att kodon skulle bestå av tre nukleotider så att det finns tillräckligt med kodon för alla 20 aminosyrorna (totalt är 64 olika kodon av tre nukleotider möjliga: en av fyra nukleotider kan placeras i var och en av de tre positionerna) [3 ] .
1961 bekräftades den genetiska kodens triplettkaraktär experimentellt. Samma år använde Marshall Nirenberg och hans kollega Heinrich Mattei ett cellfritt system för in vitro translation . En oligonukleotid bestående av uracilrester (UUUU...) togs som mall . Peptiden som syntetiserades från den innehöll endast aminosyran fenylalanin [4] . Så innebörden av kodonet fastställdes först: kodonet UUU kodar för fenylalanin. Ytterligare regler för överensstämmelse mellan kodon och aminosyror fastställdes vid laboratoriet i Severo Ochoa . Det har visats att polyadenin -RNA (AAA...) översätts till en polylysinpeptid [5] och en peptid som endast består av prolinrester syntetiseras på en mall för polycytosin -RNA (CCC...) [6] . Betydelsen av de återstående kodonen bestämdes med användning av en mängd olika sampolymerer under loppet av experiment som utfördes i laboratoriet i Hara Gobind Qur'an . Kort därefter etablerade Robert Holley strukturen för tRNA-molekylen som förmedlar translation. 1968 tilldelades Nirenberg, Korana och Holly Nobelpriset i fysiologi eller medicin [7] .
Efter att ha fastställt reglerna för den genetiska koden, började många forskare att artificiellt omvandla den . Så sedan 2001 har 40 aminosyror införts i den genetiska koden, som i naturen inte är en del av proteiner. För varje aminosyra skapades ett eget kodon och motsvarande aminoacyl-tRNA-syntetas . Artificiell expansion av den genetiska koden och skapandet av proteiner med nya aminosyror kan hjälpa till att studera proteinmolekylernas struktur mer på djupet, samt att få fram artificiella proteiner med önskade egenskaper [8] [9] . H. Murakami och M. Sishido kunde omvandla några kodoner från tre nukleotider till fyra och fem nukleotider. Stephen Brenner fick det 65:e kodonet, som var funktionellt in vivo [10] .
2015 lyckades bakterien Escherichia coli ändra värdet på alla UGG-kodon från tryptofan till tienopyrrol-alanin, som inte finns i naturen [11] . 2016 erhölls den första halvsyntetiska organismen — en bakterie vars arvsmassa innehöll två konstgjorda kvävebaser (X och Y) som bevaras under delning [12] [13] . År 2017 tillkännagav forskare från Sydkorea skapandet av en mus med en utökad genetisk kod, som kan syntetisera proteiner med aminosyror som inte finns i naturen [14] .
Gener kodas i 5'→3'-riktningen av nukleotidsekvensen [15] . Läsramen bestäms av den allra första tripletten från vilken översättningen börjar. En sekvens av icke-överlappande kodon som börjar med ett startkodon och slutar med ett stoppkodon kallas en öppen läsram . Till exempel delas sekvensen 5'-AAATGAACG-3' (se fig.) när den läses från den första nukleotiden i kodonen AAA, TGA och ACG. Om avläsningen börjar från den andra nukleotiden, så motsvarar kodonen AAT och GAA den. Slutligen, när man läser från den tredje nukleotiden, används ATG- och AAC-kodonen. Således kan vilken sekvens som helst avläsas i riktningen 5' → 3' på tre olika sätt (med tre olika läsramar), och i varje fall kommer sekvensen för proteinprodukten att skilja sig åt på grund av igenkänningen av olika kodon av ribosomen. Om vi tar hänsyn till att DNA har en dubbelsträngad struktur, så är 6 läsramar möjliga: tre på en sträng och tre på den andra [16] . Att läsa gener från DNA är dock inte slumpmässigt. Alla andra läsramar inom en enda gen innehåller vanligtvis många stoppkodoner för att snabbt stoppa och minska den metaboliska kostnaden för misssyntes [17] .
Översättningen av information från mRNA-sekvensen till aminosyrasekvensen börjar med det så kallade startkodonet - vanligtvis AUG, och i eukaryoter lyder det som metionin och i bakterieliknande formylmetionin . Ett startkodon räcker inte för att starta translation; det kräver translationsinitieringsfaktorer , såväl som speciella element i intilliggande sekvenser, såsom Shine-Dalgarno-sekvensen i bakterier. I vissa organismer används kodonen GUG, som normalt kodar för valin , och UUG, som motsvarar leucin i standardkoden, som startkodon [18] .
Efter initieringskodonet fortsätter translationen genom sekventiell läsning av kodoner och bindning av aminosyror till varandra av ribosomen tills ett stoppkodon uppnås för att stoppa translation. Det finns tre stoppkodon, var och en med olika namn: UAG (bärnsten), UGA (opal) och UAA (ockra). Stoppkodon kallas också terminatorer. Det finns inga tRNA som motsvarar stoppkodon i celler, därför, när ribosomen når stoppkodonet, istället för tRNA, interagerar translationstermineringsfaktorer med det, som hydrolyserar det sista tRNA:t från aminosyrakedjan och sedan tvingar ribosomen att dissociera [19] . Hos bakterier deltar tre proteinfaktorer i translationsterminering : RF-1, RF-2 och RF-3: RF-1 känner igen och UAA-kodonen och RF-2 känner igen UAA och UGA. RF-3-faktorn gör ett underordnat arbete. Den tredimensionella strukturen av RF-1 och RF-2 liknar formen och laddningsfördelningen av tRNA och representerar således ett exempel på molekylär mimik [20] . I eukaryoter känner translationstermineringsfaktorn eRF1 igen alla tre stoppkodonen. Det ribosomberoende GTPase eRF3, som anses vara den andra eukaryota translationstermineringsfaktorn, hjälper eRF1 i frisättningen av den färdiga polypeptiden från ribosomen [21] [22] [23] .
Fördelningen av stoppkodon i genomet av en organism är inte oavsiktlig och kan vara associerad med GC-sammansättningen av genomet [24] [25] . Till exempel har E. coli K-12- stammen 2705 TAA (63%), 1257 TGA (29%) och 326 TAG (8%) kodon i sitt genom med en GC-halt på 50,8% [26] . En storskalig studie av arvsmassan hos olika bakteriearter visade att andelen TAA-kodon positivt korrelerar med GC-sammansättningen, medan andelen TGA är negativt korrelerad. Frekvensen av det mest sällan använda stoppkodonet, TAG, är inte associerat med GC-sammansättning [27] . Stoppkodonernas styrka varierar också. Spontan translationsterminering sker oftast vid UGA-kodonet, och minst ofta vid UAA [23] .
Förutom själva stoppkodonet är dess miljö av största vikt för avbrytandet av translation. Rollen för nukleotiden som ligger omedelbart efter stoppkodonet (+4) är störst. Det är troligt att nukleotid +4 och andra nukleotider som följer den påverkar translationsterminering genom att tillhandahålla bindningsställen för translationstermineringsfaktorer. Av denna anledning föreslår vissa forskare att överväga en stoppsignal med fyra nukleotider istället för ett stoppkodon med tre nukleotider. Nukleotider uppströms om stoppkodon påverkar också translation. Till exempel, i jäst , har det visats att adenin beläget 2 positioner uppströms om första stoppkodonnukleotiden stimulerar translationell terminering vid UAG-stoppkodonet (möjligen även vid andra kodon) [23] .
Ibland fungerar stoppkodon som avkänningskodon. Till exempel kodar UGA-kodonet för den icke-standardiserade aminosyran selenocystein om det så kallade SECIS-elementet finns bredvid det i transkriptet [28] . Stoppkodonet UAG kan koda för en annan icke-standardiserad aminosyra, pyrrolysin . Ibland erkänns ett stoppkodon som ett senskodon i mutationer som påverkar tRNA. Detta fenomen observeras oftast i virus , men det har också beskrivits i bakterier, jäst , Drosophila och människor, där det spelar en reglerande roll [29] [30] .
Under loppet av DNA-replikation uppstår ibland fel under syntesen av dottersträngen. Dessa fel, som kallas mutationer , kan påverka fenotypen av en organism, särskilt om de påverkar den kodande regionen av en gen. Fel uppstår med en hastighet av 1 på varje 10–100 miljoner baspar (bp) eftersom DNA-polymeraser effektivt kan korrigera sina fel [31] [32] .
Punktmutationer är enstaka substitutioner av en kvävebas. Om den nya basen tillhör samma klass som den ursprungliga (båda puriner eller båda pyrimidiner ), så kallas mutationen övergångar . Om en purin ersätts med en pyrimidin eller en pyrimidin med en purin, så talar de om transversioner . Övergångar är vanligare än transversioner [33] . Exempel på punktmutationer är missense- och nonsensmutationer . De kan orsaka sjukdomar som sicklecellanemi respektive talassemi [ 34] [35] . Kliniskt signifikanta missense-mutationer leder till att en aminosyrarest ersätts med en rest med olika fysikalisk-kemiska egenskaper, och nonsensmutationer resulterar i uppkomsten av ett för tidigt stoppkodon [16] .
Mutationer där den korrekta läsramen störs på grund av insättningar och deletioner (tillsammans kallas de indels ) som innehåller en icke-multipel av tre nukleotider kallas ramförskjutningsmutationer. Med dessa mutationer är proteinprodukten helt annorlunda än i vildtypen . Som regel uppträder förtida stoppkodon under läsramsförskjutningar, vilket orsakar bildandet av trunkerade proteiner [36] . Eftersom dessa mutationer avsevärt stör proteinets funktion, fixeras de sällan genom selektion : ofta leder frånvaron av proteinet till att organismen dör redan före födseln [37] . Frameshift-mutationer är associerade med sjukdomar som Tay-Sachs sjukdom [38] .
Även om de allra flesta mutationer är skadliga eller neutrala visar sig vissa vara fördelaktiga [39] . De kan ge organismen bättre anpassning än vildtypen till vissa miljöförhållanden, eller göra det möjligt för den att fortplanta sig snabbare än vildtypen. I detta fall kommer mutationen gradvis att spridas genom populationen under loppet av neutralt urval [40] . Virus vars genom representeras av RNA muterar mycket snabbt [41] , vilket ofta gynnar dem, eftersom immunsystemet , som effektivt känner igen vissa varianter av virala antigener , är maktlöst mot något förändrade [42] . I stora populationer av asexuellt reproducerande organismer, såsom E. coli , kan flera fördelaktiga mutationer inträffa samtidigt. Detta fenomen kallas klonal interferens och orsakar konkurrens mellan mutationer [43] .
Förmågan hos olika kodon att koda för samma aminosyra kallas koddegeneration. För första gången kallades den genetiska koden degenererad Nirenberg och Bernfield. Men trots degenerationen finns det ingen tvetydighet i den genetiska koden. Till exempel kodar kodonen GAA och GAG båda för glutamat , men ingendera kodar för någon annan aminosyra samtidigt. Kodon som motsvarar samma aminosyra kan skilja sig åt i vilken position som helst, men oftast sammanfaller de två första positionerna av sådana kodon, och endast den sista skiljer sig åt. På grund av detta kommer en mutation som påverkar kodonets tredje position troligen inte att påverka proteinprodukten [44] .
Denna egenskap kan förklaras av den tvetydiga basparhypotesen , föreslagen av Francis Crick . Enligt denna hypotes kanske den tredje nukleotiden i DNA-kodonet inte är helt komplementär till tRNA-antikodonet för att kompensera för skillnaden mellan antalet tRNA-typer och antalet kodon [45] [46] .
Kodoner av aminosyror med liknande fysikalisk-kemiska egenskaper är också ofta lika, på grund av vilka mutationer inte leder till betydande kränkningar av proteinstrukturen. Således kodar NUN-kodon (N är vilken nukleotid som helst) vanligtvis för hydrofoba aminosyror. NCN kodar för små aminosyror med måttlig hydrofobicitet, medan NAN kodar för medelstora hydrofila aminosyror. Den genetiska koden är arrangerad så optimalt vad gäller hydrofobicitet att matematisk analys med singularvärdesuppdelning av 12 variabler (4 nukleotider per 3 positioner) ger en signifikant korrelation (0,95) för att förutsäga hydrofobiciteten hos en aminosyra genom dess kodon [47] . Åtta aminosyror påverkas inte alls av mutationer i de tredje positionerna, och mutationer i den andra positionen leder som regel till ersättning av en aminosyra med helt andra fysikalisk-kemiska egenskaper. Men mutationer i de första positionerna har störst inverkan på proteinprodukten. Således kan mutationer som leder till att en laddad aminosyra ersätts med en aminosyra med motsatt laddning bara påverka den första positionen, och aldrig den andra. En sådan förändring av laddningen kommer sannolikt att ha en stark effekt på strukturen av proteinet [48] .
Tabellen nedan visar den genetiska koden som är gemensam för de flesta pro- och eukaryoter . Tabellen listar alla 64 kodonen och listar motsvarande aminosyror. Basordningen är från 5'- till 3'-änden av mRNA. Tre-bokstavs- och enbokstavsbeteckningar av aminosyror ges.
icke-polär | polär | grundläggande | syra | (stoppkodon) |
1:a basen |
2:a basen | 3:e basen | |||||||
---|---|---|---|---|---|---|---|---|---|
U | C | A | G | ||||||
U | UUU | (Phe/F) Fenylalanin | UCU | (Ser/S) Serine | UAU | (Tyr/Y) Tyrosin | UGU | (Cys/C) Cystein | U |
UUC | UCC | UAC | UGC | C | |||||
UUA | (Leu/L) Leucin | UCA | UAA | Stopp ( Ocker ) | UGA | Stopp ( Opal ) | A | ||
UUG | UCG | UAG | Stopp ( Amber ) | UGG | (Trp/W) Tryptofan | G | |||
C | CUU | CCU | (Pro/P) Proline | CAU | (His/H) Histidin | CGU | (Arg/R) Arginin | U | |
CUC | CCC | CAC | CGC | C | |||||
CUA | CCA | CAA | (Gln/Q) Glutamin | CGA | A | ||||
CUG | CCG | CAG | CGG | G | |||||
A | AUU | (Ile/I) Isoleucin | ACU | (Thr/T) Treonin | AAU | (Asn/N) Asparagin | AGU | (Ser/S) Serine | U |
AUC | ACC | AAC | AGC | C | |||||
AUA | ACA | AAA | (Lys/K) Lysin | AGA | (Arg/R) Arginin | A | |||
AUG [A] | (Met/M) Metionin | ACG | AAG | AGG | G | ||||
G | GUU | (Val/V) Valine | GCU | (Ala/A) Alanine | GAU | (Asp/D) Asparaginsyra | GGU | (Gly/G) Glycin | U |
GUC | GCC | GAC | GGC | C | |||||
GUA | GCA | GAA | (Glu/E) Glutaminsyra | GGA | A | ||||
GUG | GCG | GAG | GGG | G |
Ala /A | GCU, GCC, GCA, GCG | Leu/L | UUA, UUG, CUU, CUC, CUA, CUG |
---|---|---|---|
Arg /R | CGU, CGC, CGA, CGG, AGA, AGG | Lys/K | AAA, AAG |
Asn /N | AAU, AAC | Met/M | AUG |
Asp /D | GAU, GAC | Phe/F | UUU, UUC |
Cys /C | UGU, UGC | Stötta | CCU, CCC, CCA, CCG |
Gln /Q | CAA, CAG | Ser /S | UCU, UCC, UCA, UCG, AGU, AGC |
Lim | GAA, GAG | Thr /T | ACU, ACC, ACA, ACG |
Gly /G | GGU, GGC, GGA, GGG | Trp/W | UGG |
Hans /H | CAU, CAC | Tyr /Y | UAU, UAC |
Ile/I | AUU, AUC, AUA | Val/V | GUU, GUC, GUU, GUG |
START | AUG | SLUTA | UAG, UGA, UAA |
I vissa proteiner kodas icke-standardiserade aminosyror av stoppkodon, beroende på närvaron av en speciell signalsekvens i mRNA. Till exempel kan stoppkodonet UGA koda för selenocystein , medan UAG kan koda för pyrrolysin . Selenocystein och pyrrolysin anses vara de 21:a respektive 22:a proteinogena aminosyrorna. Till skillnad från selenocystein har pyrrolysin sitt eget aminoacyl-tRNA-syntetas [50] . Även om vanligtvis den genetiska koden som används av en organisms celler är fixerad, kan den arkeiska Acetohalobium arabaticum byta från en 20-aminosyrakod till en 21-aminosyrakod (inklusive pyrrolysin) under olika tillväxtförhållanden [51] .
Förekomsten av avvikelser från den genetiska standardkoden förutspåddes redan på 1970-talet [52] . Den första avvikelsen beskrevs 1979 i mänskliga mitokondrier [53] . Därefter beskrevs flera alternativa genetiska koder något annorlunda än standarden, inklusive alternativa mitokondriella koder [54] .
Till exempel, i bakterier av släktet Mycoplasma , kodar UGA-stoppkodonet för tryptofan, medan i jäst från den så kallade "CTG- kladen " (inklusive den patogena arten Candida albicans ), kodar CUG-kodonet för serin och inte leucin, som i den genetiska standardkoden [55] [56] [57] . Eftersom virus använder samma genetiska kod som sina värdceller, kan avvikelser från den genetiska standardkoden störa virusreplikationen [ 58] . Men vissa virus, såsom virus av släktet Totivirus , använder samma alternativa genetiska kod som värdorganismen [59] .
I bakterier och archaea fungerar GUG och UUG ofta som startkodon [60] . Det finns också vissa avvikelser från den genetiska standardkoden i det mänskliga kärngenomet : till exempel i 4 % mRNA av malatdehydrogenasenzymet kodar ett av stoppkodonen för tryptofan eller arginin [61] . Värdet av ett stoppkodon beror på dess miljö [30] . Avvikelser i den genetiska koden för en organism kan detekteras genom att hitta mycket konservativa gener i dess genom och jämföra deras kodon med motsvarande aminosyror i homologa proteiner från närbesläktade organismer. FACIL-programmet fungerar enligt denna princip, som beräknar frekvensen med vilken varje kodon motsvarar en viss aminosyra, och bestämmer även stödet för ett stoppkodon och presenterar resultatet i form av en logotyp (LOGO) [62] . Men trots alla dessa skillnader är de genetiska koderna som används av alla organismer i stort sett lika [63] .
Tabellen nedan listar för närvarande kända icke-standardiserade genetiska koder [64] [65] . Det finns 23 icke-standardiserade genetiska koder, med den vanligaste skillnaden från den vanliga genetiska koden är omvandlingen av UGA-stoppkodonet till ett sense-kodon som kodar för tryptofan [66] .
Lista över icke-standardiserade genetiska koderBiokemiska egenskaper hos aminosyror | icke-polär | polär | huvud | sur | Avslutning: stoppkodon |
Koden | Översättningstabell _ |
DNA-kodon | RNA-kodon | Sänd med denna kod |
Standardsändning | Anteckningar | ||
---|---|---|---|---|---|---|---|---|
Standard | ett | Inkluderar översättningstabell 8 ( växtkloroplaster ) | ||||||
Vertebrat mitokondriell kod | 2 | AGA | AGA | Ter (*) | Arg (R) | |||
AGG | AGG | Ter (*) | Arg (R) | |||||
ATA | AUA | Träffade (M) | Ile (I) | |||||
TGA | UGA | TRP (W) | Ter (*) | |||||
Mitokondriell genetisk kod för jäst | 3 | ATA | AUA | Träffade (M) | Ile (I) | |||
CTT | CUU | Thr (T) | Leu (L) | |||||
CTC | CUC | Thr (T) | Leu (L) | |||||
CTA | CUA | Thr (T) | Leu (L) | |||||
CTG | CUG | Thr (T) | Leu (L) | |||||
TGA | UGA | TRP (W) | Ter (*) | |||||
CGA | CGA | frånvarande | Arg (R) | |||||
CGC | CGC | frånvarande | Arg (R) | |||||
Mitokondriell genetisk kod för slemmögel, protozoer, cnidarians och den genetiska koden för Mycoplasma och Spiroplasma | fyra | TGA | UGA | TRP (W) | Ter (*) | Inkluderar översättningstabell 7 ( kinetoplast ) | ||
Mitokondriell kod för ryggradslösa djur | 5 | AGA | AGA | Ser (S) | Arg (R) | |||
AGG | AGG | Ser (S) | Arg (R) | |||||
ATA | AUA | Träffade (M) | Ile (I) | |||||
TGA | UGA | TRP (W) | Ter (*) | |||||
Genetisk kod för ciliater, Dasycladacea och Hexamita | 6 | TAA | UAA | Gln (Q) | Ter (*) | |||
MÄRKA | UAG | Gln (Q) | Ter (*) | |||||
Mitokondriell genetisk kod för tagghudingar och plattmaskar | 9 | AAA | AAA | Asn (N) | Lys (K) | |||
AGA | AGA | Ser (S) | Arg (R) | |||||
AGG | AGG | Ser (S) | Arg (R) | |||||
TGA | UGA | TRP (W) | Ter (*) | |||||
Genetisk kod för Euplotidae | tio | TGA | UGA | Cys (C) | Ter (*) | |||
Genetisk kod för bakterier, arkéer och plastider från växter | elva | Se översättningstabell 1 | ||||||
Alternativ genetisk kod för jäst | 12 | CTG | CUG | Ser (S) | Leu (L) | |||
Mitokondriell genetisk kod för ascidianer | 13 | AGA | AGA | Gly (G) | Arg (R) | |||
AGG | AGG | Gly (G) | Arg (R) | |||||
ATA | AUA | Träffade (M) | Ile (I) | |||||
TGA | UGA | TRP (W) | Ter (*) | |||||
Alternativ mitokondriell genetisk kod för plattmaskar | fjorton | AAA | AAA | Asn (N) | Lys (K) | |||
AGA | AGA | Ser (S) | Arg (R) | |||||
AGG | AGG | Ser (S) | Arg (R) | |||||
TAA | UAA | Tyr (Y) | Ter (*) | |||||
TGA | UGA | TRP (W) | Ter (*) | |||||
Genetisk kod för Blepharisma | femton | MÄRKA | UAG | Gln (Q) | Ter (*) | |||
Mitokondriell genetisk kod för Chlorophycia | 16 | MÄRKA | UAG | Leu (L) | Ter (*) | |||
Mitokondriell genetisk kod för trematoder | 21 | TGA | UGA | TRP (W) | Ter (*) | |||
ATA | AUA | Träffade (M) | Ile (I) | |||||
AGA | AGA | Ser (S) | Arg (R) | |||||
AGG | AGG | Ser (S) | Arg (R) | |||||
AAA | AAA | Asn (N) | Lys (K) | |||||
Mitokondriell genetisk kod för Scenedesmus obliquus | 22 | TCA | UCA | Ter (*) | Ser (S) | |||
MÄRKA | UAG | Leu (L) | Ter (*) | |||||
Mitokondriell genetisk kod för Thraustochytrium | 23 | TTA | UUA | Ter (*) | Leu (L) | Liknar översättningstabell 11. | ||
Mitokondriell genetisk kod för vinggälar | 24 | AGA | AGA | Ser (S) | Arg (R) | |||
AGG | AGG | Lys (K) | Arg (R) | |||||
TGA | UGA | TRP (W) | Ter (*) | |||||
Genetisk kod för möjliga grupper SR1 och Gracilibacteria | 25 | TGA | UGA | Gly (G) | Ter (*) | |||
Genetisk kod för Pachysolen tannophilus | 26 | CTG | CUG | Ala (A) | Leu (L) | |||
Genetisk kod för Karyorelictea | 27 | TAA | UAA | Gln (Q) | Ter (*) | |||
MÄRKA | UAG | Gln (Q) | Ter (*) | |||||
TGA | UGA | Ter (*) | eller | TRP (W) | Ter (*) | |||
Genetisk kod för Condylostoma | 28 | TAA | UAA | Ter (*) | eller | Gln (Q) | Ter (*) | |
MÄRKA | UAG | Ter (*) | eller | Gln (Q) | Ter (*) | |||
TGA | UGA | Ter (*) | eller | TRP (W) | Ter (*) | |||
Genetisk kod för Mesodinium | 29 | TAA | UAA | Tyr (Y) | Ter (*) | |||
MÄRKA | UAG | Tyr (Y) | Ter (*) | |||||
Genetisk kod för Peritrichia | trettio | TAA | UAA | Glu (E) | Ter (*) | |||
MÄRKA | UAG | Glu (E) | Ter (*) | |||||
Genetisk kod för Blastocrithidia | 31 | TAA | UAA | Ter (*) | eller | Gln (Q) | Ter (*) | |
MÄRKA | UAG | Ter (*) | eller | Gln (Q) | Ter (*) | |||
TGA | UGA | TRP (W) | Ter (*) |
I många organismers genom observeras den så kallade kodonpreferensen, det vill säga förekomstfrekvensen av alla synonyma kodon som motsvarar en viss aminosyra är inte lika och för vissa kodon är den högre än för andra [67] [ 68] . Den evolutionära grunden för uppkomsten av kodonpreferens är oklar. Enligt en hypotes är de kodon som muterar oftast mindre vanliga. En annan hypotes säger att kodonpreferensen regleras av naturligt urval till förmån för de som ger störst effektivitet och noggrannhet av genuttryck [69] [70] . Kodonpreferens är starkt förknippad med GC-innehållet i genomet, och i vissa fall kan GC-innehåll till och med förutsäga frekvensen av kodonanvändning [71] . Ur en funktionell synvinkel är kodonpreferens associerad med effektiviteten och noggrannheten av translation och därför nivån av genuttryck [72] [73] .
För närvarande är den mest accepterade hypotesen för livets ursprung på jorden RNA-världshypotesen . Varje modell av ursprunget till den genetiska koden använder hypotesen om överföring av grundläggande funktioner från RNA-enzymer ( ribozymer ) till proteinenzymer. Som RNA-världshypotesen antyder, dök tRNA före aminoacyl-tRNA-syntetaser, så dessa enzymer kunde inte påverka egenskaperna hos tRNA [74] .
Den genetiska koden för den sista universella gemensamma förfadern (LUCA) var troligen baserad på DNA snarare än RNA [75] . Den genetiska koden bestod av tre nukleotidkodon, och totalt fanns det 64 olika kodon. Eftersom endast 20 aminosyror användes för att bygga proteiner , kodades vissa aminosyror av flera kodoner [76] [77] [78] [79] .
Om överensstämmelsen mellan kodon och aminosyror var slumpmässig, skulle 1,5 × 10 84 genetiska koder existera i naturen [80] . Detta antal erhölls genom att beräkna antalet sätt på vilka 21 objekt (20 aminosyrakodon och ett stoppkodon) kunde sorteras i 64 fack så att varje objekt användes minst en gång [81] . Men överensstämmelsen mellan kodon och aminosyror är inte slumpmässig [82] . Aminosyror som delar en gemensam biosyntetisk väg tenderar att dela den första kodonpositionen. Detta faktum kan vara en rest av en tidigare, enklare genetisk kod som innehöll färre aminosyror än den moderna och gradvis inkluderade alla 20 aminosyrorna [83] . Aminosyrakodon med liknande fysikalisk-kemiska egenskaper tenderar också att vara liknande, vilket mildrar effekterna av punktmutationer och translationsstörningar [84] [85] .
Eftersom den genetiska koden inte är slumpmässig, bör en rimlig hypotes om dess ursprung förklara sådana egenskaper hos den genetiska standardkoden som frånvaron av kodoner för D -aminosyror, inkluderingen av endast 20 aminosyror av 64 möjliga, begränsningen av synonyma substitutioner till den tredje positionen av kodon, funktion av kodon som stoppkodon UAG, UGA och UAA [86] . Det finns tre huvudhypoteser för ursprunget till den genetiska koden. Var och en av dem representeras av många modeller, många modeller är hybrid [87] .
Ordböcker och uppslagsverk | |
---|---|
I bibliografiska kataloger |
|