Otranslaterade regioner ( NTR , engelska untranslated regions, UTR ) är speciella mRNA- regioner som inte fungerar som en mall för proteinsyntes och som ligger intill den translaterade regionen på båda sidor (det vill säga den på mallen som proteinet syntetiseras av) ). Det finns två sådana regioner: 5'-otranslaterad region, eller 5'- UTR ( eng. 5'-otranslaterad region, 5'UTR ) och 3'-otranslaterad region, eller 3'- UTR ( eng. 3'-otranslaterad region , 3' UTR ) belägen vid 5'- respektive 3'-terminalen av mRNA:t [1] . DNA- segmenten som motsvarar 5'-UTR och 3'-UTR av transkriptet har samma namn [2] .
Oöversatta regioner är involverade i regleringen av lokalisering, translation och nedbrytning av transkriptet där de är belägna. De kännetecknas av närvaron av hårnålar , interna initiatorkodon och öppna läsramar , ribosombindningsställen , olika cis-regulatoriska element som binder till RNA- bindande proteiner [3] . Så de innehåller sådana element som IRES , uORF , ARE [3] , Shine-Dalgarno-sekvensen , riboswitch och andra [4] .
Analys av genomen från olika organismer visade närvaron av ett antal konservativa egenskaper inneboende i oöversatta regioner. Den totala längden av 5'-UTR är ungefär densamma bland alla taxonomiska grupper av eukaryoter och sträcker sig från 100 till 200 nukleotider (i jästen Schizosaccharomyces pombe är dock längden av 5'-UTR i ste11-transkriptet 2273 nukleotider [5] ). Samtidigt är längden på 3'-UTR mycket mer varierande och kan variera från 200 nukleotider i växter och vissa djur till 800 nukleotider hos människor och andra ryggradsdjur . Slående är det faktum att längden på både 5'- och 3'-UTR varierar avsevärt inom samma art : det kan ta ett värde från 12 till flera tusen nukleotider [6] . Det har faktiskt visats i ett in vitro -system som modellerar den genetiska apparaten hos däggdjur att även en 5'-UTR på 1 nukleotid kan ge normal translationsinitiering [7] .
En sektion av genomiskt DNA som motsvarar otranslaterade regioner av mRNA kan innehålla introner och oftare i 5'-regionen än i 3'-regionen. Cirka 30 % av Metazoa -gener har regioner som motsvarar 5'-UTR, som endast består av exoner , medan 3'-UTR, även om den är längre, har mycket färre introner. Den totala andelen av längden av introner från den totala längden i 3'-UTR är 1–11 %. Bildandet av alternativa otranslaterade regioner sker med användning av olika transkriptionsstart-, polyadenylerings- och splitsningsställen . Beroende på vävnaden , utvecklingsstadiet , närvaron av ett sjukdomstillstånd, kan antalet alternativa icke-översatta regioner förändras, och de kan signifikant påverka uttrycket av vissa gener [8] .
Bassammansättningen skiljer sig också i 3'- och 5'-UTR . Till exempel är innehållet av G + C högre i 5'-UTR än i 3'-UTR. Denna skillnad är särskilt märkbar i mRNA från varmblodiga ryggradsdjur, där innehållet av G+C i 5'-UTR är 60 % och i 3'-UTR är det 45 % [6] . Det finns också ett bestämt samband mellan innehållet av G+C i 5'-UTR och 3'-UTR och de tredje positionerna i kodonen för den motsvarande translaterade regionen. Ett viktigt omvänt samband har också hittats mellan G+C-innehållet i 5'-UTR och 3'-UTR och deras längder [9] . I synnerhet är det känt att gener lokaliserade i GC-rika regioner av kromosomer (tunga isokorer) har kortare 5'-UTRs och 3'-UTRs än gener lokaliserade i isokorer som är fattigare i GC. Ett liknande förhållande har visats för kodande sekvenser och introner [10] .
Slutligen, i de otranslaterade regionerna av eukaryot mRNA, hittades närvaron av upprepade sekvenser av olika typer, till exempel SINEs (inklusive Alu-repetitioner ) och LINEs , minisatelliter och mikrosatelliter . Hos människor är mRNA-upprepningar 12% 5'-UTR och 36% 3'-UTR; i andra taxa, inklusive andra däggdjur , har en lägre halt av upprepningar visats [3] .
Otranslaterade regioner utför nyckelfunktioner i post-transkriptionell reglering av genuttryck, inklusive modulering av mRNA-transport från kärnan , reglering av intracellulär mRNA-lokalisering [11] , dess stabilitet [12] och translationseffektivitet [13] . Oöversatta regioner kan också spela en roll i andra processer, till exempel vid samtranslationell inkludering av den icke-standardiserade aminosyran selenocystein vid UGA- kodonet (vanligtvis ett stoppkodon) av mRNA som kodar för selenoproteiner (denna process involverar en konserverad hårnål placerad i 3'-UTR - SECIS-elementet ) [14] . Vikten av oöversatta regioner i regleringen av genuttryck bekräftas också av det faktum att mutationer som påverkar dessa regioner kan leda till allvarliga patologier [15] (för mer information om sjukdomar orsakade av mutationer i NTR, se nedan).
Reglering av otranslaterade mRNA-regioner kan förmedlas på flera sätt. Nukleotidmotiv lokaliserade vid 3'-UTR och 5'-UTR kan interagera med specifika RNA-bindande proteiner. Till skillnad från regulatoriska element lokaliserade i DNA, där den primära strukturen av DNA (det vill säga sekvensen av nukleotider) spelar en ledande roll, bestäms den biologiska aktiviteten hos regulatoriska motiv lokaliserade på RNA av både deras primära och sekundära strukturer . Dessutom har nyckelroller i reglering visats för interaktioner mellan regioner av oöversatta regioner och specifika komplementära icke-kodande RNA , i synnerhet miRNA [16] . Slutligen är exempel på upprepande element som är viktiga för regleringen av genuttryck på RNA-nivå kända, till exempel kan CUG-bindande proteiner interagera med CUG-upprepningar i 5'-UTR av ett specifikt mRNA (till exempel kodande för transkriptionsfaktor C/EBPβ) och därigenom påverka translationseffektiviteten [17] .
Effektiviteten av mRNA-translation kan vara olika, därför är reglering av mängden av det resulterande proteinet möjlig. Detta är en viktig mekanism för att reglera genuttryck. Faktum är att endast för utsöndrade proteiner finns det ett tydligt samband mellan mängden mRNA och protein (ju mer mRNA, desto mer protein). I proteiner avsedda för intracellulär användning är detta förhållande till stor del förvrängt av de olika translationshastigheterna för olika mRNA [18] .
Strukturella egenskaper hos 5'-UTR är viktiga för kontrollen av översättning. Det har visats att mRNA som kodar för proteiner involverade i utvecklingsprocesser, till exempel tillväxtfaktorer , transkriptionsfaktorer eller produkter av proto-onkogener (proteiner som kräver exakt kontroll av uttrycket), har en 5'-UTR längre än genomsnittet [19] , som innehåller initieringskodon ( engelska uppströms initieringskodon ) och öppna läsramar , såväl som stabila element av den sekundära strukturen som förhindrar translationsprocessen (till exempel quadruplexes ). Andra specifika motiv och sekundära strukturelement i 5'-UTR kan modulera effektiviteten av translation [3] .
Normalt, efter att mRNA:t flyttats från kärnan till cytoplasman , sätts eIF4F-proteinkomplexet ihop i cap -regionen belägen vid 5'-änden av mRNA:t. Detta komplex inkluderar 3 subenheter: eIF4E (cap-bindande protein); eIF4A med helikasaktivitet ; eIF4G interagerar med olika andra proteiner, inklusive det polyadenylatbindande proteinet. Den ATP -beroende helikasaktiviteten hos eIF4A, stimulerad av det RNA-bindande proteinet eIF4B, säkerställer avvecklingen av alla element i mRNA:s sekundära struktur, vilket resulterar i bildandet av ett "landningsställe" för den lilla (40S) ribosomsubenheten [20 ] . Om translation begränsas av antalet ribosomer eller koncentrationen av translationsfaktorer, kan 3'-poly(A)-svansen interagera med 5'-kapseln, vilket förbättrar translationsinitieringen genom att introducera ett polyadenylatbindande protein som kan interagera med eIF4F-komplex [21] .
Man tror att i eukaryota mRNA börjar translation med det första AUG-kodonet (startkodonet) som ribosomen möter längs sin väg från 5'- till 3'-änden. Sekvenserna som omger startkodonen är icke-slumpmässiga och utgör Kozak-konsensussekvensen . Hos däggdjur är denna sekvens: , och de mest konserverade nukleotiderna är R ( purin , vanligtvis A ) i position -3 i AUG och G i position +4 av AUG. Det strikta arrangemanget av A i −3-läget och G i +4-läget är också karakteristiskt för andra djur, växter och svampar . Sekvenserna som utgör AUG-miljön (som delvis sträcker sig in i den oöversatta regionen) kan modulera translationens effektivitet genom att tillhandahålla en lämplig miljö för initiering [3] . GCCRCCaugG
Det bör noteras att 15 % till 50 % av 5'-UTR innehåller AUG-startkodonet internt. Därför är regeln enligt vilken ribosomen startar translation från det första startkodonet som den möter när den förflyttar sig från 5'- till 3'-änden av mRNA:t inte alltid uppfylld. Detta innebär att ibland kan ribosomen hoppa över AUG-tripletterna den möter och starta translation från ett mer avlägset startkodon, möjligen för att dessa tripletter har en "svag" nukleotidmiljö. Således kan flera olika proteiner syntetiseras från ett mRNA [22] . Dessutom fann man att närvaron av interna AUG-kodon i 5'-UTR korrelerar med en ökad längd av denna region och en "svagare" miljö för det vanliga startkodonet, och i transkript med en optimal miljö för start-AUG , den 5'-otranslaterade regionen är kort och innehåller inte AUG [23] . I detta avseende kan AUGs i 5'-UTR reducera nivån av translation av deras mRNA.
Om det i 5'-UTR efter den interna AUG, men före huvudstartkodonet, finns ett internt stoppkodon, så bildas en kort öppen läsram ( engelska uppströms öppen läsram, uORF ). Efter translation av uORF och dissociation från mRNA från den stora (60S) ribosomsubenheten kan ödet för den lilla subenheten vara annorlunda, och detta kan påverka translationseffektiviteten och mRNA-stabiliteten. Den lilla subenheten kan stanna kvar på mRNA:t, återuppta läsningen och starta translation från det underliggande AUG-kodonet, eller så kan den lämna mRNA:t och därigenom sänka translationsnivån för den öppna huvudläsramen. Hos eukaryoter begränsas ribosomens förmåga att återuppta translation, dels av stoppkodon [24] och dels av uORF-längden: om uORF-längden överstiger 30 kodoner [25] kommer ribosomen inte att kunna återupptas översättning. På detta sätt blockeras översättningen av mRNA som innehåller uORF som kodar för jästtranskriptionsfaktorer GCN 4 och YAP 1 [26] .
Den sekundära strukturen för 5'-UTR spelar en viktig roll i regleringen av översättning. Experimentella data visar att måttligt stabila element i den sekundära strukturen (värdet av fri energiförändring ΔG över -30 kcal/mol), som direkt innehåller startkodonet AUG, inte stoppar den lilla subenheten av ribosomen. Mycket stabila strukturer (ΔG under -50 kcal/mol) har en betydande effekt på translationseffektiviteten, vilket minskar den. En ökning av koncentrationen av eIF4A bidrar till att övervinna påverkan av sådana strukturer [27] .
Det finns en alternativ translationsinitieringsmekanism som inte är associerad med 5'-kapseln. Det beskrevs först i picornavirus [28] . I detta fall finns det inuti 5'-UTR en speciell sekvens som tjänar till att binda ribosomen - IRES . Därefter hittades IRES i många cellulära mRNA som kodar för regulatoriska proteiner, till exempel c-Myc proto-onkogenprodukter , homeodomänproteiner , tillväxtfaktorer (till exempel fibroblasttillväxtfaktor FGF2 [ ), såväl som deras receptorer [3] . Jämförande analys av kända cellulära IRES gjorde det möjligt att isolera ett gemensamt strukturellt motiv som är karakteristiskt för mRNA som innehåller dem. Speciellt för mRNA från immunglobulinets tunga kedja-bindande protein (BiP) och mRNA från FGF-2-proteinet har en Y-formad hårnål beskrivits , belägen omedelbart före startkodonet AUG [29] . Det har fastställts att korta strukturella motiv som är komplementära till litet ribosomalt RNA också kan fungera som IRES [30] .
Sekvenser som är mål för trans -fungerande RNA-bindande proteiner kan också vara involverade i regleringen av translation. Till exempel kan det järnkänsliga elementet IRE ( järnkänsligt element ) lokaliserat i det 5'-UTR-mRNA som kodar för proteiner involverade i järnmetabolism ( ferritin , 5-aminolevulinatsyntas och akonitas ) blockera translation. I detta fall sker järnberoende bindning av järnmetabolismproteiner, vilket undertrycker den normala skanningen av mRNA, utförd av den lilla subenheten av ribosomen under initieringen av translation. Slutligen innehåller de flesta ryggradsdjurs-mRNA som kodar för ribosomala proteiner och translationsförlängningsfaktorer en 5'-terminal oligopyrimidinkanal ( TOP ) omedelbart intill locket. Detta område krävs för koordinerad translationell repression under tillväxt, differentiering och utvecklingsförseningar, och aktiveras också av vissa läkemedel [31] .
Ödet för mRNA är en annan nyckelpunkt i den post-transkriptionella regleringen av genuttryck, eftersom i frånvaro av förstörelse av vissa mRNA kommer deras antal att öka, vilket innebär att mängden protein de kodar för kommer att öka, vilket kan påverka uttrycket av vissa gener. Flera möjliga mekanismer för mRNA-nedbrytning har föreslagits: dess nedbrytning kan utlösas genom att förkorta eller lossna 3'-poly(A)-svansen eller 5'-locket [32] . Ödet för mRNA regleras huvudsakligen av cis -regulatoriska element belägna i 3'-UTR, såsom AU-rika element ( AREs ), som utlöser mRNA-nedbrytning under påverkan av olika intra- och extracellulära signaler. Enligt tillgängliga experimentella data delades ARE in i 3 klasser: medlemmar av klass I och II kännetecknas av närvaron av flera kopior av pentanukleotiden AUUUA, som inte finns i medlemmar av klass III [33] . Klass I ARE kontrollerar cytoplasmatisk deadenylering genom att bryta ned hela poly(A)-svansen i samma hastighet för alla transkript, först bildar intermediärer med en poly(A)-svans på 30–60 nukleotider, som sedan bryts ned fullständigt. Sådana element finns huvudsakligen i mRNA som kodar för nukleära transkriptionsfaktorer, såsom c-Fos och c-Myc (produkter av "snabbsvars"-gener), såväl som mRNA som kodar för vissa cytokiner , såsom interleukiner 4 och 6 . En strukturell egenskap hos klass I ARE är närvaron av en eller flera kopior av pentanukleotiden AUUUAefter den U-rika regionen. Klass II ARE driver asynkron cytoplasmatisk deadenylering (dvs poly(A)-svansen av olika transkript bryts ned i olika hastigheter), vilket resulterar i mRNA utan poly(A)-svansen. De mRNA som innehåller sådana element inkluderar mRNA från cytokinerna GM-CSF, interleukin 2 , tumörnekrosfaktor a (TNF-a), interferon -a . En strukturell egenskap hos AREs av den andra klassen är närvaron av tandem -pentanukleotidupprepningar AUUUA, och den AU-rika regionen är belägen före dessa upprepningar. Klass III ARE saknar en pentanukleotid AUUUAoch har bara en U -rik region. Ett sådant element finns till exempel i det mRNA som kodar för c-Jun. Kinetiken för mRNA-nedbrytning i detta fall liknar den för AREs I [3] .
mRNA-nedbrytning kan också inträffa på grund av endonukleasaktivitet , och denna mekanism är beroende av både deadenylering och decapping. Denna mekanism har hittats i mRNA som kodar för transferrinreceptorn . Nedbrytningen av dessa mRNA inkluderar endonukleasklyvning av 3'-UTR, där IRE-igenkänning är ett mellansteg och reglering bestäms av intracellulära järnnivåer [34] .
Initiatorkodonen i 5'-UTR och uORF kan också spela en roll i en speciell mekanism för nonsens -medierad mRNA-nedbrytning ( nonsens - medierad mRNA-nedbrytning ) . Signalen som utlöser denna väg är ett meningslöst kodon, följt av en koppling mellan två exoner som bildas under skarvningen - ett exon skarvningskomplex , eller EJC ( engelsk Exon junction complex ) [35] (närvaron av en sådan koppling skiljer ett prematurt terminatorkodon åt. från den huvudsakliga, eftersom stoppkodonet och 3'-UTR är belägna efter det sista exonet). Exon junctions känns igen av markörproteiner som fäster till det obearbetade transkriptet medan de fortfarande är i kärnan och förblir associerade med det efter mRNA-bearbetning och överföring till cytoplasman [36] . I fallet med mRNA av vildtyp (dvs "icke-defekta"), tar translationsmaskineriet bort markörproteinet för att förhindra nedbrytning av transkriptet. Om ribosomen möter ett för tidigt stoppkodon eller om uORFs finns i transkriptet, sönderdelas det, och det defekta mRNA:t märkt med markörproteiner är involverat i NMD [37] . I jästen Saccharomyces cerevisiae (de har en andra signal som utlöser NMD - nedströms exoniska element ( DSE) ), bryts inte mRNA som innehåller funktionellt aktiva uORFs, till exempel kodande för GCN 4 och YAP 1 , ned längs NMD-vägen. uORF och den kodande sekvensen finns mRNA-specifika stabiliserande sekvenser som förhindrar NMD-aktivering på grund av interaktion med det RNA-bindande ubiquitinligaset Pub1 [ 38 ] .
uORFs kan också reglera mRNA-stabilitet oberoende av NMD. 5'-UTR av mRNA från YAP2-genen av S. cerevisiae innehåller 2 uORFs, som undertrycker transkriptavsökning av ribosomen och främjar mRNA-nedbrytning [26] . Den destabiliserande effekten beror på miljön för terminatorkodonet, som reglerar translationseffektivitet och mRNA-stabilitet.
Flera studier tyder på att många heterogena nukleära ribonukleoproteiner (hnRNPs) fungerar bara i kärnan, utan också styr ödet för mRNA i cytoplasman [39] , reglerar translation, mRNA-stabilitet och dess lokalisering i cytoplasman [37] . Ett exempel är amyloidprekursorproteinet ( APP ) . En ökning av APP-innehållet är en viktig faktor i utvecklingen av Alzheimers sjukdom . Stabiliteten av APP-mRNA beror på ett mycket konserverat 29-nukleotidelement beläget i 3'-UTR och interagerar med olika RNA-bindande cytoplasmatiska proteiner [40] .
Kontrollen av genuttryck på post-transkriptionell nivå, utförd av icke-translaterade regioner, är särskilt viktig under utveckling. Det asymmetriska arrangemanget av vissa mRNA i cellen leder till ett asymmetriskt arrangemang av proteinerna som kodas av dem. Detta är den mest bekväma mekanismen för proteinlokalisering, eftersom ett mRNA kan fungera som en mall för flera omgångar av translation. I många fall är mRNA lokaliserade i ribonukleoproteinkomplex tillsammans med proteiner från translationsapparaten, vilket garanterar den nödvändiga effektiviteten av translation [3] .
Det finns tre huvudmekanismer för det asymmetriska arrangemanget av mRNA:
Myelin basic protein ( MBP) mRNA levereras till processerna av oligodendrocyter som bildar myelinskidan av CNS -axoner genom aktiv riktad transport . Hos möss transporteras och lokaliseras mRNA av speciella signalsekvenser som finns i 3'-UTR: RNA-transportsignalen (21 nukleotider lång) och ett ytterligare element, RNA-lokaliseringsregionen [41] .
Många exempel på lokal transkriptstabilisering har hittats i de tidiga stadierna av Drosophila -utvecklingen . Således bryts transkripten som kodar för det RNA-bindande proteinet Nanos och värmechockproteinet Hsp83 överallt utom i cytoplasman vid embryots bakre pol . Olika cis-regulatoriska element belägna i 3'-UTR av respektive mRNA är ansvariga för både nedbrytningen av dessa mRNA genom hela embryot och deras stabilisering vid den bakre änden av embryot [42] .
Fenomenet med miljöbestämd mRNA-diffusion demonstreras väl av mRNA från Bicoid- proteinet i Drosophila. Elementen som är involverade i nyckelsteget i denna process, transkriptförankring, beskrivs inte fullständigt, men ett av de involverade proteinerna, Staufen , är ett dsRNA-bindande protein som krävs för att stoppa Bicoid i den främre änden av embryot [43 ] .
I alla ovanstående exempel reglerades lokalisering av cis-regulatoriska element belägna i 3'-UTR, men sådana element belägna i 5'-UTR och till och med kodningsregionen är också kända. Sådana element är kända som mRNA-arkiveringskoder ( eng. mRNA zip codes ), de interagerar med motsvarande bindande proteiner ( eng. zip-code-bindande proteiner ), till exempel den redan nämnda Staufen. Arkiveringskoder saknar likhet i primär och sekundär struktur . De kan ha en komplex (komplex) sekundär och tertiär struktur , där den primära strukturen ( nukleotidsekvensen ) inte är lika viktig som den rumsliga strukturen [44] , utan tvärtom, de kan vara korta nukleotidsekvenser [45] , ibland ingår i upprepande element (till exempel i fallet med Vg1 transkriptet i grodan Xenopus [46] ).
Alternativ splitsning är det viktigaste sättet att generera olika mRNA från ett originaltranskript, som kodar för samma eller olika proteiner. I detta fall, förutom långa proteinkodande mRNA, kan icke-kodande RNA också bildas. Det klyvda mRNA:t kan genomgå en återkapslingsprocess för att bilda ett mRNA med en trunkerad 5' otranslaterad region eller kodande endast för ett fragment av det ursprungliga proteinet. Dessutom är det känt att 3'-UTR-fragment som bildas under alternativ splitsning kan börja fungera som trans-regulatoriska icke-kodande RNA, oberoende av huvud-RNA [47] .
Det är känt att mRNA kan stängas in i en loop (cirkularisering) på grund av interaktionen av specifika proteiner som binder till poly(A)-svansen , vilket främjar bindningen av eIF4F-faktorn till locket . Som ett resultat får mRNA en sluten form, translationsinitiering stimuleras och translationseffektiviteten ökas. Men i vissa fall kan 5'-UTR och 3'-UTR av samma mRNA binda komplementärt till varandra. Således har mRNA från den humana genen som kodar för transkriptionsfaktorn p53 regioner i 5'-UTR och 3'-UTR som är komplementära till varandra. Genom att binda till varandra och till translationsfaktorn RPL26 ökar de därmed effektiviteten av translation, vilket är en av anledningarna till den snabba ackumuleringen av p53-proteinet som svar på DNA- skada [48] .
Analys av mRNA från olika mänskliga gener visade att 5'-UTR innehåller motivet som specifikt interagerar med 3'-ändarna av miRNA, medan många av dessa mRNA har ett ställe som är komplementärt till 3'-UTR i 5'-änden . Ytterligare studier har visat att bindning av 5'-UTR till miRNA underlättar bindningen av 5'-änden av mRNA till 3'-änden, och mRNA vars aktivitet bestäms starkt av miRNA har förutsägbara bindningsställen på båda UTR. Sådana mRNA kallas miBridge. Det visade sig vidare att förlusten av dessa bindningsställen minskade miRNA-driven repression av transkriptöversättning. Således fann man att bindningsställen för NTO:er med varandra är nödvändiga för undertryckande av mRNA-translation. Detta indikerar att den komplementära interaktionen mellan 5'-UTR och 3'-UTR är nödvändig för exakt reglering av genuttryck [49] .
Bakteriellt mRNA innehåller också 5'- och 3'-otranslaterade regioner [51] [52] . Längden på 5'-UTR för bakterier är mycket mindre än för eukaryoter och är vanligtvis 3-10 nukleotider. Till exempel är längden på 5'-UTR-transkriptet av Escherichia coli laktosoperon endast 7 nukleotider [53] . I bakteriers 5'-UTR är Shine-Dalgarno-sekvensen ( ) [54] lokaliserad , som tjänar till att binda ribosomen och separeras med en spacer från startkodonet AUG. Även om 5'-UTR för bakterier och eukaryoter är olika, visades det att tillägget av CC-nukleotider till mRNA-spacern av Ner -genen av bakteriofag Mu , som är väl uttryckt i Escherichia coli- och Streptomyces- celler , ledde till framgångsrikt uttryck av denna gen i retikulocytceller från kanin [55] . AGGAGG
Element av den sekundära strukturen lokaliserade i 5'-UTR har som regel en undertryckande effekt på translation [56] . I synnerhet är det i 5'-UTR som attenuatorer vanligtvis är lokaliserade - element av operoner som orsakar för tidig avslutning av translation [57] (det mest kända exemplet på dämpning är uttrycket av tryptofanoperonet ).
Dessutom är 5'-UTR av bakterier värd för de flesta av riboswitcharna [58] - mRNA-reglerande element som kan binda till små molekyler , vilket leder till en förändring i effektiviteten av proteinbildning som kodas av detta mRNA [59] .
Till skillnad från eukaryoter är långa 3'-UTR sällsynta i bakterier och dåligt förstådda. Vissa bakterier, särskilt Salmonella enterica , är dock kända för att ha eukaryotliknande mRNA med långa 3'-UTR (i S. enterica är detta hilD- mRNA ). Det antas att hilD 3'-UTRs utför olika funktioner, i synnerhet påverkar de omsättningen av deras mRNA, eftersom deletionen av dessa regioner orsakade en ökning av mängden av motsvarande mRNA [60] .
Oöversatta regioner finns också i mRNA från många arkéer . I synnerhet, i 5'- och 3'-UTR:erna av mRNA:erna från den metanocaldococcus jannaschii (som i andra medlemmar av Methanopyrales- och Methanococcales- ordningarna ) är SECIS- elementet lokaliserat , vilket är ansvarigt för insättningen av aminosyran selenocystein in i polypeptidkedjan [ 61] .
Det har fastställts att mRNA från de flesta haloarchaea , såväl som Pyrobaculum och Sulfolobus , saknar en uttalad 5'-UTR, men mRNA från arkaeametanogener har lång 5'-UTR. I detta avseende antas det att mekanismen för translationsinitiering i metanogena archaea kan skilja sig från den för andra representanter för denna domän [56] . Haloarchaealt mRNA innehåller emellertid 3'-UTR och deras 3'-ändar genomgår inte post-transkriptionell modifiering. Överraskande nog saknar dessa haloarchaeala transkript som har en 5'-UTR Shine-Dalgarno-sekvensen. Längden på 3'-UTR för haloarchaea varierade från 20 till 80 nukleotider; inga konserverade strukturella motiv och sekvenser, förutom penta-U-nukleotiden i translationstermineringsregionen, har identifierats [62] .
För arkeiskt mRNA har riboswitches beskrivits , inklusive TPP-riboswitches (bindning till tiaminpyrofosfat (TPP)), som finns i 5'-UTR (liknande riboswitches finns också i bakterier och eukaryoter) [63] .
I många virus sker translationsinitiering av en cap -oberoende mekanism och utförs genom de redan nämnda IRES- elementen lokaliserade i 5'-UTR [64] . Detta händer till exempel i HIV- , hepatit A- och C -virus [65] . Denna mekanism för translationsinitiering är bekväm eftersom det i dess fall inte finns något behov av att sätta ihop pre-initiatorproteinkomplexet, och viruset kan föröka sig snabbt [53] .
Virus har också en annan cap-oberoende translationsinitieringsmekanism som inte är associerad med IRES. Denna mekanism finns i många växtvirus . I detta fall finns det ett speciellt cap- oberoende translationselement (CITE) placerat i 3'-UTR. Ofta binder CITE translationsfaktorer, till exempel eIF4F-komplexet, och interagerar sedan komplementärt med 5'-änden och levererar translationsinitieringsfaktorer till platsen för dess start [66] .
I virus vars genom representeras av en enkelsträngad RNA-molekyl med positiv polaritet påverkar 3'-UTR inte bara translation, utan är också involverad i replikation : det är från den som replikeringen av det virala genomet börjar [67 ] .
Mässlingsviruset (släktet Morbillivirus av familjen Paramyxoviridae ) har ett genom som representeras av en enkelsträngad RNA-molekyl med negativ polaritet. En intressant mekanism har etablerats för dess M- och F-gener. mRNA:n för dessa gener har långa UTR:er; de står för ~6,4% av det totala mRNA:n. Även om dessa gener inte är direkt involverade i replikationen, ökar 3'-UTR-mRNA från M-genen ackumuleringshastigheten för M-proteinet och utlöser således genomreplikation. Samtidigt minskar 5'-UTR av F-genens mRNA bildningen av F-proteinet och undertrycker därmed replikation [68] .
Eftersom oöversatta regioner spelar en avgörande roll i regleringen av genuttryck , leder olika förändringar som påverkar dessa regioner ofta till sjukdomstillstånd såsom ärftlig trombocytemi , bröstcancer , fragilt X-syndrom , bipolär affektiv sjukdom , Alzheimers sjukdom och andra [69] . Diagrammen nedan visar samband mellan mutationer som påverkar ett eller annat funktionellt element i 3'-UTR och 5'-UTR och olika sjukdomar.