5' - Otranslaterad region (5'-UTR , uttalas som femtakts-otranslaterad region , eng. 5'-otranslaterad region, 5'-UTR ), eller ledarsekvens [1] - icke-kodande region av mRNA , lokaliserad omedelbart efter cap , men före kodningsregionen. Den DNA- region som motsvarar transkriptets 5'-UTR har samma namn [2] . 5′-UTR innehåller olika element som är involverade i regleringen av översättningseffektivitet [3] .
Den totala längden av 5′-UTR är, oftast, ungefär densamma för alla taxonomiska grupper av eukaryoter och är cirka 100–200 nukleotider , men kan nå flera tusen [4] [5] . Således, i jästen Schizosaccharomyces pombe , är längden på 5'-UTR i ste11-transkriptet 2273 nukleotider [6] [7] . Medellängden av en 5'-UTR hos människor är cirka 210 nukleotider (samtidigt är medellängden för en 3'-UTR 800 nukleotider [8] ). Den längsta kända mänskliga 5'-UTR är i Tre - onkogenen , dess längd är 2858 nukleotider och den kortaste mänskliga 5'-UTR är 18 nukleotider lång [1] .
Sammansättningen av baser skiljer sig också i 3'- och 5'-UTR. Således är innehållet av G + C högre i 5'-UTR än i 3'-UTR. Denna skillnad är särskilt märkbar i mRNA från varmblodiga ryggradsdjur, där innehållet av G+C i 5'-UTR är 60 % och i 3'-UTR är det 45 % [9] .
Inuti de DNA-regioner som motsvarar transkriptets 5'-UTR finns introner , såväl som i de DNA-regioner som motsvarar den mRNA-kodande regionen. Cirka 30% av Metazoa gener har regioner som motsvarar 5'-UTR, som endast består av exoner [4] . Hos människor har cirka 35 % av generna introner i 5′-UTR. Introner i 5'-UTR skiljer sig från de i den kodande regionen och i 3'-UTR när det gäller nukleotidsammansättning, längd och densitet [10] . Det är känt att förhållandet mellan den totala längden av introner och längden av exoner i 5'-UTR är mindre än i den kodande regionen, men introndensiteten i 5'-UTR är högre (enligt andra data, tvärtom, den är lägre [11] ), -UTR är ungefär dubbelt så lång som intronerna i den kodande regionen. Introner är mycket sällsynta i 3'-UTR än i 5'-UTR [12] .
Utvecklingen och funktionerna hos introner i 5'-UTR förblir i stort sett outforskade. Det har emellertid visat sig att aktivt uttryckta gener oftare har korta introner i 5′-UTR än långa introner eller så saknas de helt. Även om sambandet mellan längden och antalet introner och vävnad ännu inte har fastställts, har viss korrelation hittats mellan antalet introner i gener och deras funktioner. Således hittades särskilt många introner i gener som utför regulatoriska funktioner [10] . I allmänhet ökar närvaron av minst ett intron i 5'-UTR genuttrycket genom att förstärka transkriptionen (i detta fall talar vi om DNA-regionen som motsvarar 5'-UTR av transkriptet) eller genom att stabilisera den mogna mRNA. Till exempel beror expression av ubiquitin C ( UbC )-genen på närvaron av ett intron i 5'-UTR. Med förlusten av ett intron sjunker aktiviteten hos promotorn kraftigt, och ytterligare studier har visat att transkriptionsfaktorerna Sp1 och Sp3 binder i 5'-UTR-regionen av DNA [11] .
Den strukturella och nukleotidsammansättningen av 5'-UTR är viktig för regleringen av genuttryck; dessutom visades skillnader i strukturen för 5'-UTR-mRNA :t för "hushållnings" -generna och generna involverade i regleringen av ontogeni . 5′-UTR-gener, vars uttryck åtföljs av bildandet av en stor mängd protein , har som regel en kort längd, de kännetecknas av ett lågt innehåll av G + C , frånvaron av uttalade element av sekundär struktur och interna AUG- kodon ( startkodon ) belägna före huvudstartkodonet . Däremot är 5′-UTR-gener som ger upphov till en liten mängd protein längre, har ett högre GC-innehåll och har ett större antal karakteristiska sekundära strukturelement. Högstrukturerade 5'-UTR är ofta inneboende i mRNA från gener involverade i regleringen av utveckling; dessutom kännetecknas dessa bildningar av dessa mRNA ofta av vävnads- och åldersspecificitet [13] .
Det har fastställts att 5'-UTR, som har en undertryckande effekt på translation, har kompakta strukturer runt startkodonet . Även om de specifika mekanismerna för sådan repression är okända, tros det att nukleotiden och strukturella egenskaper hos 5'-UTR bestämmer bindningen av olika proteinfaktorer till den, som aktiverar eller undertrycker translation [13] .
G-quadruplex är viktiga och väl studerade sekundära strukturelement i 5'- UTR . De bildas när guaninberikade sekvenser viker sig till en extremt stabil icke-kanonisk fyrsträngsstruktur; sådana strukturer har en strikt undertryckande effekt på översättning. Bioinformatikanalys har visat att G-quadruplexer ofta är mycket konserverade och närvarande i cirka 3000 mänskliga mRNA [14] . Exempel på sådana mänskliga mRNA är mRNA från östrogenreceptorn [ 15] , extracellulärt metalloproteinas [16] , NRAS proto-onkogen [14] . Förutom 5'-UTRs, har G-quadruplexes hittats i promotorer , telomerer och 3'-UTRs. Det finns särskilt många G-quadruplexer i mRNA av proteiner involverade i regleringen av translation och ontogenes. Den undertryckande effekten av G-quadruplexes på translationen av det mRNA som de är belägna på kan bero på både deras sekundära struktur i sig och deras interaktion med proteiner och andra faktorer [17] .
Skanningsmodellen för translationsinitiering antar att den lilla subenheten av ribosomen rör sig längs mRNA:t ("scannar") i riktningen från 5'- till 3'-änden på jakt efter ett lämpligt AUG -startkodon och startar translation från det. Samtidigt trodde man också att närvaron av stabila element i den sekundära strukturen (till exempel hårnålar ) i 5'-UTR har en undertryckande effekt på translation, eftersom ribosomen inte kan passera genom dem. Nyligen genomförda studier har dock visat att så inte alltid är fallet. Translation av mRNA med en lång, högstrukturerad 5'-UTR kan fortgå likaväl som mRNA med en kort och ostrukturerad 5'-UTR. Detta förklaras av det faktum att den hämmande effekten av den sekundära strukturen i sig ofta inte uttrycks, eftersom den i första hand bestäms av proteinerna som interagerar med den. Den tidigare rådande felaktiga ståndpunkten som beskrivs ovan dök upp på grund av det faktum att tidigare forskare använde systemet med kaninretikulocytlysat (RRL ) , och detta system hade ett antal brister och motsvarade inte in vivo-förhållanden [18] .
Det finns flera mekanismer för bildandet av alternativa 5′-UTR:er med samma kodningssekvens:
Närvaron av olika 5'-UTR i mRNA av samma gen ger ytterligare möjligheter att reglera dess uttryck, eftersom även små skillnader i den sekundära strukturen av 5'-UTR kan radikalt påverka regleringen av translation. En analys av transkriptom från däggdjur har visat att uttrycket av alternativa 5'-UTR är ett vanligt fenomen, och potentiellt kan de flesta generna använda denna regleringsmekanism. Proteinprodukterna från gener som ständigt använder alternativa 5'-UTR är vanligtvis involverade i processer som transkription och signalvägar . Till exempel har östrogenreceptorn β (ERβ) genen 3 mRNA med alternativa 5'-UTR som ger upphov till isoformer av samma protein, och misslyckanden i deras aktivitet observeras ofta i cancer [19] .
Viktiga funktionella element involverade i translationsinitiering och kontroll av genuttryck är lokaliserade inom 5'-UTR. Detta bevisas för det första av det faktum att translationshastigheten inte beror på längden och strukturen av 5'-UTR i både capped och icke-capped mRNA, och även av det faktum att vissa gener kan uttryckas under stressförhållanden [20] . De viktigaste av dessa funktionella element inkluderar interna ribosominträdesställen ( IRES ), interna öppna läsramar uORFs , järnberoende element ( IRE ), etc.
Det interna ribosominträdesstället ( IRES ) är ett regulatoriskt mRNA-motiv som utför en cap-oberoende translationsinitieringsmekanism, i vilken ribosominträde sker inuti 5'-UTR, men nära translationsstartstället. IRES-mekanismen används av både capped och non-capped mRNA under förhållanden där cap-beroende translationsinitiering undertrycks på grund av stress , i ett visst skede av cellcykeln och under apoptos , vilket ger långvarigt uttryck av nödvändiga proteiner. Ett antal IRES-användande gener , såsom c-Myc , APAF1 , Bcl-2- gener, uttrycks dåligt under normala förhållanden och aktiveras av IRES under stressförhållanden. Det antas att IRES också kan vara inblandat i att upprätthålla en låg nivå av uttryck av ett antal proteiner under normala förhållanden, ta över ribosomer och förhindra dem från att starta translation från huvudstartstället. Mekanismen för initiering av intern translation är fortfarande dåligt förstådd, även om det är välkänt att effektiviteten av IRES till stor del påverkas av trans'- regulatoriska proteinfaktorer, vilket gör det möjligt för cellspecifik användning av IRES vid translation [20] .
Strukturen för eukaryot IRES är mycket varierande, och inga konserverade motiv som är karakteristiska för dem har hittills fastställts . För vissa gener kräver IRES specifika stabila element av den sekundära strukturen av mRNA, i andra gener har de tvärtom en undertryckande effekt på translation. Det har föreslagits att IRES inte är statiska strukturer och är föremål för rörelse, vilket väsentligt förändrar deras aktivitet. IRES-element kan också ge upphov till olika proteinisoformer , vilket ger ytterligare möjligheter att erhålla olika proteinprodukter från samma gen [21] .
Korta öppna läsramar ( eng. upstream open reading frames, uORF ) är belägna i 5'-UTR och kännetecknas av att deras intraramstoppkodon är beläget efter det interna startkodonet ( eng. upstream AUG, uAUG ), men före huvudstartkodonet som redan finns i den översatta (kodande) regionen . uORFs finns i cirka 50 % av mänskliga 5'-UTR- mRNA och deras närvaro orsakar en minskning av genuttryck, vilket minskar mängden funktionellt mRNA med 30 % och proteinbildning med 30-80 %. Ribosomer som binder till uAUG startar translation av uORF, vilket negativt kan påverka translationseffektiviteten för huvudläsramen (dvs. kodningsområdet). Om det inte finns någon effektiv bindning av ribosomen till startkodonet i den kodande regionen (det vill säga initiering av translation), så är resultatet en minskning av proteinbildningen, och därmed nivån av expression av motsvarande gen. Den omvända situationen kan också inträffa: translationen av uORF kommer att fortsätta till translationen av den kodande regionen, och som ett resultat bildas ett protein som är för långt, vilket kan vara skadligt för kroppen. Minskningen i translationseffektivitet på grund av närvaron av uORF i 5'-UTR är en väl studerad effekt; ett exempel som illustrerar det är genen för poly(A)-polymeras α ( eng. poly(A)-polymeras α, PAPOLA ), vars mRNA innehåller två mycket konserverade uORFs i 5'-UTR. Mutation av den proximala uAUG orsakar en ökning av translationseffektiviteten för detta mRNA, vilket tyder på att uORF signifikant minskar uttrycket av denna gen . Ett annat exempel är sköldkörtelhormonreceptorn, som har en aktiverande eller repressiv effekt på transkriptionen av ett antal målgener; stark repression av dess translation utförs av en 15 nukleotider lång uORF inom 5'-UTR av dess mRNA [22] .
Det anses allmänt att uORF minskar translationens effektivitet , eftersom efter avslutad translation av uORFs kan ribosomen inte starta translation igen och översätta den kodande sekvensen ( CDS ) . Nya studier av mer än 500 5'-UTR- genloci har dock visat att det inte finns något definitivt samband mellan effekten av uORF på nedströms genuttryck och avståndet mellan uORF och den kodande sekvensen. Samtidigt föreslår författarna av studien att i gener som innehåller en enda uORF, troligtvis sker CDS-translation efter att ha skannat uORF av ribosomen utan dess dissociation, och inte genom translationsåterinitiering. Detta antagande skiljer sig mycket från slutsatserna av Kozak (1987) och generellt från alla idéer om uORF. Dessutom visade experiment med celler som saknade Rent1 (en faktor som är involverad i den riktade förstörelsen av defekta mRNA - nonsens-medierad decay, NMD ) att uORF-innehållande transkript framgångsrikt översatts i frånvaro av NMD. Detta visar att NMD också spelar en viktig roll för att reglera funktionen hos dessa transkript. Troligtvis finns det flera alternativ för utveckling av händelser efter interaktionen mellan uORF och ribosomen: fortsättningen av översättningen, fortsättningen av skanningen eller återupptagandet av översättningen av den kodande regionen, och vilken av dem som kommer att inträffa beror på ett antal faktorer [22] .
Det har fastställts att, förutom AUG, kodon som skiljer sig från AUG med en nukleotid också kan användas som translationsstartställe, och initieringseffektiviteten i varje fall kommer att bestämmas av miljön för det icke-standardiserade startkodonet [23] .
Även om de flesta uORF påverkar genuttrycket negativt, finns det tillfällen där närvaron av uORF förbättrar translation. Ett exempel är det bicistroniska vpu-env-mRNA från HIV -1 -viruset , som innehåller en konserverad mycket liten uORF. Denna uORF ligger endast 5 nukleotider före AUG vpu och slutar snart med ett stoppkodon som överlappar med AUG vpu. Denna uORF har visat sig ha en betydande fördelaktig effekt på env-översättning utan att störa vpu-översättning. Mutanter erhölls i vilka avståndet mellan uORF och huvud-AUG ökades med 5 nukleotider, och det visades att uORF inte är involverat i vpu-initiering. Baserat på detta föreslog författarna av studien att denna lilla uORF kan fungera som ett ribosomretardationsställe, under vilket ribosomen interagerar med RNA-strukturer som underlättar dess främjande, det vill säga att den fysiskt övervinner en del av 5'-UTR för att nå det huvudsakliga initieringskodonet [24] .
Utöver ovanstående är följande verkningsmekanismer för uORF också kända:
Betydelsen av uORFs som regulatoriska element involverade i regleringen av ribosombindning och translation är väl studerad, men funktionen och till och med ödet för uORF-kodade peptider är ofta okänt, möjligen på grund av svårigheter med att analysera nivån av uttryck och lokalisering av peptider [26] .
5'-UTR mRNA från proteiner associerade med järnmetabolism innehåller ofta ett specifikt reglerande element, det järnberoende elementet . Det finns i 5'-UTR-mRNA:t av sådana proteiner som ferritin , transferrinreceptor , erytroidaminolevulinatsyntas , mitokondriellt akonitas , ferroportin [ , divalent metalltransportör ( engelska divalent metalltransportör 1 ( engelska divalent metalltransportör 1) DMT1) ) [27] (men det finns också i mRNA från proteiner som inte är associerade med järnmetabolism, till exempel i mRNA från proteinprodukten från CDC42BPA-genen, ett kinas som är involverat i omorganisationen av cytoskelettet [28] ) . IRE är en hårnål som interagerar med specifika regulatoriska proteiner - IRP1 och IRP2 (järnreglerande proteiner ) . När järnkoncentrationen är låg binder IRP1 och IRP2 till IRE, vilket skapar barriärer för ribosomen och omöjliggör translation av mål-mRNA:t [29] . Vid höga järnkoncentrationer finns det ingen stel bindning mellan dessa proteiner och hårnålen, och översättning av proteiner som är involverade i järnmetabolismen sker. Dessutom fann man att translationen av beta-amyloidprekursorproteinet också kontrolleras av IRE, och dess IRE kan också binda till IRP1 och IRP2, så det är möjligt att IRE kan spela en roll i utvecklingen av Alzheimers sjukdom sjukdom [30] .
I början av translation i eukaryoter sätts proteinkomplexet eIF4F ihop vid 5'-änden av transkriptet i cap-regionen och dess två subenheter, eIF4E och eIF4G , är fästa till 5'-UTR-regionen, vilket begränsar hastigheten med vilken translationsinitiering kan ske [31] . Rollen för 5'-UTR vid bildningen av preinitiatorkomplexet är emellertid inte begränsad till detta. I vissa fall binder proteiner till 5'-UTR och förhindrar sammansättningen av initiatorkomplexet. Som ett exempel kan vi betrakta regleringen av msl-2- genen ( engelsk male-specific lethal 2 - male specific lethal 2), som är involverad i könsbestämning i Drosophila . Proteinprodukten från SXL-genen ( sexletal ) binder till intronen lokaliserad i 5'-UTR av det primära transkriptet msl-2 , som ett resultat av vilket detta intron inte avlägsnas under splitsning [29] . Det främjar samtidig bindning till 5'-UTR- och 3'-UTR- proteiner som inte tillåter initieringskomplexet att samlas. SXL kan dock undertrycka translationen av mRNA som saknar en poly(A)-svans eller till och med en 3′-UTR [32] . mRNA från ornitindekarboxylas , som är involverat i metabolismen av polyaminer , och mRNA från c-myc i 5'-UTR innehåller hårnålsstrukturer stabiliserade av repressorproteinet, som förhindrar ribosomen från att landa på dem och sammansättningen av initiativtagarekomplexet. Variationer i antalet repressorproteiner orsakar olika grader av stabilisering av dessa hårnålar och följaktligen kan tillgängligheten av dessa 5'-UTR för initiatorproteiner och ribosomen vara olika [33] .
5'-UTR hos vissa kan binda inte bara ett repressorprotein som förhindrar sammansättning av initiatorkomplexet och ribosominträde, utan även repressorproteiner som stabiliserar olika strukturella barriärer på vägen till det skanande ribosomkomplexet. Till exempel utförs translationell repression av mRNA från humant tymidylatsyntas av dess translationsprodukt, tymidylatsyntas, enligt principen om negativ feedback; tymidylatsyntas interagerar med hårnålen på 30 nukleotider i 5'-UTR, stabiliserar den och förhindrar framfarten av ribosomen [34] .
Det är känt att mRNA kan sluta sig till en ring (cirkularisering) på grund av interaktionen av speciella proteiner som binder till poly(A)-svansen , vilket underlättar bindningen av eIF4F-faktorn till locket . Som ett resultat får mRNA en sluten form, translationsinitiering stimuleras och translationseffektiviteten ökas. Men i vissa fall kan 5'-UTR och 3'-UTR av samma mRNA binda till varandra. Således har mRNA från den humana p53 -genen regioner i 5'-UTR och 3'-UTR som är komplementära till varandra. Genom att binda till varandra och till translationsfaktorn RPL26 ökar de därmed effektiviteten av translationen av p53-proteinet som svar på DNA- skada [35] .
Analys av mRNA från olika mänskliga gener visade att 5'-UTR innehåller motivet som specifikt interagerar med 3'-ändarna av miRNA, medan många av dessa miRNA har en plats som är komplementär till 3'-UTR i 5'-änden . Ytterligare studier har visat att bindningen av 5'-UTR och 3'-UTR till samma mikroRNA underlättar bindningen av 5'-änden av mRNA till 3'-änden, som en brygga, och mRNA, aktiviteten av som avsevärt bestäms av miRNA, har förutsägbara bindningsställen på båda NTO:erna. Sådana mRNA kallas miBridge. Det visade sig vidare att förlusten av dessa bindningsställen minskade miRNA-driven repression av transkriptöversättning. Således fann man att bindningsställen för NTO:er med varandra är nödvändiga för undertryckande av mRNA-translation. Detta indikerar att den komplementära interaktionen mellan 5'-UTR och 3'-UTR är nödvändig för exakt reglering av genuttryck [36] .
Bakteriellt mRNA innehåller också 5' och 3' otranslaterade regioner [38] [39] . Längden på 5'-UTR för bakterier är mycket kortare än för eukaryoter och är vanligtvis 3-10 nukleotider. Till exempel är längden på 5'-UTR-transkriptet av Escherichia coli laktosoperon endast 7 nukleotider [40] . I bakteriers 5'-UTR är Shine-Dalgarno-sekvensen ( AGGAGG) [41] lokaliserad , som tjänar till att binda ribosomen och separeras med en spacer från startkodonet AUG. Även om 5'-UTR för bakterier och eukaryoter är olika, visades det att tillägget av CC-nukleotider till mRNA-spacern av Ner -genen av bakteriofag Mu , som är väl uttryckt i Escherichia coli- och Streptomyces- celler , ledde till framgångsrikt uttryck av denna gen i retikulocytceller från kanin [42] .
Element av den sekundära strukturen lokaliserade i 5'-UTR har som regel en undertryckande effekt på translation [43] . I synnerhet är det i 5'-UTR som dämpare vanligtvis är lokaliserade - element av operoner som orsakar för tidig avslutning av translation [44] (det mest kända exemplet på dämpning är arbetet med tryptofanoperonen ).
Dessutom är majoriteten av riboswitcharna [45] belägna i bakteriers 5'-UTR, dvs. mRNA-regulatoriska element som kan binda till små molekyler , vilket leder till en förändring i bildningen av proteinet som kodas av detta mRNA [46] ] .
Oöversatta regioner finns också i mRNA från många arkéer . SECIS-elementet som är ansvarigt för införandet av aminosyran selenocystein i polypeptidkedjan är i synnerhet lokaliserat i 5'- och 3'-UTR:erna av mRNA:t av den metanogena archaea Methanococcus jannaschii (som i andra medlemmar ) av Methanopyrales och Methanococcales ordnar ) [47] .
Det har fastställts att mRNA från de flesta haloarchaea , såväl som de från Pyrobaculum och Sulfolobus , saknar en uttalad 5'-UTR, men mRNA från arkeala metanogener har långa 5'-UTRs. I detta avseende antas det att mekanismen för translationsinitiering i metanogena arkéer kan skilja sig från den i andra representanter för denna domän [43] [48] .
5'-UTR av archaea innehåller TPP-riboswitch , som binder till tiaminpyrofosfat (TPP) (sådana riboswitch finns också i bakterier och eukaryoter) [49] .
I många virus sker translationsinitiering av en cap -oberoende mekanism och utförs genom de redan nämnda IRES- elementen lokaliserade i 5'-UTR [50] . Detta händer till exempel vid HIV , hepatit A- och C -virus [51] . Denna mekanism för translationsinitiering är bekväm eftersom det i dess fall inte finns något behov av att skanna ett långt 5'-UTR-fragment [40] .
Mutationer som påverkar 5′-UTR leder ofta till uppkomsten av olika sjukdomar, eftersom de stör arbetet i det fina regleringssystemet för vissa gener. Schemat nedan sammanfattar information om mutationer som påverkar olika regulatoriska element i 5'-UTR och de sjukdomar som utvecklas i detta fall [1] (det bör klargöras att syndromet med ärftlig hyperferritinemi/katarakt utvecklas med en mutation i IRE [1] ] [52] ).
Ordböcker och uppslagsverk |
---|