3' -Otranslaterad region (3'-UTR , engelska 3'-untranslated region, 3'-UTR ) är en icke-kodande region av mRNA belägen vid dess 3'-ände efter den kodande regionen . Den DNA- region som motsvarar transkriptets 3'-UTR har samma namn [1] . 3′-UTR kan vara involverad i regleringen av translationseffektivitet och mRNA-stabilitet, innehålla polyadenyleringssignaler [2] och mikroRNA- bindningsställen och även utföra ett antal andra regulatoriska funktioner.
Längden på 3'-UTR kan vara från 60 till 4000 nukleotider . Den genomsnittliga längden av 3'-UTR hos människor är cirka 800 nukleotider, medan medellängden av 5'-UTR är 200 nukleotider [3] . Det är anmärkningsvärt att den totala längden av 3′-UTR hos människor är mer än dubbelt så stor som hos andra däggdjur , vilket indikerar ett större antal reglerande element hos människor än hos andra däggdjur [4] . Sammansättningen av baserna skiljer sig också i 3'- och 5'-UTR. Således är innehållet av G + C högre i 5'-UTR än i 3'-UTR. Denna skillnad är särskilt märkbar i mRNA från varmblodiga ryggradsdjur, där innehållet av G+C i 5'-UTR är 60 % och i 3'-UTR är det 45 % [5] [6] .
Längden och sekundärstrukturen för 3'-UTR bestäms till stor del av dess deltagande i interaktionerna mellan 5'-änden av transkriptet och 3'-änden (se nedan), och ofta har långa 3'-UTR en signifikant effekt på genuttryck . 1996 visades det att ökning av mRNA 3'-UTR från 19 till 156 nukleotider minskade uttrycket med en faktor 45, oavsett orientering, gen eller sekvens av de infogade nukleotiderna. Detta indikerar att längden av 3'-UTR är viktig i mRNA-uttryck. En annan faktor som bestämmer vikten av 3'-UTR-längden, förutom interaktionen mellan 3'- och 5'-UTR, är förmågan hos 3'-UTR att interagera med miRNA , speciella regulatoriska RNA- molekyler som undertrycker translation ( se nedan för mer information). Dessa interaktioner äger rum på speciella platser, som är mer förekommande i långa 3'-UTR, så en lång 3'-UTR kan ha en starkare hämmande effekt på translation. Således gjordes en jämförelse av längden av 3'-UTR och antalet mikroRNA-bindande platser på den i gener av ribosomala proteiner och gener involverade i neurogenes . Det visade sig att ribosomala 3'-UTR-gener är kortare och har färre specifika mikroRNA-bindningsställen, medan i gener involverade i neurogenes tvärtom är 3'-UTR längre och innehåller många specifika mikroRNA-bindningsställen. Låt oss överväga ett annat exempel. Hip2 genen använder alternativa 3'-UTRs för flexibel kontroll av uttryck (se nedan för mer om detta fenomen) . Den längre möjliga 3′-UTR av denna gen innehåller konserverade bindningsställen för två miRNA uttryckta i aktiverade T-celler . Vid aktivering minskade det relativa uttrycket av transkriptet med en längre 3'-UTR, och det totala proteinuttrycket ökade, eftersom mRNA med kortare 3'-UTR uttrycktes, som inte innehöll bindningsställen för hämmande miRNA. Det har också visats att längden på 3'-UTR beror på närvaron av sådana regulatoriska element som AU-rika element ( ARE ) i den (för mer information, se nedan) [4] .
I allmänhet är långa 3'-UTR associerade med en relativt låg uttrycksnivå, vilket visas i experiment som jämförde uttrycket av isoformer av ett enda protein vars mRNA endast skilde sig i längden på 3'-UTR. SLC7A1 - genen uttrycks i två mRNA med olika 3'-UTR, den längre innehåller ytterligare ett mikroRNA-bindningsställe. Funktionell polymorfism i denna gen är associerad med uppkomsten av endotelial dysfunktion och en ärftlig predisposition för hypertoni . Intressant nog har den allelen som är ansvarig för manifestationen av dessa störningar vanligtvis en längre 3'-UTR, och därför är dess uttrycksnivå lägre än den för vildtypsallelen , som har en kortare 3'-UTR [4] .
Till skillnad från 5'-UTR innehåller 3'-UTR relativt få introner (cirka 5%). Vissa däggdjursgener som härrör från omvänd transkription från ett skarvat transkript har introner i 3'-UTR som minskar uttrycket av dessa gener, vilket leder deras transkript till NMD -vägen (dvs. störning). Denna negativa effekt av introner i 3'-UTR på genuttryck kan förklara deras låga distribution i denna region. Dessutom har det visat sig att vissa transkript kan binda till miRNA endast i närvaro av ett intron i 3'-UTR, vilket också undertrycker genuttryck. Detta visar att olika excision av introner i 3′-UTR möjliggör isoformspecifik mikroRNA-medierad reglering, som kan utföras på ett vävnadsspecifikt sätt [7] .
Uppenbarligen är den sekundära strukturen för 3'-UTR av mycket större betydelse än man tidigare trott. Inte bara längden på 3'-UTR är viktig, utan också dess sekundära struktur, och mutationer som förändrar den kan störa genuttrycket. År 2006 genomfördes en studie på 83 3′-UTR-varianter associerade med olika sjukdomar, och ett samband etablerades mellan funktionaliteten hos dessa varianter och förändringar i den förutsagda sekundära strukturen [8] .
Den sekundära strukturen för 3′-UTR är svår att förutsäga, eftersom många proteinfaktorer som binder till den avsevärt kan påverka dess rumsliga struktur. Dessa faktorer kan förändra det på grund av förstörelsen av mRNA-vecket, eller så kan de interagera med andra faktorer, på grund av vilka mRNA kan sluta sig till en loop. Det vanligaste exemplet på sekundära strukturelement som kan påverka uttrycket är hårnålen och RNA-bindande proteiner binder till hårnålar i 3'-UTR. Den hjärnhärledda neurotrofiska faktorn (BDNF ) -transkriptet innehåller en lång hårnål som är ansvarig för stabiliteten av mRNA i neuroner som svar på kalciumsignaler . Det antas att hårnålen är en bekväm plattform för interaktionen av ett antal RNA-bindande proteiner, icke-kodande RNA och polyadenyleringssignaler som svar på Ca 2+ . 3'-UTR av TNFα - transkriptet innehåller ARE -elementet , som bildar en hårnål som kan modulera affiniteten för denna region för olika proteiner (för mer information, se nedan). Dessa exempel visar att modulering av den sekundära strukturen av 3'-UTR med proteiner eller på annat sätt kan ändra dess bindningsspecificitet till olika trans ''-faktorer, och därigenom reglera genuttryck på post- transkriptionell nivå [9] .
Alternativ polyadenylering ( APA ) och alternativ splitsning är två mekanismer som leder till uppkomsten av olika mRNA-isoformer som skiljer sig i sina 3'-UTRs . APA kan uppstå på grund av närvaron av olika polyadenyleringsställen och olika terminala exoner ; APA beräknas använda ~50% av mänskliga gener. Denna mekanism är mycket bekväm för komplexa organismer, eftersom den tillåter transkript att uttrycka samma protein, men på olika nivåer och på olika rumsliga platser på grund av skillnader i 3′-UTR-medierad reglering. Alternativa 3'-UTRs är extremt viktiga för vävnadsspecifikt genuttryck, såväl som för variabelt uttryck i olika utvecklingsstadier . Betydande förändringar i ARA-produkter är karakteristiska för ett antal cancertyper . ARA spelar också en viktig roll vid lokalisering av proteinisoform. Proteinprodukten från HuR -genen är ett ARE-bindande protein involverat i stabiliseringen av många ARE-innehållande mRNA. På grund av ARA bildas ett antal varianter av HuR-proteinet, som skiljer sig i uttrycksnivån, och även om den stora majoriteten av transkripten av detta protein saknar ARE, har vissa fortfarande funktionella ARE i 3'-UTR. Dessa ARE:er kan binda HuR och därigenom ge positiv feedbackreglering. Således tillåter användningen av alternativa 3'-UTRs för ännu större mångfald av proteinprodukter från en enda gen [10] .
MikroRNA är korta enkelsträngade icke-kodande RNA -molekyler av endogent ursprung, cirka 20 nukleotider långa. De interagerar med mål-mRNA enligt komplementaritetsprincipen och blockerar vanligtvis translation av målet eller orsakar dess förstörelse. Som regel är mikroRNA-mRNA-bindningsställen belägna i 3'-UTR av den senare, även om några av dem är belägna i 5'-UTR och till och med i den kodande regionen. MikroRNA uttrycks ofta olika beroende på vävnadstyp och utvecklingsstadium, och gener involverade i processer som är gemensamma för alla gener måste selektivt undvika sekvenser i transkript som är delvis komplementära till mikroRNA, det vill säga för att undvika närvaron av mikroRNA-bindningsställen. Denna selektiva undvikandeprocess har en enorm inverkan på utvecklingen av 3′-UTR [11] .
Att ändra stabiliteten hos transkriptet tillåter snabb kontroll av uttrycket utan att ändra translationshastigheten. En sådan mekanism är viktig i sådana vitala processer som celltillväxt och differentiering , såväl som anpassning till miljöförhållanden. De mest välstuderade regulatoriska elementen som reglerar mRNA-stabilitet är AU-rika element ( ARE ) som finns i 3'-UTR av mRNA från vissa gener . Dessa element varierar i storlek från 50 till 150 nukleotider och innehåller vanligtvis flera kopior av AUUUA-pentanukleotiden [12] .
Det visade sig att sekvenserna för ARE skiljer sig åt, och 3 klasser av ARE särskiljs av antalet och arrangemanget av AUUUA-motiv:
ARE binder till proteiner ( ARE -bindande proteiner, ARE-BPs ), som i regel bidrar till förstörelsen av mRNA som svar på olika intra- och extracellulära signaler, även om vissa av dem reglerar translation . ARE reglerar uttrycket av gener som kodar för cytokiner , tillväxtfaktorer , tumörsuppressorgener , proto-onkogener och gener vars proteinprodukter är involverade i cellcykelreglering , såsom gener för cykliner , enzymer , transkriptionsfaktorer , receptorer och membranproteiner . Denna mångfald av gener vars transkript innehåller ARE indikerar vikten av transkriptstabilitet i genreglering [12] . Förutom att ändra mRNA-stabilitet kan ARE också aktivera translation, även om denna mekanism är mindre vanlig och mindre välkänd [13] .
Ett annat element som reglerar transkriptstabilitet är det nyligen upptäckta GU-rika elementet (GRE) . Det interagerar med CUGBP1 , ett RNA-bindande protein som främjar nedbrytningen av dess associerade mRNA [13] .
Polyadenylering är processen att lägga till en serie adenosiner (dvs en poly(A)-svans) till 3'-änden av ett omoget RNA-transkript [13] . Det har fastställts att 3′-UTR innehåller element som reglerar denna process. Således har det visats att alla polyadenylerings-mRNA på ett avstånd av 20–30 nukleotider från 3'-änden av transkriptet, till vilken poly(A)-svansen är fäst, innehåller AAUAAA-sekvensen, en polyadenyleringssignal (polyadenyleringssignaler) kan också vara nära sekvenser, såsom AU /GUAAAA eller UAUAAA). Därefter visade det sig att även om AAUAAA-sekvensen är absolut nödvändig för polyadenylering, finns det andra element utan vilka den normala fästningen av poly(A)-svansen är omöjlig. Speciellt identifierades en GU-rik sekvens omedelbart efter AAUAAA mot 3'-änden (den kallas även det engelska nedströmssekvenselementet, DSE ), samt en speciell sekvens belägen omedelbart före AAUAAA ( engelsk uppströmssekvenselement, USE ) . Dessa beståndsdelar är till stor del bevarade inte bara för däggdjur , utan för alla eukaryoter . För polyadenylering är nukleotiderna som är belägna vid skärningsstället vid 3′-änden av transkriptet också viktiga (poly(A)-svansen kommer att fästas vid denna plats efter brytningen). Således spelar 3'-UTR en avgörande roll i processen för polyadenylering [14] .
3′-UTR spelar en viktig roll i mRNA -maskeringsprocessen . Maskering av mRNA sker till exempel under oogenes och spermatogenes , när mRNA som syntetiseras under dessa processer inte översätts till protein, utan lagras i ett inaktivt tillstånd, ibland under ganska lång tid. Under befruktning och under tidig embryogenes demaskeras moderns mRNA och de nödvändiga proteinerna syntetiseras från dem. Maskering och lagring av mRNA sker även i differentierande somatiska celler hos en vuxen organism under lång tid [15] .
Fenomenet med mRNA-maskering studerades första gången i musslan Spisula solidissima 1990. Det visade sig att en stor mängd maskerad mRNA som kodar för den lilla subenheten av ribonukleotidreduktas och cyklin A lagras i dess oocyter . Det har visats att när mRNA:t är i ett maskerat tillstånd är ett komplex av maskeringsproteiner associerat med stället i dess 3'-UTR. Det visade sig också att maskerade mRNA har en kraftigt förkortad poly(A)-svans, från 200–250 adenylrester till 20–40. När mRNA demaskeras, fosforyleras maskeringsproteiner , som ett resultat av vilket locket frigörs från det blockerande proteinet och polyadenylering av mRNA av cytoplasmatiskt poly(A)-polymeras stimuleras , vilket återställer den långa poly(A)-svansen som är nödvändig för effektiv översättning [16] .
3′-UTR är ibland involverad i processen att införliva en sällsynt men funktionellt viktig aminosyra , selenocystein , i polypeptidkedjan . Det finns inget speciellt kodon för selenocystein, och Sec tRNA är fäst vid UGA-termineringskodonet, men endast när det följs av en speciell selenocysteininsertionssekvens - SECIS , som utgör ett karakteristiskt element i den sekundära strukturen. SECIS kan lokaliseras på ett avsevärt avstånd (upp till 200 nukleotider) från UGA, och i arkéer och eukaryoter är det lokaliserat i 3'-UTR av mRNA [17] [18] .
NMD ( nonsens-medierad decay ) är en effektiv mekanism för att förstöra icke-funktionella mutanta transkript . Vanligtvis bestäms effektiviteten i denna mekanism av platsen för mutationen i förhållande till exonövergången, men 3'-UTR kan också spela en viss roll. Mekanismen för translationsterminering vid för tidigt stoppkodon beror på avståndet mellan terminatorkodonet och det poly(A)-bindande proteinet PABPC1 . Det har visat sig att en ökning av avståndet mellan stoppkodonet och poly(A)-svansen utlöser NMD, och förändringar i den rumsliga strukturen hos 3'UTR kan modulera NMD [8] .
Det är känt att mRNA kan sluta sig till en ring (cirkularisering) på grund av interaktionen av speciella proteiner som binder till poly(A)-svansen , vilket underlättar bindningen av eIF4F-faktorn till locket . Som ett resultat får mRNA en sluten form, translationsinitiering stimuleras och translationseffektiviteten ökas. Men i vissa fall kan 5'-UTR och 3'-UTR av samma mRNA binda till varandra. Till exempel har mRNA från den humana p53 -genen regioner i 5'-UTR och 3'-UTR som är komplementära till varandra. Genom att binda till varandra och till translationsfaktorn RPL26 ökar de därmed effektiviteten av translationen av p53-proteinet som svar på DNA- skada [8] .
Analys av mRNA från olika mänskliga gener visade att 5'-UTR innehåller motivet som specifikt interagerar med 3'-ändarna av mikroRNA, medan många av dessa mRNA har ett ställe som är komplementärt till 3'-UTR i 5'-änden . Ytterligare studier har visat att bindning av 5'-UTR till miRNA underlättar bindningen av 5'-änden av mRNA till 3'-änden, och mRNA vars aktivitet bestäms starkt av miRNA har förutsägbara bindningsställen på båda UTR. Sådana mRNA kallas miBridge. Det visade sig vidare att förlusten av dessa bindningsställen minskade miRNA-driven repression av transkriptöversättning. Således fann man att UTR-bindningsställen med varandra är nödvändiga för att undertrycka mRNA-translation. Detta indikerar att den komplementära interaktionen mellan 5'-UTR och 3'-UTR är nödvändig för exakt reglering av genuttryck [9] .
Bakteriellt mRNA innehåller också 5'- och 3'-otranslaterade regioner [19] [20] .
I motsats till eukaryoter är långa 3′-UTRs sällsynta hos bakterier och dåligt förstådda. Vissa bakterier, särskilt Salmonella enterica , är dock kända för att ha mRNA med eukaryotliknande långa 3'-UTR (i S. enterica är detta hilD- mRNA ). Det antas att hilD 3'-UTRs utför olika funktioner, i synnerhet påverkar de omsättningen av deras mRNA, eftersom deletionen av dessa regioner orsakade en ökning av mängden av motsvarande mRNA [21] .
Oöversatta regioner finns också i mRNA från många arkéer . I synnerhet i 5'- och 3'-UTR-mRNA:t från den metanogena archaea Methanococcus jannaschii (som i andra representanter för Methanopyrales- och Methanococcales- ordningarna ), är SECIS- elementet lokaliserat , vilket är ansvarigt för införandet av aminosyra selenocystein in i polypeptidkedjan [ 22] .
Det har fastställts att mRNA från de flesta haloarchaea , såväl som för Pyrobaculum och Sulfolobus , saknar en uttalad 5'-UTR, men mRNA från arkeiska metanogener har långa 5'-UTRs. I detta avseende antas det att mekanismen för translationsinitiering i metanogena archaea kan skilja sig från den för andra representanter för denna domän [23] . Haloarchaealt mRNA innehåller emellertid 3'-UTR och deras 3'-ändar genomgår inte post-transkriptionell modifiering. Överraskande nog saknar dessa haloarchaeala transkript som har en 5'-UTR Shine-Dalgarno-sekvensen. Längden på 3'-UTR för haloarchaea varierade från 20 till 80 nukleotider; inga konserverade strukturella motiv och sekvenser, förutom penta-U-nukleotiden i translationstermineringsregionen, har identifierats [24] .
I många virus sker translationsinitiering av en cap -oberoende mekanism och sker genom IRES- element som finns i 5′-UTR [25] . En annan cap-oberoende translationsinitieringsmekanism har dock hittats i virus som inte är associerade med IRES. Denna mekanism finns i många växtvirus . I det här fallet finns det ett speciellt cap- oberoende översättningselement (CITE) placerat i 3'-UTR. Ofta binder CITE translationsfaktorer, till exempel eIF4F-komplexet, och interagerar sedan komplementärt med 5'-änden och levererar translationsinitieringsfaktorer till platsen för dess start [26] .
I virus vars genom representeras av en enkelsträngad RNA-molekyl med positiv polaritet , påverkar 3'-UTR inte bara translation, utan är också involverad i replikation : det är från den som replikeringen av det virala genomet börjar [27 ] .
Mässlingsviruset (släktet Morbillivirus av familjen Paramyxoviridae ) har ett genom som representeras av en enkelsträngad RNA-molekyl med negativ polaritet. En intressant mekanism har etablerats för dess M- och F-gener. mRNA:n för dessa gener har långa UTR:er; de står för ~6,4% av det totala mRNA:n. Även om dessa gener inte är direkt involverade i replikation , ökar 3'-UTR-mRNA från M-genen uttrycket av M-proteinet och utlöser därigenom genomreplikation. Samtidigt minskar 5'-UTR av F-genens mRNA bildningen av F-proteinet och undertrycker därmed replikation [28] .
När forskare studerar strukturen och funktionen hos 3′-UTR använder forskarna flera olika metoder. Även om en given 3′-UTR visas vara närvarande i en viss vävnad, för att få en fullständig bild av dess funktioner, är det nödvändigt att analysera effekterna av dess olika lokalisering, bestämma varaktigheten av funktion, beskriva interaktioner med trans- regulatoriska proteiner och effekten på translationseffektivitet [29] . Med hjälp av bioinformatiska metoder, baserade på analys av den primära strukturen (dvs nukleotidsekvens), kan man leta efter ARE-element och mikroRNA-bindningsställen i en given 3'-UTR. Experimentella metoder etablerar sekvenser som interagerar med vissa trans-regulatoriska proteiner, och för tillfället, baserat på sekvenseringsdata och experimentella data, är det möjligt att hitta interaktionsställen med vissa proteiner i ett givet transkript [30] . Genom att artificiellt inducera mutationer i 3'-UTR, såsom de som påverkar terminatorkodonet, polyadenyleringssignalen eller den sekundära strukturen av 3'-UTR, är det möjligt att fastställa hur mutationer i dessa regioner kan leda till translationella störningar och uppkomsten av sjukdomar (mer om sjukdomar associerade med 3′ -UTR, se nedan) [31] . Så med hjälp av alla dessa metoder kan vi utveckla vår förståelse för strukturen och funktionerna hos cis-regulatoriska element i 3'-UTR, såväl som proteiner som interagerar med 3'-UTR.
Mutationer som påverkar 3′-UTR är viktiga eftersom en sådan mutation kan påverka uttrycket av många gener. Även på transkriptionsnivå påverkar mutationer den specifika allelen och fysiskt kopplade gener, eftersom 3'-UTR-bindande proteiner också är involverade i bearbetningen och exporten av mRNA från kärnan. Således kan en mutation påverka orelaterade gener [32] . Till exempel leder mutationer i ARE till felfunktion av ARE-bindande proteiner, vilket resulterar i utveckling av sjukdomar som malign degeneration av hematopoetiska organ och leukemi [33] [34] . Ett ökat innehåll av CTG-trinukleotiden i 3'-UTR av myotoninproteinkinasgenen orsakar myotonisk dystrofi . Insättning av en 3 kb retrotransposon bestående av tandemupprepningar i 3'-UTR av fukutinproteingenen har associerats med medfödd muskeldystrofi av Fukuyama-typ [29] . Förändringar i elementen lokaliserade i 3'-UTR är associerade med utvecklingen av sådana mänskliga sjukdomar som akut myeloid leukemi , alfa-thalassemi , neuroblastom , keratinopati, aniridi , IPEX-syndrom , medfödda hjärtfel [31] . Sambandet mellan några av dessa sjukdomar med specifika 3′-UTR-element visas i diagrammet nedan.