Konsensussekvens

En konsensussekvens är en artificiell DNA- eller RNA-sekvens som i varje position innehåller den nukleotid som oftast finns i flera homologa sekvenser. Det är resultatet av multipla sekvensinriktningar där homologa sekvenser jämförs med varandra. Sådan information är viktig när man studerar DNA- eller RNA-bindande proteiner såsom transkriptionsfaktorer eller RNA-polymeras [1] .

Biologisk betydelse

Det proteinbindande stället som representeras av konsensussekvensen kan vara en kort sekvens av nukleotider som förekommer flera gånger i genomet och tros spela samma roll på olika platser. Till exempel känner många transkriptionsfaktorer igen vissa mönster i promotorerna för dessa gener som de reglerar. På liknande sätt har restriktionsenzymer typiskt palindromiska konsensussekvenser, vanligtvis motsvarande platsen där de skär DNA . Transposoner verkar på ungefär samma sätt vid identifiering av målsekvenser för transposition. Slutligen kan splitsningsställen (sekvensen omedelbart runt exon  -introngränserna) också betraktas som konsensussekvenser. Således är en konsensussekvens en modell av ett förmodat DNA-bindningsställe: den erhålls genom att matcha alla kända exempel på ett speciellt igenkänningsställe och definieras som en idealiserad sekvens som representerar den dominerande basen vid varje position. Alla verkliga exempel bör inte skilja sig från konsensus med mer än ett fåtal substitutioner, men en sådan räkning kan leda till inkonsekvenser. Varje mutation som tillåter en muterad nukleotid i huvudpromotorsekvensen att mer likna konsensussekvensen är känd som en uppmutation. Denna typ av mutation gör vanligtvis promotorn starkare, och därmed bildar RNA-polymeraset en starkare bindning med det DNA som det vill transkribera, och transkription aktiveras. Däremot är mutationer som förstör konserverade nukleotider i konsensussekvensen kända som nedmutationer. Dessa typer av mutationer undertrycker transkription eftersom RNA-polymeraset inte längre kan binda så hårt till huvudpromotorsekvensen. Konsensussekvens [2] .

Cis-regulatoriska element av DNA och RNA

Cis-verkande regulatoriska element (cis-regulatoriska element): DNA- eller RNA- regioner som binder till regulatoriska molekyler, vanligtvis proteiner, och innehåller signaler för att reglera funktionen hos gener som finns på samma DNA-molekyl som det regulatoriska elementet. De cis-regulatoriska elementen består av ett antal korta DNA-sekvenser – moduler som upprepas i olika kombinationer i olika regulatoriska element. Sådana moduler inkluderar till exempel TATA-boxen (konsensussekvens TATA(A/T)A(A/T)), CAAT-box (consensus GGCCAATCT), GC-box (consensus GGGCGG), oktamerbox (consensus ATTTGCAT) och andra [ Sverdlov E. D. 2009 ].

DNA-region: CAAT-box (promotorsekvens)

CAAT-ruta: konsensussekvens GGCCAATCT är en kort DNA-sekvens, en modul som upprepas i regulatoriska element.

CCAAT-sekvensen (CAAT) förekommer i promotorzonen för olika vävnadsspecifika gener: vid position -80-50 av olika globingener , i tyroglobulingenen och i andra gener. CAAT - Blocket ligger i samma område som GC-blocket.

Rollen för CCAAT-motivet kan vara ganska viktig i regleringen av aktiviteten av globingener aktiverade eller undertryckta vid vissa utvecklingsstadier. Undertryckande av fetal nu-globinsyntes i en vuxen organism avlägsnas i fallet med en mutationssubstitution av en nukleotid i CCAAT-sekvensen. Mutationen leder till den så kallade ärftliga persistensen (bevarande av syntesen av fetalt nu-globin hos vuxna).

Det finns inget GC-motiv i promotorerna för globingener [3] .

TATA-box (Hogness box, TATA-box)

TATA-box (Hogness-box, TATA-box): i eukaryoter, en konsensus-DNA-sekvens rik på A-T-par (TATA (A/T) A (A/T)), vanligen innehållande 7 eller 8 nukleotider och belägen cirka 25 baspar före startsidan för transkriptionen. Modul som upprepas i regulatoriska element; fungerar som ett bindningsställe för RNA-polymeras.

Positionen för TATA-boxen definierar strikt platsen för transkriptionsinitiering, dvs. 5'-änden av transkriptet. När TATA-boxen skadas eller tas bort bildas en uppsättning RNA-molekyler med olika 5'-ändar. Individuella nukleotidsubstitutioner i TATA-boxen kan leda till en kraftig minskning av transkriptionseffektiviteten.

Promotorzonen för vissa gener (till exempel genen för hydroximetylglutaryl KoA-reduktas, ett nyckelenzym i human kolesterolbiosyntes ) innehåller inte en TATA-box, och transkriptionen startar från flera olika ställen. De resulterande RNA:n skiljer sig i sina 5'-ändar i regionen för den otranslaterade ledarsekvensen . Det är möjligt att olika ledarzoner bestämmer arten av regleringen av genuttryck på translationsnivå [4] .

Anteckningar

  1. Nukleinsyror: från A till Ö / B. Appel [et al.]. - M. : Binom: Kunskapslaboratoriet, 2013. - 413 sid. - 700 exemplar.  - ISBN 978-5-9963-0376-2 .
  2. Victor Kusnetsov, Martin Landsberger, Jörg Meurer, Ralf Oelmüller. Sammansättningen av CAAT-box-bindningskomplexet vid en fotosyntesgenpromotor regleras av ljus, cytokinin och stadiet av plasttiderna  //  Journal of Biological Chemistry. — 1999-12. — Vol. 274 , utg. 50 . — S. 36009–36014 . doi : 10.1074 / jbc.274.50.36009 . Arkiverad 25 maj 2021.
  3. Thomas Lathrop Stedman. Stedmans medicinska ordbok. . — 28:e uppl. - Philadelphia: Lippincott Williams & Wilkins, 2006. - 1 volym (olika sidor) sid. - ISBN 0-7817-3390-1 , 978-0-7817-3390-8, 978-0-7817-6450-6, 0-7817-6450-5.
  4. Xu et al. Kärnpromotorspecifik genreglering: TATA-boxselektivitet och initiatorberoende dubbelriktad serumresponsfaktoraktiverad transkription // Biochimica et Biophysica Acta  (  BBA) - Gene Regulatory Mechanisms. - 2016. - Vol. 4 . - S. 553-63 . - doi : 10.1016/j.bbagrm.2016.01.005 .