Promotor

Den aktuella versionen av sidan har ännu inte granskats av erfarna bidragsgivare och kan skilja sig väsentligt från versionen som granskades den 14 april 2022; verifiering kräver 1 redigering .

Promotor ( eng.  promotor ) är en DNA- nukleotidsekvens som känns igen av RNA-polymeras som en startplatta för att starta transkription . Promotorn spelar en av nyckelrollerna i transkriptionsinitieringsprocessen [1] .

Allmän information

Vanligtvis är promotorn placerad runt transkriptionsstartpunkten - den första nukleotiden från vilken transkriptet erhålls, som har en koordinat på +1 (den föregående nukleotiden betecknas som -1). Promotorn inkluderar vanligtvis ett antal motiv som är viktiga för dess igenkänning av RNA-polymeras. I synnerhet -10 och -35 element i bakterier , TATA-box i eukaryoter [1] .

Promotorn är asymmetrisk, vilket tillåter RNA-polymeras att starta transkription i rätt riktning och indikerar vilken av de två DNA-strängarna som kommer att fungera som mall för RNA- syntes . DNA-mallkedjan kallas icke-kodande, medan den andra kodande kedjan matchar det resulterande RNA:t i sekvens (exklusive ersättning av tymin med uracil ) [1] .

Promotorn under vilken den kodande RNA-regionen av DNA är belägen spelar en avgörande roll för uttrycksintensiteten av denna gen i varje specifik celltyp. Genom aktivitet delas promotorer in i konstitutiva (konstant nivå av transkription) och inducerbara (transkription beror på förhållandena i cellen, till exempel närvaron av vissa substanser eller närvaron av värmechock). Promotoraktivering bestäms av närvaron av en uppsättning transkriptionsfaktorer [1] .

Strukturen för promotorer

I bakterier

Det bakteriella kärn -RNA-polymeraset (som består av α2ββ'ω-subenheter) kan initiera transkription var som helst i genomet. I cellen sker emellertid initiering endast i promotorregionerna. Denna specificitet tillhandahålls av σ-subenheten ( σ-faktor ), som i komplex med kärnenzymet bildar ett holoenzym . Den huvudsakliga σ-faktorn för Escherichia coli-celler är σ 70 -subenheten [1] .

Den klassiska (σ 70 ) promotorn består av två konserverade sekvenser med 6 nukleotider långa, belägna uppströms om transkriptionsstartstället med 10 och 35 bp, åtskilda av 17 nukleotider. Dessa sekvenser kallas -10 respektive -35 element . Elementen är inte identiska i alla promotorer, men konsensussekvenser kan erhållas för dem [1] .

Vissa starka promotorer har också ett UP-element uppströms om -35-elementet, vilket ökar nivån av RNA-polymerasbindning. Vissa σ 70 -promotorer har inte -35-elementet, utan har -10-elementet förlängt upp ett par nukleotider ( förlängt -10 ). Detta är promotorn för galaktosoperonet E. coli . Ibland, under -10-elementet, finns det ett annat anslutande element - diskriminatorn [1] .

Alternativa σ-subenheter av RNA-polymeras ändrar specificiteten för promotorigenkänning. Till exempel orsakar σ 32 -subenheten igenkänning av promotorer för värmechockresponsgener, σ 54 är associerad med kvävemetabolismgener [1] .

I eukaryoter

Eukaryota celler innehåller flera typer av RNA-polymeraser. Transkription av mRNA utförs av RNA-polymeras II tillsammans med en uppsättning proteintranskriptionsfaktorer [ 1] .

Den eukaryota kärnpromotorn är den minsta uppsättningen av sekvenselement som krävs för bindning av RNA-polymeras II och transkriptionsfaktorer involverade i starten av transkriptionsinitiering. Typiskt är kärnpromotorn 40-60 bp lång och kan vara placerad antingen ovanför eller under transkriptionsstartpunkten. Den kompletta uppsättningen av kärnpromotorelement inkluderar BRE-element , TATA-box , Inr (initiator) och/eller nedströmselement (DPE, DCE och MTE). Vanligtvis innehåller promotorn en kombination av dessa element. Till exempel förekommer DPE och TATA-box vanligtvis inte samtidigt i en promotor. Ofta finns det en kombination av TATA box, DPE och Inr [1] .

promotorelement Bindande protein Koordinater Konsensussekvens
BRE element TFIIB -37 -32 [GC][GC][GA]CGCCC
TATA box TBP -31 -26 TATA[AT]A[AT]
Inr TFIID -2 +4 [CT][CT]AN[TA][CT][CT]
DCE I TFIID +6 +11 CTTC
DCE II TFIID +16 +21 CTGT
MTE +21 +28
DPE TFIID +28 +32 [AG]G[AT]CGTG
DCE III TFIID +30 +34 AGC

För att transkriptionen av eukaryoter ska fortsätta är interaktion med regulatoriska sekvenser lokaliserade från transkriptionsstartpunkten nödvändig - proximala sekvenser, förstärkare , ljuddämpare , isolatorer, gränselement [1] .

I eukaryota celler finns det förutom RNA-polymeras II ytterligare två RNA-polymeraser som transkriberar rRNA ( RNA-polymeras I är ansvarig för detta ) och icke-kodande RNA som tRNA och 5sRNA (de transkriberas av RNA-polymeras III ) [1 ] .

RNA-polymeras I i eukaryota celler transkriberar en enda rRNA -prekursorgen , närvarande i många kopior i genomet. rRNA-genpromotorn innehåller kärnelement (koordinater runt -45 +20) och UCE ( uppströms kontrollelement , koordinater runt -150 -100). Transkriptionsinitiering av denna gen kräver också flera transkriptionsfaktorer, TBP, SL1 (består av TBP-proteinerna och tre TAF) och UBF. UBF binder UCE-elementet, SF1 binder kärnpromotorn. Bundet UBF stimulerar polymerasbindning till kärnpromotorregionen [1] .

RNA-polymeras III transkriberar generna av en del av cellens icke-kodande RNA ( tRNA , 5sRNA). Promotorerna för RNA-polymeras III är mycket olika och ligger vanligtvis under transkriptionsstartpunkten. Promotorer av tRNA-gener, i synnerhet, innehåller A- och B-boxar; transkriptionsfaktorerna TFIIIB och TFIIIC krävs för initiering. Andra promotorer kan innehålla A- och C-boxar (till exempel 5sRNA), transkriptionsfaktorer TFIIIA, TFIIIB, TFIIIC krävs för initiering. RNA-polymeras III-promotorgruppen innehåller TATA-boxar [1] .

Reglering av initiativtagare

Reglering av transkriptionsnivån sker ofta vid initieringsstadiet, det vill säga från bindningen av RNA-polymeras till promotorn före starten av förlängningen [1] .

Promotorregionen inom en operon i bakterier kan överlappa eller inte överlappa alls med operatorregionen för en cistron ( gen ) . Hos bakterier bestäms bindningen till promotorn av den strukturella delen av polymeraset, σ-subenheten. Regulatoriska proteiner är också ofta involverade i regleringen, vilket kan påskynda processen och öka dess effektivitet (aktivatorer) eller sakta ner den (repressorer) [1] .

Transkription av eukaryoter regleras på ett sätt som liknar det för bakterier (på grund av olika regulatoriska proteiner), men skiljer sig också. Eukaryota gener bildar inte operoner, varje gen har sin egen promotor. Eukaryoter har kromatin som består av DNA och nukleosomer. Både DNA och nukleosomer kan genomgå kemisk modifiering som påverkar nivån av transkription. Även andra DNA-regioner, såsom förstärkare, ljuddämpare, isolatorer, gränselement, är involverade i regleringen av promotorer i eukaryoter [1] .

Exempel på promotorer

Sekvenserna och regulatoriska egenskaperna hos många promotorer från olika levande organismer är nu välkända. Denna kunskap används i stor utsträckning vid skapandet av biotekniska genetiska konstruktioner ( plasmider , vektorer ). För produktuttryck i bakteriella eller eukaryota celler kan både en promotor som är karakteristisk för denna grupp av organismer som finns i genomet och en promotor, till exempel från virus som infekterar denna organism, användas [1] .

Klassiska exempel på bakteriella operoner med känd reglering av prokaryota promotorer är: laktospromotor , tryptofanpromotor , arabinospromotor , GABA-operon , galaktosoperon . Väl studerade eukaryota cellpromotorer är jäst GAL1-promotorn, den inducerbara TRE-tetracyklinpromotorn och den inducerbara edkyson-promotorn. I det virala genomet, såväl som i pro- och eukaryota sådana, finns det promotorer, till exempel T5-fagpromotorn, T7-fagpromotorn, de konstitutiva promotorerna för SV40-virusen (polyomvirus), RSV, CMV (cytomegalovirus) [1] .

Promotorregionförutsägelse

Ofta producerar promotorförutsägelsealgoritmer ett stort antal falska positiva (förutsäga promotorsekvenser som inte är promotorer). Till exempel förutsäger olika algoritmer i genomsnitt en promotor per 1000 bp, medan det mänskliga genomet innehåller ungefär en gen per 30 000–40 000 bp. [2] Detta resultat beror på det faktum att många faktorer måste beaktas när man förutsäger promotorer [2] :

Trots de ovan beskrivna svårigheterna finns det många algoritmer för att förutsäga promotorregioner i olika organismer. Tabellen nedan visar några av dem.

Algoritmnamn Hur algoritmen fungerar Vad algoritmen förutspår
TSSW [3] Algoritmen förutsäger potentiella transkriptionsstartställen med hjälp av en linjär diskriminantfunktion som kombinerar egenskaper som beskriver de funktionella motiven och oligonukleotidsammansättningen för dessa ställen. TSSW använder TRANSFAC funktionella platsdatabas (författad av E. Wingender [4] , därav den sista bokstaven i namnet på TSSW-metoden). PolII human promotorregion.
TSSG [3] /Fprom [3] TSSG-algoritmen fungerar på samma sätt som TSSW, men använder en annan databas, TFD [5] . Fprom är samma TSSG tränad på en annan uppsättning promotorsekvenser. TSSG, human PolII-promotorregion; Fprom, human promotorregion.
TSSP [3] Algoritmen fungerar på samma sätt som TSSW, med hjälp av databasen med anläggningsreglerande element RegSite [6] . Samtidigt tränades algoritmen på sekvenserna av växtpromotorregioner. växtfrämjarregion.
Peppar [7] Algoritmen förutsäger promotorregionen baserat på en kurerad positionell viktmatris och dold Markov-modell för konsensussekvenserna -35 och -10, såväl som olika bindningsställen för Bacillus subtilis och Escherichia coli (tagna som representanter för Gram-positiva och Gram - negativa bakterier). Promotorregion av prokaryoter (lämplig huvudsakligen för bakteriegenom).
PromoterInspector [8] Den heuristiska algoritmen är baserad på den genomiska miljön för promotorregionen för ett prov av däggdjurssekvenser. PolII-promotorregion hos däggdjur.
BPROM [3] Algoritmen fungerar på samma sätt som TSSW, med hjälp av DPInteract [9] funktionella platsdatabas . σ 70 E. coli- promotorregion .
NNPP 2.2 [10] Programmet är ett neuralt nätverk med fördröjning, som består av två funktionella lager, ett för TATA-box-igenkänning och ett för Inr-elementigenkänning. Promotorregion av eukaryoter och prokaryoter.
G4PromFinder [11] Algoritmen identifierar förmodade promotorer baserade på AT-rika element och G-quadruplex DNA-motiv i den GC-rika regionen. Promotorregion av bakterier.

Med ökningen av antalet förutsagda, experimentellt visade promotorregioner av olika organismer, blev det nödvändigt att skapa en databas med promotorsekvenser. Den största databasen med eukaryota promotorsekvenser (främst ryggradsdjur) är Eukaryotic Promoter Database [12] . Databasen är uppdelad i två delar. Den första (EPD) är en kurerad samling av promotorsekvenser som erhålls genom att bearbeta experimentella data, den andra (EPDnew) är resultatet av att sammanfoga promotorinformation från EPD-databasen med dataanalys från sekvenseringsmetoder med hög genomströmning. Med hjälp av metoder med hög genomströmning för att erhålla transkriptom var det möjligt att erhålla en uppsättning promotorer för några representanter för växter och svampar: Arabidopsis thaliana (Tal's coli), Zea mays (Sockermajs), Saccharomyces cerevisiae , Schizosaccharomyces pombe [13 ] .

Anteckningar

  1. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 Watson JD, Baker TA, Bell SP, Gann AA, Levine M., Losick RM Molecular Biology of the  Gene . — 7:a. — Pearson, 2014.
  2. 1 2 Pedersen Anders Gorm , Baldi Pierre , Chauvin Yves , Brunak Søren. Biologin för förutsägelse av eukaryota promotorer - en recension  //  Computers & Chemistry. - 1999. - Juni ( vol. 23 , nr 3-4 ). - S. 191-207 . — ISSN 0097-8485 . - doi : 10.1016/S0097-8485(99)00015-7 .
  3. 1 2 3 4 5 Solovyev Victor V. , Shahmuradov Ilham A. , Salamov Asaf A. Identifiering av promotorregioner och regulatoriska platser  (engelska)  // Methods in Molecular Biology. - 2010. - S. 57-83 . — ISBN 9781607618539 . — ISSN 1064-3745 . - doi : 10.1007/978-1-60761-854-6_5 .
  4. Wingender E. TRANSFAC: en databas om transkriptionsfaktorer och deras DNA-bindningsställen  //  Nucleic Acids Research. - 1996. - 1 januari ( vol. 24 , nr 1 ). - S. 238-241 . — ISSN 1362-4962 . doi : 10.1093 / nar/24.1.238 .
  5. David Ghosh. En relationsdatabas med transkriptionsfaktorer  //  Nucleic Acids Research. - 1990. - Vol. 18 , nr. 7 . - P. 1749-1756 . — ISSN 0305-1048 . - doi : 10.1093/nar/18.7.1749 .
  6. RegSite Database . SoftBerry . Hämtad 7 april 2019. Arkiverad från originalet 22 oktober 2019.
  7. de Jong Anne , Pietersma Hilco , Cordes Martijn , Kuipers Oscar P , Kok Jan. PePPER: en webbserver för förutsägelse av prokaryota promotorelement och reguloner  //  BMC Genomics. - 2012. - Vol. 13 , nr. 1 . — S. 299 . — ISSN 1471-2164 . - doi : 10.1186/1471-2164-13-299 .
  8. Scherf Matthias , Klingenhoff Andreas , Werner Thomas. Mycket specifik lokalisering av promotorregioner i stora genomiska sekvenser av PromoterInspector: a novel context analysis approach  //  Journal of Molecular Biology. - 2000. - Mars ( vol. 297 , nr 3 ). - s. 599-606 . — ISSN 0022-2836 . - doi : 10.1006/jmbi.2000.3589 .
  9. Robison Keith , McGuire Abigail Manson , Church George M. Ett omfattande bibliotek av DNA-bindningsplatsmatriser för 55 proteiner applicerade på det kompletta Escherichia coli K-12-genomet 1 1Redigerad av R. Ebright  //  Journal of Molecular Biology. - 1998. - November ( vol. 284 , nr 2 ). - S. 241-254 . — ISSN 0022-2836 . - doi : 10.1006/jmbi.1998.2160 .
  10. Burden S. , Lin Y.-X. , Zhang R. Förbättring av promotorprediktion Förbättring av promotorprediktion för NNPP2.2-algoritmen: en fallstudie med Escherichia coli DNA-sekvenser   // Bioinformatics . - 2004. - 28 september ( vol. 21 , nr 5 ). - s. 601-607 . — ISSN 1367-4803 . - doi : 10.1093/bioinformatics/bti047 .
  11. Di Salvo Marco , Pinatel Eva , Talà Adelfia , Fondi Marco , Peano Clelia , Alifano Pietro. G4PromFinder: en algoritm för att förutsäga transkriptionspromotorer i GC-rika bakteriegenom baserad på AT-rika element och G-quadruplex-motiv  //  BMC Bioinformatics. - 2018. - 6 februari ( vol. 19 , nr 1 ). — ISSN 1471-2105 . - doi : 10.1186/s12859-018-2049-x .
  12. Cavin Perier R. The Eukaryotic Promoter Database EPD  //  Nucleic Acids Research. - 1998. - 1 januari ( vol. 26 , nr 1 ). - s. 353-357 . — ISSN 1362-4962 . doi : 10.1093 / nar/26.1.353 .
  13. Dreos René , Ambrosini Giovanna , Groux Romain , Cavin Périer Rouaïda , Bucher Philipp. Den eukaryota promotordatabasen i sitt 30:e år: fokus på icke-ryggradsdjursorganismer  //  Nucleic Acids Research. - 2016. - 28 november ( vol. 45 , nr D1 ). -P.D51 -D55 . — ISSN 0305-1048 . doi : 10.1093 / nar/gkw1069 .