STARR-Seq ( självtranskriberande aktiv regulatorisk regionsekvensering ) är en metod för att analysera förstärkaraktiviteten hos miljontals DNA- sekvenser samtidigt från arvsmassan från godtyckliga organismer . STARR-seq har hög prestanda och kan användas för genomomfattande sökning och kvantifiering av förstärkaraktivitet [1] .
I eukaryoter regleras transkription av transkriptionsfaktorer - proteiner som binder till specifika DNA-regioner i genpromotorer , såväl som till regioner som inte är belägna i nära anslutning till gener, inklusive förstärkare . Enhancers är icke-kodande regioner av DNA som innehåller specifika bindningsställen för olika transkriptionsfaktorer [2] . Förstärkare rekryterar transkriptionsfaktorer som aktiverar RNA-polymeras II och allmänna transkriptionsfaktorer nära promotorn, vilket leder till gentranskription. Enhancers kan reglera transkriptionen av målgener på ett vävnadsspecifikt sätt [1] , oavsett deras placering i DNA och avståndet från genpromotorn. I vissa fall kan de reglera transkriptionen av gener som finns på en annan kromosom [3] . Men hittills har informationen varit begränsad till studier av ett litet antal förstärkare på grund av komplexiteten i deras genomomfattande sökning [2] . Dessutom fungerar många reglerande element uteslutande i specifika celltyper och under vissa förhållanden [4] .
För att bestämma förstärkare i Drosophila används en teknik som använder en slumpmässig infogning av ett transposon som kodar för en minimal promotor med ett reporterprotein . Denna metod ger information om regleringen av gener som ligger nära insättningsstället av förstärkare [5] .
Under de senaste åren har olika egenskaper hos aktiva och inaktiva förstärkare studerats med hjälp av postgenomiska teknologier. Utvecklingen av nya metoder, såsom DNase-seq , FAIRE-Seq , ChIP-seq , gjorde det möjligt att förutsäga förstärkares position i genomet. DNase-seq och FAIRE-seq tillåter emellertid inte direkt bestämning av förstärkaren och dess aktivitet. Dessutom kan dessa metoder inte testa ett stort antal kandidatsekvenser för närvaron av förstärkaraktivitet. Utvecklingen av STARR-seq gör det möjligt att utföra en genomomfattande sökning efter förstärkare och att kvantifiera deras aktivitet [1] .
Idén med STARR-seq föreslogs i laboratoriet av A. Stark (A. Stark, Institute of Molecular Pathology , Wien , Österrike ) för en genomomfattande sökning efter förstärkare av godtyckliga organismer, såväl som kvantitativ bestämning av deras aktivitet. Metoden bygger på att förstärkare kan fungera oavsett deras relativa placering på DNA. Kärnan i metoden ligger i placeringen av den potentiella förstärkaren efter den minimala promotorn, vilket gör att den aktiva förstärkaren kan aktivera transkriptionen av DNA som innehåller sin egen sekvens. Aktiviteten hos varje förstärkare kännetecknas av graden av anrikning av RNA med förstärkarsekvensen bland allt cellulärt RNA. Med detta tillvägagångssätt är det möjligt att samtidigt kontrollera miljontals DNA-sektioner från en godtycklig källa [1] .
Genomiskt DNA bryts slumpmässigt upp i små fragment. Fragment av en viss längd väljs, adaptrar ligeras till dem. DNA-fragmenten med adaptrar amplifieras sedan . PCR - produkterna renas och sätts in i plasmiden efter den minimala promotorn i den 3'-otranslaterade regionen av reportergenen, vilket gör att den aktiva förstärkaren kan aktivera transkription av RNA-polymeras av en DNA-region som innehåller, efter transkriptionsstartpunkten, sekvensen av själva förstärkaren. Cellerna transfekteras sedan med det resulterande reporterbiblioteket och odlas. Polyadenylerat RNA isoleras från totalt RNA och cDNA erhålls genom omvänd transkription , som amplifieras, varefter sekvensen av fragmenten igenkänns genom parad-änd-sekvensering . De sekvenserade fragmenten mappas till referensgenomet och data skickas för datorbehandling [1] .
STARR-seq-metoden tillämpades ursprungligen på Drosophila -genomet . Det visade sig att de flesta (55,6%) av förstärkare är lokaliserade i introner , i synnerhet i det första intronet, och intergena regioner. Det är intressant att en liten del (4,5 %) av förstärkare finns vid transkriptionsstartställen, och därför kan man anta att dessa förstärkare både kan starta transkription på denna plats och påverka transkriptionen av andra gener. De mest aktiva förstärkarna är belägna nära konstitutiva gener , såsom de som kodar för cytoskelettproteiner , och vissa utvecklingsregulatorer, såsom transkriptionsfaktorer. Författarna visade att många gener regleras av flera oberoende aktiva förstärkare. Dessutom visade det sig att nivåerna av genuttryck i genomsnitt korrelerar med den totala förstärkaraktiviteten per gen, vilket ger ett direkt samband mellan uttrycksnivån och förstärkaraktiviteten [1] .
Genom att använda STARR-seq för att söka efter och karakterisera regulatoriska allelvarianter upptäckte Vockey et al effekterna av mänsklig genetisk variation på funktionen av icke-kodande regulatoriska element genom att mäta aktiviteten hos 100 förmodade förstärkare från genomen från 95 individer. Detta tillvägagångssätt gör det möjligt att identifiera regulatoriska varianter (inklusive SNPs ) lokaliserade i genomiska loci som bidrar till förändringar i uttrycksnivåerna för olika mRNA ( eQTL ), samt bidrar till komplexa fenotyper [7] .
STARR-seq-metoden har följande fördelar:
STARR-seq kombinerar klassiska metoder för molekylärbiologi med högt specialiserade bioinformatiska metoder för att detektera och kvantifiera förstärkaraktivitet. Hittills har STARR-seq applicerats i mus- och mänskliga celler, och dess effektivitet har bekräftats [8] . Tillämpningen av STARR-seq på en mängd olika celltyper av olika organismer kommer att göra det möjligt att ta ett betydande steg i studiet av genreglering och de signalvägar som ansvarar för den under utveckling och celldifferentiering , under normala och patologiska tillstånd [6 ] .