Encyclopedia av DNA-element

Den aktuella versionen av sidan har ännu inte granskats av erfarna bidragsgivare och kan skilja sig väsentligt från versionen som granskades den 10 februari 2017; kontroller kräver 17 redigeringar .
KODA
Innehåll
Beskrivning Hela genomet databas
Kontakter
Forskningscenter University of California Santa Cruz
Laboratorium Centrum för biomolekylär vetenskap och teknik
Författarna Brian J Raney [1]
Originalpublikation PMID 21037257
Utgivningsdatum 2010
Tillgänglighet
Hemsida encodeproject.org

Encyclopedia of DNA Elements ( ENCODE  ) är ett internationellt forskningskonsortium som grundades i september 2003 . Organiserad och finansierad av US National Human Genome Research Institute ( NHGRI ) [1] [2] [3] . Tänkt som en fortsättning på Human Genome Project, syftar ENCODE till att genomföra en fullständig analys av de funktionella delarna av det mänskliga genomet . Alla resultat som erhålls under genomförandet av projektet publiceras i offentliga databaser .  

Den 5 september 2012 publicerades de första resultaten av projektet i form av 30 sammanlänkade publikationer på webbplatserna för tidskrifterna " Nature ", " Genome Biology " och " Genome Research " [4] [ 5] . Dessa publikationer visar att minst 80 % av det mänskliga genomet är biologiskt aktivt, fram till dess dominerade föreställningen att det mesta DNA var " skräp ". Men sådana förhastade slutsatser kritiseras av många forskare, som pekar på bristen på nödvändiga bevis för funktionaliteten hos dessa element [6] .

Relevans

Det mänskliga genomet uppskattas innehålla 20 000 proteinkodande gener (tillsammans utgör de exome ), och de står för endast cirka 1,5 % av det mänskliga genomets DNA . Det primära målet med ENCODE-projektet är att bestämma funktionen hos resten av genomet, varav de flesta traditionellt har ansetts som " skräp " (till exempel DNA som inte transkriberas ).

Ungefär 90 % av enstaka nukleotidpolymorfismer i det mänskliga genomet (som har visats vara associerade med olika sjukdomar med användning av genomomfattande associationsstudier ) finns utanför proteinkodande regioner. [7]

Aktiviteten och uttrycket av proteinkodande gener kan regleras av regulomen - olika element i DNA, såsom promotorn , regulatoriska sekvenser och kromatinregioner , såväl som histonmodifieringar . Man tror att förändringar i regulatoriska regioner kan störa proteinuttryck och cellfunktion och därmed leda till sjukdomar ( ENCODE Project Background ). Genom att bestämma lokaliseringen av regulatoriska element och deras effekt på transkription är det möjligt att belysa sambandet mellan förändringar i uttrycksnivåerna för specifika gener och utvecklingen av sjukdomar. [åtta]

ENCODE är tänkt att vara en omfattande resurs som kommer att göra det möjligt för forskarvärlden att bättre förstå hur genomet kan påverka människors hälsa och stimulera utvecklingen av nya metoder för att förebygga och behandla sjukdomar. [9]

Hittills hjälper projektet till med upptäckten av nya DNA-regulatoriska element, ger nya insikter i organisationen och regleringen av våra gener och genom, samt hur förändringar i DNA-sekvens kan påverka utvecklingen av sjukdomar. [7] Ett av projektets huvudresultat är beskrivningen att 80 % av det mänskliga genomet har visat sig vara associerat med minst en biokemisk funktion. [10] [11] Det mesta av detta icke-kodande DNA är involverat i regleringen av uttrycket av kodande gener. [10] Dessutom kontrolleras uttrycket av varje kodande gen av en mängd olika regulatoriska regioner belägna både nära och på avstånd från genen. Dessa resultat visar att genreglering är mycket mer komplex än man tidigare trott. [12]

Projekt ENCODE

ENCODE-projektet genomförs i tre steg: den inledande fasen, den tekniska utvecklingsfasen och den produktiva fasen.

Under den inledande fasen utvärderade ENCODE-konsortiet strategier för att identifiera olika typer av genomelement . Syftet med den inledande fasen var att definiera en uppsättning procedurer som tillsammans skulle möjliggöra noggrann och detaljerad karakterisering av stora regioner av det mänskliga genomet , med hänsyn till processens ekonomiska bärkraft och höga effektivitet. Den inledande fasen var att identifiera luckor i verktygsuppsättningen för att definiera funktionella sekvenser, samt att visa om någon av de använda metoderna visade sig vara ineffektiva eller olämpliga för uppskalning. Vissa av dessa problem måste åtgärdas under utvecklingsfasen av ENCODE-tekniken (samtidigt med projektets inledande fas), som syftade till att utveckla nya laboratorie- och beräkningsmetoder som skulle förbättra identifieringen av kända funktionella sekvenser eller studien av nya funktionella delar av genomet. Resultatet av de två första stegen, med exemplet att studera 1% av det mänskliga genomet, bestämde det bästa sättet att analysera de återstående 99% med maximal effektivitet och lägsta kostnad under den produktiva fasen. [9]

Fas I av ENCODE-projektet: inledande fas

Under pilotfasen genomfördes forskning och jämförelse av befintliga metoder för en noggrann analys av en viss del av den mänskliga genomsekvensen. Det organiserades som ett öppet konsortium och samlade forskare från olika bakgrunder och bakgrunder för att bedöma fördelarna med varje teknik, teknologi och strategi från en mångsidig uppsättning. Samtidigt var målet för projektets teknikutvecklingsfas att utveckla nya, högeffektiva metoder för att bestämma funktionella element. Syftet med detta arbete var att fastställa en uppsättning tillvägagångssätt som skulle möjliggöra den mest exakta bestämningen av alla funktionella element i det mänskliga genomet. Under den inledande fasen fastställdes olika metoders förmåga att skala upp för att analysera hela det mänskliga genomet och luckor i definitionen av funktionella element i genomsekvensen identifierades.

Den inledande fasen av projektet skedde i nära samarbete mellan experimentörer och teoretiker, vilket möjliggjorde utvärderingen av ett antal metoder för att kommentera det mänskliga genomet. En uppsättning regioner, som representerar cirka 1 % (30 Mb) av det mänskliga genomet, valdes ut som mål för den inledande fasen av projektet och analyserades av alla deltagare i pilotfasen av projektet. All data om dessa regioner som erhållits av ENCODE-deltagare släpptes snabbt i offentliga databaser. [13] [14]

Fas I-resultat [13]
  • Det mänskliga genomet transkriberas överallt, så att de flesta av dess baser är associerade med minst ett primärt transkript, och många transkript associerar distala regioner med specifika proteinkodande loci.
  • Många nya icke-proteinkodande transkript har identifierats, av vilka många överlappar proteinkodande loci och andra loci som är belägna i regioner av genomet som tidigare ansetts som transkriptionellt tysta.
  • Många tidigare okända transkriptionsstartställen har identifierats, av vilka många uppvisar kromatinstruktur och proteinsekvensspecifika bindningsegenskaper som liknar välkarakteriserade promotorer.
  • Regulatoriska sekvenser som omger transkriptionsstartställen är fördelade symmetriskt, utan förskjutning mot överliggande regioner.
  • Kromatintillgänglighet och histonmodifieringsmönster är mycket förutsägande för både närvaron och aktiviteten hos transkriptionsstartställen.
  • Distala överkänsliga DNaseI-ställen har karakteristiska histonmodifieringsmönster som på ett tillförlitligt sätt skiljer dem från promotorer.
  • DNA-replikationstid korrelerar med kromatinstruktur.
  • Totalt 5 % av baserna i genomet kan med säkerhet identifieras som under evolutionära restriktioner hos däggdjur; för cirka 60 % av dessa begränsade baser finns det bevis på att de fungerar baserat på experimentella analyser utförda hittills.
  • Olika funktionella element varierar mycket i deras sekvensvariabilitet i den mänskliga populationen och i deras sannolikhet att vara i en strukturellt variabel region av genomet.
  • Överraskande nog verkar många funktionella element inte vara begränsade till däggdjursutveckling. Detta tyder på möjligheten av ett stort antal neutrala element som är biokemiskt aktiva men som inte ger mycket fördel för kroppen. Denna pool kan fungera som ett "lager" för naturligt urval, potentiellt fungera som en källa för härstamningsspecifika element och funktionellt konserverade men icke ortologa element mellan arter.

Fas II av ENCODE-projektet: produktiv fas

I september 2007 påbörjades finansieringen av den produktiva fasen av ENCODE-projektet. I detta skede var målet att analysera hela genomet och genomföra "ytterligare studier i industriella förhållanden. [15]

Liksom i den inledande fasen organiserades arbetet i den produktiva fasen som ett öppet konsortium. I oktober 2007 tilldelade National Institute for Human Genome Research anslag på totalt mer än $80 miljoner för 4 år till det. [16] Under den produktiva fasen omfattade projektet Data Coordination Center, Data Analysis Center och Technology Development Center. [17] Vid denna tidpunkt förvandlas projektet till ett verkligt massivt företag, som involverar 440 forskare från 32 laboratorier runt om i världen. 2007, när det inledande skedet var avslutat, ökade projektet kapaciteten till stor del på grund av nästa generations sekvensering . Faktum är att mycket data bearbetades, forskarna fick cirka 15 terabyte av råinformation.

År 2010 hade ENCODE-projektet tagit emot mer än 1 000 genomomfattande datamängder. Sammantaget visar dessa data vilka regioner som verkar styra uttrycket av gener som används i vissa celltyper, och vilka regioner som interagerar med en stor mängd proteiner. Projektet ger information om transkriptionsställen, deras associerade transkriptionsfaktorer, kromatinstruktur och histonmodifieringar.

Fas II-resultat [18]
  • Den stora majoriteten (80,4%) av det mänskliga genomet är involverat i minst en RNA- och/eller kromatinassocierad biokemisk händelse i minst en celltyp. Det mesta av genomet är lokaliserat nära regulatoriska händelser: 95 % av genomet är inom 8 kilobaser från en DNA-proteininteraktion (uppmätt med ChIP-seq motivanalys eller DNas I-bindning), och 99 % är inom 1,7 kilobaser av minst en från biokemiska händelser presenterade av ENCODE.
  • Klassificering av genomet i sju kromatintillstånd antyder en initial uppsättning av 399 124 regioner med förstärkarliknande egenskaper och 70 292 regioner med promotorliknande egenskaper, såväl som hundratusentals icke-rörliga regioner. Högupplöst analys delar upp genomet ytterligare i tusentals smala tillstånd med olika funktionella egenskaper.
  • RNA-sekvensgenerering och -bearbetning kan kvantitativt korreleras med både kromatinmärken och transkriptionsfaktor (TF) bindning på promotorer, vilket indikerar att promotorfunktionalitet kan stå för mycket av variationen i RNA-uttryck.
  • Många icke-kodande varianter i individuella genomsekvenser ligger i ENCODE-kommenterade funktionella regioner; detta antal är minst lika högt som de som finns i generna som kodar för proteiner.
  • SNPs associerade med sjukdom av GWAS är berikade med icke-kodande funktionella element, av vilka de flesta finns i eller nära vissa ENCODE-definierade regioner, utanför proteinkodande gener. I många fall kan sjukdomsfenotyper associeras med en viss celltyp eller transkriptionsfaktor.
  • ENCODE Consortium

ENCODE-konsortiet består huvudsakligen av forskare som sponsras av US National Human Genome Research Institute . Övriga projektdeltagare är medlemmar i konsortiet eller den analytiska arbetsgruppen.

Den inledande fasen av projektet bestod av åtta studiegrupper och tolv grupper som deltog i teknikutvecklingsfasen av ENCODE-projektet ( ENCODE Pilot Project: Participants and Projects ). I slutet av 2007, när pilotfasen av projektet officiellt avslutades, hade antalet deltagare vuxit till 440 forskare från 32 laboratorier runt om i världen. För närvarande består konsortiet av olika centra som utför olika uppgifter ( ENCODE Participants and Projects ):

  1. Produktionscenter (ENCODE Production Centers)
  2. Data Coordination Center (ENCODE Data Coordination Center)
  3. Data Analysis Center (ENCODE Data Analysis Center)
  4. Beräkningsanalys av resultat (ENCODE Computational Analysis Awards)
  5. Teknisk utveckling (ENCODE Technology Development Effort)

Presenterade data

Sedan 2007 har ENCODE-projektets deltagare genomfört ett stort antal studier baserade på olika biologiska sekvenser för att kartlägga de funktionella delarna av det mänskliga genomet [19] . Kartlagda element (och tillvägagångssätt som används) inkluderar RNA-transkriptionsregioner (RNA-seq, CAGE, RNA-PET och manuell annotering), proteinkodande regioner (masspektrometri), transkriptionsfaktorbindningsställen (ChIP-seq och DNase-seq), kromatinstruktur (DNase-seq, FAIRE-seq, histon ChIP-seq och MNase-seq) och DNA-metyleringsställen (RRBS-analys). Nedan följer en detaljerad beskrivning av de uppgifter som projektdeltagarna har erhållit under åren av sitt arbete och presenteras på projektets webbplats.

Transkriberade och proteinkodande regioner

Projektet använde manuell och automatiserad anteckning för att skapa en omfattande katalog över mänskliga proteinkodande och icke-kodande RNA och pseudogener, kallad GENCODE. [20] [21] Katalogen innehåller 20 687 proteinkodande gener, med ett genomsnitt på 6,3 alternativt splitsade per lokus.

Dessutom genererade 8801 automatiskt små RNA och 9640 manuellt kurerade långa icke-kodande RNA (lncRNA) kommenterades. Jämförelse av lncRNA med andra ENCODE-data visar att lncRNA genereras via en väg som liknar proteinkodande gener. [22] GENCODE-projektet annoterade också 11 224 pseudogener, varav 863 är transkriberade och associerade med aktivt kromatin. [23]

RNA

  • RNA sekvenserades från 16 olika cellinjer och multipla subcellulära fraktioner för att utveckla en omfattande katalog av RNA-uttryck. Om man antar att ett konservativt tröskelvärde används för att identifiera regioner med RNA-aktivitet, representeras 62 % av genomiska baser reproducerbart i sekvenserade långa (>200 nukleotider) RNA-molekyler eller GENCODE-exoner.
  • Metoden CAGE-seq (5' cap target RNA-isolering och sekvensering) användes för att identifiera 62 403 transkriptionsstartställen (TSS) med hög konfidens (IDR 0,01).
  • Slutligen hittades en betydande andel av kodande och icke-kodande transkript som bearbetades till ihållande stabila RNA kortare än 200 nukleotider. Dessa prekursorer inkluderar överförings-RNA, miRNA , litet nukleärt RNA och litet nukleolärt RNA ( tRNA , miRNA , snRNA respektive snoRNA)

Proteinbindningsställen

För att direkt identifiera regulatoriska regioner kartlade projektdeltagarna bindningsställena för 119 olika DNA-bindande proteiner och ett antal RNA-polymeraskomponenter i 72 celltyper med hjälp av ChIP-seq. [24] Varje bindningsställe undersöktes för anrikning av kända DNA-bindande motiv och för närvaron av nya motiv.

Regioner i genomet som är överkänsliga för DNas I

Kromatintillgänglighet, kännetecknad av DNas I-överkänslighet, är ett kännetecken för DNA-reglerande regioner. [25] [26] Projektdeltagarna kartlade 2,89 miljoner unika, icke-överlappande DNase I-överkänslighetsplatser (DHS) med hjälp av DNase-seq i 125 celltyper.

Histon modifieringsplatser

Kromosomala placeringar av 12 histonmodifikationer i 46 celltyper analyserades. De erhållna data visar att de globala modifieringsmönstren varierar mycket för olika celltyper i enlighet med förändringar i transkriptionsaktivitet. Det har visat sig att integrationen av olika histonmodifieringsinformation kan användas systematiskt för att tilldela funktionella attribut till genomiska regioner. [27]

DNA-metylering

Cytosinmetylering (vanligtvis vid CpG-dinukleotider) är involverad i den epigenetiska regleringen av genuttryck. Promotormetylering är ofta associerad med repression, medan genmetylering korrelerar med transkriptionsaktivitet. [28] Projektdeltagarna använde metoden Restricted Genomic Loci Set Bisulfite Sequencing (RRBS) för att kvantitativt profilera DNA-metylering för i genomsnitt 1,2 miljoner CpGs i var och en av 82 cellinjer och vävnader, inklusive CpGs i intergena regioner av proximala promotorer och regioner inom en gen (genkroppar). [29]

Platser för kromosominteraktioner

Fysiska interaktioner mellan enskilda regioner av kromosomer, som kan separeras med hundratals kilobaser, anses viktiga i regleringen av genuttryck 46. 5C-metoden har avslöjat långväga interaktioner med transkriptionsstartställen (TSS) i ett mål 1% av genomet (44 ENCODE pilotregioner) i fyra celltyper (GM12878, K562, HeLa-S3 och H1 hESC) 49. Hundratals statistiskt signifikanta långdistansinteraktioner hittades i varje celltyp efter att ha tagit hänsyn till kromatinpolymerbeteende och experimentell variation. Par av interagerande loci visade en stark korrelation mellan nivån av TSS-genuttryck och närvaron av vissa klasser av funktionella element, såsom förstärkare . Det genomsnittliga antalet distala element som interagerar med TSS var 3,9 och medeltalet av TSS som interagerar med det distala elementet var 2,5, vilket indikerar ett komplext nätverk av sammankopplat kromatin. Denna sammanflätade "långdistans"-arkitektur har också avslöjats över genomet genom kromatininteraktionsanalys med parad slutmärkssekvensering ( ChIA-PET ) som används för att detektera interaktioner i RNA-polymeras II (Pol II) berikat kromatin i fem celltyper. [trettio]

Kritik

Trots konsortiets påståenden om att ENCODE-projektet långt ifrån är över har responsen på de artiklar och pressbevakning som redan publicerats varit positiv. Redaktörerna för tidskriften Nature och författarna till ENCODE-projektet skriver: "... vi har samarbetat under många månader för att göra största möjliga stänk, vilket kommer att dra till sig uppmärksamheten från inte bara det vetenskapliga samfundet, utan även allmänheten" ("... samarbetade under många månader för att göra största möjliga stänk och fånga uppmärksamheten hos inte bara forskarvärlden utan även hos allmänheten"). [31] Påståendet från ENCODE-projektet att 80 % av det mänskliga genomet har en biokemisk funktion [10] togs snabbt upp av populärvetenskapliga publikationer, som karakteriserade resultaten av projektet som orsakade döden av "skräp"-DNA . [32] [33]

Slutsatsen att huvuddelen av arvsmassan är "funktionell" har dock kritiserats med motiveringen att ENCODE-projektet definierar "funktionalitet" för brett, nämligen att allt som transkriberas i en cell har en funktion. Denna slutsats gjordes trots den allmänt accepterade uppfattningen att många delar av DNA som transkriberas , såsom pseudogener , ändå inte är funktionella. Dessutom betonade ENCODE-projektet sensitivitet snarare än specificitet, vilket ledde till många falska positiva resultat . [34] [35] [36] Det något godtyckliga valet av cellinjer och transkriptionsfaktorer , liksom avsaknaden av nödvändiga kontrollexperiment, har blivit en ytterligare källa till allvarlig kritik av ENCODE, eftersom en slumpmässig DNA-molekyl kan efterlikna en sådan "funktionellt" beteende i ENCODE-tolkningar. [37]

Som svar på denna kritik har det hävdats att de flesta genomtranskription och -splitsningar , som ses hos människor, är en mer exakt indikator på genetisk funktion än sekvenskonservatism. Dessutom är det mesta av "skräp"-DNA involverat i epigenetisk reglering och var en nödvändig förutsättning för utvecklingen av komplexa organismer. [38] Som svar på kommentarer om definitionen av ordet "funktionell" noterade många att i det här fallet rör tvisten en skillnad i definition, och inte kärnan i projektet, som är att tillhandahålla data för efterföljande studier av biokemiska aktivitet hos icke-proteinkodande DNA-regioner. Även om definitioner är viktiga och vetenskapen är begränsad till språk, verkar ENCODE ha tjänat sitt syfte, eftersom ett stort antal forskningsartiklar för närvarande använder data som genereras av projektet snarare än att diskutera definitioner av "funktionalitet". [39] Ewan Birney, en av ENCODE-forskarna kommenterade några av reaktionerna på projektet. Han noterar att ordet "funktion" har använts pragmatiskt för att hänvisa till "viss biokemisk aktivitet" som visar sig i olika klasser av experiment på olika sätt: närvaron av RNA , histonmodifieringar , DNaseI- överkänsliga regioner, ChIP -seq transkriptionsfaktortoppar , DNA-footprinting , transkriptionsfaktorbindningsställen och exoner . [40]

Dessutom har projektet kritiserats för sin höga budget (cirka 400 miljoner dollar totalt) och beskydd av så kallad "big science", grundläggande vetenskaplig forskning som tar pengar från mer produktiva vetenskapliga utvecklingar som måste genomföras på bekostnad av forskarna själva. [41] Det inledande skedet av ENCODE-projektet uppskattades till $55 miljoner, dess expansion kostade cirka $130 miljoner, och US National Human Genome Research Institute var redo att allokera upp till $123 miljoner för nästa fas av projektet. Vissa forskare hävdar att den korrekta avkastningen på investeringen ännu inte har följt. I ett försök att räkna alla publikationer där ENCODE spelar en betydande roll har 300 sådana artiklar identifierats sedan 2012, varav 110 var baserade på resultat från laboratorier utan ENCODE-finansiering. Ett ytterligare problem var att ENCODE inte är ett unikt namn som bara hänvisar till ENCODE-projektet, så ordet 'koda' (koda) dyker upp i mycket litteratur om genetik och genomforskning . [7]

Som en annan viktig kommentar hävdas att resultaten inte motiverade tidsåtgången och att projektet i princip är oändligt till sin karaktär. Även om det har jämförts med Human Genome Project och till och med kallats dess uppföljare, har The Human Genome ett tydligt slut som ENCODE för närvarande saknar.

Författarna till projektet delar tydligen den vetenskapliga världens oro och förnekar inte existensen av problem, men samtidigt försöker de motivera sina ansträngningar genom att förklara detaljerna i projektet i intervjuer, inte bara för det vetenskapliga samfundet, men också till media. De säger att det tog mer än ett halvt sekel att gå från att förstå att DNA  är den materiella grunden för ärftlighet till att dechiffrera sekvensen av det mänskliga genomet , så deras plan för nästa århundrade är att förstå denna sekvens [7] .

Andra projekt

För närvarande är ENCODE-konsortiet involverat i flera ytterligare projekt med liknande mål. Några av dessa projekt ingick i den andra fasen av ENCODE.

modENCODE

I analogi med ENCODE-projektet lanserades även ett projekt för att kartlägga de funktionella delarna av arvsmassan hos huvudmodellobjekten  - Drosophila melanogaster och Caenorhabditis elegans  - engelska.  Model Organism ENCyclopedia Of DNA Elements (modENCODE) . Fördelen med detta projekt är möjligheten att utföra några experiment på modellorganismer som är svåra eller omöjliga att utföra på människor. [42]

Projektet grundades av National Institutes of Health ( NIH ) 2007. [  43] [44] År 2010 presenterade modENCODE-konsortiet ett antal artiklar i Science om annotering och analys av fördelningen av funktionella element i genomet av Drosophila melanogaster och Caenorhabditis elegans Data från dessa publikationer finns tillgängliga på modENCODE-webbplatsen [45] .

För närvarande är modENCODE ett forskningskonglomerat av 11 fröprojekt uppdelat mellan D. melanogaster och C. elegans research . Projektet omfattar forskning inom följande områden:

  • Genstruktur
  • mRNA- och ncRNA- expressionsprofilering
  • Transkriptionsfaktorbindningsställen
  • Histon modifieringar och utbyte
  • Kromatinstruktur _
  • Initiering och sekvens av steg i DNA-replikation
  • Variation i antalet exemplar [46] .
modern

modERN (  modellorganismen Encyclopedia of Regulatory Networks ) är en utlöpare av modENCODE .  Projektet kombinerar forskning om grupperna C. elegans och D. melanogaster och fokuserar på identifiering av ytterligare transkriptionsfaktorbindningsställen. Projektet lanserades samtidigt med den tredje fasen av ENCODE och är planerad att slutföras 2017. Hittills har modERN publicerat resultaten av 198 experiment, ytterligare 500 har accepterats för publicering och behandlas av ENCODEs dataclearinghouse.

Genomics of Gene Regulation

Programmet Genomics of   Gene Regulation (GGR) lanserades i början av 2015 av US National Institutes of Health och kommer att pågå i tre år. Målet med programmet är att studera gennätverk och vägar i olika kroppssystem för att ytterligare främja förståelsen av de mekanismer som styr genuttryck. Även om ENCODE-projektet är separat från GGR, underhåller ENCODE Data Clearinghouse GGR-data på sin portal.

Färdkarta

År 2008 organiserades Roadmap Epigenomics  Mapping Consortium av US National Institutes of Health för att utveckla en offentlig källa för epigenetiska data från mänskligt genom för biologisk och medicinsk forskning. Baserat på resultatet av arbetet publicerade konsortiet i februari 2015 artikeln "Integrativ analys av 111 referens mänskliga epigenom". Konsortiet samlade in och kommenterade regulatoriska element i 127 referensepigenom, varav 16 ingick i ENCODE-projektet. Färdplansprojektdata finns på Roadmap- eller ENCODE- portalerna .  

fruitENCODE

fruitENCODE-projektet: ett uppslagsverk över DNA-elementen i mogna frukter, en del av ENCODE. Målet med projektet är att generera datauppsättningar: DNA-metyleringsställen, histonmodifieringar, DNas I-överkänsliga kromatinregioner, genuttryck, transkriptionsfaktorbindningsställen för suckulenta frukter av alla slag i olika utvecklingsstadier. Det preliminära publiceringsdatumet för resultaten publiceras på fruitENCODE- portalen .

Factorbook

Transkriptionsfaktorbindningsdata som erhållits av ENCODE är för närvarande tillgänglig på Factorbook.org [47]  , en wiki-baserad databas. Det första numret av FactorBook innehåller:

  • 457 ChIP-seq datamängder för 119 transkriptionsfaktorer i vissa mänskliga cellkulturer
  • Genomsnittliga profiler av histonmodifieringar och nukleosompositionering runt transkriptionsfaktorbindningsställen
  • Motiv som berikar bindningsställena, såväl som avståndet mellan dem och deras orientering [48]

Se även

Anteckningar

  1. 1 2 Raney BJ, Cline MS, Rosenbloom KR, Dreszer TR, Learned K., Barber GP, Meyer LR, Sloan CA, Malladi VS, Roskin KM, Suh BB, Hinrichs AS, Clawson H., Zweig AS, Kirkup V. Fujita PA, Rhead B., Smith KE, Pohl A., Kuhn RM, Karolchik D., Haussler D., Kent, WJ . KODA data för helgenom i UCSC-genomläsaren (2011 uppdatering  )  // Nucleic Acids Res. : journal. - 2011. - Januari ( vol. 39 , nr Databasnummer ). - P.D871-5 . doi : 10.1093 / nar/gkq1017 . — PMID 21037257 .
  2. EGASP: det mänskliga ENCODE Genome Annotation Assessment Project.  (engelska) . PubMed .
  3. Kleshchenko E. DNA utan skräp  // The New Times. - 2012. - Utgåva. 29 (256) .
  4. ENCODE-projekt vid UCSC (nedlänk) . ENCODE Consortium. Hämtad 5 september 2012. Arkiverad från originalet 10 september 2012. 
  5. Walsh, Fergus . Detaljerad karta över genomets funktion  (5 september 2012). Arkiverad från originalet den 5 september 2012. Hämtad 6 september 2012.
  6. Dan Graurs blogg .
  7. 1 2 3 4 Maher B. ENCODE: The human encyclopaedia   // Nature . - 2012. - September ( vol. 489 , nr 7414 ). - S. 46-8 . - doi : 10.1038/489046a . — PMID 22962707 .
  8. Saey, Tina Hesman Team släpper uppföljaren till det mänskliga genomet . Society for Science & the Public (6 oktober 2012). Hämtad: 18 oktober 2012.
  9. 1 2 ENCODE Project Consortium. ENCODE-projektet (ENCyclopedia Of DNA Elements) . Vetenskap (2004).
  10. 1 2 3 Bernstein BE, Birney E., Dunham I., Green ED, Gunter C., Snyder M. En integrerad encyklopedi av DNA-element i det mänskliga genomet  //  Nature: journal. - 2012. - September ( vol. 489 , nr 7414 ). - S. 57-74 . - doi : 10.1038/nature11247 . — . — PMID 22955616 .
  11. Timmer J. Det mesta av det du läste var fel: hur pressmeddelanden skrev om vetenskaplig historia . Personal / From the Minds of Ars . Ars Technica (10 september 2012). Hämtad: 10 september 2012.
  12. Pennisi E. Genomics. ENCODE-projektet skriver lovord för skräp-DNA  (engelska)  // Science : journal. - 2012. - September ( vol. 337 , nr 6099 ). - S. 1159, 1161 . - doi : 10.1126/science.337.6099.1159 . — PMID 22955811 .
  13. 1 2 Birney E. , Stamatoyannopoulos JA , Dutta A. et al. Identifiering och analys av funktionella element i 1% av det mänskliga genomet av pilotprojektet ENCODE.  (engelska)  // Nature. - 2007. - Vol. 447, nr. 7146 . - s. 799-816. - doi : 10.1038/nature05874 . — PMID 17571346 .
  14. KODA Programpersonal. KODA: Pilotprojekt: översikt . National Human Genome Research Institute (18 oktober 2012).
  15. Genome.gov | ENCODE och modENCODE-projekt . ENCODE-projektet: ENCyclopedia Of DNA Elements . United States National Human Genome Research Institute (1 augusti 2011). Hämtad: 5 augusti 2011.
  16. ^ National Human Genome Research Institute - Organisation . NIH-almanackan . United States National Institute of Health. Hämtad: 5 augusti 2011.
  17. Genome.gov | KODA Deltagare och projekt . ENCODE-projektet: ENCyclopedia Of DNA Elements . United States National Human Genome Research Institute (1 augusti 2011). Hämtad: 5 augusti 2011.
  18. Joseph R. Ecker, Wendy A. Bickmore, Inês Barroso, Jonathan K. Pritchard, Yoav Gilad. ENCODE förklaras   // Nature . — 2012-09. — Vol. 489 , utg. 7414 . — S. 52–54 . — ISSN 1476-4687 . - doi : 10.1038/489052a .
  19. ENCODE Project Consortium. A User's Guide to the Encyclopedia of DNA Elements (ENCODE  )  // PLOS Biology. — 2011-04-19. — Vol. 9 , iss. 4 . — P.e1001046 . — ISSN 1545-7885 . - doi : 10.1371/journal.pbio.1001046 .
  20. Jennifer Harrow, Adam Frankish, Jose M. Gonzalez, Electra Tapanari, Mark Diekhans. GENCODE: Referensanteckningen för det mänskliga genomet för ENCODE-projektet  //  Genome Research. — 2012-09-01. — Vol. 22 , iss. 9 . — S. 1760–1774 . — ISSN 1549-5469 1088-9051, 1549-5469 . - doi : 10.1101/gr.135350.111 .
  21. Cédric Howald, Andrea Tanzer, Jacqueline Chrast, Felix Kokocinski, Thomas Derrien. Kombinera RT-PCR-seq och RNA-seq för att katalogisera alla genetiska element som kodas i det mänskliga genomet  //  Genome Research. — 2012-09-01. — Vol. 22 , iss. 9 . — S. 1698–1710 . — ISSN 1549-5469 1088-9051, 1549-5469 . - doi : 10.1101/gr.134478.111 .
  22. Thomas Derrien, Rory Johnson, Giovanni Bussotti, Andrea Tanzer, Sarah Djebali. GENCODE v7-katalogen över mänskliga långa icke-kodande RNA: Analys av deras genstruktur, evolution och uttryck  //  Genome Research. — 2012-09-01. — Vol. 22 , iss. 9 . - P. 1775-1789 . — ISSN 1549-5469 1088-9051, 1549-5469 . - doi : 10.1101/gr.132159.111 .
  23. Baikang Pei, Cristina Sisu, Adam Frankish, Cedric Howald, Lukas Habegger. GENCODE pseudogen resurs  // Genome Biology. — 2012-09-05. - T. 13 , nej. 9 . - S. R51 . — ISSN 1474-760X . - doi : 10.1186/gb-2012-13-9-r51 .
  24. Mark B. Gerstein, Anshul Kundaje, Manoj Hariharan, Stephen G. Landt, Koon-Kiu Yan. Arkitekturen för det mänskliga regleringsnätverket härledd från ENCODE-data   // Nature . — 2012-09. — Vol. 489 , utg. 7414 . — S. 91–100 . — ISSN 1476-4687 . - doi : 10.1038/nature11245 .
  25. David S. Gross, William T. Garrard. Nukleasöverkänsliga platser i kromatin  // Annual Review of Biochemistry. - 1988-06-01. - T. 57 , nej. 1 . — S. 159–197 . — ISSN 0066-4154 . - doi : 10.1146/annurev.bi.57.070188.001111 .
  26. Fjodor D. Urnov. Chromatin remodeling as a guide to transcriptional regulatory networks in däggdjur  (fr.)  // Journal of Cellular Biochemistry. - 2003. - Vol. 88 , livr. 4 . — S. 684–694 . — ISSN 1097-4644 . - doi : 10.1002/jcb.10397 .
  27. Jason Ernst, Pouya Kheradpour, Tarjei S. Mikkelsen, Noam Shoresh, Lucas D. Ward. Kartläggning och analys av kromatintillståndsdynamik i nio mänskliga celltyper   // Nature . — 2011-05. — Vol. 473 , utg. 7345 . — S. 43–49 . — ISSN 1476-4687 . - doi : 10.1038/nature09906 .
  28. Madeleine P. Ball, Jin Billy Li, Yuan Gao, Je-Hyuk Lee, Emily M. LeProust. Riktade och genomskaliga strategier för att avslöja genkroppsmetyleringssignaturer i mänskliga celler  //  Nature Biotechnology. — 2009-04. — Vol. 27 , iss. 4 . — S. 361–368 . — ISSN 1546-1696 . - doi : 10.1038/nbt.1533 .
  29. Alexander Meissner, Tarjei S. Mikkelsen, Hongcang Gu, Marius Wernig, Jacob Hanna. Genomskala DNA-metyleringskartor över pluripotenta och differentierade celler  (engelska)  // Nature. — 2008-08. — Vol. 454 , utg. 7205 . — S. 766–770 . — ISSN 1476-4687 . - doi : 10.1038/nature07107 .
  30. Omdirigera . linkinghub.elsevier.com . Hämtad: 10 november 2020.
  31. Maher B. Slåss om ENCODE och skräp . Nyhetsblogg . Nature Publishing Group (6 september 2012).
  32. Kolata G. Långt ifrån "skräp", DNA Dark Matter visar sig vara avgörande för hälsan , The New York Times (5 september 2012).
  33. Gregory TR. ENCODE mediahypemaskin . Genomicron (6 september 2012).
  34. Graur D., Zheng Y., Price N., Azevedo RB, Zufall RA, Elhaik E. Om tv-apparaternas odödlighet: "funktion" i det mänskliga genomet enligt det evolutionsfria evangeliet av  ENCODE  / / Genome Biol Evol : journal. - 2013. - Vol. 5 , nej. 3 . - s. 578-590 . - doi : 10.1093/gbe/evt028 . — PMID 23431001 .
  35. Moran L.A. Sandwalk: Om innebörden av ordet "funktion" . Sandwalk (15 mars 2013).
  36. Gregory TR. Kritik av ENCODE i peer-reviewed tidskrifter. "Genomicron (länk ej tillgänglig) . Genomicron (11 april 2013). Hämtad 30 april 2015. Arkiverad från originalet 2 april 2015. 
  37. White MA, Myers CA, Corbo JC, Cohen BA Massivt parallella in vivo-förstärkaranalyser avslöjar att mycket lokala egenskaper bestämmer den cis-reglerande funktionen hos ChIP-seq toppar   // Proceedings of the National Academy of Sciences of the United States of America  : tidning. - 2013. - Juli ( vol. 110 , nr 29 ). - P. 11952-11957 . - doi : 10.1073/pnas.1307449110 . — PMID 23818646 .
  38. Mattick JS, Dinger ME Omfattningen av funktionalitet i det mänskliga genomet  (obestämd)  // The HUGO Journal. - 2013. - T. 7 , nr 1 . - S. 2 . - doi : 10.1186/1877-6566-7-2 .
  39. Naturredaktion. Form och funktion   // Natur . - 2013. - 14 mars ( vol. 495 ). - S. 141-142 . - doi : 10.1038/495141b .
  40. Birney, Ewan KODER: Mina egna tankar . Ewans blogg: Bioinformatiker i stort (5 september 2012).
  41. Timpson T. Debatterar KODER: Dan Graur, Michael Eisen . Mendelspod (5 mars 2013).
  42. ModENCODE-projektet: Model Organism ENCyclopedia Of DNA Elements (modENCODE) . NHGRI webbplats . Hämtad 13 november 2008.
  43. modENCODE-deltagare och projekt . NHGRI webbplats . Hämtad 13 november 2008.
  44. Berkeley Lab Life Sciences tilldelade NIH-anslag för fruktfluga, nematodstudier . Lawrence Berkeley National Laboratorys webbplats (14 maj 2007). Hämtad 13 november 2008.
  45. modENCODE . National Human Genome Research Institute.
  46. Celniker S. Låsa upp genomets hemligheter . Nature (11 juni 2009).
  47. Faktorbok
  48. Wang J. Factorbook.org: en Wiki-baserad databas för transkriptionsfaktorbindande data som genererats av ENCODE-konsortiet . Nukleinsyraforskning (29 november 2012).

Länkar