ChIA-PET

Chromatin Interaction Analysis by Paired-End Tag Sequencing (ChIA-PET)  är en molekylärbiologisk metod som låter dig bestämma interaktionerna (spatial närhet) av kromatinregioner som ligger på ett avsevärt avstånd från varandra i genomet . [1] Sådana interaktioner är av intresse för att fastställa regleringselement . Regulatoriska element i celler kan lokaliseras på ett avsevärt avstånd från promotorn för den reglerade genen (till exempel cis-regulatoriska element , trans-regulatoriska element , isolatorer , förstärkare). För att förstå mekanismerna för sådana interaktioner är det nödvändigt att känna till det rumsliga arrangemanget av kromatinregioner i förhållande till varandra, vilket denna metod gör det möjligt att bestämma de novo . I sin tur är informationen som erhålls viktig för att förstå mekanismerna för reglering av genuttryck . [2]

ChIA-PET är baserat på användningen av ChIP , 3C ( Chromosome Conformation Deermination ) och Paired -end-tag- sekvensering , för vilken högkapacitetssekvensering och ytterligare datorbearbetning av resultaten används. [3] 

Historik

Metoden användes först 2009 [1] för att bestämma avlägsna ER-alfa- bindningsställen i human bröstcancer. Därefter användes den till exempel för att konstruera en interaktom (karta över möjliga interaktioner) medierad av CTCF i embryonala stamceller från mus [4] .

Metodens möjligheter

ChIA-PET kombinerar kapaciteten hos både ChIP- och 3C [5] -baserade metoder , vilket förbättrar kapaciteten hos var och en. Den traditionella ChIP-metoden låter dig bestämma interaktionen mellan ett visst protein och DNA och kan användas för att söka efter transkriptionsfaktorbindningsställen . Med hjälp av ChIP-seq kan de novo bindningsställen för proteinet av intresse bestämmas i hela genomet. Om ett protein binder regioner av kromatin som är långt ifrån varandra på kromosomen men nära i rymden, kan ChIP-seq identifiera var och en av dem, men indikerar inte deras interaktion. Men inte alla sekvenser som bestäms av ChIP-seq-metoden är unikt kartlagda i genomet och alla är inte funktionella bindningsställen [6] .

3C- och ChIA-PET-metoderna är baserade på teorin om proximal ligering ( proximity  ligation ), som säger att ändarna av kromatinregionerna associerade med proteinkomplexet, som är i närheten, kommer att ligeras till varandra med större sannolikhet än ändarna av regionerna i lösning eller associerade med ett annat proteinkomplex.

3C-metoden tillåter en att bestämma den rumsliga strukturen av kromatin, men tillåter inte en att bestämma det interagerande proteinet [5] . Ett betydande problem är behovet av noggrann kunskap om sekvensen av interagerande loci . Detta är nödvändigt för valet av primrar för den kvantitativa eller semikvantitativa PCR-analys som används för att bestämma dem. (Det bör noteras att det kan finnas flera loci - kandidater för interaktioner - bestämt av 3C-metoden). ChIA-PET-metoden tillåter de novo bestämning av den rumsliga strukturen hos kromatin som är associerad med ett specifikt protein. Det vill säga, å ena sidan kräver det inte kunskap om DNA-sekvensen i området för interaktion, och å andra sidan beror det helt på specificiteten hos de antikroppar som används .

Jämförande egenskaper

Chip Chip seq ChIA-PET 3C
Behöver specifika antikroppar + + + -
Det är nödvändigt att känna till DNA-sekvensen vid det studerade stället + - - +
Referensgenom krävs - + + -
Metoden ger information om Bindande webbplatser Om de novo bindningsställen
Om de novo bindningsställen +
kromatinkonformation
Kromatinkonformationer

Beskrivning av metoden

Experimentella metoder

DNA-proteinkomplex är tvärbundna ospecifikt med formaldehyd. Provet utsätts för ultraljud , medan DNA-molekyler krossas till fragment och löst bundna ospecifika komplex förstörs. Som ett resultat erhålls DNA-fragment i starka komplex med proteiner. Vidare, med hjälp av specifika antikroppar fixerade på magnetiska pärlor, utfälls kromatinfragment associerade med proteinet av intresse. Ofta är studieobjekten kända transkriptionsfaktorer [1] . Utfällda komplex avlägsnas från lösningen med magnetiska pärlor med användning av en magnet. De isolerade komplexen delas upp i 2 alikvoter och oligonukleotid-semi -linkers med en känd sekvens "sys" till ändarna av DNA-molekylerna . Halvlinker A finns i den ena alikvoten och halvlinker B finns i den andra. Båda halvlänkarna innehåller det ställe som känns igen av Mmel- restriktionsenzymet och skiljer sig från varandra genom en "streckkod" av två nukleotider : CG för halv- linker A och AT för halvlänkare B. Som ett resultat kan länkarna senare, under sekvensering, särskiljas från varandra med "streckkoden". I nästa steg kombineras två alikvoter och proximal ligering sker, varvid halvlänkarna ligeras ovanpå varandra för att bilda fullängdslinkers. Länkare med AA (CG/CG) eller BB (AT/AT) "streckkoder" anses vara troliga ligeringsprodukter inom samma komplex, medan länkar med AB (CG/AT) "streckkoder" anses vara chimära ligeringsprodukter av DNA associerade med olika proteinkomplex Förberedelse för sekvensering involverar bearbetning av komplexen med Mmel restriktionsenzym [8] , som klyver DNA på ett visst avstånd från dess igenkänningsställe i halvlänkaren. Som ett resultat, i slutet av detta steg, erhålls konstruktioner innehållande ett par "taggar" ( eng.  tag ) (20 bp vardera) på båda sidor av den fullständiga länken (38 bp). De resulterande fragmenten sekvenseras i båda ändarna ( PET ) .  Taggarna kartläggs sedan på genomet. [7] [9]

Datorbehandling

Datorbehandling av sekvenseringsresultat inkluderar 6 moduler [7] [10]

Länkfiltrering

Alla lässekvenser är uppdelade i sekvenser med läsbara "streckkoder" och oläsbara "streckkoder". Om "streckkoden" inte kan läsas, "kasseras" sekvensen från bearbetning. Om "streckkoden" kan läsas, är sekvenserna anpassade till länkarna. Alla erhållna sekvenser är uppdelade i chimära (bildade genom ligering av DNA från olika komplex och innehållande A/B-linkern) och icke-chimära (innehållande A/A- eller B/B-linkern). Det bör noteras att bland de sekvenser som innehåller A/A eller B/B kan chimära sådana också förekomma. Vidare "kasseras" sekvenserna för länkarna själva och sekvenserna av "taggar" (PET) analyseras. [7] [10]

Kartläggning av PETs

Sekvenserna som erhölls i föregående steg mappas till referensgenomet. I det första steget isoleras 100 % inriktade sekvenser , som kan kartläggas på ett lokus (unikt) eller på många loci. Av de återstående sekvenserna är de som innehåller 1 substitution i sekvensen ( engelska  missmatch ) med referensgenomet isolerade, de är också uppdelade i unika och sekvenser med multipel mappning. Alla andra sekvenser är icke-mappade. Alla sekvenser utom de unikt mappade "kasseras" från bearbetning. [7] [10]

Klassificering av PETs

Det finns två grupper av PET:er: "self-ligated" ( engelsk  self-ligation PETs ) och "interligated" ( engelsk interligation  PETs ). "Självligerade" ( engelsk  self-ligation PETs ) motsvarar ändarna av ett ChIP-DNA-fragment, de bör vara belägna på samma kromosom på kort avstånd från varandra, i orienteringen "huvud till svans". "Interligerade" ( eng.  inter-ligation PETs ) delas in i intrakromosomala (karterade på samma kromosom på stort avstånd), interkromosomala (karterade på olika kromosomer) och ligerade i olika orienteringstaggar ( eng.  different orientation ligation PETs ) (mappade) på samma kromosom på kort avstånd, men i fel orientering eller på olika DNA-strängar). Gränsen som separerar "självligerade" PET från "interligerade" PET bestäms naturligt av längden på DNA-fragmenten som erhålls vid en given "ljud" intensitet. I olika experiment var det 3-4,6 Kb. [7] [10]

Bestämning av proteinbindningsställen

Självligeringstaggar ( self-ligation PETs ) används för att bestämma proteinbindningsställen .  Proceduren liknar den som används i ChIP-seq .

Definition av kromatininteraktioner

I förutsägelsen av denna typ av interaktion används " inter -ligation" PETs . 

Visualisering och organisering av resultat

Data från de tidigare stegen läggs in i databaser för lagring, bearbetning och eventuell visualisering.

Nackdelar med metoden

  • I denna metod är signal-brusförhållandet inte för högt. Detta kan bero på ospecifika proteinkomplex, otillräcklig specificitet hos de använda antikropparna, PCR före sekvensering och sekvenseringsfel. Alla dessa faktorer kan leda till fel.
  • Den andra viktiga punkten: behovet av att överge analysen av stora mängder data. Till exempel, icke-unika PET:er lokaliserade i upprepningar, där funktionella bindningsställen för transkriptionsfaktorer också kan finnas [11]
  • Det är omöjligt att bestämma vilka av proteinerna i komplexet, "sitter" på det regulatoriska stället, som är ansvarig för bildandet av DNA-slingan. Detta kräver ytterligare experiment, till exempel 3C.
  • Specifika antikroppar krävs, dessutom kan proteinet i komplexet vara avskärmat och otillgängligt för antikroppar, i vilket fall komplexets bindningsställen inte kommer att bestämmas.
  • Ett referensgenom krävs.

Fördelarna med

  • Tillåter de novo bestämning av både kromatininteraktioner och proteinbindningsställen.
  • Kräver inte kunskap om DNA-sekvensen vid proteinbindningsstället.
  • Förmågan att justera metodens selektivitet genom att välja specifika antikroppar antingen för ett specifikt protein (till exempel en specifik transkriptionsfaktor) eller för ett vanligt använt protein (till exempel vanliga transkriptionsfaktorer).
  • Kompatibel med taggbaserad NGS-sekvensering [12] .

Programvara som används för att analysera resultaten [13]

Följande datorprogram används i ChIA-PET-experiment

  • ELAND Mappar ChIP-berikade DNA-fragment till referensen av mänskligt genom. [2]
  • Eisen programvara Bestämmer genuttrycksnivåer baserat på hierarkisk klustring. [3]
  • RepeatMasker In-silico maskerar återkommande element. [fyra]
  • Monte Carlo-simulering Används för att uppskatta den falska positiva frekvensen. [fjorton]
  • PET-Tool Programvara för att bearbeta och arbeta med Paired-End di-Tag-sekvensdata. [5]
  • ChIA-PET Tool Programvara för bearbetning av ChIA-PET-data. ChIA-PET Tool webbsida ChIA-PET Tool paper Arkiverad 15 januari 2014 på Wayback Machine

Se även

Anteckningar

  1. 1 2 3 Melissa J. Fullwood, et al. En östrogenreceptor α-bunden human kromatininteraktom Arkiverad 25 februari 2016 på Wayback Machine . Natur. 5 november 2009; 462(7269): 58-64.
  2. Elzo de Wit och Wouter de Laat Ett decennium av 3C-teknologier: insikter i kärnkraftsorganisation . Gene Dev. 2012 1 januari; 26(1): 11-24.
  3. Melissa J. Fullwood och Yijun Ruan ChIP-baserade metoder för identifiering av långväga kromatininteraktioner Arkiverad 26 maj 2021 på Wayback Machine . J Cell Biochem. 1 maj 2009; 107(1): 30-39.
  4. Lucy Handoko et al. CTCF-medierad funktionell kromatininteraktom i pluripotenta celler Arkiverad 25 maj 2021 på Wayback Machine . Nat Genet. 19 juni 2011; 43(7): 630-638.
  5. 1 2 Dekker J Fångar kromosomkonformation Arkiverad 15 oktober 2017 på Wayback Machine . Vetenskap. 2002 februari 15;295(5558):1306-11.
  6. Johnson et al., (2007). Genomomfattande kartläggning av in vivo protein-DNA-interaktioner. Vetenskap. (316); 1497-502.
  7. 1 2 3 4 5 6 7 Betygsatt av Guoliang Li tn al. ChIA-PET-verktyg för omfattande kromatininteraktionsanalys med sekvensering av taggar i parad ände Arkiverad 25 maj 2021 på Wayback Machine . Genome Biol. 2010; 11(2): R22.
  8. [1] Arkiverad 12 juni 2015 på Wayback Machine
  9. Yufen Goh et al. Kromatininteraktionsanalys med paired-end tag-sekvensering (ChIA-PET) för kartläggning av kromatininteraktioner och förståelse av transkriptionsreglering .J Vis Exp. 2012; (62): 3770.
  10. 1 2 3 4 Stein L et al. Den generiska genomläsaren: en byggsten för en modellorganismsystemdatabas Arkiverad 11 maj 2016 på Wayback Machine . Genome Res. 2002;12:1599-1610.
  11. Polak & Domany, Alu-element innehåller många bindningsställen för transkriptionsfaktorer och kan spela en roll i regleringen av utvecklingsprocesser Arkiverad 25 maj 2021 på Wayback Machine . BMC Genomics. 2006, (7); 133
  12. Bidragit av Fullwood och Ruan Whole Genome Chromatin Interaction Analysis with Paired-End Tags (ChIA-PET) Arkiverad 26 december 2010 på Wayback Machine . 2010
  13. sv:ChIA-PET
  14. Monte Carlo metod