Cancer Genome Atlas ( TCGA) eller ARG är ett projekt som syftar till att systematisera data om genetiska mutationer som leder till cancer [1] . Systematisering genomförs med hjälp av sekvensering och bioinformatiska metoder . Detta projekt är ett samarbete mellan National Cancer Institute och Human Genome Research Institute , USA [2] .
För att fullständigt undersöka varje cancervariant genomgick motsvarande prov en storskalig studie med sekvensering och bioinformatikmetoder : kvantitativ analys av genuttryck och genkopia av variationer, genotypning av enstaka nukleotidpolymorfismer , genomomfattande analys av DNA-metyleringsmönster , exonsekvensering . Uppgifterna som erhålls är allmän egendom, alla forskare kan bekanta sig med dem och använda dem i sitt arbete.
ARG-projektet har visat att ett aktivt och storskaligt samarbete mellan forskare från olika institutioner kan vara fruktbart, och den data som erhålls som ett resultat av arbetet kan användas av forskare runt om i världen.
AWG startade 2005 som ett 3-årigt pilotprojekt [3] . Nästan 100 miljoner dollar anslogs för att finansiera lanseringsversionen av AWG. I det inledande skedet karakteriserar forskare glioblastoma multiforme , lungcancer och äggstockscancer , eftersom dessa sjukdomar är orsaken till många dödsfall i USA varje år [4] .
Den första fasen av arbetet slutfördes framgångsrikt, så målet var att 2014 karakterisera 20-25 cancertyper. Systematiseringen av genetiska mutationer tillhandahölls av två typer av centra: sekvenseringsstadiet tillhandahölls av centra för att beskriva genom, och bioinformatisk dataanalys tillhandahölls av centra för analys av genomisk data [5] .
I september 2013 samlade ARG-projektet in tillräckligt med tumörvävnadsprover för att karakterisera mer än 30 typer av cancer. År 2017 studerades 33 typer av maligna tumörer i detalj, inklusive 10 sällsynta typer [6] .
AWG närmar sig sitt slut 2017, men all data som tas emot av AWG kommer att förbli allmän egendom. Exemplet på framgången med detta projekt bevisar genomförbarheten av flera organisationers gemensamma arbete när de arbetar inom cancergenomik och kommer att hjälpa till i framtida forskning inom detta område [2] .
Från patienter som diagnostiserats med cancer tas en bit av cancerös och normal vävnad (vanligtvis blod ) med deras tillstånd. De vävnader och vätskor som används för analys kallas provet eller biomaterialet.
Patientvävnadsprover som ska användas för genomforskning måste genomgå strikt kvalitetskontroll så att deras genetiska material ( DNA och RNA ) kan användas i komplex genetisk analys med hjälp av nästa generations sekvenseringsteknik. Testning, bearbetning och preparering av vävnader för vidare analys, samt direkt isolering av DNA och RNA, utförs av laboratorier för analys av prover vid ARG (Biospecimen Core Resources) [7] . All patientinformation är konfidentiell. Proverna är föremål för strikta kvalitetskriterier, till exempel ska innehållet av cancerceller i biomaterialet vara minst 60 %. Tidigare var detta kriterium lika med 80 %, men det sänktes med införandet av nästa generations sekvensering .
För varje typ av cancer analyseras tumörer och normala vävnader från hundratals patienter. Ett stort antal prover behövs för den statistiska signifikansen för att bestämma den fullständiga genomiska profilen för motsvarande sjukdom. Genomisk profilering är nödvändig för att identifiera de förändringar som leder till tumörutveckling. Detta arbete involverar centra för beskrivning av genom [8] , centra för sekvensering med hög genomströmning [9] samt centra för analys av genomiska data [10] . De förstnämnda analyserar många genetiska förändringar (såsom antalet genkopievariationer) som potentiellt är involverade i tumörutveckling, såväl som förändringar i genuttrycksnivåer i cancervävnader jämfört med normala kroppsceller som fungerar som kontroller. High-throughput sekvenseringscentra bestämmer sedan förändringarna i DNA som är associerade med en viss typ av cancer. Detta uppnås med hjälp av exomsekvensering , 10% av vävnaderna genomgår helgenomsekvensering för att identifiera förändringar som inte påverkar exoner , men som potentiellt påverkar cancertransformation. Resultatet är en enorm mängd information som bearbetas av centra för analys av genomisk data. Samma centra tillhandahåller en mängd olika datavisualiserings- och analysverktyg i DGA för att främja deras bredare användning bland forskare runt om i världen.
All information som erhållits under forskarnas arbete lagrades av TCGA Data Coordinating Center [11] och fördes in i öppna databaser. Forskare sökte, laddade ner och analyserade ARG-data med hjälp av lämplig portal (TCGA Data Portal) [12] , som innehöll genomiska profiler av respektive cancertyper. På grund av uppsägningen av AWG-kontraktet med Coordinating Center (DCC), den 15 juli 2016, stängdes AWG-dataportalen. Nu är uppgifterna om AWG-projektet fritt tillgängliga på Genomics Data Commons -portalen [13] .
År 2008 rapporterade ett team av ARG-forskare några resultat i sin studie av en hjärntumör, glioblastom ; de upptäckte nya genetiska mutationer i DNA som kan användas för diagnos och behandling [17] . Forskare uppnådde detta resultat tack vare en storskalig studie av genom isolerade från tumörvävnader hos 206 patienter diagnostiserade med glioblastom. Uppgifterna inkluderar information om punktmutationer , kromosomala omarrangemang (såsom variationer i antal kopior), genuttrycksnivåer och epigenomik . ARG-personal sekvenserade 601 gener från tumörvävnadsprover och jämförde dessa resultat med kontrollprover. De kunde identifiera signifikanta och statistiskt signifikanta mutationer som skiljer glioblastomceller från normala celler och som inte tidigare har karakteriserats. Forskare har kunnat identifiera fyra undertyper av glioblastom som skiljer sig från varandra i deras genomiska egenskaper, överlevnadsgrad, patienternas ålder och deras svar på behandling [18] . Dessa subtyper har benämnts proneuralt, neuralt, klassiskt och mesenkymalt glioblastom. Patientrankning är viktig för utvecklingen av individuell terapi, vilket kan leda till en ökning av effektiviteten av medicinsk intervention.
Äggstockscancer är den femte vanligaste orsaken till kvinnlig död i USA. På grund av bristen på effektiva behandlingar har kvinnor med denna diagnos en ganska negativ prognos: endast 31% av alla patienter lever längre än fem år från det att sjukdomen diagnostiserades. På grund av den extrema relevansen av forskning inom området för denna typ av cancer, beslutade ARG-forskarna att karakterisera den som en av de första och föreslå potentiella nya mål för terapi. Forskare har kunnat hitta hundratals gener i tumörvävnader som har raderats eller duplicerats . Bland dessa gener finns det 68 duplicerade, för vars produkter motsvarande inhibitorer redan är kända . Denna upptäckt ger en startpunkt i sökandet efter nya läkemedel för behandling av äggstockscancer. Forskarna fann att beroende på vilka gener som överuttrycks i äggstockstumörceller är det möjligt att förutsäga en patients förväntade livslängd. 108 och 85 gener har identifierats som är associerade med god respektive dålig överlevnad. Människor som överuttrycker motsvarande 108 gener lever 23 % längre än de som överuttrycker de andra 85 generna. Jämfört med äggstockscancer har glioblastom ett fundamentalt annorlunda genomiskt mönster: det kännetecknas mer av genetiska mutationer, vanligtvis i samma gener, och variationen i antalet kopior av gener, till skillnad från äggstockscancer, är mycket mindre representerad. Detta tyder på att olika typer av cancer skiljer sig från varandra just i naturen av förändringar i DNA. Om denna teori är korrekt kan individuella genomiska profiler för varje cancer planeras [19] .
National Cancer Institute (NCI) och Human Genome Research Institute (NHGRI) finansierade en testversion av ARG-projektet under tre år , vilket gav $50 miljoner vardera. Därefter tillhandahöll NCI 25 miljoner dollar per år för att stödja den andra fasen av AWG under fem år, och NHGRI skickade 25 miljoner dollar per år i två år. 2009 undertecknades en lag (American Recovery and Reinvestment Act, ARRA) som gav ARG ytterligare finansiering till ett belopp av 175 miljoner USD [20] . Efter undertecknandet av detta dokument började den andra fasen av AWG:s existens. NCI :s styrelse tillhandahöll ytterligare 25 miljoner USD under det första året efter ARRA för sekvensanalys och ytterligare 25 miljoner USD under det andra året av den andra fasen av ARG. Totalt tilldelades 150 miljoner dollar för provsekvensering och 70 miljoner dollar för provinsamling, kvalitetskontroll och DNA- och RNA-isolering.
ARG inkluderar prover från över 11 000 patienter för 33 typer av cancer [21] och är den överlägset största samlingen av tumörer. Dessa prover analyseras för nyckelgenomiska och molekylära egenskaper. Insamlingen av ARG-prover avslutades 2013 och från och med april 2017 har ARG-forskare äntligen slutfört exomsekvensering för alla typer av tumörer och helgenomsekvensering för mer än 1000 cancervävnadsprover. Mer än 2700 vetenskapliga artiklar hänvisar till ARG:s arbete, vilket bevisar detta projekts enorma roll i utvecklingen av idéer om cancer [22] . Alla ARG-data är tillgängliga och kan användas för publikationer utan begränsningar [23] .
typ av cancer | Antal analyserade prover [21] | Identifierade mutationer [24] |
---|---|---|
Akut myeloid leukemi | 200 | I 99,5% av fallen identifieras minst en icke-synonym mutation i en av följande gener: NPM1 (27%), tumörsuppressorgener (15,5%),
gener associerade med DNA-metylering (43,5%), signalgener (59%), kromatinmodifierande gener (30,5%), myeloida transkriptionsfaktorgener (22%), kohesinkomplexgener (13%) och spliceosomala gener (13,5%) [ 25] . |
binjurebarkcarcinom | 92 | Mutationer i generna PRKAR1A, RPL22, TERF2, CCNE1 och NF1. Även frekvent förlust av en stor del av DNA följt av fördubbling av hela genomet, ökat uttryck av TERT, en minskning av telomerlängd och aktivering av cellcykelprogram [26] hittades . |
Urothelial carcinom i urinblåsan | 412 | Signifikanta återkommande mutationer i 32 gener, inklusive gener involverade i cellcykelreglering, kromatinreglering och kinassignaleringsvägar. Periodiska in-frame FGFR3-TACC3 fusioner har identifierats, såväl som uttryck och integration av flera virus (inklusive HPV16) [27] . |
Grad 2 hjärngliom | 516 | IDH-mutationer och 1p/19q-deletion åtföljs av mutationer i CIC-, FUBP1-, NOTCH1-generna och TERT-genpromotorn; genomiska avvikelser liknar de i glioblastom [28] . |
Invasivt bröstkarcinom | 1098 | Somatiska mutationer av de tre generna TP53, PIK3CA och GATA3 observerades i >10% av fallen; i vissa fall upptäcktes specifika mutationer av GATA3, PIK3CA och MAP3K1 gener [29] . Förlust av E-cadheringenen och mutationer i generna PTEN, TBX3 och FOXA1 har också identifierats [30] . |
Livmoderhalscancer | 307 | Mutationer i generna SHKBP1, ERBB3, CASP8, HLA-A och TGFBR2. Amplifieringar hittades också i immunmålen CD274/PD-L1 och PDCD1LG2/PD-L2. Integration av HPV-virus observerades i alla fall av HPV18-infektion och i 76 % av fallen av HPV16-infektion, åtföljd av olika strukturella avvikelser och ökat mål-DNA-uttryck. I HPV-negativa tumörer har frekventa mutationer av KRAS-, ARID1A- och PTEN-generna identifierats [31] . |
Cholangiocarcinom | 51 | IDH-mutationer åtföljda av lågt uttryck av kromatinmodifierare, ökat uttryck av mitokondriella gener och ökat antal kopior av mitokondriellt DNA [32] . |
Kolonadenokarcinom | 461 | Mutationer i generna APC, TP53, SMAD4, PIK3CA, KRAS, ARID1A, SOX9 och FAM123B/WTX, amplifiering av ERBB2, IGF2, fusion av NAV2 och TCF7L1 (en komponent i WNT-signalvägen), hypermetylering och tystnad av 75MLH1 % av fallen [33] . |
Esofaguskarcinom | 185 | Frekventa genomiska amplifieringar av CCND1 och SOX2 och/eller TP63 i skivepitelcancer, och amplifiering av ERBB2, VEGFA och GATA4 och/eller GATA6 i adenokarcinom [34] . |
Glioblastom multiforme | 617 | Mutationer i EGFR, NF1, TP53, PlK3R1, PIK3CA, IDH1, PTEN, RB1, LZTR1 [35] , mutationer i kromatinmodifierande gener i 40% av fallen [36] . |
Skivepitelcancer i huvud och nacke | 528 | PIK3CA-onkogenmutationer, förlust av TRAF3-genen och amplifiering av E2F1-cellcykelgenen dominerar. I fall av tumörer orsakade av rökning observeras TP53-mutationer, inaktivering av CDKN2A och amplifiering av 3q26/28 och 11q13/22 WNT och aktivering av den oxidativa stressfaktorn NFE2L2 [37] . Även amplifiering av TP63-genen och ökat uttryck av immunitets- och proliferationsgener [38] . |
Kromofobiskt karcinom i njuren | 113 | Mutation i promotorregionen av TERT-genen, ökat uttryck av denna gen [39] . |
Hypernefroid cancer | 537 | Mutationer i VHL , PBRM1, ARID1A, SMARCA4, mutationer i PI(3)K/AKT-väggenerna, förändringar i generna i Krebs-cykeln, pentosfosfatvägen och glutamintransportörgener, förändringar i metyleringen av MiR-21 och GRB10-promotor [40] . |
papillär njurcancer | 291 | MET- eller SETD2-mutationer, CDKN2A-tystnad, TFE3-fusioner, överuttryck av NRF2, en komponent i ARE-signalvägen [41] . |
Hepatocellulärt karcinom | 377 | |
Pulmonellt adenokarcinom | 585 | Mutationer i RIT1, MGA, EGFR (oftare hos kvinnor), RBM10 (oftare hos män), avvikelser i NF1, MET, ERBB2 och RIT1 upptäcktes i 13 % av fallen [42] . |
Skivepitelcancer i lungan | 504 | Mutationer i TP53, mutationer i den stora histokompatibilitetsgenen HLA-A klass I, mutationer i squamous differentieringsgener, PI(3)K pathway-gener, samt mutationer i NFE2L2, KEAP1, CDKN2A och RB1 generna [43] , amplifiering av TP63-genen, ökad expressionsimmunitet och proliferationsgener [38] . |
Diffust storcellslymfom | 58 | |
Mesoteliom | 87 | |
Seröst cystadenocarcinom i äggstocken | 608 | Mutationer i TP53 upptäcktes i 96 % av de studerade fallen; mutationer i NF1, BRCA1, BRCA2, RB1 och CDK12, promotormetylering av 168 gener och signifikanta kopiaberrationer av 113 gener, fann man också att det homologa rekombinationssystemet skadades i ungefär hälften av fallen [44] . |
Adenocarcinom i bukspottkörteln | 185 | |
Feokromocytom och paragangliom | 179 | Mutationer i generna CSDE1, HRAS, RET, EPAS1 och NF1; olika fusioner av generna MAML3, BRAF, NGFR och NF1 [45] . |
adenokarcinom i prostata | 500 | Fusion av generna ERG, ETV1/4 och FLI1 eller mutationer av generna SPOP, FOXA1 och IDH1 upptäcktes i 74 % av fallen, abnormiteter i PI3K- eller MAPK-signalvägarna upptäcktes i 25 % av cancerfallen och inaktivering av DNA reparationsgener observerades också hos 19 % [46] . |
Adenocarcinom i ändtarmen | 172 | Mutationer i generna APC, TP53, SMAD4, PIK3CA, KRAS, ARID1A, SOX9 och FAM123B/WTX, amplifiering av ERBB2, IGF2, fusion av NAV2 och TCF7L1 (en komponent i WNT-signalvägen), hypermetylering och tystnad av 75MLH1 % av fallen [33] . |
Sarkom | 261 | |
Kutant melanom | 470 | Mutationer i BRAF, RAS, NF1, KIT [47] . |
Adenocarcinom i magen | 443 | Mutationer i PIK3CA-genen, ökade nivåer av DNA-metylering, amplifiering av JAK2-, CD274- och PDCD1LG2-generna [48] . |
Tumörer av testikel embryonala celler | 150 | |
tymom | 124 | |
Sköldkörtelkarcinom | 507 | EIF1AX, PPM1D, CHEK2 och olika genfusioner [49] . |
Livmoderkarcinosarkom | 57 | Mutationer i generna TP53, PTEN, PIK3CA, PPP2R1A, FBXW7 och KRAS [50] . |
Sarkom i livmoderns endometrium | 560 | Ett litet antal förändringar i antalet kopior eller mutationer av TP53-genen, frekventa mutationer i PTEN, CTNNB1, PIK3CA, ARID1A, KRAS, ARID5B [51] . |
Uveal melanom | 80 |