Metagenomics är en gren av molekylär genetik som studerar genetiskt material som erhålls från miljöprover. Metagenomics studerar uppsättningen gener för alla mikroorganismer som finns i ett prov av miljön - metagenomet . Metagenomisk analys gör det möjligt att bestämma artdiversiteten i provet som studeras utan behov av isolering och odling av mikroorganismer.
Den största fördelen med att använda det metagenomiska tillvägagångssättet är att ta hänsyn till inte bara odlade mikroorganismer utan även icke-odlade. Det visade sig att sådana organismer utgör det huvudsakliga bidraget till arternas mångfald i samhällen [1] . Metagenomics gör det möjligt att i detalj studera mångfalden av samhällen, och därför ta reda på mekanismerna för deras funktion, för att bestämma metaboliska samband [2] .
Den utbredda utvecklingen av metagenomik beror på spridningen av nya generationens sekvenseringsmetoder . De gör det möjligt att erhålla sekvenserna av nästan alla gener från varje mikroorganism i samhället [3] . Eftersom priset på DNA-sekvensering sjunker varje dag, blir sådan analys mer överkomlig.
Termen "metagenomics" användes först av Joe Handelsman , John Clardy , Robert Goodman , Sean Brady och andra i deras 1998-publikation [4] . Termen "metagenom" uppstod från idén att en uppsättning gener som samlats in från miljön kan analyseras på samma sätt som hela genom analyseras. Kevin Chen och Lyor Patcher (forskare vid University of California, Berkeley ) har definierat metagenomik som "tillämpningen av moderna genomiktekniker utan behov av isolering och laboratorieodling av enskilda arter" [5] .
Under lång tid, vid sekvensering av genomen av mikroorganismer, användes som regel kulturer av identiska celler som DNA-källor. Tidiga metagenomiska studier har dock visat att det i många livsmiljöer finns stora grupper av mikroorganismer som inte kan odlas i laboratoriekultur och därför kan deras genom inte sekvenseras. Dessa tidiga arbeten studerade 16S rRNA-sekvenser , som är ganska korta, ofta bevarade inom en enda art och tenderar att skilja sig från art till art. Många 16S rRNA-sekvenser som finns i olika livsmiljöer kunde inte tillskrivas någon av de odlade arterna, vilket indikerar förekomsten av många icke-isolerade mikroorganismer. Dessa studier har visat att endast 1 % av arterna som finns i ett miljöprov är odlade [1] .
Molekylär forskning inom detta område initierades av Norman Pace och kollegor, som använde PCR för att studera mångfalden av rRNA-sekvenser [6] . Genom dessa studier förde Pace fram idén om att klona DNA direkt från miljöprover 1985 [7] . 1991 publicerade Pace och kollegor den första rapporten om isolering och kloning av DNA från ett miljöprov [8] . Även om den befintliga metoden då endast tillät att arbeta med mycket konservativa, icke-proteinkodande gener , tillät den oss att bekräfta resultaten av morfologiska mikrobiologiska studier, vilket tyder på en större artdiversitet av mikroorganismer än vad laboratorieodlingsmetoder tillåts. År 1995 rapporterade Healy den metagenomiska isoleringen av funktionella gener från en komplex laboratoriekultur av miljömikroorganismer odlade på torrt gräs [9] . Edward DeLong , som lämnade Paces laboratorium, lade grunden för att konstruera fylogenier av mikroorganismer från miljön baserat på 16S rRNA. Hans egen grupp började sätta ihop ett bibliotek av genetiskt material från marina mikroorganismer [10] .
År 2002 visade Mia Breitbard, Forest Rower och kollegor, med hjälp av hagelgevärssekvensering av miljöprover , att 200 liter havsvatten innehöll mer än 5 000 typer av virus [11] . Ytterligare studier har visat att mänsklig avföring innehåller mer än tusen typer av virus, och ett kilo marint sediment kan innehålla mer än en miljon typer av virus, inklusive bakteriofager . Nästan alla dessa virus var nya arter. 2004 sekvenserades DNA helt från sura gruvvatten [12] . Tack vare denna studie var det möjligt att erhålla fullständiga eller nästan kompletta genom av bakterie- och arkeala arter, som tidigare inte hade odlats i laboratoriet [13] .
I början av 2003 organiserade Craig Venter , chef för ett parallellt projekt till Human Genome Project, en expedition för att samla in havsvattenprover från hela jorden ( engelska: Global Ocean Sampling Expedition (GOS) ). Alla prover sekvenserades med hagelgevär för att identifiera de nya organismernas genom. DNA från 2000 olika arter har identifierats i Sargassohavet, inklusive 148 nya bakteriearter [14] .
2005 publicerade Stefan Schuster och kollegor vid University of Pennsylvania den första sekvensen från ett miljöprov som erhållits med hjälp av high-throughput-sekvensering, närmare bestämt pyrosekvensering [15] .
Flera human metagenomics-projekt befinner sig i olika skeden av implementering eller har redan slutförts, inklusive analys av hud- och tarmmikroflora [16] . Att få en komplett bakteriell bild av kroppen kräver enorma ansträngningar, på grund av den enorma artmångfalden av mikroorganismer.
Under 2007-2008 lanserades ett globalt projekt kallat Human Microbiome . Under 2011 presenterades vissa resultat [17] [18] . Sedan 2010 har en storskalig studie av det mänskliga metagenomet beskrivits i Ryssland. Ett konsortium av ledande ryska institut inom gastroenterologi och molekylärbiologi började som ett initiativprojekt att genomföra de första experimenten på storskalig sekvensering av DNA- prover från den mänskliga tarmen [19] .
Den första allmänt använda metoden för sekvensering genom slumpmässig fragmentering är hagelgevärsmetoden . Det ligger i det faktum att DNA som isolerats från provet hydrolyseras till slumpmässiga fragment. Sedan, med hjälp av metoderna för molekylär kloning , skapas ett bibliotek av kloner från de erhållna fragmenten . DNA-sekvenser bestäms genom Sanger-sekvensering , och sedan sätts genomet samman [20] . Sekvensering ger information om de gener som finns i de organismer som representeras i provet. En funktionell beskrivning av produkterna av dessa gener gör det möjligt att bestämma de metaboliska sambanden i samhället [21] .
Närvaron av molekylär kloningsstadiet i metoden gör det ganska tidskrävande. Från och med 2016 används inte längre Sanger-sekvensering för att bestämma genomsekvenser, utan istället används nya generationer sekvenseringsmetoder , som gör det möjligt att erhålla genomsekvenser av organismer som befinner sig i ett prov av miljön snabbare och utan stadiet av molekylär kloning. [22] [23]
Med en sådan analys kommer sekvenserna som tillhör de mest representerade organismerna att dominera i uppsättningen av DNA från provet. För att ge tillräcklig täckning av genomen hos underrepresenterade organismer blir det nödvändigt att använda stora volymer provmedium. Å andra sidan leder den slumpmässiga karaktären av sekvenseringsmetoder (slumpmässig fragmentering av en DNA-sekvens från ett prov) till att sekvenserna av många organismer som kan förbli obemärkta med traditionella odlingsmetoder är tillgängliga för analys, åtminstone i några små plots. deras genomiska DNA-sekvenser [12] .
Uppgiften att bestämma artsammansättningen i ett samhälle löses genom att sekvensera vissa gener som alla organismer i ett samhälle ska ha. Vissa regioner av sådana genomiska DNA-sekvenser, såsom genen som kodar för 16S rRNA , består av mycket konserverade sekvenser och hypervariabla regioner [24] . Denna egenskap tillåter användningen av sekvenseringsprimrar som är komplementära till konserverade regioner för att generera sekvenser av hypervariabla regioner. De erhållna sekvenserna gör det möjligt att tillskriva organismen en viss art [25] [26] .
Data som erhållits som ett resultat av ett metagenomiskt experiment innehåller en enorm mängd information och brus, eftersom de är fragment av DNA-sekvenser som tillhör tusentals och tiotusentals olika arter [27] . Att samla in, kurera och extrahera användbar biologisk information från datauppsättningar av denna storlek är beräkningsutmaningar som kan lösas med hjälp av bioinformatik [28] .
Det första steget av metagenomisk analys är den preliminära filtreringen av data. Det inkluderar borttagning av redundanta sekvenser av låg kvalitet. För metagenomer som härrör från djurorganismer är det viktigt att ta bort sekvenser av eukaryot ursprung [29] . Eukaryot genomisk DNA-kontamination avlägsnas med hjälp av Eu-Detect [30] och DeConseq [31] algoritmer .
I huvudsak är DNA-sekvenserna från genomiska och metagenomiska experiment desamma. Men metagenomiska experiment ger lägre täckning, och användningen av nästa generations sekvenseringsmetoder för analys leder till en begränsning av längden på sekvensen som sekvenseras [28] . Uppgiften är också komplicerad på grund av den olika representationen av arter i samhället. Dessa egenskaper leder till det faktum att sammansättningen av genomregioner från data från ett metagenomiskt experiment blir en svår uppgift, det kräver hög datorkraft och kan leda till felaktiga resultat. Till exempel kan chimära sekvenser erhållas, som är en kombination av sektioner av DNA-sekvenser från olika organismer [32] .
Det finns flera program som sätts ihop med avseende på pair-end-läsningar, den här metoden låter dig minska antalet fel. Program som Phrap eller Celera Assembler skapades ursprungligen för sammansättning av enstaka genom, men de ger bra resultat vid bearbetning av metagenomiska data [27] . Andra program, som Velvet assembler, använder de Bruijn-grafer för att hantera de korta sekvenserna (läsningarna) som är resultatet av nästa generations sekvenseringsmetoder. Sammansättningen av genomen från de vanligaste arterna underlättas genom användning av referensgenom [32] . Efter montering uppstår följande problem: det är nödvändigt att bestämma vilken art de resulterande sekvenserna tillhör [33] .
I metagenomisk analys används två huvudsakliga metoder för att kommentera kodande sekvenser efter montering [32] . Den första metoden är baserad på sökningen efter homologa kommenterade gener, vanligtvis med BLAST . Detta tillvägagångssätt implementeras i MEGAN4-programmet [34] . Det andra tillvägagångssättet ( ab initio ) använder interna egenskaper hos sekvensen för att förutsäga kodande regioner , för dess genomförande används träningsuppsättningar av gener från besläktade organismer [35] . Detta tillvägagångssätt används av programmen GeneMark [36] och GLIMMER [37] . Den största fördelen med ab initio- metoden är att den kan identifiera kodande sekvenser för vilka inga homologer är kända [27] .
Medan annoteringen av metagenomet indikerar vilka funktioner som implementeras i samhället, låter definitionen av artsammansättning dig bestämma vilka organismer som är ansvariga för deras implementering. Processen att associera vissa gener, och därmed de funktioner som de kan utföra, med vissa typer av organismer kallas binning . Den implementeras med BLAST- metoden genom att söka efter liknande gener, för vilka man vet vilken organism de tillhör. Detta tillvägagångssätt implementeras i MEGAN-programmet (MEta Genome ANAlyzer) [38] . Det här programmet låter dig också utföra en funktionell annotering av metagenomet. Under bearbetning associeras sekvenser med NCBI taxonomy noder och SEED eller KEGG [39] funktionella klassificeringsnoder som använder den minst gemensamma förfaderalgoritmen [39] . Den första versionen av programmet användes 2005 för att analysera det metagenomiska sammanhanget för DNA-sekvenser erhållna från mammutben [ 15] .
Ett annat program, PhymmBL, använder interpolerade Markov-modeller [27] för detta ändamål . Metoderna MetaPhlAn [40] och AMPHORA [41] använder data om unika genetiska markörer - sekvenser som är karakteristiska för vilken kladd som helst - för att bestämma representationen av en taxonomisk grupp i en gemenskap [42] . Vissa binning-metoder använder information om inneboende sekvensegenskaper, såsom oligonukleotidfrekvenser eller kodonanvändning .
Att analysera det stora exponentiellt växande antalet tillgängliga DNA-sekvenser är en utmanande uppgift. Dessutom kompliceras analysen av de komplexa metadata som är förknippade med metagenomiska projekt. De inkluderar information om geografin för provet som studeras, miljöegenskaper, fysiska data, samt provtagningsmetoder [28] . Denna information är nödvändig för att säkerställa reproducerbarheten av experiment och för ytterligare analys. Det är viktigt att presentera denna information med hjälp av standardiserade dataformat och att utveckla specialiserade databaser som Genomes OnLine Database (GOLD) [43] .
Särskilda tjänster har utvecklats för integrering av metadata och data om genomiska sekvenser. Under 2007 skapades en tillgänglig tjänst för analys av data från metagenomiska experiment Metagenomics Rapid Annotation med hjälp av Subsystem Technology-servern (MG-RAST). År 2012 hade cirka 50 000 metagenom laddats upp till denna databas [44] .
En jämförande analys av metagenomer gör det möjligt att förstå funktionerna hos mikrobiologiska samhällen och, för symbiotiska mikroorganismer, fastställa deras roll för att upprätthålla värdens hälsa [45] . Parvisa och multipla jämförelser av metagenomer utförs genom att anpassa deras fragment, jämföra GC-sammansättning , oligonukleotidanvändningsmönster och artdiversitet. En funktionell jämförelse kan göras genom att jämföra fragment av metagenomer med databaser som innehåller information om metabola vägar [39] . För att bestämma ett samhälles funktion är det inte definitionen av artsammansättningen som spelar en viktig roll, utan den funktionella beskrivningen av alla gener som finns i den. Samma funktioner finns i samhällen under liknande ekologiska förhållanden, även om artsammansättningen i sådana samhällen kan skilja sig mycket [46] . Det är därför metadata som beskriver villkoren för att få ett metagenomiskt prov är mycket viktigt för jämförande analys [27] .
Huvudmålet med jämförande metagenomik är att identifiera grupper av mikroorganismer som bestämmer egenskaperna hos ett visst område av miljön. Dessa egenskaper är resultatet av interaktioner mellan grupper av mikroorganismer. För detta ändamål utvecklades gemenskapens analysprogram [47] . Det gör det möjligt att jämföra den taxonomiska sammansättningen av samhällen och identifiera möjliga interaktioner mellan de upptäckta grupperna av mikroorganismer. Istället för att helt enkelt jämföra fördelningen av taxonomiska grupper tar programmet hänsyn till de probabilistiska mönstren för interaktioner.
Den huvudsakliga metoden i analysen av det metagenomiska samhället är kartläggningen av avläsningar till genomen från kända bakterier eller arkéer annoterade i GenBank . För att förstå vilka mikroorganismer som lever i ett givet prov och vilka metabola samband som är möjliga mellan dem, är det alltså inte nödvändigt att sätta ihop sekvensen igen [48] .
I många bakteriesamhällen, både naturliga och artificiella (såsom bioreaktorer ), finns en ansvarsfördelning i metaboliska processer, den så kallade syntrofin , som ett resultat av vilken metaboliska produkter från vissa mikroorganismer används av andra mikroorganismer [49] . Till exempel, i ett av dessa system - rötkammare - finns det två syntrofa arter ( Syntrophobacterales och Synergistia ), som ett resultat av det gemensamma arbetet med vilket den använda råvaran omvandlas till ett fullständigt metaboliserbart avfall ( metan ) [50] . Genom att studera genuttryck med hjälp av DNA-mikroarrayer eller proteomanalys kan forskare sammanföra delar av det metabola nätverket för att bilda metaboliska kluster [51] .
Metagenomics ger forskare tillgång till den funktionella och metaboliska mångfalden av mikrobiella samhällen, men metagenomics kan inte visa vilka av dessa metaboliska processer som är aktiva. Extraktion och analys av metagenomiskt budbärar-RNA (metatranskriptom) ger information om regleringen av genuttrycksprofiler för komplexa samhällen [46] . På grund av tekniska svårigheter (till exempel den snabba nedbrytningen av budbärar-RNA- molekyler ) finns det hittills väldigt få studier av transkript av odlade mikrobiella samhällen. Utvecklingen av mikroarrayteknologier gav dock impulser till studiet av metatranskriptomer, och det blev möjligt att utvärdera uttrycket av olika gener i hela samhället [52] .
Metagenomisk sekvensering används i studien av virala samhällen. Eftersom virus inte delar en gemensam universell fylogenetisk markör (som 16S RNA för bakterier och archaea och 18S RNA för eukaryoter), är det enda sättet att få tillgång till studien av den genetiska mångfalden hos ett viralt samhälle i ett ekologiskt prov genom metagenomik. Virala metagenomer (även kallade viromes ) borde alltså ge mer och mer information om viral mångfald och evolution [53] .
Metagenomics har potential att utforskas i en mängd olika tillämpningar. Metagenomik kan tillämpas för att lösa praktiska problem inom områden som medicin , teknik, jordbruk och ekologi.
Mikrobiella samhällen spelar en nyckelroll för att upprätthålla människors hälsa , men deras sammansättning och funktionsmekanismer är fortfarande olösta [54] . Metagenomisk sekvensering har använts för att karakterisera mikrobiella samhällen hos hundratals individer. Detta är en del av det så kallade Human Microbiome Project, vars huvudmål är: att identifiera den grundläggande uppsättningen av mänskliga mikrober , att förstå hur förändringar i den mänskliga mikrofloran korrelerar med förändringar i hälsa, och att utveckla den tekniska och bioinformatiska basen för att uppnå dessa mål [55] sekvensering av genom från tarmmikroorganismer lämpliga för odling under laboratorieförhållanden:
En annan medicinsk inriktning är MetaHit-projektet (metagenomics of the human digestive tract ), där 124 personer från Danmark och Spanien deltog , bland dem var friska personer, överviktiga och personer med sjukdomar i matsmältningskanalen. Huvudsyftet med studien var att försöka karakterisera den fylogenetiska mångfalden hos gastrointestinala bakterier. Studien visade att två bakterieklader, Bacteroidetes och Firnicutes , utgör mer än 90 % av alla kända bakteriella fylogenetiska grupper som dominerar den distala tarmen. Med hjälp av den relativa frekvensen av gener som finns i tarmen, identifierade forskarna 1 244 metagenomiska kluster som spelar en avgörande roll för att upprätthålla ett hälsosamt tillstånd. Två huvudfunktioner hos dessa kluster har identifierats: att upprätthålla uttrycket av hushållningsgener och uttrycket av gener specifika för mag-tarmkanalen. Hushållningsgenklustret är väsentligt för alla bakterier och spelar ofta en stor roll i metabola vägar som central kolmetabolism , aminosyrasyntes . Ett kluster av specifika gener inkluderar förmågan att vidhäfta värdproteiner och förmågan att livnära sig på sockerarter . Patienter med kolonirritation har 25 % färre av dessa gener och uppvisar även lägre bakterieantal än personer som inte har diagnostiserats med några gastrointestinala problem.
Även om dessa studier har potentiellt värdefulla medicinska applikationer, var endast 31-48,8 % av sekvenserna inriktade med de 194 kända tarmbakteriegenomen, och endast 7,6-21,2 % av avläsningarna var anpassade till GenBank -sekvenser , vilket tyder på behovet av ytterligare utveckling av forskning för att helt täcka alla bakteriegenom [56] .
Kostnaden för sekvensering av mänskligt genom under de senaste tre åren[ vad? ] har minskat med nästan 100 gånger och fortsätter att minska snabbt. Förbättringen av NGS DNA- sekvenseringsteknologier inom en snar framtid kommer att leda till att nästa priströskel ($1000 per genom) övervinns och kommer att orsaka grundläggande förändringar inom många områden av biologi och medicinsk genetik , vilket borde leda till personalisering av medicin i framtiden . Den teknologiska boomen inom detta område av molekylär genetik tyder på att metagenomik gradvis kommer att ersätta PCR- diagnostik. År 2011 tillkännagavs även ett anslag för forskning inom metagenomik i Ryssland [57] .
Biobränslen erhålls genom omvandling av biomassa , t.ex. genom att omvandla cellulosa , som härrör från majs och hirs , till hydrolysalkohol . Denna process är beroende av mikrobiella konsortier för att omvandla cellulosa till sockerarter, följt av jäsning av sockerarter till etanol . Mikroorganismer producerar också olika källor till bioenergi, inklusive metan och väte [58] .
Effektiv industriell produktion av nya föreningar från biomassa kräver nya enzymer med högre produktivitet och lägre produktionskostnader [59] . Metagenomiska tillvägagångssätt för analys av komplexa mikrobiella samhällen möjliggör målinriktad screening av enzymer för industriell tillämpning vid produktion av biobränslen, såsom glykosylhydrolaser [60] . Dessutom är kunskap om hur mikrobiella samhällen fungerar avgörande för att hantera dessa samhällen, och metagenomik är ett nyckelverktyg för att förstå dem. Metagenomiska tillvägagångssätt gör det möjligt att utföra en jämförande analys mellan konvergerande system av mikroorganismer.
Genom metagenomik kan strategier förbättras för att övervaka effekterna av föroreningar på ett ekosystem , och nya metoder kan utvecklas för att städa upp förorenade miljöer. En djupare förståelse för hur mikrobiella samhällen hanterar föroreningar ger hopp om att denna process kan användas i framtiden för att bekämpa industriella föroreningar [61] .
Mikrobiella samhällen kan producera ett brett spektrum av biologiskt aktiva ämnen som vidare används av andra organismer. Många av de läkemedel som används idag återfanns ursprungligen i mikroorganismer. Den senaste tidens framgångar med att erhålla mångsidigt genetiskt material från oodlade mikroorganismer har lett till upptäckten av nya gener, enzymer och andra aktiva föreningar. Användningen av metagenomik har möjliggjort utvecklingen av nya grenar av den kemiska och farmaceutiska industrin [62] .
Ett gram jord som används för att odla växter innehåller mellan 10 9 och 10 10 mikrobiella celler [63] . Sammansättningen av mikrobiella samhällen som lever i jorden har länge uppmärksammats av forskare, men är fortfarande dåligt förstådd, trots deras ekonomiska betydelse. Mikrobiella samhällen utför ett brett spektrum av ekosystemfunktioner som är nödvändiga för växttillväxt (till exempel kvävefixering ), skydd av växter från sjukdomar, deltagande i kretsloppet av järn och andra metaller . Metagenomics hjälper till att studera interaktioner mellan mikrober i detta samhälle, såväl som interaktionen mellan växter och mikrober. Baserat på data som erhållits med hjälp av metagenomisk analys är det möjligt att identifiera egenskaperna hos mikroorganismer som tillhör oodlade taxa, för att förstå deras roll i ämnescykeln, såväl som deras förhållande till växter. Allt detta är nödvändigt för att förbättra grödornas hälsa [64] .
Metagenomics kan ge värdefull information om den funktionella ekologin i miljösamhällen [65] . Till exempel indikerar metagenomiska analyser av bakteriesamhällen som finns i avföring från australiensiska sjölejon att sjölejonsavföring är näringsrik och kan vara en viktig födokälla för kustnära ekosystem. Detta beror på att bakterier som utsöndras samtidigt med avföring kan omvandla svårsmältbara föreningar till biologiskt tillgängliga former som kan vara ytterligare involverade i näringskedjan [66] .
DNA-sekvensering kan också användas för att identifiera arter som finns i vattenpelaren. Detta kan hjälpa till att fastställa utbudet av invasiva arter och hotade arter , samt spåra säsongsbefolkningar [ 67] .
![]() | |
---|---|
I bibliografiska kataloger |
Personlig medicin | |
---|---|
Omix datasektioner | |
Applikationssektioner | |
Metoder | |
Relaterade artiklar |