16S rRNA är en av de tre huvudtyperna av rRNA som utgör ryggraden i prokaryota ribosomer . Siffrorna i rRNA-namnet är lika med värdet på sedimentationskonstanten . Följaktligen, för en given molekyl är detta värde lika med 16S ( Swedberg-enheter ). Totalt hittades tre typer av rRNA i prokaryota mikroorganismer: 23S och 5S i den stora subenheten av ribosomen (50S), 16S i den lilla subenheten av ribosomen (30S). På liknande sätt är konstanterna för de andra två rRNA-molekylerna 23 respektive 5 S. Den eukaryota analogen av 16S rRNA är 18S rRNA [1] .
Hittills har nukleotidsekvenserna i 16S rRNA och 18S rRNA studerats för mer än 400 arter från olika riken av vilda djur . 16S rRNA-gensekvensen används huvudsakligen i studiet av fylogenetik hos bakterier och arkéer . Sedan 2010 har Earth Microbiome -projektet lanserats , som samlar forskning om detta ämne. Dessutom används 16S rRNA-gensekvensen för medicinsk forskning om patogena bakterier.
16S rRNA isolerades först av Eisenberg och Litaur 1959 under experiment för att isolera och studera de fysikaliska egenskaperna hos Escherichia coli RNA . Baserat på en jämförelse av viskositeterna för RNA och DNA- lösningar föreslog de att RNA är en enkelsträngad molekyl. Vid separering av RNA-molekyler isolerade från bakterieceller hittades två RNA-fraktioner som skiljer sig åt i värdena för sedimenteringskoefficienter. För den lättare fraktionen var koefficienten lika med 16S och för den tyngre fraktionen 25S [2] .
Senare, på 1960 -talet, fann A. Belozersky och A. Spirin att rRNA står för 80–90 % av allt cell-RNA. De beskrev också för första gången skillnaden i struktur och sammansättning av rRNA i prokaryota och eukaryota organismer. Upptäckten av ribosomer och rRNA av den prokaryota typen i mitokondrier och kloroplaster blev ett av bevisen för teorin om symbiogenes [3] [4] [5] .
Den primära strukturen av 16S rRNA representeras av en enkelsträngad sekvens bestående av 1600 ribonukleotider . Genom hela sekvensen, konserverad för många arter och hypervariabla regioner är jämnt fördelade. Regioner kallas konservativa, vars sekvenser skiljer sig något eller inte alls skiljer sig åt i de organismer som övervägs. Hypervariabla är de regioner vars sekvenser skiljer sig mycket åt i avlägsna organismer, men i närbesläktade de har en viss procentuell likhet [6] [7] .
16S rRNA-genen innehåller nio hypervariabla regioner, betecknade V1-V9. Varje region är 30 till 100 baspar lång. Dessa platser är involverade i bildandet av den sekundära strukturen av den lilla subenheten av ribosomen . Mellan de hypervariabla regionerna innehåller 16S rRNA-genen mycket konserverade sekvenser. Graden av konservatism för hypervariabla regioner är inte densamma - det har visat sig att sekvenserna för mer konserverade regioner är likartade i organismer på nivån av taxa av hög rang, och mindre konservativ - på nivån för låg taxonomisk rang som släkten och arter [8] [9] .
I den sekundära strukturen av 16S rRNA kan 4 väldefinierade domäner urskiljas (liksom proteindomänen är RNA-domänen en stabil, självsammansättande struktur av molekylen): 5'-domän (resterna 1-556), central (rester 564-912) och två ′-ändar (stor domän 926-1391 och liten domän 1392-1542). De olika domänerna är separerade från varandra av helixar som slutar med RNA- hårnålar . Den sekundära strukturen av 16S rRNA innehåller också 5'- och 3'-oparade baser som bildar loopar. Det antas att dessa baser kan delta i bildandet av den tertiära strukturen av 16S rRNA, ansluten via vätebindningar , inte enligt den kanoniska Watson-Crick-basbindningen [11] .
Följande funktioner har beskrivits för 16S rRNA:
Alla tre prokaryota rRNA-gener (16S, 23S och 5S ) är i ett samtranskriberat operon och separeras av tRNA- gener och spacersekvenser . Under bearbetningen av det primära transkriptet , utfört av endonukleaser , avlägsnas spacersekvenser och intermediärer uppträder som en produkt , och slutligen moget RNA [13] .
16S rRNA är en komponent i den lilla subenheten av ribosomen och spelar en viktig roll vid mRNA -avkodning . rRNA-prekursorn är 17S rRNA, som frisätts från det primära transkriptet av RNas III -nukleaset . Ytterligare bearbetning av 5'-änden utförs av RNaserna E och G. Hur 3'-änden bearbetas är för närvarande oklart [13] .
16S rRNA-sekvensen representeras av nio hypervariabla regioner och konserverade sekvenser som separerar dem. På grund av dessa egenskaper hos den primära strukturen föreslogs det att använda 16S rRNA -genen för fylogenetiska studier . Den första vetenskapsmannen som använde 16S rRNA för att etablera familjerelationer mellan grupper av bakterier var Carl Woese . Han föreslog att 16S rRNA-genen kunde användas som en pålitlig molekylär klocka , eftersom det visade sig att 16S rRNA från evolutionärt avlägsna bakteriearter har liknande delar av sekvensen och funktionen [14] [1] [15] .
Således gör hypervariabla regioner det möjligt att särskilja olika arter från varandra, och närvaron av mycket konserverade regioner tillåter skapandet av universella primers som kan användas för att studera bakterier och archaea , oavsett deras taxonomiska tillhörighet. Det första paret universella primers som fick stor användning utvecklades av Weisburg et al. [14]
Det bör också noteras att den valda primer-annealing- regionen är så konservativ att universella primers kan användas för att amplifiera 16S rRNA från mitokondrier och kloroplaster , ättlingar till alfa-proteobakterier respektive cyanobakterier [ 16] .
Sekvenseringsmetoder med universella primers används inom medicinsk mikrobiologi som ett snabbt och billigt alternativ till den morfologiska metoden för bakteriell identifiering, som kräver ett stort antal manipulationer, inklusive ofta behovet av att odla en potentiell patogen under laboratorieförhållanden under lång tid. Dessutom ger sekvensering mer tillförlitliga resultat [17] . I denna industri används vissa hypervariabla regioner: till exempel är V3-regionen bäst för att identifiera patogensläkten och V6 för artidentifiering [18] .
År 2010 lanserades Earth Microbiome -projektet , som satte sig den ambitiösa uppgiften att skapa en global katalog över den biologiska mångfalden av icke- odlade mikroorganismer på vår planet, det vill säga de som är svåra att odla och underhålla i laboratoriet . Denna storskaliga studie planerar att analysera mikrobiella samhällen från mer än 200 000 miljöprover från laboratorier runt om i världen. Sekvenserna för 16S rRNA-gener används för att bestämma den taxonomiska tillhörigheten av mikroorganismer i prover. DNA isoleras från de insamlade proverna och sedan utförs PCR med primers för 16S rRNA. Amplikonerna som erhålls under PCR sekvenseras . I denna typ av forskning kan Illumina , Ion Torrent -sekvenseringsteknologier användas , och andra plattformar kan också användas . Som regel kan kompletta sekvenser av hypervariabla regioner av intresse erhållas efter en enda sekvenseringshändelse [19] . Projektet har hittills analyserat mer än 30 000 prover [20] .
I sådana studier tas särskild omsorg vid valet av primers och fragmentet som ska amplifieras . Huvudkriterierna är den fullständiga täckningen av de studerade organismerna (i detta fall arkéer och bakterier) och den fylogenetiska upplösningen av sekvensen, det vill säga hur detaljerat det är möjligt att bestämma den taxonomiska tillhörigheten för en organism från sekvensen [21] .
Earth Microbiome Project använder hypervariabla regioner V4 och V4-V5 för att klassificera mikroorganismer, eftersom dessa regioner anses vara optimala för att klassificera mikrobiella samhällen. PCR-primrarna för dessa fragment är en förbättring jämfört med de tidigare använda primrarna 515F, 907R och 806R. Förbättringen av den gamla versionen av primrarna krävdes för att kunna erhålla längre amplikoner, vilket gjorde det möjligt att bättre identifiera organismer från Crenarachaeota/Thaumarchaeota-grupperna, vars exakta klassificering inte kunde fastställas tidigare [22] [23] .
Område som ska förstärkas | Primer namn | Primersekvens (5'-3') |
---|---|---|
V4 | 515F | GTG YCA GCM GCC GCG GTA A |
V4 [24] | 806R | GGA CTA CHV GGG TWT CTA AT |
V4-V5 | 515F | GTG YCA GCM GCC GCG GTA A |
V4-V5 | 926R | CCG YCA ATT YMT TTR AGT TT |
V4-V5 [23] | 907R | CCG TCA ATT CCT TTG AGT TT |
Med ackumuleringen av en stor mängd data fann man att vissa typer av bakterier var felaktigt klassificerade enligt morfologiska egenskaper. Baserat på 16S rRNA- sekvensering har nya arter isolerats, inklusive de som inte kunde odlas i laboratoriet [25] [26] och även släkten [27] . Med tillkomsten av tredje generationens sekvensering har det blivit möjligt i många laboratorier att samtidigt identifiera tusentals 16S rRNA-sekvenser inom några timmar, vilket möjliggör metagenomiska studier , såsom studier av tarmmikrofloran [28] .
Tillsammans med de många fördelar som den beskrivna metoden för att upprätta familjeband mellan grupper av organismer (universalitet av användning och relativ hastighet för avrättning) har, finns det också nackdelar. I synnerhet hypervariabla regioner gör lite för att skilja mellan närbesläktade arter . Till exempel är sekvenserna för 16S rRNA-genen i representanter för familjerna Enterobacteriaceae , Clostridiaceae och Peptostreptococcaceae 99% lika. Det vill säga, den hypervariabla regionen av V4 kan skilja sig åt med endast ett fåtal nukleotider , vilket gör det omöjligt att på ett tillförlitligt sätt skilja mellan taxa av lågrankade bakterier . Om studien av bakteriell taxonomi är begränsad till analys av hypervariabla regioner av 16S rRNA, kan man felaktigt kombinera närbesläktade grupper till ett taxon och underskatta mångfalden av den studerade gruppen av bakterier [29] [30] .
Dessutom kan bakteriegenomet innehålla flera 16S rRNA-gener vars hypervariabla regioner V1, V2 och V6 representerar den största intraspecifika mångfalden . Även om det inte är den mest exakta metoden för att klassificera bakteriearter, förblir analys av hypervariabla regioner en av de mest använda metoderna som är tillämpliga för studier av bakteriesamhällen [31] .
I ljuset av antagandet att evolutionen drivs av vertikal överföring av genetiskt material från förfäder till ättlingar, har 16S rRNA-gener länge ansetts vara artspecifika och därför mycket exakta markörer för att bestämma förhållandet mellan grupper av prokaryoter . Ett ökande antal observationer tyder dock på möjligheten till horisontell överföring av dessa gener. Förutom observationer av horisontell genöverföring i naturen har experimentella bevis för dessa händelser presenterats. Studien använde en mutant Escherichia coli - stam som saknade sin egen 16S rRNA-gen. Men montering av en funktionell ribosom har observerats med 16S rRNA lånat från en icke-besläktad E. coli bakterie [32] [15] . Liknande interoperabilitet har också observerats i Thermus thermophilus . Dessutom observerades både fullständig och partiell genöverföring i T. thermophilus . Partiell överföring uttrycktes i spontan bildning av en till synes slumpmässig chimär sekvens mellan värdbakteriens gen och den främmande genen [33] .
Så 16S rRNA-genen kunde ha utvecklats på flera sätt, inklusive vertikal och horisontell genöverföring. Frekvensen av den senare varianten kan vara betydligt högre än man tidigare trott.
De kompletta sekvenserna av 16S rRNA-gener, liksom många andra, är sammansatta från läsningar - vissa nukleotidsekvenser erhållna efter sekvensering . Sekvensering utförs på Illumina- plattformen (läslängden når 250 baspar); använder Sanger-sekvenseringsteknik (längd på avläsningar - upp till 1000 baspar); med hjälp av jonhalvledarsekvensering (avläsningslängd - upp till 200 baspar). Därefter jämförs avläsningarna med referenssekvensen för 16S rRNA-genen, så att den fullständiga gensekvensen sammanställs från många avläsningar.
16S rRNA-gensekvenserna har bestämts för typstammar av bakterier och archaea och samlats in i öppna databaser som NCBI . Men kvaliteten på de sekvenserade sekvenserna som finns i sådana databaser kontrolleras ofta inte. Som ett resultat används sekundära databaser som endast innehåller 16S rRNA-gensekvenser i stor utsträckning [34] . De mest använda databaserna listas nedan.
EzBioCloud-databasen, tidigare känd som EzTaxon, består av ett komplett hierarkiskt taxonomiskt system som innehåller 65 342 bakteriella och arkeala 16S rRNA-sekvenser från och med februari 2020. EzBioCloud-databasen är systematiskt kurerad och uppdateras regelbundet. Dessutom tillhandahåller databasens webbplats bioinformatikverktyg som ANI-kalkylatorn för att hitta procentuell likhet mellan två sekvenser av prokaryota genom, ett parvis anpassningsverktyg för två sekvenser och många andra [35] .
RDP är en kurerad databas som tillhandahåller rRNA-sekvensinformation och relaterade program och tjänster. Föreslaget innehåll inkluderar fylogenigrupperade rRNA - anpassningar, fylogenetiska träd härledda av anpassning , sekundära rRNA-strukturer och olika program för att visualisera och analysera information för rRNA-genforskning. De flesta programvarupaket är tillgängliga för nedladdning och lokal användning [36] .
SILVA är en databas som innehåller en manuellt verifierad och regelbundet uppdaterad uppsättning av rRNA-sekvensanpassningar för alla tre livsdomäner av ribosom små subenheter (16S/18S) och stora ribosomsubenheter (23S/28S) . Baserat på databasen skapades också en tjänst för primerdesign och konstruktion av fylogenetiska anpassningar [37] .