Nanopore-sekvensering är en familj av högeffektiva tredje generationens DNA- eller RNA- sekvenseringsmetoder [1] . Metoden bygger på användning av protein-, solid-state eller andra porer med en diameter på flera nanometer som är känsliga för nukleinsyror.
Nanopore-sekvensering undviker stegen med PCR - amplifiering och kemisk märkning av ett DNA- eller RNA-prov [2] . Detta är en betydande fördel jämfört med andra sekvenseringsmetoder som använder minst ett av dessa steg. Metodens möjligheter inkluderar relativt billig genotypning , hög rörlighet, snabb analys och realtidsvisning av resultat. Användningen av metoden för snabb detektion av virala patogener [3] , spårning av bakteriell resistens [4] , genomsekvensering av människa [5] [6] och växt [7] , haplotypning [8] , spårning av ebolavirus [9] och andra fält har beskrivits.
1989 demonstrerades skapandet av kanaler ( nanoporer ) i ett artificiellt fosfolipidmembran av alfa-toxin syntetiserat av Staphylococcus aureus [10] [11] . 1995 föreslogs idén om nanoporsekvensering först - bestämningen av egenskaperna hos en linjär polymer när den dras genom en por i ett membran. När den passerar genom en por interagerar polymeren med den på ett visst sätt, vilket gör det möjligt att bestämma dess egenskaper [12] . Ett år senare, 1996, dök det första arbetet upp som beskrev möjligheten att använda nanoporer ( alfa-hemolysin användes som nanopore ) för att karakterisera nukleinsyror [13] .
Åren 1999-2000 visades det att det, genom att använda stafylokocker alfa-hemolysin som nanopor , är möjligt att skilja enkelsträngat RNA från enkelsträngat DNA [14] [15] .
År 2001 genomfördes för första gången ett arbete där förekomsten av korta DNA- sekvenser bestämdes med hjälp av nanoporer [16] . Först 2009 var det möjligt att visa förmågan att särskilja alla baser i DNA-sekvensen med nanoporer, vilket är nödvändigt för att skapa sekvenseringsmetoder [17] .
2012 demonstrerade Oxford Nanopore Technologies de första nanopore- sequencers : GridION och MinION [18] .
Samtidigt visades den grundläggande möjligheten att använda denna metod - bakteriofagens phiX- genom sekvenserades med en längd på 5,4 tusen baspar (bp) [19] .
Ett nanoporesystem är en reaktionskammare uppdelad i två delar av ett membran som innehåller ett nanometerstort hål, en nanopore. En spänning läggs på delar av kammaren , vilket resulterar i att de studerade molekylerna passerar genom poren i riktning mot det elektriska fältet . När en nukleinsyramolekyl passerar genom en por påverkar enskilda nukleotider en eller annan uppmätta parameter i systemet, vilket gör det möjligt att bestämma nukleotidsekvensen [2] . I en praktiskt använd version av nanopore-sekvensering är kammaren fylld med en elektrolytisk lösning, och styrkan hos jonströmmen som strömmar genom poren under fältets verkan mäts; när nukleotider passerar genom poren minskar de det tillgängliga tvärsnittet för joner och strömmen minskar [20] .
Beroende på om de sekvenserade nukleinsyramolekylerna behåller sin kemiska integritet, finns det två alternativ - helsträngssekvensering och exonukleassekvensering [ 21] .
I denna metod klyvs inte nukleinsyrakedjor. Överföringen av hela DNA- och RNA-molekyler genom poren kan utföras på följande sätt:
I denna metod skärs nukleinsyrakedjan till enstaka nukleotider av ett exonukleas lokaliserat i omedelbar närhet av poren. Under inverkan av fältet kommer negativt laddade nukleotider oberoende av varandra in i poren där baser bestäms [21] .
Proteinnanoporer och syntetiska nanoporer i fast tillstånd används för sekvensering [21] .
Staphylococcus aureus alfa-hemolysin är en vattenlöslig monomer som spontant bildar en heptamer i membranet . Den transmembrana domänen består av en stam och ett porhuvud. Porhuvudet innehåller ett hålrum på cirka 4,5 nm i diameter . Vid korsningen av pipan och huvudet finns en avsmalning av kanalen med en bredd på 1,5 nm. Porstammen består av 14 antiparallella beta-strängar som bildar en genomgående kanal som är cirka 2 nm bred. Vid neutralt pH är många aminosyrarester i poren laddade (till exempel den positivt laddade lysinresten K147 och den negativt laddade glutamatresten E111). I en 1 M KCl- lösning bibehålls en potential på 120 mV på poren (från stammen till huvudet), vilket orsakar en ström på 120 pA [22] . Det finns tre nukleotidigenkänningsställen inom stammen , vilket i teorin gör det möjligt för mer än en plats att känna igen en enda nukleotid (vilket ökar läsnoggrannheten) [23] .
MSPAPorin A Mycobacterium smegmatis ( Eng. Mycobacterium smegmatis porin A, MspA ) är en nanopor med en diameter på 1,2 nm. Den har strukturella egenskaper (porform och diameter) som förbättrar signal-brusförhållandet i DNA-sekvensering jämfört med alfa-hemolysin [24] . Men MspA har också en betydande nackdel: den negativt laddade kärnan stör utvecklingen av enkelsträngat DNA inuti poren. Därför, för sekvensering i det ursprungliga proteinet, ersattes tre negativt laddade aspartatrester med neutrala asparaginrester [25] .
Motor-DNA-förpackningsprotein från bakteriofag phi29Det motoriska DNA-förpackningsproteinet från bakteriofagen phi29 är involverat i packningen av DNA i kapsiden av virus, såväl som i frisättningen av DNA från kapsiden vid infektion. Den viktigaste skillnaden från de ovannämnda proteinerna är att den, med en större kanaldiameter (från 3,6 nm till 6 nm), kan passera dubbelsträngat DNA. På grund av sin natur integreras inte motorproteinet phi29, till skillnad från andra porer, i membranet i sin ursprungliga form, men detta problem löses genom att modifiera proteinet [26] . Andra modifieringar tillåter proteinet att hoppa över enkelsträngat DNA eller enkelsträngat RNA [27] .
Förutom proteinnanoporer används även icke-biologiska nanoporer i fast tillstånd. För analys av nukleinsyror används nanoporer i substrat gjorda av kisel , kiselnitrid och polyetylenimin [27] . Porer bränns vanligtvis ut av jon- eller elektronstrålar, vilket gör det lätt att variera deras storlek [28] . Separat är det värt att lyfta fram material som bildar mycket tunna "2D"-porer: grafen , molybdendisulfid och andra [27] . Grafen har också en extremt liten tjocklek, vilket bidrar till en ökning av den rumsliga upplösningen längs DNA, och samtidigt styrka, kemisk tröghet och elektrisk ledningsförmåga . Dessa egenskaper underlättar användningen av dessa material i nanopore-sekvensering [28] .
GrafenEftersom grafen är en tunn och jontät struktur är det ett bra nanoporbaserat sekvenseringsmaterial. Således visades det att grafennanoporer kan användas som en elektrod för att mäta strömmen som flyter genom nanoporer mellan två kammare som innehåller joniska lösningar [28] .
FluorescensdetektionUnder 2010 utvecklades en solid state nanosekvenseringsmetod baserad på fluorescerande signaldetektion . Först omvandlas det önskade DNA:t till DNA, där varje ursprunglig bas motsvarar en kort sekvens. Fluorescerande prober ( molekylära beacons ) hybridiserar till dessa korta sekvenser , med änden av en sond som släcker fluorescensen av fluoroforen i början av den andra sonden. Samtidigt, för att koda fyra baser, behövs bara två typer av prober: varje bas (mer exakt, den korta sekvensen som motsvarar den) motsvarar två fluorescerande signaler (00, 01, 10 eller 11, där 0 motsvarar en färg och 1 till en annan). När det passerar genom poren lindas det resulterande dubbelsträngade DNA:t av, sonden separeras och följaktligen börjar fluoroforen på nästa sond att glöda [29] [30] .
Fördelarna med metoden inkluderar signalens noggrannhet - kamerorna registrerar signalen mycket mer exakt än andra tillgängliga tekniker. Metoden kräver dock förbehandling av provet: omvandlingen av varje nukleotid till cirka 12 nukleotider (vilket också förlänger själva DNA:t) [29] .
Jämförelse av fasta tillstånd och biologiska nanoporerNanoporer i fast tillstånd saknar några av nackdelarna med biologiska nanoporer: känslighet för pH, temperatur, elektrolytkoncentrationer , mekanisk stress , etc. Dessutom är de mer stabila, håller längre, det är mycket lättare att få en mängd olika former och storlekar på sådana porer, och produktionstekniken liknar produktionen av halvledare , vilket i hög grad underlättar processen att erhålla sådana porer och gör det potentiellt möjligt att kombinera med andra nanoenheter. Fördelarna med biologiska nanoporer inkluderar möjligheten till kemisk eller genetisk modifiering, kemisk specificitet för DNA eller RNA och en relativt låg hastighet av passage av DNA eller RNA genom poren [28] [31] .
För att erhålla nanoporer kan DNA-origamiteknik användas . Denna möjlighet demonstrerades första gången 2012, när en struktur som liknar alfahemolysin erhölls med hjälp av DNA-origami. Den resulterande strukturen införlivades spontant i membran [27] .
2010 visades det att enkelväggiga kolnanorör också kan bäddas in i membran och låta DNA passera [27] .
Från och med 2020 har solid-state nanopores inte den kemiska specificiteten av proteiner; därför studeras möjligheten att integrera protein-nanoporer i solid state-substrat aktivt [28] .
En annan lovande riktning är användningen av solid-state nanopores med sensorer (kapacitiva sensorer, tunnel elektroniska och andra detektorer) [28] .
Jämfört med befintliga sekvenseringsmetoder har användningen av denna sekvenseringsmetod fördelar [2] , såsom låg kostnad och enkel användning (på grund av frånvaron av behovet av provberedning och användning av reagens), hög känslighet (fram till sekvensering). utan DNA-amplifiering från blod och saliv ), hög läslängd (upp till tiotusentals baser), hög rörlighet, snabb analys och visning av resultat i realtid [2] .
Nackdelarna inkluderar sådana egenskaper som den låga kvaliteten på avläsningar jämfört med sekvenseringstekniker för korta avläsningar (denna situation förändras dock till det bättre med uppkomsten av nya algoritmer), förlusten av funktionella egenskaper hos biologiska porer över tid (porerna fungerar tillförlitligt endast under en viss tid). körningar) och miljöfaktorers inverkan på hastigheten för avläsning av sekvensen och följaktligen på dess kvalitet (ett motorprotein kan bara arbeta med en tillräcklig hastighet i ett visst pH-område, men inte arbetar tillräckligt snabbt utanför intervallet) [32] .
I februari 2012 vid AGBT-konferensen i Florida presenterade Oxford Nanopore Technologies prototyper av två plattformar för högkapacitetssekvensering av långa fragment baserade på helsträngad nanoporesekvensering: GridION och MinION. Som en demonstration sekvenserades 5386 bp PhiX-bakteriofaggenomet. [19] För 2020 släpper företaget flera enheter. Alla tillåter dataanalys i realtid [33]
MinionMinION är en liten engångscellsekvenserare designad för hemmabruk med ett riktpris på cirka $900. Sequencern har en USB 3.0-kontakt för anslutning till en dator. Innehåller 512 nanoporer med liknande egenskaper [2] . Cellen låter dig sekvensera upp till 30 miljoner bp. DNA (på cirka två dagar kan 10-20 miljoner bp DNA digitaliseras) [34] . 2019 började företaget släppa Flongle, en adapter för MinION eller GridION som låter dig arbeta med mindre produktiva (~1 Gb, 126 nanoporer istället för 512), men mycket billigare ($90) celler [35] .
GridIONGridION är en enhet designad för sekvensering av hela genomet (i huvudsak en MinION med ökad genomströmning). Prototypen hade 2000 individuella nanoporer, var och en kan ta emot avläsningar upp till 5100 bp i längd. med en hastighet av 150 miljoner bp/h under 6 timmar [2] . GridION Mk1 kostar $49 955 och innehåller 5 oberoende celler. Med hjälp av den kan upp till 150 miljoner bp sekvenseras i ett experiment. DNA [36] .
PromethionFöretagets högst presterande sequencer tillåter sekvensering av flera biljoner bp i ett enda experiment. DNA. PromethION 24 innehåller 24 celler och kan digitalisera 3,8 biljoner bp på tre dagar. DNA, PromethION 48 innehåller 48 celler och kan digitalisera 7,6 biljoner bp på tre dagar. DNA. Sekvensercellerna innehåller 3000 nanoporer [37] . En dataström från ett sådant antal nanoporer kan inte analyseras av en konventionell dator, så det krävs en superdator för att använda denna sekvenserare (dock, om du bara kör en cell, då kan en konventionell dator hantera det) [37] [38] .
Annan utvecklingFöretaget planerar att släppa ytterligare två enheter: SmidgION, en sekvenserare som ansluts till en smartphone, och Plongle, en sekvenserare som innehåller 96 oberoende celler med låg genomströmning, och därför är designad för frekvent sekvensering av stora mängder kort DNA [39] .
Efterbearbetning av Oxford Nanopore-dataEfter att ha använt Oxford Nanopore-produkter är utdata rådata i FAST5-format. FAST5-formatet som används av Oxford Nanopore är en variant av HDF5- standarden med en hierarkisk intern struktur utformad för att lagra DNA-sekvensrelaterade metadata och händelser (aggregerade totala strömmätningar) förbehandlade av en fungerande enhet. Bearbetningsresultat visas i realtid i det grafiska gränssnittet MinKNOW och data registreras i filformatet FASTQ eller .fast5 [40] . Därefter måste du utföra nukleotidigenkänning ( engelsk base calling ). Denna process kommer att bearbeta rådata i FAST5-format till FASTQ-format (i MinKNOW kan den här processen startas under läsning av läsningar). Du kan också använda program som poreTools [41] , Guppy [42] [43] .
Därefter måste du rensa upp de mottagna sekvenserna för att bli av med data med för mycket brus. För denna uppgift används till exempel programmet NanoFilt [44] [45] . När uppgifterna har rensats kan de resulterande uppgifterna användas för efterföljande datainsamling och analys [43] .
Program ( https://github.com/skovaka/UNCALLED )
Ordböcker och uppslagsverk |
---|