Molekylär dockning är en metod för molekylär modellering som gör det möjligt att förutsäga den mest gynnsamma orienteringen och konformationen av en molekyl ( ligand ) vid bindningsstället för en annan ( receptor ) för bildandet av ett stabilt komplex [1] . Data om partners position och konformation används för att förutsäga styrkan i interaktionen genom så kallade poängfunktioner. Om liganden är en makromolekyl kallas dockning makromolekylär .
Molekylär dockning kan ses som ett sökande efter den optimala positionen för "nyckeln" (ligand) i "låset" (receptorn) [2] . I det här fallet betraktas molekylerna som stela kroppar. Men i verkligheten, under dockningsprocessen, ändrar liganden och proteinet konformationer för att uppnå bästa bindning. Förändringar i proteinkonformation kan inkludera rörelser av loopar och domäner [2] . En sådan process som leder till framgångsrik bindning kallas "inducerad matchning" [3] .
Molekylär dockning används för att modellera processen för molekylär igenkänning. Det är vanligtvis nödvändigt att hitta den optimala ligandkonformationen. Denna position uppnås när den fria bindningsenergin är minimal. [4] .
Komplex av biologiskt signifikanta molekyler såsom proteiner, nukleinsyror , kolhydrater och lipider spelar en nyckelroll i kemisk signaltransduktion. Dessutom kan den relativa orienteringen av de två interagerande molekylerna påverka typen av signal som produceras (oavsett om den är hämmande eller katalytisk ). Därför är interaktionen mellan biologiska molekyler viktig för att förutsäga både typen och styrkan av den producerade signalen [5] .
Dockning används ofta för att förutsäga affiniteten och aktiviteten hos en liten läkemedelsmolekyl för ett målprotein. Molekylär dockning, som är ett av stadierna i utvecklingen av läkemedel , spelar således en viktig roll i denna process [6] .
En av fördelarna med molekylär dockning är möjligheten till dess automatisering. Som en del av läkemedelsutvecklingsuppgiften blir det möjligt att screena bibliotek av föreningar med låg molekylvikt . Molekylär dockning gör det möjligt att bestämma den mest optimalt interagerande föreningen - ett läkemedel från ett antal analoger med liknande sammansättning [7] .
En av metoderna som används vid läkemedelsutveckling är fragmenterad design . Metoden är baserad på sökning efter små fragment med låg bindningsaffinitet till målet, och deras ytterligare kombination för att söka efter en förening med hög affinitet. Fragmentdesign används för att söka efter potenta inhibitorer. Detta problem löses med olika metoder. Dessa inkluderar vissa typer av NMR-spektroskopi , isotermisk titrering-kalorimetri , mikroskopisk termoforesmetod , plasmonresonans och andra [8] . Molekylär dockning gör det i sin tur också möjligt att lösa ett liknande problem genom att skanna bibliotek av olika föreningar, både lågmolekylära och komplexa, och bedöma deras affinitet [9] .
Dockning kan användas i bioremediering för att söka efter miljöföroreningar som bryts ned av vissa enzymer [10] .
Det finns dock fall då själva platsen för interaktion inte är känd direkt. Sedan tillämpar vi den så kallade "blinda" dockningen [11] . Olika varianter av detta tillvägagångssätt implementeras i följande algoritmer: MolDock [12] , Fragment Hotspot Maps [11] , DoGSiteScorer [13] .
Bland de grundläggande tillämpningsområdena för molekylär dockning är [4] :
Det finns olika sätt att modellera dockning. Ett tillvägagångssätt använder en matchningsteknik som beskriver proteinet och liganden som ytterligare ytor [14] [15] . Ett annat tillvägagångssätt modellerar den faktiska dockningsprocessen där parvisa interaktionsenergier beräknas . Båda tillvägagångssätten har betydande fördelar såväl som vissa begränsningar [16] .
"Styv" kallas dockning, där bindningslängderna, vinklarna och torsionsvinklarna för dockningspartnerna förblir oförändrade under simuleringen. Som ett resultat av interaktion med ett annat protein eller ligand sker emellertid konformationsförändringar både i själva proteinryggraden och i sidokedjorna. Ryggradens rörlighet kan i sin tur delas in i två typer: rörligheten för stora delar av proteinet - domäner, den så kallade "shift"-rörelsen och rörligheten hos enskilda delar, såsom loopar. I det här fallet beskriver "hård" dockning felaktigt interaktioner. Därför finns det några ytterligare "flexibla" dockningsalgoritmer. De tillåter konformationsförändringar, som ett resultat av vilket detta tillvägagångssätt gör det möjligt att erhålla interaktionsuppskattningar som ligger närmast naturliga. Men beräkningen av alla möjliga konformationsförändringar, med hänsyn till rörelsen på en given nivå av datorutveckling, skulle ta enormt lång tid. Dessutom kan ett stort antal frihetsgrader också leda till en ökning av antalet falska positiva. I samband med dessa problem blir det nödvändigt att rationellt välja en liten delmängd av möjliga konformationsförändringar för modellering [17] .
"Flexibel" dockning kan också användas i samband med lågmolekylära sammansättningsdockning. Men i det här fallet är rotation runt alla bindningar i själva ligandens molekyl tillåten, medan proteinet förblir en "stel" struktur [18]
Dockning kan också delas in i singel ( engelska singel ) och sekventiell ( engelska sekventiell ) [19] . Sekventiell dockning används främst för dockning av flera lågmolekylära föreningar (ligander). Efter dockning av en av liganderna i en separat fil sparas strukturen av proteinet med denna ligand. Vidare upprepas algoritmen och dockning implementeras för den andra liganden i den tidigare sparade strukturen. Detta tillvägagångssätt kan vara användbart i sökandet efter allosteriska centra [20] .
Geometrisk överensstämmelse (metoder för att bestämma formens ömsesidiga beroende) beskrivs för ett protein och en ligand som ett antal egenskaper som bestämmer deras optimala interaktion [21] . Dessa egenskaper kan inkludera både den molekylära ytan själv och en beskrivning av ytterligare ytegenskaper. I detta fall beskrivs den molekylära ytan av receptorn i termer av dess tillgänglighet till lösningsmedlet , och den molekylära ytan av liganden beskrivs i termer av dess överensstämmelse med beskrivningen av receptorytan. Det ömsesidiga beroendet mellan de två ytorna utgör en formmatchningsbeskrivning som kan hjälpa till att detektera olika positioner av liganden. Ett annat tillvägagångssätt är att beskriva de hydrofoba egenskaperna hos ett protein med hjälp av rotationer i ryggradsatomerna . Ett annat tillvägagångssätt kan baseras på Fouriertransformen [22] [23] [24] .
I detta tillvägagångssätt separeras proteinet och liganden på ett visst fysiskt avstånd, och liganden hittar sin position i proteinets aktiva plats efter ett visst antal "steg". Stegen inkluderar stela kroppstransformationer såsom translation och rotation , såväl som interna förändringar av ligandstrukturen, inklusive vinkelrotationer. Vart och ett av dessa steg i rymden förändrar systemets totala energiuppskattning, och därför beräknas den efter varje drag. Den uppenbara fördelen med denna metod är att den tillåter ligandens flexibilitet att utforskas under simulering, medan formrelationsmetoderna måste använda någon annan metod för att lära sig om ligandens rörlighet. En annan fördel är att processen är fysiskt närmare vad som faktiskt händer när proteinet och liganden närmar sig varandra efter molekylär igenkänning. Nackdelen med denna teknik är att det tar tid att utvärdera den optimala dockningslösningen, eftersom det är nödvändigt att utforska ett ganska stort energilandskap [1] .
Det första som behövs för att screena molekyler genom dockning är strukturen hos proteinet av intresse. Vanligtvis bestäms strukturen med biofysiska metoder ( röntgendiffraktionsanalys eller NMR-spektroskopi ), den kan också erhållas genom homologimodellering . Proteinstrukturen, tillsammans med en databas med potentiella ligander, fungerar som input till dockningsprogrammet. Framgången med dockning beror på två komponenter: sökalgoritmen och utvärderingsfunktionen [4] .
Framgångsrik dockning kräver två villkor [25] :
I många fall, t.ex. antikroppar och kompetitiva inhibitorer , är bindningsstället känt. I andra fall kan bindningsstället bestämmas från mutagenes eller fylogeni . Konfigurationer där proteinatomer överlappar varandra (den så kallade flare, från engelska clash ) är alltid uteslutna [26] .
Efter att ha sålt ut komplex med bloss, mäts energin i varje struktur (komplex modell) med hjälp av den så kallade hastighetsfunktionen (utvärdering). Den senare måste särskilja en "pålitlig" struktur över minst 100 000 alternativ. Detta är ett komplext beräkningsproblem, så många metoder har utvecklats för att lösa det. Algoritmer kan delas in i deterministiska och stokastiska [4] .
Från en matematisk synvinkel är dockning ett sökande efter det globala minimumet av den fria energifunktionen , givet på ett flerdimensionellt utrymme av alla möjliga sätt att binda en ligand till ett protein. Sökutrymmet består i teorin av alla möjliga positioner i rymden och konformationer av proteinet associerat med liganden. Men i praktiken, med de tillgängliga beräkningsresurserna, är det omöjligt att helt utforska sökutrymmet - detta skulle kräva beräkning av alla möjliga förskjutningar av varje molekyl (molekyler är dynamiska och existerar som en ensemble av konformationstillstånd) och alla rotations- och positionella positioner för liganden i förhållande till proteinet vid en given detaljnivå. De flesta dockningsprogram tar hänsyn till hela konformationsutrymmet av varianter för en ligand (en "flexibel" ligand), och vissa försöker också modellera ett "flexibelt" receptorprotein. Varje fast position för detta par i rymden kallas en dockningslösning [27] .
Algoritmer för att hitta den bästa bindningen kan delas in i följande kategorier: systematiska metoder, slumpmässiga eller stokastiska heuristiska metoder, molekylära dynamikmetoder och termodynamiska metoder [28] .
Metoder som garanterar att hitta det globala minimumet i ett ändligt antal steg är systematiska metoder, det vill säga metoder för sekventiell uppräkning av alla möjliga positioner av liganden i det aktiva mitten av målproteinet. Men på grund av det stora antalet beräkningar som krävs kräver denna metod införandet av betydande förenklingar. Det finns andra globala optimeringsmetoder som inte garanterat hittar det globala minimumet i ett ändligt antal programsteg, men i praktiken visar de sig kunna hitta sådana minima mycket snabbare än systematiska uppräkningsmetoder. Sådana metoder kan delas in i två stora grupper: heuristiska och termodynamiska [29] .
Heuristiska metoder använder några empiriska strategier för att hitta det globala minimumet, vilket påskyndar proceduren jämfört med enkel skanning av hyperytan. De mest kända och populära är följande heuristiska metoder [28] :
Termodynamiska metoder inkluderar glödgningsmodellering .
I metoder av Monte Carlo-typ förfinas den initiala konfigurationen genom att acceptera eller förkasta steg (iterativa ändringar av någon uppsättning parametrar), beroende på värdet av utvärderingsfunktionen (d.v.s. strukturpoäng) (se Metropolis-kriteriet ), tills en ett visst antal steg har tagits. Det antas att konvergensen till den bästa strukturen kommer från en stor klass av initiala, varav endast en behöver beaktas. De initiala strukturerna kan analyseras mycket snabbare med "grova" ( grova ) metoder . Det är svårt att hitta en poängfunktion som både skulle särskilja en "bra" struktur väl och konvergera med den från ett stort avstånd (i det samplade utrymmet). Därför föreslogs att man skulle använda två approximationsnivåer ("grov" och "exakt") med olika utvärderingsfunktioner. Rotation kan införas i Monte Carlo som en extra parameter för steg [34] .
Monte Carlo-metoder är stokastiska och garanterar inte en uttömmande sökning, därför kan den bästa konfigurationen missas även när man använder estimatorn, som i teorin skiljer den åt. Hur allvarligt detta problem påverkar resultaten av dockning har ännu inte klarlagts [34] .
Detta tillvägagångssätt är implementerat i RosettaDock- algoritmen . Rossetta Commons . Hämtad 27 april 2020. [35] .
Som ett resultat av dockning genereras ett stort antal potentiella ligandpositioner, av vilka några omedelbart avvisas på grund av kollisioner med proteinmolekylen. Resten utvärderas med hjälp av en poängfunktion som tar det aktuella dockningsbeslutet som indata och returnerar ett tal som indikerar sannolikheten att dockningsbeslutet representerar en gynnsam bindande interaktion. Således kan bindningseffektiviteten för en ligand i förhållande till en annan bedömas [4] .
I moderna dockningsalgoritmer kan tre huvudtyper av utvärderingsfunktioner särskiljas: kraftfältsbaserad, empirisk och statistisk.
De flesta poängfunktioner är baserade på fysik av molekylär mekanik kraftfält , som uppskattar energin hos en dockningslösning inom ett bindningsställe. Olika bidrag till dockningslösningens energi kan skrivas som en ekvation [4] :
Komponenterna i ekvationen inkluderar lösningsmedelseffekter, konformationsförändringar i proteinet och liganden, fri energi på grund av protein-ligand-interaktioner, interna rotationer, associationsenergi för liganden och receptorn för att bilda ett enda komplex, och fri energi på grund av förändringar i vibration. lägen. En låg (negativ) energi indikerar ett stabilt system och därmed en trolig bindningsinteraktion [36] .
Empiriska utvärderingsfunktioner, till skillnad från de som baseras på kraftfält, inkluderar komponenter som beskriver intermolekylära kontakter på ett enklare sätt. Det finns inga direkta analogier med parvisa intermolekylära fysiska interaktioner i detta fall. Förutsägelseförmågan hos ett sådant tillvägagångssätt är starkt beroende av både komponenterna själva och koefficienterna med vilka de går in i ekvationen. Intermolekylära interaktioner presenteras som en linjär kombination av termer som beskriver olika typer av kontakter: vätebindningar, hydrofoba interaktioner, interaktioner med metalljoner och andra. Förenkling, till exempel, för koordinationsbindningar med metalljoner eller hydrofoba kontakter, består i deras beskrivning med användning av avstånden mellan motsvarande atomer i liganden och receptorn, dock är en sådan approximation inte fysiskt korrekt. Vätebindningar beskrivs av empiriska geometriska parametrar (avståndet mellan donator och acceptor och vinkeln mellan dem och väteatomen), och inte av deras energiegenskaper [37] .
Ett alternativt tillvägagångssätt genom statistiska poängfunktioner är att erhålla en kunskapsbaserad statistisk potential för interaktioner från PDB -databasen över protein-ligandkomplex , och utvärdera passformen av dockningslösningen enligt den uppskattade potentialen [38] .
Det finns många program för teoretisk dockning av proteiner. Det mesta fungerar så här: ett protein är fixerat i rymden och det andra roterar runt det. I detta fall, för varje konfiguration av svängar, görs utvärderingsberäkningar enligt utvärderingsfunktionen. Utvärderingsfunktionen är baserad på ytkomplementaritet, elektrostatiska interaktioner, van der Waals repulsion och så vidare. Problemet med denna sökning är att beräkningar över hela konfigurationsutrymmet tar lång tid att beräkna, vilket sällan leder till en enda lösning [39] .
Ofullkomligheten i utvärderingsfunktionen leder oundvikligen till behovet av att utvärdera prediktionsförmågan hos en viss dockningsalgoritm (till exempel AutoDock, ICM). Detta kräver ytterligare experimentella data, såsom en referensstruktur. Utvärderingen kan utföras på flera sätt [4] :
Dockningsnoggrannhet [ 40] är en av bedömningarna av tillämpligheten av en algoritm, förmågan hos en algoritm att reproducera experimentella data.
Anrikningsfaktor uppskattas som algoritmens förmåga att särskilja (representerar i toppen av de bästa) "sanna" ligander från "falskt" i provet, där antalet "falskt" är mycket större än antalet "sant" . "Sant" hänvisar till ligander vars bindning har bevisats experimentellt, och "falsk" hänvisar till ligander vars bindning inte har bevisats. Analysen av metodens ROC- kurva utförs ofta [41] .
Dockningsprogrammens förmåga att reproducera strukturer som erhållits genom röntgendiffraktionsanalys kan bedömas genom ett antal benchmarkingmetoder [ 42] .
När det gäller små molekyler kan speciella referensuppsättningar som innehåller experimentella data tas för jämförande analys. Till exempel Astex Diverse Set [43] som innehåller strukturer av proteiner med ligander erhållna med röntgendiffraktionsanalys eller Directory of Useful Decoys (DUD) [44] metoden .
När det gäller peptiddockning kan Lessons for Efficiency Assessment of Docking and Scoring (LEADS-PEP) [45] användas .
På senare tid har fler och fler vetenskapliga artiklar ägnas åt virtuell screening och dockning dykt upp. Men lita inte blint på deras resultat. Några av de vanligaste frågorna från forskare inkluderar:
Med den snabba utvecklingen av ett stort antal olika algoritmer finns också problemet med att välja den lämpligaste algoritmen. Den bästa urvalsstrategin är att hitta den algoritm som testades på ett lämpligt urval för uppgiften och visade optimala värden [47] .
Inom biologin äger ett stort antal biokemiska processer rum på makromolekylär nivå . Processerna förmedlas av protein-protein- och protein -nukleinsyrainteraktioner . För att studera denna typ av interaktioner används makromolekylär dockning. Denna metod gör det möjligt att förutsäga den tredimensionella strukturen av det studerade komplexet i den naturliga miljön. Liksom molekylär dockning är resultatet av studien en uppsättning modeller av komplexet (strukturerna), som rankas ytterligare baserat på den uppskattade (poäng, poäng, poäng) funktion [48] .
Denna metod tillåter att lösa ett större antal biologiska problem [49] .