Makromolekylär dockning

Makromolekylär dockning  är en metod för molekylär modellering av den kvartära strukturen av komplex som bildas av två eller flera interagerande biologiska makromolekyler . Oftast studeras protein-proteinkomplex , mer sällan - protein- nukleinkomplex .

Det slutliga målet med dockning är att förutsäga den tredimensionella strukturen av det studerade makromolekylära komplexet i den naturliga miljön. Resultatet av dockning är en uppsättning modeller av komplexet (strukturerna). De kan rangordnas med olika metoder, såsom en utvärderingsfunktion (poäng, poäng, poäng) för att välja den mest troliga (mer sannolikt att förekomma i kroppen).

Termen "dockning" eller "dockning" dök upp i slutet av 1970-talet i betydelsen att modellera dockningen av två molekyler, där orienteringen av den senare inte ändrades (endast läget ändrades). Med ökningen av datorkraften blev det möjligt att tillåta en förändring av partnernas orientering, detta dockningsalternativ kallas "rigid docking" eller rigid body docking ("rigid body"). Nästa steg var övergången till "flexibel dockning", där partnernas interna geometri (konformation) förändras.

Inledning

De biologiska rollerna för de flesta proteiner, beskrivna av vilka molekyler de kan interagera med, är i bästa fall kända, åtminstone ofullständigt. Även proteiner involverade i väl studerade biologiska processer (t.ex. TCA ) kan ha oväntade interaktanter eller nya biologiska funktioner.

När det gäller protein-protein-interaktioner uppstår ytterligare frågor. Man tror att genetiska sjukdomar (t.ex. cystisk fibros ) orsakas av felveckade ( muterade ) proteiner och det finns en önskan att förstå vilka onormala protein-proteininteraktioner som kan orsakas av en viss mutation . Om det i framtiden blir möjligt att designa proteiner för att utföra biologiska funktioner, kommer det att vara viktigt att fastställa omfattningen av deras möjliga interaktioner.

För en viss uppsättning proteiner kan följande problem lösas:

Om de ansluter

Om de inte ansluter,

Protein-protein dockning kan användas för att lösa dessa problem.

Dessutom kan dockning hjälpa till att studera proteiner med okänd funktion (ett relativt understuderat område). Om det inte finns någon modell för rumslig struktur kan den modelleras (se förutsägelse av proteinstruktur ).

Protein-nukleinsyrainteraktioner spelar en viktig roll i en levande cell. Transkriptionsfaktorer reglerar genuttrycket och polymeraser som replikerar är proteinkomplex och det genetiska materialet som de binder till består av nukleinsyror . Modellering av protein-nukleinsyrainteraktioner har vissa svårigheter, vilka beskrivs nedan.

Historik

På 1970-talet bestod komplex modellering av att manuellt identifiera element på ytorna av interaktanter (partners) och tolka implikationerna för bindning, funktion och aktivitet; alla datorprogram användes vanligtvis i slutet av simuleringsprocessen för att skilja mellan de relativt få konfigurationer som återstod efter att alla heuristiska begränsningar hade tillämpats. För första gången användes datorer i studien av interaktionen mellan hemoglobin i sicklecellfibrer. [1] Sedan, 1978, dök arbete upp med trypsin - aprotininkomplexet . [2] Datorer har använts för att skilja mellan "dåliga" och "bra" modeller, genom en poängfunktion. En stor gränsyta (bindningsyta) "belönades" och straff utdömdes för överlappande områden. Datorn använde en förenklad representation av interagerande proteiner: varje rest representerades som ett enda bindningsställe. Elektrostatiska interaktioner såsom vätebindningar har analyserats för hand.

I början av 1990-talet hade mer komplexa strukturer definierats, medan den tillgängliga beräkningskraften hade ökat avsevärt. Med tillkomsten av bioinformatik har fokus legat på att utveckla metoder som är tillämpliga på godtyckliga interaktanter till rimliga beräkningskostnader och i avsaknad av ytterligare fylogenetiska eller experimentella data.

1992 publicerades en metod [3] som använde den snabba Fouriertransformen. I denna metod fanns det en "grov" representation av dockningspartnerna: i form av tredimensionella matriser, vars nummer motsvarade atomernas positioner. Snabb Fourier-transform hjälpte till att hitta platsen för dessa matriser som motsvarar kontakten mellan partners mycket snabbare än andra dockningsmetoder. 1997 började denna metod ta hänsyn till elektrostatiska interaktioner.

1996 publicerades resultaten av den första studien [4] , där sex forskargrupper försökte förutsäga strukturen av TEM-1-beta-laktamaskomplexet med beta-laktamasinhibitorprotein (BLIP). Studien noterade behovet av att ta hänsyn till konformationsförändringar och svårigheten att särskilja konformer.

Metoder

Den grundläggande mekanismen för dockning liknar molekylär dockning . Metoder av Monte Carlo-typ används också , där den initiala konfigurationen förfinas under iterativa ändringar i uppsättningen parametrar. Vid varje steg accepteras eller avvisas konfigurationen baserat på värdet på utvärderingsfunktionen.

Går till ömsesidigt utrymme

Vart och ett av proteinerna kan representeras som ett enkelt kubiskt gitter. För komplexa modeller som översätts till varandra genom att ändra proteinets position kan en viss utvärderingsfunktion nästan omedelbart beräknas med hjälp av faltningssatsen . Det är möjligt att konstruera meningsfulla, om än ungefärliga, "falsade" poängfunktioner som tar hänsyn till både stereokemiska och elektrostatiska interaktioner.

Ömsesidiga rymdmetoder har använts i stor utsträckning på grund av deras förmåga att utvärdera ett stort antal strukturer. De förlorar sin hastighetsfördel om vridningsförändringar äger rum. En annan nackdel är att det är omöjligt att effektivt använda den samlade kunskapen. Frågan kvarstår också om denna metod inte är tillräckligt exakt för att på ett tillförlitligt sätt avslöja strukturen för det bästa komplexet.

Utvärderingsfunktioner (poängfunktioner)

För att söka efter en poäng (någon indikator) som gör det möjligt att urskilja de bästa modellerna utvecklades ett speciellt testprov (Benchmark, se nedan) av protein-proteinstrukturer. Poängen rankas efter den rangordning de ger den bästa strukturen (helst bör rangordning efter poäng ta den "experimentella" bästa strukturen till toppen) och efter deras täckning (andelen kontrollfall för vilka de uppnår ett acceptabelt resultat). Poäng är indelade i flera kategorier, inklusive:

Vanligtvis skapas hybridpoäng (poängfunktionerna själva) genom att kombinera en eller flera av ovanstående kategorier (nedan kallade "termerna" för poängfunktionen) till en viktad summa, vars vikter optimeras med hjälp av testprover ( de så kallade Benchmarks). För att undvika fördomar bör testmodellerna som används för att optimera vikterna inte överlappa de testmodeller som används för det slutliga testet av hybridpoängen.

I problemet med protein-protein dockning är det viktigt att hitta en poängfunktion som på ett tillförlitligt sätt återspeglar information om partners affinitet. En sådan egenskap skulle avsevärt påskynda utvecklingen av in silico protein engineering , läkemedelsutveckling och high-throughput annotering av interaktomen (dvs vilka proteiner som binder och vilka inte). Många poängfunktioner har föreslagits för att utvärdera bindningsaffinitet/fri energi. [5] [6] [7] [8] [9] Korrelationen mellan den experimentellt bestämda bindningsaffiniteten och förutsägelserna av nio populära poängfunktioner visade sig dock vara nästan ortogonal (R 2 ~ 0). [10] [11] Det har också observerats att vissa termer korrelerar bättre med de experimentella bindningsenergierna än den fullständiga uppskattningen, vilket tyder på att det är möjligt att hitta och förbättra poängfunktionen genom att se över vikterna av dess komponenter (termer). Bland de experimentella metoderna för att bestämma bindningsaffinitet är ytplasmonresonans (SPR), Förster resonansenergiöverföring , metoder som använder radioligander, isotermisk titreringskalorimetri (ITC), mikroskopisk termofores (MST) eller spektroskopiska mätningar och andra fluorescensmetoder. Information från vetenskapliga artiklar kan också vara en bra källa för att förbättra poängsättningen. [12]

Testval (Benchmarks)

För att testa dockningsmetoder gjordes ett testprov (Benchmark) av 84 strukturer av protein-proteinkomplex. [13] Strukturerna i testprovet är speciellt utvalda för att täcka ett brett spektrum av interaktionstyper och är så heterogena som möjligt (innehåller så få repetitiva egenskaper som möjligt, såsom profiler av partnerfamiljer i SCOP-databasen ) . Testelementen är uppdelade i tre komplexitetsnivåer (den svåraste innehåller den största förändringen i ryggradens konformation). Exempel på testmodeller för protein-proteindockning är enzym-inhibitorstrukturer, antigen-antikroppsstrukturer och homomultimera komplex.

Den senaste versionen av riktmärket för dockning av protein-protein består av 230 komplex, [14] och 47 för dockning av DNA-protein [15] Det senaste testsetet för dockning av RNA-protein innehåller 126 element. [16] Det finns samlade testprover med 209 komplex. [17]

Affinitetstestset baserades på protein-protein dockningstestset. [10] Den inkluderade 81 protein-proteinkomplex med experimentellt uppmätta affiniteter. Dessa komplex spänner över 11 storleksordningar i affinitet.

Detta urval granskades ytterligare och utökades avsevärt. [18] Det nya testsetet innehåller proteiner med olika biologiska funktioner. Den består av G-proteiner och extracellulära domäner av receptorer, såväl som antigen/antikropp, enzym/inhibitor och enzym/substratkomplex. Det är också mångsidigt när det gäller partneraffinitet för varandra, med Kd som sträcker sig från 10 −5 till 10 −14 M. De nio elementen är närbesläktade komplex som har en liknande struktur men mycket olika affiniteter. Eftersom strukturerna för komponenterna i komplexet är kända separat, är det möjligt att utvärdera förändringar i partnernas konformation under dess bildande. I de flesta komplex är de mycket betydelsefulla. Detta testset kan också användas för biofysikaliska modeller som syftar till att fastställa sambandet mellan affinitet och struktur i protein-protein-interaktioner, med hänsyn till data om reagenserna och deras konformationsförändringar, och inte bara på produkten (komplexet). [arton]

CAPRI

CAPRI (Critical Assessment of PRediction of Interactions) [19]  är ett regelbundet evenemang under vilket forskare runt om i världen bjuds in att erhålla strukturen av ett protein-proteinkomplex om bara strukturerna av reagenser ges genom dockning. Evenemang (omgångar) äger rum ungefär var sjätte månad. Under varje omgång får deltagaren strukturerna för reagenserna i komplexet, vars struktur nyligen bestämdes experimentellt. Koordinaterna för komplexet hålls hemliga. CAPRI-utvärderingen är dubbelblind , eftersom deltagarna inte känner till komplexets struktur och arrangörerna inte vet vem av deltagarna som föreslog en viss modell av komplexet.

För närvarande vinner CAPRI popularitet (37 grupper deltog världen över i den sjunde omgången). Även om resultaten av CAPRI är av liten statistisk signifikans på grund av det lilla antalet mål i varje omgång, är CAPRIs roll ganska betydande. CASP - poängen är en liknande övning i förutsägelse av proteinstruktur.

Se även

Anteckningar

  1. C. Levinthal, S. J. Wodak, P. Kahn, A. K. Dadivanian. Hemoglobininteraktion i sicklecellfibrer. I: Teoretiska förhållningssätt till de molekylära kontakterna.  (engelska)  // Proceedings of the National Academy of Sciences . - National Academy of Sciences , 1975-04-01. — Vol. 72 , iss. 4 . - P. 1330-1334 . - ISSN 1091-6490 0027-8424, 1091-6490 . - doi : 10.1073/pnas.72.4.1330 .
  2. Shoshana J. Wodak, Joel Janin. Datoranalys av protein-proteininteraktion  // Journal of Molecular Biology. — 1978-09. - T. 124 , nr. 2 . - S. 323-342 . — ISSN 0022-2836 . - doi : 10.1016/0022-2836(78)90302-9 .
  3. E. Katchalski-Katzir, I. Shariv, M. Eisenstein, A.A. Friesem, C. Aflalo. Molekylär ytigenkänning: bestämning av geometrisk passning mellan proteiner och deras ligander genom korrelationstekniker.  (engelska)  // Proceedings of the National Academy of Sciences . - National Academy of Sciences , 1992-03-15. — Vol. 89 , iss. 6 . - P. 2195-2199 . - ISSN 1091-6490 0027-8424, 1091-6490 . - doi : 10.1073/pnas.89.6.2195 .
  4. NCJ Strynadka, M. Eisenstein, E. Katchalski-Katzir, BK Shoichet, ID Kuntz. Molekylära dockningsprogram förutsäger framgångsrikt bindningen av ett β-laktamasinhiberande protein till TEM-1 β-laktamas  // Nature Structural Biology. — 1996-03. - T. 3 , nej. 3 . - S. 233-239 . — ISSN 1072-8368 . doi : 10.1038 / nsb0396-233 .
  5. Gray JJ, Moughon S, Wang C, Schueler-Furman O, Kuhlman B, Rohl CA, Baker D (2003). "Protein-protein dockning med samtidig optimering av styv kroppsförskjutning och sidokedjekonformationer". J. Mol. biol . 331 (1): 281-299. DOI : 10.1016/S0022-2836(03)00670-3 . PMID  12875852 .
  6. Camacho CJ, Vajda S. Proteindockning längs smidiga associationsvägar  // Proceedings of the National Academy of Sciences of the United States of America  : journal  . - 2008. - Vol. 98 , nr. 19 . - P. 10636-10641 . - doi : 10.1073/pnas.181147798 . — PMID 11517309 .
  7. Camacho CJ, Vajda S. In silicoscreening av mutationseffekter på enzym-proteininhibitoraffinitet: en dockningsbaserad strategi  //  BMC Structural Biology : journal. - 2007. - Vol. 7 . — S. 37 . - doi : 10.1186/1472-6807-7-37 . — PMID 17559675 .
  8. Zhang C., Liu S., Zhu Q., Zhou Y. En kunskapsbaserad energifunktion för protein-ligand-, protein-protein- och protein-DNA-komplex  (engelska)  // Journal of Medicinal Chemistry : journal. - 2005. - Vol. 48 , nr. 7 . - P. 2325-2335 . - doi : 10.1021/jm049314d . — PMID 15801826 .
  9. Esmaielbeiki R., Nebel JC Scoring av dockningskonformationer med hjälp av förutspådda proteingränssnitt  //  BMC Bioinformatics : journal. - 2014. - Vol. 15 . — S. 171 . - doi : 10.1186/1471-2105-15-171 . — PMID 24906633 .
  10. 1 2 Kastritis PL, Bonvin AM Är poängfunktioner i protein-protein dockning redo att förutsäga interaktomer? Ledtrådar från ett nytt riktmärke för bindningsaffinitet  //  J. Proteome Res. : journal. - 2010. - Maj ( vol. 9 , nr 5 ). - P. 2216-2225 . - doi : 10.1021/pr9009854 . — PMID 20329755 .
  11. Rosato A., Fuentes G., Verma C. Fakulteten för 1000 biologi: utvärderingar för Kastritis PL & Bonvin AM J Proteome Res 2010 maj 7 9 (5) :2216-25  //  Faculty of 1000 Biology : journal . - 2010. - Vol. 9 , nej. 5 . - P. 2216-2225 . - doi : 10.1021/pr9009854 . — PMID 20329755 .
  12. Badal, VD, Kundrotas, PJ, Vakser, IA Naturlig språkbehandling i text för strukturell modellering av proteinkomplexbrytning   // BMC Bioinformatics : journal. - 2018. - Vol. 19 , nr. 1 . - S. 84 . - doi : 10.1186/s12859-018-2079-4 . — PMID 29506465 .
  13. Mintseris J., Wiehe K., Pierce B., Anderson R., Chen R., Janin J., Weng Z. Protein-Protein Docking Benchmark 2.0: an update  (neopr.)  // Proteins. - 2005. - T. 60 , nr 2 . - S. 214-216 . - doi : 10.1002/prot.20560 . — PMID 15981264 .
  14. Vreven T., Moal IH, Vangone A., Pierce BG, Kastritis PL, Torchala M., Chaleil R., Jiménez-García B., Bates PA, Fernandez-Recio J., Bonvin AM, Weng Z. Uppdateringar till Benchmarks för integrerad protein-proteininteraktion: Docking benchmark version 5 och affinity benchmark version 2  //  Journal of Molecular Biology : journal. - 2015. - September ( vol. 427 , nr 19 ). - P. 3031-3041 . - doi : 10.1016/j.jmb.2015.07.016 . — PMID 26231283 .
  15. van Dijk M., Bonvin AM Ett protein-DNA-dockningsriktmärke  //  Nucleic Acids Research : journal. - 2008. - Augusti ( vol. 36 , nr 14 ). — P.e88 . - doi : 10.1093/nar/gkn386 . — PMID 18583363 .
  16. Nithin C., Mukherjee S., Bahadur RP En icke-redundant protein-RNA dockningsbenchmark version 2.0  //  Proteins : journal. - 2016. - November ( vol. 85 , nr 2 ). - s. 256-267 . - doi : 10.1002/prot.25211 . — PMID 27862282 .
  17. Nithin, Chandran; Ghosh, Pritha; Bujnicki, Janusz; Nithin, Chandran; Ghosh, Pritha; Bujnicki, Janusz M. Bioinformatikverktyg och riktmärken för beräkningsdockning och 3D-strukturförutsägelse av RNA-proteinkomplex  (engelska)  // Gener : journal. - 2018. - 25 augusti ( vol. 9 , nr 9 ). - S. 432 . - doi : 10.3390/gener9090432 . — PMID 30149645 .
  18. 1 2 Kastritis PL, Moal IH, Hwang H., Weng Z., Bates PA, Bonvin AM, Janin J. Ett strukturbaserat riktmärke för protein-proteinbindningsaffinitet  //  Protein Science : journal. - 2011. - Mars ( vol. 20 , nr 3 ). - s. 482-491 . - doi : 10.1002/pro.580 . — PMID 21213247 .
  19. Janin J., Henrick K., Moult J., Eyck LT, Sternberg MJ, Vajda S., Vakser I., Wodak SJ CAPRI: a Critical Assessment of Predicted Interactions  //  Proteins : journal. - 2003. - Vol. 52 , nr. 1 . - S. 2-9 . - doi : 10.1002/prot.10381 . — PMID 12784359 .