Rosetta@home | |
---|---|
| |
Sorts | Protein Structure Prediction , Volunteer Computing och Berkeley Open Infrastructure for Network Computing-projekt [d] |
Utvecklaren | Baker laboratory , University of Washington , Rosetta Commons |
Operativ system | Programvara för flera plattformar |
Första upplagan | 6 oktober 2005 |
Hårdvaruplattform | BOINC |
senaste versionen | Rosetta Mini: 3,71 [1] ( 20 januari 2016 ) |
stat | Aktiva |
Licens | Gratis för akademisk och ideell användning, proprietär licens tillgänglig för kommersiellt bruk [2] |
Hemsida | boinc.bakerlab.org/roset... |
Mediafiler på Wikimedia Commons |
Rosetta@home | |
---|---|
Plattform | BOINC |
Storlek för nedladdning av programvara | 48 MB |
Job Data Loaded Storlek | 2,5 MB |
Mängd jobbdata som skickats | 6-150 KB |
Diskutrymme _ | 130 MB |
Använd mängd minne | 255 MB |
GUI | det finns |
Genomsnittlig tid för uppgiftsberäkning | 0,5 - 10 timmar (tidskontroll möjlig) |
deadline | 10 dagar |
Möjlighet att använda GPU | Nej |
Mediafiler på Wikimedia Commons |
Rosetta@Home är ett frivilligt datorprojekt som syftar till att lösa ett av de största problemen inom molekylärbiologi - att beräkna den tertiära strukturen hos proteiner utifrån deras aminosyrasekvenser . Tack vare det avslutade Human Genome Project är aminosyrasekvenserna för alla proteiner i människokroppen kända. Forskning inom detta projekt kommer också att hjälpa till med utformningen av nya, icke-existerande proteiner. Medan mycket av projektet fokuserar på grundforskning för att förbättra noggrannheten och robustheten hos proteomikmetoder, främjar Rosetta@home också tillämpad forskning för att bekämpa sjukdomar som cancer , malaria , Alzheimers , mjältbrand och andra genetiska och virussjukdomar [3] . Foldit är ett videospel från Rosetta@Home som syftar till att uppnå målen för projektet med en crowdsourcad strategi.
Rosetta@Home beräkningsresultat är inte direkt tillgängliga. Du kan inte heller använda resultaten av beräkningar av din egen dator. [4] De används dock för ett stort antal vetenskapliga publikationer. [5]
I huvudsak är Rosetta ett datorprogram vars huvuduppgifter är:
Det här projektet använder förutsägelse och resultatfeedback för att förbättra potentiella sökfunktioner och algoritmer .
Rosetta@home-appen och BOINC Distributed Computing Platform , tillgängliga för operativsystemen Windows, Linux och macOS; BOINC körs också på flera andra, som FreeBSD. Deltagande i Rosetta@home kräver en centralprocessor (CPU) med en klockhastighet på minst 500 MHz, 200 megabyte ledigt diskutrymme, 512 megabyte fysiskt minne och en internetanslutning. Från och med den 27 juni 2020 är den nuvarande versionen av Rosetta Mini-appen 4.20. Den aktuella rekommenderade versionen av BOINC-programvaran är 7.16.7. Standard Hypertext Transfer Protocol (HTTP) (port 80) används för kommunikation mellan användarens BOINC-klient och Rosetta@home-servrarna vid University of Washington ; HTTPS (port 443) används vid lösenordsutbyte. Fjärr- och lokalhantering av BOINC-klienten använder port 31416 och port 1043, som specifikt kan avblockeras om de ligger bakom en brandvägg. Arbetsenheter som innehåller data om enskilda proteiner distribueras från servrar som finns i Baker Lab vid University of Washington till frivilliga datorer, som sedan beräknar en strukturförutsägelse för det tilldelade proteinet. För att undvika repetitiva strukturförutsägelser för ett givet protein initieras varje arbetsblock med ett slumpmässigt antal frön. Detta ger varje förutsägelse en unik bana att gå ner genom proteinets energilandskap. Proteinstrukturförutsägelser från Rosetta@home är ungefärliga värden för det globala minimumet i ett givet proteins energilandskap. Detta globala minimum representerar den mest energimässigt gynnsamma proteinkonformationen, det vill säga dess ursprungliga tillstånd.
Huvudfunktionen i Rosetta@home grafiska användargränssnittet (GUI) är en skärmsläckare som visar det aktuella tillståndet för den löpande modulen under proteinveckningssimulering. Det övre vänstra hörnet av den aktuella startskärmen visar målproteinet som antar olika former (konformationer) i sitt sökande efter den lägsta energistrukturen. Omedelbart till höger är strukturen för den senast mottagna. Det övre högra hörnet visar den lägsta energikonformationen för den nuvarande layouten; nedan är den sanna eller naturliga strukturen för proteinet om det redan har bestämts. Tre diagram ingår i startskärmen. Nära mitten visas ett diagram för den termodynamiska fria energin för den accepterade modellen, som fluktuerar när den accepterade modellen ändras. Den accepterade modellens standardavvikelse (RMSD), som mäter hur strukturellt lik den accepterade modellen är den ursprungliga modellen, visas till höger. Till höger om det mottagna energidiagrammet och under RMSD-diagrammet används resultaten av dessa två funktioner för att plotta energin kontra RMSD när modellen gradvis förfinas.
Som alla BOINC-projekt körs Rosetta@home i bakgrunden på användarens dator, med ström från den vilande datorn, under eller innan du loggar in på ett konto på värdens operativsystem . Programmet släpper resurser från processorn när andra applikationer behöver dem, vilket inte påverkar den normala användningen av datorn. Många programalternativ kan ställas in genom användarkontoinställningar, inklusive: den maximala procentandelen CPU-resurser som programmet kan använda (för att kontrollera strömförbrukningen eller generera värme från en dator som körs med konstant effekt), den tid på dygnet som programmet kan köras och mer andra.
Rosetta, programvaran som körs på Rosetta@home-nätverket, har skrivits om i C++ för att göra det lättare att utveckla än vad som var tillåtet av dess ursprungliga version skriven i Fortran. Den här nya versionen är objektorienterad och släpptes den 8 februari 2008. Rosetta kodutveckling utförs av Rosetta Commons. Programvaran är fritt licensierad till den akademiska världen och är tillgänglig för läkemedelsföretag mot en avgift.
Med spridningen av genomsekvenseringsprojekt kan forskare härleda aminosyrasekvensen eller primärstrukturen hos många proteiner som utför funktioner i en cell. För att bättre förstå proteinfunktion och hjälpa till med rationell läkemedelsdesign behöver forskare känna till proteinets tredimensionella tertiära struktur.
Protein tredimensionella strukturer bestäms för närvarande experimentellt med hjälp av röntgenkristallografi eller kärnmagnetisk resonans (NMR) spektroskopi. Processen är långsam (det kan ta veckor eller till och med månader att ta reda på hur man kristalliserar ett protein för första gången) och kostsamt (cirka 100 000 USD per protein). Tyvärr överstiger hastigheten med vilken nya sekvenser upptäcks vida den för strukturbestämning - av de mer än 7 400 000 proteinsekvenser som finns tillgängliga i National Center for Biotechnology Information (NCBI) oreducerad (nr) proteindatabas, finns det färre än 52 000 tredimensionella proteinstrukturer har lösts och placerats i Protein Data Bank, huvudförvaret för strukturell information om proteiner [6] . Ett av huvudmålen med Rosetta@home är att förutsäga proteinstrukturer med samma noggrannhet som befintliga metoder, men på ett sätt som kräver betydligt mindre tid och pengar. Rosetta@home utvecklar även metoder för att bestämma strukturen och dockningen av membranproteiner (t.ex. G-proteinkopplade receptorer (GPCR)), som är extremt svåra att analysera med traditionella metoder som röntgenkristallografi och NMR-spektroskopi, men som representerar majoriteten av målen för moderna läkemedel.
Framsteg i förutsägelse av proteinstruktur mäts i det tvååriga experimentet Critical Assessment for Protein Structure Prediction (CASP), där forskare från hela världen försöker härleda proteinstruktur från aminosyrasekvensen i ett protein. De högpresterande grupperna i detta ibland konkurrensutsatta experiment anses vara de facto-standarden för vad som är det senaste inom förutsägelse av proteinstruktur. Rosetta, programmet som Rosetta @ home är baserat på, användes med CASP5 2002. I 2004 års CASP6-experiment skapade Rosetta historia genom att vara den första att uppnå nära atomär upplösning ab initio proteinstrukturförutsägelse i sin presenterade modell för CASP-målet T0281. Ab initio- modellering anses vara en särskilt utmanande kategori av proteinstrukturförutsägelse eftersom den inte använder information från strukturell homologi och måste förlita sig på information från sekvenshomologi och modellering av fysiska interaktioner inom proteinet. Rosetta@home har använts i CASP sedan 2006, där det var en av de främsta prediktorerna i varje strukturell förutsägelsekategori i CASP7. Dessa högkvalitativa förutsägelser drevs av datorkraft från Rosetta@home-volontärer. Ökad datorkraft gör att Rosetta@home kan välja ut fler regioner av konformationsutrymme (möjliga former som ett protein kan ta) som enligt Levinthals Paradox förutspås växa exponentiellt med proteinlängden.
Rosetta@home används också i protein-protein dockningsförutsägelse, som bestämmer strukturen av flera komplexa proteiner, eller kvartär struktur. Denna typ av proteininteraktion påverkar många cellulära funktioner, inklusive antigen-antikroppsbindning och enzyminhibitorbindning, såväl som import och export av celler. Att fastställa dessa interaktioner är avgörande för läkemedelsutveckling. Rosetta används i experimentet Critical Interaction Prediction Evaluation (CAPRI), som utvärderar tillståndet för ett proteins dockningsfält, liknande hur CASP mäter framsteg i förutsägelse av proteinstruktur. Datorkraften som tillhandahålls av volontärerna i Rosetta@home-projektet citerades som en av de främsta drivkrafterna för Rosettas prestation på CAPRI, där dess dockningsförutsägelser var bland de mest exakta och kompletta.
I början av 2008 användes Rosetta för att beräkningsmässigt utforma ett protein med en funktion som inte tidigare setts i naturen. Detta var delvis inspirerat av en förkortning av en berömd artikel från 2004 som ursprungligen beskrev beräkningsdesignen av ett protein med förbättrad enzymaktivitet jämfört med dess naturliga form. En forskningsartikel från 2008 från David Bakers grupp som beskriver hur proteinet tillverkades, där Rosetta@home hänvisar till de beräkningsresurser han gjort tillgängliga, är ett viktigt bevis på konceptet för denna proteintekniksmetod. Denna typ av proteindesign kan ha framtida tillämpningar för läkemedelsupptäckt, grön kemi och bioremediering.
En komponent i Rosettas mjukvarupaket, RosettaDesign, har använts för att exakt förutsäga vilka regioner av amyloidogena proteiner som mest sannolikt bildar amyloidliknande fibriller. Genom att ta hexapeptider (sex aminosyror långa fragment) av ett protein av intresse och välja den lägsta energimatchningen för en struktur som liknar den hos en känd fibrillbildande hexapeptid, kunde RosettaDesign identifiera peptider dubbelt så stor risk att bilda fibriller än slumpmässiga proteiner . Rosetta@home användes i samma studie för att förutsäga strukturer för beta-amyloid, ett fibrillbildande protein som tros orsaka Alzheimers sjukdom. Preliminära men ännu inte publicerade resultat har erhållits för proteiner utvecklade av Rosetta som kan förhindra fibrillerbildning, även om det inte är känt om detta kan förhindra sjukdomen.
En annan komponent i Rosetta, RosettaDock, har använts i samband med experimentella metoder för att modellera interaktioner mellan tre proteiner - dödlig faktor (LF), ödemfaktor (EF) och skyddande antigen (PA) - som utgör mjältbrandstoxin. Datormodellen förutspådde noggrant dockningen mellan LF och PA, vilket hjälpte till att fastställa vilka domäner av respektive proteiner som är involverade i LF-PA-komplexet. Denna förståelse användes så småningom i forskning, vilket resulterade i förbättrade mjältbrandsvacciner.
RosettaDock användes för att modellera dockning mellan en antikropp (immunoglobulin G) och ett ytprotein som uttrycks av herpesviruset, herpes simplex virus 1 (HSV-1), som tjänar till att bryta ned den antivirala antikroppen. Proteinkomplexet som förutspåddes av RosettaDock överensstämde nära med särskilt svåra att erhålla experimentella modeller, vilket fick forskarna att dra slutsatsen att dockningsmetoden kunde lösa några av de problem som röntgenkristallografi har vid modellering av protein-till-protein-gränssnitt.
Genom forskning finansierad av ett anslag på 19,4 miljoner dollar från Bill & Melinda Gates. USA, Rosetta@home har använts i utvecklingen av många möjliga vacciner mot humant immunbristvirus (HIV).
I forskning associerad med initiativet Great Challenges in Global Health har Rosetta använts för att beräkningsmässigt utveckla nya homing-endonukleasproteiner som kan döda Anopheles gambiae eller på annat sätt göra myggan oförmögen att överföra malaria. Förmågan att specifikt modellera och förändra protein-DNA-interaktioner, såsom de för homing-endonukleaser, ger beräkningsmetoder för proteinteknik som Rosetta en viktig roll i genterapi (som inkluderar potentiella cancerbehandlingar).
Baserat på den officiella statistiken för Rosetta@Home [7] -projektdeltagarna, i oktober 2011, var antalet aktiva deltagare 38 tusen personer [8] . I juli 2017 hade projektet cirka 300 000 aktiva användare [9] .
Frivilliga datorprojekt | |
---|---|
Astronomi |
|
Biologi och medicin |
|
kognitiv |
|
Klimat |
|
Matte |
|
Fysiska och tekniska |
|
Multipurpose |
|
Övrig |
|
Verktyg |
|