Föräldralösa gener

Orphan gener ( Orphan gen eller ORF ans, främst i litteraturen om mikrobiologi) [1] [2]  är gener utan funna homologer i andra evolutionära grenarengelska  [2] Föräldralösa barn är en undergrupp av taxonomiskt begränsade gener (TRG) som är unika på en viss taxonomisk nivå (till exempel för en viss växt) [3] . Till skillnad från icke-föräldralösa TRGs, anses föräldralösa i allmänhet vara unika för en mycket smal taxon , mestadels en art.

Den klassiska evolutionsmodellen är baserad på duplicering, omarrangemang och mutation av gener med idén om ett gemensamt ursprung [4] [5] . Föräldralösa gener är distinkta genom att de är härstamningsspecifika utan någon känd historia av vanlig duplicering och permutation utanför deras specifika art eller klad [6] . Föräldralösa gener kan uppstå genom en mängd olika mekanismer såsom horisontell genöverföring , duplicering och snabb divergens , och de novo genuppkomst från en -kodande sekvens [2Dessa processer kan fungera i olika hastigheter hos insekter, primater och växter [7] . Trots deras relativt nya ursprung kan föräldralösa gener koda för funktionellt viktiga proteiner [8] [9] .

Historien om studiet av föräldralösa gener

Föräldralösa gener upptäcktes först efter starten av jästgenomsekvenseringsprojektet 1996 [ 2 ] . Föräldralösa gener stod för cirka 26% av jästgenomet, men man trodde att dessa gener skulle kunna klassificeras av homologer om fler genom sekvenserades [3] . Vid den tiden ansågs genduplicering vara den enda seriösa modellen för genutveckling [ 2] [4] [10] , sedan sekvenserades endast ett fåtal genom för jämförelse, därför ansågs frånvaron av detekterbara homologer vara mest sannolikt på grund av bristande sekvensering data, och inte från -för den verkliga bristen på homologi [3] . Emellertid fortsatte föräldralösa gener att existera när antalet sekvenserade genom ökade [3] [11] , vilket så småningom ledde till slutsatsen att föräldralösa gener är allestädes närvarande i alla genom [2] . Uppskattningar av andelen gener som är föräldralösa varierar kraftigt mellan arter och studier; 10-30 % är en vanligen citerad siffra [3] .

Studiet av föräldralösa gener uppstod till stor del runt sekelskiftet. År 2003 jämförde en studie av briggsae och besläktade arter över 2 000 gener [3 De antog att dessa gener måste ha utvecklats för snabbt för att kunna upptäckas och är därför platser för mycket snabb utveckling [3] . 2005 undersökte Wilson 122 bakteriearter för att försöka ta reda på om ett stort antal föräldralösa gener i många arter verkligen är föräldralösa gener [11] . Studien visade att detta var ett korrekt antagande och spelade en roll i anpassningen av bakterier. Definitionen av taxonomiskt begränsade gener introducerades i litteraturen för att få föräldralösa gener att verka mindre "mystiska" [11] .

År 2008 visade sig ett funktionellt etablerat jästprotein , BSC4, ha sitt ursprung novo från icke-kodande sekvenser vars homologi fortfarande återfanns i systerarter [ 12

År 2009 upptäcktes en föräldralös gen som reglerar det interna biologiska nätverket : QQS föräldralös gen från Arabidopsis thaliana påverkar stärkelsemetabolismen [13] . Det föräldralösa proteinet QQS interagerar med den konserverade transkriptionsfaktorn NF-YC4, vilket förklarar ökningen av proteinproduktionen som orsakas när QQS-genen introduceras genom genteknik i andra växtarter [14] .

År 2011 genomfördes en omfattande genomisk studie av distributionen och evolutionärt ursprung för föräldralösa gener i växter på modellväxten Arabidopsis thaliana [15] .

Hur man identifierar föräldralösa gener

Gener kan villkorligt klassificeras som föräldralösa om inga ortologa proteiner finns i närliggande arter [7] .

En metod som används för att utvärdera likheten mellan nukleotid- eller proteinsekvenser som indikerar homologi (dvs likhet på grund av gemensam härkomst) är verktyget Basic Local Alignment Search (BLAST) . BLAST låter dig snabbt söka efter sekvenser i stora databaser [16] [17] . Modellering tyder på att BLAST under vissa förhållanden är lämplig för att detektera avlägsna släktingar till en gen [18] . Däremot kan BLAST lätt missa korta och snabbt utvecklande gener [19] .

Den systematiska upptäckten av homologi för att kommentera föräldralösa gener kallas philostratigraphy[20] . Filostratigrafi genererar ett fylogenetiskt träd , där homologin mellan alla gener från huvudarten och generna från andra arter beräknas. Den tidigaste gemensamma förfadern till en gen bestämmer genens ålder eller fylogenetiska stratum . Benämna "föräldralös" används ibland endast för det yngsta fylogenetiska lagret som innehåller endast en art, men när det tolkas brett som en taxonomiskt begränsad gen , kan det se till allt utom det äldsta fylogenetiska lagret med en föräldralös gen i en större clade .

Var kommer föräldralösa gener ifrån?

Föräldralösa gener uppstår från en mängd olika källor, främst genom de novo-förekomst , och snabb divergens och horisontell genöverföring [2

De novo utseende

Nya föräldralösa gener dyker ständigt upp novo från icke-kodande sekvenser [ 21Dessa nya gener kan vara användbara nog för att fixeras genom selektion . Eller, mer sannolikt, kommer de igen att dra sig tillbaka till en icke-genetisk bakgrund. Det senare alternativet stöds av studier i Drosophila som visar att unga gener är mer benägna att dö ut [22] .

Man trodde en gång att uppkomsten av de novo- gener var nästan omöjlig på grund av de komplexa och potentiellt bräckliga krångligheterna med att skapa och underhålla funktionella polypeptider [10] , men studier under de senaste tio åren har hittat flera exempel på de novo- gener , varav några är förknippade med viktiga biologiska processer, särskilt testikelfunktion hos djur. De novo gener har också hittats i svampar och växter [12] [23] [24] [5] [25] [26] [27] .

För unga föräldralösa gener kan homologa icke-kodande DNA-sekvenser ibland hittas i systertaxa, vilket allmänt anses vara starkt bevis för de novo- ursprung . Bidraget från de novo- ursprung till taxonomiskt begränsade gener av äldre ursprung, särskilt i förhållande till den traditionella teorin om gentuplikationsutveckling, förblir dock kontroversiellt [28] [29] .

Duplicering och divergens

Duplicerings- och divergensmodellen för föräldralösa gener antar att en ny gen skapas som ett resultat av någon duplicering eller divergenshändelse, och en period av snabb evolution inträffar när all detekterbar likhet med den ursprungligen duplicerade genen går förlorad [2] . Även om denna förklaring stämmer överens med den nuvarande förståelsen av dupliceringsmekanismer [2] , är antalet mutationer som krävs för att förlora detekterbar likhet tillräckligt stort för att vara en sällsynt händelse [2] [18] och den evolutionära mekanism genom vilken en genduplicering kan vara isolerade och divergera snabbt förblir oklart [2] [30] .

Horisontell genöverföring

En annan förklaring till hur föräldralösa gener uppstår har att göra med en dupliceringsmekanism som kallas horisontell genöverföring , där den ursprungliga duplicerade genen kommer från en separat, okänd härstamning[2] . Denna förklaring till ursprunget för föräldralösa gener är särskilt relevant i bakterier och archaea , där horisontell genöverföring är vanlig.

Egenskaper för ett protein

Föräldralösa gener tenderar att vara mycket korta (cirka 6 gånger kortare än mogna gener), och vissa är svagt uttryckta , vävnadsspecifika och enklare att använda kodon och aminosyrasammansättning [ 31] . Föräldralösa gener tenderar att koda för intrinsiskt störda proteiner32]33] [34] även om viss struktur har hittats i en av de bäst karakteriserade föräldralösa generna [ 35] tiotusentals av eller specialiserad metabolism som har karakteriserats hittills är ingen föräldralös eller ens begränsad till sitt ursprung; uppenbarligen krävs hundratals miljoner år av evolution för katalys [31] .

Biologiska funktioner

Även om förekomsten av föräldralösa gener är erkänd, diskuteras fortfarande den evolutionära rollen för föräldralösa barn, och i förlängningen deras betydelse. En teori är att många föräldralösa barn inte spelar en evolutionär roll; genom innehåller icke-funktionella öppna läsramar (ORF) , som skapar falska polypeptidprodukter som inte stöds av selektion , vilket betyder att de sannolikt inte kommer att kvarstå mellan arter och sannolikt kommer att hittas som föräldralösa gener [3] . Men många andra studier har visat att åtminstone vissa föräldralösa barn är funktionellt viktiga och kan hjälpa till att förklara uppkomsten av nya fenotyper [2] [3] [11] [13] [14] [15] .

Anteckningar

  1. Fischer, D.; Eisenberg, D. Hitta familjer för genomiska ORFans // Bioinformatics. - 1999. - 1 september ( vol. 15 , nr 9 ). - S. 759-762 . - doi : 10.1093/bioinformatics/15.9.759 . PMID 10498776 .
  2. 1 2 3 4 5 6 7 8 9 10 11 12 13 Tautz, D.; Domazet-Lošo, T. Det evolutionära ursprunget för föräldralösa gener  (engelska)  // Nature Reviews Genetics . - 2011. - Vol. 12 , nr. 10 . - s. 692-702 . doi : 10.1038 / nrg3053 . PMID 21878963 .
  3. 1 2 3 4 5 6 7 8 9 Khalturin, K; Hemmrich, G; Fraune, S; Augustine, R; Bosch, TC Mer än bara föräldralösa barn: är taxonomiskt begränsade gener viktiga i evolutionen? (eng.)  // Trends in Genetics : journal. - Cell Press , 2009. - Vol. 25 , nr. 9 . - s. 404-413 . - doi : 10.1016/j.tig.2009.07.006 . — PMID 19716618 .
  4. 1 2 Ohno, Susumu. Evolution genom genduplicering . - Springer Science & Business Media , 2013. - ISBN 978-3-642-86659-3 .
  5. 1 2 Zhou, Qi; Zhang, Guojie; Zhang, Yue; Xu, Shiyu; Zhao, Ruoping; Zhan, Zubing; Li, Xin; Ding, Yun; Yang, Shuang. Om ursprunget till nya gener i Drosophila   // Genome Research. - 2008. - 1 september ( vol. 18 , nr 9 ). - P. 1446-1455 . - doi : 10.1101/gr.076588.108 . — PMID 18550802 .
  6. Toll-Riera, M.; Bosch, N.; Bellora, N.; Castelo, R.; Armengol, L.; Estivill, X.; Alba, MM Ursprunget till föräldralösa primater  : en jämförande genomik-strategi  // Molecular Biology and Evolution : journal. - Oxford University Press , 2009. - Vol. 26 , nr. 3 . - s. 603-612 . - doi : 10.1093/molbev/msn281 . — PMID 19064677 .
  7. 1 2 Wissler, L.; Gadau, J.; Simola, D.F.; Helmkampf, M.; Bornberg-Bauer, E. Mechanisms and Dynamics of Orphan Gene Emergence in Insect Genomes   // Genome Biology and Evolution : journal. - 2013. - Vol. 5 , nej. 2 . - S. 439-455 . - doi : 10.1093/gbe/evt009 . — PMID 23348040 .
  8. Reinhardt, Josephine A.; Wanjiru, Betty M.; Brant, Alicia T.; Saelao, Perot; Begun, David J.; Jones, Corbin D. De Novo ORFs i Drosophila är viktiga för organisk kondition och utvecklades snabbt från tidigare icke-kodande sekvenser  //  PLoS Genet : journal. - 2013. - 17 oktober ( vol. 9 , nr 10 ). — P. e1003860 . - doi : 10.1371/journal.pgen.1003860 . — PMID 24146629 .
  9. Suenaga, Yusuke; Islam, S.M. Rafiqul; Alagu, Jennifer; Kaneko, Yoshiki; Kato, Mamoru; Tanaka, Yukichi; Kawana, Hidetada; Hossain, Shamim; Matsumoto, Daisuke. NCYM, en Cis-Antisense-gen från MYCN, kodar för ett De Novo-utvecklat protein som hämmar GSK3β, vilket resulterar i stabilisering av MYCN i humana neuroblastom   // PLoS - genet : journal. - 2014. - 2 januari ( vol. 10 , nr 1 ). - P. e1003996 . - doi : 10.1371/journal.pgen.1003996 . — PMID 24391509 .
  10. 1 2 Jacob, F. Evolution and tinkering  (engelska)  // Science : journal. - 1977. - 10 juni ( vol. 196 , nr 4295 ). - s. 1161-1166 . - doi : 10.1126/science.860134 . - . — PMID 860134 .
  11. 1 2 3 4 Wilson, G.A.; Bertrand, N.; Patel, Y.; Hughes, JB; Feil, EJ; Field, D. Orphans som taxonomiskt begränsade och ekologiskt viktiga gener  (engelska)  // Microbiology : journal. - 2005. - Vol. 151 , nr. 8 . - P. 2499-2501 . - doi : 10.1099/mic.0.28146-0 . — PMID 16079329 .
  12. 1 2 Cai, Jing; Zhao, Ruoping; Jiang, Huifeng; Wang, Wen. De Novo Ursprung av en ny proteinkodande gen i Saccharomyces cerevisiae  (engelska)  // Genetics: journal. - 2008. - 1 maj ( vol. 179 , nr 1 ). - s. 487-496 . - doi : 10.1534/genetics.107.084491 . — PMID 18493065 .
  13. 1 2 Li, L.; Foster, C.M.; Gan, Q.; Nettleton, D.; James, M.G.; Myers, A.M.; Wurtele, ES Identifiering av det nya proteinet QQS som en komponent i det metaboliska nätverket av stärkelse i Arabidopsis-blad  //  The Plant Journal : journal. - 2009. - Vol. 58 , nr. 3 . - s. 485-498 . - doi : 10.1111/j.1365-313X.2009.03793.x . — PMID 19154206 .
  14. 1 2 Li, L; Zheng, W; Zhu, Y; Ja, H; Tang, B; Arendsee, Z; Jones, D; Li, R; Ortiz, D; Zhao, X; Du, C; Nettleton, D; Scott, P; Salas-Fernandez, M; Yin, Y; Wurtele, ES QQS föräldralösa genen reglerar kol- och kvävefördelning mellan arter via NF-YC-interaktioner  // Proceedings of the National Academy of Sciences of the United States of America  : journal  . - 2015. - Vol. 112 , nr. 47 . - P. 14734-14739 . - doi : 10.1073/pnas.1514670112 . - . — PMID 26554020 .
  15. 1 2 Donoghue, MTA; Keshavaiah, C.; Swamidatta, S.H.; Spillane, C. Evolutionära ursprung för Brassicaceae-specifika gener i Arabidopsis thaliana  (engelska)  // BioMed Central : journal. - 2011. - Vol. 11 , nr. 1 . — S. 47 . - doi : 10.1186/1471-2148-11-47 . — PMID 21332978 .
  16. Altschul, S. Gapped BLAST och PSI-BLAST: en ny generation av sökprogram för proteindatabaser  //  Nucleic Acids Research : journal. - 1997. - 1 september ( vol. 25 , nr 17 ). - P. 3389-3402 . doi : 10.1093 / nar/25.17.3389 . — PMID 9254694 .
  17. NCBI BLAST hemsida . Hämtad 8 september 2020. Arkiverad från originalet 21 augusti 2020.
  18. 12 Alba , M; Castresana, J. Om homologisökningar med protein BLAST och karakterisering av geners ålder  //  BioMed Central : journal. - 2007. - Vol. 7 . — S. 53 . - doi : 10.1186/1471-2148-7-53 . — PMID 17408474 .
  19. Moyers, B.A.; Zhang, J.  Phylostratigraphic Bias skapar falska mönster av genomevolution  // Molecular Biology and Evolution : journal. - Oxford University Press , 2014. - 13 oktober ( vol. 32 , nr 1 ). - s. 258-267 . - doi : 10.1093/molbev/msu286 . — PMID 25312911 .
  20. Domazet-Lošo, Tomislav; Brajkovic, Josip; Tautz, Diethard. En fylostratigrafisk metod för att avslöja den genomiska historien om stora anpassningar i metazoanlinjer   // Trends in Genetics : journal. - Cell Press , 2007. - 11 januari ( vol. 23 , nr 11 ). - S. 533-539 . - doi : 10.1016/j.tig.2007.08.014 . — PMID 18029048 .
  21. McLysaght, Aoife; Guerzoni, Daniele. Nya gener från icke-kodande sekvens: rollen för de novo proteinkodande gener i eukaryotisk evolutionär innovation  (engelska)  // Philosophical Transactions of the Royal Society B  : journal. - 2015. - 31 augusti ( vol. 370 , nr 1678 ). — S. 20140332 . - doi : 10.1098/rstb.2014.0332 . — PMID 26323763 .
  22. Palmieri, Nicola; Kosiol, Carolyn; Schlotterer, Christian. Livscykeln för föräldralösa gener  (engelska)  // eLife  : journal. - 2014. - 19 februari ( vol. 3 ). — P.e01311 . - doi : 10.7554/eLife.01311 . — PMID 24554240 .
  23. Zhao, Li; Saelao, Perot; Jones, Corbin D.; Begun, David J. Origin and Spread of de Novo Genes in Drosophila melanogaster Populations  (engelska)  // Science : journal. - 2014. - 14 februari ( vol. 343 , nr 6172 ). - s. 769-772 . - doi : 10.1126/science.1248286 . - . — PMID 24457212 .
  24. Levine, Mia T.; Jones, Corbin D.; Kern, Andrew D.; Lindfors, Heather A.; Begun, David J. Nya gener härledda från icke-kodande DNA i Drosophila melanogaster är ofta X-länkade och uppvisar testis-biased expression  // Proceedings of the National Academy of Sciences of the United States of America  : journal  . - 2006. - 27 juni ( vol. 103 , nr 26 ). - P. 9935-9939 . - doi : 10.1073/pnas.0509809103 . - . — PMID 16777968 .
  25. Heinen, Tobias JAJ; Staubach, Fabian; Hamming, Daniela; Tautz, Diethard. Uppkomsten av en ny gen från en intergenisk region  (engelska)  // Current Biology  : journal. - Cell Press , 2009. - 29 september ( vol. 19 , nr 18 ). - P. 1527-1531 . - doi : 10.1016/j.cub.2009.07.049 . — PMID 19733073 .
  26. Chen, Sidi; Zhang, Yong E.; Länge, Manywan. Nya gener i Drosophila blir snabbt väsentliga  (engelska)  // Science : journal. - 2010. - 17 december ( vol. 330 , nr 6011 ). - P. 1682-1685 . - doi : 10.1126/science.1196380 . - . — PMID 21164016 .
  27. Silveira AB, Trontin C., Cortijo S., Barau J., Del-Bem LE, Loudet O., Colot V., Vincentz M. Extensive Natural Epigenetic Variation at a De Novo Originated Gene  //  PLoS Genetics  : journal. - 2013. - Vol. 9 , nej. 4 . — P.e1003437 . - doi : 10.1371/journal.pgen.1003437 . — PMID 23593031 .
  28. Neme, Rafik; Tautz, Diethard. Evolution: Dynamics of De Novo Gene Emergence  (engelska)  // Current Biology  : journal. - Cell Press , 2014. - 17 mars ( vol. 24 , nr 6 ). - P.R238-R240 . - doi : 10.1016/j.cub.2014.02.016 . — PMID 24650912 .
  29. Moyers, Bryan A.; Zhang, Jianzhi. Utvärdera fylostratigrafiska bevis för utbredd de novo genfödelse i genomevolution  //  Molecular Biology and Evolution : journal. - Oxford University Press , 2016. - 11 januari ( vol. 33 , nr 5 ). - P. 1245-1256 . - doi : 10.1093/molbev/msw008 . — PMID 26758516 .
  30. Lynch, Michael; Katju, Vaishali.  De förändrade evolutionära banorna för genduplikat  // Trends in Genetics : journal. - Cell Press , 2004. - 1 november ( vol. 20 , nr 11 ). - s. 544-549 . - doi : 10.1016/j.tig.2004.09.001 . — PMID 15475113 .
  31. 1 2 Arendsee, Zebulun W.; Li, Ling; Wurtele, Eve Syrkin. Blir myndig: föräldralösa gener i växter  (eng.)  // Trends in Plant Science : journal. - Cell Press , 2014. - November ( vol. 19 , nr 11 ). - s. 698-708 . - doi : 10.1016/j.tplants.2014.07.003 . — PMID 25151064 .
  32. Mukherjee, S.; Panda, A.; Ghosh, TC Belysande av evolutionära egenskaper och funktionella implikationer av föräldralösa gener i Leishmania major  // Infection, Genetics and Evolution  : journal  . - 2015. - Juni ( vol. 32 ). - s. 330-337 . - doi : 10.1016/j.meegid.2015.03.031 . — PMID 25843649 .
  33. Wilson, Benjamin A.; Foy, Scott G.; Neme, Rafik; Masel, Joanna. Unga gener är mycket störda som förutspåtts av preadaptationshypotesen om de novo genfödsel  //  Nature Ecology & Evolution : journal. - 2017. - 24 april ( vol. 1 , nr 6 ). - P. 0146-0146 . - doi : 10.1038/s41559-017-0146 . — PMID 28642936 .
  34. Willis, Sara; Masel, Joanna. Genfödsel bidrar till strukturell störning kodad av överlappande gener  //  Genetics: journal. - 2018. - 19 juli ( vol. 210 , nr 1 ). - s. 303-313 . - doi : 10.1534/genetics.118.301249 . — PMID 30026186 .
  35. Bungard, Dixie; Copple, Jacob S.; Yan, Jing; Chhun, Jimmy J.; Kumirov, Vlad K.; Foy, Scott G.; Masel, Joanna; Wysocki, Vicki H.; Cordes, Matthew HJ Foldability of a Natural De Novo Evolved Protein // Structure. - 2017. - November ( vol. 25 , nr 11 ). — S. 1687–1696.e4 . - doi : 10.1016/j.str.2017.09.006 . — PMID 29033289 .