Beräkningsgenomik

Den aktuella versionen av sidan har ännu inte granskats av erfarna bidragsgivare och kan skilja sig väsentligt från versionen som granskades den 26 juni 2013; kontroller kräver 6 redigeringar .

Beräkningsgenomik använder beräkningsanalys för att dechiffrera genomsekvenser och relaterade data [1] , inklusive DNA- och RNA-sekvenser . Beräkningsgenomik kan också definieras som en gren av bioinformatik , men med den skillnaden att uppmärksamhet ägnas åt analys av kompletta genom (snarare än individuella gener) för att förstå principerna för hur olika DNA kontrollerar en organism på molekylär nivå [2] .

Historik

Beräkningsgenomik började sin utveckling samtidigt med bioinformatik. På 1960-talet skapade Margaret Dayhoff och andra vid National Biomedical Research Foundation databaser med olika proteinsekvenser för evolutionär forskning [3] . Deras studie byggde ett fylogenetiskt träd som bestämde de förändringar som krävs för att ett visst protein ska utvecklas till ett annat protein. Detta ledde till skapandet av en substitutionsmatris som utvärderar sannolikheten för att ett protein länkar till ett annat.

Med början på 1980-talet började genomsekvensdatabaser växa fram, men nya utmaningar uppstod när det gäller att hitta och jämföra data om enskilda gener. Till skillnad från textsökningsalgoritmer som används på webbplatser, när man letar efter genetisk likhet, är det nödvändigt att identifiera sekvenser som inte nödvändigtvis är identiska, utan helt enkelt lika. Detta ledde till uppkomsten av Needleman-Wunsch-algoritmen , som är en dynamisk programmeringsalgoritm för att jämföra uppsättningar av aminosyrasekvenser med varandra med hjälp av substitutionsmatriser som erhållits i en tidigare studie av M. Deyhoff. Senare dök BLAST- algoritmen upp , som möjliggör snabba och optimerade sökningar i databaser med gensekvenser. BLAST och dess modifieringar är bland de mest använda algoritmerna för detta ändamål [4] .

Framväxten av frasen "beräkningsgenomik" sammanfaller med uppkomsten av kompletta kommenterade genom under andra hälften av 1990-talet. Den första årliga konferensen om beräkningsgenomik anordnades av forskare från Institutet för genomisk forskning (TIGR) 1998, vilket gav ett forum för denna specialitet och effektivt särskiljde detta vetenskapsområde från de mer allmänna områdena genomik eller beräkningsbiologi [5] [ 6] . För första gången i den vetenskapliga litteraturen användes denna term, enligt MEDLINE , ett år tidigare (i tidskriften Nucleic Acids Research [7] ).

Anteckningar

  1. Koonin EV (2001) Computational Genomics, National Center for Biotechnology Information, National Library of Medicine, NIH (PubMed ID: 11267880)
  2. Computational Genomics and Proteomics vid MIT (länk ej tillgänglig) . Hämtad 13 december 2010. Arkiverad från originalet 22 mars 2018. 
  3. David Mount (2000), Bioinformatics, Sequence and Genome Analysis, s. 2-3, Cold Spring Harbor Laboratory Press, ISBN 0-87969-597-8
  4. T. A. Brown (1999), Genomes, John Wiley & Sons, ISBN 0-471-31618-0
  5. [backPid]=67&cHash=fd69079f5e [https://web.archive.org/web/20170107160058/http://www.jcvi.org/cms/press/press-releases/full-text/archive/2004// article/computational-genomics-conference-to-attract-leading-scientists/?tx_ttnews[backPid]=67&cHash=fd69079f5e Arkiverad 7 januari 2017 på Wayback Machine The 7th Annual Conference on Computational Genomics (2004)]
  6. The 9th Annual Conference on Computational Genomics (2006) Arkiverad 12 februari 2007.
  7. A. Wagner (1997), A computational genomics approach to the identification of gene networks, Nucleic Acids Res., Sep 15;25(18):3594-604, ISSN 0305-1048