Beräkningsgenomik använder beräkningsanalys för att dechiffrera genomsekvenser och relaterade data [1] , inklusive DNA- och RNA-sekvenser . Beräkningsgenomik kan också definieras som en gren av bioinformatik , men med den skillnaden att uppmärksamhet ägnas åt analys av kompletta genom (snarare än individuella gener) för att förstå principerna för hur olika DNA kontrollerar en organism på molekylär nivå [2] .
Beräkningsgenomik började sin utveckling samtidigt med bioinformatik. På 1960-talet skapade Margaret Dayhoff och andra vid National Biomedical Research Foundation databaser med olika proteinsekvenser för evolutionär forskning [3] . Deras studie byggde ett fylogenetiskt träd som bestämde de förändringar som krävs för att ett visst protein ska utvecklas till ett annat protein. Detta ledde till skapandet av en substitutionsmatris som utvärderar sannolikheten för att ett protein länkar till ett annat.
Med början på 1980-talet började genomsekvensdatabaser växa fram, men nya utmaningar uppstod när det gäller att hitta och jämföra data om enskilda gener. Till skillnad från textsökningsalgoritmer som används på webbplatser, när man letar efter genetisk likhet, är det nödvändigt att identifiera sekvenser som inte nödvändigtvis är identiska, utan helt enkelt lika. Detta ledde till uppkomsten av Needleman-Wunsch-algoritmen , som är en dynamisk programmeringsalgoritm för att jämföra uppsättningar av aminosyrasekvenser med varandra med hjälp av substitutionsmatriser som erhållits i en tidigare studie av M. Deyhoff. Senare dök BLAST- algoritmen upp , som möjliggör snabba och optimerade sökningar i databaser med gensekvenser. BLAST och dess modifieringar är bland de mest använda algoritmerna för detta ändamål [4] .
Framväxten av frasen "beräkningsgenomik" sammanfaller med uppkomsten av kompletta kommenterade genom under andra hälften av 1990-talet. Den första årliga konferensen om beräkningsgenomik anordnades av forskare från Institutet för genomisk forskning (TIGR) 1998, vilket gav ett forum för denna specialitet och effektivt särskiljde detta vetenskapsområde från de mer allmänna områdena genomik eller beräkningsbiologi [5] [ 6] . För första gången i den vetenskapliga litteraturen användes denna term, enligt MEDLINE , ett år tidigare (i tidskriften Nucleic Acids Research [7] ).