Begreppet molekylär likhet (eller kemisk likhet , kemisk likhet ) är ett av nyckelbegreppen inom kemoinformatik [1] [2] . Det spelar en viktig roll i moderna metoder för att förutsäga egenskaperna hos kemiska föreningar , designa nya föreningar med förutbestämda egenskaper, och i synnerhet i sökandet efter nya läkemedel genom att screena stora databaser med tillgängliga (eller potentiellt tillgängliga) kemiska föreningar. En sådan sökning bygger på principen om likhet mellan egenskaper formulerad av Johnson och Maggiora: liknande kemiska föreningar har liknande egenskaper [1] .
Måttet på molekylär likhet beskrivs ofta som det ömsesidiga avståndet, eller som ett konstant minusavstånd i deskriptorrymden.
Likhetsbaserad virtuell screening (en variant av ligandbaserad virtuell screening) bygger på antagandet att alla föreningar i databasen som liknar en given substans har liknande biologisk aktivitet. Även om denna hypotes inte alltid är sann [3] visar sig ofta uppsättningen av kemiska strukturer som väljs under loppet av sådan screening vara avsevärt berikad med föreningar som har den önskade typen av biologisk aktivitet [4] . För att uppnå större effektivitet i likhetsbaserad virtuell screening beskrivs kemiska strukturer vanligtvis med hjälp av molekylära skärmar ( strukturnycklar ) eller molekylära fingeravtryck av fast eller variabel storlek. Även om molekylära skärmar och molekylära fingeravtryck kan genereras från både rent topologisk (2D) molekylär anslutningsinformation och (3D) information om den rumsliga strukturen hos molekyler, dominerar topologiska fingeravtryck, som är en form av binära fragmentdeskriptorer, detta område. Medan strukturella nycklar, såsom MDL-nycklar [5] , är ganska lämpliga för att arbeta med kemiska databaser av små och medelstora , så är det för effektivt arbete med stora databaser att föredra att använda molekylära fingeravtryck med en högre informationstäthet. Exempel är de fragmentbaserade molekylära fingeravtrycken från Daylight [6] , BCI [7] och Tripos [8] . Det vanligaste måttet på likhet för strukturer representerade av molekylära fingeravtryck är Tanimoto (Jakara) koefficienten T . Två kemiska strukturer anses vanligtvis vara lika om (för Daylights molekylära fingeravtryck).