Подобие последовательностей (sequence similarity)

Подобие последовательностей (sequence similarity): степень сходства нуклеотидных или белковых последовательностей, определяемая в процентах идентичности или сходства (консервативности, conservation). Под степенью идентичности последовательностей при их сравнении после выравнивания понимают процентное содержание идентичных аминокислот или нуклеотидов . Под сходством подразумевают долю идентичных аминокислот (нуклеотидов) плюс долю остатков, замена которых друг на друга не сильно меняет физико-химические совйства ДНК или белка. Такие замены могут быть названы консервативными .

Последнее понятие особенно часто используют при сравнении белков. В этом случае рассматривают насколько похожи по определенным критериям аминокислоты в соответствующих частях двух выравненных последовательностей: например, валин и изолейцин похожи, поскольку они гидрофобны. Аспарагиновая и глутаминовая кислоты похожи, потому что они несут отрицательный заряд и т.д.

В ДНК сходство как критерий подобия используют реже, но тоже используют: например, если в обеих последовательностях на данном месте стоят пуриновые звенья (A - в одной последовательности и G - в другой, общее обозначение для пуринов - R) или пиримидины (Т - в одной и С - в другой, общее обозначение - Y), то эти последовательности более похожи, чем, если в одной стоит пуриновое звено, а в другой пиримидиновое, или нет вообще никакого.

Для поиска подобия существуют специальные компьютерные программы [ Свердлов Е.Д. 2009 ].