Замены нуклеотидов: в кодирующих последовательностях
При исследовании последовательностей кодирующих белок обычно не берутся во внимание стартовый и терминирующий кодоны, т.к. они одинаковы во всех случаях.
Для того чтобы корректно оценить число синонимичных и несинонимичных замен расклассифицируем все нуклеотидные позиции следующим образом: если в позиции возможны i синонимичных замен, то позиция рассматривается как на i/3 синонимичная и на (3-i)/3 несинонимичная. Так для кодона TTT (Phe) первые две позиции несинонимичные (любая замена вызывает замену аминокислоты) а последняя на 1/3 синонимичная и на 2/3 несинонимичная. При сравнении двух последовательностей вычисляется среднее число синонимичных и несинонимичных позиций.
Затем расклассифицируем замены как синонимичные и несинонимичные. При этом приходится учитывать возможные пути между двумя разными кодонами при условии единичных замен. Например рис
И соответственно мы говорим что между этими двумя кодонами 3/2 несинонимичных замен и 1/2 синонимичных. Однако путь Asn->Lys->Thr гораздо менее вероятен, чем Asn->Thr->Thr. Поэтому чаще каждому пути присваивают определенный вес и расчитывают число замен разного типа исходя из этого. Часто используются разнообразные матрицы расстояний между аминокислотами.
Исходя из этого мы можем посчитать число соответствующих замен на позицию:
Ps=Ms/Ns, где Ps - число синонимичных замен на позицию, Ms - число синонимичных замен, Ns - число синонимичных замен на позицию; и Pa=Ma/Na, где Pa - число несинонимичных замен на позицию, Ma - число несинонимичных замен, Na - число несинонимичных замен на позицию; Для расчета истинного числа замен мы можем использовать модель Кантора и Джукса, при этом мы получим следующие оценки:
Ks = -3/4 ln[1 - (4Ms/3Ns)] и
Ka = -3/4 ln[1 - (4Ma/3Na)]