Замены нуклеотидов: в некодирующих последовательностях
Исходя из однопараметрической модели Кантора и Джукса вероятность того, для двух последовательностей, дивергировавших во время t=0 и имевших в определенном сайте нуклеотид A, вероятность того, что в момент времени t они также имеют в этой позции нуклеотид A равняется P AA(t)2 . Соответственно вероятность иметь один и тотже нуклеотид в данной позиции равна
I(t)= PAA (t)2 + PAC (t)2 + PAT (t)2 + P AG(t)2
. Или исходя из ранее полученных выражений
I(t)= 1/4+(3/4)-8at.
Вероятность, что две последовательности различаются в момент времени t равна
p = 1 - I(t) .
или
p = 3/4 ( 1 - e-8at ) .
далее имеем
8at = - ln( 1 - 4/3 p) .
Время дивергенции между двумя последовательностями обычно не известно и мы не можем оценить a. Поэтому принято оценивать K - число замен на позицию с момента дивергенции двух последовательностей.
K = 2(3at)
K = - 3/4 ln(1 - 4/3p), где p - видимое число замен.
Варианса в таком случае равна
p ( 1 - p ) V(K) = **************** L ( 1 - 4/3 p)2 , где L длина последовательности. Для двухпараметрической модели Кимуры, K расчитывается следующим образом
K = 1/2 ln(a) + 1/4 ln (b), где
a = 1/(1 - 2P -Q), b = 1/(1 - 2Q) и Q - доля транзиций а P доля трансверсий. Варианса приблизительно равна
V(K)=[ a 2P + c2 Q - (aP + cQ)2 ]/L
где c = (a+b)/2.