Замены нуклеотидов: в некодирующих последовательностях

Исходя из однопараметрической модели Кантора и Джукса вероятность того, для двух последовательностей, дивергировавших во время t=0 и имевших в определенном сайте нуклеотид A, вероятность того, что в момент времени t они также имеют в этой позции нуклеотид A равняется P AA(t)2 . Соответственно вероятность иметь один и тотже нуклеотид в данной позиции равна

I(t)= PAA (t)2 + PAC (t)2 + PAT (t)2 + P AG(t)2

. Или исходя из ранее полученных выражений

I(t)= 1/4+(3/4)-8at.

 Вероятность, что две последовательности различаются в момент времени t равна

p = 1 - I(t) . 

или

p = 3/4 ( 1 - e-8at ) . 

далее имеем

8at = - ln( 1 - 4/3 p) . 

Время дивергенции между двумя последовательностями обычно не известно и мы не можем оценить a. Поэтому принято оценивать K  - число замен на позицию с момента дивергенции двух последовательностей.

K = 2(3at)

K = - 3/4 ln(1 - 4/3p), где p - видимое число замен. 

Варианса в таком случае равна

        p ( 1 - p )
V(K) = ****************
       L ( 1 - 4/3 p)2  , 
где L длина последовательности.  
Для 
двухпараметрической модели Кимуры, K расчитывается следующим образом 

K = 1/2 ln(a) + 1/4 ln (b), где

a = 1/(1 - 2P -Q), b = 1/(1 - 2Q) и Q - доля транзиций а P доля трансверсий. Варианса приблизительно равна

V(K)=[ a 2P  +  c2 Q - (aP + cQ)2 ]/L 

где c = (a+b)/2.

Ссылки: