Замены нуклеотидов: однопараметрическая модель Кантора и Джукса

Схема замен, предложенная Кантором и Джуксом ( Jukes & Cantor, 1969 ) приведена на рисунке .

Эта модель предполагает равные вероятности замен между всеми четырьмя типами нуклеотидов с вероятностью a. В данной модели темп замен для определенной позиции составляет 3a на единицу времени.

Предположим, что в определенной позиции стоит нуклеотид А, какова вероятность того, что через время t в той же позиции будет стоять нуклеотид А, или каково значение PA (t) .

при t=0      PA (0)=1
при t=1      P A(1)=1-3a                                  
(4.1)
при t=2      P A(2)=(1-3a)*PA (1)+a*[1-PA
(1)]             (4.2) 

Последнее выражение включает в себя два возможных сценария: 1 - отсутствие замен; 2 - две замены, сперва А на C,T или G, а затем обратная мутация в А.

Для последующих моментов времени можно вывести рекуррентное соотношение:

P A(t+1)= (1-3a)*P A(t)+a*[1-P A(t)]      
          (4.3) 
Выражение  4.3  можно  переписать  для  числа изменений в данном сайте в
единицу времени: 
PA (t+1) - P A(t) = -3a*P A(t) +
a*[1-PA (t)] 
или
DP(t)=-3a*PA(t)+a*[1-PA(t)]=-4a*PA(t)+a   
          (4.4)
 
До сих пор время в уравнениях выступало как дискретная величина,
однако мы можем перейти к 
непрерывному времени, рассматривая DP A(t) как темп изменений 
за время t.

При этом 4.4 перепишется как:

          dP A(t)
     ---------------  = -4a*PA (t) + a       (4.5)
           dt                  
 Это дифференциальное уравнение имеет решение в виде:
        P A(t)= 1/4  + (3/4)*e -4at           (4.6)
исходя из начальных условий PA (0)= 1 можно записать
вероятность
нахождения нуклеотида A в данной позиции во время t как
        PA (t) = 1/4 + (3/4) -4at             (4.7)
Если же в начале в данной позиции находилось не A, ( т.е. PA (0) = 0 ), то вероятность P A(t) запишется как
         P A(t) = 1/4 - (1/4)-4at          (4.8)
Из  уравнений  4.6  и  4.7  мы  видим,  что если в начале в  данной 
позиции  стоит  нуклеотид  A,  
то  вероятность  PA  (t) при  t  стремящемся  к  бесконечности 
будет, убывая, стремится 
к асимптоте - 1/4. Если  же в начале в  данной позиции стоит не  A, то
вероятность  PA (t)   
при t  стремящемся к  бесконечности будет возрастать,  стремясь  к  той  же
 асимптоте - 1/4. 
По достижении состояния  равновесия  аналогичные  вероятности  для всех
четырех нуклеотидов окажутся 
равными 1/4. Далее, при условии  бесконечной длины  последовательности,  
эти  частоты   меняться  
не   будут.
На самом деле мы можем рассматривать P A(t) как частоту данного нуклеотида в последовательности.

Ссылки: