Замены нуклеотидов: однопараметрическая модель Кантора и Джукса
Схема замен, предложенная Кантором и Джуксом ( Jukes & Cantor, 1969 ) приведена на рисунке .
Эта модель предполагает равные вероятности замен между всеми четырьмя типами нуклеотидов с вероятностью a. В данной модели темп замен для определенной позиции составляет 3a на единицу времени.
Предположим, что в определенной позиции стоит нуклеотид А, какова вероятность того, что через время t в той же позиции будет стоять нуклеотид А, или каково значение PA (t) .
при t=0 PA (0)=1 при t=1 P A(1)=1-3a (4.1) при t=2 P A(2)=(1-3a)*PA (1)+a*[1-PA (1)] (4.2)
Последнее выражение включает в себя два возможных сценария: 1 - отсутствие замен; 2 - две замены, сперва А на C,T или G, а затем обратная мутация в А.
Для последующих моментов времени можно вывести рекуррентное соотношение:
P A(t+1)= (1-3a)*P A(t)+a*[1-P A(t)]
(4.3)
Выражение 4.3 можно переписать для числа изменений в данном сайте в
единицу времени:
PA (t+1) - P A(t) = -3a*P A(t) +
a*[1-PA (t)]
или
DP(t)=-3a*PA(t)+a*[1-PA(t)]=-4a*PA(t)+a
(4.4)
До сих пор время в уравнениях выступало как дискретная величина, однако мы можем перейти к непрерывному времени, рассматривая DP A(t) как темп изменений за время t.
При этом 4.4 перепишется как:
dP A(t)
--------------- = -4a*PA (t) + a (4.5)
dt
Это дифференциальное уравнение имеет решение в виде:
P A(t)= 1/4 + (3/4)*e -4at (4.6)
исходя из начальных условий PA (0)= 1 можно записать
вероятность
нахождения нуклеотида A в данной позиции во время t как
PA (t) = 1/4 + (3/4) -4at (4.7)
Если же в начале в данной позиции находилось не A, ( т.е. PA
(0) = 0 ), то вероятность P
A(t) запишется как
P A(t) = 1/4 - (1/4)-4at (4.8)
Из уравнений 4.6 и 4.7 мы видим, что если в начале в данной
позиции стоит нуклеотид A,
то вероятность PA (t) при t стремящемся к бесконечности
будет, убывая, стремится
к асимптоте - 1/4. Если же в начале в данной позиции стоит не A, то
вероятность PA (t)
при t стремящемся к бесконечности будет возрастать, стремясь к той же
асимптоте - 1/4.
По достижении состояния равновесия аналогичные вероятности для всех
четырех нуклеотидов окажутся
равными 1/4. Далее, при условии бесконечной длины последовательности,
эти частоты меняться
не будут.
На самом деле мы можем рассматривать P A(t) как частоту данного
нуклеотида в
последовательности.
