Анализ связи точек рекомбинаций с короткими повторами

Для анализа связи точек рекомбинаций вируса SV40 и клеточной ДНК с короткими прямыми повторами используется статистический подход ( Hasson et al., 1984 ). Каждый повтор в работе (Hasson et al., 1984) описывается длиной и расстоянием между началами участков повтора. Так повтор "ATG" в последовательности "ATGTATG" имеет длину 3 нуклеотида и расположен на расстоянии 4 нуклеотида. В последовательности SV40 выявляются все совершенные прямые повторы длиной более 2 нуклеотидов у которых расстояние между участками повторов меньше 20. Каждой позиции в последовательности приписывается вес исходя из характеристик повторов, которые попадают в эту позицию. В качестве веса используется функция от длины этих совершенных повторов и расстояния между сегментами. Фактически вес отражает физическую характеристику стабильности гетеродуп- лекса, который может образоваться по участкам совершенного повтора. Для 26 известных точек рекомбинации вычислялся их средний вес. Далее в последовательности выбирается 1000000 групп "случайных" наборов точек рекомбинации (26 случайно выбранных позиций в последовательности) и для каждого набора вычисляется средний вес. На основе распределения весов случайных наборов оценивается число наборов "случайных" точек рекомбинации с большим весом. Оказалось, что доля таких групп очень мала: 0.0002. На основании этого авторы делают вывод о неслучайности связи точек рекомбинации с короткими прямыми повторами и предлагают модель рекомбинации, одним из этапов которой является формирование несовершенных гетеродуплексов по участкам прямых повторов (Hasson et al., 1984).

Ссылки: