Точечные матрицы гомологии многомерные

Потребности исследователей не ограничиваются сравнением только двух последовательностей. Большой популярностью пользуется множественное выравнивание последовательностей. Было крайне заманчивым распространить метод точечных матриц на несколько последовательностей. Здесь нужно решить три проблемы.

1) дать определение сходства фрагментов, вырезанных из нескольких последовательностей. Иными словами, необходимо определить, когда ставить точку на такой многомерной матрице.

2) Как изобразить такую многомерную матрицу на плоскости.

3) Как посчитать такую матрицу, ведь время счета ~Ln , где n - число последовательностей. Если в работах ( Roytberg, 1992 ; Alexandrov, 1992 ) намечена схема преодоления первого препятствия, то для второго не было известно приемлемого решения. Так единственная известная попытка ( Vihinen, 1988 ; Vihinen, 1990 ; Vihinen et al., 1992 ) не дает адекватного представления. Совсем неприступной казалась третья задача. В работе ( Shepelev & Yanishevsky, 1994 ) предложено решение этих проблем. Предложенный подход гарантирует точное решение задачи в смысле данного определения многомерной ТМГ. Эксперименты показывают, что для пяти генов размера 3-4 т.п.о. время счета составляет 2-3 минуты. Имеющиеся оценки демонстрируют, что суммарная длина последовательностей может быть 100 тыс. нуклеотидов, а число последовательностей до 100 (см. рис 2 bi )

Ссылки: