Повторы в эукариотическом геноме

Геном эукариот характеризуется двумя основными особенностями: 1) Повторенность последовательностей; 2) Разделением по составу на различные фрагменты, характеризуемые специфическим содержанием нуклеотидов;

Повторенная ДНК состоит из нуклеотидных последовательностей различной длины и состава, которые встречаются в геноме несколько раз либо в тандемно-повторенном, либо в диспергированном виде. Последовательности ДНК, которые не повторяются, называются уникальной ДНК (single-copy DNA). Размер части генома, занятой повторяющимися последовательностями, широко варьирует между таксонами. У дрожжей он достигает 20%, у млекопитающих до 60% всей ДНК повторяется. У растений процент повторенных последовательностей может превышать 80%.

По взаимной ориентации в структуре ДНК различаются прямые, инвертированные, симметричные повторы, палиндромы, комплементарные палиндромы и т.п. В очень широком диапазоне варьирует и длина (в числе оснований) элементарной повторяющейся единицы, и степень их повторяемости, и характер распределения в геноме (наиболее грубая классификация: тандемно и дисперсно распределенные повторы); наконец, периодичность повторений ДНК может иметь очень сложную структуру, когда короткие повторы включены в более протяженные или окаймляют их и т.д.

Ставшая классической работа Бриттена и Кона (Britten, Kohne, 1968) по кинетике ренатурации ДНК показала, что геномы высших эукариот можно грубо разделить на четыре фракции: самокомплементарная ДНК (foldback DNA), высоко повторенная ДНК (highly repetitive DNA), умеренно повторенная ДНК (middle repetitive DNA) и уникальные последовательности (single-copy DNA). Самокомплементарная ДНК состоит из палиндромных последовательностей, способных образовывать двуцепочечные шпильки, "замыкаясь" сами на себя. Фракция высоких повторов состоит из коротких последовательностей длиной от нескольких нуклеотидов до нескольких сотен н.п., которые имеют около 500,000 копий. В умеренные повторы входят более длинные последовательности от сотен до тысяч н.п., имеющие до 100 копий на геном.

Поиск, классификация и в дальнейшем выявление функции повторов- необходимый этап при анализе геномов. Повторы могут быть точными и неточными. Кроме того, для последовательностей ДНК можно рассматривать зеркальные и инвертированные повторы. С биологической точки зрения интересны также неточные повторы. Такие повторы иногда называются вырожденными.

Дупликации. Повторы в геномных последовательностях были обнаружены довольно давно. Подробную сводку ранних сведений можно найти в книге Газаряна и Тарантула. Повторы в геномах можно классифицировать по-разному:

(1) Некоторые геномы сами являются дупликациями.

(2) Сегментарные дупликации, особенно выраженные в геноме человека. Такие дупликации включают перенос 1-200 т.п.о. блоков геномных последовательностей в основном в прицентромерные и в меньшей степени в субтеломерные районы хромосом. Степень гомологии таких дупликаций выше 90%. Некоторые из этих дупликаций связаны с геномными болезнями.

Сегментарные дупликации занимают 3.3% генома человека ( IHGSC, 2001 , Venter et al., 2001 ).

(3) Дупликации генов и генные семейства.

(4) Множественные копии мобильных элементов.

(5) Простые повторы (короткие, от 1 до нескольких десятков нуклеотидов, в том числе микросателлиты и минисателлиты , которые по-видимому, не кодируют никаких продуктов.

(6) Палидромы.

(7) Блоки тандемно повторенных последовательностей, такие как последовательности в центромерах, теломерах, коротких плечах акроцентрических хромосом, кластеры рибосомальных генов.

(8) Инактивированные ретротранспозированные копии генов.

(9) Внутрибелковые повторы ( Heringa, 1998 ). По частоте встречаемости различают низкокопийные (примерно до 10 копий), умеренно повторяющиеся последовательности (от 10 до 104), часто повторяющиеся последовательности (более 105). По типу следования различают диспергированные и тандемные повторы.

Геном человека известен на 94% ( IHGSC, 2001 ). На основании этого материала можно сделать следующие выводы. Повторы занимают по крайней мере 50% генома. В геноме человека (и млекопитающих) встречаются мобильные элементы четырех типов.

Это long interspersed elements ( LINE , длина 6 т.п.о., число копий 8.5*105, число семейств 3, 21% генома);

short interspersed elements ( SINE , 100-400 п.о., 1.5*106, 3, 13% генома);

LTR retrotransposons (1.5-11 т.п.о., 4.5*105, ?100, 8%);

ВNA transposons (80-3000 п.о., 3*105, ?100, 3%). Несеквенированная пока часть генома относится в основном к центромерным областям хромосом и содержит тандемные кластеры альфа-сателлитных последовательностей, которые подробно рассмотрены ниже.

Ссылки: