Гены эукариот: мозаичное строение
Предельно схематично изобразим структуру типичного белоксинтезирующего эукариотического гена и процессинг соответствующей про-мРНК:
€;€;€;“;“;“;“;“;’;’;’;’;’;’;’;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;’;’;’;’;’;’;’;“;“;“;“;“;€;€;€;
ДНК
;
5' v 3'
“;“;“;“;“;’;’;’;’;’;’;’;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;’;’;’;’;’;’;’;“;“;“;“;“;
гя РНК
;
v
GpppG
“;“;“;“;“;’;’;’;’;’;’;’;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;’;’;’;’;’;’;’;“;“;“;“;“;
A...An
;
v
€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;
€;€; €;€;
€;€;€;€;€;€; €;€;€;€;€;€;
€;€; €;€;
GpppG “;“;“;“;“;’;’;’;’;’;’;’;€;€; €;€;’;’;’;’;’;’;’;“;“;“;“;“;
A...An
; I Сближение сайтов
V разрезания и сращивания
GpppG “;“;“;“;“;’;’;’;’;’;’;’;’;’;’;’;’;’;’;“;“;“;“;“;
A...An мРНК
( Общая схема процессинга и экспрессии типичного эукариотического
гена, кодирующего белок ( Рэфф, Коффмен,1986 ).
Белые участки соответствуют интронам, покрытые точками - экзонам,
вертикальные волнистые линии - фланкирующие 5'- и 3'-последовательности. )
В схеме отражено самое неожиданное открытие молекулярной биологии, датируемое 1977 г., - разделение гена на "существенные", кодирующие белок фрагменты, (экзоны) и "несущественные" (интроны) ( Gilbert, 1978 ), которые ферментативно удаляются (процесс "сплайсинга") при созревании мРНК и, следовательно, не учавствуют в трансляции.
По мозаичному, экзон-интронному, принципу почти все исследованные гены эукариот, включая вирусные гены, экспрессируемые в эукариотических клетках. Псевдогены часто лишены интронов, но они могли утратить их вторично; не исключено также, что они - "процессированные" гены или "ретрогены", образовавшиеся путем обратной транскрипции ( Sharp, 1983 ).
Число, размеры и внутренняя структура интронов изменяется в очень широком диапазоне, эволюционно консервативна структура лишь экзон-интронных границ, по которым осуществляется сплайсинг.
Как проецируется мозаичная структура генов на структуру кодируемых ими белков? Поиск соответствия между двумя формами генетического языка на этом уровне дал известное правило: один экзон ДНК - один домен белка ( Brack, Tonegawa, 1977 ; Gilbert, 1978 ).
Под доменом обычно подразумевается функционально более или менее автономная компактная субструктура белка, ведущая себя как целое в некоторых генетических тестах и непосредственно выявляемая методом рентгенструктурного анализа. Мультидоменный принцип организации многих белков был осознан и сформулирован еще до открытия его молекулярно-генетической основы - мозаичного строения генов. Естественно, предполагалось наличие и особых генетических единиц (субгенов), отвечающих доменам,и , более того, на ряде экспериментальных прецедентов высказывалось мнение, что мультидоменные белки образуются в эволюции из однодоменных через делеционные слияния соответствующих "до-генов" в единый ген и что вообще эволюция легко оперирует такими дискретными единицами. Ныне эти идеи общеприняты.
Формула "один экзон - один домен" лучше "работает" в случае глобулярных, нежели фибриллярных белков, экзон-интронные сшивки проецируются, как правило, на поверхность глобулы. В этом есть свой резон: с одной стороны функциональные центры построены преимущественно из внутренних аминокислотных остатков, с другой стороны, в ходе эволюции, когда мозаичная структура гена только складывалась, сплайсинг был, надо полагать, не очень точен; следовательно, именно такое поверхностное распределение экзон-интронных границ давало тогда минимальные дефекты при ошибках сплайсинга.
Таким образом, минимальными относительно автономными семантическими единицами генетического языка являются экзоны на уровне ДНК и домены на уровне белка.
