Гены эукариот: мозаичное строение
Предельно схематично изобразим структуру типичного белоксинтезирующего эукариотического гена и процессинг соответствующей про-мРНК:
€;€;€;“;“;“;“;“;’;’;’;’;’;’;’;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;’;’;’;’;’;’;’;“;“;“;“;“;€;€;€; ДНК ; 5' v 3' “;“;“;“;“;’;’;’;’;’;’;’;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;’;’;’;’;’;’;’;“;“;“;“;“; гя РНК ; v GpppG “;“;“;“;“;’;’;’;’;’;’;’;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;’;’;’;’;’;’;’;“;“;“;“;“; A...An ; v €;€;€;€;€;€;€;€;€;€;€;€;€;€;€; €;€; €;€; €;€;€;€;€;€; €;€;€;€;€;€; €;€; €;€; GpppG “;“;“;“;“;’;’;’;’;’;’;’;€;€; €;€;’;’;’;’;’;’;’;“;“;“;“;“; A...An ; I Сближение сайтов V разрезания и сращивания GpppG “;“;“;“;“;’;’;’;’;’;’;’;’;’;’;’;’;’;’;“;“;“;“;“; A...An мРНК( Общая схема процессинга и экспрессии типичного эукариотического гена, кодирующего белок ( Рэфф, Коффмен,1986 ). Белые участки соответствуют интронам, покрытые точками - экзонам, вертикальные волнистые линии - фланкирующие 5'- и 3'-последовательности. )
В схеме отражено самое неожиданное открытие молекулярной биологии, датируемое 1977 г., - разделение гена на "существенные", кодирующие белок фрагменты, (экзоны) и "несущественные" (интроны) ( Gilbert, 1978 ), которые ферментативно удаляются (процесс "сплайсинга") при созревании мРНК и, следовательно, не учавствуют в трансляции.
По мозаичному, экзон-интронному, принципу почти все исследованные гены эукариот, включая вирусные гены, экспрессируемые в эукариотических клетках. Псевдогены часто лишены интронов, но они могли утратить их вторично; не исключено также, что они - "процессированные" гены или "ретрогены", образовавшиеся путем обратной транскрипции ( Sharp, 1983 ).
Число, размеры и внутренняя структура интронов изменяется в очень широком диапазоне, эволюционно консервативна структура лишь экзон-интронных границ, по которым осуществляется сплайсинг.
Как проецируется мозаичная структура генов на структуру кодируемых ими белков? Поиск соответствия между двумя формами генетического языка на этом уровне дал известное правило: один экзон ДНК - один домен белка ( Brack, Tonegawa, 1977 ; Gilbert, 1978 ).
Под доменом обычно подразумевается функционально более или менее автономная компактная субструктура белка, ведущая себя как целое в некоторых генетических тестах и непосредственно выявляемая методом рентгенструктурного анализа. Мультидоменный принцип организации многих белков был осознан и сформулирован еще до открытия его молекулярно-генетической основы - мозаичного строения генов. Естественно, предполагалось наличие и особых генетических единиц (субгенов), отвечающих доменам,и , более того, на ряде экспериментальных прецедентов высказывалось мнение, что мультидоменные белки образуются в эволюции из однодоменных через делеционные слияния соответствующих "до-генов" в единый ген и что вообще эволюция легко оперирует такими дискретными единицами. Ныне эти идеи общеприняты.
Формула "один экзон - один домен" лучше "работает" в случае глобулярных, нежели фибриллярных белков, экзон-интронные сшивки проецируются, как правило, на поверхность глобулы. В этом есть свой резон: с одной стороны функциональные центры построены преимущественно из внутренних аминокислотных остатков, с другой стороны, в ходе эволюции, когда мозаичная структура гена только складывалась, сплайсинг был, надо полагать, не очень точен; следовательно, именно такое поверхностное распределение экзон-интронных границ давало тогда минимальные дефекты при ошибках сплайсинга.
Таким образом, минимальными относительно автономными семантическими единицами генетического языка являются экзоны на уровне ДНК и домены на уровне белка.