Гены эукариот: мозаичное строение
Предельно схематично изобразим структуру типичного белоксинтезирующего эукариотического гена и процессинг соответствующей про-мРНК:
    
     
€;€;€;“;“;“;“;“;’;’;’;’;’;’;’;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;’;’;’;’;’;’;’;“;“;“;“;“;€;€;€;
 ДНК 
                               ;  
        5'                     v                    3'
        
“;“;“;“;“;’;’;’;’;’;’;’;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;’;’;’;’;’;’;’;“;“;“;“;“;
 гя РНК 
                               ;  
                               v  
   GpppG
“;“;“;“;“;’;’;’;’;’;’;’;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;€;’;’;’;’;’;’;’;“;“;“;“;“;
 A...An
                               ;  
                               v  
                        €;€;€;€;€;€;€;€;€;€;€;€;€;€;€;
                        €;€;           €;€;
                        €;€;€;€;€;€;   €;€;€;€;€;€;
                            €;€;   €;€;
          GpppG “;“;“;“;“;’;’;’;’;’;’;’;€;€;   €;€;’;’;’;’;’;’;’;“;“;“;“;“;
 A...An
                               ;   I  Сближение сайтов
                               V      разрезания и сращивания
                               
              GpppG “;“;“;“;“;’;’;’;’;’;’;’;’;’;’;’;’;’;’;“;“;“;“;“; 
A...An   мРНК 
 ( Общая схема процессинга и экспрессии типичного эукариотического
гена, кодирующего белок ( Рэфф, Коффмен,1986 ).
Белые участки соответствуют интронам, покрытые точками - экзонам,
вертикальные волнистые линии - фланкирующие 5'- и 3'-последовательности. )
В схеме отражено самое неожиданное открытие молекулярной биологии, датируемое 1977 г., - разделение гена на "существенные", кодирующие белок фрагменты, (экзоны) и "несущественные" (интроны) ( Gilbert, 1978 ), которые ферментативно удаляются (процесс "сплайсинга") при созревании мРНК и, следовательно, не учавствуют в трансляции.
По мозаичному, экзон-интронному, принципу почти все исследованные гены эукариот, включая вирусные гены, экспрессируемые в эукариотических клетках. Псевдогены часто лишены интронов, но они могли утратить их вторично; не исключено также, что они - "процессированные" гены или "ретрогены", образовавшиеся путем обратной транскрипции ( Sharp, 1983 ).
Число, размеры и внутренняя структура интронов изменяется в очень широком диапазоне, эволюционно консервативна структура лишь экзон-интронных границ, по которым осуществляется сплайсинг.
Как проецируется мозаичная структура генов на структуру кодируемых ими белков? Поиск соответствия между двумя формами генетического языка на этом уровне дал известное правило: один экзон ДНК - один домен белка ( Brack, Tonegawa, 1977 ; Gilbert, 1978 ).
Под доменом обычно подразумевается функционально более или менее автономная компактная субструктура белка, ведущая себя как целое в некоторых генетических тестах и непосредственно выявляемая методом рентгенструктурного анализа. Мультидоменный принцип организации многих белков был осознан и сформулирован еще до открытия его молекулярно-генетической основы - мозаичного строения генов. Естественно, предполагалось наличие и особых генетических единиц (субгенов), отвечающих доменам,и , более того, на ряде экспериментальных прецедентов высказывалось мнение, что мультидоменные белки образуются в эволюции из однодоменных через делеционные слияния соответствующих "до-генов" в единый ген и что вообще эволюция легко оперирует такими дискретными единицами. Ныне эти идеи общеприняты.
Формула "один экзон - один домен" лучше "работает" в случае глобулярных, нежели фибриллярных белков, экзон-интронные сшивки проецируются, как правило, на поверхность глобулы. В этом есть свой резон: с одной стороны функциональные центры построены преимущественно из внутренних аминокислотных остатков, с другой стороны, в ходе эволюции, когда мозаичная структура гена только складывалась, сплайсинг был, надо полагать, не очень точен; следовательно, именно такое поверхностное распределение экзон-интронных границ давало тогда минимальные дефекты при ошибках сплайсинга.
Таким образом, минимальными относительно автономными семантическими единицами генетического языка являются экзоны на уровне ДНК и домены на уровне белка.
