Гены, кодирующие белок: схема структуры
Схема эукариотического гена.
5' фланкирующая последовательность содержит ряд сигналов определяющих темп, время транскрипции и отвечающих за инициацию. Другое название этих специфических последовательностей - промоторы, а 5' фланкирующего участка - промоторный. Здесь расположены:
ТАТА - бокс, расположен на 19-27 пар оснований раньше точки инициации транскрипции, отвечает за выбор точки начала транскрипции.
СААТ - бокс и несколько GC - боксов расположены до ТАТА-бокса, они отвечают за присоединение РНК-полимеразы. СААТ и GС боксы активны в обоих ориентациях.
Эти сигналы не являются необходимыми, существуют гены не обладающие ими, но значительно повышают эффективность трансляции.
3' фланкирующая последовательность содержит сигналы терминации транскрипции и поли-А сайт.
Трансляция начинается с сайта инициации транскрипции (это кэп-сайт в транскрипте РНК) и заканчивается в сайте терминации, который часто похож на поли-А сайт зрелой мРНК. Считанная РНК называется предшественником мРНК и содержит 3' и 5' нетранслируемые участки, интроны и экзоны.
Особенностью эукариотического гена является его мозаичное строение . Это делает процесс сплайсинга (или созревания) для мРНК необходимым. В процессе созревания удаляются интроны из мРНК и она определенным образом модифицируется.
Существуют различные типы интронов (Lewin,1990) , наиболее распространенные подчиняются так называемому GU-AG правилу: преобладающее большинство эукариотических интронов начинаются с GU а заканчиваются AG нуклеотидами. Кроме того интроны многих исследованных видов содержат специфическую последовательность называемую UACUAAC бокс, расположенную за 30 пар оснований до 3' конца интрона.
Различные гены могут содержать разное количество интронов, иногда до десятка, и интроны могут быть различной длины, до нескольких тысяч нуклеотидов. В качестве примера на рисунке приведена разметка экзонов для человеческого фактора-IX.
экзоны1 2 3 4 5 6 7 8
Видно, что большая часть последовательности данного гена представлена интронами. Иногда интроны встречаются и не в кодирующих участках, в основном это случается в участках перед стартовым кодоном. Прокариотические белок-кодирующие гены не имеют интронов и содержат другие сигнальные последовательности в 5' нетранслируемом участке: -10 последовательность - известная как Прибнов бокс, расположена за 10 нуклеотидов до сайта инициации транскрипции и содержит последовательность UAUAAU или ее вариант. -35 последовательность - расположена за 35 нуклеотидов до сайта инициации транскрипции и содержит последовательность UAUAAU или ее вариант. Кроме у прокариот встречаются и другие сигнальные последовательности расположенные более чем за 35 нуклеотидных пар до сайта инициации транскрипции.