Образование семейств генов и приобретение новых функций: введение
Полная дупликация гена образует две идентичные копии. То, как они будут эволюционировать, зависит от конкретного случая. Эти копии, например, могут сохранить первичную функцию и предоставят, таким образом, организму способность производить большие количества определенной РНК и/или белка. В другом случае одна из копий может стать неактивной за счет накопления вредных мутаций и превратится в лишенный функции псевдоген. Или, что более важно, генная дупликация может привести к возникновению нового гена. Такое событие произойдет в том случае, если один из дуплицированных участков сохранит свою первоначальную функцию, тогда как другой постепенно претерпит такие молекулярные изменения, что со временем станет способен выполнять какую-то новую фунуцию.
Повторенные гены можно разделить на две группы: вариантные и инвариантные повторы. Инвариантные повторы имеют идентичные или почти идентичные последовательности. В некоторых случаях можно показать, что повторение идентичных последовательностей коррелирует с синтезом повышенных количеств генного продукта, необходимого для нормального функционирования организма. Подобные повторы называют дозовыми повторами. Дозовые повторы встречаются везде, где возникает метаболитическая потребность в производстве больших количеств специфических РНК или белков ( Ohno, 1970 ). Подобные примеры включают гены рРНК и тРНК, которые необходимы для трансляции, а также гистоновые гены, которые образуют основной белковый компонент хромосом и, поэтому, должны синтезироваться в больших количествах.
Вариантные повторы состоят из сходных копий генов, последовательности которых в большей или меньшей степени отличаются друг от друга. Интересно, что вариантные повторы иногда могут выполнять заметно различающиеся функции. Например, тромбин, который режет фибриноген во время процесса свертывания крови, и пищеварительный фермент трипсин когда-то возникли в процессе полной генной дупликации. Сходным образом, лактальбумин, одна из субъединиц фермента, катализирующего синтез лактозы, и лизозим, который "растворяет" определенные типы бактерий посредством расщепления полисахаридного компонента клеточных стенок, имеют общее эволюционное происхождение. Появление различий в выполняемых функциях обычно требует накопления большого количества замен. Тем не менее, при определенных обстоятельствах, новая функция может появиться после относительно малого количества замен ( Betz et al, 1974 ).
Все гены, принадлежащие к определенной геномной группе повторенных последовательностей, называют генным семейством или мультигенным семейством. Члены мультигенного генного семейства обычно находятся на одной хромосоме рядом друг с другом. В некоторых случаях какие-нибудь функциональные или нефункциональные члены семейства могут находиться на другой хромосоме.
Когда дуплицированные гены начинают значительно различаться друг от друга либо функционально, либо по составу последовательности, становится не слишком удобно относить их к одному и тому же семейству. Термин суперсемейство был предложен Dayhoff (1978) для того, чтобы ввести некоторое разграничение между близкородственными и более дивергировавшими белками. Согласно этой классификации белки, демонстрирующие по-крайней мере 50% сходства на аминокислотном уровне, считаются членами семейства, тогда как гомологичные белки сходные менее чем на 50% считаются членами суперсемейства. Например, альфа- и бета-глобиновые гены относятся к двум различным семействам, а вместе с миоглобином они образуют суперсемейство глобинов. Однако, эти два термина (семейство и суперсемейство) не всегда возможно использовать строго согласно критериям, предложенным Dayhoff. Например, альфа-глобиновые цепи человека и карпа демонстрируют только 46% сходства, что ниже соответствующего предела для отнесения их к одному семейству. Поэтому классификацию белков на семейства и суперсемейства проводят не только на основе сходства последовательностей, но и на основе некоторой дополнительной информации, касающейся функционального сходства или тканевой специфичности.
Число генов внутри генного семейства значительно варьирует. Некоторые гены повторены в геноме всего несколько раз и относятся к так называемым низкоповторенным генам. Другие могут повторяться в геноме сотни раз и называются высокоповторенными генами.