Транскрипционные факторы: Принципы классификации

Специфичность взаимодействия транскрипционных факторов (ТФ) с распознаваемыми ими регуляторными последовательностями генов определяется преимущественно особенностями их ДНК-связывающих доменов . Многие факторы связываются с ДНК в виде димеров (мультимеров), и состав этих комплексов также может влиять на специфичность связывания с ДНК.

Предлагаемая классификация транскрипционных факторов опирается на совокупность свойств их ДНК-связывающих доменов. В некоторых случаях учитываются и особенности димеризационных доменов ТФ. Таким образом, основные подразделы классификации определяются функциональными и структурными критериями. Один из низших уровней иерархии задается генами, кодирующими транскрипционные факторы, а самый низший соответствует различным белкам, образующимся при альтернативном сплайсинге одной пре-мРНК. Предложенная классификация позволяет приписать отдельному транскрипционному фактору десятичный классификационный код, соответствующий его принадлежности к определенной группе ТФ.

Два белка различных биологических видов при наличии выраженной функциональной или структурной гомологии рассматриваются в рамках предложенной классификации как один и тот же фактор. Однако часто бывает трудно или даже невозможно установить отношения сходства между транскрипционными факторами, происхождение которых сильно различается, например, белками позвоночных и насекомых. Поэтому в большинстве случаев ТФ позвоночных, насекомых, высших растений и грибов приписываются в этой классификации к различным группам.

В соответствии с предложенной схемой все ТФ по ключевым особенностям ДНК-связывающих доменов разделены на четыре следующих суперкласса:

Суперкласс 1 . Факторы, ДНК-связывающий домен которых обогащен положительно заряженными аминокислотными остатками ( basic domain 284 фактора).

Суперкласс 2 . Факторы, у которых ДНК-связывающий домен формируется с участием координированных ионов цинка ( zinc-coordinated DNA-binding domain, 148 факторов).

Cуперкласс 3 . Факторы, имеющие ДНК-связывающий мотив типа спираль-поворот-спираль ( helix-turn-helix DNA binding motif, 369 факторов ).

Суперкласс 4 . Факторы, у которых поверхность, контактирующая с ДНК, представлена в виде сложным образом организованного скэффолда из бета-нитей. Контакты с ДНК в этом случае осуществляются по малой бороздке ( betta-scaffold factors with minor grooves contacts,156 факторов).

Существует также большая группа транскрипционных факторов с неизвестной в настоящее время структурной организацией ДНК- связывающих доменов, которые относятся к условному суперклассу 0.

Наименования более низких уровней классификации выбраны произвольным образом (по аналогии с классификацией биологических видов). 

Класификация проводится, как правило, в соответствии с основными структурными характеристиками ДНК-связывающих доменов определены классы. Эти классы являются общепринятыми в литературных источниках. Они использованы в базе данных TRANSFAC и описаны там в таблице CLASS [ Wingender E. et al., 1996 ]. В большинстве случаев принадлежность какого-либо ТФ к определенному классу, указанная в Классификации , не вызывает сомнений. Произошло лишь несколько изменений в разбиении факторов на уровне классов, наиболее крупным из которых является объединение ТФ типов Myb и Ets в общий класс факторов, имеющих триптофановый кластер.

Вполне очевидным является деление большинства классов на семейства. Так, внутри класса bZIP факторы типов AP-1, CREB, и C/EBP отнесены к отдельным семействам, что обусловлено, в первую очередь, различиями в формировании ДНК-белковых комплексов. 

Во многих семействах классификация может быть продолжена путем деления cемейств на подсемейства. При построении кода классификации каждому подсемейству, входящему в состав семейства, приписывается определенный номер. При этом цифра "0" используется наравне со значащими цифрами (1, 2, ...) для тех факторов, которые пока не могут быть приписаны к какому-либо из известных подсемейств. Однако, в ряде случаев деление на подсемейства не имеет смысла (в первую очередь при наличии ограниченного набора факторов). Таким образом, четвертый уровень классификации (подсемейство) является необязательным.

Классификация ТФ в соответствии с изложенными принципами представлена в Классификации по Вингендеру . Можно видеть, что она описывает принадлежность фактора к определенной группе до уровня подсемейства. Два ниже лежащих уровня (род фактора и вид фактора) не представлены.

Общее число регуляторных белков составляет несколько тысяч. Суммированая информация о 996 известных факторах транскрипции представленна в базе данных TRANSFAC к концу 1999 г. Классификация основана на гомологии первичных и вторичных структур факторов транскрипции. Каждому фактору соответствует пятизначный цифровой код, первая цифра которого относится к суперклассу, вторая - к классу, третья - к семейству, четвертая - к подсемейству, пятая является видовой характеристикой фактора.

Ссылки: