CRISPR Система: механизм действия, экспрессия
Транскрипция пре-крРНК инициируется с промотора , расположенного внутри лидерной последовательности [ Jansen R., et al., 2002 , Marraffini L.A., Sontheimer E.J., 2008 , Pul U., et al., 2010 , Pougach K., et al., 2010 ]. В некоторых случаях короткие транскрипты могут синтезироваться и с противоположной цепи ДНК CRISPR-кассеты . Возможно, они выполняют регуляторную функцию [ Lillestol R.K., et al., 2009 ]. На сегодняшний день известны два клеточных белка, которые участвуют в регуляции транскрипции CRISPR-кассет E. coli К12, - H-NS и LeuO [ Pul U., et al., 2010 , Westra E.R., et al., 2010 ]. В клетках с делецией гена hns или гиперэкспрессией гена leuO количество cas -транскриптов и крРНК существенно возрастает.
В геноме Thermus thermophilus HB8 насчитывается десять CRISPR/Cas- локусов, еще два находятся на плазмиде pTT27 . C помощью метода геномных микрочипов показано, что уровень транскриптов большинства генов CRISPR/Cas-локусов этого микроорганизма повышается во время инфекции литическим бактериофагом YS40 , несмотря на то, что ни одна из CRISPR-кассет не содержит спейсеров , соответствующих геному фага [ Agari Y., et al., 2010 ]. Кроме того, экспрессия cas-генов этого микроорганизма регулируется белком-рецептором циклического AMP [ Agari Y., et al., 2010 ].
Полноразмерный CRISPR-транскрипт подвергается процессингу ( рис. 2 ). Процессированные транскрипты представляют собой моно- или олигомеры CRISPR-спейсеров и повторов. При изучении E. coli К12, CRISPR/Cas-локус которой относится к группе I по классификации Макаровой и соавт. [ van der Oost, J., et al., 2009 , Makarova K.S., et al., 2006 ], обнаружено, что белки Cse1 (CasA) , Cse2 (CasB) , Cas7 (CasC, Csa2, Csd2, Cse4, Csh2, Csp1 и Cst2) , Cas5 (CasD, Cas5a, Cas5d, Cas5e, Cas5h, Cas5p, Cas5t и Cmx5) и Cas6e (CasE, Cse3) образуют комплекс, получивший название Каскад (Cascade, CRISPR-Activated Complex for Antiviral Defence; комплекс защиты от вирусов, активируемый CRISPR). Состав Каскада можно описать следующей формулой: Cse11Cse22Cas76Cas51Cas6e1. При помощи электронной микроскопии показано, что этот белковый комплекс имеет форму, напоминающую силуэт морского конька [ Jore M.M., et al., 2011 ]. Предложена модель, согласно которой крРНК связывается вдоль протяженной вогнутой поверхности частицы Каскада. Каскад расщепляет полноразмерный транскрипт CRISPR-кассеты E. coli К12 с образованием крРНК длиной 61 н. Для разрезания необходима эндонуклеолитическая активность белка Cas6e (CasE, Cse3) . Участок специфического расщепления пре-крРНК располагается внутри последовательности повтора на расстоянии 8 н. от 5'-конца спейсера. 3'-конец крРНК образует шпильку за счет палиндромной последовательности нуклеотидов, входящей в состав повтора [ Jore M.M., et al., 2011 ]. Зрелая крРНК несет гидроксильную группу на 5'-конце и 2',3'-циклический фосфат на 3'-конце [ Wiedenheft B., et al., 2011 ]. Сашитал и соавт. [ Sashital D.G., et al., 2011 ] получили кристаллическую структуру комплекса крРНК и Cas6e из T. thermophilus. Cas6e связывается с пре-крРНК в районе шпильки, образованной палиндромной последовательностью повтора так, что разрезание пре-крРНК всегда происходит по основаниям, следующим за шпилькой.
CRISPR/Cas-локусы Streptococcus pyogenes относятся к группе II по классификации Макаровой и соавт. [ van der Oost, J., et al., 2009 , Makarova K.S., et al., 2006 ]. В геноме этого микроорганизма нет генов cas6, cas6f (csy4) и cas6e (casE, cse3), ответственных за процессинг пре-крРНК в других системах. Группой под руководством Шарпантье [ Deltcheva E., et al., 2011 ] обнаружено, что процессинг пре-крРНК в этой системе осуществляет белок Cas9 (Csn1, Csx12) в комплексе с клеточной РНКазой III и малой некодирующей РНК tracrRNA . Молекулы tracrRNA комплементарно связываются с последовательностями повторов в пре-крРНК, а РНКаза III в присутствии Cas9 разрезает дуплекс с образованием фрагментов CRISPR-РНК длиной 66 н. Эти фрагменты содержат последовательность спейсера, которая фланкирована повторами и впоследствии процессируются с образованием зрелой крРНК длиной 39?42 н. ( рис. 3 ). Механизм этого более глубокого процессинга пока не известен.
Процессинг молекул пре-крРНК у P. furiosus , CRISPR/Cas-локусы которого относятся к группе III по классификации Макаровой и соавт. [ van der Oost, J., et al., 2009 , Makarova K.S., et al., 2006 ], сходен с таковым у E. coli [ Hale C., et al., 2008 ]. Разрезание пре-крРНК на короткие фрагменты осуществляется по последовательностям повторов. 5'-концы образовавшихся крРНК всегда содержат "ручку" (handle) из восьми последних нуклеотидов повтора. 3'- концы крРНК варьируют, что приводит к образованию двух классов крРНК длиной порядка 39 и порядка 45 н. Карте и соавт. [ Carte J., et al., 2008 ] показали, что процессинг пре-крРНК P. furiosus осуществляется белком Cas6 (Cmx6) , входящим в группу " коровых " Cas-белков. Им также удалось выявить участок специфического связывания этого белка на молекуле РНК- предшественника. Этот участок представляет собой первые 12 н. повтора. Далее по направлению к 3'-концу повтора, на расстоянии 10 н. от участка специфического связывания Cas6, находится сайт разрезания пре-крРНК. Связывание нарушается как в случае изменения последовательности этого участка, так и в случае изменения расстояния между участком связывания и участком разрезания. Для разрезания (при условии сохранения связывания) требуется динуклеотид AA на расстоянии восьми нуклеотидов от 3'-конца повтора; введение замен в динуклеотид AA препятствуют расщеплению. Интересно, что чем дальше спейсер находится от последовательности лидера, тем меньшее количество соответствующей крРНК P. furiosus обнаруживается в клетке. Такой градиент, возможно, обусловлен терминацией транскрипции на последовательностях палиндромных повторов, образующих тугоплавкие шпильки.