CRISPR-Cas Последовательности в метагеномax антарктических микробов
Анализ типов CRISPR-Cas последовательностей в метагеномax антарктических микробных сообществ.
CRISPR кассеты , входят в состав CRISPR-Cas систем адаптивного иммунитета прокариот , обеспечивающих защиту от вирусов и плазмид. CRISPR кассета состоит из коротких повторяющихся участков (повторов), разделенных уникальными последовательностями ( спейсерами ) [ 32 ]. Первичный транскрипт CRISPR кассеты, ( пре-крРНК ) процессируется с образованием CRISPR РНК ( крРНК ), каждая из которых содержит последовательность одного спейсера и фланкирующих фрагментов повторов. При комплементарном взаимодействии комплекса Cas белков с крРНК с мишенью - как правило, участком ДНК бактериофага - происходит деградация чужеродной ДНК. Последовательность ДНК бактериофага, комплементарная спейсеру, называется протоспейсером . Кроме комплементарного взаимодействия спейсера крРНК и протоспейсера мишени в случае CRISPR-Cas систем первого и второго типов к протоспейсеру должен примыкать дополнительный мотив, состоящий из двух- трех нуклеотидов, называемый PAM (protospacer adjacent motif) , последовательность которого различается для CRISPR-Cas систем из различных микроорганизмов.
Около 40% отсеквенированных геномов бактерий и около 90% отсеквенированных геномов архей содержат CRISPR кассеты [ 32 ]. В среднем, в одной CRISPR кассете насчитывается около 60 спейсеров. Повторы, соответствующие CRISPR-Cas системе одного типа, как правило являются специфичными для одного вида бактерий, тогда как наборы спейсеров часто уникальны для отдельных штаммов одного вида [ 33 ]. Таким образом, анализ набора спейсеров в CRISPR кассетах является чувствительным инструментом для выявления отличий между штаммами внутри одного рода или вида для широкого спектра микроорганизмов.
Мы провели биоинформатический поиск CRISPR кассет в метагеномных последовательностях микроорганизмов антарктического снега с помощью программы поиска CRISPR кассет CRASS (от CRISPR assembler, "сборщик CRISPR"). Эта программа проводит поиск не менее трех повторяющихся участков ДНК длиной от 23 до 47 нуклеотидов, расположенных на удалении 26-50 нуклеотидов друг от друга, т.е. ищет участки, содержащие как минимум три повтора, разделенные двумя спейсерами [ 138 ]. Нам удалось найти фрагменты CRISPR кассет в метагеномах всех четырех станций. Последовательности повторов из этих кассет и количества спейсеров в CRISPR кассетах, ассоциированных с каждым из найденных типов повторов, представлены в Таблице 3 Приложения . Лишь малая часть из найденных нами последовательностей повторов соответствовала повторам в уже известных CRISPR кассетах, доступных в базе данных GеnBank. Среди известных повторов был обнаружен 46- нуклеотидный повтор из CRISPR кассеты Flavobacterium psychrophilum (CRISPR-Cas система подтипа II-C) [ 182 ]. Фрагменты кассет, содержавших этот повтор, были найдены в образцах снега, собранного на станциях Прогресс, Дружная и Ленинградская. Другой повтор, найденный в образцах со станций Ленинградская и Прогресс, был идентичен 36 нуклеотидному повтору кассеты Flavobacterium columnare (CRISPR-Cas подтипа II-B) [ 182 ]. Как указано выше, Flavobacterium был самым многочисленным родом в образцах со станции Прогресс (40% от всех найденных последовательностей ДНК) и был менее представлен на станциях Дружная (4%), Ленинградская (0,1%) и Мирный (0,1%).
570 спейсеров, найденных в метагеномных библиотеках четырех образцов, сравнили с базой данных спейсеров CRISPR [ 183 ], однако соответствий найдено не было. Сравнение этого же набора спейсеров с нуклеотидной базой данных GenBank выявило соответствие одного спейсера из образца станции Прогресс, ассоциированного с 36- нуклеотидным повтором F. columnare, с последовательностью фрагмента генов 16S рРНК Flavobacterium sp. 136G. Такое совпадение может указывать на участие CRISPR-Cas системы в предотвращении генетического обмена между родственными штаммами/видами флавобактерий.
Последовательность PAM для CRISPR-Cas системы подтипа II-С F. columnare (с 36-нуклеотидным повтором) ранее не была определена. Мы проанализировали 43 спейсера Flavobacterium columnare , находящиеся в базе данных CRISPR [ 183 ] и нашли четыре соответствия участкам генома флавобактериофага FCL-2 . Выравнивание последовательностей, прилегающих к 3'-концу идентифицированных протоспейсеров, выявило консервативный мотив TAA, расположенный в пяти нуклеотидах от 3'-конца протоспейсера ( Рис. 15 ). Возможно, что данная последовательность является PAM мотивом CRISPR-Cas системы F. columnare. Единственный протоспейсер, выявленный в ходе анализа антарктических спейсеров не содержал такого тринуклеотидного мотива, и, следовательно, не должен узнаваться CRISPR-Cas системой.