Анализ последовательностей спейсеров в CRISPR локусах

Последовательности фрагментов CRISPR кассет F. psichrophillum амплифицировали с праймерами Flavo_F и Flavo_R ( Табл. 2 ), полученный препарат разделяли с помощью гель-электрофореза в агарозном геле, фрагменты длиной от 200 п.о. до 500 п.о. очищали из геля и подвергали высокопроизводительному секвенированию, как указано выше. Глубина прочтения для каждого образца составляла 500000 пар прочтений. Предварительную обработку прочтений проводили с помощью программы CLC Genomics Workbench 6 (CLC Bio-Qiagen, Aarhus, Дания) как указано выше.

Последовательности спейсеров из ДНК фрагментов, содержащих CRISPR кассеты, извлекали биоинформатически с помощью пакета IRanges DNAStringSet в среде статистических вычислений R. Объединение схожих по последовательности спейсеров в кластера спейсеров проводили с помощью алгоритма кластеризации K-mean [ 139 ], диаметр кластеров (максимальное допустимое число замен между спейсерами внутри одного кластера) составлял 5 п.о., конечный набор кластеров для каждого образца не содержал идентичных кластеров. Для попарного сравнения сетов кластеров спейсеров между образцами создавали локальные базы данных из наборов спейсеров каждого образца с помощью биоинформатической программы blastmkdb пакета Blast+, установленной в виде пакета утилит для командной строки. Сравнение спейсеров из разных баз данных проводили с помощью биоинформатической программы blastn пакета Blast+ [ 140 ]. Поиск соответствий кластеров спейсеров с последовательностями в базах данных nt и env_nt GenBank осуществляли с помощью биоинформатической программы blastn пакета Blast+, встроенного в биоинформатический интернет-ресурс Galaxy [ 141 , 142 , 143 ].

Поиск протоспейсеров проводили с помощью биоинформатической программы "CRISPRTarget online tool" [ 144 ]. Поиск PAM мотива проводили с помощью биоинформатической программы "WebLogo" [ 145 ].

Ссылки: