Метагеномный анализ сообществ антарктического снега

Анализ библиотек фрагментов генов 16S рРНК позволяет описать таксономический состав бактерий, но не позволяет получить информацию о других микроорганизмах, находящихся на поверхности снега (эукариот, вирусов), а также не дает полного представления о наличии специфических адаптаций снежных микробов. Для более полного описания таксономического состава антарктического снежного сообщества мы провели метагеномное секвенирование случайных фрагментов ДНК в полученных образцах. ДНК сообществ снега четырех станций использовалась в качестве матрицы для высокопроизводительного секвенирования на платформе Иллюмина с покрытием около 500000 парных прочтений на каждый образец. Полученные прочтения фильтровали по качеству, длине, затем совмещали парные прочтения, как описано в разделе МЕТОДЫ ИССЛЕДОВАНИЯ РАЗНООБРАЗИЯ МИКРООРГАНИЗМОВ СНЕГА АНТАРКТИДЫ

К настоящему времени получен значительный массив данных, собранных методом высокопроизводительного секвенирования метагеномомных библиотек из различных экосистем. Эти данные объединены в общедоступной базе MG-RAST [ 135 ]. Данные метагеномного секвенирования, полученные в настоящей работе, также были добавлены в эту базу данных. Краткое описание образцов и номера, присвоенные им базой данных MG-RAST, указаны в Табл. 1 Приложения . Поиск генов в полученных ДНК последовательностях и определение их таксономической принадлежности проводили на сервере MG-RAST с помощью пакета "Best hit Classification" ( Табл. 9 ).

Как видно из Таблицы 9 , большинство метагеномных последовательностей принадлежали представителям домена Bacteria , и лишь небольшая доля последовательностей относилась к другим доменам жизни. Это означает, что полученные нами данные по секвенированию амплифицированных библиотек фрагментов генов 16S РНК достаточно полно описывают разнообразие сообществ снежных микроорганизмов. Действительно, коэффициент корреляции Пирсона между соотношениями таксономических групп, выявленными при анализе метагеномнымных библиотек и библиотек фрагментов генов 16S РНК для каждой станции составил 0,97-0,99 (p-value<0,05) на уровне классов ( Рис. 12 ) и 0,68-0,86 (p-value<0,05) на уровне родов.

Менее 1% случайных метагеномных последовательностей содержали фрагменты генов 16S рРНК . Мы экстрагировали эти последовательности из метагеномных данных и провели их таксономический анализ с помощью пакета программ RDP. Сравнивали соотношение таксономических групп, полученных в ходе этого анализа, с соотношением таксономических групп, определенным при анализе библиотек амплифицированных фрагментов генов 16S рРНК. Коэффициент корреляции Пирсона составил 0,94-0,98 (p-value<0,05) для образцов со всех станций. Таким образом, ПЦР амплификация фрагментов V3-V4 гена 16S рРНК с использованными вырожденными праймерами не внесла существенного смещения в пропорции таксономических групп микроорганизмов, присутствующих в образце.

Последовательности ДНК эукариот были лучше всего представлены в образце со станции Мирный, где их доля составила 15% ( Табл. 9 ). Большинство из них относилось к диатомовым водорослям Bacilariophyta , что, скорее всего, было связано с выбором места отбора образцов снега - снег на этой станции отбирали непосредственно над морским льдом. Как было показано выше, доля последовательностей рода Bacillariophyta в библиотеках амплифицированных фрагментов генов 16S рРНК составила 24%. Образцы из остальных трех станций содержали около 1% эукариотических последовательностей ( Табл. 9 ). Самыми распространенными из них были последовательности Streptophita (Растения) , Chordata (Хордовые) , Arthropoda (Членистоногие) , Ascomycota (Аскомицеты) и Аpicomplexa (эндопаразитические простейшие животных) , представители которых не являются эндогенными обитателями поверхностного снега Антарктиды. Учитывая гораздо большие (по сравнению с бактериальными) размеры геномов этих эукариот, можно заключить, что примеси чужеродного для антарктических снежных сообществ генетического материала в образцах были минимальны.

Помимо прокариотических и эукариотических последовательностей, мы обнаружили около 400 последовательностей ДНК из вирусных геномов. Интересно, что 70% вирусных последовательностей на станции Прогресс и до 50% на станции Дружная принадлежали эукариотическим вирусам. Большая их часть соответствовала фрагментам генома гигантского вируса амебы Pandoravirus sp . Некоторые из обнаруженных последовательностей имели 100% сходство с изолированным из австралийского озера в 2013 году пандоравирусом Pandoravirus dulcis [ 169 ]. Пандоравирусы были обнаружены в различных морях по всему миру [ 170 ], а совсем недавно - в антарктическом озере и почве Сухой Долины [ 171 , 172 ]. Другой гигантский вирус, Pithovirus sibericum , был недавно обнаружен в образцах вечной мерзлоты в Сибири [ 173 ].

Остальные вирусные последовательности соответствовали фрагментам геномов бактериофагов - вирусов бактерий. Большинство из них относились к семейству хвостатых фагов Caudovirales , которые доминируют в природных экосистемах с преобладанием бактерий [ 174 ]. На станции Прогресс самыми многочисленными были последовательности, сходные с последовательностями бактериофага 6H , заражающего флавобактерии . Это представляется логичным, т.к. Flavobacteriа были самым многочисленным родом бактерий, найденным в образце с этой станции. Однако в образцах из других станций нам не удалось выявить корреляции между детектируемыми бактериями и бактериофагами. Например, среди наиболее представленных групп фагов на станции Ленинградская можно выделить фаг AcaML1 Acidithiobacillus , а на станции Мирный - фаг HTVC008M Pelagibacter . Однако бактерии родов Acidithiobacillus и Pelagibacter в соответствующих образцах обнаружены не были.

Содержание ДНК последовательностей архей было крайне низким во всех четырех метагеномных библиотеках (менее 0,2%), что согласуется с отсутствием продуктов амплификации фрагментов генов 16S рРНК архей.

Ссылки: