Методы, основанные на сравнении последовательностей фрагментов ДНК
За более чем вековую историю изучения микроорганизмов появилось множество подходов для оценки и изучения их разнообразия в естественных сообществах. Долгое время разнообразие микроорганизмов в природных экосистемах оценивалось путем выделения чистых культур микроорганизмов из исследуемых образцов. Такой подход, помимо значительной трудоемкости, приводил к сильной недооценке истинного разнообразия, т.к., согласно современным данным, менее 1% бактерий, присутствующих в образце, поддается культивации [ 8 ].
Значительным шагом вперед стало применение молекулярных методов, которые основаны на исследовании и сравнении последовательностей ДНК отдельных генов или целых геномов организмов, находящихся в образце. Эти работы позволили выявить и описать новые филогенетические группы прокариот , для многих из которых до настоящего времени не получено культивируемых представителей.
При описания филогенетического разнообразия для определения таксономической принадлежности микроорганизмов принято использовать последовательность ДНК одного из генов домашнего хозяйства микроорганизмов. На ранних этапах экологических исследований использовали ген rpoB , кодирующий фрагмент бета субъединицы РНК-полимеразы прокариот или ген фактора трансляции Ef-Tu . Оба эти гена присутствуют в геномах всех бактерий и являются высоко консервативными, не подвержены, по-видимому, горизонтальному переносу, и поэтому удобны для анализа таксономического состава сообществ [ 16 ]. Тем не менее, начиная с середины 90-х годов гораздо более широкое распространение получила оценка разнообразия, основанная на сравнении последовательностей фрагментов генов 16S рРНК бактерий [ 17 ].
С развитием технологий высокопродуктивного секвенирования без типирования бактерий по последовательности генов 16S рРНК не обходится ни одно метагеномное исследование. В настоящее время все биоинформатические ресурсы и базы данных для филогенетического анализа используют в качестве филогенетического маркера именно эти последовательности. Самые распространенные биоинформатические ресурсы - это Ribosomal Database Project ресурс (или сокращенно RDP) [ 18 ] и Greengenes database ресурс [ 19 ].
Длина последовательности гена 16S рРНК составляет примерно 1500 п.о., и включает как строго консервативные, так и более вариабельные участки. Более консервативные участки обладают меньшей разрешающей способностью при определении филогенетической принадлежности. Поэтому для филогенетического анализа на уровне родов и видов используют вариабельные участки гена 16S рРНК. Многочисленные исследования были проведены для выявления участков 16S рРНК гена, обладающих наиболее высокой разрешающей способностью. Ими оказались участки V2 , V3 , V4 , V5 и V6 [ 20 ], которые представлены на Рис. 1.
Однако, имеется ряд ограничений интерпретации результатов анализа последовательностей гена 16S рРНК. Самое серьезное из них заключается в том, что в геноме одной бактерии может содержаться несколько копий рибосомальных генов (от 1 до 15, а в среднем - 4,2). Нуклеотидные последовательности этих копий могут различаться [ 22 ]. Хотя в большинстве геномов такие вариации составляют менее 1% [ 17 ], в геноме бактерии Aeromonas veronii имеются шесть копий генов 16S рРНК, последовательности которых различаются между собой до 1,5% [ 23 ], a в геноме Thermobispora bispora - две копии генов 16S рРНК различаются на 6,4% [ 24 ]. Таким образом, в некоторых случаях уровень отличий последовательностей гена 16S рРНК внутри одного генома сопоставим со значениями, характерными для разных видов или даже родов бактерий.
Другим ограничением использования последовательностей гена 16S рРНК для оценки разнообразия сообществ является то, что идентичность двух сравниваемых последовательностей 16S рРНК гена вообще говоря не означает идентичность остальных частей геномов. Например, в двух штаммах Bacillus globisporus и Bacillus psychrophilus гены 16S рРНК идентичны более чем на 99,7%, однако при определении родства методом ДНК-гибридизации, было показано, что геномные ДНК двух этих штаммов гибридизуются между собой лишь на 25-50%. Бактерии считаются принадлежащими к одному виду, если уровень гибридизации их ДНК равен или превышает 70% [ 23 ]. Аномально высокий уровень идентичности последовательностей гена 16S рРНК внутри одного рода (около 0,03% замен), также наблюдается у Streptococcus , Vibrio , Escherichia , Bacillus , Pantoea , Acinetobacter , Achromobacter , Stenotrophomonas и Actinomyces [ 23 ]. Другими словами, идентификация организмов по последовательности гена 16S рРНК может давать неточные результаты на уровне таксонов низких порядков.
Таким образом, определение видовой принадлежности у бактерий по последовательностям гена 16S рРНК - не однозначный процесс. Изначально, порог уровня сходства для представителей одного вида определялся как >97% идентичности последовательности фрагментов гена 16S рРНК [ 25 ], затем его увеличили до 98,7-99% [ 26 ]. Позже, при оценке степени сходства последовательностей ДНК бактерий внутри одного вида было предложено использовать порог в 99,3% идентичности последовательности гена 16S рРНК, а на уровне рода - 95,6% [ 22 ]. Для более высоких таксонов ( семейство , класс , тип ) границы еще более размыты и устанавливаются индивидуально в каждом конкретном случае. Пользуясь вышеописанными оценками уровня сходства в большинстве случаев (>90%) с помощью анализа последовательностей фрагментов гена 16S рРНК удается определить бактерию до рода , а в 65-83% случаев - до вида [ 23 ]. Точность определения филогенетической принадлежности микроорганизмов также зависит от длины анализируемой последовательности гена 16S рРНК: чем длиннее последовательность ДНК, тем с большей точностью можно определить таксономическую принадлежность бактерии [ 18 ], Рис. 2 .
Серьезная проблема, которая возникает при попытке определить филогенетическую принадлежность бактерий, - это различные ошибки, содержащиеся в последовательностях ДНК, депонированных в базах данных. Для 16S рРНК генов было показано, что около 3% последовательностей из баз данных являются артефактами - химерные последовательности, а около 2% - содержат ошибки секвенирования [ 23 ]. Кроме того, представленность разных таксонов в базе данных GenBank очень сильно варьирует, что вносит неточности в определение редких таксонов. Большинство доступных на сегодняшний день геномов бактерий принадлежат к филуму Proteobacteria (среди них, большая часть относится к Gammaproteobacteria , Alphaproteobacteria и Betaproteobacteria ), Firmicutes , и Actinobacteria . Напротив, такие таксоны как Caldiserica , Elusimicrobia , Gemmatimonadetes , Ignavibacteria , и Thermodesulfobacteria представлены в базе данных только одним геномом [ 22 ].
Для установления последовательности ДНК генов 16S рРНК используются различные технологии секвенирования. Классический метод секвенирования - это капиллярное секвенирование по Сэнгеру . Этот метод позволяет определить последовательность ДНК фрагмента длиной до 1000 п.о., при этом требуется предварительное разделение ДНК фрагментов из смеси с помощью молекулярного клонирования. Большинство исследований таксономического состава сообщества с помощью капиллярного секвенирования ограничивались анализом не более чем сотни клонов, содержащих последовательность гена 16S рРНК [ 27 ]. Однако, разнообразие микроорганизмов в большинстве природных образцов многократно превышает возможности этого метода [ 28 ].
С развитием технологий высокоэффективного секвенирования появилась возможность более полного описания разнообразия микробных сообществ [ 27 ]. Существует несколько технологий секвенирования следующего поколения: 454 пиросеквенирование (Roche) , секвенирование синтезом (Illumina) , ионный полупроводник (Ion Torrent) , секвенирование на основе лигирования (SOLiD) и другие [ 28 ]. Все они могут быть с успехом использованы для анализа разнообразия микробных сообществ.
На этапе, предшествующему собственно секвенированию, проводят реамплификацию ранее амплифицированных фрагментов генов 16S рРНК с праймерами, содержащими баркоды (короткие уникальные для каждого образца последовательности ДНК внутри последовательности праймеров) [ 29 ]. Это позволяет одновременно анализировать ДНК из нескольких сообществ, т.к. баркоды дают возможность вычленить последовательности, относящиеся к разным образцам. В ходе дальнейшего биоинформатического анализа миллионов последовательностей ДНК, полученных в результате высокопродуктивного секвенирования, происходит выбраковка последовательностей плохого качества и объединение последовательностей в группы на основании степени сходства [ 29 ]. Стандартным является объединение последовательностей 16S рРНК, различающихся менее чем на 3%, в ОТЕ (операционные таксономические единицы, operational taxonomic unit - OTU ).
Помимо секвенирования фрагментов генов 16S рРНК существует множество альтернативных методик, позволяющих описать микробное разнообразие в образце. Например, метод рестрикционного анализа продуктов амплификации гена 16S рРНК (amplified ribosomal DNA restriction analysis, ARDRA ), который был предложен в 1995 г. ( Vaneechoutte, 1995 ). Метод основан на амплификации достаточно протяженных фрагментов генов 16S рРНК на матрице геномной ДНК чистых культур бактерий. Полученные ампликоны обрабатывают эндонуклеазами рестрикции, и продукты рестрикции затем разделяют с помощью гель-электрофореза. Различные бактерии обладают уникальным паттерном распределения длин ДНК фрагментов, что позволяет проводить быстрое типирование изолятов [ 30 ].
Для описания разнообразия сообществ микроорганизмов также используют метод электрофореза в денатурирующем геле (denaturing gradient gel electrophoresis, DGGE ) [ 31 ]. На матрице выделенной тотальной ДНК сообщества проводят амплификацию участка гена 16S рРНК. Полученные фрагменты затем разделяют с помощью высокоразрешающего денатурирующего градиентного гель-электрофореза. По полученным паттернам амплифицированных ДНК фрагментов можно судить о сложности микробного сообщества, о динамике внутри сообщества, о различиях в структуре сообщества между образцами.