Бесплатный автореферат и диссертация по биологии на тему
Новые методы анализа динамики почвенного микробиома, изученной с использованием метагеномных технологий
ВАК РФ 03.02.03, Микробиология

Автореферат диссертации по теме "Новые методы анализа динамики почвенного микробиома, изученной с использованием метагеномных технологий"

САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

На правах рукописи

НОВЫЕ МЕТОДЫ АНАЛИЗА ДИНАМИКИ ПОЧВЕННОГО МИКРОБИОМА, ИЗУЧЕННОЙ С ИСПОЛЬЗОВАНИЕМ МЕТАГЕНОМНЫХ ТЕХНОЛОГИЙ

03.02.03 - Микробиология

005060059

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата биологических наук

ПЕРШИНА

Елизавета Владимировна

Санкт-Петербург - 2013

005060059

Работа выполнена в государственном научном учреждении «Всероссийский научно-исследовательский институт сельскохозяйственной микробиологии» Российской академии сельскохозяйственных наук (Санкт-Петербург).

Кандидат биологических наук Андронов Евгений Евгеньевич (ГНУ ВНИИСХМ Россельхозакадемии)

Доктор биологических наук, профессор Квитко Константин Васильевич (Санкт-Петербургский государственный университет)

Кандидат биологических наук Алехина Ирина Александровна (Арктический и Антарктический научно-исследовательский институт)

Институт биохимии им. А.Н. Баха РАН

Защита состоится "/гГ. г. в ч на заседании

объединенного совета ДМ212.232.07 по защите докторских и кандидатских диссертаций при Санкт-Петербургском государственном университете по адресу: 199034, Санкт-Петербург, Университетская наб., 7/9, Биолого-почвенный факультет, аудитория . Тг?.-?

Факс для отзывов: +7 (812) 4704362

С диссертацией можно ознакомиться в библиотеке им. М. Горького Санкт-Петербургского государственного университета.

Автореферат разослан «/У » МСи\ 2013 г.

Научный руководитель:

Официальные оппоненты:

Ведущая организация:

Ученый секретарь диссертационного совета

Е.И. Шарова

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ Актуальность работы.

Долгое время изучение почвенных микробных сообществ было основано на выделении культур микроорганизмов с последующим изучением их свойств. При этом прямой подсчет клеток микроорганизмов в почве показал, что их число примерно на порядок превышает оценки численности, полученные с использованием методов культивирования. Анализ почвенной ДНК подтвердил наличие в почве большого числа некультивируемых микроорганизмов, доля которых может составлять до 90% от состава сообщества. Доступ к изучению некультивируемых микроорганизмов появился только с внедрением в микробиологическую практику молекулярно-генетических подходов (Rondon et al., 1999). Уже сейчас становятся очевидными перспективы применения этих методов в почвенной микробиологии. В первую очередь, это возможность более полного исследования почвенного микробиома, в перспективе включающее изучение свойств не только культивируемых, но и некультивируемых микроорганизмов, определение состава и функций почвенных микробных ассоциаций, выяснение объема и функциональной нагрузки почвенного микробного сообщества и его генетического потенциала.

В начале своего развития исследования почвенного микробиома были ограничены отсутствием эффективных методик секвенирования (Wooley et al., 2010), но с появлением методов секвенирования нового поколения (производительность которых сейчас достигает 1 ООО Gb/запуск) ситуация изменилась и на первый план вышли проблемы, связанные с анализом и биологической интерпретацией метагеномных данных (Sboner et al., 2011). Наиболее распространенным является использование стандартных экологических методов оценки биоразнообразия, включающих два аспекта: редукционистский, связанный с анализом встречаемости и функциональной нагрузки отдельных таксонов в пробах и холистический, основанный на определении интегральных характеристик сообщества (например, показателей «richness» - видовое богатство и «eveness» -выровненность разнообразия) и сравнительном анализе микробиомов (с использованием разнообразных методов многомерной статистики, в частности, кластерного анализа). Применение стандартных экологических методик к анализу метагеномных данных породило ряд проблем как в редукционистском, так и в холистическом подходах. В первом случае, обилие видов микроорганизмов в пробах (количество видов в 1 грамме почвы может исчисляться несколькими тысячами) значительно затрудняет работу со «списками организмов». Особенно остро эта проблема встает при проведении крупномасштабных мониторинговых исследований и исследований по биогеографии микроорганизмов (Fierer, 2008), где требуется анализ списков, содержащих несколько тысяч и сотен тысяч видов. Одним из решений может стать систематизация данных по биоразнообразию, позволяющая связать появление в «списках» тех или иных микроорганизмов с действием определенного экологического фактора.

Еще одной проблемой метагеномного анализа является наличие в «списках» большого количества неидентифицируемых последовательностей, доля

которых может достигать 60% от состава ампликонной библиотеки (Sul et al., 2011). Единственным инструментом для работы с неидентифицируемыми последовательностями является их объединение в ОТЕ (Операционные Таксономические Единицы - аналоги биологических видов - группы последовательностей 16S рРНК, объединенные по установленному критерию гомологии, как правило 97%). После этой процедуры возможно проведение сравнительного анализ микробиомов по содержанию в них тех или иных ОТЕ. Для этого используются интегральные методы оценки биоразнообразия, главными из которых являются PCoA (Principal Components Analysis, англ. Метод Главных Компонентов) и кластерный анализ. Наряду с очевидными достоинствами имеющихся инструментов для интегральной оценки биоразнообразия (Lozupone et al., 2011), они имеют один существенный недостаток, связанный с обязательным использованием процедуры выравнивания нуклеотидных последовательностей, требующей больших временных затрат. Выравнивание последовательностей должно проводиться каждый раз при смене состава анализируемых образцов. Более того, если амплифицируемые фрагменты находятся в разных участках гена 16S рРНК, то их выравнивание в принципе невозможно. Это ограничивает использование кластерного анализа в серии независимых экспериментов (особенно если речь идет о сотнях и тысячах экспериментальных образцов). Поэтому возникла необходимость в разработке нового системного подхода к исследованию микробиома, который: 1) независим от наличия в пробах неидентифицируемых последовательностей 2) может быть использован для анализа данных из независимых экспериментов и 3) пригоден для описания структуры и динамики микробиомов.

Разработка новых подходов должна начинаться с исследования простых модельных систем. В нашей работе в качестве такой системы были выбраны микробные сообщества, находящиеся под воздействием одного из наиболее мощных экологических факторов - фактора засоленности (Lozupone et al., 2007).

Цель исследования. Разработать новые методы для анализа данных по таксономическому разнообразию микробных сообществ, полученных с использованием метагеномных технологий, на примере анализа модельных систем природного и искусственного почвенного засоления. Задачи работы:

1. На основе анализа данных пиросеквенирования библиотек гена 16S рРНК изучить изменение таксономической структуры почвенного микробиома вдоль градиента засоленности в условиях природного почвенного засоления;

2. Изучить изменение таксономической структуры почвенного микробиома в условиях искусственного засоления;

3. Выявить группы микроорганизмов, являющиеся маркерами процессов природного и искусственного засоления;

4. Разработать математические методы для анализа данных высокопроизводительного секвенирования, позволяющие провести

ранжирование микроорганизмов в соответствии с реакцией на действие засоленности и дать интегральную оценку структуры и динамики микробных сообществ. Научная новизна.

Впервые на основе анализа данных высокопроизводительного секвениро-вания описано изменение таксономической структуры метагенома микробного сообщества в условиях природного и искусственного почвенного засоления и выявлены кандидаты на роль индикаторов засоления - бактерий из сем. ВасИ-1асеае (Пгтгси/ез) и пор. Брк'т^оЬас1ег'ш1ев (Вас1егсяс1е1еи). Впервые предложены новые методы для анализа данных высокопроизводительного секвенирова-ния: 1) метод ранжирования микроорганизмов в соответствии с реакцией на засоленность, позволяющий выявить экологические группы галофильных, гало-толерантных и негалофильных микроорганизмов на уровне рода 2) метод математического моделирования динамики микробиомов в таксономическом пространстве гена 16Б рРНК с вычислением интегральных параметров, описывающих их структуру (центральная точка) и динамику (вектор смещения центральной точки), позволяющих установить факт и определить направление сукцессии микробного сообщества.

Научно-теоретическая и практическая значимость исследования. Предложенные новые методы могут быть использованы для анализа структуры и динамики почвенного микробиома. Они будут востребованы во многих областях практической микробиологии. В природоохранной сфере станет возможным проведение масштабных мониторинговых исследований по действию основных биогенных и антропогенных экологических факторов на структуру почвенных микробоценозов, что будет способствовать развитию программ, направленных на сохранение их природного биоразнообразия. В сельскохозяйственной практике исследование почвенного микробиома будет способствовать поиску новых потенциально плодородных земель, в криминалистике - формированию базы микробиологических маркеров, позволяющих установить регион происхождения почвенного образца. Методы, разрабатываемые в диссертации реализуются в ряде научных проектов: «Метагеномный анализ микробиома как многофункционального высокоинтегрированного биосферного «интерфейса» (Программа поддержки фундаментальных исследований по приоритетным направлениям Санкт-Петербургского государственного университета), «Основные факторы, влияющие на формирование структуры почвенного микробиома по данным высокопроизводительного секвенирова-ния» (РФФИ, 12-04-01371-а), «Разработка метода массового метагеномного скрининга почв сельскохозяйственного назначения в целях оптимизации их использования» (ГК№ 16.512.11.2132). Апробация работы.

Материалы диссертации опубликованы в 12 научных работах (из которых 8 статей и 3 тезиса). По результатам работы были сделаны сообщения на конференциях: VII Московский международный конгресс «Биотехнология: состояние и перспективы развития», 19-22 марта 2013 г., Москва, Россия (устный до-

клад), VI Всероссийской конференция молодых ученых «Стратегия взаимодействия микроорганизмов и растений с окружающей средой», 24-28 сентября 2012 г., Саратов, Россия (первая премия за устный доклад), школа-конференция для аспирантов AB-RMS («Адаптация к изменению климата в регионе Балтийского моря: вклад исследований из области растительной и микробной биотехнологии») 12-17 июля 2010 г., Миккеле, Финляндия, 4-й съезд европейского микробиологического общества 26-30 июня 2011 г., Женева, Швейцария, 14-й международный симпозиум по экологии микроорганизмов 1924 августа 2012 г., Копенгаген, Дания.

Объем и структура диссертации.

Материалы диссертации изложены на 117 страницах машинописного текста, включающего в себя введение, 5 глав обзора литературы, описание материалов и методов исследования, 5 глав собственных исследований и обсуждения полученных результатов, выводы и список литературы. Работа проиллюстрирована 7 таблицами и 31 рисунками, указатель литературы содержит 154 источник, в том числе 10 отечественных и 144 иностранных.

СОДЕРЖАНИЕ РАБОТЫ Материалы и методы исследования

Отбор образцов из района природного почвенного засоления. Летом 2009 года в окрестностях оз. Акколь, района Шингирлау (Казахстан) был произведен отбор 6 почвенных образцов (Tl, Т2, Т2-3, ТЗ, Т4 и Т5) вдоль градиента засоленности, определяемого показателями кондуктометрии (общее содержание солей в почве варьировало в пределах от 1,23% (Т1) до 0,01% (Т5)). В том же регионе в 200 км от солончака были отобраны 3 образца типичной для данного региона темно-каштановой почвы (одна целинная почва - НЦ и две залежные почвы - НЗ и НК). Пробы отбирали из горизонта А1 на глубине 10 см.

Постановка опыта по искусственному засолению. Почва, отобранная на участке НК, была просеяна (сито 0 0,3 см) и очищена от крупных корней. Концентрации для солевой смеси соответствовали солевому составу максимально засоленного образца Т1 (СГ - 8mM; S042" - 12 mM; Na+ - 7 тМ; К+ - 0,5 тМ; Mg2+ - 2,5 тМ; Са2+ - 10 тМ на 100 г почвы). При сохранении молярных соотношений ионов, концентрация вносимых солей была повышена до 3%. Внесение солей проводили при разделении растворимых солей кальция и сульфатов по разным смесям. Опыт был выполнен в двух технических проворно-стях (для контрольных и экспериментальных сосудов). В опыте поддерживалась постоянная влажность (60% от полной влагоемкости). Отбор проб осуществлялся в двух временных интервалах - на 1 и 150 день после начала эксперимента. Всего было проанализировано 4 образца: контроль 1 день, контроль 150 день, опыт 1 день, опыт 150 день. Пробы отбирали из трех равноудаленных друг от друга и от стенок сосуда точек.

Выделение ДНК. Выделение ДНК проводили из 0,2 г почвенного образца по оригинальной методике (Андронов и др., 2009). Для опыта по искусственно-

му засолению ДНК выделяли отдельно из трех точек сосуда, перед очисткой экстракты смешивали в равных пропорциях.

Количественная ПЦР. Приблизительную оценку численности микроорганизмов в образцах Т1, Т2, Т2-3, ТЗ, Т4, Т5, НЗ и НЦ проводили с использованием ПЦР с детекцией в реальном времени. В качестве контроля для бактерий использовали клонированные фрагменты рибосомного оперона Escherichia coli (Sigma), для архей - штамма FG-07 Halobacteriiim salinarum (штамм предоставил Г. Юргенс, Университет Хельсинки), для грибов - штамма дрожжей Saccharomyces cerevisiae Meyen 1B-D1606 (Mohamed et al., 2011). Были использованы следующие праймеры: Eub338/Eub518 - для бактерий (Lane, 1991), arc91517arcl059r - для архей (Yu et al., 2005), ITSlf/5.8s - для грибов (Fierer et al., 2006). Определение для каждого образца проводили в трех повторностях. Количественные оценки приводились к числу рРНК оперонов на грамм почвы.

Секвеиирование ампликопных библиотек. Амплификация генов 16SpPHK осуществлялась с использованием универсальных праймеров (комплементарных последовательностям как бактерий, так и архей) к вариабельному участку V4 - F515 GTGCCAGCMGCCGCGGTAA и R806 GGAC-TACVSGGGTATCTAAT (Bates et al., 2010). Праймеры содержали мультиплексные идентификаторы, позволяющие проводить одновременный анализ нескольких проб. На втором этапе проводилось пиросеквенирование полученных амплификатов с использованием прибора GS Junior (Roche, USA) согласно рекомендациям производителя.

Анализ данных высокопроизводительного секвенирования. Анализ ам-пликонных библиотек гена 16S рРНК проводили в программе «QIIME» версии 1.5.0. (Caporaso et al., 2010). Из нуклеотидных последовательностей были удалены служебные последовательности и праймеры, проведена фильтрация последовательностей по качеству, выравнивание последовательностей с использованием алгоритма PyNast (в качестве матрицы для выравнивания использовали специально сконструированный набор последовательностей - «Greengenes coreset» доступный на сайте: http://greengcnes.lbl.gov/') и построение матрицы генетических дистанций. Последовательности, обладающие 97% сходством объединялись в ОТЕ. Таксономическая идентификация последовательностей проводилась с использованием базы данных RDPII (Wang et al., 2007).

На следующем этапе были вычислены индексы разнообразия Шеннона (Н = —5-(р,) ■ fnfpi), где pi - частота встречаемости i-ro вида) и Chaol (Sest = Sobs + а /2Ь, где Ses, - оцениваемое количество ОТЕ, S0bs - наблюдаемое количество ОТЕ, а - количество ОТЕ, встреченных один раз, b - количество ОТЕ, встреченных 2 раза), оценивающего количество ОТЕ присутствующих в образце, но не детектируемых в эксперименте). Кластерный анализ микробиомов проводился с использованием алгоритмов «unweighted unifrac» и «weighted unifrac» (Lozupone et al., 2011). Для выявления физико-химических факторов, оказывающих наибольшее влияние на структуру микробиома, проводился тест Мантеля (1000 перестановок). Все процедуры анализа проводились для нормализованных образцов (из каждого образца случайным образом выбиралось по 694 по-

следовательности (наименьшее число последовательностей в образце), усреднение полученных результатов проводилось для 10 таких случайных выборок).

Для выявления микроорганизмов-индикаторов в образцах НК (контроль 1 день) и НК' (опыт 150 день) опыта по искусственному почвенному засолению была проведена идентификация таксономического положения исследуемых нуклеотидных последовательностей и сравнительный анализ микробных сообществ с использованием приложения «LibCompare» сервиса RDPII (Cole et al., 2009).

Последовательности из образцов Tl, Т2, Т2-3, ТЗ, Т4, Т5, НЦ и НЗ были депонированы на сервере NCBI с присвоением идентификатора SRA049908.2.

Результаты и обсуждение

1. Анализ нуклеотидных последовательностей с использованием

традиционных подходов

Определение общих показателей численности и биоразнообразия микробных сообществ. Выявленный в сообществах микроорганизмов уровень биоразнообразия достигал высоких значений - сотни и даже тысячи видов (Табл. 1)-

Таблица 1. Основные показатели биоразнообразия для почвенных образцов, характеризующие процессы природного и искусственного засоления

S а м а а. ш § 1 * п о а и ч Н о Я •S се и — 3 2 <4 ¡5 Численность (кол-во рибосомных оперонов/г почвы) я 2 I'S

ю О * 1 СJ и а э Бактерии Археи Грибы У § U

Т1 1005 390 928,6 7,3 1,8 • Ю10 1,2 ■ Ю10 1,0 • ю9 1,23

Т2 694 268 647,9 6,9 2,0 • Ю10 1,1 ■ 109 6,3 • 108 1,19

Т2-3 1890 385 808,8 6,2 1,1 • Ю10 4,6 • 108 6,9 • 108 0,23

ТЗ 1245 453 1285,9 7,5 1,3 • Ю10 5,4 • 108 3,1 • 109 0,06

Т4 1599 469 1002,2 7,0 2,1 • Ю10 8,5 • 108 1,1 ■ 109 0,03

Т5 1155 348 810,5 6,8 6,5 • 109 2,9 ■ 108 2,7 • 108 0,01

НЗ 959 411 1272,1 7,5 8,5 • 109 4,3 • 108 1,7 • 109 0,04

НЦ 1083 552 2366,0 8,0 9,4 ■ 109 3,9 • 108 1,0 • 109 0,05

НК 3406 1141 2329,5 8,9 1,6 • 10'° 3,4 • 108 1,3 • 109 0,04

НК' 2338 580 1302,1 6,9 6,4 ■ 109 2,4 ■ 108 1,1 • 109 3,04

Численность микроорганизмов не претерпевала существенных изменений как в процессе природного, так и в ходе искусственного засоления, за исключением образца Т1, в котором достоверно увеличивалась численность архей. Численность бактерий в среднем на порядок превышала численность грибов и архей (Табл. 1).

Наиболее богатыми в видовом отношении были образцы незасоленных почв -НК, НЗ, НЦ и участка ТЗ - переходной зоны солончака, где встречаются как растения-галофиты, так и типичные представители степной флоры. Более низкими показателями биоразнообразия характеризовались образцы Т2, Т2-3 (переходная зона с наличием 1-2 видов галофитных растений) и Т4, Т5 (переходная зона со степной растительностью). Колебания в показателях биоразнообразия в переходной зоне (Т2, Т2-3, ТЗ, Т4, Т5) можно объяснить сменой растительного покрова на данных участках - более разнообразные растительные ассоциации (наибольшее число видов растений в солончаке было обнаружено на участке ТЗ) обеспечивают повышение уровня разнообразия в микробных сообществах, ассоциированных, прежде всего, с областью ризосферы.

Уровень биоразнообразия достигал максимальных значений в незасоленных почвах в связи с полным отсутствием фактора засоленности, и развитием богатых в видовом отношении растительных ассоциаций.

Наиболее засоленный участок солончака (образец Т1), напротив, характеризовался высоким показателем индекса Шеннона, сравнимым с таковыми для менее засоленных участков и незасоленных почв (Табл. 1). Это указывает на развитие в данном местообитании сообщества климаксного типа. Высокий уровень биоразнообразия в данном случае может быть связан с образованием резистентных к экстремальным условиям ассоциаций в составе биопленок.

Анализ таксономической структуры почвенного микробиома в условиях природного почвенного засоления. Анализ таксономической структуры микробиома на уровне домена показал, что абсолютное большинство в сообществе составляют бактерии.

Во всех пробах были выявлены представители 21 бактериальной филы: Armatimonadetes, Acidobacteria, Actinobacteria, Bacteroidetes, CCMllb, Chlamydiae, Chlorobi, Chloroflexi, Cyanobacteria, Firmicutes, Fusobacteria, Gemmatimonadetes, Nitrospirae, Planctomycetes, Proteobacteria, SBR1093, SPAM, TM7, Thermi, Verrucomicrobia, WS3 и двух археотных фил: Crenarchaeota и Euryarchaeota. Помимо бактерий с установленным систематическим положением, все пробы содержали большое количество неидентифицируемых на уровне филы последовательностей, доля которых увеличивалась по мере продвижения от незасоленных участков к засоленным от 2,1% (образец Т5) до 16,1% (образец Т1). Изменения в составе сообщества заключались в постепенной смене соотношения основных бактериальных фил. Для наиболее засоленного участка солончака характерно доминирование бактерий из фил Proteobacteria, Firmicutes, Bacteroidetes при относительно малой доли представителей филы Actinobacteria (Рис. 1, 3). По мере продвижения к незасоленным участкам солончака и в незасоленных почвах доля актинобактерий значительно увеличивается, возводя их в

ранг абсолютных доминантов (63% от общей численности прокариот для образца НЦ). Повышение содержания устойчивых к засушливым условиям акти-нобактерий по мере удаления от берега соленого озера, позволило предположить, что не только засоленность, но и влажность является определяющим фактором для развития микробных сообществ в данном регионе. Для проверки этой гипотезы нами был проведен тест Мантеля, который показал значимую корреляцию состава микробного сообщества только с уровнем засоленности.

Pseudomonadaceae Е п terobacteriaceae Rhodospirillaceae

Gemmatimonadetes NA* Baciliaceae ■ Alicyclobacillaceae Rhodothermaceae\ Balneolaceae

kolll3fam.gen.sp

Actinobacteria NA* Bacteria NA*

SOG A31 HA* (Chloroflexi)

Proteobacteria, NA*

ШШ ж Gemmatimonadaceae (Gemmatimonadetes)

Solirubrobacteraceae

Solirubrobacterales fam.gen.sp

Rubrobacteraceae

Actinomycetales " fam.gen.sp.

Actinobacteria NA* MC47 fam.gen.sp.

НЦ

Рис. 1. Таксономическое разнообразие микробных сообществ (на уровне семейства) в условиях природного засоления. Наиболее многочисленные бактериальные филы: А - Actinobacteria, Б - Proteobacteria, В - Firmicutes, Г - Bacteroidetes. NA -non-attributed sequences (неидентифицированные последовательности).

В целом, результаты, полученные нами при анализе микробных сообществ солончака хорошо согласуются с литературными данными (Hollister et al., 2010, Zenova et al., 2005; Звягинцев и др., 2008), что позволяет говорить о том, что совместное присутствие представителей, по крайней мере, трех бактериальных фил - Proteobacteria, Firmicutes и Bacteroidetes является характерным признаком почвенных засоленных местообитаний.

Как показывает исследование микробиома на уровне семейства (Рис. 1), состав семейств актинобактерий в засоленных участках солончака и части переходной зоны (Tl, Т2, Т2-3 и ТЗ) отличается от такового для незаселенных участков. В образцах Т1 и Т2 доминируют неидентифицируемые на уровне семейства актинобактерии из порядка коШЗ, по мере продвижения к незасолен-ным участкам солончака и в незаселенных почвах доминируют актинобактерии из порядков Rubrobacteriales и Solirubrobacteriales. Широкую степень экологической пластичности демонстрируют актинобактерии из порядка МС47 и

Т2-3 Т2 ' ТЗ

■ Т5

■ Т4 ' НЗ

НЦ Т1

Solirubrobacteriales, равно представленные во всех исследуемых образцах за исключением участка Т1 (Рис. 1).

Обнаруженные тенденции в смене таксономического состава сообществ подтверждает дендрограмма кластерного анализа (Рис. 2), на которой прослеживается обособление трех зон -наиболее засоленного участка солончака, переходной зоны (Т2-3 -ТЗ) и зоны незаселенных почв (Т4, Т5, НЦ, НЗ). Образование последней группы является дополнительным подтверждением того, что засоленность является основным фактором, влияющим на формирование микробиомов в данном регионе.

Анализ таксономической структуры микробных сообществ в условиях искусственного почвенного засоления. Кластерный анализ образцов из опыта по искусственному засолению не выявил значимых различий между образцами контроль 1 день, контроль 150 день и опыт 1 день, Поэтому в дальнейший анализ были отобраны 2 образца - образец контрольной почвы 1 дня (НК) и образец опыта на 150 день после засоления (НК').

В условиях опыта по искусственному засолению произошло значительное понижение индексов

Т1 ТЗ • Т2 Т2-3 Т5 Т4 НЗ НЦ

Рис. 2. Кластерный анализ микробных сообществ из солончака и незаселенных почв НЦ и НЗ с использованием двух основных алгоритмов кластеризации: "unweighted unifrac" (вверху) и "weighted unifrac"(BHH3y).

биоразнообразия (Табл. 1), что свидетельствует о формировании в засоленном образце сообщества переходного типа.

Состав фил в образцах НК и НК' практически полностью совпадал с таковым для образцов, отобранных в солончаке и на участках НЗ и НЦ (Рис. 3). Внесение в почву солей вызвало понижение доли бактерий из целого ряда фил, таких как Proteobacteria, Chloroflexi, Gemmatimonadetes, Acidobacteria, Verrucomicrobia, Planctomycetes и архей из порядка Thermoprotei. При этом в сообществе резко возросло содержание бактерий из фил Bacteroidetes и Firmicutes (Рис. 3). Процентное содержание актинобактерий в сообществе практически не изменилось, но засоленность вызвала существенное понижение их биоразнообразия. Типичные представители каштановых почв данного региона - актинобактерии из сем. Rubrobacteriaceae и Solirubrobacteriaceae, а также ак-

тинобактерии из сем. Micrococcaceae были полностью замещены бактериями из сем. Nocardioidaceae и Streptomycetaceae (Рис. 3).

Анализ образцов НК и НК' на уровне рода показал, что сем. Balneolaceae включает в себя такие рода умеренно-галофильных бактерий как Gracilimonas и Thalassobacillus. Обнаружение последовательностей ДНК, принадлежащих данным бактериям в экспериментальном образце (для Gracilimonas - 60 нук-леотидных последовательностей при их полном отсутствии в контроле), является прекрасной иллюстрацией к тезису М. Бейеринка «Everything is everywhere, the environment selects».

Природное засоление

А Б А Б

Искусственное засоление

БАБА

I

1

й 1 1

1

I

Proteobacteria

у Bacillaceae у Balneolaceae / КоІІІЗ Nocardioidaceae Streptomycetaceae

Actinobacteria NA

J^M S5 —Gemmatimonadetes

/ ^H ВИ — Firmicutes ^ —chloroflexi

__ ^ Bacteroidetes

A

H3

T1

" Actinobacteria

Acidobacteria

Bacteria N A* Crenarchaeota

HK'

Рис. 3. Сравнительный таксономической структуры микробиомов в процессах природного и искусственного засоления: А - на уровне филы, Б - на уровне семейства. NA - non-attributed sequences (неидентифицированные последовательности).

В литературе бактерии p. Gracilimonas описаны как морские бактерии, являющиеся симбионтами цианобактерий p. Synechococcus (Choi et al., 2009), поэтому их развитие в почве является примером высокого адаптивного потенциала почвенных микробных сообществ.

Сравнительный анализ таксономической структуры микробных сообществ в условиях природного и искусственного почвенного засоления. Как в случае природного, так и в случае искусственного почвенного засоления в микробном сообществе засоленной почвы возрастает доля бактерий из фил Firmicutes и Bacteroidetes. Увеличивается доля бактерий из одних и тех же порядков и семейств. Так, для филы Bacteroidetes было отмечено повышенное содержание в засоленных образцах бактерий из пор. Sphingobacteriales с присутствием общего для исследуемых процессов засоления сем. Balneolaceae. Для филы Firmicutes как в образце Т1, так и в образце НК' отмечалось увеличение доли бактерий из пор. Bacillales, и в частности сем. Bacillaceae (Рис. 3). В обоих

процессах при увеличении уровня засоленности происходила закономерная смена типичных почвенных актино-бактерий (ЯаЪгоЪасгепасеае и БоИгиЬгоЬа^епасеае) на другие группы актинобактерий, более приспособленные к условиям засоления.

В развитии процессов засоления имеются и существенные различия. Данные процессы принадлежат к разным экологическим типам — климаксному в случае солончака и переходному в случае искусственного засоления, что подтверждают не только значения общих показателей биоразнообразия, но и анализ таксономической структуры сообществ (биоразнообразие галофильных бактерий в филах ПгтюигеБ и Вааего1с1е1е5 в условиях искусственного засоления было заметно ниже по сравнению с наиболее засоленным участком солончака) и кластерный анализ, где образцы Т1 и НК' кластеризовались отдельно (Рис. 4).

2. Разработка новых подходов для анализа структуры метагенома

Систематизация данных по биоразнообразию и выявление экологических групп микроорганизмов. Использование традиционного редукционистского подхода, связанного с оценкой представленности таксонов в пробах, уже на уровне семейств сталкивается с определенными трудностями в описании биоразнообразия (количество неидентифицируемых семейств во всех образцах достигало 137). Очевидно, что при увеличении числа образцов, а также при рассмотрении структуры микробиома на микробиологически более значимом уровне рода, сравнительный анализ таблиц представленности микроорганизмов в пробах становится неразрешимой задачей. В нашей работе впервые был предложен метод для упорядочивания данных таблицы представленности таксонов (родов микроорганизмов), посредством их ранжирования в соответствии с действием заданного экологического фактора. Для этого по данным таблицы представленности были построены графики, показывающие динамику численности отдельных родов во всех образцах (Рис. 5). Оказалось, что закономерность в изменении представленности родов не является монотонной (Рис. 5). Поэтому для выявления микроорганизмов, демонстрирующих тенденцию к увеличению/уменьшению численности с ростом засоленности, была проведена аппроксимация полученных графиков с использованием линейного уравнения вида у = ах + Ь, где у - доля того или

90

90Г

100

100

631_ 81

100 L

Т1 J3, Т2

-Т2-3 -Т5 "НЦ " Т4

-нз

-НК' НК

0.05

Рис 4. Сравнение структуры микробных сообществ с использованием кластерного анализа. Алгоритм кластеризации - «weighted unifrac».

иного микроорганизма в сообществе, х — засоленность почвы (значение электропроводности). В результате, все микроорганизмы были ранжированы по коэффициенту «а» и разделены на три группы, численность которых растет с увеличением засоленности (а > 0, галофильные микроорганизмы), падает (а < О, негалофильные микроорганизмы) или остается постоянной (а = О, галотолерантные микроорганизмы, Рис. 5).

со я

0 m и н

* U

га ф

к vo

1 §

et о

Таксон А

Таксон В

Таксон С

n 6.0Е-05

s з-s -в--в-m

0

2£ ф

S

1

ф

4.0Е-05

2.0Е-05

0.0Е+00

-2.0Е-05

а>0

а=0

а<0

335 665 1880 2500 9 40 335 665 1880 2500 9 40 335 665 1880

Tumebacillus Nocardioides Actinomyces

Gp 9,10 Gp 2,7,13 Gp 1,4,6,16,17

Geminicoccus Rhizobium Corynebacterium

Halobacillus Carnobacterium Planotetraspora

Halomonas Singulishoera Streptomyces

Salisaeta Pelomonas Aminobacter

Paenibacillus Actinoallomurus Pseudonocardia

Haliangium Desulfosporosinus Sporichthya

Marinobacter Brevundimonas Sphingomonas

Microbulbifer Burkholderia Micrococcus

Oceanobacillus Sporosarcina Bradyrhizobium

Maribius Micromonospora Gemmatimonas

Marinimicrobium Aeromonas Pseudomonas

Prosthecomicrobium Mesorhizobium Rubrobacter

Genus NA*=35 Genus NA*=15 Genus NA*=36

і -4.0Е-05

Галофильные и

слабогалофильные

микроорганизмы

Галотолерантные микроорганизмы

Негалофильные микроорганизмы

Рис. 5. Выявление экологических групп микроорганизмов с использованием регрессионного анализа таблицы представленности таксонов в пробах. Вверху - графики представленности микроорганизмов в зависимости от засоленности (электропроводности) и их аппроксимация уравнением линейной регрессии, внизу - графическое представление таблицы представленности, данные которой упорядочены по коэффициенту наклона прямой «а». Genus NA* - количество ОТЕ неидентифи-цируемых на уровне рода.

Среди группы предполагаемых галофилов нами были идентифицированы бактерии из таких семейств как Rhodospirillaceae, Rhodobacteraceae, Hyphomicrobiaceae, Alteromonadaceae, Halomonadaceae, Rhodothermaceae, Bacillaceae. Данные микроорганизмы были обнаружены на участках Tl, Т2 (6,13 • 10"5>а> 1,40 ■ 10"7).

По мере удаления от зон с повышенным содержанием солей (участки Т2-3 и ТЗ), в составе сообщества появляются группы галотолератных бактерий (9,33 • 10"8 < а < -9,57 -10"8). При дальнейшем движении вдоль уменьшения градиента засоленности (точки Т4 и Т5), в составе микробного сообщества начинают доминировать типичные негалофильные почвенные бактерии (-3,56 • 10'5 < а<-1,09 ■ 10"7) (Рис. 5).

Проведенный анализ является важным дополнением к традиционным методам, поскольку позволяет на основе таксономических данных перейти к построению функциональной структуры сообщества. Метод может быть использован для изучения реакции микробного сообщества на различные экологические стрессы.

Разработка и использование модели таксономического пространства (ТП) для гена 16S рРНК. Систематизация данных по биоразнообразию имеет большое значение для анализа идентифицируемых последовательностей. Но число таких последовательностей практически никогда не превышает число не-идентифицируемых последовательностей (на уровне семейства количество не-идентифицированных последовательностей галофильных микроорганизмов достигало 53%, на уровне рода 68%). Учет неидентифицируемых последовательностей возможен только при холистическом подходе к оценке биоразнообразия. Наиболее популярным холистическим подходом является кластерный анализ микробиомов. Помимо уже упомянутых недостатков данного анализа, нам удалось показать, что на результаты кластеризации оказывает влияние выбор того или иного алгоритма кластеризации и включение в анализ дополнительных образцов (Рис. 2, 4).

Нами был предложен новый интегральный метод, который связан с разработкой специальной операционной среды для анализа микробиомов - таксономического пространства гена 16S рРНК (ТП). ТП представляет собой многомерное метрическое пространство, в котором последовательности гена 16S рРНК представлены точками, геометрические расстояния между которыми соответствуют попарным генетическим дистанциям между последовательностями. Положение точек в ТП определяется путем прямой трансформации генетических дистанций (выраженных в p-distance, pairwise deletion) в геометрические координаты (Рис. 6).

Для выбора оптимального набора координат было отобрано 107 последовательностей из базы данных RDPII по критерию представленности среди них основных бактериальных и археотных фил. Затем было проведено сравнение фактических расстояний между данными нуклеотидными последовательностями (генетические дистанции, определяемые в результате множественного выравнивания последовательностей, djj) с расстояниями между соответствующими точками в n-мерном евклидовом пространстве, dij' (геометрические расстояния) при последовательном переборе всех возможных наборов координат (Сп107, где п = 2, ..., 107). Выбор оптимального набора координат для ТП осуществлялся на основе анализа коэффициента корреляции между матрицами генетических дистанций (dy) и матрицами их геометрических аналогов (dy') (Рис. 7). Макси-

мальное соответствие сіу и сіу' наблюдалось при небольшом количестве координат (от 20 до 45). Для дальнейших построений нами использовались 42 последовательности, обеспечивающими наилучшие показатели коэффициента корреляции.

А

І j

А diA djA

В diB djB

С die dje

Рис. 6. Схема трансформации генетических дистанций (А) в геометрические координаты ТП (Б), м- картируемые в ТП нуклеотидные последовательности 165 рРНК, А,В,С - нуклеотидные последовательности, выбранные из базы данных 1?ОР11 для построения ТП (реперные точки), сЯ—генетические дистанции (количество различающихся нуклеотидных позиций между последовательностями, выраженное в %, р-с^апсе), б,1 -геометрические аналоги генетических дистанций.

100

Рис. 7. Зависимость средних значений коэффициента корреляции (Я) между матрицами генетических дистанций и их геометрических аналогов в ТП от количества выбранных «координатных осей» (1М).

Они были равномерно распределены между 23 бактериальными и 2 археотными филами: Proteobacteria, Firmicutes, Actinobacteria и Acidobacteria, Bacteroidetes, Chlamydiae, De-inococcus- Thermus, Nitrospirae, Spirochaetes, Thermotogae, Chlorobi, Chloroßexi, Cyano-bacteria, Gemmatimonadetes, Lentisphaerae, Planctomycetes, Verrucomicrobia, OPIO, TM7, WS3, SRI, Euryarchaeota, Korarchaeota.

С использованием выбранных координат было произведено картирование мик-робиомов в ТП, на Рисунке 8 приведены двухмерные про-

екции ТП. Видно, что максимальные различия между микробными сообществами наблюдаются при сравнении незаселенных образцов НЗ и НЦ с наиболее засоленным участком солончака Т1, а эллипсы для образцов Т4, Т5 и НЗ практически совпадают, что хорошо совпадает с данными традиционного анализа и указывает на правомерность построений лежащих в основе ТП.

Рис. 8. Графическое представление данных анализа микробных сообществ участка Т1 и незаселенных почв НЦ и НЗ в ТП. PCI, РС2 - оси проекции, на которой наблюдаются максимальные различия в структуре сообществ. Эллипсы на рисунке заключают 95% совокупности точек.

Проведя построение ТП с использованием выбранных координат, мы получили систему а) моделирующую таксономические отношения между нуклео-тидными последовательностями (в ТП можно обнаружить области, занимаемые отдельными бактериальными и археотными таксонами); б) позволяющую решить проблему включения в анализ неидентифицируемых последовательностей (положение каждой такой последовательности в ТП задается индивидуальным набором из 42 координат) и в) позволяющую вычислять интегральные геометрические параметры, описывающие структуру (форма «облаков точек») и динамику (их перемещение в пространстве) микробных сообществ.

Для описания структуры микробных сообществ в ТП нами были вычислены наиболее простые геометрические параметры - центральная точка сообщества, имеющая средние значения координат по каждой из осей, и дисперсия по каждой из координатных осей, которая служила мерой разброса точек относительно центра. Для оценки сходства или различия в структуре сообществ, проводилось вычисление расстояния между центральными точками. Максимальные различия в структуре сообществ в ТП наблюдались для пары НЦ и Т1 (0,19), а минимальные - 0,02 для образцов Т4 и НЗ). Полученные результаты хорошо согласуются как с графической интерпретацией данных таблицы коор-

динат в проекции на плоскость (Рис. 8) так и с данными кластерного анализа (Рис. 2).

Для грубой оценки достоверности наблюдаемых различий в структуре сообществ было проведено сравнение средних и их дисперсий с использованием параметрических критериев Стьюдента и Фишера. Для всех пар сравниваемых сообществ хотя бы для одной из осей были выявлены достоверные различия на 0,05% уровне значимости (количество осей с достоверными различиями колебалось в пределах от 31 до 42 для Р-критерия и от 40 до 42 для ^критерия). Достоверность различий в структуре сообществ в ТП позволяет перейти к исследованию их сукцессии.

Для ее описания были введены параметры вектора смещения сообщества, показывающего направление сукцессии, и угла между векторами смещения, как меры сходства процессов сукцессии. Направление вектора развития сообщества определяется разницей координат его начальной и конечной точек (центральных точек сообществ), модуль вектора равен расстоянию между центральными точками, угол между векторами определяется по формуле скалярного произведения векторов. Для анализа процессов почвенного засоления в ТП нами было построено три вектора: НЦ—>Т1, НЗ—>Т1 и НК—>НК'. Первые два представляли развитие процесса природного почвенного засоления при переходе от незасо-ленных образцов к наиболее засоленному участку солончака Т1, последний -развитие процесса искусственного почвенного засоления (Рис. 9).

Искусственное засоление Природное засоление

Рис. 9. Определение интегральных характеристик микробных сообществ в ТП (центральные точки и углы между векторами смещения микробных сообществ)

При анализе углов между векторами развития сообщества в условиях природного и искусственного почвенного засоления оказалось, что искомые значения угла не превышают 90° (42° для пары НК—>НК'/НЦ—>Т1 и 73° для пары НК—>НК7НЗ—>Т1). Предполагая, что угол в данной системе варьирует от 0° (полностью сходное развитие сообществ) до 180° (разнонаправленное развитие сообществ), полученные нами данные свидетельствуют в пользу наличия сходных паттернов в развитии исследуемых сообществ. Данный результат хорошо согласуется с проведенным нами ранее сравнительным анализом таксономической структуры метагенома, где наряду с существенными различиями в структуре сообществ было отмечено появление в засоленных образцах бактерий, принадлежащих к одним и тем же порядкам и семействам. Важно подчеркнуть, что тенденции, наблюдаемые в ходе сукцессии микробных сообществ, становятся очевидными только при подробном анализе их таксономической структуры и не могут быть выведены из результатов кластерного анализа (Рис. 2, 4).

Очевидно, что по результатам одного единственного исследования невозможно однозначно трактовать значения углов между векторами смещения. Для более точной оценки нужно выполнить целый ряд исследований, в которых необходимо провести анализ факторов по их воздействию на микробное сообщество (выделить факторы, оказывающие противоположное и однонаправленное действие, сопоставить величины угла с тем или иным уровнем воздействия экологического фактора и т.д.).

Однако уже сейчас понятно, что данный метод является эффективным орудием для проведения сравнительного анализа микробиомов. Используя универсальные численные характеристики для описания структуры и направления сукцессии микробного сообщества, он предоставляет уникальную возможность - проводить сравнительный анализа различных по своей природе сообществ, а также сравнивать между собой разные экологические факторы по силе их воздействия на сообщество.

ЗАКЛЮЧЕНИЕ

В работе были предложены новые методы, дополняющие традиционные редукционистские и холистические подходы в изучении микробного биоразнообразия с учетом специфики метагеномных данных. На примере анализа процессов засоления мы показали, что исследование таксономической структуры микробных сообществ сталкивается с серьезными методологическими проблемами при работе с большим объемом данных по биоразнообразию (позволяет анализировать микробном только на высоких таксономических уровнях, таких как фила, порядок или семейство). При этом в микробиологии наиболее значимой и определенной в физиологическом плане таксономической характеристикой является род и вид микроорганизмов. Предложенный метод ранжирования родов микроорганизмов внес системность в данные по биоразнообразию и позволил связать появление тех или иных родов микроорганизмов в сообществе с определенным значением экологического фактора.

Наличие неидентифицируемых последовательностей в данных по биоразнообразию делает более рациональным использование холистических подходов, среди которых общепризнанным является кластерный анализ, данные которого, как было показано в работе, носят неоднозначный характер и зависят не только от выбора алгоритма кластеризации, но и от количества анализируемых образцов. В качестве принципиально нового подхода, позволяющего преодолеть ограничения кластерного анализа, в работе был предложен новый математический подход, связанный с анализом микробиомов в таксономическом пространстве. ТП позволяет рассматривать почвенный метагеном как целостную надорганизменную систему, структура и динамика которой может быть описана с использованием интегральных математических параметров. Использование ТП для анализа микробных сообществ в условиях засоления позволило оценить глубину и направление сукцессии сообществ при действии стрессовых факторов различной природы.

Совместное применение традиционных и новых подходов в исследовании процессов почвенного засоления позволило выявить группы галофильных, не-галофильных и галотолерантных прокариот и показать наличие сходных тенденций в развитии систем природного и искусственного почвенного засоления.

Поскольку в работе применялись наиболее простые статистические критерии, использование которых не вполне соответствует природе исследуемых данных, в дальнейшем необходима разработка дополнительных статистических оценок для каждого из интегральных параметров ТП. Также стала очевидной необходимость в проведении ряда экспериментов, позволяющих проводить дифференциацию экологических факторов в зависимости от степени их влияния на структуру микробиома. Работа по этим направлениям позволит перейти использованию информации о структуре почвенного метагенома на практике в природоохранной, сельскохозяйственной и других сферах.

В рамках модели ТП могут найти свое решение и фундаментальные вопросы, связанные с эволюцией нуклеотидных последовательностей. Поскольку модель позволяет дать описание любому варианту структуры гена 168 рРНК (включая как реально существующие, так и еще не реализованные в ходе эволюции варианты), в ее рамках могут решаться вопросы о происхождении и дивергентной эволюции прокариотных таксонов (например, может быть определен гипотетический центр происхождения таксона). В последнем случае ТП может быть реорганизовано в эволюционное пространство (ЭП). Реорганизация ТП в ЭП будет связана с предъявлением новых требований к выбору координат, участвующих в его построении.

Рассмотрение микробных сообществ в ЭП позволит подойти к решению целого ряда вопросов, таких как установление связи между изменением таксономической структуры сообщества и эволюционными событиями в микробных популяциях, выбор научно-обоснованного критерия для выявления ОТЕ и многих других.

ВЫВОДЫ:

1. Использование кластерного анализа и теста Мантеля показало, что основным фактором, определяющим структуру микробного сообщества в почвах солончака Шингирлау, является засоленность, определяющая смену состава микробного сообщества с доминирующих в незаселенных участках актинобактерий ЯиЬгоЬаМеггасеае и БоИгиЪгоЬа^епасеае на некультивируемых бактерий из класса АсИпоЬаМепа и бактерий из фил РШеоЬаМепа, Птйааея и Дасгего/а'еГет в наиболее засоленном участке.

2. В модельном опыте по искусственному засолению наблюдалось значительное снижение уровня разнообразия. В сообществе увеличилась доля бактерий из семейств ВасШасеае, 81гер1отусе1асеае, Мосагс1Шс1асеае и Ва1пео1асеае (в том числе его слабогалофильных представителей из рода СгасШтопа.ч).

3. Выявлены группы микроорганизмов, которые могут рассматриваться в качестве кандидатов на роль индикаторов процесса засоления — бактерии из семейств ВасШасеае и Ва1пео1асеае.

4. Ранжирование микроорганизмов с использованием модели линейной регрессии позволило систематизировать данные по разнообразию и выявить роды микроорганизмов, принадлежащие к предполагаемым группам галофильных, галотолерантных и негалофильных микроорганизмов

5. Разработанная модель таксономического пространства на основе оценки двух интегральных математических параметров - центральной точки и вектора ее смещения позволяет учитывать неидентифицируемые последовательности, проводить сравнительный анализ метагеномов и оценивать направление и глубину их сукцессии.

Список работ, опубликованных по теме диссертации

Статьи в изданиях, рекомендованных ВАК:

1. Коростик Е. (Першина Е.), Пинаев А., Ахтемова Г., Андронов Е. Универсальные 16Б рРНК праймеры В01 для описания генетического разнообразия почвенных прокариот // Экологическая генетика. 2006. Т.1У. №4. С. 32-37.

2. Першина Е., Тамазян Г., Дольник А., Пинаев А., Сергалиев Н., Андронов Е. Изучение структуры микробного сообщества засоленных почв с использованием высокопроизводительного секвенирования // Экологическая генетика. 2012. Т.Х. №2. С. 31-38.

3. Петрова С., Андронов Е., Пинаев А., Першина Е. Перспективы использования молекулярно-генетического анализа в почвенной экологии // Вестник ОрелГАУ. 2010. Т.26. №5. С.45-48.

4. Дольник А., Тамазян Г., Першина Е., Вяткина К., Порозов Ю., Пинаев А., Андронов Е. Концепция универсальной таксономической системы

бактерий: эволюционное пространство гена 16S-pPHK v.1.0. // Сельскохозяйственная биология. №5. 2012. С.111-120.

5. Андронов Е., Петрова С., Пинаев А., Першина Е., Рахимгалиева С., Ах-меденов К., Горобец А., Сергалиев Н. Изучение структуры микробного сообщества почв разной степени засоления с использованием T-RFLP и ПЦР с детекцией в реальном времени // Почвоведение. №2. 2012. С. 173183.

6. Андронов Е., Петрова С., Чижевская Е., Коростик Е. (Першина Е.), Ахтемова Г., Пинаев А. Влияние внесения генетически модифицированого штамма Sinorhizobium meliloti АСН-5 на структуру почвенного сообщества микроорганизмов // Микробиология. 2009. Т. 78. №4. С. 1-10.

7. Першина Е., Андронов Е., Пинаев А., Ахтемова Г., Думова В., Проворов Н. Анализ полиморфизма длин рестрикционных фрагментов ДНК для изучения динамики почвенных микроорганизмов в условиях воздействия ксенобиотиков // Сельскохозяйственная биология. 2011. №3. С.81-87

8. Першина Е., Андронов Е., Самосоров Г., Семенов А. Генное досье микробиома // Science first hand (Наука из первых рук). 2013. №1. С. 6975.

Статьи в других изданиях:

1. Pershina Е., Andronov Е., Pinaev A., Provorov N. Recent advances and perspectives in metagenomic studies of soil microbial communities. In: Malik A., Grohmann E., Alves M. (Eds) Management of the microbial resources in the environment. Berlin: Springer, 2013. P. 141-166.

Тезисы:

1. Першина E., Андронов Е., Дольник А., Тамазян Г., Проворов Н. Новые методы анализа структуры метагенома для мониторинга агроэкологиче-ского состояния почв // Материалы VII Московского международного конгресса «Биотехнология: состояние и перспективы развития», 19-22 марта 2013 г., Москва.

2. Першина Е., Тамазян Г., Дольник А., Пинаев А., Сергалиев Н., Андронов Е. Основные тенденции в формировании почвенных микробных сообществ под воздействием засоления по данным высокопроизводительного секвенирования // Материалы VI Всероссийской конференции молодых ученых «Стратегия взаимодействия микроорганизмов и растений с окружающей средой», 24-28 сентября 2012 г., Саратов.

3. Andronov E., Pershina E., Pinaev A., Dolnik A. The taxonomic space for microbial metagenomics // 4ft Congress of European Microbiologists. Geneva, Switzerland, June 26-30.

Подписано в печать 25.04.13 Формат 60x84 1/16 Печ. л. 1,0

Тираж 100_Заказ 015_Цифровая печать

Отпечатано в копировальном центре ИП Гортуева Ю. И. (191036, г. Санкт-Петербург, ул. 5-я Советская, д. 24 пом. 20Н)

Текст научной работыДиссертация по биологии, кандидата биологических наук, Першина, Елизавета Владимировна, Санкт-Петербург

ГОСУДАРСТВЕННОЕ НАУЧНОЕ УЧРЕЖДЕНИЕ «ВСЕРОССИЙСКИЙ НАУЧНО-ИССЛЕДОВАТЕЛЬСКИЙ ИНСТИТУТ СЕЛЬСКОХОЗЯЙСТВЕННОЙ МИКРОБИОЛОГИИ» РОССИЙСКОЙ АКАДЕМИИ СЕЛЬСКОХОЗЯЙСТВЕННЫХ НАУК

На правах рукописи

04201' 358648

ПЕРШИНА Елизавета Владимировна

НОВЫЕ МЕТОДЫ АНАЛИЗА ДИНАМИКИ ПОЧВЕННОГО МИКРОБИОМА, ИЗУЧЕННОЙ С ИСПОЛЬЗОВАНИЕМ МЕТАГЕНОМНЫХ ТЕХНОЛОГИЙ

03.02.03 - микробиология

диссертация на соискание ученой степени кандидата биологических наук

Научный руководитель: Кандидат биологических наук Андронов Евгений Евгеньевич

Санкт-Петербург 2013

Содержание работы

Введение..............................................................................................................................................3

Цель и задачи исследования.........................................................................................................§

Глава 1. Обзор литературы.

Структура почвенного метагенома и методы ее изучения...................................................9

Введение..................................................................................................................................9

1. Источники почвенной ДНК...........................................................................................13

2. Пространственная организация почвенного метагенома..........................................17

3. Биоразнообразие почвенных микробных сообществ как результат воздействия селективных географических и физико-химических факторов среды.......................22

4. Влияние засоления на почвенное микробное сообщество.......................................26

5. Современные филогенетические и таксономические аспекты исследования биоразнообразия .........................................................................................................................32

Глава 2. Объекты и методы исследования..............................................................................48

1. Отбор почвенных образцов............................................................................................48

2. Приготовление препарата почвенной ДНК.................................................................52

2.1. Выделение ДНК из почвы...........................................................................................52

2.2. Очистка препарата ДНК..............................................................................................53

3. Проведение количественной ПЦР................................................................................54

4. Секвенирование нуклеотидных последовательностей..............................................55

5. Обработка результатов секвенирования......................................................................56

6. Анализ нуклеотидных последовательностей ампликонных библиотек.................57

7. Использование статистических крнитериев для оценки достоверности различий средних и дисперсий...........................................................................................................59

Глава 3. Результаты и обсуждение............................................................................................61

1. Анализ численности и общих показателей биоразнообразия микробных сообществ ......................................................................................................................................61

2. Анализ таксономической структуры микробных сообществ в условиях природного почвенного засоления ...............................................................................................65

3. Анализ таксономической структуры микробных сообществ в условиях искусственного почвенного засоления......................................................................................71

4. Сравнительный анализ таксономической структуры микробных сообществ в условиях природного и искусственного почвенного засоления..................................75

5. Разработка новых подходов для анализа структуры и динамики микробиома.....77

5.1.Выявление экологических групп галофильных, галотолерантных и негалофиль-ных микроорганизмов.........................................................................................................78

5.2. Разработка и использование модели таксономического пространства (ТП) для гена 16Б рРНК......................................................................................................................81

Выводы.............................................................................................................................................98

Заключение......................................................................................................................................99

Список литературы.....................................................................................................................102

Благодарности...............................................................................................................................117

Введение

Долгое время изучение почвенных микробных сообществ было основано на выделении культур микроорганизмов с последующим изучением их свойств. При этом прямой подсчет клеток микроорганизмов в почве показал, что их число примерно на порядок превышает оценки численности, полученные с использованием методов культивирования (Мишустин и др., 1978). Анализ почвенной ДНК подтвердил наличие в почве большого числа некультивируемых микроорганизмов, доля которых может составлять до 90% от состава сообщества. Доступ к изучению некультивируемых микроорганизмов появился только с внедрением в микробиологическую практику молекулярно-генетических подходов (Rondon et al., 1999). Оказалось, что почвенный метагеном содержит в себе огромный объем генетической информации (в 1 гр почвы может содержаться до 1015 - 1016 п.н. ДНК, что примерно соответствует 109 - Ю10 бактериальным геномам). Качественный анализ таксономического состава почвенного сообщества, проведенный на основе изучения полиморфизма гена 16S рРНК, показал, что число видов микроорганизмов, формирующих микробное сообщество, исчисляется тысячами (Vogel et al., 2009).

Уже сейчас становятся очевидными перспективы применения молекулярно-генетических методов в почвенной микробиологии. В первую очередь, это возможность более полного исследования почвенного микробиома, в перспективе включающее изучение свойств не только культивируемых, но и некультивируемых микроорганизмов, определение состава и функций почвенных микробных ассоциаций, выяснение объема и функциональной нагрузки почвенного микробиологического и генетического потенциала.

В начале своего развития исследования почвенного микробиома были ограничены отсутствием эффективных методик секвенирования (Wooley et al., 2010). Используемая в то время стандартная методика секвенирования по Сэнджеру требовала больших временных и материальных затрат (Маниатис и др., 1984). С появлением методов высокопроизводительного секвенирования стало возможным не только полное исследование таксономической структуры почвенного микробиома, но и изучение ее динамики (Lombard et al., 2011). В результате этого появилась

возможность использовать метагеномные данные для решения основных задач почвенной микробиологии, среди которых большое значение имеет определение общих закономерностей в формировании и функционировании микробиомов различных почвенных местообитаний. Для решения данного вопроса требуется проведение микробиологического скрининга почв различных типов, а также осуществление масштабных мониторинговых исследований по изучению динамики микро-биома в ответ на действие того или иного экологического фактора. Данные исследования будут являться фундаментом для использования метагеномных данных на практике. В частности, они могут быть использованы в природоохранной сфере для сохранения природного биоразнообразия микроорганизмов и выявления факторов, нарушающих его структуру. Также данные по структуре почвенного микробиома могут быть востребованы для решения ряда проблем современного земледелия, таких как: ранняя диагностика и профилактика почвенного состояния, поиск новых потенциально плодородных земель, микробиологическая ремедиация почв, оптимизация использования биопрепаратов, создание новых эффективных растительно-микробных систем в практике адаптивного земледелия и др.

Технологическая база для проведения данных исследований намного опережает в своем развитии методологическую базу, связанную с разработкой адекватных методов анализа метагеномных данных, которые позволили бы извлекать из них биологически значимую информацию. На данный момент устойчивой тенденцией является применение методов, которые представляют собой синтез методов биоинформатики и традиционных экологических подходов к оценке биоразнообразия (Schloss et al., 2009). Очевидно, что работа со «списками организмов» при проведении масштабных мониторинговых исследований представляет собой практически невыполнимую задачу, поэтому использование данных по структуре метагено-ма для решения поставленных ранее задач фундаментальной и прикладной почвенной микробиологии будет напрямую зависеть от применения новых аналитических подходов, которые позволили бы упростить процедуру анализа данных по биоразнообразию и извлечь из них биологически значимую информацию. Работы в направлении поиска качественно новых методов обработки результатов метагеномных исследований активно ведутся (Lilburn et al., 2004; Hur et al., 2004, Hughes et al., 2004; Lee et al., 2006). Также наметилась ярко выраженная тенденция к инте-

грации метагеномных данных, проявляющаяся в возникновении крупных международных проектов по изучению биоразнообразия, таких как EMP (Earth Microbi-ome Project), HMP (Human Microbiome Project) и др.

В рамках данной работы нами будут предложены методы для обработки данных по таксономическому разнообразию гена 16S рРНК с целью их более эффективного использования в исследованиях по микробиологическому мониторингу почвенного состояния. Решение этой задачи необходимо начинать с создания наиболее простых модельных систем, в которых микробные сообщества будут подвергаться действию экологического фактора, вызывающего контрастные изменения в их структуре. Одним из таких факторов является засоление (Lozupone et al., 2007). Выбор этого фактора является важным не только с методической, но и с практической точки зрения, поскольку почвенное засоление является одним из факторов, ограничивающих эффективность современного земледелия, и с каждым годом достигает все больших масштабов (Evelin et al., 2009).

В качестве объектов данного исследования нами были выбраны две системы - природного засоления (пробы почвы, отобранные по градиенту засоленности в солончаке) и искусственного засоления (лабораторный эксперимент по искусственному засолению каштановой почвы).

Цель и задачи исследования:

Целью исследования является разработка новых методов для анализа данных по таксономическому разнообразию микробных сообществ, полученных с использованием метагеномных технологий, на примере анализа модельных систем природного и искусственного почвенного засоления.

Задачами работы являлись:

1. На основе анализа данных пиросеквенирования библиотек гена 16S рРНК изучить изменение таксономической структуры почвенного микробиома вдоль градиента засоленности в условиях природного почвенного засоления;

2. Изучить изменение таксономической структуры почвенного микробиома в условиях искусственного засоления;

3. Выявить группы микроорганизмов, являющиеся маркерами процессов природного и искусственного засоления;

4. Разработать математические методы для анализа данных высокопроизводительного секвенирования, позволяющие провести ранжирование микроорганизмов в соответствии с реакцией на действие засоленности и дать интегральную оценку структуры и динамики микробных сообществ.

Научная новизна:

Впервые на основе анализа данных высокопроизводительного секвенирования описано изменение таксономической структуры метагенома микробного сообщества в условиях природного и искусственного почвенного засоления и выявлены кандидаты на роль индикаторов засоления - бактерий из сем. ВасШасеае (ПгтгсМез) и пор. 8рЫп§оЬас(епа1е$ (Вас1егогс1е1е&). Впервые предложены новые методы для анализа данных высокопроизводительного секвенирования: 1) метод ранжирования микроорганизмов в соответствии с реакцией на засоленность, позволяющий выявить экологические группы галофильных, галотолерантных и негалофильных микроорганизмов на уровне рода 2) метод математического моделирования динамики микробиомов в таксономическом пространстве гена 16Б рРНК с вычислением интегральных параметров, описывающих их структуру (центральная точка) и динамику (вектор смещения центральной точки), позволяющих установить факт и определить направление сукцессии микробного сообщества.

Научно-теоретическая и практическая значимость исследования.

Предложенные новые методы могут быть использованы для анализа структуры и динамики почвенного микробиома. Они будут востребованы во многих областях практической микробиологии. В природоохранной сфере станет возможным

проведение масштабных мониторинговых исследований по действию основных биогенных и антропогенных экологических факторов на структуру почвенных микробоценозов, что будет способствовать развитию программ, направленных на сохранение их природного биоразнообразия. В сельскохозяйственной практике исследование почвенного микробиома будет способствовать поиску новых потенциально плодородных земель, в криминалистике - формированию базы микробиологических маркеров, позволяющих установить регион происхождения почвенного образца.

Выполнение работы было поддержано:

Программой поддержки фундаментальных исследований по приоритетным направлениям Санкт-Петербургского государственного университета в рамках проекта «Метагеномный анализ микробиома как многофункционального высоко-интегрированного биосферного «интерфейса», грантом РФФИ 12-04-01371-а «Основные факторы, влияющие на формирование структуры почвенного микробиома по данным высокопроизводительного секвенирования» и ГК № 16.512.11.2132 «Разработка метода массового метагеномного скрининга почв сельскохозяйственного назначения в целях оптимизации их использования».

Апробация работы.

Материалы диссертации опубликованы в 12 научных работах (из которых 8 статей и 4 тезиса). По результатам работы были сделаны сообщения на конференциях: VII Московский международный конгресс «Биотехнология: состояние и перспективы развития», 19-22 марта 2013 г., Москва, Россия (устный доклад), VI Всероссийской конференция молодых ученых «Стратегия взаимодействия микроорганизмов и растений с окружающей средой», 24-28 сентября 2012 г., Саратов, Россия (первая премия за устный доклад), школа-конференция для аспирантов AB-RMS («Адаптация к изменению климата в регионе Балтийского моря: вклад исследований из области растительной и микробной биотехнологии») 12-17 июля 2010 г., Миккеле, Финляндия, 4-й съезд европейского микробиологического общества 26-

30 июня 2011 г., Женева, Швейцария, 14-й международный симпозиум по экологии микроорганизмов 19-24 августа 2012 г., Копенгаген, Дания.

Публикации.

По материалам диссертации опубликовано 9 печатных работ (8 статей и одна глава в монографии) и 5 тезисов докладов на российских и международных научных конференциях.

Объем и структура диссертации.

Материалы диссертации изложены на 117 страницах машинописного текста, включающего в себя введение, 5 глав обзора литературы, описание материалов и методов исследования, 5 глав собственных исследований и обсуждения полученных результатов, выводы и список литературы. Работа проиллюстрирована 7 таблицами и 31 рисунками, указатель литературы содержит 154 источника, в том числе 10 отечественных и 144 иностранных.

Глава 1. Обзор литературы. Структура почвенного метагенома и методы ее изучения

Введение

Главной проблемой в изучении микробных сообществ является то, что подавляющее большинство микроорганизмов не поддаются лабораторному культивированию и, поэтому, о биоразнообразии этих микроорганизмов мы можем судить исключительно по разнообразию выделяемых из среды нуклеотидных последовательностей.

Под термином метагеном принято понимать «совокупный» геном микробного сообщества того или иного местообитания (Riesenfeld et al., 2004; Raes et al., 2007; Simon et al., 2011; Mocali et al., 2010). Изучение генетического состава метагенома происходит на основе анализа молекул ДНК, выделенных непосредственно из биоценоза. Дальнейший анализ ДНК подразумевает решение двух задач - исследование таксономической и функциональной структуры микробного сообщества. В первом случае используются ген-специфичные праймеры для изучения филогенетических маркеров биоразнообразия (прежде всего это ген 16S рРНК), во втором случае происходит изучение функциональных генов (например, гены, продукты которых участвуют в процессах нитрификации (атоА), азотфиксации (гены nif) и др.) или совокупного генетического материала сообщества (секвенирование коротких фрагментов генома, их последующая сборка и аннотация).

Исторически первыми были исследования таксономической структуры сообщества, которые с появлением технологий высокопроизводительного секвениро-вания достигли своего расцвета. Производительность современных секвенаторов растет с каждым годом и уже приближается к решению проблемы полного секве-нирования почвенного метагенома (Delmont et al., 2010).

Иногда в литературе можно встретить мнение о том, что в потенциале исследование полноразмерных геномов полностью заменит исследование одной лишь таксономической структуры сообщества (Rondon et al., 2000). Но вопрос о принципиальной возможности для сборки полноценных геномов из метагеномных данных,

по-прежнему, остается открытым. Во-перв