Бесплатный автореферат и диссертация по биологии на тему
Изучение эволюции регуляторных систем прокариот методами сравнительно-геномного анализа
ВАК РФ 03.00.28, Биоинформатика

Автореферат диссертации по теме "Изучение эволюции регуляторных систем прокариот методами сравнительно-геномного анализа"

На правах рукописи

Равчеев Дмитрий Андреевич

ИЗУЧЕНИЕ ЭВОЛЮЦИИ РЕГУЛЯТОРНЫХ СИСТЕМ ПРОКАРИОТ МЕТОДАМИ СРАВНИТЕЛЬНО-ГЕНОМНОГО АНАЛИЗА

03.00.28 - биоинформатика

Автореферат диссертации на соискание ученой степени кандидата биологических наук

□03472054

Москва, 2009

003472054

Работа выполнена в Учреждении Российской академии наук Институте проблем передачи информации им. A.A. Харкевича РАН.

Научный руководитель: кандидат физико-математических наук,

доктор биологических наук, профессор Гельфанд Михаил Сергеевич

Официальные оппоненты: доктор биологических наук

Северинов Константин Викторович Институт молекулярной генетики Российской академии наук

кандидат физико-математических наук Демин Олег Владимирович Институт физико-химической биологии им. А.Н. Белозерского МГУ

Ведущая организация: Федеральное государственное унитарное предприятие

Государственный научно-исследовательский институт генетики и селекции промышленных микроорганизмов

Защита диссертации состоится 11 июня 2008 года в 15 часов на заседании диссертационного совета Д.002.077.02 при Учреждении Российской академии наук Институте проблем передачи информации им. A.A. Харкевича РАН по адресу: 127994, г .Москва, ГСП-4, Большой Каретный переулок, д. 19, стр.1.

С диссертацией можно ознакомиться в библиотеке Учреждения Российской академии наук Института проблем передачи информации им. A.A. Харкевича РАН.

Автореферат разослан ¡lAßuh_200Й года

Ученый секретарь диссертационного совета доктор биологических наук, профессор

с/хлк'У-

Рожкова Г.И.

?

Общая характеристика работы

Актуальность темы:

Бактерии известны своей способностью приспосабливаться к различным условиям и занимать самые разнообразные экологические ниши. Подобная приспособляемость достигается за счет способности достаточно быстро отвечать на изменение окружающих условий и физиологического состояния клетки, чему микроорганизмы обязаны системе регуляции экспрессии собственных генов. В настоящее время общепринятым является мнение, что для эффективного приспособления к окружающим условиям важен не набор имеющихся генов, но и профили их регуляции. Именно регуляция позволяет эффективно использовать имеющиеся гены в зависимости от потребностей клетки.

Долгое время изучение регуляции транскрипции осуществлялось лишь экспериментально. Однако, экспериментальное исследование регуляции транскрипции является крайне трудоемким процессом. Методы же массового анализа, как правило, характеризуются высоким уровнем шума.

В последний десяток лет для изучения регуляции активно применяются методы сравнительного анализа последовательностей геномов. Этому способствуют высокие темпы роста количества геномов с известной полной последовательностью. Так, к настоящему моменту времени известны полные последовательности более чем 800 бактериальных геномов. При этом возрастает количество геномов, относящихся к одному порядку или семейству.

Сравнительный анализ геномных последовательностей позволяет предсказывать функции новых генов, осуществлять метаболическую реконструкцию, предсказывать регуляторные взаимодействия. В случае исследования регуляции методами сравнительной геномики основной задачей является выявление последовательностей, ответственных за регуляцию генов: промоторов и терминаторов транскрипции, сайтов связывания регуляторных белков, последовательностей потенциальных белков-регуляторов. При этом сравнительный анализ позволяет не только предсказывать регуляторные последовательности, но и прослеживать их эволюцию, например, скоординированные изменения в последовательности белка-регулятора и сайта его связывания, исчезновение или появление регуляторных последовательностей перед определенными генами.

Исследование эволюции регуляции не является самоцелью. Подобные исследования позволяют получить новую информацию о биохимии и физиологии микроорганизмов, выявить критические различия между паразитическими и свободно живущими организмами, а также между патогенными и непатогенными бактериями.

\

\

\

Цели и задачи работы;

Целью настоящей работы был анализ эволюции регуляторных взаимоотношений в геномах гамма-протеобактерий. В качестве объектов исследования были выбраны регулятор метаболизма Сахаров FruR, гомологичные репрессоры PurR и RbsR и глобальные регуляторы дыхания Fnr, ArcA и NarP.

В ходе работы были поставлены следующие задачи:

1. Изучение эволюции регуляторных систем на основании сравнения аминокислотных последовательностей регуляторных белков.

2. Построение распознающих правил для предсказания потенциальных сайтов связвания соответствующих факторов транскрипции.

3. Предсказание потенциальных регулонов методами сравнительной геномики.

4. Анализ регулонов в разных группах гамма-протеобактреий, поиск таксон-специфических особенностей регуляции, построение потенциальных сценариев эволюции.

Научная новизна и практическая ценность:

Впервые была подробно исследована регуляция белком FruR в четырех порядках гамма-протеобактерий. Предсказана регуляция 30 новых генов. На основании состава соответствующего регулона в различных таксонах построена эволюционная модель, в соответствии с которой FruR эволюционировал от локального регулятора к глобальному путем расширения регулона.

Подробно исследована эволюция гомологичных регуляторов PurR и RbsR. Приведены доводы в пользу гипотезы о происхождении регуляторов в результате дупликации предкового гена, предложен сценарий эволюции для этих белков. Для PurR предсказана регуляция 27 новых генов, показана консервативность регуляции генов биосинтеза пуриновых нуклеотидов и метаболизма одноуглеродных фрагментов.

Впервые проведен анализ комплексной регуляции дыхания гамма-протеобактрерий, исследована регуляция посредством глобальных регуляторов Fnr, ArcA и NarP. Предсказана регуляция 153 новых генов. Кроме того, предсказан ряд таксон-специфических регуляторных каскадов, показаны корреляции между относительной ролью регулятора в каскаде и составом соответствующего регулона.

Апробация работы:

Основные положения диссертации были представлены на следующих конференциях: 1. The Third International Conference on Bioinformatics of Genome Regulation and Structure (BGRS'2002), 14-20 July 2002, Novosibirsk, Russia.

2. XI международная научная конференция студентов, аспирантов и молодых ученых «Ломоносов-2004», 12-15 апреля 2004, Москва, Россия.

3. The Fourth International Conference on Bioinformatics of Genome Regulation and Structure (BGRS'2004), 25-30 July 2004, Novosibirsk, Russia.

4. XII международная научная конференция студентов, аспирантов и молодых ученых «Ломоносов-2005», 12-16 апреля 2005, Москва, Россия.

5. 2nd Moscow Conference on Computational Molecular Biology (MCCMB'05), 18-21 July 2005, Moscow, Russia.

6. Международная школа «Биоинформатика, геномика, протеомика», 11-18 апреля 2006, Алма-Ата, Казахстан.

7. XIII международная научная конференция студентов, аспирантов и молодых ученых «Ломоносов-2006» 12-15 апреля 2006, Москва, Россия.

8. 4th Bertinoro Computational Biology Meeting "Evolution of and Comparative Approaches to Gene Regulation", 24-30 June 2006, Bertinoro, Italy.

9. Межлабораторный семинар ИППИ РАН, 27 февраля 2007, Москва, Россия.

10. 3rd Moscow Conference on Computational Molecular Biology (MCCMB'07), 27-31 July 2007, Moscow, Russia.

11.30-я конференция молодых ученых и специалистов ИППИ РАН «Информационные технологии и системы» (ИТиС'07), 18-21 сентября 2007, Звенигород, Россия.

12.31-я конференция молодых ученых и специалистов ИППИ РАН «Информационные технологии и системы» (ИТиС'08), 29 сентября - 3 октября 2008, Геленджик, Россия.

Структура и объем диссертации:

Диссертационная работа изложена на 219 страниц машинописного текста и включает в себя введение и пять разделов. Первый раздел представляет собой обзор литературы по теме диссертации. Второй раздел описывает применявшиеся в настоящей работе методы, истоники данных и использованное программное обеспечение. В разделах 3-5 содержатся оригинальные результаты и их обсуждение. Работа содержит 59 рисунков и 18 таблиц. Список цитируемой литературы, приводимый в конце диссертации, содержит 396 наименований.

Содержаение работы

Исследование эволюции обобщенного FruR (СгаУрегулона

Белок FruR (Cra) представляет собой фактор транскрипции, координирующий потоки метаболизма углеводов в Escherichia coli. Этот белок обеспечивает переключение между

анаболизмом и катаболизмом Сахаров, в случае недостатка Сахаров активируя анаболические пути, а в случае их избытка - катаболические1.

В настоящей работе ортологи белка FruR Е. coli были найдены в геномах 18 гамма-протеобактерий, относящихся к четырем порядкам: Enterobacteriales, Pasteurellales, Vibrionales и Pseudomonadales. Поскольку все найденные ортологи FruR достаточно близки эволюционно, для поиска потенциальных сайтов связывания этого белка возможно использование единой матрицы позиционных весов.

Для построения такой матрицы были рассмотрены 5'-некодирующие области генов Е. coli., для регуляция которых была показана экспериментально. В результате с помощью программы SignalX была построена матрица для распознавания потенциальных сайтов связывания белка FruR. Сайт связывания белка FruR представляет собой нестрогий палиндром длиной 16 нуклеотидов (Рисунок 1), консенсус сайта при этом согласуется с ранее предсказанным2.

1-

sM CMl

.sS I yfin^kw^IJLse.

"т-СМО^ГЮСОГ-ЮФОт-СЧСО^ЮШ

Рисунок 1. Диаграмма Лого для сайтов связывания FruR

На следующем этапе был проведен поиск потенциальных сайтов связывания FruR в геномах гамма-протеобактерий. Для определиня состава обобщенного регулона был применен метод проверки соответствия: ген считался относящимся к обобщенному рсгулону, если сайт перед опероном, содержащим его, был обнаружен в нескольких геномах.

В соотвествии с описаной процедурой, к обобщенному регулону было отнесено в целом 57 генов Обобщенный FruR-регулон включает в себя все гены, входящие в регулон в Е. coli, и, кроме того, по результатам настоящего исследования к регулону было отнесено еще 30 генов. Таковыми являются гены фосфотрансферазных систем (manXYZ), центрального метаболизма (tpiA, gapA, gpmA, pdhR-aceEF-lpdA), белков дыхательных комплексов (nuoABCEFGHIJKLMN), ферментов ассимиляции азота (nirBDC-cysG), транспортных белков (сорА) и регуляторных белков (fruR, сгр).

В геномах бактерий из порядка Pseudomonadales были обнаружены доменные перестройки для генов фруктозо-специфичной фосфотрансферазной системы, кодируемых опероном fruBKA.

1 Saier M.H., Ramseier T.M. The catabolite repressor/activator (Cra) protein of enteric bacteria // J Bacteriol - 1996 - Vol. 178 (12)-Pp. 3411-3417.

2 Negre D„ Bonod-Bidaud C., Geourjon C„ Deleage G., Cozzone A.J., Corny J. C. Definition of a consensus DNA-binding site for the Escherichia coli pleiotropic regulatory protein, FruR // Mol Microbiol - 1996 - Vol. 21 (2) - Pp. 257-266.

В случае Pseudomonadales первый ген из этого оперона кодирует химерный белок, N- и С-концевые участки которого ортологичны соответственно белкам FruB и PtsI Е. coli. То есть, у Pseudomonadales fru-оперон кодирует не только специфичные для транспорта фруктозы белки, но и белки, необходимые для функционирования всех фосфотрансферазных систем. Возможно, это связано с тем, что в геномах бактерий этой группы гены для других фосфотрансферазных систем отсутствуют.

В ходе исследования FruR-регулона в различных гамма-протеобактериях была замечена следующая особенность: состав регулона крайне сильно отличается в различных порядках микроорганизмов. Так, в Pseudomonadales в состав регулона входит лишь один оперон, fruB/ptsI-fruKA. Аналогичная ситуация наблюдается и в Vibrionales, где единственным членом регулона является оперон fruBKA. В группе Pasteurellales регулон полностью отсутствует. У бактерий порядка Enterobacteriales, по сравнению с другими таксонами, наблюдается необычайное расширение регулона. Так, опероны fruBKA, ptsHI-crr, manXYZ, glk, epd-pgk-fbaA, ppsA, pfkA, pykF, icdA, adhE, tpiA, gapA, gpmA, pdhR-aceEF-lpdA, nuoABCDEFGHlJKLMN, nirBDC-cysG, сорА и crp входят в состав FruR-регулона в большинстве геномов из этой группы. Другие же опероны, а именно mtlADR,ft>p, edd-eda, рскА и асеВАК, регулируются лишь в Е. coli и близких к ней Salmonella spp.

Таким образом, можно условно разделить все члены обобщенного FruR-регулона на три группы, в соответствии с таксономическим распространением их регуляции:

• гены, регулируемые во всех исследованных геномах, за исключением Pasteurellales;

• гены, регулируемые только в геномах Enterobacteriales;

• гены, регулируемые только в геномах Е. coli и Salmonella spp.

На основании подобного распределения членов регулона по таксономическим группам, был предсказан наиболее вероятный сценарий эволюции FruR-регулона. По всей видимости, первоначально FruR-регуляция возникла у общего предка еще до отделения группы Pseudomonadales, причем первоначально FruR существовал как регулятор единственного fru-оперона. Такая ситуация сохранилась в геномах представителей Pseudomonadales и Vibrionales.

В дальнейшем в группе Pasteurellales регулон разрушился в процессе эволюции, причем в разных геномах можно наблюдать разные стадии этого процесса. У части организмов, таких как Haemophilus influenzae и Haemophilus dukreyi ген fruR оказался полностью утрачен. В геноме Pasteurella multocida, хотя и присутствует полноразмерный ген fruR, не было найдено потенциальных сайтов связывания белка ни перед одним геном, входящим в регулон в других исследованных микроорганизмах.

У Enterobacteriales произошло значительное расширение регулона путем появления новых сайтов связывания FruR перед генами центрального метаболизма, дыхания, ассимилляции азота, транспортных и регуляторных белков. В процессе дальнейшего эволюционного

расхождения разных групп Enterobacteriales происходили изменения состава регулона путем исчезновения сайтов перед теми или иными генами. Дальнейшее расширение FruR-регулона произошло в узкой группе, входящей в состав Enterobacteriales, и включающей в себя Е. coli и Salmonella spp. (Рисунок 2).

KD1

-CD-

■ Escherichia coli

■ Salmonella typhi Enterob.

• Salmonella typhimurium Yersinia pestis

Yersinia pseudotuberculosis Yersinia entemcoütica ' Serratia marcescens

• Pectobacterium carotovorum

• Pectobacterium chysanthemium

• Photorhabdus luminescens

icteriaies

Pasteurdla muliocida Pasteurcllales

AvtiitobnciUus aciinomycetemcomitans

— l'ibriußschcri

I- Vibrio cliolerae

[l— Vibrio parahaeniolylicus ^— Hbrio vulnificus -PhoCobacterium prüßmclum

Vibrii

males

I-Pseudomonas ai'ivginosa Pseildomi

—( I— Pseudomonas syringae LP— Pseudomonas fluorescens '-Pseudomonas ¡nitida

nadales

Рисунок 2. Предполагаемый сценарий эволюции FruR-регулона гамма-протсобактерий. Цифрами отмечены предполагаемые эволюционные события: 1 - возникновение FruR-регуляции оперона /га; 2 - разрушение регулона в Pasteurellales; 3 - расширение регулона в Enterobacteriales; 4 - дальнейшее расширение регулона в группе, включающей Е. coli и Salmonella spp.

Исследование эволюции обобщенных PurR- и RbsR-регулонов

Транскрипционные факторы PurR и RbsR - это очень похожие белки. Так, последовательности указанных белков из Е. coli тождественны на 47,0%. При этом в Е. coli эти белки являются ближайшими гомологами, то есть сходство между ними значительно выше, чем сходство каждого из них с любым другим белком, закодированном в этом геноме, что позволяет предположить происхождение этих белков в результате относительно недавней дупликации одиночного предкового гена. Поэтому в настоящей работе было проведено исследование эволюции белков PurR и RbsR и регулируемых ими генов.

Ортологи PurR Е. coli были найдены в 15 геномах бактерий из порядков Enterobacteriales (Е. coli, Salmonella typhi, S. typhimurium, Yersinia pestis, Y. pseudotuberculosis, Pectobacterium carotovorum, Photorhabdus luminescens), Pasteurellales (Pasteurella multocida, Haemophilus influenzae, H. ducreyi) и Vibrionales (Vibrio vulnificus, V.parahaemolyticus, V. cholerae, V. fischeri, Photobacterium profundum). Во всех перечисленных геномах, за исключением Y. pestis, Y.

pseudotuberculosis и H. ducreyi, были также обнаружены ортологи белка RbsR. В геномах из порядка Pseudomonadales (Pseudomonas aeruginosa, P. putida, P. fluorescens, P. syringae) был обнаружен белок, одинаково схожий с PurR и RbsR из Е. coli. Можно предположить, что белок из Pseudomonadales происходит напрямую от предкового белка, a PurR и RbsR из Enterobacteriales, Pasteurellales и Vibrionales являются потомками копий, образовавшимися в результате дупликации исходного гена.

Ранее было показано, что в Е. coli белок RbsR репрессирует экспрессию оперона rbsDACBKR, связываясь с сайтом, расположенном в промоторной области3. Кроме того, сайты перед rfo-опероном были предсказаны в геномах S. typhi, P. multocida, Н. influenzae и V. cholerae4. На основе вышеперечисленных сайтов была построена матрица для распознавания потенциальных сайтов связывания белка RbsR. Сайт связывания белка RbsR представляет собой палиндром длиной 20 нуклеотидов (Рисунок 3).

Рисунок 3. Диаграмма Лого для сайтов связывания RbsR

В результате поиска потенциальные сайты связывания RbsR были обнаружены перед опероном rbsDACBKR во всех геномах, где присутствует ген регуляторного белка . Обнаружить консервативные потенциальные сайты перед какими-либо другими оперонами не удалось.

В геноме Н. ducreyi не было найдено ортологов для ни одного из генов рибозного оперона, тогда как в геномах Y. pestis и Y. pseudotuberculosis, где ген белка RbsR отсутствует, были обнаружены ортологи для генов rbsD и rbsK, лежащие в одном потенциальном опероне, причем перед опероном был найден потенциальный сайт с весьма высоким весом (Рисунок 4). Подобные данные указывают на то, что утрата гена регулятора произошла относительно недавно. При этом были утеряны и все гены транспортера рибозы, кроме rbsD, но сохранился ген rbsK, кодирующий киназу рибозы.

3 Mauzy C.A., Hermodson M.A. Structural and functional analyses of the repressor, RbsR, of the ribose operon of Escherichia coli II Protein Sci - 1992 - Vol. 1 (7) - Pp. 831-842.

4 Laikova O.N., Mironov A. A., Gelfand M.S. Computational analysis of the transcriptional regulation of pentose utilization systems in the gamma subdivision of Proteobacteria // FEMS Microbiol Lett - 2001 - Vol. 205 (2) - Pp. 315-322.

Enterobacteriales (кроме Yersinia spp.), Pasteurellales, Vibrionales

RbsR-caiiT rbsD rbsA rbsC rbsB rbsK rbsR

Yersinia spp.

RbsR-caiiT ibsD rbsK

Pseudomonadales

RbsR-canr rbsB rbsA rbsC rbsR rbsK rbsD

Рисунок 4. Структура рибозного оперона в различных гамма-протеобактериях.

Ввиду эволюционной близости всех найденных ортологов PurR, PurR-регупяция во всех геномах была исследована с использованием единой матрицы. В геноме Е. coli ранее были экспериментально установлены сайты связывания пуринового репрессора перед 19 оперонами5. Эти сайты были использованы в качестве обучающей выборки для построения соответствующей матрицы. Сайт связывания белка PurR представляет собой нестрогий палиндром длиной 16 нуклеотидов (Рисунок 5).

СО О) о

Рисунок 5. Диаграмма Лого для сайтов связывания PurR

К обобщенному PurR-регулону было отнесено в общей сложности 62 гена, объединенных как минимум в 49 оперонов. Помимо экспериментально известных членов регулона и Е. coli и генов с ранее предсказанной регуляцией, к обобщенному регулону были добавлены 27 новых генов. К новым членам регулона относятся гены модификации пуриновых нуклеотидов (guaC, gsk, ushA), синтеза пиримидиновых нуклеотидов (upp-uraA, carAB, pyrLBI), метаболизма одноуглеродных фрагментов (folD, rpiA, serA, flis), транспортных белков (uraA, gltS), утилизации нуклеотидов и нуклеиновых кислот (xseA, cytR), центрального метаболизма (рскА, ppsA, glpX) и гены с неизвестной функцией (ydiA, yiiU, yhhQ, ydij, HD1120, VC2168).

В ходе исследования эволюции пуриновой регуляции гамма-протеобактерий было замечено, что состав регулона достаточно сильно различается в разных видах бактерий. Все

5 Zalkin H., Neiihardt P. Biosynthesis of purine nucleotides // Escherichia coii and Salmonella. Cellular and Molecular Biology - ASM Press - Washington D.C. - Pp. 1325-1333.

входящие в регулои гены можно условно разделить на три группы. Первая группа - так называемое ядро регулона, то есть гены, регулирующиеся во всех геномах или в подавляющем большинстве. К этой группе относятся большая часть генов биосинтеза инозинмонофосфата (ИМФ) из рибозо-5-фосфата (ригТ, ригЬ, ригМЫ, ригНй, рпА, ригС, ригВ) и гены метаболизма одноуглеродных фрагментов, ассоциированных с фолатами ^а>ТНР, /ЪЮ, §1уА, Аи). Вторая группа включает гены, регуляция которых слабо консервативна, но при этом встречается в различных таксонах. Это гены азотного метаболизма (¡реАВ), метаболизма одноуглеродных фрагментов (¡егА), трансмембранных белков (#/(5, укЕ, у]сЦ), утилизации нуклеотидов (хзеА), а также ген с неизвестной функцией у11И(). К третьей группе были отнесены гены с таксон-специфической регуляцией. Для ЕЩегоЬааепакз характерна регуляция собственно гена белка регулятора РигЯ, генов, участвующих в модификации нуклеотидов (ригА, guaBA), генов биосинтеза пиримидиновых нуклеотидов (соЛВА, ирр-игаА, ругС, ругй, сагАВ, ругЬВГ), генов трансмембранных белков (¡ях, у/еб) и гена с неизвестной функцией уйи. Что касается порядка Ра51еиге1Ые8, то для него характерна регуляция гораздо меньшего числа генов, таких как гргА, ответственного за синтез рибозо-5-фосфата, генов центрального метаболизма рскА и g 1рХ, а также генов уМ] уйи и Нй1120, функция которых неизвестна. Картина, наблюдающаяся в УШпопакв, похожа на таковую для бактерий из порядка ЕтегоЬааепакз с некоторыми отличиями. Так, для УШпопакв была установлена регуляция генов модификации пуриновых нуклеотидов (¿иаВА, guaC, gsk, шИА), биосинтеза пиримидиновых нуклеотидов (ирр-игаА, ругС, ругй, ругЬВ!), трансмембранных белков (уг'еО), центрального метаболизма (рскА, glpX, рряА) и ряда генов с неизвестными функциями (уМА, УС2168, уиЦ).

В целом охарактеризовать консервативность РигИ-зависимой регуляции можно следующим образом: наиболее консервативной являеся регуляция генов, учасвующих в биосинтезе ИМФ из рибозо-5-фосфата, а также генов, ответственных за синтез необходимых для этого производных фолатов. Регуляция генов, необходимых для модификаций ИМФ и синтеза пиримидиновых нуклеотидов, так же как и генов центрального метаболизма консервативна на уровне определенных таксонов. Для остальных генов регуляция хоть и встречается в различных таксонах, но консервативной не является.

Бактерии порядка Р8еш1отопа11а1ез содержат белок, примерно одинаково сходный с белками РигЯ и ЯЬэК из других порядков гамма-протеобактерий. В ходе анализа локализации данного гена на хромосоме было обнаружено, что он расположен совместно с гйя-генами, и, по всей видимости, составляет с ними один оперон гЬзВАСККй (Рисунок 4). При сравнении структуры г£>.?-оперона в РвеиёотопасЫез и бактериях из других таксонов было замечено, что в эволюции сохраняется состав оперона, хотя и меняется порядок генов в нем. На основании кластеризации белка-регулятора из РвешкипопасЫез с генами гбя-оперона естественно предположить, что данный белок выполняет функцию НЬбИ, то есть регулирует экспрессию

/-¿«-оперона. Исходя из этого предположения, были исследованы промоторные области оперона и с помощью программы программы были обнаружены высоко консервативные

участки длиной 14 нуклеотидов Как и в случаях РигЛ и ШкЫ других гаммапротеобактерий, сайт имеет структуру палиндрома (Рисунок 6). В результате поиска консервативные потенциальные сайты связывания ЯЬвК РэеисЬтопасЫев были обнаружены во всех исследованных геномах из данного порядка только перед собственно гЬз-опероном. Ни перед одним из других генов не удалось выявить значимых консервативных сайтов. Таким образом, можно утверждать, что в Рзеис1отопа(1а1е8 ЛЬвИ представляет собой регулятор одного оперона.

Рисунок 6. Диаграмма Лого для сайтов связывания ИкЯ РзеисЬтопасЫей

С целью более детально проследить эволюцию регуляторных систем РигИ. и МиЯ, было проведено сравнение сайтов связывания трех регуляторных белков (Рисунок 7). Сайты всех исследуемых белков имеют палиндромную структуру. При этом центральная часть сайтов длиной 8 нуклеотидов весьма консервативна и имеет консенсус АААССГТТ, а информационное содержание крайних позиций невелико. Наиболее значительные различия наблюдаются в тройках нуклеотидов, ближайших к центральной консервативной части. Именно в этой области и наблюдаются основные различия между сайтами РигЯ и М^И. В то же время, последовательность сайта ШкЯ Р8еис1отопас1а1ез более похожа на таковую для РигЯ, чем для По всей видимости, сайт связывания РигИ сохранил исходную структуру, существовавшую в предковом геноме.

На основании данных о филогении регуляторных белков, структуре сайтов и составе обобщенных регулонов была выдвинута следующая модель эволюции регуляторных систем РигЛ и Rb.sK (Рисунок 8). Судя по всему, первоначально белок ШкЯ существовал как локальный регулятор, контролирующий экспрессию одного /■¿«-оперона. Однако затем, после отделения предковых форм РвеисЬтопасЫеБ, произошла дупликация гена белка-регулятора. Далее в к происходили следующие события. В одной ветви белок сохранила свою функцию локального регулятора, рибозного репрессора, но при этом изменилась структура сайта связвания. Так образовался регулятор КЬэЯ ЕгПегоЬа^пакэ, Ра51еиге11а1е5 и УШпопакя. В другой же ветви структура сайта в целом сохранилась, однако, изменилась функция белка. В отличие от Иги!?, для РиЖ не наблюдается постепенного расширения регулона. По-видимому,

образование регулона происходило довольно быстро в эволюционном масштабе.

10

Entcrobactcrialcs, Pastcurcllalcs, Vibrionales RbsR

___CI* Г \ fil

гтП

I UA

AG

«O"rin<or»coo>o^t4p>4,u,i<ot-»«eo>o

PurR 2

Pseudomonadales RbsR

л to h. со o> ö

= 1

Г А

—jj— i . —^—

41- in <e i*. л ел о

Рисунок 7. Сравнение сайтов связывания RbsR, PurR и RbsR Pseudomonadales.

Enterobacteriales

Pseudimianadales

Рисунок 8. Предполагаемый сценарий эволюции регулонов RbsR, РиЖ и RbsR Pseudomonadales. Цифрами отмечены предполагаемые эволюционные события: 1 - RbsR -локальный регулятор гЬз-оперона; 2 - удвоение гена белка-регулятора; 3 - изменение структуры сайта связывания КЬбЯ с сохранением функции; 4 - изменение специфичности связывания с лигандом РиЖ при сохранении сайта, возникновение РиЖ-регулона.

Эволюция глобальной регуляции дыхания

Предшествующие исследования Рпг- и АгсА-регулонов гамма-протеобактерий6'7 показали, что глобальная регуляция дыхания слабо консервативна. По всей видимости, это связано с

6 Герасимова A.B., Родионов Д.А., Миронов A.A., Гельфанд М.С. Компьютерный анализ регуляторных сигналов в бактериальных геномах. Участки связывания Fnr // Мол Биол - 2001 - Т. 35 - №6 - С. 1001-1010.

наличием множественной регуляции у генов, задействованных в дыхании и смежных процессов. В связи с этим было принято решение о комплексном изучении глобальной регуляции дыхания, то есть, об одновременном исследовании Fnr-, ArcA- и NarP-зависимой регуляции.

Ортологи белка Fnr из Е. coli были найдены в 12 организмах, относящихся к трем порядкам: Enterobacteriales (Salmonella typhi, Yersinia pestis, Y. enterocolitica, Pectobacterium carotovorum), Pasteurellales (Pasteurella multocida, Actinobacillus actinomycetemcomitans, Haemophilus influenzae, H. ducreyi), и Vibrionales (Vibrio vulnificus, V.parahaemolyticus, V. cholerae, V.fischeri).

Во всех перечисленных геномах были найдены и ортологи регуляторного белка АгсА. Ортологи же сенсорного белка АгсВ, активирующиего АгсА, были обнаружены во всех перечисленных выше геномах, кроме Н. influenzae и Н. ducreyi. Для ортологов АгсВ была обнаружена еще одна особенность. Известно, что ключевую роль в димеризации и последующей активации АгсВ Е. coli играют цистеиновые остатки Cysl80 и Cys241, расположенные в трансмембранном PAS-домене, причем основную роль в димеризации играет Cysl80, а замена Cys241 является менее критичной8. Оба цистеиновых остатка консервативны лишь в белках Enterobacteriales и V. flscheri, тогда как в других Vibrionales консервативен лишь Cysl80, что дает повод полагать, что у Vibrionales АгсВ, скорее всего, функционален. У представителей же Pasteurellales полностью отсутсвует PAS-домен. Не исключено, что у этих бактерий активация АгсА осуществляется другим сенсорным белком. Подобная ситуация была описана для другого представителя гамма-протеобактерий, Shewanella oneidensis MR-19. Тем не менее, наличие ортологов регуляторного белка АгсА во всех вышеупомянутых организмах позволяет провести исследование соответствующей регуляции.

Поиск ортологов регуляторных белков показал, что оба регулятора, NarL и NarP, присуствуют лишь в Е. coli, S. typhi и Р. carotovorum, тогда как в геномах Yersinia spp., Pasteurellales и Vibrionales был обнаружен только одиночный регулятор NarP. Похожая, но не идентичная ситуация наблюдалась для сенсорных белков NarX и NarQ. В геномах, где присутствуют гены для обоих регуляторов, также обнаружены гены двух сенсорных белков. В геномах же с одиночной регуляторной системой ген пагР существует совместно с narQ, за исключением Y. pestis и Y. enterocolitica, в которых обнаружена нестандартная пара NarP-NarX.

7 Герасимова А.В., Гельфанд М.С., Макеев В.Ю., Миронов А.А., Фаворов А.В. Регулятор АгсА в гамма-протеобактериях. Определение сайтов связывания и описание регулона // Биофизика - 2003 - Т. 48 - №1 - С. 21 25.

8 Malpica R., Franco В., Rodriguez С., Kwon О., Ceorgellis D. Identification of a quinone-sensitive redox switch in the ArcB sensor kinase//Proc Natl Acad Sci USA - 2004 - Vol. 101 (36)-Pp. 11318-11323.

9 Gralnick J.A., Brown C.T., Newman D.K. Anaerobic regulation by an atypical Arc system in Shewanella oneidensis II Mol Microbiol - 2005 - Vol. 56 (5) - 1347-1357.

Поскольку NarX взаимодействует с белком NarL, но не с NarP10 (Rabin and Stewart, 1993), последовательности сенсорных белков были рассмотрены более подробно.

Важной особенностью модуля NarX Е. coli, является кластер цистеинов Cys265, Cys302, Cys308, Cys313 и Cys316u. Было обнаружено, что в последовательностях белков из У. pestis и У. enterocolitica отсутствует характерные для NarX цистеиновые остатки. Следовательно, хотя сенсорные белки из бактерий рода Yersinia spp. близки по последовательности к NarX, они, по всей вероятности, выполняют функцию NarQ.

Были также обнаружены корреляции между строением регуляторной системы и системы нитрат-нитритного дыхания. Так, в геномах, содержащих обе системы NarX-NarL и NarQ-NarP, были обнаружены гены как для цитоплазматической, так и для периплазматической нитрат-редуктаз. В геномах, где присутствует лишь одна регуляторная двукомпонентная система, были найдены гены только для периплазматической нитрат-редуктазы.

Поскольку данные о структуре сайтов связывания NarL противоречивы, а наличие удвоенной двукомпонентной системы усложняет исследование, было принято решение ограничиться изучением регуляции в геномах, содержащих одну систему регуляции нитрат-нитритного дыхания. Во всех таких геномах была исследована регуляция белками Fnr, АгсА и NarP.

Матрица для поиска потенциальных сайтов связывания Fnr была составлена на основе экспериментально определенных сайтов из Е. coli. Fnr-связывающий мотив представляет собой инвертированный повтор длиной 14 нуклеотидов (Рисунок 9).

Рисунок 9. Диаграмма Лого для сайтов связывания Fnr

В случае АгсА-зависимой регуляции существующих данных о структуре сайтов связывания было недостаточно для построения чувствительного распознающего правила. Поэтому регуляторные области генов, экспрессия которых регулируется АгсА в Е. соИ были

10 Rabin R.S.. Stewart V. Dual response regulators (NarL and NarP) interact with dual sensors (NarX and NarQ) to control nitrate- and nitrite-regulated gene expression in Escherichia coli K-12 // J Bacteriol -1993 - Vol. 175 (11) - Pp. 32593268.

" Stewart V. Biochemical Society Special Lecture. Nitrate- and nitrite-responsive sensors NarX and NarQ of proteobacteria

11 Biochem Soc Trans - 2003 - Vol. 31 (l)-Pp. 1-10.

проанализированы с помощью программы 8е81МСМС12. Всего перед 14 генами было найдено 18 потенциальных сайтов связывания регулятора, на основании которых была построена матрица позиционных весов. Потенциальный мотив связывания АгсА представляет собой несовершенный повтор длиной 15 нуклеотидов (Рисунок 10).

1-

т- <м т *f ю

0 г- см о ** ю со N со сп о ^

Рисунок 10. Диаграмма Лого для сайтов связывания АгсА

В отличие от других регуляторов дыхания, Инг и АгсА, в случае ЫагР использование матрицы, построенной по сайтам связывания данного белка в Е. соИ, было сочтено неправомерным в силу следующих причин. В Е. соИ регуляция генов нитрат-нитритного дыхания осуществляется сразу двумя гомологичными белками, КагЬ и КагР, причем наблюдается различная специфичность белков-регуляторам к сайтам связывания13. Во всех исследованных геномах, где был обнаружен единственный ген пагР, также были найдены гены периплазматической нитрат-редуктазы пар и гены сст-оперона, отвечающие за перенос гема в периплазму. В некоторых из этих геномов были найдены гены периплазматической нитрит-редуктазы пг/. Для построения матрицы для поиска сайтов связывания были исследованы регуляторные области оперонов, содержащих парсст- и пг/-гекы в исследуемых геномах. Перед большинством данных оперонов были найдены палиндромные последовательности длиной 16 п.н. (Рисунок 11).

2-1

0J

U^MsMl

CMe0*finC0h.C0C>O*-C4C04-in iD

Рисунок 11. Диаграмма Лого для сайтов связывания NarP

12 Favorov A. V., Gelfand M.S.. Gerasimova A. V., Ravcheev D.A., Mironov A.A., Makeev V.J. A Gibbs sampler for identification of symmetrically structured, spaced DNA motifs with improved estimation of the signal length. Bioinformatics - 2005 - V. 21 (10) - Pp. 2240-2245.

13 Darwin A. J., Tyson K.L, Busby S.J., Stewart V. Differential regulation by the homologous response regulators NarL and NarP of Escherichia coli K-12 depends on DNA binding site arrangement//Mol Microbiol - 1997 - Vol. 25 (3) - 583-595.

В десяти геномах гамма-протеобактерий были исследованы обобщенные регулоны для факторов транскрипции Fnr, ArcA и NarP. Поскольку, как уже отмечалось ранее, регуляция каждой отдельной регуляторной системой слабо консервативна, то имеет смысл рассматривать регуляцию тремя системами в целом. В общей сложности к трем обобщенным регулонам было отнесено 153 гена, в том числе и 68 новых членов регулонов. К новым членам регулонов относятся гены дыхательных систем (atpIBEFHAGCD, nqrABCDEF, torYZ, fdoGHI, fdxGHI, fdhD, dadAX), центрального метаболизма (sfcA, pckA, eno, pgk, talB, aldB), метаболизма углеводов (ptsHI-crr, mtlADR, deoCABD, nagB, glgBXCAP), метаболизма жирных кислот (fabBA, fadIJ, fadD, acpP-fabF), ответа на кислородный стресс (sodA), нуклеотидредуктаз (nrdAB), транспортных белков (gltP, gntXY,fadL) и регуляторных белков (dusB-fis, cpxRA, oxyR,fur).

В ходе исследования были выявлены существенные различия в регуляции между порядками гамма-протеобактерий. Так, в Yersinia spp. обобщенный регулон NarP оказался намного меньше, чем в других таксонах. Обратная ситуация наблюдается для Pasteurellales, где обобщенный регулон NarP увеличен по сравнению с другими таксонами. Другой отличительной чертой этого порядка является высокая степерь перекрывания между обобщенными регулонами для разных регуляторов. Характерной чертой Vibrionales является увеличение обобщенного АгсА по сравнению с другими группами.

На основе наличия консервативных предсказанных сайтов перед генами fnr, arcA, и пагР был предсказан ряд таксон-специфических регуляторных каскадов (Рисунок 12). Для Е. coli регуляторные каскады были известны из экспериментальных работ. В этом организме Fnr представляет собой главный регулятор дыхания, контролирующий экспрессию генов других регуляторов: Fnr репрессирует транскрипцию оперона narXL и собственного гена, а также регулирует транскрипцию гена агсА14. Перед геном агсА был ранее предсказан собственный сайт, и на основании положения последнего отностельно экспериментально извсестных промоторов был сделан вывод о позитивной авторегуляции15. Регуляторы нитрат-нитритного дыхания формируют сложную сеть регуляторных взаимодействий16.

Однако, в геномах других гамма-протеобактерий наблюдается иная ситуация. В Yersinia spp. Fnr, по всей видимости, регулирует экспрессию агсА, и оба гена fnr и агсА авторегулируются. При этом система регуляции нитрат-нитритного дыхания не принимает участия в регуляторных каскадах.

Более значительные изменения в системе регуляторных каскадов были обнаружены в геномах Pasteurellales. В геномах большинства представителей этого порядка потенциальные

14 Takahashi К., Hattori T., Nakanishi T., Nohno T., Fujita N., Ishihama A., Taniguchi S. Repression of in vitro transcription of the Escherichia coli fnr and narX genes by FNR protein // FEBS Lett - 1994 - Vol. 340 (1-2) - Pp. 59-64.

15 Герасимова A.B., Гельфанд M.C., Макеев В.Ю., Миронов A.A., Фаворов A.B. Регулятор АгсА в гамма-протсобактериях. Определение сайтов связывания и описание регулона // Биофизика - 2003 - Т. 48 - № 1 - С. 2125.

16 Darwin A.J., Stewart V. Expression of the narX, narL, narP, and narQ genes of Escherichia coli K-12: regulation of the regulators // J Bacteriol - 1995 - V. 177 (13) - Pp. 3865-3869.

15

сайты связывания Fnr, ArcA и NarP были обнаружены перед геном fnr, тогда как перед генами агсА и пагР не было найдено консервативных сайтов.

В случае Vibrionales также была предсказана авторегуляция для генов fnr, агсА и пагР. Белок АгсА, по всей видимости, регулирует экспрессию гена пагР, тогда как Fnr контролирует экспрессию генов агсА и пагР.

Таким образом, структура регуляторных каскадов, характерная для Е. coli, не сохраняется в других гамма-протеобактериях, и относительная роль каждого регулятора в каскадах может меняться от таксона к таксону.

Escherichia coli

J3-

r

Yersinia spp.

* i

Jtt

l^M^lonv

УИМКИ6ИМ1 trnrO ЕДУ

KSSay

J3-е/у\®

0У0

r

----

УИМИМЭТМ1 narP ИУ

WWWWll narx ту

Pastcurellales

i i t -ö-

— "Ci

игкдхумду/йс •• v агсЛ]ь(

■iwmtocwmI «'im ':/:v

- репрессия)

- предсказанная регуляция

ЪОТМРЧХУМ) пагр tny 1ксперпме>[тал1.пые данные

Г*

I i г+'Ж

NijrPJ^

»+ г* "Q1

Рисунок 12. Регуляторные каскады в различных таксонах

Выводы

1. Построено распознающее правило для поиска потенциальных сайтов связывания белка фруктозного репрессора РпЖ и предсказано 26 новых членов обобщенного РгиК-рсгулона.

2. Построена модель эволюции обобщенного FruR-регулона, показана эволюция от локального регулятора оперона fruBKA до глобального регулятора метаболизма Сахаров.

3. Построены распознающие правила для поиска потенциальных сайтов белков PurR, RbsR и RbsR Pseudomonadales и предсказано 25 новых генов, входящих в обобщенный регулон PurR.

4. Построена модель эволюции, в соответствии с которой PurR и RbsR являются результатом дупликации предкового белка, репрессора рибозного оперона, с последующим изменением функции PurR и структуры мотива связывания RbsR.

5. Построены распознающие правила для поиска потенциальных сайтов связывания факторов транскрипции Fnr, АгсА и NarP, разработана и применена методика анализа комплексной регуляции в родственных геномах. Предсказано 67 новых членов обобщенных регулонов.

6. Предсказаны таксон-специфичные регуляторные каскады, показаны корреляции между перестройкой структуры регуляторных каскадов и размером обобощенного регулона: регуляторы, занимающие относительно более высокое положение в каскаде, имеют большие регулоны.

7. Для глобальной регуляции дыхания показано наличие консервативных ядер регулонов и таксон-специфичной периферической регуляции.

Список публикаций по теме диссертации

Публикации в научных журналах

1. Равчеев Д.А., Гельфанд М.С., Миронов A.A., Рахманинова А.Б. Пуриновый регулон гамма-протеобактерий. Детальное описание // Генетика. 2002. Т. 38. №9, С. 1203-1214.

2. Favorov A.V., Gelfand M.S., GerasimovaA.V., Ravcheev D.A., Mironov A.A., Makeev V.J. A Gibbs sampler for identification of symmetrically structured, spaced DNA motifs with improved estimation of the signal length // Bioinformatics. 2005. Vol. 21. P. 2240-2245.

3. Равчеев Д.А., Рахманинова А.Б., Миронов A.A., Гельфанд M.C. Регуляция нитрат-нитритного дыхания гамма-протеобактерий. исследование методами сравнительной геномики // Молекулярная биология. 2005. Т. 39. №5. С. 832-846.

4. Ravcheev D.A., Gerasimova А. V., Mironov A.A., Gelfand M.S. Comparative genomic analysis of regulation of anaerobic respiration in ten genomes from three families of gamma-proteobacteria (Enterobacteriaceae, Pasteurellaceae, Vibrionaceae) // BMC Genomics. 2007. Vol. 8. Suppl. 1. P. 54.

5. Цыганова M.O., Гельфанд M.C., Равчеев Д.А. Регуляция дыхания у энтеробактерий: сопоставление данных по экспрессии на биочипах и сравнительно-геномного анализа // Молекулярная биология, 2007. Т. 41. №3. С. 556-571.

Публикации в сборниках трудов конференций

1. Ravcheev D.A., Gelfand M.S., Mironov A.A., Rakhmaninova A.B. Purine regulon of gamma-proteobacteria // Proc. 3rd International Conference on Bioinformatics of Genome Regulation and Structure (BGRS'2002). 2002. Vol. 2. P. 38-39.

2. Равчеев Д.А., Рахманинова А.Б. NarP-зависимая регуляции нитрат-нитритного дыхания у гамма-протеобактерий. Исследование эволюции дыхательной системы методами сравнительной геномики // Сборник тезисов XI Международной научной конференции студентов, аспирантов и молодых ученых «Ломоносов-2004». 2004. Т. 1. С. 27.

3. Gerasimova A.V., Ravcheyev D.A., Gelfand M.S., Rakhmaninova A.B. Comparative genomic analysis of respiration switch in gamma-proteobacteria // Proc. 4th International Conference on Bioinformatics of Genome Regulation and Structure (BGRS'2004). 2004. V.2. P. 195-198.

4. Равчеев Д.А. Исследование регуляции нитрат-нитритного дыхания гамма-протеобактерий методами сравнительной геномики // Сборник тезисов XII Международной конференции студентов, аспирантов и молодых ученых «Ломоносов». 2005. Т. 2. С. 34-35.

5. Ravcheev D.A., Gerasimova A.V. How gamma-proteobacteria switch the mode of respiration: A comparative genomic analysis // Proceedings of the International Moscow Conference on Computitional Molecular Biology (MCCMB'05). 2005. P. 321-322.

6. Tsiganova M„ Ravcheev D.A. Regulation of respiration in Escherichia coli: the comparison of microarray and genomics data // Proceedings of the International Moscow Conference on Computitional Molecular Biology (MCCMB'05) 2005. P. 401-402.

7. Zakirzianova V., Ravcheev D.A. A comparative genomic analysis of an evolving regulatory system: how FruR became Cra // Proceedings of the International Moscow Conference on Computitional Molecular Biology (MCCMB'05) 2005. P. 423-424.

8. Равчеев Д.А. Исследование регуляции нитрат-нитритного дыхания гамма-протеобактерий методами сравнительной геномики // Материалы международной школы «Биоинформатика, геномика, протеомика». 2006. С. 48-51.

9. Закирзянова В.В., Равчеев Д.А. Исследование обобщенного FruR-регулона гамма-протеобактерий методами сравнительной геномики // Материалы XIII международной конференции студентов, аспирантов и молодых ученых «Ломоносов». 2006. Т. 4. С. 45-46.

10. Цыганова М.О., Равчеев Д.А. Регуляция дыхания у энтеробактерий: сопоставление данных по анализу экспресии на биочипах и сравнительно-геномного анализа // Материалы ХП1 международной конференции студентов, аспирантов и молодых ученых «Ломоносов». 2006. Т. 4. С. 39-40.

11. Ravcheev D.A. Regulation of respiration in gamma-proteobacteria: evolution of multiple regulatory systems // Proc. 4th Bertinoro Computational Biology Meeting (BCB 2006).

12. Tsoy O.V., Zakirzianova W., Ravcheev D.A. Stories about the evolution of regulators: how FruR became CRA and RbsR became PurR // Proc. 3rd Moscow Conference on Computational Molecular Biology (MCCMB'07). 2007. P. 300.

13. Цой O.B., Закирзяпова В., Равчеев Д.А. Как PurR стал Cra, a RbsR стал PurR: истории из жизни бактериальных факторов транскрипции // Сборник трудов конференции молодых ученых «ИТиС'07». 2007. С. 303-306.

14. Фаворов А., Гельфаид М, Герасимова А., Равчеев Д., Кулаковский И., Миронов А., Макеев В. Алгоритм SeSiMCMC для поиска участков специфического связывания белков -регуляторов транскрипции // Сборник трудов конференции молодых ученых «ИТиС'07». 2007. С. 334-337.

15. Равчеев Д.А. Комплексная регуляция дыхания бактерий: исследование методами сравнительной геномики // Сборник трудов конференции молодых ученых и специалистов ИППИ РАН "Информационные технологии и системы-2008". 2008. С. 273-276.

16. Цыганова М.О, Равчеев Д.А. Регуляция дыхания бактерий: транскриптомика и сравнительная геномика // Сборник трудов конференции молодых ученых и специалистов ИППИ РАН "Информационные технологии и системы-2008". 2008, С. 332-336.

Благодарности: Автор выражает искреннюю благодарность Михаилу Сергеевичу Гельфанду за чуткое научное руководство, Андрею Александровичу Миронову и Александру Владимировичу Фаворову за любезно предоставленное программное обеспечение, Анне Викторовне Герасимовой, Ольге Цой, Марине Цыгановой и Виоланте Закирзяновой за помощь в выполнении работы и Алекскандре Борисовне Рахманиновой, Дмитрию Александровичу Родионову и Ольге Николаевне Лайковой за ценные советы и полезное обсуждение.

-ДЛЯ ЗАМЕТОК-

Равчеев Дмитрий Андреевич

ИЗУЧЕНИЕ ЭВОЛЮЦИИ РЕГУЛЯТОРНЫХ СИСТЕМ ПРОКАРИОТ МЕТОДАМИ СРАВНИТЕЛЬНО-ГЕНОМНОГО АНАЛИЗА

Работа посвящена исследованию эволюции регуляторных взаимодейтсвий в геномах гамма-протеобактерий. В качестве объектов исследования выбраны регуляция метаболизма Сахаров белком FruR, регуляция биосинтеза пуриновых нуклеотидов и утилизации рибозы гомологичными белками PurR и RbsR, соответственно, и глобальная регуляция дыхания белками Fnr, ArcA и NarP.

Показано изменение состава FruR-регулона в различных таксонах, приведены результаты, свидетельствующие об эволюции этого белка от локального регулятора оперона fruBKA до глобального регулятора биосинтеза Сахаров. Предсказана регуляция 30 новых генов, входящих в FruR-регулон.

Исследована эволюция белков PurR и RbsR, приведены данные, указывающие на их происхождение от общего предка, представлявшего собой регулятор утилизации рибозы, и дальнейшие видоизменения каждой из копий. Предсказаны 27 новых генов, входящие в пуриновый регулон.

Исследована глобальная регуляция дыхания, предсказана регуляция более 150 новых генов. Установлена корреляция между относительной ролью гена в структуре регуляторных каскадов и составом соответствующего регулона. Показано наличие консервативных ядер регулонов и таксон-специфичной периферической регуляции.

Ravcheev Dmitry Ândreevich

INVESTIGATION OF EVOLUTION OF THE PROKARYOTIC REGULATORY SYSTEMS USING COMPARATIVE GENOMICS APPROACHES

Evolution of regulatory interactions in gamma-protebacteria genomes was analyzed. The analysis was performed for several regulatory systems: FruR, the regulator of sugar metabolism flow; homologous proteins PurR and RbsR, the regulators of purine biosynthesis and ribose utilization, respectively; and global regulators of respiration, Fnr, ArcA and NarP. For FruR regulation, taxon-specific changes in regulon structure were demonstrated. The predicted evolution scenario is that FruR evolved from the repressor of a single fruBKA operon to the global regulator of the sugar metabolism. FruR regulation was predicted for 30 new regulon members.

Evolution of homologous regulators PurR and RbsR was studied in detail. These proteins evolved by duplication of a single ancestral gene. PurR regulation was predicted for 27 genes. Analysis of complex global regulation of respiration resulted in prediction of regulation for more than 150 genes. A set of taxon-specific regulatory cascades was predicted and correlations of the cascade structure and the regulon composition were demonstrated. The regulon members were classified into two groups: the conserved regulon core and taxon-specific periphery.

Заказ № 22/05/09 Подписано в печать 06.05.2009 Тираж 100 экз. Усл. п.л. 1,25

ООО "Цифровичок", тел. (495) 797-75-76; (495) 649-83-30 www.cfr.ru ; e-mail: info@cfr.ru

Содержание диссертации, кандидата биологических наук, Равчеев, Дмитрий Андреевич

Введение.

Глава 1. Обзор литературы.

1.1. Общие принципы регуляции транскрипции бактерий.

1.1.1. РНК-полимераза: структура и взаимодействие с промотором.

1.1.2. Факторы транскрипции.

1.2. Современные методы сравнительной геномики.

1.2.1. Предсказание функций генов на основе сравнения аминокислотных последовательностей.

1.2.2. Кластеризация генов на хромосоме.

1.2.3. Слияние генов.

1.2.4. Профили встречаемости генов.

1.2.5. Методы распознавания потенциальных регуляторных сайтов.

1.2.6. Сравнительная геномика и изучение регуляции.

1.3. FruR (Cra) - регулятор центрального метаболизма.

1.4. Регуляция утилизации рибозы.

1.5. PurR — регулятор биосинтеза пуриновых нуклеотидов.

1.6. Глобальная регуляция генов дыхания.

1.6.1. Общие принципы устройства дыхательных цепей бактерий.

1.6.2. Особенности регуляции дыхания Е. coli.

1.6.3. Fnr: ответ на молекулярный кислород.

1.6.4. Двукомпонентная система АгсВ-АгсА: ответ на окислительно-восстановительный статус хинонов.

1.6.5. Регуляция нитрат-нитритного дыхания: двукомпонентные системы NarX

NarL и NarQ-NarP.

Глава 2. Материалы и методы.

2.1. Общие принципы сравнительного подхода к регуляции.

2.2. Объект исследования и банки данных.

2.3. Программное обеспечение.

Глава 3. Исследование эволюции обобщенного FruR (Сга)-регулона.

3.1. Изучение эволюции регуляторной системы.

3.2. Построение распознающего правила для поиска потенциальных сайтов связывания FruR.

3.3. Структура обобщенного FruR-регулона в исследованных геномах.

3.3.1. Гены белков фосфотрансферазных систем.

3.3.2. Гены ферментов центрального метаболизма.

3.3.3. Гены белков дыхательных комплексов.

3.3.4. Гены ферментов ассимиляции азота.

3.3.5. Гены транспортных белков.

3.3.6. Гены регуляторных белков.

3.4. Эволюция FruR-регулона.

3.5. Обсуждение и выводы.

Глава 4. Исследование эволюции обобщенных PurR- и RbsR-регулонов.

4.1. Изучение эволюции регуляторных систем.

4.2. Исследование RbsR-зависимой регуляции.

4.2.1. Построение распознающего правила для поиска потенциальных сайтов связывания RbsR.

4.2.2. Структура обобщенного RbsR-реглуона.

4.3. Исследование PurR-зависимой регуляции.

4.3.1. Построение распознающего правила для поиска потенциальных сайтов связывания PurR.

4.3.2. Структура обобщенного PurR-реглуона.

4.3.2.1. Синтез пуриновых нуклеотидов.

4.3.2.2. Синтез пиримидиновых нуклеотидов.

4.3.2.3. Метаболизм азота.

4.3.2.4. Метаболизм одноуглеродных фрагментов.

4.3.2.5. Транспортные белки.

4.3.2.6. Утилизация нуклеотидов и нуклеиновых кислот.

4.3.2.7. Центральный метаболизм.

4.3.2.8. Белки с неизвестной функцией.

4.3.3. Таксон-специфические особенности PurR-регуляции.

4.4. Исследование регуляции в Pseudomonadales.

4.4.1. Ген регуляторного белка из Pseudomonadales.

4.4.2. Построение распознающего правила для поиска потенциальных сайтов

RbsR Pseudomonadales.

4.4.3. Структура обобщенного реглуона в Pseudomonadales.

4.5. Эволюция PurR- и RbsR-регулонов.

4.6. Обсуждение и выводы.

Глава 5. Эволюция глобальной регуляции дыхания.

5.1. Эволюция регуляторных систем.

5.1.1. Одно компонентная регуляторная система Fnr.

5.1.2. Двукомпонентная система АгсВ-АгсА.

5.1.3. Регуляция нитрат-нитритного дыхания: удвоенная двукомпонентная система

NarX-NarL и NarQ-NarP.

5.2. Построение распознающих правил для поиска сайтов связыания регуляторов дыхания.

5.2.1. Построение распознающего правила для поиска потенциальных сайтов связывания Fnr.

5.2.2. Построение распознающего правила для поиска потенциальных сайтов связывания АгсА.

5.2.3. Построение распознающего правила для поиска потенциальных сайтов связывания NarP.

5.3. Состав обобщенных Fnr-, АгсА- и NarP-регулонов.

5.3.1. Белки дыхательных цепей.

5.3.2. Биосинтез молибдоптеринового кофактора.

5.3.3. Центральный метаболизм и брожение.

5.3.4. Метаболизм углеводов.

5.3.5. Метаболизм жирных кислот.

5.3.6. Ответ на кислородный стресс.

5.3.7. Нуклеотидредуктазы.

5.3.8. Транспортные белки.

5.3.9. Пептидазы.

5.3.10. Регуляторы транскрипции.

5.4. Таксон-специфические особенности глобальной регуляции дыхания.

5.4.1. Состав обобщенных регулонов в различных таксонах.

5.4.2. Структура регуляторных каскадов в разных таксонах.

5.4.3. Регуляция в отдельных таксонах.

5.5. Обсуждение и выводы.

Выводы.

Введение Диссертация по биологии, на тему "Изучение эволюции регуляторных систем прокариот методами сравнительно-геномного анализа"

Бактерии известны своей способностью приспосабливаться к различным условиям и занимать самые разнообразные экологические ниши. Подобная приспособляемость достигается за счет способности достаточно быстро отвечать на изменение окружающих условий и физиологического состояния клетки, чему микроорганизмы обязаны системе регуляции экспрессии собственных генов. Подобная регуляция осуществляется сразу на многих уровнях: транскрипции, трансляции, ковалентной модификации белков и аллостерической регуляции. Если аллостерическая регуляция позволяет быстро среагировать на резко меняющиеся условия существования, то в основе более эффективного использования имеющихся ресурсов лежит регуляция экспрессии генов на уровне транскрипции. Такая регуляция осуществляется с участием как необходимых компонентов транскрипции, так и дополнительных белков, называемых факторами транскрипции. В настоящее время в молекулярной биологии и смежных областях преобладает мнение, что для жизни микроорганизмов важны не только собственно гены, содержащиеся в геноме, но и профили их регуляции. Именно регуляция позволяет эффективно использовать имеющиеся гены в зависимости от потребностей клетки. В виду столь высокой роли регуляции в жизни микроорганизмов, исследование регуляции в различных бактериях и сравнительный анализ последних позволяют сделать выводы об эволюции как отдельных функциональных систем клетки, так и организмов в целом.

Долгое время изучение регуляции транскрипции осуществлялось только лишь экспериментально. При этом исследования сосредотачивались, как правило, на транскрипции индивидуальных генов, что позволяло собрать массу необходимых сведений, но не давало полной картины регуляторных взаимодействий. Современные методы массового анализа, такие как метод микрочипов или иммунопреципитация хроматина, позволяют исследовать экспрессию сотен и даже тысяч генов, но имеют массу существенных недостатков. Во-первых, для данных методов характерен относительно высокий уровень шума, а во-вторых, благодаря им можно получить лишь косвенные подтверждения регуляции, такие как влияние мутации в гене белка регулятора на уровень экспрессии гена или связывание белка с регуляторной областью.

В последний десяток лет в руках исследователей появился новый мощный инструмент для изучения регуляции, в особенности, у бактерий - методы сравнительного анализа последовательностей геномов. Его использованию способствуют высокие темпы роста количества бактериальных геномов с известной полной последовательностью. В 1995 году впервые была опубликована полная последовательность бактериального генома — это был геном облигатного паразита, возбудителя менингита, хронического бронхита и других болезней, Haemophilus influenzae Rd KW20 [1]. С тех пор определение полной последовательности (секвенирование) геномов стало происходить нарастающими темпами, превратившись в настоящее время в широко развитую индустрию. Так, в базе данных KEGG ([2, 3]) к концу 2008-го года насчитывалось 740 последовательностей полных геномов, причем только за один 2008-й год появилось 167 новых последовательностей. При этом растет и количество геномов, относящихся к одной таксономической группе, часто даже таксонов такого низкого ранга, как вид. Так, к концу 2008-го года известны последовательности геномов 16 штаммов Escherichia coli. Понятно, что для анализа такого количества геномов недостаточно одних лишь экспериментальных методов, и необходимо использование биоинформатических подходов.

Здесь следует остановиться на взаимоотношениях биоинформатики и экспериментальной молекулярной биологии. Биоинформатика, как наука, изучающая последовательности нуклеиновых кислот и белков [4], получает от молекулярной биологии собственно последовательность, и, зачастую, ее аннотацию — описание функций определенных участков последовательности. Однако, непрерывный рост полных последовательностей геномов делает невозможной экспериментальную аннотацию всех последовательностей. Поэтому в настоящее время большинство функционально значимых участков последовательностей аннотируются именно методами биоинформатики. Этими методами можно получить информацию о таких функционально значимых участках, как гены, регуляторные сайты, белковые мотивы и других.

В настоящее время аннотация новых геномных последовательностей как правило осуществляется практически исключительно биоинформатическими методами. Большую популярность среди биологов получили такие программы, как BLAST [5] для сравнения последовательностей, CLUSTAL [6] и MUSCLE [7] для множественного выравнивания и выделения функциональных участков, Mfold [8] для предсказания вторичной структуры РНК, ТМНММ [9] для идентификации трансмембранных сегментов в белках и другие.

Что касается изучения регуляции методами биоинформатики, то основной ее задачей является выявление последовательностей, ответственных за регуляцию генов: промоторов и терминаторов транскрипции, сайтов связывания регуляторных белков, последовательностей потенциальных белков-регуляторов. В настоящее время изучение регуляции методами биоинформатики распространено крайне широко, и зачастую используется самими экспериментальными биологами, в качестве предварительного исследования или дополнения к эксперименту [10-14].

В настоящее время активно используется и изучение регуляции исключительно методами биоинформатики, без привлечения эксперимента. Наиболее достоверные результаты при этом дают методы, основанные на сравнении нескольких геномных последовательностей. Так, была успешно исследована регуляция биосинтеза аргинина [15] и ароматических аминокислот [16, 17], биосинтеза пуринов, ароматических аминокислот и фиксации азота в археях ([18]), метаболизма углеводов [19, 20] ответа на тепловой шок [21] и устойчивости к ионам тяжелых металлов [22]. В последнее время в практику вошло исследование сразу нескольких функционально близких регуляторных систем. Такой подход хорошо зарекомендовал себя в случаях анализа регуляции метаболизма оксидов азота [23] и жирных кислот [24] и гомеостаза железа и марганца [25]. Также была прослежена эволюция регуляции биосинтеза НАД в протеобактериях [26, 27], группе Bacillus/Clostridium, типе Fusobacteria и порядке Thermotogales [28] и LexA-зависимой регуляция SOS-ответа в различных группах бактерий [29-31]. Исследована регуляция азотфиксации в цианобактериях [32] и Firmicutes [33].

Целый ряд исследований посвящен РНК-регуляции. Так, методами биоинформатики изучены РНК-переключатели, регулирующие биосинтез рибофлавина [34-36]), синтез тиамина [37], синтез кобаламина [38], биосинтез метионина и метаболизм S-аденозил метионина [39] и биосинтез, транспорт и катаболизм лизина [40].

В некоторых исследованиях проведен массовый анализ регуляции методами сравнительной геномики. Например, были исследованы сразу 101 регулон для Rhodopseudomonas palustris и родственных альфа-протеобактерий [41], 188 регулонов для трех геномов Bacillus [42] и 125 регулонов для Staphylococcus aureus и других Bacillales [43].

В настоящей работе была прослежена эволюция нескольких регуляторных систем в группе гамма-протеобактерий. Таковыми являются регулятор центрального метаболизма FruR (Сга), гомологичные регуляторы биосинтеза пуриновых нуклеотидов и утилизации рибозы, соответственно PurR и RbsR, и глобальные регуляторы дыхания, Fnr, АгсА и NarP.

Заключение Диссертация по теме "Биоинформатика", Равчеев, Дмитрий Андреевич

Выводы

1. Построено распознающее правило для поиска потенциальных сайтов связывания белка фруктозного репрессора FruR и предсказано 26 новых членов обобщенного FruR-регулона.

2. Построена модель эволюции обобщенного FruR-регулона, показана эволюция от локального регулятора оперона fruBKA до глобального регулятора метаболизма Сахаров.

3. Построены распознающие правила для поиска потенциальных сайтов белков PurR, RbsR и RbsR Pseudomonadales и предсказано 25 новых генов, входящих в обобщенный регулон PurR.

4. Построена модель эволюции, в соответствии с которой PurR и RbsR являются результатом дупликации предкового белка, репрессора рибозного оперона, с последующим изменением функции PurR и структуры мотива связывания RbsR.

5. Построены распознающие правила для поиска потенциальных сайтов связывания факторов транскрипции Fnr, АгсА и NarP, разработана и применена методика анализа комплексной регуляции в родственных геномах. Предсказано 67 новых членов обобщенных регулонов.

6. Предсказаны таксон-специфичные регуляторные каскады, показаны корреляции между перестройкой структуры регуляторных каскадов и размером обобощенного регулона: регуляторы, занимающие относительно более высокое положение в каскаде, имеют большие регулоны.

7. Для глобальной регуляции дыхания показано наличие консервативных ядер регулонов и таксон-специфичной периферической регуляции.

Список работ, опубликованных по теме диссертации

Публикации в научных журналах

1. Равчеев Д.А., Гельфанд М.С., Миронов А.А., Рахманинова А.Б. Пуриновый регулон гамма-протеобактерий. Детальное описание. Генетика. 2002. 38 (9), 1203-1214.

2. Favorov A.V., Gelfand M.S., Gerasimova A.V., Ravcheev D.A., Mironov A.A., Makeev V.J. A Gibbs sampler for identification of symmetrically structured, spaced DNA motifs with improved estimation of the signal length. Bioinformatics. 2005. 21, 2240-2245.

3. Равчеев Д.А., Рахманинова А.Б., Миронов A.A., Гельфанд М.С. Регуляция нитрат-нитритного дыхания гамма-протеобактерий. исследование методами сравнительной геномики. Молекулярная биология. 2005. 39 (5), 832-846.

4. Ravcheev D.A., Gerasimova А.V., Mironov А.А., Gelfand M.S. Comparative genomic analysis of regulation of anaerobic respiration in ten genomes from three families of gamma-proteobacteria (Enterobacteriaceae, Pasteurellaceae, Vibrionaceae). BMC

Genomics. 2007. 8 (1). 54.

5. Цыганова M.O., Гельфанд M.C., Равчеев Д.А. Регуляция дыхания у энтеробактерий: сопоставление данных по экспрессии на биочипах и сравнительно-геномного анализа. Молекулярная биология, 2007, 41 (3), 556-571.

Публикации в сборниках трудов конференций

1. Ravcheev D.A., Gelfand M.S., Mironov A.A., Rakhmaninova A.B. Purine regulon of gamma-proteobacteria. Proceedings of The Third International Conference on Bioinformatics of Genome Regulation and Structure. 2002. v. 2. 38-39.

2. Равчеев Д.А., Рахманинова А.Б. NarP-зависимая регуляции нитрат-нитритного дыхания у гамма-протеобактерий. Исследование эволюции дыхательной системы методами сравнительной геномики. Сборник тезисов XIМеждународной научной конференции студентов, аспирантов и молодых ученых «Ломоносов-2004». 2004. т. 1. с. 27.

3. Gerasimova A.V., Ravcheyev D.A., Gelfand M.S., Rakhmaninova A.B. Comparative genomic analysis of respiration switch in gamma-proteobacteria. Proceedings of The Fourth International Conference on Bioinformatics of Genome Regulation and Structure. 2004. v.2. 195-198.

4. Равчеев Д.А. Исследование регуляции нитрат-нитритного дыхания гамма-протеобактерий методами сравнительной геномики. Сборник тезисовXII Международной конференции студентов, аспирантов и молодых ученых «Ломоносов». 2005. т. 2. с. 34-35.

5. Ravcheev D.A., Gerasimova A.V. How gamma-proteobacteria switch the mode of respiration: A comparative genomic analysis. Proceedings of the International Moscow Conference on Computitional Molecular Biology. 2005. p. 321-322.

6. Tsiganova М., Ravcheev D. A. Regulation of respiration in Escherichia coli: the comparison of microarray and genomics data. Proceedings of the International Moscow Conference on Computitional Molecidar Biology. 2005. p. 401-402.

7. Zakirzianova V., Ravcheev D.A. A comparative genomic analysis of an evolving of regulatory system: how FruR became Cra. Proceedings of the International Moscow Conference on Computitional Molecidar Biology. 2005. p. 423-424.

8. Равчеев Д.А. Исследование регуляции нитрат-нитритного дыхания гамма-протеобактерий методами сравнительной геномики. Материалы международной школы «Биоинформатика, геномика, протеомика». 2006, с. 48-51.

9. Закирзянова В.В., Равчеев Д.А. Исследование обобщенного FruR-регулона гамма-протеобактерий методами сравнительной геномики. Материалы XIIIмеждународной конференции студентов, аспирантов и молодых ученых "Ломоносов". 2006. т. 4, с. 45-46.

10. Цыганова М.О., Равчеев Д.А. Регуляция дыхания у энтеробактерий: сопоставление данных по анализу экспресии на биочипах и сравнительно-геномного анализа.

Материалы XIIIмеждународной конференции студентов, аспирантов и молодых ученых "Ломоносов". 2006. т. 4, с. 39-40.

11. Ravcheev D.A. Regulation of respiration in gamma-proteobacteria: evolution of multiple regulatory systems. Fourth Bertinoro Computational Biology Meeting (BCB 2006).

12. Tsoy O.V., Zakirzianova W., Ravcheev D.A. Stories about the evolution of regulators: how FruR became CRA and RbsR became PurR. Proceedings of the 3rd Moscow Conference on Computational Molecular Biology, 2007, p. 300.

13. Цой O.B., Закирзянова В., Равчеев Д.А. Как PurR стал Cra, a RbsR стал PurR: истории из жизни бактериальных факторов транскрипции. Сборник трудов 30-й конференции молодых ученых и специалистов ИППИРАН "Информационные технологии и системы ИТиС'07", 2007, с. 303-306.

14. Фаворов А., Гельфанд М., Герасимова А., Равчеев Д., Кулаковский И., Миронов А., Макеев В. Алгоритм SeSiMCMC для поиска участков специфического связывания белков — регуляторов транскрипции. Сборник трудов 30-й конференции молодых ученых и специалистов ИППИ РАН "Информационные технологии и системы ИТиС'07", 2007, с. 334-337.

15. Равчеев Д.А. Комплексная регуляция дыхания бактерий: исследование методами сравнительной геномики. Сборник трудов конференции молодых ученых и специалистов ИППИ РАН "Информационные технологии и системы-2008", 2008, с. 273-276.

16. Цыганова М., Равчеев Д. Регуляция дыхания бактерий: транскриптомика и сравнительная геномика. Сборник трудов конференции молодых ученых и специалистов ИППИ РАН "Информационные технологии и системы-2008", 2008, с. 332-336.

130

Благодарности

Автор выражает искреннюю благодарность Михаилу Сергеевичу Гельфанду за чуткое научное руководство, Андрею Александровичу Миронову и Александру Владимировичу Фаворову за любезно предоставленное программное обеспечение, Анне Викторовне Герасимовой, Ольге Цой, Марине Цыгановой и Виоланте Закирзяновой за помощь в выполнении работы и Алекскандре Борисовне Рахманиновой, Дмитрию Александровичу Родионову, Алексею Геннадиевичу Витрещаку и Ольге Николаевне Лайковой за ценные советы и полезное обсуждение.

Библиография Диссертация по биологии, кандидата биологических наук, Равчеев, Дмитрий Андреевич, Москва

1. Kanehisa M., Goto S. KEGG: kyoto encyclopedia of genes and genomes. Nucleic Acids Res. 2000, 28, 1; 27-30.

2. Kanehisa M., Goto S., Hattori M., Aoki-Kinoshita K.F., Itoh M., Kawashima S., Katayama Т., Araki M., Hirakawa M. From genomics to chemical genomics: new developments in KEGG. Nucleic Acids Res. 2006, 34; D354-357.

3. Гельфанд M.C. Апология биоинформатики. Биофизика. 2005, 50, 4; 752-766.

4. Altschul S.F., Madden T.L., Schaffer A.A., Zhang J., Zhang Z., Miller W., Lipman D.J. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Res. 1997, 25, 17; 3389-3402 .

5. Thompson J.D., Gibson T.J., Plewniak F., Jeanmougin F., Higgins D.G. The CLUSTALX windows interface: flexible strategies for multiple sequence alignment aided by quality analysis tools. Nucleic Acids Res. 1997, 25, 24; 4876-4882.

6. Edgar R.C. MUSCLE: a multiple sequence alignment method with reduced time and space complexity. BMC Bioinformatics. 2004, 5; 113.

7. Zuker M. Mfold web server for nucleic acid folding and hybridization prediction. Nucleic Acids Res. 2003, 31, 13; 3406-3415.

8. Krogh A., Larsson В., von Heijne G., Sonnhammer E.L. Predicting transmembrane protein topology with a hidden Markov model: application to complete genomes. J. Mol. Biol. 2001,305, 3; 567-580.

9. Darwin A.J., Li J., Stewart V. Analysis of nitrate regulatory protein NarL-binding sites in the fdnG and narG operon control regions of Escherichia coli K-12. Mol. Microbiol 1996, 20, 3; 621-632.

10. He В., Choi K. Y., Zalkin H. Regulation of Escherichia coli glnB, prsA, and speA by the purine repressor. J. Bacteriol. 1993,175, 11; 3598-3606.

11. He В., Shiau A., Choi K.Y., Zalkin H., Smith J.M. Genes of the Escherichia coli pur regulon are negatively controlled by a repressor-operator interaction. J. Bacteriol. 1990, 172, 8; 4555-4562.

12. Melville S.B., Gunsalus R.P. Isolation of an oxygen-sensitive FNR protein of Escherichia coli: interaction at activator and repressor sites of FNR-controlled genes. Proc. Natl. Acad. Sci. U. S. A. 1996, 93, 3; 1226-1231.

13. Makarova K.S., Mironov A. A., Gelfand M.S. Conservation of the binding site for the arginine repressor in all bacterial lineages. Genome Biol. 2001, 2, 4; RESEARCH0013.

14. Panina E.M., Vitreschak A.G., Mironov A.A., Gelfand M.S. Regulation of aromatic amino acid biosynthesis in gamma-proteobacteria. J. Mol. Microbiol. Biotechnol. 2001, 3, 4; 529543.

15. Panina E.M., Vitreschak A.G., Mironov A.A., Gelfand M.S. Regulation of biosynthesis and transport of aromatic amino acids in low-GC Gram-positive bacteria. FEMS Microbiol. Lett. 2003,222, 2; 211-220.

16. Gelfand M.S., Koonin E.V., Mironov A.A. Prediction of transcription regulatory sites in Archaea by a comparative genomic approach. Nucleic Acids Res. 2000, 28, 3; 695-705.

17. Laikova O.N., Mironov A.A., Gelfand M.S. Computational analysis of the transcriptional regulation of pentose utilization systems in the gamma subdivision of Proteobacteria.

18. FEMS Microbiol. Lett. 2001, 205, 2; 315-322.

19. Rodionov D.A., Mironov A.A., Gelfand M.S. Transcriptional regulation of pentose utilisation systems in the Bacillus/CIostridium group of bacteria. FEMS Microbiol. Lett. 2001, 205, 2; 305-314.

20. Permina E.A., Gelfand M.S. Heat shock (sigma32 and HrcA/CIRCE) regulons in beta-, gamma- and epsilon-proteobacteria . J. Mol. Microbiol. Biotechnol. 2003, 6, 3-4; 174-181.

21. Permina E.A., Kazakov A.E., Kalinina O.V., Gelfand M.S. Comparative genomics of regulation of heavy metal resistance in Eubacteria. BMC Microbiol. 2006, 6; 49.

22. Rodionov D.A., Dubchak I.L., Arkin A.P., Aim E.J., Gelfand M.S. Dissimilatory metabolism of nitrogen oxides in bacteria: comparative reconstruction of transcriptional networks. PLoS Comput. Biol. 2005,1, 5; e55.

23. Kazakov A.E., Rodionov D.A., Aim E., Arkin A.P., Dubchak I., Gelfand M.S. Comparative genomics of regulation of fatty acid and branchcd-chain amino acid utilization in proteobacteria. J. Bacteriol. 2009,191, 1; 52-64.

24. Rodionov D.A., Gelfand M.S., Todd J.D., Curson A.R., Johnston A.W. Computational reconstruction of iron- and manganese-responsive transcriptional networks in alpha-proteobacteria. PLoS Comput. Biol. 2006, 2, 12; el63.

25. Gerasimova A.V., Gelfand M.S. Evolution of the NadR regulon in Enterobacteriaceae. J.

26. Bioinform. Comput. Biol. 2005, 3, 4; 1007-1019.

27. Rodionov D.A., De Ingeniis J., Mancini C., Cimadamore F., Zhang H., Osterman A.L., RafFaelli N. Transcriptional regulation of NAD metabolism in bacteria: NrtR family of Nudix-related regulators. Nucleic Acids Res. 2008, 36, 6; 2047-2059.

28. Сычева JI.B., Пермина E.A., Гельфанд M.C. Таксон-специфичная регуляция SOS-ответа у гамма-протеобактерий. Мол. Биол. 2007, 41, 5; 908-917.

29. Mazo'n G., Erill I., Campoy S., Corte's P., Forano E., Barbe' J. Reconstruction of the evolutionary history of the LexA-binding sequence. Microbiology. 2004,150, 11; 37833795.

30. Erill I., Jara M., Salvador N., Escribano M., Campoy S., Barbe' J. Differences in LexA regulon structure among Proteobacteria through in vivo assisted comparative genomics.

31. Nucleic Acids Res. 2004, 32, 22; 6617-6626.

32. Su Z., Olman V., Mao F., Xu Y. Comparative genomics analysis of NtcA regulons in cyanobacteria: regulation of nitrogen assimilation and its coupling to photosynthesis.

33. Nucleic Acids Res. 2005, 33, 16; 5156-5171.

34. Дорощук H.A., Гельфанд M.C., Родионов Д.А. Регуляция метаболизма азота у грамположительных бактерий. Мол. Биол. 2006, 40, 5; 919-926.

35. Winkler W.C., Cohen-Chalamish S., Breaker R.R. An mRNA structure that controls gene expression by binding FMN. Proc. Natl. Acad. Sci. U. S. A. 2002, 99, 25; 15908-15913.

36. Gelfand M.S., Mironov A.A., Jomantas J., Kozlov Y.I., Perumov D.A. A conserved RNA structure element involved in the regulation of bacterial riboflavin synthesis genes.

37. Trends Genet. 1999,15, 11; 439-442.

38. Vitreschak A.G., Rodionov D.A., Mironov A.A., Gelfand M.S. Regulation of riboflavin biosynthesis and transport genes in bacteria by transcriptional and translational attenuation. Nucleic Acids Res. 2002, 30, 14; 3141-3151.

39. Rodionov D.A., Vitreschak A.G., Mironov A.A., Gelfand M.S. Comparative genomics of thiamin biosynthesis in procaryotes. New genes and regulatory mechanisms. J. Biol. Chem. 2002, 277, 50; 48949-48959.

40. Vitreschak A.G., Rodionov D.A., Mironov A.A., Gelfand M.S. Regulation of the vitamin B12 metabolism and transport in bacteria by a conserved RNA structural element. RNA. 2003, 9, 9; 1084-1097.

41. Rodionov D.A., Vitreschak A.G., Mironov A.A., Gelfand M.S. Comparative genomics of the methionine metabolism in Gram-positive bacteria: a variety of regulatory system.

42. Nucleic Acids Res. 2004, 32, 11; 3340-3353.

43. Rodionov D.A., Vitreschak A.G., Mironov A. A., Gelfand M.S. Regulation of lysine biosynthesis and transport genes in bacteria: yet another RNA riboswitch? Nucleic Acids Res. 2003,31, 23; 6748-6757.

44. Conlan S., Lawrence C., McCue L.A. Rhodopseudomonas palustris regulons detected by cross-species analysis of alphaproteobacterial genomes. Appl. Environ. Microbiol. 2005, 71, 11; 7442-7452.

45. Terai G., Takagi Т., Nakai K. Prediction of co-regulated genes in Bacillus subtilis on the basis of upstream elements conserved across three closely related species. Genome Biol. 2001,2, 11; RESEARCH0048.

46. Alkema W.B., Lenhard В., Wasserman W.W. Regulog analysis: detection of conserved regulatory networks across bacteria: application to Staphylococcus aureus. Genome Res. 2004,14, 7; 1362-1373.

47. Korzheva N., Mustaev A., Kozlov M., Malhotra A., Nikiforov V., Goldfarb A., Darst S.A. A structural model of transcription elongation. Science. 2000, 289, 5479; 619-625.

48. Gourse R.L., Ross W., Gaal T. UPs and downs in bacterial transcription initiation: the role of the alpha subunit of RNA polymerase in promoter recognition. Mol. Microbiol. 2000, 37, 4; 687-695.

49. Hampsey M. RNA polymerase comes into focus. Trends Genet. 2000,16, 1; 20.

50. Browning D.F., Busby S.J. The regulation of bacterial transcription initiation. Nat. Rev. Microbial. 2004, 2, 1; 57-65.

51. Ishihama A. Functional modulation of Escherichia coli RNA polymerase. Annu. Rev. Microbiol. 2000, 54; 499-518.

52. Ross W., Ernst A., Gourse R.L. Fine structure of E. coli RNA polymerase-promoter interactions: alpha subunit binding to the UP element minor groove. Genes Dev. 2001, 15, 5; 491-506.

53. Perez-Rueda E., Collado-Vides J. The repertoire of DNA-binding transcriptional regulators in Escherichia coli K-12. Nucleic Acids Res. 2000, 28, 8; 1838-1847.

54. Babu M., Teichmann S.A. Evolution of transcription factors and the gene regulatory network in Escherichia coli. Nucleic Acids Res. 2003, 31, 4; 1234-1244.

55. Martinez-Antonio A., Collado-Vides J. Identifying global regulators in transcriptional regulatory networks in bacteria. Curr. Opin. Microbiol. 2003, 6, 5; 482-489.

56. Stover C.K., Pham X.Q., Erwin A.L., Mizoguchi S.D., Warrener P., Hickey M.J., Brinkman

57. Moreno-Campuzano S., Janga S.C., Pe'rez-Rueda E. Identification and analysis of DNA-binding transcription factors in Bacillus subtilis and other Firmicutes~a genomic approach. BMC Genomics. 2006, 7; 147.

58. Dobrindt U., Hacker J. Whole genome plasticity in pathogenic bacteria. Curr. Opin. Microbiol. 2001, 4, 5; 550-557.

59. Lewis M. The lac repressor. C. R. Biol. 2005, 328, 6; 521-548.

60. Hulett F.M., Lee J., Shi L., Sun G., Chesnut R., Sharkova E., Duggan M.F., Kapp N. Sequential action of two-component genetic switches regulates the PHO regulon in Bacillus subtilis. J. Bacteriol. 1994,176, 5; 1348-1358.

61. Anthamatten D., Scherb В., Hennecke H. Characterization of a/Ix£Jr-regulated Bradyrliizobium japonicum gene sharing similarity with the Escherichia coli fnr and Rhizobium melilotifixK genes. J. Bacteriol. 1992,174, 7; 2111-2120.

62. Kolb A., Busby S., Buc H., Garges S., Adhya S. Transcriptional regulation by cAMP and its receptor protein. Annual Review of Biochemistry. 1993, 62; 749-795.

63. Kumar A., Grimes В., Fujita N., Makino K., Malloch R.A., Hayward R.S., Ishihama A. Role of the sigma 70 subunit of Escherichia coli RNA polymerase in transcription activation.

64. J. Mol. Biol. 1994, 235, 2; 405-413.

65. Chen P.R., He C. Selective recognition of metal ions by metalloregulatory proteins. Curr. Opin. Chem. Biol. 2008,12, 2; 214-221.

66. Weickert M.J., Adhya S. The galactose regulon of Escherichia coli. Mol. Microbiol. 1993, 10, 2; 245-251.

67. Shin M., Kang S., Hyun S.J., Fujita N., Ishihama A., Valentin-Hansen P., Choy H.E. Repression of deoP2 in Escherichia coli by CytR: conversion of a transcription activatorinto a repressor. EMBO J. 2001, 20, 19; 5392-5399.

68. Rodionov D.A., Mironov A. A., Gelfand M.S. Conservation of the biotin regulon and the BirA regulatory signal in Eubacteria and Archaea. Genome Res. 2002,12, 10; 1507-1516.

69. Panina E.M., Mironov A. A., Gelfand M.S. Comparative genomics of bacterial zinc regulons: enhanced ion transport, pathogenesis, and rearrangement of ribosomal proteins. Proc. Natl. Acad. Sci. U. S. A. 2003,100, 17; 9912-9917.

70. Садовская H.C., Лайкова O.H., Миронов A.A., Гельфанд М.С. Изучение регуляции метаболизма длинноцепочечных жирных кислот с использованием компьютерного анализа полных бактериальных геномов. Мол. Биол. 2001, 35, 6; 1010-1014.

71. Campbell J.W., Cronan J.E. Jr. The enigmatic Escherichia colifadE gene is yafH. J.

72. Bacteriol. 2002,184, 13; 3759-3764.

73. Rodionov D.A., Hebbeln P., Gelfand M.S., Eitinger T. Comparative and functional genomic analysis of prokaryotic nickel and cobalt uptake transporters: evidence for a novel group of ATP-binding cassette transporters. J. Bacteriol. 2006,188, 1; 317-327.

74. Rutherford K., Parkhill J., Crook J., Horsnell Т., Rice P., Rajandream M.A., Barrell B. Artemis: sequence visualization and annotation. Bioinformatics. 2000,16, 10; 944-945.

75. Fitch W.M. Distinguishing homologous from analogous proteins. Syst. Zool. 1970,19, 2; 99-113.

76. Benson D.A., Boguski M.S., Lipman D.J., Ostell J., Ouellette B.F., Rapp B.A., Wheeler D.L. GenBank. Nucleic Acids Res. 1999,27, 1; 12-17.

77. Emmert D.B., Stoehr P.J., Stoesser G., Cameron G.N. The European Bioinformatics Institute (EBI) databases. Nucleic Acids Res. 1994, 22, 17; 3445-3449.

78. Boeckmann В., Blatter M.-C., Famiglietti L., Hinz U., Lane L., Roechert В., Bairoch A. Protein variety and functional diversity: Swiss-Prot annotation in its biological context. C. R. Biol. 2005, 328, 10-11; 882-899.

79. Gasteiger E., Jung E., Bairoch A. SWISS-PROT: connecting biomolecular knowledge via a protein database. Curr. Issues Mol. Biol. 2001, 3, 3; 47-55.

80. Koonin E.V., Galperin M. Y. Prokaryotic genomes: the emerging paradigm of genome80