Бесплатный автореферат и диссертация по биологии на тему
Анализ регуляции транскрипции генов дыхания в гамма-протеобактериях методами сравнительной геномики
ВАК РФ 03.00.03, Молекулярная биология

Автореферат диссертации по теме "Анализ регуляции транскрипции генов дыхания в гамма-протеобактериях методами сравнительной геномики"

На правах рукописи

Герасимова Анна Викторовна

Анализ регуляции транскрипции генов дыхания в гамма-протеобактериях методами сравнительной геномики

03.00.03 Молекулярная биология

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата биологических наук

Москва - 2006

Работа выполнена в лаборатории биоинформатики Государственного научно-исследовательского института генетики и селекции промышленных микроорганизмов.

Научный руководитель:

кандидат физико-математических наук, доктор биологических наук Михаил Сергеевич Гельфанд

Официальные оппоненты:

доктор биологических наук, профессор В. П. Вейко кандидат физико-математических наук В. Е. Раменский Ведущая организация:

Институт физико-химической биологии им. А.Н. Белозерского, МГУ.

Защита состоится 25 апреля 2006 года в 14 часов на заседании Диссертационного совета Д217.013.01 при Государственном научно-исследовательском институте генетики и селекции промышленных микроорганизмов по адресу 117545, Москва, 1-ый Дорожный проезд, д. 1.

С диссертацией можно ознакомиться в библиотеке ГосНИИГенетика

Автореферат разослан « » марта 2006 г.

Ученый секретарь Диссертационного совета,

кандидат биологических наук

В.И. Щербакова

W6A-

Общая характеристика работы Актуальность темы

Изучение транскрипционной регуляции генов, кодирующих дыхательные белки важно для понимания процессов, происходящих в бактериальной клетке, при изменении среды её обитания. Например, большинство кишечных патогенов являются факультативными анаэробами, то есть, вне носителя они обитают в среде, богатой кислородом, а, попадая в организм человека, или животного, они оказываются в анаэробных условиях.

В процессе биологической очистки загрязненных почв, например, при помощи Shewanella spp. (Martin-Gil, 2004) анализ регуляции дыхания является одним из главных направлений изучения соответствующих штаммов.

В ответе на изменение концентрации кислорода участвуют несколько сотен генов, образующих сложные регуляторные каскады. Сами дыхательные регулоны эволюционно подвижны, и анализ бактериального дыхания даже в близкородственных геномах представляет собой объемную и сложную задачу.

Одним из современных подходов к решению этой задачи является биоинформатический, который использует тот факт, что с каждым годом секвенируется всё больше бактериальных геномов. На данный момент известны нуклеотидные последовательности для 350 полных бактериальных геномов и 570 незаконченных. Такое количество геномов позволяет проводить сравнительный анализ как на далеких, так и на близких эволюционных расстрояниях, находить таксоноспецифичные особенности регулона и оценивать консервативность ядра регулона внутри семейства или вида.

В настоящей работе новые методы сравнительной геномики и большое число геномных последовательностей прокариот были использованы для анализа регуляции транскрипции генов дыхания в гамма-протеобактериях.

Цель и задачи исследования

Целью настоящей работы является применение современных методов сравнительной геномики к исследованию регуляции дыхания в гамма-протеобактериях. В работе решаются следующие задачи:

• Построение распознающего правила для участков связывания изучаемых белков-регуляторов.

• Поиск в бактериальных геномах новых генов, зависящих от переключения аэробного/анаэробного метаболизма.

• Анализ таксон-специфичной регуляции различными дыхательными регуляторами. ---------

i национал) i тяг библиотека i

! ^zm'

• Совместный анализ различных регулонов, участвующих в одном процессе -дыхании.

Научная новизна и практическое значение

В работе впервые получены следующие результаты:

• Впервые полностью проанализирована транскрипционная регуляция дыхания в геномах трех различных семейств Enterobacteriaceae, Pasteurellaceae и Vibrionaceae.

• Построены матрицы для поиска потенциальных сигналов для регуляторов дыхания FNR, АгсА, нитрат-нитритного переключателя NarP, регулятора транспорта молибдата ModE и регулятора биосинтеза НАД - NadR.

• Разработан и применен способ анализа обобщенного регулона в группе близкородственных малоизученных геномов, основанный на полном попарном сравнении регулонов.

• С помощью подробного анализа найдены несколько десятков новых индивидуальных членов регулонов, а также найдены члены обощенных регулонов, такие как опероны atp, torYZ, nqr и ген Ы674.

• Показана авторегуляция генов агсА и nadR в нескольких рассмотренных геномах.

Апробация работы

Материалы исследований по теме диссертации докладывались на межлабораторных семинарах ГосНИИГенетика (2001-2006); на международных конференциях "Artifical Intelligence and Heuristic Methods for Bioinformatics" (Сан-Миниато, Италия, 2001); BGRS'2002 (Conference on Bioinformatics of Genome Regulation and Structure), BGRS'2004, Новосибирск, Россия, MCCMB'03 (Moscow Conference on Computational and Molecular Biology), MCCMB'05, Москва, Россия, ISMB'04, (Intellectual Systems for Molecular Biology) Глазго, Великобритания. Апробация диссертации состоялась на заседании секции Ученого совета по молекулярной биологии Государственного научно-исследовательского института генетики и селекции промышленных микроорганизмов 10 марта 2006 года.

Объем и структура диссертации

Диссертационная работа изложена на 116 странице машинописного текста и состоит из трех глав - введение, обзор литературы, результаты и обсуждение -и выводов. Глава с результатами состоит из трех частей, каждая из которых начинается с краткого резюме и содержит описание выполненных автором исследований, изложение полученных результатов и их обсуждение.

Первая часть посвящена построению распознающих правил для поиска потенциальных сигналов связывания изучаемых регуляторных факторов.

Вторая часть посвящена разработке и применению методов анализа таксоноспецифичной регуляции в геномах бактерий.

Третья часть посвящена детальному анализу дыхательных регулонов в геномах гамма-протеобактерий.

Список литературы, приведенный в конце диссертации, содержит 203 наименования. Работа содержит 31 рисунк и 8 таблиц.

Содержание работы

Часть 1. Построение распознающих правил для поиска потенциальных сайтов связывания регуляторов дыхания

Для анализа и поиска новых членов регулонов необходимо создать распознающие правила, или матрицы для поиска сигнала. Если цель работы -изучить регуляцию на больших эволюционных расстояниях, то для каждой группы (семейства или вида) геномов, создаются собственные матрицы для поиска сигнала. В настоящей работе изучалась регуляция в близкородственных организмах, поэтому создание индивидуальных матриц было нецелесообразно.

Для построения матрицы поиска потенциальных сайтов связывания FNR были взяты 5'-некодирующие области перед теми генами из генома Е. coli, для которых FNR рефляция была показана экспериментально. В качестве таких генов использовалась выборка, доступная в банке данных DPInteract (http://arep.med.harvard.edu/dpinteract/). Матрица графически представлена на рисунке 1.

itgat л .тс&а

« n «t in (D S СО С> О ^ «М СО

Рисунок 1. Диаграмма ЛОГО для сайтов связывания FNR.

Матрицей позиционных весов, которая и использовалась в данной работе для поиска потенциальных сайтов, называлась матрица, построенная на основе выборки операторных участков, каждый из которых, в общем случае, имеет длину L. Вес w(a,i) нуклеотида "а" в позиции "Г рассчитывался по формуле:

w(a,i) = log [N(a,i) + 0.5 ] - 0.25 S^AC G T log [ N(b,i) + 0.5 ], где N(a,i) - количество нуклеотидов "а" из нашей выборки, которые находятся в позиции "/". Таким образом, используя данную матрицу, любому участку

нуклеотидной последовательности длинн Ь можно поставить в соответствие вес

где а, - нуклеотид в позиции г. Далее можно ввести некоторое пороговое значение 5Р, при котором, если вес 5 больше или равен этому значению, то данная последовательность является потенциальным операторным участком, а в противном случае - нет. Используя такой подход, можно проанализировать области, находящиеся непосредственно перед началами генов для всего генома, и определить потенциальные сайты связывания белков-регуляторов (Миронов, 1999).

Полученные правила для поиска сайтов связывания также могут быть продемонстрированы наглядно при помощи диаграмм Лого. В Лого высота каждой буквы показывает степень её консервативности, а общая высота каждой колонки - статистическую значимость данной позиции.

Чтобы построить матрицу для поиска потенциальных сайтов связывания АгсА, была использована программа 8е81МСМС, в качестве обучающей выборки были взяты 5'-некодирующие области перед следующими генами и оперонами: цитохром Ь убихинол оксидоредуктаза (сус/ЛВ), транспортер формиата (/осА), изоцитрат дегидрогеназа (¡сс/А), альдегид дегидрогеназа (аЫА), Ь-лактат пермеаза (1ШР), цитрат синтаза (^кА), сукцинат дегидрогеназа (.чМСП), супероксид дисмутаза (яос1А), липоамид дегидрогеназа (!рс1А) и регулятор распада малых молекул (¿1сСВ). Полученный сигнал показан на рисунке 2.

тмсль^мс

" 1- N П « Ю (О N СО О) О г N СО ^ Ю

Т~ I- г- т— т- ч—

=о о

Рисунок 2. Лого для поиска АгсА сигнала.

На рисунке 2 отчетливо видно, что сайт связывания белка АгсА представляет собой пятнадцатинуклеотидный неполный прямой повтор. Такая структура сайта подтверждает предположение, о том, что характерной нуклеотидной последовательностью, узнаваемой белками-регуляторами подсемейства Отр1?/РЬоВ, является тандемный повтор. ЛОГО для остальных изученных в данной работе сигналов приведены в тексте диссертации.

Часть 2. Разработка и применение нового метода сравнительно-геномикного анализа регуляции

2.1. Анализ таксоноспецифичной регуляции

С каждым годом количество полностью секвенированных геномов растет, только в группе Enterobacteriaceae, с учетом различных штаммов, их доступно более двадцати. Такое многообразие позволило нам разработать и применить метод полного попарного сравнения геномов.

Известно, что самый хорошо изученный на сегодняшний день организм -это энтеробактерия Escherichia coli. Именно его обычно и использовали в качестве образца для сравнения с остальными, малоизученными бактериями. Но нельзя не считаться с тем фактом, что далеко не все гены, присутствующие, например в Yersinia pestis, имеют ортологов в геноме Е. coli.

В предыдущих компьютерных исследованиях транскрипционной регуляции использовали следующую процедуру: строили распознающие правило (матрицу для поиска сигнала), при помощи этой матрицы проводили поиск потенциально регулируемых генов в геноме Е. coli, а затем проверяли сохранение сигнала перед ортологичными генами в близкородственных геномах. Эта процедура позволяла с большой долей вероятности предсказывать регуляцию генов, имеющих ортологов в Е. coli, однако найти новых членов регулона, свойственных другим бактериям, было невозможно.

Поэтому мы разработали новый подход для анализа таксон-специфичной регуляции. Мы провели полное попарное сравнение геномов организмов, относящихся к одной таксономической группе: в каждом из геномов проводился поиск потенциальных сайтов одного белка-регулятора. Далее на основании сохранения сайтов перед ортологичными генами определялись потенциальные члены обобщенного регулона. Если сайт перед геном сохранялся минимум в трех геномах организмов из одной группы, то ген считался членом обобщенного регулона. Для таких генов также проверялось наличие сайтов перед его ортологами в геномах организмов из других групп.

2.2. Применение метода таксоноспецифичного анализа для изучения эволюции регулона NadR в семействе Enterobacteriaceae

Убедившись в сохранении всех доменов белка NadR в геномах Е. coli К-12 MG1655 (ЕС), Shigella flexneri 2457Т (SF), Salmonella typhi CT18 (ST), Y. pestis C092 (YP), Yersinia enterocolitica 8081 (YE), Photorhabdus luminescens subsp. laumondii TT01 (PHL), Erwinia carotovora subsp. atroseptica SCRI1043 (ERW), Klebsiella pneumoniae MGH78578 (KP) и Serratia marcescens Dbl 1 (SM), мы применили процедуру попарного сравнения геномов и изучили эволюцию регулона NadR в Enterobacteriaceae.

Мы считали, что ген может быть потенциальным членом регулона Ыас1К., если сайт сохраняется как минимум перед четырьмя ортологичными генами из рассмотренных геномов. Результаты приведены в таблице 1.

пасШ nadA рпсВ пабК упЯЛМ грэР

геном имя гена имя гена имя гена имя гена имя гена имя гена

ЕС паЛВ пас1А рпсВ паая упГЬ/М гряР

вР вне рамки aadA росВ упПУМ ГрвР

8Т 8Т¥2834 вТУ0797 ЭТУ1010 паая 8ТУ1578/79 8ТУ2863

Ю> паёВ nadA рпсВ шк1Я упПТМ вне рамки

ЫШ пасШ ЕСА1378 рпсВ ЕСА0463 ЕСА2259/60 ЕСЛ3359

БМ гыв па(1А рпсВ ■ниШ упОУМ вне рамкн

вне рамкн

УР па<1В падА рпсВ па(1К /УР02266 грвР

УЕ КУЕ01420 КУЕ03344 ЯУЬ02025 11УЕ00967 КУЕ00573/74 ИУЕ01243

РНЬ пайВ р1и1468 рспВ пасЖ р!и2225/24 гряР

Таблица 1. Гены потенциального регулона Иас1Я. Поиск проводился в интервалах от (-300) пар нуклеотидов до (+10) пар нуклеотидов от старта трансляции. Пороговое значение веса сайта 4.6. Жирным шрифтом показаны гены с сайтом выше порогового. Фраза "Вне рамки" означает, что нам удалось найти ортологичный ген только по нуклеотидной последовательности.

Видно, что кроме уже известных членов ЫасЖ регулона, появились новые кандидаты. Был проведен детальный анализ этих кандидатов с применением метода филогенетического футпринтинга всех 5'-некодирующих областей генов из таблицы 1. В основе метода филогенетического футпринтинга лежит поиск консервативных последовательностей перед ортологичными генами из родственных геномов с помощью выравнивания (МсСие, 2001).

Как было отмечено в таблице 1, правилу сохранения сайта как минимум в четырех из рассмотренных девяти геномов, удовлетворяет также и ген пас1Я, кодирующий белок-регулятор №<Ж. Потенциальный сайт связывания N8(111 был найден в Е. сат^ога, 51 тагсеясепз, К рехйя и К еп!егосо1Шса. Выравнивание 5'-некодирующих областей пасИ* приведено на рисунке 3.

ТОТТГА ТАААСА

УЕI I II I I ' I' I и | I гаяпркяк«мцм!

ур| -ТТТААТАСТСССААТССССС—АССАТАСТ5Т0ТТАТТТТ зм| ТТТТАТТААТСТСССТОАСССССАССААСАТАТО-СТАТТТ ЕРЯ 1 - -САСТ АОСССАССТТСССТ----ТАТСТТЗТС-СТАТТТ

УЕ I СбАвОССС---ТАТ<ЗСТ6САСТТССАСТАТСТСААААСАСГСАТТААССААААА0ССТ

УР | ССАВАССО---САТСКЛЧЗСАЗТТССАСТАТСТСААААСОвСААТТААССАААААОССТ

гм I Авс-газс----САТвССбСААТТТСАТТЛССТОААе АССГССАТСААССААААСвЭТТ

ЕКЯI ОАгТОТТеСАССАТвТСАТСАТТТСАТТАССТСААЛТССССТАТССОССАСААСССТТ

Рисунок 3. Сохранение сайта связывания в 5'-некодирующей области гена па<Ж. Сайт отмечен серым, жирным шрифтом выделены позиции, совпадающие с консенсусом и стартовый кодон АТС.

На рисунке 3 видно, что область потенциального связывания NadR весьма консервативна по сравнению со всем остальным межгенным промежутком.

Выравниваниях 5'-некодирующей областей генов nadA, nadB и рпсВ также продемонстрировали высокую консервативность сайта связывания NadR, тогда как анализ 5'-некодирующих областей генов ynjL, ynJM и rpsP показал большую степень сохранения всего некодирующего участка, а не только потенциальных сайтов и эти гены не были отнесены к потенциальному регулону.

Подобный анализ показал, что даже очень простой регулон, отвечающий за необходимый метаболический путь, может заметно различаться в весьма близкородственных организмах. Варьировать может не только набор регулируемых генов, но даже авторегуляция. Впервые предсказанная в этой работе авторегуляция nadR является особенностью нескольких, но далеко не всех организмов из семейства энтеробактерий.

Одним из возможных объяснений этого факта может быть предположение, что регулон NadR относительно молод, поскольку он присутствует только в одном семействе (Enterobacteriaceae) из всех гамма-протеобактерий.

Часть 3. Анализ дыхательных регулонов в геномах гамма-протеобактерий

3.1. Анализ регулона FNR

С использованием матрицы для поиска FNR сигнала, описанной выше, был проведен поиск потенциальных FNR-сайтов, расположенных перед другими генами Е, coli. Получилось, что при пороге 4.0 потенциальные FNR-сайты обнаруживаются перед 121 геном, в то время как, при построении весовой матрицы использовались сайты для 9 из 121 отобранных генов (полученные из базы данных регуляторных сайтов DPInteract). Используя стандартную процедуру сравнения близкородственных геномов, мы обнаружили, что геномы всех рассмотренных бактерий, (S typhi, К. pneumoniae, Y pestis, Н influenzae, V cholerae и P. aeruginosa) содержат гены, ортологичные fnr, что указывает на консервативность FNR-регулона у этих гамма-протеобактерий.

Ортологи 121 гена Е coli, перед которыми найдены потенциальные FNR-боксы, идентифицированы и в других геномах. Построенную весовую матрицу применили для анализа 5'-областей ортологичных генов. В работе получены 39 генов, 5'-области которых содержат потенциальные FNR-сайты в геномах как минимум трех разных бактерий, одна из которых - Е. coli. Эти гены были разделены на три группы. В первую группу вошли 9 генов, сайты которых использовали для построения распознающей матрицы. Вторая группа состоит из 12 генов, регуляция которых белком FNR показана экспериментально, но сами FNR-сайты не выявлены. В третью группу вошли 18 генов, 5'-области которых содержат потенциальные FNR-боксы как минимум в двух геномах, кроме Е. coli, при том, что FNR-регуляция этих генов не изучена.

Хорошо известно, что белок FNR гомологичен регулятору CRP и что сигналы связывания этих двух регуляторов похожи. Поэтому нельзя было исключить, что часть из предсказанных сайтов на самом деле являются сайтами связывания CRP. С использованием весовой матрицы для поиска CRP-сайтов (Gelfand, 2000) были получены веса потенциальных сайтов связывания CRP для отобранных генов из FNR-регулона. Видно, что многие известные гены из FNR-регулона (первая и вторая группы таблицы 2.2 из текста диссертации) имеют потенциальный CRP-сайт. Кроме того из литературы известно, что гены ansB и tdcA находятся под двойной регуляцией CRP и FNR (Green, 1996), (Chattopadhyay, 1997). Наконец, CRP регулирует ген mil А, входящий в третью группу (Ramseier, 1995). Нам удалось обнаружить перед этим геном несколько потенциальных сайтов связывания CRP, и их вес выше, чем вес потенциального FNR-сайта. Гипотетический ген Ъ2503 мы отнесли к генам, регулируемым FNR, так как выравнивание 5'-областей ортологичных ему генов выявило консервативность именно области потенциального FNR-сайта.

К потенциальному FNR-регулону относится, по-видимому, и ген aid А. Этот ген не имеет ортологов в рассматриваемых нами геномах, и поэтому на основании формального критерия не может быть отнесен к регулону. Однако в геноме Е. coli перед ним находится потенциальный FNR-сайт, и известно (Pellicer, 1999), что этот ген регулируется АгсА и CRP (сайт связывания CRP не совпадает с найденным нами FNR-сайтом), то есть принадлежит к известным регулонам центрального метаболизма. Всё это даёт возмодность предсказывать потенциальную FNR-регуляцию гена aid А.

Таким образом, были идентифицированы сайты связывания FNR в 5'-областях 12 генов Е coli, регулируемых FNR, и найдены еще 17 генов, которые предположительно принадлежат к FNR-регулону. Описаны FNR-регулоны S typhi, К pneumoniae, Y. pestis, H. influenzae, V cholerae и P. aeruginosa.

3.2. Анализ регул она АгсА

Поиск по обеим цепям генома E.coli потенциальных сайтов связывания (сайтов) АгсА, соответствующих матрице, описанной в части 1, при пороге 4.25 обнаружил потенциальные сайты связывания АгсА в 5'-областях 257 генов.

С помощью стандартной процедуры поиска ортологичных генов в геномах гамма-протеобактерий, родственных E.coli (Y. pestis, P. multocida и V. vulnificus), были выявлены гены, ортологичные гену белка-регулятора АгсА. Это позволило предположить наличие регулона АгсА в этих бактериях и с помощью методов сравнительной геномики существенно сузить результаты поиска в Е coli. Для этого с помощью комплекса программ "Genome Explorer" были проанализированы полные геномы четырех родственных гамма-протеобактерий Е coli, Y pestis, P. multocida и V. vulnificus. Для каждого из отобранных ранее 257 генов из E.coli с потенциальными сайтами связывания АгсА, искали ортологи в остальных геномах. В случае, если хотя бы два гена-

ортолога из трех рассмотренных геномов содержали в своей 5'-некодирующей области потенциальный сайт Arc А с весом выше порогового (4.00), ген считался имеющим консервативный сайт АгсА.

Мы обнаружили в геноме E.coli 23 гена с консервативным сайтом АгсА (таблица приведена в тексте диссертации). Из них 14 упомянуты в литературе как регулируемые кислородно-зависимыми механизмами. Следовательно, описанная процедура как минимум позволяет распознавать гены, регулируемые одним (или несколькими) из кислородно-зависимых регуляторов.

Обучающая выборка состояла из ArcA-регулируемых генов. Известные сайты узнавания других кислородных регуляторов отличаются от использованного нами мотива АгсА, который был эволюционно консервативен, и, следовательно, биологически функционален в проанализированных геномах. Интересно, что одним из найденных 23 генов оказался ген самого белка АгсА. Это позволяет предполагать наличие обратной связи в механизме его регуляции (автоторегуляции).

3.3. Анализ регулона NarP

В общей сложности было рассмотрено 13 геномов различных организмов, относящихся к группе гамма-протеобактерий: Е. coli К12 (ЕС), S. typhi Ту2 (ST), Erwinia carotovora subsp. atroseptica (EO), Y. pestis KIM (YP) Haemophilus ducreyi 35000HP (HD), Haemophilus influenzae Rd (HI), P. multocida Pm70 (PM), V cholerae 01 (VC), Vibrio parahaemolyticus RIMD 2210633 (VP), V vulnificus CMCP6 (VV), Y. enterocolitica (YE), Actinobacillus actinomycetemcomitans HK1651 (AA) и Vibriofischeri ESI 14 (VF).

В исследуемых геномах проводился поиск сайтов с весом выше порогового значения 3,50. Однако в геноме A. actinomycetemcomitans перед генами-потенциальными членами регулона зачастую удавалось обнаружить лишь сайты с весом ниже принятого порогового значения. Поэтому для данного генома было установлено пороговое значение 3,25 При данных пороговых значениях потенциальные сайты связывания NarP обнаруживались в каждом геноме перед приблизительно 400 генами. Ясно, что отдельные предсказания таких сайтов недостоверны.

Применив метод таксон-специфичного анализа регуляции, описанный выше, и проанализировав NarP-регуляцию внутри трёх групп, в общей сложности к обобщенному регулону было отнесено 77 генов, организованных как минимум в 29 оперонов. В исследованных геномах обобщенный NarP-регулон включает в себя почти все гены, входящие в объединенный NarL-NarP-регулон в Е. coli.

3.4. Анализ регулона ModE

В семействе Enterobacteriaceae был проведен детальный анализ ModE регулона. С помощью матрицы для поиска ModE сигнала, описанной выше, в областях [-400; 0] нуклеотидов от старта трансляции при пороге 4.4 был

проведен поиск потенциальных сайтов в геномах Е coli К-12 MG1655, S. typhi СТ18, Y pestis С092, Y enterocolitica 8081, Р. luminescens subsp. laumondii TT01 (PHL), E. carotovora subsp. atroseptica SCRI1043 (ERW), К pneumoniae MGH78578 (KP) и S marcescens Dbl 1 (SM)._________________

^ ämsA В С

£C, ST, KP -1—с г-1

dmsA в с

ур---Н -d -СГ

•J1 ЫВ87 ц tut

ЕС, ST, KP, ERW, SM yfiAK ^ яюаА в С о e —L-cr'ct-c.-l ' EC, ST ■ oarP Щ mpe D A s Иве --1-Г, 1— -C_ 1— CT iT,

YP, YE, PhL ДОК «- moaA СОЕ ^ ~ Em narP napF 0 A G H в С

ЕС, ST гае* в J—C. I. " №. УЕ narP 4» * mf о а а в с —'—l ^

EC,ST 1 r* er rarP

' тМ в

KP, YP, YE, ERW. SM, PhL--<—' "4 PhL

EC, ST, KP, YP, YE, ERW, SM ^m—

^ №CK biez

C, YE чг;

TtorC btsZ

—1 ' -r •

madE

PhL 4m -

Рисунок 4. Известные ModE-регулируемые опероны. Обозначения. Черным прямоугольником обозначен ModE сигнал, белыми стрелками — опероны, черными стрелками - дивергентные гены.

На рисунке 4 схематически изображены опероны, для которых в геноме Е. coli была показана регуляция ModE. Здесь же можно видеть, что произошло с опероном, дивергоном и сайтами в близкородственных организмах.

На рисунке 5 приведены новые потенциальные члены регулона ModE, которых нам удалось идентифицировать. Это гены STY3313 и STY3312, входящие в один оперон из S. typhi и их ортологи в геномах Erwinia carotovora, Klebsiella pneumoniae и Serratia marcescens Эти гены кодируют потенциальный транспортер молибдена. Регуляция потребителей - частое свойство кофакторных регулонов, поэтому обнаружение сохраняющегося сайта связывания ModE перед этим опероном делает регуляцию весьма вероятной.

Кроме того, консервативный сайт был найден перед геном оксидоредуктазы, содержащей молибдоптеприн (STY0659) и опероном, кодирующим анаэробную сульфит редукатзу asrABC из генома 5". typhi.

¥ smзгз STY3312 от Т STYOe№ FNR tteP ST Т ч-> - ST--С—

TW * Ы674

1 J er;

STY3313 STY3312

TECA3096 ECA3095 ECA3094 ECA3093

ST Т'ГАВ__С

Рисунок 5. Новые ModE-peryлиpyeмыe опероны. Черным прямоугольником обозначен Мо<1Е сигнал, белыми стрелками - опероны.

Ген Ь1674 кодирует уникальную оксидоредуктазу, присутствующую только в геноме Escherichia coli, потому стандартные методы сравнительной геномики не позволили бы нам определить этот ген, как участник какого либо регулона. Но в этом случае мы обнаружили в 5'-области оксидоредуктазы (Ы674) потенциальные сайты связывания не только регулятора ModE, но также NarP и FNR. Как известно, многие участники ModE-регулона входят также и в FNR-регулон, так что ген Ы674 был отнесен нами к этим дыхательным регуонам. Следует отметить, что наше предположение было впоследствие подтверждено экспериментально, и сайт ModE перед Ы674 оказался функциональным (Rob Gunsalus, Университет Калифорнии, Лос-Анжелес, частное сообщение).

3.5. Комплексный анализ дыхательных регулонов

Изучение дыхательной регуляции предоставило возможность для комплексного анализа нескольких регуляторных систем, реагирующих на сходные изменения окружающей среды.

Для трёх групп бактерий: Enterobacteriaceae, Pasteurellaceae и Vibrionaceae, был проведен детальный анализ регулонов FNR, АгсА и NarP. Результаты приведены в таблице 3.5.1 в тексте диссертации, а история оперонных перестроек отражена в таблице 3.5.2 из текста диссертации.

Гены, попавшие в эти таблицы, могут быть разделены на несколько функциональных групп.

Дыхательные ферменты

Для оперонов cydAB, пар, сст, nrf, dms, torCAD,frd,fdn, ndh, glpABC и glpD из E. coli регуляция как минимум одним из рассматриваемых регуляторов была показана экспериментально. Мы провели детальный анализ таксон-специфичной регуляции этих генов и предсказали регуляцию некоторых других генов, участвующих в дыхании.

Одним из наиболее важных результатов была идентификация консервативных сайтов в 5'-некодирующих областях оперонов atpIBEFHAGCD. Этот оперон кодирует все субъединицы АТФ-синтетазного комплекса, который является важным компонентом дыхательного пути. Экспериментальные данные о регуляции этого оперона в Е. coli противоречивы. В частности, в работе (Kasimoglu, 1996) утверждалось, что экспрессия atp оперона не зависит от FNR или АгсА. С другой стороны, было показано увеличение экспрессии различных atp генов в 1.5-8 раз в fnr-мутантном штамме Е. coli по сравнению с диким штаммом (Salmon, 2003). В нашей работе потенциальные АгсА-сайты были найдены в 5'-некодирующих областях atp оперона в двух геномах Yersinia, а FNR-сайты во всех геномах Vibrionaceae. Таким образом, по крайней мере в нескольких геномах гамма-протеобактерий экспрессия генов АТФ синтетазы, по-видимому, контролируется глобальными регуляторами дыхания.

Перед Ыа+-экспортирующей NADH-дегидрогеназой (nqrABCDEF) также были найдены потенциальные регуляторные сайты. Потенциальные сайты

связывания FNR сохранились во всех рассмотренных геномах, тогда как сайты связывания АгсА были найдены во всех геномах Vibrionaceae и Pasteurellaceae, но не в Yersinia spp., а NarP-регуляция вообще специфична для Pasteurellaceae.

В геноме Е. coli есть два оперона, кодирующих редуктазы три-метиламин-оксид (ТМАО) азота, torCAD и torYZ . Экспрессия torCAD репрессируется регулятором NarL и активируется TorR (Iuchi, 1987. Simon, 1994), тогда как экспрессия torYZ конститутивна (Gon, 2000). В тех трёх геномах Pasteurellaceae, где гены torCAD отсутствуют, перед torYZ опероном были найдены сайты для всех трех дыхательных регуляторов. В геномах Vibrionaceae транскрипция the torCAD контролируется FNR, a torYZ-NarP.

Аналогичная ситуация имеет место и в случае с генами формиат редуктаз. В Е. coli оперон fein регулируется факторами FNR, NarL и NarP (Li, 1992, Wang, 2003), тогда как экспрессия оперона fdo постоянна (Abaibou, 1992). Но в геномах Y. pestis и Y. entercolitica гены fdn отсутствуют, и потенциальные сайты белков FNR, АгсА и NarP были найдены перед опероном fdo.

Потенциальные сайты связывания регулятора АгсА были обнаружены перед геном fdhD, кодирующим белок, участвующий в формировании белковых комплексов Fdn и Fdo в геномах Pasteurellaceae и Yersinia spp. Более того, перед геном fdhD мы обнаружили сайты связывания NarP в двух геномах Yersinia spp. Интересно, что потенциальные регуляторные сайты были найдены только в геномах, содержащих гены fdo или fdn.

В 5'-некодирующей области оперона dadAX в геномах Yersinia spp. и Vibrionaceae мы обнаружили потенциальные сайты АгсА. Первый ген этого оперона кодирует малую субъединицу дыхательной D-аминокислотной дегидрогеназы (Lobocka, 1994). Таким образом, работа D-аминокислот, как электронных доноров, в некоторых геномах может контролироваться АгсА.

Синтез молибденового кофактора

Молибденовый кофактор - необходимый компонент некоторых дыхательных дегидрогеназ и редуктаз, например, комплексов Fdn, Fdo, Nap, Dms и Tor (Gennis et al., 1996). Как было сказано выше, регуляция экспрессии оперонов moa и тое в геноме Е. coli осуществляется разными дыхательными регуляторами, см. раздел 3.2. Во всех геномах за исключением V. fischeri в 5'-некодирующей области оперона moa были найдены сайты хотя бы для одного регулятора дыхания. Сохранение потенциальных сайтов FNR и АгсА перед опероном тое было отмечено только в геномах Pasteurellaceae.

Центральный метаболизм и брожение

В различных экспериментальных работах было показано, что экспрессия оперонов pdhR-aceEF-lpdA, pflB, yfiD, gltA, sucABCD, sdhCDAB, aspA, fumC, mdh, IdhA и adhE в E. coli регулируется хотя бы одним глобальным регулятором дыхания, см. ссылки в таблице 3.5.1 из текста диссертации. Перед генами, участвующими в гликолизе, глюконеогенезе, пентозо-фосфатном пути,

метаболизме пирувата и лактатата также были найдены искомые потенциальные сайты.

Ген sfcA кодирует малатдегидрогеназу, участвующую в пути глюконеогенеза. В геномах Yersinia spp. перед ним были найдены сайты связывания NarP, а FNR-сайты были обнаружены в группе Vibrionaceae.

Фермент глюконеогенеза, фосфоэнол пируват синтаза кодируется геном ppsA. Перед ним были найдены потенциальные сайты связывания FNR в Yersinia spp. и АгсА в Vibrionaceae.

Ещё один ген из этого пути, рскА, кодирующий фософоэнол-пируват карбоксигеназу, имеет потенциальные сайты АгсА во всех геномах Vibrionaceae и Pasteurellaceae, за исключением P. multocida.

Перед геном епо, кодирующим энолазу и участвующим в гликолизе/глюконеогенезе в Pasteurellaceae были найдены потенциальные сайты связывания FNR и NarP. Мы также предсказали дыхательную регуляцию для гена pgk, кодирующего фосфоглицерат-киназу: консервативные сайты связывания NarP были обнаружены в Pasteurellaceae, a FNR - в Vibrionaceae.

Ген talB кодирует транс-альдолазу В, фермент пентозно-фосфатного пути. В геномах Pasteurellaceae мы обнаружили потенциальные сайты NarP в 5'-некодирующей области гена tal В.

Кроме того, потенциальные сайты FNR и АгсА были найдены во всех Vibrionaceae перед геном aldB. Этот ген кодирует альдегид дегидрогеназу, фермент, участвующий в метаболизме пирувата.

Метаболизм углеводов

Регуляция генов сахарного метаболизма белками-регуляторами дыхания не была изучена экспериментально. Однако мы обнаружили потенциальные сайты связывания FNR, АгсА и NarP перед некоторыми оперонами сахарного метаболизма. Нельзя назвать это неожиданным результатом, поскольку метаболизм Сахаров близок центральному метаболизму, и сахара поставляют субстраты для производства энергии.

Гены ptsH и ptsl кодируют белки НРг и El общего компонента всех фосфоэнол-пируват: карбогидрат фосфотрансферазных систем PTS. В Е coli гены ptsHI контранскрибируются с err, кодирующим EIIA компонент глюкозо-специфичной PTS (Ryu, 1995). Структура этого оперона сохраняется во всех рассмотренных геномах. В Pasteurellaceae этот оперон предсказан как АгсА-регулируемый.

Оперон mtlADR кодирует компонент EIIABC маннитол-специфичной PTS, манитол-1-фосфат дегидрогеназу и репрессор этого оперона. АгсА-регуляция была предсказана для геномов Yersinia spp., FNR-регуляция - для Vibrionaceae.

Перед опероном deoCABD в геномах Vibrionaceae нами были найдены потенциальные сайты связывания NarP. Гены этого оперона отвечают за деградацию пиримидиновых дезоксинуклоизидов до ацетальдегида и глицерол-3-фосфата (Neughard, 1990).

Во всех бактериях Vibrionaceae перед генами nag В, кодирующими глюкозамин-6-деаминазу, были найдены потенциальные сайты связывания FNR.

Кластер генов glgBXCAP содержит гены, отвечающие за биосинтез гликогена и катаболизм. Эти гены образуют один оперон в геномах Yersinia spp. В Pasteureilасеае генам gig предшествует ген malQ, который мы тоже относим к потенциальному оперону malQ-glgBXCAP. В обеих Yersinia spp. потенциальные сайты связывания FNR были найдены перед геном glgB, тогда как в Pasteurellaceae сайты связывания FNR и NarP обнаружились перед геном malQ. Сохранение этих сайтов, несмотря на оперонные перестройки, говорит о том, что гены gig действительно являются членами дыхательных регулонов.

Метаболизм жирных кислот

Регуляция оперонов, участвующих в метаболизме жирных кислот, не была показана экспериментально, однако имелись некоторые косвенные подтверждения (Iuchi and Lin, 1988). Перед некоторыми из этих оперонов есть консервативные сайты связывания, и поэтому, скорее всего, они действительно входят в дыхательные регулоны.

Опероны fabBA и fadIJ гомологичны и кодируют белковый комплекс для бета-окисления жирных кислот. Белковый комплекс FadBA принимает участие в деградации жирных кислот и в аэробных, и в анаэробных условиях, тогда как FadIJ в основном работает в анаэробных условиях (Clark and Cronan, 1996, Campbeil et al., 1993). Эффект от мутации гена arc А на эспрессию fadBA оперона был отмечен в работе (Iuchi and Lin, 1988), но прямая регуляция показана не была. В Yersinia spp. сохранение потенциальных сайтов связывания АгсА обнаружено перед опероном fadIJ, а сайтов связывания FNR и АгсА -перед опероном fabBA. В геномах Vibrionaceae наблюдалась обратная ситуация: сайты связывания FNR и АгсА располагались перед опероном fadIJ, а одиночные сайты АгсА перед опероном fabBA.

ArcA-регуляция гена fadD предсказана в геномах Yersinia spp. и Vibrionaceae. Ген fadD кодирует ацил-коА синтазу, фермент, участвующий в бета-окислении жирных кислот (Weimar, 2002).

Ещё один оперон, кодирующий белки синтеза жирных кислот (acpP-fabF), может участвовать в регуляции дыхания. Оба белка АсрР и FabF вовлечены в биосинтез жирных кислот (Cronan and Rock, 1996). Консервативные сайты связывания АгсА перед этим опероном были найдены в геномах Yersinia spp , а сайты связывания FNR в Vibrionaceae.

Можно предпололжить несколько возможных объяснений регуляции метаболизма жирных кислот в зависимости от способа дыхания. Во-первых, метаболизм жирных кислот близок к центральному метаболизму, например через ацетил-КоА (Lin, 1996, Hassan, 1992) . Во-вторых, одни ферменты окисения жирных кислот предпочитают анаэробные условия, а другие -аэробные (Campbell, 2003).

Кислородный стресс

Было показано, что экспрессия гена супероксид-дисмутазы (sodA) в геноме Е coli регулируется белками FNR и ArcA (Hassan and Sun, 1992). Подобная регуляция сохраняется в геномах Pasteurelaceae, а в Yersinia spp. были обнаружены только потенциальные сайты АгсА.

Нуклеотид редукгазы

Известно, что FNR активирует оперон nrdDG в геноме Е coli в анаэробных условиях (Boston, 2003), а эспрессия еще одного оперона нуклеотид редуктазы, nrdAB, не зависит от FNR в Е coli (Boston, 2003). Сохранение сайтов связывания FNR в 5'-некодирующих областях nrdDG оперона наблюдалось в двух геномах Yersinia spp. и во всех Vibrionaceae. В геномах Pasteurellaceae, наоборот, потенциальные сайты FNR найдены перед nrdAB опероном.

Транспорт

Регуляция хотя бы одним из изучаемых регуляторов в геноме Е coli была показана экспериментально для следующих оперонов: foc A, dcuA, dcuB, dcuC, glpFK и feoAB, см. ссылки в таблице 3.5.1 в тексте диссертации. Регуляция некоторых других транспортных генов предсказана сейчас.

Потенциальные сайты связывания АгсА обнаружены перед геном gltP в геномах Yersinia spp. и Vibrionaceae. Продукт этого гена - траспортер глутамата и аспартата (Wallace, 1994). Транспорт дикарбоксилатов контролируется дыхательными регуляторами, например, экспрессия генов dcuA, dcuB и dcuC, кодирующих транспортеры дикарбоксилата, в геноме Е coli регулируется белком FNR (Golby, 1998 и Zientz, 1999).

Оперон gntXY кодирует белок из системы транспорта глюконата (Рогсо, 1998). Потенциальные сайты связывания АгсА и FNR найдены перед gntXY опероном во всех геномах Pasteurellaceae.

Наконец, регуляция была предсказана для гена fadL, кодирующего транспортер жирных кислот (Black, 1991). Потенциальные сайты связывания FNR и АгсА были найдены в геномах Yersinia spp , а сайты связывания АгсА -в Vibrionaceae.

Т-пептидаза

Экспрессия гена рерТ, кодирующего аминотрипептидазу T (Lombardo, 1997), активируется регулятором FNR в S. typhimurium (Strauch, 1985). Это предсказание подтверждается высокой консервативностью сайтов связывания FNR, обнаруженных во всех рассмотренных геномах, таблица 3.5.1 из текста диссертации.

Регуляторы транскрипции

Регуляция генов fnr, arc А, пагР и narQ различными дыхательными регуляторами в геноме Е. coli была показана экспериментально (ссылки в таблице 3.5.1 в тексте диссертации). Были показаны существенные перестройки этого регуляторного каскада в других бактериях. В качестве примера на рисунке 6 показаны регуляторные каскады, для геномов семейства

УНэпопасеае. Каскады для остальных семейств приведены в тексте диссертации.

Г*

ТпгЩРШЧЬС

Fis - это широко представленный белок, отвечающий за архитектуру ДНК. Он регулирует сверхспирализацию бактериальной ДНК (Browning, 2005). Экспериментально было показано, что в Е. coli Fis вместе с FNR и/или АгсА регулирует экспрессию nrf, nir, ndh, adhE, yfiD, sdhCDAB-sucABCD, acnB и narK оперонов. В геноме Е coli ген fis ко-транскрибируется с геном dusB (Ninnemann, 1992), и структура кластера dusB-fis сохраняется во всех рассмотренных геномах. В группе Pasteurellaceae потенциальные сайты связывания FNR и АгсА были найдены перед геном dus В. Таким образом, можно предположить, что в рассмотренных геномах транскрипция гена fis контролируется дыхательными регуляторами. Так как белок Fis контролирует экспрессию дыхательных генов, то, возможно, FNR и АгсА, регулируя экспрессию гена fis, таким образом влияют и на экспрессию собственных генов.

Оперон cpxRA кодирует двухкомпонентную регуляторную систему, участвующую в стресс-ответе (Raivio, 2005). Некоторые данные указывают на перекрестное взаимодействие между системами CpxR-CpxA и ArcA-ArcB в Е. coli (luchi, 1989) В геномах Pasteurellaceae были обнаружены консервативные сайты связывания FNR и АгсА перед опероном срх.

OxyR - фактор транскрипции ответа на дыхательный стресс (Christman, 1989). Во всех геномах Pasteurellaceae, были обнаружены потенциальные сайты связывания АгсА перед генами oxyR. Так как АгсА проявляет активность как фактор транскрипции только в условиях отсутствия кислорода, возможно, что в этих условиях он репрессирует экспрессию сенсора oxyR.

Ген fur, кодирующий регулятор транспорта железа, в 5'-некодирующей области содержит потенциальные сайты FNR в геномах Pasteurellaceae, и АгсА в Vibrionaceae. Нельзя сказать, что наши выводы о дыхательной регуляции Fur неожиданны, потому как железо — неотьемлемый компонент большинства дыхательных комплексов (Gennis and Stewart, 1996) и самого фактора FNR (Sutton, 2004).

Таким образом, в данной работе три дыхательных регулона в десяти геномах, принадлежащих к трем семействам были изучены сначала независимо, потом данные были суммированы и найдены возможные дополнительные члены обобщенных регулонов. Потенциальные члены регулонов были разбиты на десять функциональных групп, и для каждого оперона был проведен анализ литературных данных, дающий нашим предсказаниям больший или меньший вес. К обобщенному потенциальному дыхательному регулону мы относим 68 оперонов из группы гамма-протеобактерий.

Выводы

1. Впервые полностью проанализирована транскрипционная регуляция дыхания в геномах трех различных семейств Enterobacteriaceae, Pasteurellaceae и Vibrionaceae.

2. Были построены матрицы для поиска потенциальных сигналов для регуляторов дыхания FNR, АгсА, нитрат-нитритного переключателя NarP, регулятора транспорта молибдата ModE и регулятора биосинтеза НАД -NadR.

3. Разработан и применен способ анализа обобщенного регулона в группе близкородственных малоизученных геномов, основанный на полном попарном сравнении регулонов.

4. С помощью подробного анализа были найдены несколько десятков новых индивидуальных членов регулонов, в том числе, была предсказана потенциальная FNR-регуляция оперона narQP в геномах Vibrionaceae, ArcA-регуляция оперона adhE в группе геномов Vibrionaceae и frdA в Pasterellaceae и Yersinia, регуляция оперона moa белком NarP в Pasterellaceae Vibrionaceae.

5. Также были найдены члены обощенных регулонов, такие как опероны atp, torYZ, nqr и ген Ы674.

6. Впервые показана потенциальная авторегуляция гена агсА в геномах Yersinia spp., Vibrionaceae и Н. ducreyi.

7. Детально проанализирована регуляция транскрипции биосинтеза НАД в девяти геномах из семейства Enterobacteriaceae. Впервые показана авторегуляция гена nadR в геномах Е. carotovora, S marcescens, Y. pestis и Y. enterocolitica.

Список работ, опубликованных по теме диссертации Публикации в научных журналах:

1. A.V. Gerasimova, M.S. Gelfand. Evolution of the NadR regulon in Enterobacteriaceae // Journal of Bioinformatics and Computational Biology, 2005, V.3 (4), pp.1007-1019.

2. A.V. Favorov, M.S. Gelfand, A.V. Gerasimova, D.A. Ravcheev, A.A. Mironov, V.J. Makeev. Gibbs sampler for identification of symmetrically structured, spaced DNA motifs with improved estimation of the signal length // Bioinformatics, 2005, V.21(10), pp.2240-2245.

3. A.B. Герасимова, M.C. Гельфанд, В. Ю. Макеев, A.A. Миронов, А.В. Фаворов. Регулятор-ArcA в гамма-протеобактериях. Определение сайтов-связывания и описание регулона // Биофизика, 2003, т.48(1), стр. 21-25.

4. А.В. Герасимова, Д.А. Родионов, А.А. Миронов, М.С. Гельфанд. Компьютерный анализ регуляторных сигналов в бактериальных геномах. Участки связывания Fnr//Молекулярная Биология, 2001, т.35(6), стр. 10011010.

Тезисы международных научных конференций:

1. A.V. Gerasimova, M.S. Gelfand. Comparative analysis of transcriptional regulation in E. coli and relative genomes: FNR, ArcA, NarP and ModE regulons // Conference on New Frontiers in Microbiology and Infection, 2005, pp.26-27, Villars-sur-Ollon, Switzerland, September 4-8, 2005

2. A.V. Gerasimova, D.A. Ravcheev. How gamma-proteobacteria switch the mode of respiration: a comparative genomic analysis // Moscow Conference on Computational and Molecular Biology, pp. 297-299, Moscow, Russia, July 1821,2005.

3. A.V. Gerasimova, D.A. Ravcheev, A.B. Rakhmaninova, M.S. Gelfand. Computer analyses of aerobic-anaerobic regulation in gamma-proteobacteria // Intellectual Systems for Molecular Biology pp. 111 .Glasgow, United Kingdom, July 31-August 4, 2004.

4. A.V. Favorov, M.S. Gelfand, A.V. Gerasimova, A.A. Mironov, V.J. Makeev. Gibbs Sampler for identification of symmetrically structured, spaced DNA motifs with improved estimation of the signal length and its validation on the ArcA binding sites // Conference on Bioinformatics of Genome Regulation and Structure, 2004, V.2, pp.269-272, Novosibirsk, Russia, July 25-30, 2004.

5. A.B. Герасимова, Д.А. Равчеев. Компьютерное предсказание потенциальных участков связывания FNR и ArcA // Международная научная конференция студентов, аспирантов и молодых учёных «Ломоносов-2004», стр. 10, Москва, Россия, Апрель 2004.

6. A.V. Gerasmova. Comparative genomics of FNR,- DNR,- ANR- and EtrA regulons of gamma-proteobacteria // Moscow Conference on Computational and Molecular Biology, 2003, pp.78-79, Moscow, Russia, July 22-25, 2003.

7. A.V. Favorov, A.V. Gerasimova. Yet Another Digging-for-DNA-Motifs Gibbs Sampler // Moscow Conference on Computational and Molecular Biology, 2003, pp.67-68, Moscow, Russia, July 22-25, 2003.

8. A.V. Gerasimova, D.A. Rodionov, A.A. Mironov, M.S. Gelfand. FNR/DNR/ANR-regulon in Gamma- Proteobacteria // Conference on Bioinformatics of Genome Regulation and Structure, 2002, V.2, pp.19-20, Novosibirsk, Russia, July 14-20, 2002.

9. A.V. Gerasimova. Computational analysis of regulatory sites in bacterial genomes: FNR- and ANR-binding sites // NATO Advanced Studies: Intelligent Systems for Molecular Biology, pp. 25, San Miniato, Italy, October 1-12, 2001.

Подписано в печать 22.03.2006 Формат 60x88 1/16. Объем 1.5 пл. Тираж 75 экз. Заказ № 503 Отпечатано в ООО «Соцветие красок» 119992 г.Москва, Ленинские горы, д.1 Главное здание МГУ, к. 102

№-78 36

i

Содержание диссертации, кандидата биологических наук, Герасимова, Анна Викторовна

ВВЕДЕНИЕ

Глава I. ОБЗОР ЛИТЕРАТУРЫ

1.1. Регуляция дыхания в геноме Е. coli

1.1.1. Транскрипционный регулятор FNR

1.1.2. Двухкомпонентная система АгсА/АгсВ

1.1.3. Регуляция нитрит-нитратного дыхания

1.1.4. Транскрипционный регулятор ModE

1.2. Регул он NadR в геномах Е. coli и S. thypi

1.3. Современные методы сравнительной геномики

1.3.1. Методы поиска экспериментальных данных, для 21 последующего компьютерного анализа и предсказаний

1.3.2. Методы, основанные на сходстве аминокислотных 22 последовательностей белков

1.3.3. Кластеризация генов на хромосоме 26 ► 1.3.4. Анализ регуляторных сигналов

Глава II. МАТЕРИАЛЫ И МЕТОДЫ

2.1. Банки данных геномных последовательностей

2.2. Компьютерные программы и методы для анализа нуклеотидных и аминокислотных последовательностей

Глава III. РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ

3.1. Построение распознающих правил для поиска потенциальных сайтов связывания регуляторных белков

3.1.1. Построение распознающего правила для регулона FNR

3.1.2. Построение распознающего правила для регулона Arc А

3.1.3. Построение распознающего правила для регулона NarP

3.1.4. Построение распознающего правила для регулона ModE

3.1.5. Построение распознающего правила для регулона NadR

3.2. Разработка и применение новых методов сравнительной геномики

3.2.1. Анализ таксоноспецифичной регуляции

3.2.2. Применение метода таксоноспецифичного анализа для 42 изучения эволюции NadR регулона в группе геномов Enterobacteriaceae

3.3. Анализ дыхательных регулонов

3.3.1. Анализ FNR регулона

3.3.2. Анализ АгсАрегулона

3.3.3. Анализ NarP регулона

3.3.4. Анализ ModE регулона

3.3.5. Комплексный анализ дыхательных регулонов 77 ВЫВОДЫ 93 БЛАГОДАРНОСТИ 94 СПИСОК ЛИТЕРАТУРЫ

Введение Диссертация по биологии, на тему "Анализ регуляции транскрипции генов дыхания в гамма-протеобактериях методами сравнительной геномики"

Большинство гамма-протеобактерий, к которым относится и Escherichia coli, могут существовать в среде с различными концентрациями кислорода, что дает возможность изучать аэробные и анаэробные особенности жизни клетки. В аэробных условиях основным акцептором электронов является кислород, а в анаэробных - нитрат и нитрит.

В клетках Е. coli в качестве основного белка-регулятора, отвечающего за переключение экспрессии генов, вовлеченных в дыхательный метаболизм, выступает регуляторный белок FNR.

Другой транскрипционный регулятор АгсА, часть двухкомпонентной системы АгсА/АгсВ, также регулирует экспрессию генов, участвующих в дыхании, но его основная функция - выбор между аэробным метаболизмом и брожением.

В анаэробных условиях наиболее эффективным способом получения клеткой энергии является нитрат-нитритное дыхание. Регуляция этого типа дыхания в Е. coli осуществляется удвоенной двухкомпонентной системой, включающей гомологичные сенсорные белки NarQ и NarX и гомологичные факторы транскрипции NarL и NarP.

Основным коферментом в дыхательных ферментах является молибден, и поэтому неудивительно, что часто их эспрессия регулируется не только регулятором потребления молибдата ModE, но и белками-регуляторами аэробно-анаэробного переключения, упомянутыми выше.

С каждым годом секвенируется все больше и больше геномов. На данный момент известны последовательности более 350 полных и около 570 незаконченых бактериальных геномов. Сравнительный анализ большого числа различных секвенированных геномов произвел переворот в области функциональной аннотации генов. Чтобы ответить на вопрос "Какова наиболее вероятная функция данного гена?" до недавнего времени использовался исключительно перенос экспериментально установленных функций белков из одного вида на другие, основанный на сходстве аминокислотных последовательностей. Для реализации поиска гомологичных последовательностей по различным банкам данных (таких как Genbank, Swiss-Prot и др.) были разработаны программные комплексы BLAST (Altschul et al., 1994) и FASTA (Pearson, 1990).

Наличие полных секвенированных геномов и возможность проводить их компьютерный анализ позволяет существенно уменьшить количество экспериментов. Экспериментально обнаружив ту или иную особенность определенного участка ДНК, можно попытаться ее формализовать и затем провести анализ сразу всего генома, используя при этом чисто компьютерные подходы, однако, несмотря на общий успех, методы, основанные на сходстве нуклеотидных последовательностей не способны определить функции многих генов, а также могут приводить к неточным (или даже неправильным) аннотациям генов. Такие гипотетические гены, не имеющие точно определенной функции, составляют от 20% до 60% I большинства бактериальных геномов. Функциональное описание большинства из этих гипотетических белков потребует огромного количества экспериментов, число которых может быть существенно уменьшено применением сравнительного анализа геномов. Среди новых подходов сравнительной геномики большое значение имеют анализ сцепленных на хромосоме генов (Overbeek et al., 1999), случаев слияния генов (Enright et al., 1999), профилей встречаемости генов в полных геномах (Pellegrini et al., 1999) и анализ общих регуляторных сайтов (Gelfand et al., 2000). Одновременное использование всех этих геномных методик позволяет обнаружить функциональную связь между белками, участвующими в одном метаболическом пути (Wolf et al., 2001; Makarova et al., 2002). Таким образом, метаболическая реконструкция помогает обнаружить как новые аспекты данного метаболического пути в хорошо изученных организмах (таких как Е. coli и S. typhi), так и описать de novo метаболический потенциал ^охарактеризованных организмов.

Другой, не менее важный, раздел сравнительной геномики -предсказание регуляции экспрессии генов. В ряде работ было показано, что регуляторные сайты в бактериальных геномах могут быть предсказаны наиболее эффективно при одновременном анализе нескольких родственных геномов. Так, в частности, были описаны регулоны, отвечающие за биосинтез пуринов и аргинина (Mironov et al., 1999), ароматических аминокислот (Panina et al., 2001), транспорт и метаболизм железа (Panina et al., 2001), утилизацию различных Сахаров (Laikova et al., 2001; Rodionov et al., 2001 and 2000), а также SOS-ответ (Permina et al., 2002).

В дополнение к этим методам, в рамках данной работы был разработан новый метод анализа регуляции, специфичной для геномов одной таксономической группы.

При помощи всех методов сравнительной геномики была описана регуляция дыхания в геномах гамма-протеобактери, произведен > комплексный, таксон-специфичный анализ четырех глобальных регулонов в десяти геномах.

Заключение Диссертация по теме "Молекулярная биология", Герасимова, Анна Викторовна

Выводы

1. Впервые полностью проанализирована транскрипционная регуляция дыхания в геномах трех различных семейств Enterobacteriaceae, Pasteurellaceae и Vibrionaceae.

2. Были построены матрицы для поиска потенциальных сигналов для регуляторов дыхания FNR, АгсА, нитрат-нитритного переключателя NarP, регулятора транспорта молибдата ModE и регулятора биосинтеза НАД -NadR.

3. Разработан и применен способ анализа обобщенного регулона в группе близкородственных малоизученных геномов, основанный на попарном сравнении регулонов.

4. С помощью подробного анализа были найдены несколько десятков новых индивидуальных членов регулонов. Также были найдены члены обощенных регулонов, такие как опероны atp, torYZ, nqr и ген Ы674.

5. Впервые показана потенциальная авторегуляция гена агсА в большинстве рассмотренных геномов.

6. Детально проанализирована регуляция транскрипции биосинтеза НАД, в девяти геномах из семейства Enterobacteriaceae. Впервые показана авторегуляция гена nadR в геномах Е. carotovora, S. marcescens, Y. pestis и Y. enterocolitica.

Благодарности

Я благодарна Михаилу Сергеевичу Гельфанду за руководство, постоянную под держку и помощь в работе, Андрею Александровичу Миронову и Александру Владимировичу Фаворову, за предоставленные программные продукты, комплекс программ Genom Explorer и SeSiMCMC, соответственно, моим коллегам Дмитрию Равчееву, описавшему NarP регулон, и Дмитрию Родионову за полезное обсуждение и помощь, оказанную мне с первых дней моего пребывания в лаборатории, заведующему лаборатории Биоинформатики Всеволоду Юрьевичу Макееву и всем сотрудникам лаборатории, за доброе отношение и творческую обстановку в коллективе.

Библиография Диссертация по биологии, кандидата биологических наук, Герасимова, Анна Викторовна, Москва

1. Abaibou Н., Pommier J., Benoit S., Giordano G., Mandrand-Berthelot M.A. Expression and characterization of the Escherichia coli fdo locus and a possible physiological role for aerobic formate dehydrogenase. J Bacteriol. 1995; 177:7141-7149.

2. Ailion M., Bobik T.A., Roth J.R. Two global regulatory systems (Crp and Arc) control the cobalamin/propanediol regulon of Salmonella typhimurium. J Bacteriol. 1993; 175:7200-7208.

3. Alkema W.B., Lenhard В., Wasserman W.W., Regulog analysis: detection of conserved regulatory networks across bacteria: application to Staphylococcus aureus, Genome Research 2004; 14:1362-1373.

4. Altschul S., Madden Т., Schaffer A., Zhang J., Zhang Z., Miller W., Lipman D. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Res. 1997; 25: 3389-3402.

5. Altschul S., Boguski M.S., Gish W., Wootton J.C. Issues in searching molecular sequence databases. Nat Genet. 1994; 6: 119-29.

6. Anderson L.A., McNairn E., Lubke Т., Pau R.N., Boxer D.H. ModE-dependent molybdate regulation of the molybdenum cofactor operon moa in Escherichia coli. J Bacteriol. 2000; 182(24):7035-7043.

7. Aravind L., Koonin E.V. DNA-binding proteins and evolution of transcription regulation in the archaea. Nucleic Acids Res. 1999; 27: 4658-4670.

8. Aravind L., Watanabe H., Lipman D.J., Koonin E.V. Lineage-specific loss and divergence of functionally linked genes in eukaryotes. Proc Natl Acad Sci USA. 2000; 97: 11319-24.

9. Bagg A., Neilands J.B. Ferric uptake regulation protein acts as a repressor, employing iron (II) as a cofactor to bind the operator of an iron transport operon in Escherichia coli. Biochemistry. 1987; 26:5471-5477.

10. Bauer C.E., Elsen S., Bird Т.Н. Mechanisms for redox control of gene expression. Annu. Rev. Microbiol. 1999; 53: 495-523.

11. Bearson S.M., Albrecht J.A., Gunsalus R.P. Oxygen and nitrate-dependent regulation of dmsABC operon expression in Escherichia coli: sites for Fnr and NarL protein interactions. BMC Microbiol. 2002; 2: 13.

12. Begley T.P., Kinsland C., Mehl R.A., Osterman A., Dorrestein P. The biosynthesis of nicotinamide adenine dinucleotides in bacteria. Vitam Horm. 2001; 61: 103-19.

13. Bell A.I., Cole J.A., Busby S.J. Molecular genetic analysis of an FNR-dependent anaerobically inducible Escherichia coli promoter. Mol Microbiol. 1990; 4(10): 1753-63.

14. Benson D.A., Karsch-Mizrachi I., Lipman D.J., Ostell J., Wheeler D.L. GenBank. Nucleic Acids Res. 2003; 31: 23-7.

15. Black P.N. Primary sequence of the Escherichia coli fadL gene encoding an outer membrane protein required for long-chain fatty acid transport. J Bacteriol. 1991; 173:435-442.

16. Bongaerts J., Zoske S., Weidner U., Unden G. Transcriptional regulation of the proton translocating NADH dehydrogenase genes (nuoA-N) of Escherichia coliby electron acceptors, electron donors and gene regulator. Mol Microbiol. 1995; 16:521-534.

17. Bork P., Hofmann K., Bucher P., Neuwald A.F., Altschul S.F., Koonin E.V. A superfamily of conserved domains in DNA damage-responsive cell cycle checkpoint proteins. FASEBJ. 1997; 11: 68-76.

18. Boston Т., Atlung T. FNR-mediated oxygen-responsive regulation of the nrdDG operon of Escherichia coli. J Bacteriol. 2003; 185:5310-5313.

19. Brenner S.E. Errors in genome annotation. Trends Genet. 1999; 15: 132-133.

20. Browning D.F., Cole J.A., Busby S.J. Transcription activation by remodelling of a nucleoprotein assembly: the role of NarL at the FNR-dependent Escherichia coli nir promoter. Mol Microbiol. 2004, 53:203-215.

21. Browning D.F., Grainger D.C., Beatty C.M., Wolfe A.J., Cole J.A., Busby S.J. Integration of three signals at the Escherichia coli nrf promoter: a role for Fis protein in catabolite repression. Mol Microbiol. 2005; 57:496-510.

22. Campbell J.W., Morgan-Kiss R.M., Cronan J.E. Jr. A new Escherichia coli metabolic competency: growth on fatty acids by a novel anaerobic beta-oxidation pathway. Mol Microbiol. 2003; 47(3):793-805.

23. Chao G., Shen J., Tseng C.P., Park S.J., Gunsalus,R.P. Aerobic regulation of isocitrate dehydrogenase gene (icd) expression in Escherichia coli by the arcA and fnr gene products. J. Bacteriol 1997; 179 (13): 4299-4304.

24. Chattopadhyay S., Wu Y., Datta P. Involvement of Fnr and ArcA in anaerobic expression of the tdc operon of Escherichia coli. J Bacteriol. 1997; 179(15):4868-4873.

25. Chen P., Andersson D.I., Roth J.R. The control region of the pdu/cob regulon in Salmonella typhimurium. JBacteriol. 1994; 176(17):5474-5482.

26. Chen Y.M., Lin E.C. Regulation of the adhE gene, which encodes ethanol dehydrogenase in Escherichia coli. J Bacteriol. 1991; 173: 8009-8013.

27. Clark D.P., Cronan J.E. Two-carbon compounds and fatty acids as carbon sources. In Escherichia coli and Salmonella. Cellular and Molecular Biology. Volume 1. 2nd edition. Edited by Neidhart F.C. Washington: ASM Press; 1996; 343-357.

28. Colloms S.D., Alen C., Sherratt D.J. The ArcA/ArcB two-component regulatory system of Escherichia coli is essential for Xer site-specific recombination at psi. MolMicrobiol. 1998; 28(3):521-530.

29. Compan I., Touati D. Anaerobic activation of arcA transcription in Escherichia coli: roles of Fnr and ArcA. Mol Microbiol. 1994; 11:955-964.

30. Cotter P.A., Chepuri V., Gennis R.B., Gunsalus R.P. Cytochrome о (<cyoABCDE) and d (cydAB) oxidase gene expression in Escherichia coli is regulated by oxygen, pH, and the fnr gene product. J Bacteriol. 1990; 172(11):6333-8.

31. Cotter P.A, Gunsalus R.P. Oxygen, nitrate, and molybdenum regulation of dmsABC gene expression in Escherichia coli. J Bacteriol. 1989; 171 (7):3 817-23.

32. Cronan J.E., Laporte D. 1996 In: Escherichia coli and Salmonella. Cellular and Molecular Biology. Eds Neidhart F.C. Washington: ASM Press, pp. 206-216.

33. Cronan J.E., Rock C.O. Biosynthesis of membrane lipids. In Escherichia coli and Salmonella. Cellular and molecular biology. Volume 1. 2nd edition. Edited by Neidhardt F.C. Washington: ASM Press; 1996:612-636.

34. Dandekar Т., Snel В., et al. Conservation of gene order: a fingerprint of proteins that physically interact. Trends Biochem.Sci. 1998; 23: 324-328.

35. Darwin A. J., Li J., Stewart V. Analysis of nitrate regulatory protein NarL-binding sites in the fdnG and narG operon control regions of Escherichia coli K-12. Mol Microbiol. 1996; 20: 621-632.

36. Darwin A.J., Tyson K.L., Busby S.J., Stewart V. Differential regulation by the homologous response regulators NarL and NarP of Escherichia coli K-12 depends on DNA binding site arrangement. Mol Microbiol. 1997; 25: 583-595.

37. Darwin A.J., Ziegelhoffer E.C., Kiley P.J., Stewart V. Fnr, NarP, and NarL regulation of Escherichia coli K-12 napF (periplasmic nitrate reductase) operon transcription in vitro. J Bacteriol. 1998; 180: 4192-4108.

38. Daugherty M., Vonstein V., Overbeek R., Osterman A. Archaeal shikimate kinase, a new member of the GHMP-kinase family. J Bacteriol. 2001; 183: 292300.

39. Daugherty M., Polanuyer В., Farrell M., Scholle M., Lykidis A., de Crecy-Lagard V., Osterman A. Complete reconstitution of the human coenzyme A biosynthetic pathway via comparative genomics. J Biol Chem. 2002; 277:2143121439.

40. Delbaere L.T., Sudom A.M., Prasad L., Leduc Y., Goldie H. Structure/function studies of phosphoryl transfer by phosphoenolpyruvate carboxykinase. Biochim BiophysActa. 2004; 1697:271-278.

41. Dodd I.B., Egan J.B. Improved detection of helix-turn-helix DNA-binding motifs in protein sequences. Nucleic Acids Res. 1990; 18: 5019-5026.

42. Enright A.J., Iliopoulos I., Kyrpides N.C., Ouzounis C.A. Protein interaction maps for complete genomes based on gene fusion events. Nature. 1999; 402: 8690.

43. Fitch W.M. Distinguishing homologous from analogous proteins. Syst Zool. 1970;19:99-113.

44. Fleischmann R.D., Adams M.D., White O., Clayton R.A., Kirkness E.F., Kerlavage A.R., Bult C.J., Tomb J.F., Dougherty B.A., Merrick J.M., et al. Whole-genome random sequencing and assembly of Haemophilus influenzae Rd. Science. 1995;269:496-512.

45. Foster J.W., Park Y.K., Penfound Т., Fenger Т., Spector М.Р. Regulation of NAD metabolism in Salmonella typhimurium: molecular sequence analysis of the bifiinctional NadR regulator and the nadA-pnuC operon, J Bacteriol. 1990; 172: 4187-96.

46. Frankel D.G. Glycolysis. In Escherichia coli and Salmonella. Cellular and molecular biology. Volume 1. 2nd edition. Edited by Neidhardt F.C. Washington: ASM Press; 1996: 189-198.

47. Fraser C.M., Gocayne J.D., White O., Adams M.D., Clayton R.A., Fleischmann R.D., Bult C.J., Kerlavage A.R., Sutton G., Kelley J.M., et al. The minimal gene complement of Mycoplasma genitalium. Science. 1995; 270: 397-403.

48. Friedberg D., Midkiff M., Calvo J.M., Global versus local regulatory roles for Lrp-related proteins: Haemophilus influenzae as a case study, J Bacteriol. 2001; 183:4004-4011.

49. Galperin M.Y. Conserved "hypothetical" proteins: new hints and new puzzles. Сотр. Funct. Genomics 2001; 2: 14-18.

50. Galperin M.Y., Brenner S.E. Using metabolic pathway databases for functional annotation. Trends Genet. 1998; 14: 332-3.

51. Galperin M.Y., Koonin E.V. Functional genomics and enzyme evolution. Homologous and analogous enzymes encoded in microbial genomes. Genetica. 1999; 106:159-70.

52. Galperin M.Y., Koonin E.V. Sources of systematic error in functional annotation of genomes: domain rearrangement, non-orthologous gene displacement and operon disruption. In Silico Biol. 1998; 1: 55-67.

53. Gelfand M.S. Recognition of regulatory sites by genomic comparison. Res Microbiol. 1999; 150: 755-71.

54. Gelfand M.S., Koonin E.V., Mironov A.A. Prediction of transcription regulatory sites in Archaea by a comparative genomic approach. Nucleic Acids Res. 2000; 28: 695-705.

55. Gelfand M.S., Novichkov P.S., Novichkova E.S., Mironov A.A. Comparative analysis of regulatory patterns in bacterial genomes. Brief. Bioinform., 2000; 1; 357-371.

56. Gennis R.B., Stewart V. In: Escherichia coli and Salmonella. Cellular and Molecular Biology. Eds Neidhart F.C. Washington: ASM Press, 1996; 217-286.

57. Golby P., Kelly D.J., Guest J.R., Andrews S.C. Transcriptional regulation and organization of the dcuA and dcuB genes, encoding homologous anaerobic C4-dicarboxylate transporters in Escherichia coli. J Bacteriol. 1998; 180: 65866596.

58. Govantes F, Orjalo AV, Gunsalus RP: Interplay between three global regulatory proteins mediates oxygen regulation of the Escherichia coli cytochrome d oxidase (<cydAB) operon. MolMicrobio. 2000; 38:1061-1073.

59. Green J., Irvine A.S., Meng W., Guest J.R. FNR-DNA interactions at natural and semi-synthetic promoters. Mol. Microbiol. 1996; 19(1): 125-137.

60. Green J.M., Nichols B.P., Matthews R.G. 1996 In: Escherichia coli and Salmonella. Cellular and Molecular Biology. Eds Neidhart F.C. Washington: ASM Press, pp. 665-673.

61. Green J., Sharrocks A.D., Green В., Geisow M., Guest J.R. Properties of FNR proteins substituted at each of the five cysteine residues. Mol Microbiol. 1993; 8(l):61-68.

62. Gon S., Patte J.C., Mejean V., Iobbi-Nivol C. The torYZ (yecK-bisZ) operon encodes a third respiratory trimethylamine N-oxide reductase in Escherichia coli. J Bacteriol. 2000; 182: 5779-5786.

63. Grunden A.M., Ray R.M., Rosentel J.K., Healy F.G., Shanmugam K.T. Repression of the Escherichia coli modABCD (molybdate transport) operon by ModE. J Bacteriol. 1996; 178(3):735-44.

64. Hassan H.M., Sun H.C. Regulatory roles of Fnr, Fur, and Arc in expression of manganese-containing superoxide dismutase in Escherichia coli. Proc Natl Acad Sci USA. 1992; 89:3217-3221.

65. Huerta A.M., Salgado H., Thieffry D., Collado-Vides J. RegulonDB: a database on transcriptional regulation in Escherichia coli. Nucleic Acids Res. 1998; 26: 5559.

66. Iuchi S, Furlong D, Lin EC: Differentiation of arcA, arcB, and cpxA mutant phenotypes of Escherichia coli by sex pilus formation and enzyme regulation. J Bacteriol 1989, 171:2889-2893.

67. Iuchi S., Lin E.C. The narL gene product activates the nitrate reductase operon and represses the fumarate reductase and trimethylamine N-oxide reductase operons in Escherichia coli. Proc Natl Acad Sci USA. 1987; 84: 3901-3905.

68. Iuchi S., Lin E.C. arcA {dye), a global regulatory gene in Escherichia coli mediating repression of enzymes in aerobic pathways. Proc Natl Acad Sci USA. 1988; 85(6):1888-1892.

69. Jacob F., Monod J. Genetic regulatory mechanisms in the synthesis of proteins. JMB. 1961;3:318-356.

70. Jennings M.P., Beacham I.R. Co-dependent positive regulation of the ansB promoter of Escherichia coli by CRP and the FNR protein: a molecular analysis. Mol Microbiol. 1993; 9(1):155-164.

71. Jiang G.R., Nikolova S., Clark D.P. Regulation of the IdhA gene, encoding the fermentative lactate dehydrogenase of Escherichia coli. Microbiology. 2001; 147: 2437-2446.

72. Kaiser M., Sawers G. Overlapping promoters modulate Fnr- and ArcA-dependent anaerobic transcriptional activation of the focApfl operon in Escherichia coli. Microbiology. 1997; 143: 775-783.

73. Kaiser M., Sawers G. Fnr activates transcription from the P6 promoter of the pfl operon in vitro. Mol Microbiol. 1995; 18(2):331-342.

74. Kaiser M., Sawers G. Nitrate repression of the Escherichia coli pfl operon is mediated by the dual sensors NarQ and NarX and the dual regulators NarL and NarP. J Bacteriol. 1995; 177: 3647-3655.

75. Kalman L.V., Gunsalus R.P. Identification of a second gene involved in global regulation of fumarate reductase and other nitrate-controlled genes for anaerobic respiration in Escherichia coli. J Bacteriol. 1989; 171:3810-3816.

76. Kammler M., Schon C., Hantke K. Characterization of the ferrous iron uptake system of Escherichia coli. J Bacteriol. 1993; 175:6212-6219.

77. Kasimoglu E., Park S.J., Malek J., Tseng C.P., Gunsalus R.P. Transcriptional regulation of the proton-translocating ATPase (atpIBEFHAGDC) operon of Escherichia coli: control by cell growth rate. JBacteriol. 1996; 178:5563-5567.

78. Kisker C., Schindelin H., Rees D. C. Molybdenum-cofactor-containing enzymes: structure and mechanism. Annu. Rev. Biochem. 1997; 66: 233-267

79. Kolesnikow Т., Schroder I., Gunsalus R.P. Regulation of narK gene expression in Escherichia coli in response to anaerobiosis, nitrate, iron, and molybdenum. J Bacteriol 1992; 174(22):7104-7111.

80. Koonin E.V., Galperin M.Y. (2002) Sequence-Evolution-Function. Computational approaches in comparative genomics. Kluwer Academic Publishers, Boston/Dordrecht/London

81. Koonin E.V., Galperin M.Y. Prokaryotic genomes: the emerging paradigm of genome-based microbiology. Curr.Opin.Gen.Dev. 1997; 7: 757-763.

82. Koonin E.V., Mushegian A.R., Galperin M.Y., Walker D.R. Comparison of archaeal and bacterial genomes: computer analysis of protein sequences predicts novel functions and suggests a chimeric origin for the archaea. Mol Microbiol. 1997;25:619-637.

83. Kredich N.M. 1996 In: Escherichia coli and Salmonella. Cellular and Molecular Biology. Eds Neidhart F.C. Washington: ASM Press, pp. 514-527.

84. Kurnasov O., Polanuyer В., Ananta S., Sloutsky R., Tam A., Gerdes S., Osterman A. Ribosylnicotinamide kinase domain of NadR protein: identification and implications in NAD biosynthesis. J Bacteriol 2002; 184: 6906-6917.

85. Kyrpides N.C. Genomes OnLine Database (GOLD 1.0): a monitor of complete and ongoing genome projects world-wide. Bioinformatics. 1999; 15(9):773-784.

86. Laikova O.N., Mironov A.A., Gelfand M.S. Computational analysis of the transcriptional regulation of pentose utilization systems in the gamma subdivision ofProteobacteria. FEMSMicrobiol Lett. 2001; 205:315-322.

87. Lambden P.R., Guest J.R. Mutants of Escherichia coli K12 unable to use fiimarate as an anaerobic electron acceptor. J Gen Microbiol. 1976; 97(2): 145-60.

88. Lawrence J., Roth J. Selfish operons: horizontal transfer may drive the evolution of gene clusters. Genetics. 1996; 143: 1843-1860.

89. Li J., Kustu S., Stewart V. In vitro interaction of nitrate-responsive regulatory protein NarL with DNA target sequences in the fdnG, narG, narK and frdA operon control regions of Escherichia coli K-12. J Mol Biol. 1994; 241: 150-165.

90. Li J., Stewart V. Localization of upstream sequence elements required for nitrate and anaerobic induction of fdn (formate dehydrogenase-N) operon expression in Escherichia coli K-12. J Bacteriol. 1992; 174:4935-4942.

91. Li S.F., DeMoss J.A. Promoter region of the nar operon of Escherichia coli: nucleotide sequence and transcription initiation signals. J Bacteriol. 1987; 169(10):4614-4620.

92. Lin E.C.C. Amino acids as carbon sources. In Escherichia coli and Salmonella. Cellular and molecular biology. Volume 1. 2nd edition. Edited by Neidhardt F.C. Washington: ASM Press; 1996:358-379.

93. Liu X., De Wulf P. Probing the ArcA-P modulon of Escherichia coli by whole genome transcriptional analysis and sequence recognition profiling. J. Biol. Chem. 2004; 279:12588-12597.

94. Lobocka M., Hennig J., Wild J., Klopotowski T. Organization and expression of the Escherichia coli K-12 dad operon encoding the smaller subunit of D-amino acid dehydrogenase and the catabolic alanine racemase. J Bacteriol. 1994; 176:1500-1510.

95. Lombardo M.J., Lee A.A., Knox T.M., Miller C.G. Regulation of the Salmonella typhimurium pepT gene by cyclic AMP receptor protein (CRP) and FNR acting at a hybrid CRP-FNR site. J Bacteriol. 1997; 179:1909-1917.

96. Lynch A.S., Lin E.C. (1996) Biosynthesis of thiamin. In Escherichia coli and Salmonella. Cellular and molecular biology (ed. Neidhardt, F.C.), pp. 15261538. American Society for Microbiology, Washington, D.C.

97. Lynch A.S., Lin E.C. Transcriptional control mediated by the ArcA two-component response regulator protein of Escherichia coli: characterization of DNA binding at target promoters. J. Bacteriol. 1996; 178(21): 6238-6249.

98. Makarova K.S., Aravind L., Grishin N.V., Rogozin I.B., Koonin E.V. A DNA repair system specific for thermophilic Archaea and bacteria predicted by genomic context analysis. Nucleic Acids Res. 2002; 30:482-496.

99. Makarova K.S., Mironov A.A., Gelfand M.S. Conservation of the binding site for the arginine repressor in all bacterial lineages. Genome Biol. 2001; 2: RESEARCH0013.

100. Malpica R., Franco В., Rodriguez C., Kwon O., Georgellis D. Identification of a quinone-sensitive redox switch in the ArcB sensor kinase. Proc Natl Acad Sci U SA. 2004; 101(36): 13318-23.

101. Marcotte E.M., Pellegrini M., Thompson M.J., Yeates Т.О., Eisenberg D. A combined algorithm for genome-wide prediction of protein function. Nature. 1999; 402: 83-86.

102. McGuire A.M., De Wulf P., Church G.M., Lin E.C. A weight matrix for binding recognition by the redox-response regulator ArcA-Р of Escherichia coli. Mol Microbiol. 1999; 32(1):219-221.

103. McNicholas P.M., Chiang R.C., Gunsalus R.P. Anaerobic regulation of the Escherichia coli dmsABC operon requires the molybdate-responsive regulator ModE. Mol Microbiol. 1998; 27(1): 197-208.

104. McNicholas P.M., Rech S.A., Gunsalus R.P. Characterization of the ModE DNA-binding sites in the control regions of modABCD and moaABCDE of Escherichia coli. Mol Microbiol. 1997; 23(3):515-524.

105. Mejean V., Iobbi-Nivol C., Lepelletier M., Giordano G., Chippaux M., Pascal M.C. TMAO anaerobic respiration in Escherichia coli: involvement of the tor operon. Mol Microbiol. 1994; 11:1169-1179.

106. Melville S.B., Gunsalus R.P. Mutations in fnr that alter anaerobic regulation of electron transport-associated genes in Escherichia coli. J Biol Chem. 1990; 256:18733-18736.

107. Membrillo-Hernandez J., Lin E.C. Regulation of expression of the adhE gene, encoding ethanol oxidoreductase in Escherichia coli: transcription from a downstream promoter and regulation by fnr and RpoS. J Bacteriol. 1999; 181:7571-7579.

108. Mironov A.A., Koonin E.V., Roytberg M.A., Gelfand M.S. Computer analysis of transcription regulatory patterns in completely sequenced bacterial genomes. Nucleic Acids Res. 1999; 27:2981-2989.

109. Database, 2003 brings increased coverage and new features. Nucleic Acids Res. 2003;31:315-318.

110. Mushegian A.R., Koonin E.V. Gene order is not conserved in bacterial evolution. Trends Genet. 1996; 12: 289-300.

111. Neughard J., Kelln R.A. Biosynthesis and conversions of pyrimidines. In Escherichia coli and Salmonella. Cellular and molecular biology. Volume 1. 2nd edition. Edited by Neidhardt F.C. Washington: ASM Press; 1990:580-599.

112. Nielsen H., Engelbrecht J., Brunak S., von Heijne G. Identification of prokaryotic and eukaryotic signal peptides and prediction of their cleavage sites. Protein Eng. 1997; 10: 1-6.

113. Nielsen J., Jorgensen B.B., van Meyenburg K.V., Hansen F.G. The promoters of the atp operon of Escherichia coli K12. Mol Gen Genet. 1984; 193:64-71.

114. Ninnemann O., Koch C., Kallmann R. The E.coli fis promoter is subject to stringent control and autoregulation. EMBO J. 1992; 11:1075-1083.

115. Overbeek R., Fonstein M., D'Souza M., Pusch G., Maltsev N. The use of gene clusters to infer functional coupling. Proc Natl Acad Sci USA. 1999; 96; 28962901.

116. Overbeek R., Fonstein M., D'Souza M., Pusch G., Maltsev N. Use of contiguity on the chromosome to predict functional coupling. In Silico Biol. 1998

117. Panina E.M., Mironov A.A., Gelfand M.S. Comparative analysis of FUR regulons in gamma-proteobacteria. Nucleic Acids Res. 2001; 29: 5195-206.

118. Panina E.M., Vitreschak A.G., Mironov A.A., Gelfand M.S. Regulation of aromatic amino acid biosynthesis in gamma-proteobacteria. J Mol Microbiol Biotechnol. 2001; 3: 529-543.

119. Park S.J., Cotter P.A., Gunsalus R.P. Regulation of malate dehydrogenase (mdh) gene expression in Escherichia coli in response to oxygen, carbon, and heme availability. J Bacteriol. 1995; 177:6652-6656.

120. Park S.J., Gunsalus R.P. Oxygen, iron, carbon, and superoxide control of the fumarase fumA and fumC genes of Escherichia coli: role of the arcA, fnr, and soxR gene products. J Bacteriol. 1995; 177:6255-6262.

121. Park S.J., McCabe J., Turna J., Gunsalus R.P. Regulation of the citrate synthase {gitA) gene of Escherichia coli in response to anaerobiosis and carbon supply: role of the arcA gene product. J Bacteriol. 1994; 176:5086-5092.

122. Pearson W.R. Rapid and sensitive sequence comparison with FASTP and ¥ AST AMethods Enzymol. 1990; 183: 63-98.

123. Pellegrini M., Marcotte E.M., Thompson M.J., Eisenberg D., Yeates Т.О. Assigning protein functions by comparative genome analysis: protein phylogenetic profiles. Proc Natl Acad Sci USA. 1999; 96: 4285-4288.

124. Pellicer M.T., Fernandez C., Badia J., Aguilar J. Lin E.C., Baldom L. Cross-induction of glc and ace operons of Escherichia coli attributable to pathway intersection. Characterization of the glc promoter. J. Biol. Chem. 1999; 274 (3): 1745-1752.

125. Pellicer M.T., Lynch A.S., De Wulf P., Boyd D., Aguilar J., Lin E.C. A mutational study of the ArcA-P binding sequences in the aldA promoter of Escherichia coli. Mol. Gen. Genet. 1999; 261 (1): 170-176.

126. Penfound Т., Foster J.W. NAD-dependent DNA-binding activity of the bifimctional NadR regulator of Salmonella typhimurium. J Bacteriol. 1999; 181: 648-655.

127. Permina E.A., Mironov A.A., Gelfand M.S. Damage-repair error-prone polymerases of eubacteria: association with mobile genome elements. Gene. 2002; 293:133-140.

128. Plunkett G., Burland. V., Daniels D.L., Blattner F.R. Analysis of the Escherichia coli genome. III. DNA sequence of the region from 87.2 to 89.2 minutes. Nucleic Acid Res. 1993; 21: 3391-3398.

129. Plumbridge J.A., Cochet O., Souza J.M., Altamirano M.M., Calcagno M.L., Badet B. Coordinated regulation of amino sugar-synthesizing and -degrading enzymes in Escherichia coli K-12. J Bacteriol. 1993; 175:4951-4956.

130. Porco A., Alonso G., Isturiz T. The gluconate high affinity transport of GntI in Escherichia coli involves a multicomponent complex system. J Basic Microbiol. 1998; 38:395-404.

131. Postma P.W., Lengeler J.W., Jacobson G.R. Phosphoenolpyruvate: carbohydrate phosphotransferase systems. In Escherichia coli and Salmonella. Cellular and molecular biology. Edited by Neidhardt F.C. Washington: ASM Press; 1996:1149-1174.

132. Postma P.W., Lengeler J.W., Jacobson G.R. Phosphoenolpyruvate: carbohydrate phosphotransferase systems of bacteria. Microbiol Rev. 1993; 57:543-594.

133. Quail M.A., Haydon D.J., Guest J.R. The pdhR-aceEF-lpd operon of Escherichia coli expresses the pyruvate dehydrogenase complex. Mol Microbiol. 1994; 12(1):95-104.

134. Rabin R.S., Stewart V. Dual response regulators (NarL and NarP) interact with dual sensors (NarX and NarQ) to control nitrate- and nitrite-regulated gene expression in Escherichia coli K-12. J. Bacteriol. 1993; 175: 3259-3268.

135. Raivio T.L. Envelope stress responses and Gram-negative bacterial pathogenesis. Mol Microbiol. 2005; 56:1119-1128.

136. Rajagopalan K.V. 1996 In: Escherichia coli and Salmonella. Cellular and Molecular Biology. Eds Neidhart F.C. Washington: ASM Press, pp. 674-679.

137. Ramseier T.M., Saier M.H. Jr. cAMP-cAMP receptor protein complex: five binding sites in the control region of the Escherichia coli mannitol operon. Microbiology. 1995; 141 (Pt 8):1901-1907.

138. Richard D.J., Sawers G., Sargent F., McWalter L., Boxer D.H. Transcriptional regulation in response to oxygen and nitrate of the operons encoding the NiFe. hydrogenases 1 and 2 of Escherichia coli. Microbiology. 1999; 145: 2903-2912.

139. Riley M., Sanderson K.E. The bacterial chromosome. Am. Soc. Microbiol. 1990; 85-95.

140. Ritz D., Patel H., Doan В., Zheng M., Aslund F., Storz G., Beckwith J. Thioredoxin 2 is involved in the oxidative stress response in Escherichia coli. J BiolChem. 2000; 275(4):2505-2512.

141. Rodionov D.A., Mironov A.A., Gelfand M.S. Transcriptional regulation of pentose utilisation systems in the Bacillus/Clostridium group of bacteria. FEMS Microbiol Lett. 2001; 205:305-314.

142. Rodionov D.A., Mironov A.A., Rakhmaninova A.B., Gelfand M.S. Transcriptional regulation of transport and utilization systems for hexuronides, hexuronates and hexonates in gamma purple bacteria. Mol Microbiol. 2000; 38:673-683.

143. Ryu S., Ramseier T.M., Michotey V., Saier M.H., Garges S. Effect of the FruR regulator on transcription of the pts operon in Escherichia coli. J Biol Chem. 1995;270:2489-2496.

144. Saier M.H., Ramseier T.M., Reizer J. Regulation of carbon utilization. In Escherichia coli and Salmonella. Cellular and Molecular Biology. Volume 1. 2nd edition. Edited by Neidhart F.C. Washington: ASM Press. 1996; 1325-1333.

145. Salgado H., Moreno-Hagelsieb G., Smith T.F., Collado-Vides J. Operons in Escherichia coli: genomic analyses and predictions. Proc Natl Acad Sci USA. 2000; 97: 6652-7.

146. Salmon К., Hung S.P., Mekjian К., Baldi P., Hatfield G.W. Global gene expression profiling in Escherichia coli K12. The effects of oxygen availability and FNR. J Biol Chem. 2003; 278:29837-29855.

147. Self W.T., Grunden A.M., Hasona A., Shanmugam K.T. Molybdate transport. Res Microbiol. 2001; 152(3-4):311-321.

148. Schneider T.D., Stephens R.M. Sequence Logos: A New Way to Display Consensus Sequences, Nucleic Acids Research 1990; 18: 6097-6100.

149. Shalel-Levanon S., San K.Y., Bennett G.N. Effect of ArcA and FNR on the expression of genes related to the oxygen regulation and the glycolysis pathway in Escherichia coli under microaerobic growth conditions. Biotechnol Bioeng. 2005; 92:147-159.

150. Schlindwein C., Giordano G., Santini C.L, Mandrand M.A. Identification and expression of the Escherichia colifdhD and fdhE genes, which are involved in the formation of respiratory formate dehydrogenase. J Bacteriol 1990; 172:61126121.

151. Simon G., Mejean V., Jourlin C., Chippaux M., Pascal M.C. The torR gene of Escherichia coli encodes a response regulator protein involved in the expression of the trimethylamine N-oxide reductase genes. J Bacteriol. 1994; 176:56015606.

152. Spiro S., Guest J.R. Adaptive responses to oxygen limitation in Escherichia coli. Trends Biochem Sci. 1991; 16:310-314.

153. Spiro S., Guest J.R. Regulation and over-expression of the fiir gene of Escherichia coli. J Gen Microbiol. 1987; 133(12):3279-3288.

154. Spiro S., Roberts R.E., Guest J.R. FNR-dependent repression of the ndh gene of Escherichia coli and metal ion requirement for FNR-regulated gene expression. MolMicrobiol. 1989; 3(5):601-608.

155. Sprenger G.A., Schorken U., Sprenger G., Sahm H. Transaldolase В of Escherichia coli K-12: cloning of its gene, talB, and characterization of the enzyme from recombinant strains. J Bacteriol. 1995; 177:5930-5936.

156. Stewart V., Bledsoe P.J. Fnr-, NarP- and NarL-dependent regulation of transcription initiation from the Haemophilus influenzae Rd napF (Periplasmic Nitrate Reductase). J Bacteriol. 2005; 187:6928-6935.

157. Stewart V., Bledsoe P.J., Williams S.B. Dual overlapping promoters control napF (periplasmic nitrate reductase) operon expression in Escherichia coli K-12. J Bacteriol. 2003; 185:5862-5870.

158. Stewart V., Rabin R.S. In: Two-component signal transduction. Eds Hoch J.A.and Silhavy T.J. Washington: ASM Press. 1995: 233-252.

159. Stiefel, E. I. In Molybdenum Cofactors and Model Systems (eds Stiefel, E. I., Coucouvanis, D. & Newton, N. W.) 1-19 (Am. Chem. Soc., Washington DC, 1993)

160. Studholme D.J., Pau R.N. A DNA element recognised by the molybdenum-responsive transcription factor ModE is conserved in Proteobacteria, green sulphur bacteria and Archaea. BMC Microbiol. 2003 2; 3:24.

161. Sutton V.R., Mettert E.L., Beinert H., Kiley P.J. Kinetic analysis of the oxidative conversion of the 4Fe-4S.2+ cluster of FNR to a [2Fe-2S]2+ cluster. J Bacteriol. 2004; 186:8018-8025.

162. Takahashi K., Hattori Т., Nakanishi Т., Nohno Т., Fujita N., Ishihama A., Taniguchi S. "Repression of in vitro transcription of the Escherichia colijhr and narXgenes by FNR protein. FEBSLett 1994; 340(1-2): 59-64.

163. Tatusov R.L., Koonin E.V., Lipman D.J. A genomic perspective on protein families. Science. 1997; 278: 631-637.

164. Thompson J.D., Gibson T.J., Plewniak F., Jeanmougin F., Higgins D.G. The CLUSTAL X windows interface: flexible strategies for multiple sequence alignment aided by quality analysis tools. Nucleic Acids Res. 1997; 25: 48764882.

165. Tokuda H., Nakamura Т., Unemoto T. Potassium ion is required for the generation of pH-dependent membrane potential and delta pH by the marine bacterium Vibrio alginolyticus. Biochemistry. 1981; 20: 4198-4203.

166. Toro-Roman A., Mack T.R., Stock A.M. Structural analysis and solution studies of the activated regulatory domain of the response regulator ArcA: a symmetric dimer mediated by the alpha4-beta5-alpha5 face. J. Mol. Biol. 2005; 349: 11-26.

167. Tseng C.P., Yu C.C., Lin H.H., Chang C.Y., Kuo J.T. Oxygen- and growth rate-dependent regulation of Escherichia coli fumarase (FumA, FumB, and FumC) activity. J Bacteriol. 2001; 183: 461-467.

168. Tusnady G.E., Simon I. Principles governing amino acid composition of integral membrane proteins: application to topology prediction. J Mol Biol. 1998; 283: 489-506.

169. Tyson K.L, Bell A.I., Cole J.A., Busby S.J. Definition of nitrite and nitrate response elements at the anaerobically inducible Escherichia coli nirB promoter: interactions between FNR and NarL. Mol Microbiol. 1993, 7:151-157.

170. Wallace В., Yang Y.J., Hong J.S., Lum D. Cloning and sequencing of a gene encoding a glutamate and aspartate carrier of Escherichia coli K-12. J Bacteriol. 1990; 172:3214-3220.

171. Wang H., Gunsalus R.P. The nrfA and nirB nitrite reductase operons in Escherichia coli are expressed differently in response to nitrate than to nitrite. J Bacteriol. 2000; 182: 5813-5822.

172. Wang H., Gunsalus R.P. Coordinate regulation of the Escherichia coli formate dehydrogenase fdnGHI and fdhF genes in response to nitrate, nitrite, and formate: roles for NarL and NarP. J Bacteriol. 2003; 185: 5076-5085.

173. Watanabe H., Mori H., Itoh Т., Gojobori T. Genome plasticity as a paradigm of eubacteria evolution. J.Mol.Evol. 1997; 44: S57-S64.

174. Wolf Y.I., Rogozin I.B., Kondrashov A.S., Koonin E.V. Genome alignment, evolution of prokaryotic genome organization, and prediction of gene function using genomic context. Genome Res. 2001; 11:356-372.

175. Wood J.M. Membrane association of proline dehydrogenase in Escherichia coli is redox dependent. Proc Natl Acad Sci USA. 1987; 84(2):373-377.

176. Wu C.H., Yeh L.S., Huang H., Arminski L., Castro-Alvear J., Chen Y., Hu Z., Kourtesis P., Ledley R.S., Suzek B.E., Vinayaka C.R., Zhang J., Barker W.C. The Protein Information Resource. Nucleic Acids Res. 2003; 31: 345-347.

177. Xu J., Johnson R.C. aldB, an RpoS-dependent gene in Escherichia coli encoding an aldehyde dehydrogenase that is repressed by Fis and activated by Crp. J Bacteriol. 1995; 177:3166-3175.

178. Yanai I., Derti A., DeLisi C. Genes linked by fusion events are generally of the same functional category: a systematic analysis of 30 microbial genomes. Proc Natl Acad Sci USA. 2001; 98: 7940-7945.

179. Yang H., Liu M.Y., Romeo T. Coordinate genetic regulation of glycogen catabolism and biosynthesis in Escherichia coli via the CsrA gene product. J Bacteriol. 1996; 178:1012-1017.

180. Zientz E., Janausch I.G., Six S., Unden G. Functioning of DcuC as the C4-dicarboxylate carrier during glucose fermentation by Escherichia coli. J Bacteriol. 1999; 181:3716-3720.

181. Равчеев Д.А., Гельфанд M.C., Миронов A.A, Рахманинова А.Б. Пуриновый регулон гамма-протеобактерий. Детальное описание. Генетика. 2002; 38: 1203-1214.