Бесплатный автореферат и диссертация по биологии на тему
Структурообразующие мотивы в геномах прокариот
ВАК РФ 03.01.03, Молекулярная биология

Автореферат диссертации по теме "Структурообразующие мотивы в геномах прокариот"

005047838

На правах рукописи

Киселев Сергей Сергеевич

СТРУКТУРООБРАЗУЮЩИЕ МОТИВЫ В ГЕНОМАХ ПРОКАРИОТ: ЗАКОНОМЕРНОСТИ РАСПРЕДЕЛЕНИЯ И ФУКЦИОНАЛЬНОЕ ЗНАЧЕНИЕ

03.01.03 - молекулярная биология

Автореферат диссертации на соискание учёной степени кандидата биологических наук

2 О ЛЕН 2012

Пущино 2012

005047838

Работа выполнена в Федеральном государственном бюджетном учреждении науки Институте биофизики клетки Российской академии наук и Путинском государственном естественно-научном институте

Научные руководители:

Официальные оппоненты:

Железная Людмила Алексеевна - доктор биологических наук, Федеральное государственное бюджетное учреждение науки Институт теоретической и экспериментальной биофизики РАН, главный научный сотрудник лаборатории кристаллофизики и рентгеноструктурных исследований с использованием синхротронного излучения.

Спвожелезов Виктор Семёнович - доктор биологических наук, Федеральное государственное бюджетное учреждение науки Институт биофизики клетки РАН, ведущий научный сотрудник лаборатории молекулярной физиологии клетки.

Ведущая организация: Федеральное государственное бюджетное учреждение пауки Институт общей генетики им. Н.И. Вавилова РАН

Защита диссертации состоится «20» декабря 2012 г. в 15 ч. 30 мин. на заседании диссертационного совета Д 002.038.01 при Федеральном государственном бюджетном учреждении науки Институте биофизики клетки Российской академии наук по адресу: 142290, г. Пущино, ул. Институтская, д. 3.

С диссертацией можно ознакомиться в Центральной библиотеке НЦБИ РАН по адресу: 142290, г. Пущино, ул. Институтская, 3.

Автореферат разослан «¿0» ноября 2012 г.

доктор биологических наук, профессор Озолинь Ольга Николаевна доктор физико-математических наук Комаров Владислав Михайлович

Учёный секретарь диссертацио[

кандидат биологических наук

Актуальность проблемы. Наиболее быстро развивающимися областями биологии в настоящее время являются геномика и молекулярная биология. На сегодняшний день полностью расшифровано более 1200 геномов прокариот, что предоставляет возможность квалифицированного поиска в них разных функциональных элементов и сравнительного анализа их распространённости в геномах микроорганизмов различных таксономических групп. Кроме генов, кодирующих белки и нетранслируемые РНК, в состав геномов входят элементы, выполняющие разнообразные, не всегда известные функции. Наиболее изученными из них являются промоторы, сайты связывания регуляторных белков и мобильные генетические элементы. К наименее исследованным, по-видимому, следует отнести недавно обнаруженные «промоторные островки», имеющие высокую плотность перекрывающихся промоторов [ЭЬаукипоу е/ а/., 2009], а также многочисленные повторяющиеся элементы, в том числе мононуклеотидные треки. Принято считать, что большая часть повторов появилась в результате генетических перестроек и дупликаций, т.е. их совокупность в некоторой степени отражает эволюционный путь конкретного биологического вида. Механизм накопления протяжённых мононуклеотидных треков менее понятен, зато установлено, что ро1у(с1А)п- и ро1у(сИ)п-треки формируют анизотропные изгибы двойной спирали ДНК и, следовательно, являются структурообразующими элементами, важными для пространственной компактизации и адаптивной изомеризации генома. Это указывает на неслучайный характер распределения таких треков в природных ДНК, но целенаправленному исследованию их распределения в геномах посвящено относительно небольшое число работ, выполненных с использованием ограниченного числа природных ДНК.

Целью данной работы был анализ распространения мононуклеотидных повторов (ро1у(с!А)„, ро1у((1Т)„, ро1у(сЮ)„, ро1у(с1С)п) в репрезентативной выборке полностью расшифрованных геномов прокариот и оценка их эвристической ценности для поиска регуляторных участков.

Основные задачи:

1. Анализ распространения мононуклеотидных ро1у(с1А)п-, ро!у(с!Т)п-, ро1у((Ю)п- и ро1у(<1С)п-треков в геномах прокариот с разным АТ/ОС-составом.

2. Сравнительный анализ встречаемости мононуклеотидных и смешанных ро!у(с1\\0п- и ро1у(с18)п-треков (\У=А=Т, 5=0=С) в умеренно СС-богатых геномах прокариот.

3. Анализ распределения мононуклеотидных и смешанных треков в кодирующих и некодирующих участках прокариотических геномов.

4. Оценка предсказательного потенциала алгоритма поиска промоторов РЫРготи, учитывающего наличие мононуклеотидных и смешанных А/Т-треков, но игнорирующего консервативные элементы, узнаваемые ст-субъединицами РНК-полимеразы.

5. Анализ распространённости и биологической роли «промоторных островков», имеющих высокую плотность потенциальных промоторов.

Научная новизна. Обнаружена общая тенденция преимущественного присутствия мононуклеотидных ро1у(с1А)п/ро1у((1Т)п-треков по сравнению с

ро1у(сЮ)п/ро1у(с1С)п-треками, которое наблюдается не только в хромосомах с GC-составом менее 50%, но и в большинстве хромосом с высоким содержанием G/C-пар. Установлено, что межгенные участки бактериальных хромосом обогащены мононуклеотидными ро!у(с1А)п/ро1у(с1Т)п-треками и смешанными W-треками, которые, следовательно, можно использовать в качестве дополнительного признака для поиска регуляторных участков в геномах. Разработан новый метод оценки фоновых значений при поиске сигнальных элементов в нуклеотидных последовательностях, который не требует предварительной их аннотации и может быть использован для любых геномов. Впервые установлена высокая чувствительность унифицированной версии алгоритма поиска промоторов PlatPromU, которая позволяет осуществлять поиск промоторов в неохарактеризованных нуклеотидных последовательностях. Впервые установлено, что с «промоторных островков», имеющих высокую плотность потенциальных промоторов и низкую способность инициировать продуктивный синтез РНК, идёт синтез коротких олигонуклеотидов. Впервые установлено, что «промоторные островки» ассоциированы с горизонтально перенесёнными генами, а в их первичной структуре обнаружено высокое содержание структурообразующих мононуклеотидных А/Т-треков, появление которых может быть результатом эволюции, направленной на адаптацию чужеродного генетического материала к регуляторным сетям нового хозяина.

Апробация работы. Материалы диссертации были представлены на 13, 14 и 15 международных школах-конференциях молодых учёных «Биология -наука XXI века» (Пущино, 2009-2011), 3 и 4 международных конференциях «Математическая биология и биоинформатика» (Пущино, 2010, 2012), международной московской конференции по вычислительной молекулярной биологии (Москва, 2011), 2 международной конференции «Моделирование нелинейных процессов и систем» (Москва, 2011) и на 8 международной конференции по биоинформатике регуляции и структуры геномов и системной биологии (Новосибирск, 2012).

Публикации. По материалам диссертации опубликовано 3 статьи в рецензируемых журналах, 3 статьи в научных сборниках и 7 тезисов.

Объём и структура диссертации. Диссертация состоит из введения, обзора литературы, методической части, изложения полученных результатов и их обсуждения, заключения, выводов, списка публикаций автора и списка цитируемой литературы, включающего Jисточников. Работа изложена на страницах машинописного текста и содержит bt,, рисунков и // таблиц.

МАТЕРИАЛЫ И МЕТОДЫ Поиск мононуклеотидных и смешанных треков. Для анализа были использованы нуклеотидные последовательности 411 прокариотических геномов, взятые из базы данных GenBank (ftp://ftp.ncbi.nih.gov/genomes/Bacteria/). Для поиска треков использовали программу DNA Tool, любезно предоставленную A.A. Деевым (ИТЭБ РАН). При количественном анализе учитывались треки длиной от 5 нуклеотидов и выше.

Число мононуклеотидных А/Т- и G/C-треков в конкретной хромосомной

ДНК сравнивали с количеством таких же треков в случайной нуклеотидной последовательности, имеющей AT/GC-состав и длину, аналогичные природной ДНК. В качестве критерия отличия использовали параметр

Rj = l>,° /v', где:

L>° - наблюдаемое число мононуклеотидных треков в /'-ой хромосоме,

и'- ожидаемое число таких же треков в случайной последовательности,

аналогичной по своему AT/GC-составу и длине /-ой хромосоме.

Значения и' определяли отдельно для каждого из четырёх видов повторов по формуле, предложенной де Вахтером [de Wächter, 1981]:

= р;(1-р,.)х[<Х-"-!)(1-р,) + 2],где: г, „ - ожидаемое число треков из п нуклеотидов в последовательности длиной L, р1 - частота встречаемости каждого основания в последовательности.

Для сопоставления распределения мононуклеотидных треков и смешанных W- и S-треков было выбрано 57 геномов прокариот, содержащих от 50% до 60% G/C-nap. Кроме степени преобладания W- и S-треков в разных геномах были исследованы особенности их распределения в кодирующих участках генов и межгенных пространствах. Для разбиения генома на кодирующие и некодирующие участки использовали компьютерную программу DNA Tool.

Статистическую достоверность отклонений в числе найденных треков от ожидаемых значений оценивали методом, предложенным Шакла и Сривастава [Shukla, Srivastava, 1985].

Для поиска промоторов в разных геномах были использованы специализированные и унифицированная версии алгоритма PlatProm, который изначально был адаптирован для узнавания а70-зависимых промоторов Е. coli [Brok-Volchanski et al., 2006; Ozoline, Deev, 2006]. Для оценки соответствия геномных последовательностей консервативным элементам в участках-35, -10 и вблизи стартовой точки транскрипции он использует позиционные весовые матрицы, которые отражают контекст нуклеотидных последовательностей, узнаваемых а70 Е. coli. Для создания специализированных версий программы эти матрицы в автоматическом режиме были перенастроены на а-специфические модули других промоторов. Для этого были использованы обучающие наборы промоторов, взятых из оригинальных статей или из указанных в Табл. 1 компиляций. В унифицированном режиме у алгоритма были отключены позиционные весовые матрицы и для поиска промоторов использовали только каскадные позиционные матрицы, большинство из которых учитывает особые конформационные свойства промоторной ДНК, а также модули, способствующие переходу транскрипционного комплекса к продуктивной инициации. Качество специализированных версий PlatPromA, PlatPromB и PlatPromS оценивали с использованием тестовых компиляций, не перекрывающихся с обучающими наборами. В остальных случаях число известных промоторов было ограничено, поэтому применяли стратегию сменных мишеней (каждый промотор по очереди был тестовым, а остальные входили в обучающий набор). Сквозное сканирование генома, необходимое для определения фонового значения, осуществляли специализированными версиями программы, созданными на основе всех известных промоторов.

Таблица 1

Геномы, использованные для поиска промоторов разными версиями PlatProm

Штамм Алгоритм GC- состав, % Размер генома, н.п. Источник для точек старта

Escherichia coli К12 MG1655 (а54) PlatProm-s54 50,8 4639675 ReguIonDB

Agrobacterium tumefaciens str. C58 (кольцевая хромосома) PlatPromA 59,4 2841580 Wilms et al., 2012

Agrobacterium tumefaciens str. C58 (линейная хромосома) 59,3 2075577

Bacillus subtilis subsp. subtilis str. 168 PlatPromB 43,5 4215606 DBTBSи BsubCyc

Corynebacterium glutamicum ATCC 13032 PlatPromC 53,8 3309401 Эта работа

Helicobacter pylori 26695 PlatPromH 38,9 1667867 Sharma et al., 2010

Pseudomonas syringae pv. tomato str. DC3000 PlatPromP 58,4 6397126 Filiatrault et al., 2010

Salmonella enterica subsp. enterica str. LT2 PlatPromS 51,8 4857432 Эта работа

Streptomyces coelicolor A3(2) PlatPromSc 72,1 8667507 Vockenhuber et al., 2011

Предсказательный потенциал разных версий PlatProm оценивали как процент идентифицированных промоторов на разных уровнях достоверности ('чувствительность). Значимыми считали показатели промотор-подобия, превышающие фоновое значение на 3, 4 и 5 StD (для Е. coli р<0,0014, р<0,00004 и р<0,0000005, соответственно). Промотор считали узнанным, если предсказанная точка инициации транскрипции находилась в диапазоне ±5 н.п. от экспериментально картированного старта. Специфичность PlatProm-s и PlatPromU (процент ошибочно принятых за промотор непромоторных фрагментов генома Е. coli) оценивали с использованием непромоторной компиляции CS1, содержащей 273 нуклеотидных последовательности [Shavkunov et al., 2009].

Генерацию случайных нуклеотидных последовательностей заданного состава и длины осуществляли при помощи ресурса FaBox 1.40 [Villesen, 2007].

Критерии для выявления «промоторных островков». Согласно предложенным в работе [Shavkunov et al., 2009] критериям, «промоторными островками», выявляемыми специфическими версиями алгоритма PlatProm, считали участки генома протяжённостью от 300 н.п. и более, имеющие, как минимум, 8 потенциальных точек старта на любой нити ДНК в скользящем окне длиной 100 н.п. Потенциальными точками старта считали такие, показатель промотор-подобия которых превышал фоновый уровень на 4 StD. При поиске «островков», выявляемых PlatPromU («смешанных промоторных островков») использовали аналогичные значения длины скользящего окна и количества находящихся в нём потенциальных точек старта, но пороговой

длиной считали минимальную длину «смешанного промоторного островка», перекрывающегося с «островком», выявляемым специфическим алгоритмом.

Транскрипционную активность «промоторных островков» оценивали с использованием данных прямого секвенирования кДНК [Dornenburg et al., 2010]. Зарегистрированные в этой работе фрагменты РНК (образцы) соотносили с геномной картой Е. coli с помощью компьютерной программы RNAMatcher, разработанной В.В. Панюковым (ИМПБ РАН). Эта программа определяет число одинаковых образцов и находит соответствующие им участки генома. Для оценки эффективности продуктивного синтеза были использованы образцы, полностью соответствующие геномной ДНК. В том случае, если они имели несколько соответствий в геноме, их число делилось на число совпадающих сайтов и полученное количество приписывалось каждому их них. Для оценки эффективности абортивного синтеза определяли количество коротких РНК длиной 10-11 нуклеотидов. Их находили среди образцов, соответствующих РНК, имеющих на З'-конце маркерный адаптер GATCGTGACTG.

Степень ассоциации «смешанных промоторных островков» с чужеродными генамн оценивали с использованием двух наборов генов, появившихся в геноме Е. coli в результате горизонтального переноса, согласно Lawrence, Ochman [1998] и Nakamura et al. [2004], а также по перекрыванию с «островками патогенности», выявленными алгоритмом IslandViewer [Langille, Brinkman, 2009] и нашим алгоритмом GIST (с учётом и без).

Взаимодействие «промоторных островков» с белком H-NS определяли с использованием данных, полученных в опытах по иммунопреципитации ДНК-белковых комплексов антителами к H-NS [Grainger et al., 2006; Oshima et al., 2006; Kahramanoglou et al., 2011].

РЕЗУЛЬТАТЫ И ИХ ОБСУЖДЕНИЕ 1. Анализ распространения мононуклеотндных poly(dA)„-, poly(dT)„-, poly(dG)„- и poIy(dC)„-TpeKOB в геномах прокариот с различным нуклеотидным составом.

Для исследования было выбрано 342 бактериальные и 69 архейных хромосом с GC-составом, варьирующим в диапазоне от 16,5% до 74,9%. Учитывали наличие в них треков длиной от 5 нуклеотидов и выше, т.к. они обладают явно выраженными структурообразующими свойствами, что повышает вероятность их участия в различных биологических процессах.

На Рис. 1 пунктирными линиями показаны ожидаемые зависимости частот встречаемости мононуклеотндных треков от их длины в случайных нуклеотидных последовательностях конкретного размера и GC-состава. В последовательностях с GC-составом <50% ро ly (d А)п/ро 1у (с1Т)п-тре ки должны преобладать над ро1у(сЮ)п/ро1у(с1С)п-треками (Рис. 1а), а для геномов с GC-составом >50% ожидается обратная зависимость (Рис. 16, в). В АТ-богатом геноме В. subtilis (Рис. 1а), так же как и во всех хромосомах с GC-составом <50% poIy(dA)n- и poly(dT)n-треков действительно оказалось больше, чем poly(dG)n- и poly(dC)n-TpeKOB, а в 108 хромосомах с GC-составом >50% было больше poly(dG)n/poly(dC)n-TpeKOB, как, например, у Т. thermophilus (Рис. 16). Но для 81 эубактериальной и 9

архейных хромосом с ОС-составом >50% было обнаружено явное преобладание ро1у(с1А)п- и ро1у(сГГ)п-повторов, а не ро1у(сЮ)„- и ро1у(с!С)п-треков (Рис. 1в). Таким образом, большинство исследованных геномов (74%) характеризуются повышенным содержанием ро1у(с1А)п- и ро1у(<1Т)п-треков. Во многих остальных случаях частоты встречаемости этих треков также были выше ожидаемых (Рис. 16). Поэтому была осуществлена строгая статистическая оценка этого преобладания.

Длина трека, н.п.

Длина трека, н.л.

Длина трека, н.п.

Рис. 1. Распределение мононуклеотидных А/Т- и О/С-треков в бактериальных геномах (сплошные линии) и случайных нуклеотидных последовательностях (пунктирные линии) с аналогичным ОС-составом и дайной. А/Т-треки обозначены синим цветом, О/С-треки — лиловым цветом, а) В. зиЫШз эиЬзр. эЦ. 168 (ОС-состав 43,5%); б) Т. 1кегторкИш

НВ27 (ОС-состав 69,4%); в) I. Ьощкопет^ НЬНК9 (ОС-состав — 62,4%).

В качестве критерия отличия частот встречаемости гомонуклеотидных треков в геномных ДНК от случайных нуклеотидных последовательностей использовали величину Я-, отражающую отклонение числа конкретных треков в геномных ДНК от их количества в случайных нуклеотидных последовательностях. На Рис. 2 показаны профили распределения Я. Видно, что для абсолютного большинства геномов Я(а+т) больше 1 (382 хромосомы, т.е. 93%), а %нс), наоборот, меньше 1 (294 хромосомы, т.е. 72%). Причём с 95% достоверностью число ро1у(с1А)п/ро1у(с1Т)п-треков превышает ожидаемые значения в 93% прокариотических геномов.

Обе гистограммы выявляют наличие максимумов в профилях распределения Я. Их расположение свидетельствует о том, что число ро1у(с!А)п/ро1у(сГГ)п-треков в исследованных геномных ДНК чаще всего в 2 раза выше их числа в случайных последовательностях, а ро!у(сЮ)п/ро1у(с1С)„-треки, наоборот, встречаются в два раза реже.

Рис. 2. Гистограмма распределения 411 хромосомных ДНК по коэффициентам 1*(а+т) (синяя кривая) и 11(00 (лиловая кривая). Для построения графика использованы интервалы разбиения ЛЯ=0,2. Пунктирная красная линия соответствует Я = 1

Таким образом, масштабный анализ распространённости мононуклеотидных треков выявил повышенную частоту встречаемости А/Т-треков в абсолютном большинстве геномов, что указывает на эволюционное избегание протяженных ро!у(сЮ)п/ро1у(с1С)п-треков и особую биологическую роль ро1у(с!А)п/ро1у(сГГ)п-треков.

2. Сравнительный анализ встречаемости мононуклеотидных и смешанных ■\У- и 8-треков.

Одной из наиболее вероятных биологических функций ро1у(с1А)п/ро1у(<1Т)п-треков является структурообразующая, т.к. при п>4 они способны формировать анизотропные изгибы в двойной спирали, которые важны для комплексообразования ДНК с различными белками [КогоЬау-АугаЬат е? а!., 2006], а также для компактизации нуклеоида. Но в таком случае наблюдаемая для мононуклеотидных треков асимметрия должна либо сглаживаться, либо совсем исчезать для смешанных \V-TpeKOB (\У=А=Т).

Для проверки данного предположения было выбрано 57 геномов прокариот, содержащих от 50% до 60% О/С-пар, т.е. такие хромосомы, в которых повышенная частота встречаемости А/Т-треков не является тривиальной.

18 16

0 и

1 12

5 ю

к к

Рис. 3. Гистограммы распределения умеренно СС-богатых геномов по И для мононуклеотидных (а) и смешанных (б) треков. Пунктирная красная линия соответствует К = 1.

На Рис. За показано распределение выбранных геномов по частоте встречаемости в них мононуклеотидных треков. Несмотря на повышенное содержание в этих геномах О/С-пар, оно отражает ту же закономерность, которая была выявлена для предыдущей выборки (Рис. 2а). Но для смешанных треков никакой асимметрии обнаружено не было (Рис. 36). Это значит, что эволюционному отбору, по-видимому, подвержены именно мононуклеотидные ро!у(с1А)п- и ро1у(с1Т)„-треки, которые имеют целый ряд специфических физико-химических свойств, а не смешанные XV-треки.

Однако набор смешанных \V-TpeKOB, обнаруженных в каждом конкретном геноме, включает и мононуклеотидные ро!у(с1А)п/ро1у(с1Т)п-треки, поэтому полное отсутствие асимметрии в распределении и Э-треков (Рис. 36) было не совсем ожидаемым. Поскольку общепризнанным является представление о том, что регуляторные участки геномов обогащены А/Т-парами [Уа§П е? а!., 2006], было высказано предположение, что асимметрия для \У-треков имеет место только в межгенных участках и маскируется при усреднении на геном. Поэтому на следующем этапе нами было исследовано распределение

мононуклеотидных poly(dA)n/poly(dT)n-TpeKOB, а также W- и S-треков отдельно в межгенных и кодирующих последовательностях.

3. Анализ распределения мононуклеотидных треков в кодирующих и некодирующих участках бактериальных геномов.

В качестве оценочного параметра в этом случае использовали модифицированную величину R*, для вычисления которой ожидаемое число треков рассчитывали по приведенной выше формуле, но р, равнялось частоте встречаемости W или S (либо А, Т, G и С) в генах или в межгенных участках, а L - суммарной длине кодирующих или некодирующих последовательностей генома. Несмотря на то, что такой подход не является абсолютно строгим (ожидаемое число треков рассчитывается по непрерывной последовательности, а наблюдаемое — по фрагментам генома), он, тем не менее, предоставляет возможность оценить характер доминирования исследуемых треков и степень отклонения наблюдаемых частот встречаемости от ожидаемой величины. Важно также иметь в виду, что нуклеотидный состав межгенных участков и генов обычно отличается от среднего по геному. Поэтому при нормировке на нуклеотидный состав конкретных участков отклонение в содержание А/Т-треков или G/C-треков может проявляться сильнее или слабее, чем при нормировке на геном. В связи с этим мы использовали 2 типа нормировки: на ожидаемое число треков в конкретных последовательностях и на геном.

Вне зависимости от способа нормировки в межгенных участках число мононуклеотидных poly(dA)n/poly(dT)n-TpeKOB оказалось существенно больше ожидаемого (при нормировке на геном среднее значение R*(a+t) = 6,47) (Рис. 4а), в то время как обнаруженное число poly(dG)n/poly(dC)n-TpeKOB было ниже ожидаемых значений (при нормировке на геном среднее значение R*(cnc) = 0,67) (Рис. 4а). Но частота встречаемости poly(dA)n/poly(dT)n-TpeKOB в кодирующих последовательностях тоже отличалась от ожидаемой величины, хотя и в меньшей степени (при нормировке на геном среднее значение R*(a+t) составило 2,45) (Рис. 46). Поэтому данные, представленные на Рис. За, отражают не только явную обогащённость межгенных участков poly(dA)n/poly(dT)n-TpeKaMH, но и общую тенденцию к их формированию в умеренно GC-богатых геномах.

Число мононуклеотидных poly(dG)„/poly(dC)„-TpeKOB в межгенных участках мало отличалось от ожидаемых значений (Рис. 4а), но в генах (Рис. 46) неожиданно оказалось существенно меньше, чем в среднем по геному (Рис. За). Вполне возможно, что в основе этого избегания лежит повышенный структурный полиморфизм водородного связывания уотсон-криковских G/C-пар по сравнению с А/Т-парами [Komarov et al., 1992; Комаров, 1998; Kabanov, Ко maro v, 2002]. Эволюционное удаление мононуклеотидных G/C-треков, следовательно, должно способствовать структурной гомогенности ДНК. Другим неблагоприятным свойством мононуклеотидных G/C-треков может быть способность формировать стабильные G-квадруплексы, которые способны существенно нарушать трёхмерную структуру ДНК.

Среднее значение параметра R* для смешанных W- и S-треков в генах (Рис. 5а) практически не отличалось от среднего по геномам (Рис. 36), а

межгенные участки были обогащены \¥-треками (Рис. 56), что особенно явно проявлялось при нормировке на геном.

ЗС1 а) Межгенные области

20 ■

||

п п п

^ £ й5> £ £ 1? ^ и? , <э <о .<з <э <о <о Ъ <о ^ ъг у у у /•//

6»С б) Гены

1 Т

I 1Шп ,1д,Я II

& С? ^ „9 ^ А Ь? #

</ о? «У ^ тГ чГ г® & У ь? (Г </ ъ* <ь?

Рис. 4. Гистограммы распределения геномов по 11*(а+т) и Я*(с+о в межгенных участках и кодирующих последовательностях. Пунктирная красная линия соответствует К = 1.

Таким образом, проведённый анализ выявил преимущественное присутствие мононуклеотидных ро1у(с!А)п- и ро1у(с1Т)п-треков, а также смешанных \У-треков в межгенных областях бактериальных геномов. Следовательно, их наличие можно использовать в качестве дополнительного дискриминационного признака регуляторных участков геномов, важнейшим функциональным элементом которых являются промоторы.

30 а) Гены

20 \л/ ■ в а

10 п п_ М 4

Й oJ 1. П : II

с; 30 о £

Т 20

в

и

6) Межгенные области

я® а® ^ „^ л? ¿> я? .а? а?

</ </ о? о* ^ у у тз- v- 1? ч? ч?-

я*

Рис. 5. Гистограммы распределения геномов по 11*\у и Н*8 в межгенных участках (а) и кодирующих последовательностях (б) Пунктирной красной линией обозначен К = 1.

На Рис. 6 показан характер распределения ро1у(сГГ)4-треков в промоторах, узнаваемых а70. Видно, что они обычно находятся в позициях, фазированных с шагом спирали. Т.к. ро1у(сГГ)4-треки изгибают двойную спираль ДНК, это указывает на предпочтительную конфигурацию промоторной ДНК. Наличие и расположение этих треков учитывается каскадными матрицами алгоритма поиска промоторов РЫРгот (Рис. 7).

-20Q

Позиция 5'-конца ТТЛ относительно старта транскрипции

Рис. 6. Распределение poly(dT)4 в тестовом наборе, содержащем 290 промоторов, узнаваемых РНК-полимёразой Е. coli и не использованных для «обучения» алгоритма PlatProm. Проведена процедура сглаживания но трём соседним позициям.

Число ро1у(с1А)4-треков на этой же нити ДНК меньше и они обычно находятся в области контакта с а-субъединицами РНК-полимеразы и в прилегающей области (Рис. 7). Очень большой вклад в результативность программы вносят -треки, расположенные с регулярностью 1 и 1,5 витка спирали. Чтобы избежать двойного вклада мононуклеотидных треков (как (А/Т),, и как (Щв), алгоритм учитывает именно эту регулярность, оценивая наличие парных триплетов \улу\¥(п)7,8'у\'\\'\\' и \¥\у\у(п)1з>14\уут (Рис. 7).

Инвертированные повторы ■ Прямые повторы п ш и WWW(n)13 14www www(n}7 swww Доминирующие мотивы Гибкие звенья н ; ,

Wn^n

(Tin

Wn

Динуклеотиды

Консенсусные элементы -10 и -35

I I II в • | ■

tl It а ■ ■ ■ t

н мши 1 I иная « aai

It t <ii Ii на I

I 7.6% I 26,6%

I 2,4% I 13.1% 1 2,4% I 5,9%

29.3%

•240

-200 -160 -120 -80 -40 0 40 80

Позиция относительно стартовой точки транскрипции (0)

Рис. 7. Схема, отражающая распределение всех элементов, учитываемых алгоритмом Р1а1:Ргот, относительно стартовой точки транскрипции (позиция 0). Справа указано снижение чувствительности алгоритма при отключении соответствующих модулей, оценённое как суммарное уменьшение процента узнаваемых промоторов на двух уровнях (на 4 и 38Ш выше фона). Рисунок взят из публикации рЬаукцпоу еГ а/., 2009].

Характер распределения \¥\у\¥(п)8\у\у\у в промоторах тестового набора показан на Рис. 8. Видно, что степень превышения фонового уровня для этих элементов выше (до 8 БШ), чем для ро1у(с1Т)4 (~5 8Ш), поэтому отключение их учёта в Р1а1Ргот почти так же снижает его эффективность, как и отключение учёта консенсусных элементов (Рис. 7, справа). Независимый вклад в результативность РЫРгот вносят гибкие динуклеотиды УК (чаще всего ТА) (У=С=Т, Я=А=0), которые способствуют структурной адаптации промоторной ДНК к поверхности фермента. Кроме этого, структурообразующими в промоторах могут быть прямые и инвертированные повторы, которые учитываются алгоритмом, т.к. являются потенциальными мишенями для связывания регуляторных белков, а также могут формировать «сдвинутые» структуры с выпетливанием однонитевых участков (прямые повторы) или шпильки (инвертированные повторы). Таким образом, в нашем распоряжении был алгоритм, который для поиска промоторов использует

не только консенсусные элементы, узнаваемые а , но и структурные особенности промоторов, причём значительный вклад в результативность программы вносят А/Т-треки.

Рис. 8. Распределение \у\у\у(п)8\\'ту в промоторах тестового набора (см. Рис. 6). Проведена процедура сглаживания по трём соседним позициям.

Позиция 5-конца уу\лм(п)8ил/^ относительно старта транскрипции

Из-за структурной консервативности бактериального транскрипционного аппарата распределение структурообразующих модулей в разных промоторах может быть инвариантным. Поэтому их высокая статистическая значимость открывает возможность создания такого алгоритма, который сможет искать промоторы без предварительной информации о контексте их консенсусных элементов. В качестве пробного шага в этом направлении мы оценили способность Р1а1Ргот узнавать <т54-зависимые промоторы Е. соИ в том случае, когда учёт консервативных гексануклеотидов и динуклеотидов вблизи стартовой точки и элемента -10 был отключен. Выбор этих промоторов был обусловлен тем, что механизм их активации и контекст консервативных

элементов сильно отличаются от промоторов, узнаваемых а (Рис. 9).

cgcatctcgaaaaatcaaggagttgcaaa actggcacgattttttcatatatgtg cagatctttataaatcaaaaagataaaaa attggcacgcaaattgtattaacag agcctccgccgtttatgcacttttatcact ggctggcacgaaccctgcaatctaca ttggttagcttgtacatcaacaccaaaataaaactggcaagcatcttgcaatctggt

aatggcatcctttatgcaatatgaaa attggcacagttactgcataatagta actggcacgcaatctgcaattagca actggcatgatttgtgaatgtatcg ttggcacaaaaaatgcttaaagct actggcacaattattgcttgtaget

tctggcgtaaatcttgcctgcttagactaaatCttt

ataacttattgaatatattgagttaatcag atcagtacgttaccaaactattttcttt ttatagagtaaaaacaatcagataaaaa aatttccttaaataacagtaaattaaaa aaatctctttaataacaataaattaaaag gacattattcaccgcagggataatcaac cctacctcccctaacgcttatcgtcgtt ttatcccgattttcgcgatcgcagccgga attaaaaaattaagctgcttatttaattt gtgaatgataacctcgttgctcttaagc aaccgcgccgtatcgaaatcaactaattcc ctaaggccgcctg gegegge gataacgccttttaggggcaatttaaaag ttggcacagatttcgctttatctt taatatcagggaatgaccccacataaaat gtggcataaaagatgcatactgta консенсус: ttaaaa ctggca tgcatt

консенсус промоторов а70: ttgaca tataat

aatGtca ttcAgca tttAcag tgtAagt tgcAatg accAgtg agaCatc gcgCatt ggcAtct ggcAata

gtggcgcaatccctgcaatactta tctggcacgacggttgcaattatca tctggcacagttgttgctaccactg

aatCggt ggaCagc aagCgcc ctgAcat tttTacg gtcGaga A/c cA

glnH-p2

pspA

astC-p2

nac

hyfA

glmY-pl

norV

hydN

hycA

hypA

xdhA-p2

ygjG

rtcB

rpoH-p6

ibpB

glnA-p2

fdhF

Рис. 9. Нуклеотидные последовательности экспериментально картированных аэ4-зависимых промоторов Е. coli (взяты из базы данных RegulonDB (ver. 7.5) [Cama-Gastro et al., 2011]). Жирным шрифтом выделены консервативные элементы и стартовая точка транскрипции.

4. Распознавание промоторов о Е. coli разными версиями PlatProm.

Исходная версия алгоритма PlatProm с достоверностью р<0,0014 (3 StD выше фона) обнаружила только 11 промоторов, а с достоверностью

р<0,0000005 (5 выше фона) всего один (Рис. 10а). Затем с использованием процедуры максимизированного ожидания (последовательные циклы расчёта весовых матриц и выравнивания нуклеотидных последовательностей) весовые матрицы РЫРгот были оптимизированы на распознавание доминирующих нуклеотидных пар в области консервативных элементов -35 и -10. Несмотря на то, что адаптированный алгоритм РЫРгош-з54 не учитывал дополнительный консервативный элемент а54-зависимых промоторов СТСКЗСА в позиции -28 (Рис. 9), его чувствительность на втором и третьем пороговом уровнях оказалась выше, чем у исходной версии (Рис. 10а). На Рис. 106 в качестве примера приведён результат сканирования генома Е. соН вблизи гена Иу/А. Видно, что алгоритм РЫРгот-Б54 узнал экспериментально картированный старт (красный столбик на среднем графике), а исходная версия программы Р1а1Ргот (о70) в качестве наиболее вероятного старта предложила позицию, лежащую на 12 н.п. левее.

X н п о

=- г к о ц О.

О С

а

I I

F* 3StD (1 уровень)

Я-MSID (2 уровень) Пороговые уровни

FtSSID (3 уровень)

Рис. 10. а) Способность PlatProm-s , PlatProm и PlatPromU (указано на рисунке) распознавать а54-зависимые промоторы Е. coli на разных пороговых уровнях, соответствующих показателям промотор-подобия, превышающим фон (F ) на 3, 4 и 5 StD. б) Старты транскрипции, предсказанные алгоритмами в а54-зависимом промоторе гена hyfA. Красным цветом отмечена настоящая точка старта.

Координата относительно стартового кодона гена, н.п.

Затем в исходном алгоритме Р1агРгот были отключены весовые матрицы, учитывающие вклад консервативных элементов и динуклеотидов вблизи точки старта. Унифицированный таким образом алгоритм РЫРготи распознал промотор гена ку/А, но предложил в качестве наиболее вероятного старта позицию -6. Такое отклонение вполне допустимо при тотальном поиске промоторов, тем более что соседние области в диапазоне ±500 н.п. не содержали ложноположительных сигналов. Чувствительность Р1а1Рготи оказалась самой высокой на всех трёх пороговых уровнях (Рис. 10а), а в контрольном непромоторном наборе СБ1 этот алгоритм нашёл только один потенциальный промотор с р<0,0014, т.е. его специфичность оказалось очень высокой (99,6%). Это значит, что учитываемые каскадными матрицами структурообразующие мотивы, в том числе мононуклеотидные и смешанные А/Т-треки, можно использовать для поиска промоторов других а-факторов. Но консервативность транскрипционного аппарата бактерий позволяла также надеяться на возможность использования Р1а1Рготи для поиска промоторов в других бактериальных геномах. Для этого был разработан метод определения

фоновых значений показателей промотор-подобия, который не нуждается в предварительной аннотации геномных последовательностей.

5. Разработка метода оценки статистически значимых пороговых значений коэффициента промотор-подобия.

Для адекватной оценки предсказательного потенциала поисковой программы необходимо иметь возможность определения фоновых значений рассчитываемых показателей промотор-подобия в конкретных геномах и их стандартных отклонений. Ранее для этого мы использовали два набора последовательностей. Один из них состоял из 273 фрагментов кодирующих последовательностей конвергентно транскрибируемых генов Е. coli [Shavkunov et ed., 2009]. Присутствие функциональных промоторов в таких генах наименее вероятно. Второй набор содержал 400 случайных последовательностей, имеющих равный с исследуемым геномом AT/GC-состав. Достоинством первой компиляции является её биологическая аутентичность, но для создания такого набора необходимо иметь уже аннотированный геном и не всегда удаётся собрать достаточное для статистического анализа число фрагментов. Случайные последовательности можно получить в любом количестве, но среди них могут оказаться и промоторы, распределение которых в геноме определяется эволюционным отбором.

Поэтому для оценки фонового уровня и характерного для непромоторных ДНК StD был предложен новый способ определения пороговых уровней. Суть его заключается в поиске участков, наименее похожих на промоторную ДНК. В режиме скользящего окна определяли среднее значение коэффициента промотор-подобия (F) и StD на фрагменте в 1000 н.п. (средний размер гена). Затем геном разбивали на сегменты равной длины и в каждом из них искали позицию с минимальным F (Fm\n), как показано на Рис. 11. Среднее значение Fmm по всему геному (F) считали фоновым уровнем, а среднее значение соответствующих им StD — характеристикой его вариабельности в непромоторных участках.

о

F

-4

-6

О 10000 20000 30000 40000 50000

Позиции сегментов, н.п.

Рис. 11. Поиск непромоторных участков для первых 50000 н.п. хромосомы Е. coli К.12 MG1655. Серые столбики соответствуют значениям F для фрагментов длиной в 1000 н.п. Локальные минимумы (F,™,,), выявляемые при разбиении последовательности на сегменты длиной 5000 и 10000 н.п. отмечены окружностями и треугольниками, соответственно.

Определённые таким образом StD не проявляли существенной зависимости от плотности сегментации, а величина Fmm закономерно была тем меньше, чем больше размер сегмента (Рис. 11, Табл. 2). Для того чтобы выбрать оптимальный размер сегмента, величины F+4StD, полученные для разной плотности разбиения, сравнивали с аналогичным порогом, рассчитанным для контрольной компиляции CS1 (7,56) и 10 случайных последовательностей, идентичных геному Е. coli по размеру и нуклеотидному составу. Наиболее близкими к тщательно подобранному непромоторному набору эти значения оказались при разбиении генома Е. coli на сегменты длиной 5000 н.п. (Табл. 2). Среднее значение F + 4StD для 10 случайных последовательностей было немного выше (7,99), что отражает неслучайное распределение промотор-подобных сигналов в геномах и указывает на целесообразность использования натуральных последовательностей для определения пороговых уровней.

Таблица 2

Зависимость значений F и StD от плотности сегментации генома £ coli MG1655

Размер сегмента (н.п.) F StD F + 4StD

5000 -5,41 3,27 7,67

10000 -5,76 3,24 7,2

20000 -6,04 3,21 6,8

50000 -6,35 3,20 6,45

Таким образом, у нас появился инструмент оценки пороговых уровней для показателей промотор-подобия, рассчитанных разными версиями алгоритма в любом геноме. Для его реализации не нужен специальный набор контрольных ДНК. Это очень удобно, хотя и усложняет определение специфичности (процент ложноположительных сигналов) программы. Поэтому в дальнейшем мы не использовали этот важный параметр для характеристики алгоритмов. Чтобы частично компенсировать этот недостаток, чувствительность программ (процент узнанных промоторов) оценивали на трёх уровнях достоверности, рассчитанных по конкретному геному. Самый нижний из них превышал фон на 3810. Он обеспечивал достоверность р<0,0014, т.е. допускал обнаружение ~11200 ложных сигналов в геноме размером 4000000 п.н., или 1 ложный промотор на 357 пар оснований, что вполне приемлемо. Два других обеспечивают достоверность р<0,000034 и р<0,00000034, т.е. предполагают обнаружение всего -272 - 3 ложных сигналов в таком же геноме, что можно считать пренебрежимо малым.

6. Оценка способности унифицированной и специализированных версий РЫРгот распознавать промоторы в геномах с разным СС-составом.

Поскольку основной вклад в показатели промотор-подобия, рассчитанные унифицированным алгоритмом, дают АТ-богатые элементы, нами была оценена эффективность его работы с геномами, имеющими разный ОС-состав. Для этого было выбрано 7 геномов, в которых было картировано достаточное

для получения специализированной версии PlatProm число промоторов.

Геном С. glutamicum содержит 53,8% G/C-nap. В нём известно 158 негомологичных промоторов, активируемых основным о-фактором - SigA. Все они были использованы для построения весовых матриц специализированной версии программы PlatPromC, а оценка её эффективности осуществлялась методом сменных мишеней, как описано выше.

Рис. 12. Сопоставление способности PlatPromC, PlatProm и PlatPromU (указано на графике) распознавать промоторы С. glutamicum на разных уровнях достоверности.

ж 100 1

3 о?

s 80 -

ф m СО о

ш а. 60 ■

со о

X 1-

с") о 40 -

>- 2

К с о а. 20 -

о с

а 0 -

га | Il

1ПИ вЛ1

Пороговые уровни

На Рис. 12 показан суммарный результат сравнительного анализа. На первом уровне (р<0,0014) наиболее эффективной оказалась адаптированная программа PlatPromC (серые столбики), с помощью которой удалось узнать 81,6% промоторов, т.е. столько же, сколько на этом пороговом уровне находит PlatProm в тестовом наборе, составленном из промоторов Е. coli. Это значит, что каскадные матрицы, которые в PlatPromC остались «настроенными» на структурно-конформационные свойства промоторов Е. coli, равноэффективны и для поиска промоторов С. glutamicum. В сочетании с позиционными весовыми матрицами, отражающими контекст консервативных модулей в промоторах а70 Е. coli, они работали хуже (белые столбики). Это соответствует общему представлению о необходимости специфической адаптации алгоритмов поиска промоторов к контексту узнаваемых модулей. Чувствительность PlatPromU, работающей только с каскадными матрицами (чёрные столбики), на первом уровне практически не отличалась от PlatPromC (79,7%), а на более высоких пороговых уровнях даже превышала её. Т.е. унифицированная версия алгоритма эффективно распознаёт SigA-зависимые промоторы в геноме С. glutamicum, который почти не отличается от генома Е. coli по GC-составу.

Поскольку большинство модулей, учитываемых PlatPromU, содержат А/Т-треки, была реальная опасность снижения чувствительности программы при работе с АТ-богатыми геномами. Таковым, в частности является геном Н. pylori (GC-состав 38,9%). В нём картировано 44 промотора основного ст-фактора (а80), которые были использованы для получения адаптированной программы PlatPromH. Оказалось, что на первом уровне все три алгоритма обладали приблизительно равной эффективностью (84,1-86,4%). На втором самой лучшей оказалась специфическая версия, узнавшая 54,5% промоторов, а на третьем — PlatPromU (25%) (Рис. 13а), чувствительность которой снизилась по сравнению с предыдущими геномами, но незначительно.

На Рис. 136 показаны результаты сканирования генома Н. pylori вблизи гена frpB4. Исходная версия программы не распознаёт точку старта, картированную в позиции -55 по отношению к ATG-кодону, а PlatPromH и

Р1а1Рготи её узнают. При этом все 3 алгоритма предсказывают существование дополнительного старта внутри соседнего гена НР1511. Он находится на допустимом (<650 н.п.) для промоторов расстоянии от начала гена /грВ4, поэтому вполне может быть его дополнительным промотором, либо с него начинается синтез укороченной РНК с гена НР1511.

б 5.01 Р!а(Ргот

=- 2

к о

ц а.

о с Ч

Ш

Пороговые уровни

Рис. 13. Способность PlatPromH, PlatProm и PlatPromU (указано на рисунке) узнавать независимые промоторы Н. pylori на трёх пороговых уровнях (а) и стартовые точки, предсказанные алгоритмами для гена frpB4 (серая стрелка) Н. pylori (б) Красным цветом обозначена настоящая точка старта. Ось X соответствует (F + 4 StD).

§-4.5 Ш

— 4.0

0 4.0'

1 О

g- в,О-

JQ

S 5.5

I-

я

я 50

X

Ё 4.5

4.0

fprBi

-400 -200 PlatPromH

fprB4

-400 -200 PlatPromU

HP1521

i

fprB4

-400 -200 0 200 400 Координата относительно стартового кодона гена, н.п.

На Рис. 14 показано распределение промоторов, предсказанных разными версиями программы на геномной карте Н. pylori. Около 70% сигналов транскрипции, предсказанных специфической версией программы (PlatPromH), расположены перед кодирующими последовательностями или внутри межгенных областей (Рис. 14, внешний круг). Это столько же, сколько и в случае промоторов, предсказанных PlatProm в геноме Е. coli. Доля потенциальных промоторов для антисмысловой и альтернативной транскрипции также оказалась сопоставимой с геномом Е. coli [Shavkunov et а!., 2009]. Унифицированная программа с той же достоверностью (р<0,00004) предсказывает больше промоторов с внутригенной локализацией (вторая окружность на Рис. 14). Но на более высоком пороговом уровне процент ожидаемых промоторов оказался очень большим (Рис. 14, внутренний круг). Следовательно, унифицированную версию алгоритма вполне можно использовать для предварительного поиска промоторов в АТ-богатом геноме.

Рис. 14. Классификация предсказанных стартовых точек по расположению в геноме Н. pylori (PlatPromH и PlatPromU). Светло-серым цветом обозначены ожидаемые промоторы, предсказанные в межгенных участках; темно-серым -внутригенные промоторы, имеющие смысловую ориентацию, а чёрным -потенциальные промоторы для антисмысловой транскрипции.

Таблица 3

Узнавание промоторов в геномах с разным GC-составом_

Микроорганизм (число анализируемых промоторов) GC- состав, % Алгоритм Доля узнаваемых промоторов, %

1 уровень 2 уровень 3 уровень

Helicobacter pylori 26695 (44) 38,9 PlatPromH 86,4 54,5 15,9

PlatProm 84,1 45,5 15,9

PlatPromU 84,1 50 25

Bacillus subtilis subsp. subtilis str. 168 (349) 43,5 PlatPromB 90,6 68,5 30,2

PlatProm 92,8 64,8 30,4

PlatPromU 86,6 65,1 35,6

Escherichia coli К12 MG1655 (548) 50,8 PlatProm 87,1 57,1 19,6

PlatPromU 73,3 52,1 30,4

Salmonella enterica subsp. enterica serovar Typhimurium str. LT2 (210) 51,8 PlatPromS 87,1 45,3 14,4

PlatProm 72,7 37,4 10,8

PlatPromU 86,3 69,1 47,5

Corynebacterium glutamicum ATCC 13032(158) 53,8 PlatPromC 81,6 50 19

PlatProm 71,5 34,8 12

PlatPromU 79,7 59,5 32,9

Pseudomonas syringae pv. tomato str. DC3000 (63) 58,4 PlatPromP 63,5 44,4 23,8

PlatProm 71,4 44.4 23,8

PlatPromU 73 50,8 36,5

Agrobacterium tumefaciens str. C58 (360) 59,3 PlatPromA 77,3 54,6 27,8

PlatProm 77,3 45,4 16,5

PlatPromU 79,4 58,8 39,2

Streptomyces coelicolor str. A3(2) (192) 72,1 PlatPromSc 77,1 42,2 9,4

PlatProm 77,6 39,1 9,9

PlatPromU 71,9 -14,3 25,5

В Табл. 3 приведены суммарные данные для 8 исследованных геномов. На первом уровне достоверности программы имели приблизительно равную чувствительность. На втором - промоторы 5 из 8 геномов эффективнее распознавались PlatPromU, а на третьем - все промоторы лучше распознавались PlatPromU, причём, варьируя в пределах от 25% до 47,5%, чувствительность на этом уровне оказалась практически не зависимой от GC-состава (коэффициент корреляции Пирсона -0,05). Самая большая разница в предсказательном потенциале PlatPromU и специфических версий программы была обнаружена для S. enterica LT2 и Str. coelicolor А3(2) (3,3 и 2,7 раз, соответственно) (Табл. 3). Это, по-видимому, нельзя объяснить малым числом известных промоторов в обучающем наборе, т.к. в обоих случаях их было достаточно. Не исключено, что высокая эффективность PlatPromU на этих геномах обусловлена более высокой ролью структурообразующих элементов в архитектуре промоторной ДНК.

Таким образом, PlatPromU можно использовать для предварительного поиска промоторов в малоизученных геномах даже в том случае, если их GC-состав сильно отличается от 50%. Наиболее разумным при этом может быть использование высокого порогового уровня, который позволит собрать

достаточный для построения геном-специфического алгоритма набор родных промоторов при минимальном числе ложных сигналов.

7. Поиск участков генома с высокой плотностью потенциальных промоторов.

Большинство промоторов, предсказываемых различными версиями РЫРгот, расположено перед последовательностями генов, кодирующими белки или нетранслируемые РНК (Рис. 14). Но все компьютерные программы поиска промоторов предсказывают их наличие и внутри генов. Это могут быть промоторы для антисмысловых или альтернативных РНК [БЬаукипоу е( а!., 2009]. Хотя биологическая роль таких РНК не всегда понятна, их синтез из внутригенных областей подтверждается данными полногеномного скрининга.

3996000 3998000 4000000 4002000 4004000 4006000

Координаты в геноме Е. coli Рис. 15. Распределение стартовых точек транскрипции в геномной области Е. coli К12 MG 1655, предсказанных PlatProm на обеих нитях ДНК (столбики). Голубыми стрелками показаны кодирующие последовательности генов и направления их транскрипции. Х-ось проведена на уровне, превышающем фон на 4 StD. Х-ось вставки проведена так, чтобы показать кластер потенциальных точек старта рядом с нормальными промоторами. Красным цветом обозначена настоящая точка старта [Arthur et al., 1987].

Кроме этого, оказалось, что потенциальные сигналы транскрипции в геноме Е. coli К12 MG 1655 и 9 геномах 5. enterica распределены неравномерно. Совместно с группой Квана из Университета Гонконга была обнаружена повышенная частота их встречаемости в протяжённых участках генома, содержащих гены, приобретённые в результате горизонтального переноса («геномных островках»). Избыточное число промоторов в таких областях может способствовать экспрессии «чужих» генов в геноме нового хозяина. Используя это свойство, китайскими партнёрами был разработан новый алгоритм поиска «чужеродной» ДНК GIST (Genomic-island Identification by Signals of Transcription), классификационным признаком которого является 5-кратное превышение среднего по геному числа потенциальных промоторов в скользящем окне длиной 4000 н.п. В геноме Е. coli с его помощью было выявлено 59 «геномных островков», а в геномах сальмонелл — от 47 до 56.

Более детальный анализ показал, что 40 «геномных островков» Е. coli содержат 59 из 78 выявленных ранее [Shavkunov et al., 2009] относительно коротких участков генома (300-1100 н.п.) с аномально высокой плотностью промотор-подобных мест («промоторные островки»). Они имеют по крайней

мере 8 потенциальных точек инициации транскрипции на обеих нитях в скользящем окне 100 н.п. на протяжении как минимум 300 н.п. и средняя частота в них промоторов в 50 раз выше, чем в геноме. На Рис. 15 в качестве примера показан один из «островков» в сравнении с нормальными промоторами. Он полностью покрывает два гена и регуляторную область одного из них. Такую плотность промотор-подобных мест нельзя считать артефактом PlatProm, поскольку другая программа поиска промоторов [Hertz, Stormo, 1996] также выявляет аналогичный кластер в этой области. С кодирующими последовательностями генов перекрываются ещё 18 «островков», 4 лежат между конвергентными генами, где может начинаться синтез антисмысловых РНК, а 55 находятся в регуляторных участках генов. До последнего времени функциональная роль «островков» была совершенно непонятна. Поэтому очень важно было определить, насколько часто они присутствуют в других геномах. Для этого было выбрано 3 генома S. enterica, отличающихся по плотности кодирования, а также геномы С. glutamicum, В. subtilis и Н. pylori. Во всех случаях сканирование осуществлялось полученными ранее адаптированными версиями алгоритма.

У сальмонелл было выявлено сопоставимое с Е. coli число «промоторных островков» (69 у штамма Paratyphi В SPB7, 74 у Typhi Ту2 и 67 у Arizonae RSK2980) с внутригенной и межгенной локализацией. Но только для 3 из 17 генов, содержащих 1 или 2 внутригенных «островка», имеются ортологи хотя бы в одном геноме сальмонелл. Большинство генов, фланкирующих межгенные «островки» (61%) также отсутствует в геномах сальмонелл, что указывает на эволюционную нестабильность ассоциированных с «островками» генов.

Только для 10 из 55 межгенных «промоторных островков» Е. coli были найдены последовательности с некоторым подобием геномам сальмонелл (22100% гомологии), причём 7 из них совпадают с полноценными «промоторными островками». Все они находятся рядом с гомологичными генами. Кроме этого 4 «островка» были обнаружены перед другими гомологичными генами, первичная структура регуляторных областей которых не похожа или мало похожа на Е. coli. Для адекватной экспрессии этих генов, следовательно, важна высокая плотность потенциальных промоторов.

В геноме С. glutamicum был найден ортолог только для 1 (yneN) из 17 генов Е. coli, имеющих «островки» внутри кодирующих последовательностей, а среди генов, фланкирующих межгенные «островки», таких оказалось 9. Это соответствует предположению об эволюционной нестабильности генов, ассоциированных с «промоторными островками». При этом в геноме С. glutamicum было найдено только 11 «островков» и все они оказались расположенными в одном участке генома длиной -170000 н.п. (красные метки на третьей окружности Рис. 16), который полностью принадлежит профагу CGP3 [Frunzke et al., 2008]. Таким образом, все «островки» появились в геноме С. glutamicum в результате генетической рекомбинации.

У В. subtilis и Н. pylori специфическими версиями алгоритмов было обнаружено только по 2 «островка». В геноме В. subtilis один из них находится в межгенной области ykuV{+)/rok{+) и покрывает регуляторную область гена

rok. Этот ген кодирует белок нуклеоида, репрессирующий экспрессию горизонтально перенесённых генов. Он является функциональным аналогом гистоноподобного белка нуклеоида H-NS Е. coli и белка Lsr2 GC-богатых микобактерий [Smits, Grossman, 2010]. Второй «островок» находится в профаге SPß (в межгенной области sunA(-)/sunI(-)) [Lazarevich et al., 1999].

Таким образом, количество «промоторных островков» в геномах разных бактерий сильно различается, причём многие из них находятся в «геномных островках» или профагах, т.е. в чужеродной ДНК. Поэтому возникло предположение, что «промоторные островки» могут быть специфически ассоциированы с «чужими» генами, даже если эти гены не входят в состав протяжённых «геномных островков». Детальный анализ показал, что 75 из 78 (или 73 из 78, без учёта данных GIST) «островков» в геноме Е. coli находятся в регуляторной области генов, чужеродность которых предсказана разными авторами [Lawrence, Ochman, 1998; Nakamura et al., 2004; Langille, Brinkman, 2009]. Это в 3-9 раз больше ожидаемого, что является весомым аргументом в пользу причастности «островков» к ассимиляции чужеродной ДНК.

Однако число «островков», выявленных специфическим алгоритмом в геноме Е. coli значительно меньше, чем число чужеродных генов (у Е. coli по оценкам разных авторов от 424 до 1053). Это может быть результатом слишком жёстких критериев, использованных для отбора «островков». Вполне естественно предположить возможность существования «островков» с разной а-специфичностью. Поэтому на следующем этапе было определено количество «промоторных островков», выявляемых в разных геномах унифицированной версией алгоритма PlatPromU.

8. Число и функциональные свойства «смешанных промоторных островков».

В геноме Е. coli Kl2 MG 1655 было найдено 434 «смешанных промоторных островка», удовлетворяющих критериям, описанным в разделе «Материалы и

Рис. 16. Геномная карта С. g/«tam;cнm, отражающая расположение генов на «+» и «-» нитях генома (две внешние окружности); «промоторных островков», выявленных алгоритмами РМРготС и РЫРготи (окружности 3 и 4, соответственно); обогащённость й/С-парами (окружность 5) и асимметрию в распределении гуанинов и цитидинов на двух нитях (0/С-зке\у, окружность 6).

методы». У S. enterica Ту 2 их оказалось 495, что сопоставимо с их количеством в геноме Е. coli. У С. glutamicum было найдено 177 «смешанных островков», что в 16 раз больше, чем выявлялось специфическим алгоритмом и они распределены по всему геному (Рис. 16, окружность 4). В геноме В. subtilis их оказалось 72, а у Н. pylori, по-прежнему, только 2. На Рис. 17 показано перекрывание общего пула потенциально «чужих» генов Е. coli с генами, ассоциированными со «смешанными островками» и с 351 обычным промотором. Видно, что обычные промоторы, как правило, контролируют синтез родных генов Е. coli, а большинство «островков» ассоциировано с чужеродной ДНК, причём около 40% «чужих» генов связано с «островками».

Чужеродные гены Ранее Д™ 78 «островков», найденных PlatProm,

— была обнаружена необычная комбинация

вз /s, звА°/» \ функциональных свойств. По данным

£о /■ X'vf- o~s полногеномного скрининга, полученным методом

11(76,1%', п ff Л-Зе ChIP-on-chip, все они взаимодействуют с РНК-

оо\ ; ( 75,8% ' 1 о ш

о о- Ч__</ : I j J ш | полимеразои, но транскрипционная активность на

- _ микроматрицах была зарегистрирована только для 9

„ ~ «островков» TShavkunov et al., 20091. Это могло

Рис. 17. Степень перекрывания ' L J

обычных промоторов и быть следствием того, что «островки» образуют

«смешанных промоторных только закрытые комплексы с полимеразои,

островков» Е. coli (серые неспособные инициировать синтез РНК. Но

окружности) с потенциально футпринтинг КМп04, осуществлённый для 24

«чужими» генами (пунктир) и «островков», показал их способность формировать доля «чужих» генов (точечные

• , транскрипционно-компетентные комплексы с

сегменты), ассоциированная с v '

двумя типами промоторов. ферментом in vitro, а для 12 «островков» переход в

«открытое» состояние был зарегистрирован и in vivo [Shavkunov et al., 2011]. Было высказано предположение, что их транскрипционная активность блокирована на стадии синтеза коротких абортивных продуктов, которые из-за проблем с обратной транскрипцией не могут быть зарегистрированы на микроматрицах. Поэтому для 434 «смешанных островков» был проведён экспрессионный анализ с использованием данных прямого секвенирования кДНК [Dornenburg et al., 2010], позволяющих оценить количество длинных и коротких РНК-продуктов в общем пуле клеточных РНК (Рис. 18). Его результаты подтверждают низкую эффективность продуктивной инициации для 78 «островков», выявленных PlatProm (только 7 начинают продуктивный синтез), и свидетельствуют о том, что большинство «смешанных островков» тоже не инициируют синтез длинных РНК (Сектор А), но во всех случаях был зарегистрирован синтез коротких олигонуклеотидов (Сектор В). Поэтому не исключено, что «островки» являются своеобразными «фабриками» коротких РНК, которые играют самостоятельную роль в бактериальных клетках, например, праймируют транскрипцию других генов [Goldman et al., 2011 ].

С другой стороны, обнаруженный характер функциональной активности свидетельствует о целенаправленной репрессии продуктивной транскрипции с «островков». Такая репрессия может быть результатом взаимодействия нескольких молекул РНК-полимеразы с перекрывающимися промоторами, а

также результатом прямой репрессии со стороны гистоноподобного белка нуклеоида H-NS. Этот белок считается специфическим ингибитором горизонтально перенесённых генов и, согласно анализу данных, полученных методом ChIP-on-chip [Grainger et al., 2006; Oshima et al., 2006; Kahramanoglou et al., 2011], связывается с 425 «островками» из 434 (97,9%).

Рис. 18. Распределение функциональных сайтов в геноме Е. coli. Внешние окружности 1 и 2 - генная карта штамма. Окружность 3 - относительное число РНК длиной 10-11 н. (а) и > 44 н. (б), обнаруженных в результате прямого секвенирования кДНК [Dornenburg et al., 2010] (logio числа +1). Т.к. не наблюдалось никакой асимметрии в активности «островков» по геному, результаты этого анализа показаны на одной окружности, разделенной на 2 сектора. Окружность 4 - распределение сайтов связывания РНК-полимеразы, выявленных методом ChlP-on-chip [Reppas et al., 2006] (log2 отношения специфических и контрольных сигналов гибридизации). Красным цветом отмечены продукты и сигналы гибридизации, соответствующие «смешанным промоторным островкам».

Итак, нами обнаружено, что «промоторные островки», содержащие аномально высокое число потенциальных промоторов, ассоциированы с чужими генами. Это предполагает их участие в ассимиляции чужеродного генетического материала. Предварительный анализ показал, что предполагаемые доноры имеют нормальные промоторы, т.е. «островки» должны формироваться в геноме хозяина после переноса. Они могут обеспечивать супрессию токсичных или бесполезных генов и предоставлять возможность бактериальной популяции выбрать оптимальный промотор для интеграции «чужого» гена в регуляторные сети нового хозяина. В рамках защищаемой работы важно, что эволюционное давление оказалось направленным на формирование протяжённых АТ-треков, число которых в «промоторных островках» превышает ожидаемые значения при нормировке на геном и даже при нормировке на АТ-богатые последовательности «островков» в 2,34 и 1,73 раза, соответственно.

выводы

1. В хромосомных ДНК прокариот наблюдается общая тенденция преимущественного присутствия мононуклеотидных poIy(dA)n/poly(dT)n-треков, которые преобладают над poly(dG)n/poly(dC)n-TpeKaMH не только в хромосомах с GC-составом менее 50%, но и в большинстве хромосом с высоким содержанием G/C-nap.

2. Установлено, что регуляторные участки геномов обогащены ро1у(ёА)п/ро1у(ёТ)п-треками и смешанными W-треками, которые, следовательно, можно использовать в качестве дополнительного дискриминационного признака для поиска этих участков в геномах.

3. Разработан новый метод оценки фоновых значений показателя промотор-подобия в любых геномах, не требующий предварительного картирования в них генов.

4. Впервые установлена высокая чувствительность унифицированной версии алгоритма поиска промоторов PlatPromU, которая позволяет осуществлять поиск промоторов в неохарактеризованных нуклеотидных последовательностях.

5. В пяти бактериальных геномах впервые картированы участки с высокой плотностью потенциальных мест инициации транскрипции («смешанные промоторные островки»). Установлено, что в геноме Е. coli они, как правило, взаимодействуют с РНК-полимеразой и гистоноподобным белком нуклеоида Н-NS. Показано, что синтез длинных РНК с них идёт хуже, чем в среднем по геному, но «островки» способны эффективно инициировать синтез коротких олигонуклеотидов.

6. Впервые доказана ассоциация «смешанных промоторных островков» с чужеродной ДНК, что позволяет предположить их участие в процессе адаптации чужих генов к регуляторным сетям нового хозяина.

СПИСОК ПУБЛИКАЦИЙ ПО ТЕМЕ ДИССЕРТАЦИИ Статьи в журналах:

1. Киселев С.С.. Комаров В.М., Масулис И.С., Озолинь О.Н. Распределение мононуклеотидных повторов в бактериальных хромосомах: А/Т-треки преобладают над G/C-треками // Компьютерные исследования и моделирование. 2010. Т. 2. С. 183-187.

2. Киселев С.С., Озолинь О.Н. Структурообразующие модули как индикаторы промоторной ДНК в бактериальных геномах // Математическая биология и биоинформатика. 2011. Т. 6. С. 39-52.

3. Huang Q„ Cheng X., Cheung М.К., Kiselev S.S., Ozoline O.N., Kwan H.S. High-density transcriptional initiation signals underline genomic islands in bacteria // PLoS ONE. 2012. V. 7. Article № e33759.

Статьи в сборниках:

1. Kiselev S.S.. Purtov Yu.A., Ozoline O.N. Unified promoter-search algorithm as a

novel tool for annotation of bacterial genomes // Доклады 3 международной конференции "Математическая биология и биоинформатика". С. 91-92.

2. Kiselev S.S.. Ozoline O.N. Computer-based search for promoters within the A/T-rich genome of Helicobacter pylori II Proceedings of the international Moscow conference on computational molecular biology. Moscow. 2011. P. 272-273.

3. Озолинь O.H., Киселев С.С.. Панюков В.В. Новые элементы бактериальных геномов - «промоторные островки» как маркеры чужеродной ДНК // Доклады 4 международной конференции "Математическая биология и биоинформатика". С. 66-67.

Тезисы докладов на конференциях:

1. Киселев С.С., Комаров В.М., Масулис И.С., Озолинь О.Н. Асимметрия в распределении мононуклеотидных повторов в геномах прокариот // Тезисы докладов 13 международной школы-конференции молодых учёных «Биология - наука XXI века». Пущино, 2009. С. 22.

2. Киселев С.С., Комаров В.М., Масулис И.С., Озолинь О.Н. В бактериальных хромосомах мононуклеотидные А/Т-треки преобладают над G/C-треками // Тезисы докладов 14 международной школы-конференции молодых учёных «Биология - наука XXI века». Пущино, 2010. Т. 2. С. 143.

3. Киселев С.С., Комаров В.М., Масулис И.С., Озолинь О.Н. Распределение W-треков и S-треков в геномах умеренно GC-богатых микроорганизмов // Тезисы докладов 15 международной школы-конференции молодых учёных «Биология - наука XXI века». Пущино, 2011. С. 30.

4. Киселев С.С.. Озолинь О.Н. Потенциальные антисмысловые РНК в геномах Bacillus snbtilis и Corynebacterium glutamicam И Тезисы докладов 15 международной школы-конференции молодых учёных «Биология — наука XXI века». Пущино, 2011. С. 8-9.

5. Киселев С.С., Комаров В.М., Масулис И.С., Деев А.А., Озолинь О.Н. Специфика встречаемости смешанных W-треков и S-треков в геномах умеренно GC-богатых микроорганизмов // Фундаментальные физико-математические проблемы и моделирование технико-технологических систем. Вып. 14. М„ 2011. С. 173-174.

6. Shavkunov K.S., Tutukina M.N., Masulis I.S., Panyukov V.V., Kiselev S.S.. Deev A.A., Ozoline O.N. «Promoter islands» as genomic regions with quenched transcription // Abstracts of the eighth international conference on bioinformatics of genome regulation and structure/systems biology. Novosibirsk. 2012. P. 287.

7. Tutukina M.N., Lukyanov V.I., Kiselev S.S., Ozoline O.N. Functional interplay of overlapping promoters, predicted within phoR/brnQ «promoter island» // Abstracts of the eighth international conference on bioinformatics of genome regulation and structure/systems biology. Novosibirsk. 2012. P. 322.

Подписано в печать:

16.11.2012

Заказ № 7870 Тираж - 75 экз. Печать трафаретная. Типография «11-й ФОРМАТ» ИНН 7726330900 115230, Москва, Варшавское ш., 36 (499) 788-78-56 www.autoreferat.ru

Содержание диссертации, кандидата биологических наук, Киселев, Сергей Сергеевич

Введение.

Обзор литературы.

1. Особенности структурной организации и биологическая роль мононуклеотидных poly(dA)n-TpeKOB.

1.1. Модели структурной организации poly(dА)п-треков.

1.2. Биологическая роль ро1у(<1А)п-треков.

1.2.1. poly(dA) n-треки как мишени прямого контакта с белками транскрипционного комплекса.

1.2.2. poly(dA) п-треки и суперспирализация ДНК.

1.2.3. poly(dA) п-треки и выпетливание ДНК.

1.2.4. poly(dA)n-TpeKH и терминация синтеза ДНК обратной транскриптазой ретровирусов.

1.2.5. poly(dA)n-TpeKH и температурозависимая регуляция транскрипции у патогенных бактерий.

1.2.6. poly(dA) „-треки в кинетопластной ДНК.

1.2.7. poly(dA) „-треки в участках прикрепления хроматина к ядерному белковому матриксу.

1.2.8. poly(dA) „-треки и упаковка ДНК в нуклеосомы.

2. Неравномерность в распределении А/Т-пар в геномах прокариот.

3. Общая характеристика транскрипционного цикла и роль poly(dA)n-TpeicoB в формировании и функционировании транскрипционного комплекса.

3.1. Фазы транскрипционного цикла.

3.2. Структура бактериальной РНК-полимеразы: субъединицы, принимающие участие в распознавании промоторов.

3.2.1. а-субъединица.

3.2.2. о-субъединицы.

3.3. Особенности нуклеотидных последовательностей промоторной ДНК.

3.3.1. Консервативные гексануклеотиды.

3.3.2. «Расширенный» -10-элемент и реорганизация -10-элемента.

3.3.3. Дискриминатор.

3.3.4. UP-элемент.

3.3.5. Промоторы, узнаваемые а54.

4. Компьютерные алгоритмы поиска промоторов прокариот.

4.1. Методы, основанные на использовании искусственных нейронных сетей.

4.2. Методы, основанные на использовании скрытых марковских моделей.

4.3. Учёт локальных физических особенностей промоторной ДНК.

4.4. Алгоритмы, основанные на использовании позиционных весовых матриц.

5. Методы и алгоритмы.

5.1. Поиск мононуклеотидных и смешанных треков в геномах.

5.2. Компьютерный поиск промоторов.

5.3. Определение фоновых значений показателя промотор-подобия и характеристика степени его вариабельности.

5.4. Адаптация PWM PlatProm к контексту консервативных элементов других промоторов.

5.5. Унификация PlatProm.

5.6. Оценка предсказательного потенциала компьютерных алгоритмов.

5.7. Критерии для выявления «промоторных островков».

5.8. Оценка транскрипционной активности «смешанных промоторных островков».

5.9. Исследование ассоциации «смешанных промоторных островков» Е. coli с горизонтально перенесёнными генами.

5.10. Оценка взаимодействия «смешанных промоторных островков» Е. coli с белком H-NS и РНК-полимеразой.

6. Результаты и обсуждение.

6.1. Анализ распространения мононуклеотидных poly(dA)n- и poly(dT)rt-TpeKOB по сравнению с poly(dG)n- и ро1у^С)п-треками в геномах прокариот с различным AT/GC-составом.

6.2. Сравнительный анализ встречаемости мононуклеотидных треков и смешанных W- и S-треков.

6.3. Анализ распределения мононуклеотидных треков в кодирующих и некодирующих участках бактериальных геномов.

6.4. Распознавание промоторов а54 Е. coli разными версиями PlatProm.

6.5. Разработка метода оценки статистических значимых пороговых значений коэффициента промотор-подобия.

6.6. Оценка способности унифицированной и специализированных версий PlatProm распознавать промоторы в геномах с разным GC-составом.

6.6.1. Распознавание SigA-зависимых промоторов Corynebacteriimi glutamicum.

6.6.2. Распознавание промоторов Agrobacterium tumefaciens.

6.6.3. Распознавание а -зависимых промоторов Helicobacter pylori.

6.7. Поиск участков генома с высокой плотностью потенциальных промоторов.

6.8. Число и функциональные свойства «смешанных промоторных островков».

Библиография Диссертация по биологии, кандидата биологических наук, Киселев, Сергей Сергеевич, Пущино

1. Комаров В.М. Квантово-химическое полуэмпирическое исследование полиморфизма уотсон-криковского спаривания азотистых оснований // Биофизика. 1998. Т. 43. С. 967-974.

2. Озолинь О.Н., Деев А.А., Масулис И.С., Часов В.В., Костяницина Е.Г., Пуртов Ю.А., Архипов И.В., Брок-Волчанский А.С. Уровни структурной организации промоторнон ДНК Escherichia coli II Биофизика. 2002. Т. 47. С. 809-819.

3. Озолинь О.Н., Пуртов Ю.А., Брок-Волчанский А.С., Деев А.А., Лукьянов В.И. Особенности ДНК-белковых взаимодействий в транскрипционных комплексах Escherichia coli II Молекулярная биология. 2004. Т. 38. С. 786-797.

4. Северинов К.В. Взаимодействия ДНК-зависимой РНК-полимеразы бактерий с промоторами // Молекулярная биология. 2007. Т. 43. С. 423-432.

5. Фиорини А., Гувейя Ф.С., Фернандес М.А. Участки, ассоциированные с матриксом (скаффолдом) и внутренние изгибы ДНК // Биохимия. 2006. Т. 71. С. 598-606.

6. Часов В.В., Деев А.А., Масулис И.С., Озолинь О.Н. А/Т-треки в структуре промоторов Escherichia coli: характер распределения и функциональное значение // Молекулярная биология. 2002. Т. 36. С. 682-688.

7. Abu-Daya A., Fox K.R. Interaction of minor groove binding ligands with long AT tracts //Nucl. Acids Res. 1997. V. 25. P. 4962-4969.

8. Adachi Y., Kas E., Laemmli U.K. Preferential, cooperative binding of DNA topoisomerase II to scaffold-associated regions // EMBO J. 1989. V. 8. P. 3997-4006.

9. Adler В., Sasakawa C., Tobe Т., Makino S., Komatsu K., Yoshikawa M. A dual transcriptional activation system for the 230 kb plasmid genes coding for virulence-associated antigens of Shigella flexneri // Mol. Microbiol. 1989. V. 3. P. 627-635.

10. Aguirre A., Cabeza M.L., Spinelli S.V., McClelland M., Vescovi E.G., Soncini F.C. PhoP-induced genes within Salmonella pathogenicity island // J. Bacteriol. 2006. V. 188. P. 6889-6898.

11. Akbar S., Schechter L.M., Lostroh C.P., Lee C.A. AraC/XylS family members, HilD and HilC, directly activate virulence gene expression independently of HilA in Salmonella (yphimurium // Mol. Microbiol. 2003. V. 47. P. 715-728.

12. Albert I., Mavrich T.N., Tomsho L.P., Qi J., Zanton S.J., Schuster S.C., Pugh B.F. Translational and rotational settings of II2A.Z nucleosomes across the Saccharomyces cerevisiae genome//Nature. 2007. V. 446. P. 572-576.

13. Alexandrov N.N., Mironov A.A. Application of a new method of pattern recognition in DNA sequence analysis: a study of E. coli promoters // Nucl. Acids Res. 1990. V. 18. P. 1847-1852.

14. Alexeev D.G., Lipanov A.A., Skuratovskii I.Y. Poly(dA).poly(dT) is a B-type double helix with a distinctively narrow minor groove // Nature. 1987. V. 325. P. 821-823.

15. Albano M., Smits W.K., Ho L.T.Y., Kraigher В., Mandic-Mulec I., Kuipers O.P., Dubnau D. The Rok protein of Bacillus subtilis represses genes for cell surface and extracellular functions//J. Bacteriol. 2005. V. 187. P. 2010-2019.

16. Anderson J.D., Widom J. Poly(dA-dT) promoter elements increase the equilibrium accessibility of nucleosomal DNA target sites // Mol. Cell. Biol. 2001. V. 21. P. 3830-3839.

17. Archer C.D., Elliott T. Transcriptional control of the nuo operon which encodes the energy-conserving NADII dehydrogenase of Salmonella typhimurium II J. Bacteriol. 1995. V. 177. P. 2335-2342.

18. Arndt A., Eikmanns B.J. The alcohol dehydrogenase gene adhA in Corynebacteriumglutamicum is subject to carbon catabolite repression // J. Bacteriol. 2007. V. 189. P. 7408-7416.

19. Arnott S., Chandrasekaran R., Hall I.H., Puigjaner L. C. Heteronomous DNA // Nucl. Acids Res. 1983. V. 11. P. 4141-4155.

20. Arthur H.H., Cavanagh D.R., Finch P.W., Emmerson P.T. Regulation of the Escherichia coli avrD gene in vivo // J. Bacteriol. 1987. V. 169. P. 3435-3440.

21. Atlung T., Ingmer II. I-I-NS: a modulator of environmentally regulated gene expression // Mol. Microbiol. 1997. V. 24. P. 7-17.

22. Auchter M., Arndt A., Eikmanns B.J. Dual transcriptional control of the-acetaldehyde dehydrogenase gene aid of Corynebacteriwn glutamicum by RamA and RamB // J. Biotechnol. 2009. V. 140. P. 84-91.

23. Baker K.E., Ditullio K.P., Neuhard J., Kelln R.A. Utilization of orotate as a pyrimidine source by Salmonella typhimurinm and Escherichia coli requires the dicarboxylate transport protein encoded by dctA U J. Bacteriol. 1996. V. 178. P. 7099-7105.

24. Barchiesi J., Castelli M.E., Soncini F.C., Vescovi E.G. mgtA expression is induced by Rob overexpression and mediates a Salmonella enterica resistance phenotype // J. Bacteriol. 2008. V. 190. P. 4951-4958.

25. Barne K.A., Bown J.A., Busby S.J., Minchin S.D. Region 2.5 of the Escherichia coli RNA polymerase a70 subunit is responsible for the recognition of the "extended-10" motif at promoters // EMBO J. 1997. V. 16. P. 4034-4040.

26. Barreiro C., Gonzalez-Lavado E., Patek M., Martin J.-F. Transcriptional analysis of the groES-groELl, groEL2, and dnaK genes in Corynebacteriwn glutamicum: characterization of heat shock-induced promoters //J. Bacteriol. 2004. V. 186. P. 413-417.

27. Barrios H., Valderrama B., Morett E. Compilation and analysis of o5,-dependent promoter sequences //Nucl. Acids Res. 1999. V. 27. P. 4305-4313.

28. Barruiso-Iglesias M., Barreiro C., Flechoso F., Martin J.F. Transcriptional analysis of the FoFi ATPase operon of Corynebacteriwn glutamicum ATCC 13032 reveals strong induction by alkaline pl-l // Microbiology. 2006. V. 152. P. 11-21.

29. Barth E., Barcelo M.A, Klackta C., Benz R. Reconstitution experiments and gene deletions reveal the existence of two-component major cell wall channels in the genus Corynebacteriwn //J. Bacteriol. 2010. V. 192. P. 786-800.

30. Baxter M.A., Jones B.D. The fimYZ genes regulate Salmonella enterica serovar Typhimurium invasion in addition to type 1 fimbrial expression and bacterial motility // Infect. Immun. 2005. V. 73. P. 1377-1385.

31. Bcnoff B., Yang II., Lawson C.L., Parkinson G., Liu J., Blatter E., Ebright Y.W., Berman II.M., Ebright R.II. Structural basis of transcription activation: the CAP-aCTD-DNA complex // Science. 2002. V. 297. P. 1562-1566.

32. Berezney R., Coffey D.S. Identification of a nuclear protein matrix // Biochem. Biophys. Res. Comraun. 1974. V. 60. P. 1410-1417.

33. Beutel B.A., Gold L. In vitro evolution of intrinsically bent DNA // J. Mol. Biol. 1992. V. 228. P. 803-812.

34. Bode J., Benham C., Knopp A., Mielke C. Transcriptional augmentation: modulation of gene expression by scaffold/matrix-attached regions (S/MAR elements) // Crit. Rev. Eukar. Gene Expr. 2000. V. 10. P. 73-90.

35. Bode J., Stengert-Iber M., Kay V., Schlake T., Dietz-Pfeilstetter A. Scaffold/matrixattached regions: topological switches with multiple regulatory functions // Crit. Rev. Eukar. GeneExpr. 1996. V. 6. P. 115-138.

36. Bolshoy A., McNamara P., Harrington R.E., Trifonov E.N. Curved DNA without A-A: experimental estimation of all 16 DNA wedge angles // Proc. Natl. Acad. Sei. USA. 1991. V. 88. P. 2312-2316.

37. Boulikas T. Nature of DNA sequences at the attachment regions of genes to the nuclear matrix // J. Cell. Biochem. 1993. V. 52. P. 14-22.

38. Boulikas T., Kong C.F. Multitude of inverted repeats characterizes a class of anchorage sites of chromatin loops to the nuclear matrix // J. Cell. Biochem. 1993. V. 53. P. 1-12.

39. Browning D.F., Busby S.J.W. The regulation of bacterial transcription initiation //Nat. Rev. Microbiol. 2004. V. 2. P. 57-65.

40. Buck M., Cannon W. Specific binding of the transcription factor sigma-54 to promoter DNA//Nature. 1992. V. 358. P. 422-^124.

41. Buck M., Gallegos M.-T., Studholme D.J., Guo Y., Gralla J.D. The bacterial enhancer-dependent a54 (cN) transcription factor // J. Bacteriol. 2000. V. 182. P. 4129-4136.

42. Burgess R.R., Travers A.A., Dunn J.J., Bautz E.K. Factor stimulating transcription by RNA polymerase // Nature. 1969. V. 221. P. 43-^6.

43. Burgess R.R., Travers A.A. Escherichia coli RNA polymerase: purification, subunit structure, and factor requirements 11 Fed. Proc. 1970. V. 29. P. 1164-1169.

44. Burkhoff A.M., Tullius T.D. The unusual conformation adopted by the adenine tracts in kinetoplast DNA // Cell. 1987. V. 48. P. 935-943.

45. Burr T., Mitchell J., Kolb A., Minchin S., Busby S. DNA sequence elements loeated immediately upstream of the -10 hexamer in Escherichia coli promoters: a systematic study I I Nucl. Acids Res. 2000. V. 28. P. 1864-1870.

46. Burrows P.C., Severinov K., Buck M., Wigneshweraraj S.R. Reorganisation of an RNA polymerase-promoter DNA complex for DNA melting // EMBO J. 2004. V. 23. P. 4253-4263.

47. Burrows P.C., Severinov K., Ishihama A., Buck M., Wigneshweraraj S.R. Mapping a54-RNA polymerase interactions at the -24 consensus promoter element // J. Biol. Chem. 2003. V.278. P.29728-29743.

48. Bush M., Dixon R. The role of bacterial enhancer binding proteins as specializedactivators of cr^-dependent transcription // Microbiol. Mol. Biol. Rev. 2012. V. 76. P. 497-529.

49. Byerly K.A., Urbanowski M.L., Stauffer G.V. The MetR binding site in the Salmonella typhimiirium metH gene: DNA sequence constraints on activation // J. Bacteriol. 1991. V. 173. P. 3547-3553.

50. Byrne C.R., Monroe R.S., Ward K.A., Kredich N.M. DNA sequences of the cysK regions oí Salmonella typhimiirium and Escherichia coli and linkage of the cysK regions to ptsll II J. Bacteriol. 1988. V. 170. P. 3150-3157.

51. Calladine C.R., Drew H.R., McCall M.J. The intrinsic curvature of DNA in solution // J. Mol. Biol. 1988. V. 201. P. 127-137.

52. Campbell E.A., Muzzin O., Chlenov M., Sun J.L., Olson C.A., Weinman O., Trester-Zedlitz M.L., Darst S.A. Structure of the bacterial RNA polymerase promoter specificity a subunit // Mol. Cell. 2002. V. 9. P. 527-539.

53. Campbell E.A., Westblade L.F., Darst S.A. Regulation of bacterial RNA polymerase a factor activity: a structural perspective // Curr. Opin. Microbiol. 2008. V. 11. P. 121-127.

54. Cannon W., Clavcrie-Martin F., Austin S., Buck M. Core RNA polymerase assists binding of the transcription factor o54 to promoter DNA // Mol. Microbiol. 1993. V. 8. P. 287298.

55. Cannon W., Chaney M., Buck M. Characterisation of holoenzyme lacking oN regions I and II // Nucl. Acids Res. 1999. V. 27. P. 2478-2486.

56. Cannon W.V., Gallegos M.-T., Buck M. Isomerization of a binary sigma-promoter DNA complex by transcription activators //Nat. Struct. Biol. 2000. V. 7. P. 594-601.

57. Cannon W., Gallegos M.-T., Buck M. DNA melting within a binary o54-promoter DNA complex // J. Biol. Chem. 2001 V. 276. P. 386-394.

58. Cardon L.R., Stormo G.D. Expectation maximization algorithm for identifying protein-binding sites with variable lengths from unaligned DNA fragments // J. Mol. Biol. 1992. V. 223. P. 159-170.

59. Carmona M., Claverie-Martin F., Magasanik B. DNA bending and the initiation of transcription at a54-dependent bacterial promoters // Proc. Natl. Acad. Sci. USA. 1997. V. 94. P. 9568-9572.

60. Carpousis A.J., Gralla J.D. Cycling of ribonucleic acid polymerase to produce oligonucleotides during initiation in vitro at the lac UV5 promoter // Biochemistry. 1980. V. 19. P. 3245-3253.

61. Carver T., Thomson N., Bleasby A., Berriman M., Parkhill J. DNAPlotter: circular and linear interactive genome visualization // Bioinformatics. 2009. V. 25. P. 119-120.

62. Chen II., Tang IL, Ebright R.H. Functional interaction between RNA polymerase a subunit C-terminal domain and o1 in UP-element- and activator-dependent transcription // Mol. Cell. 2003. V. 11. P. 1621-1633.

63. Chen I., Christie P.J., Dubnau D. The ins and outs of DNA transfer in bacteria // Science. 2005. V. 310. P. 1456-1460.

64. Chen I., Dubnau D. DNA uptake during bacterial transformation // Nat. Rev. Microbiol. 2004. V. 2. P. 241-249.

65. Chen P., Ailion M., Bobik T., Stormo G., Roth J. Five promoters integrate control of the cob/pdu regulon in Salmonella typhimurium II J. Bacteriol. 1995. V. 177. P. 5401-5410.

66. Clio B.-K., Zengler K., Qiu Y., Park Y.S., Knight E.M., Barrett C.L., Gao Y., Palsson B.O. The transcription unit architecture of the Escherichia coli genome // Nat. Biotechnol. 2009. V. 27. P. 1043-1049.

67. Choi P., Wang L., Archer C.D., Elliott T. Transcription of the glutamyl-tRNA reductase (hemA) gene in Salmonella typhimurium and Escherichia coli: role of the hemA PI promoter and the arcA gene product // J. Bacteriol. 1996. V. 178. P. 638-646.

68. Ciampi M.S. Rho-dependent terminators and transcription termination // Microbiology. 2006. V. 152. P. 2515-2528.

69. Claverys J.-P., Martin B., Polard P. The genetic transformation machinery: composition, localization, and mechanism //FEMS Microbiol. Rev. 2009. V. 33. P. 643-656.

70. Coenye T., Vandamme P. Characterization of mononucleotide repeats in sequenced prokaryotic genomes // DNA Res. 2005. V. 12. P. 221-233.

71. Coll M., Frederick C.A., Wang A.H., Rich A. A bifurcated hydrogen-bonded conformation in the d(A-T) base pairs of the DNA dodecamer d(CGCAAATTTGCG) and its complex with distamycin // Proc. Natl. Acad. Sci. USA. 1987. V. 84. P. 8385-8389.

72. Collado-Vides J. A linguistic representation of the regulation of transcription initiation. I. An ordered array of complex symbols with distinctive features // Biosystems. 1993. V. 29. P.87-104.

73. Collado-Vides J., Magasanik B., Gralla J.D. Control site location and transcriptional regulation in Escherichia coli II Microbiol. Rev. 1991. V. 55. P. 371-394.

74. Collinson S.K., Clouthier S.C., Doran J.L., Banser P.A., Kay W.W. Salmonella enterilidis agfBAC operon encoding thin, aggregative fimbriae //J. Bacteriol. 1996. V. 178. P. 662-667.

75. Condon C., Squires C., Squires C.L. Control of rRNA transcription in Escherichia coli II Microbiol. Rev. 1995. V. 59. P. 623-645.

76. Craig J.E., Boyle D., Francis K.P., Gallagher M.P. Expression of the cold-shock gene cspB in Salmonella typhimurium occurs below a threshold temperature I I Microbiology. 1998. V. 144. P.697-704.

77. Cramer A., Auchter M., Frunzke J., Bott M., Eikmanns B.J. RamB, the transcriptional regulator of acetate metabolism in Corynebacterium glutamicum, is subject to regulation by RamA and RamB // J. Bacteriol. 2007. V. 189. P. 1145-1149.

78. Cramer A., Eikmanns B.J. RamA, the transcriptional regulator of acetate metabolism in Corynebacterium glutamicum, is subject to negative autoregulation // J. Mol. Microbiol. Biotechnol. 2007. V. 12. P. 51-59.

79. Crothers D.M., Haran T.E., Nadeau J.G. Intrinsically bent DNA II J. Biol. Chem. 1990. V. 265. P. 7093-7096.

80. Daniels D., Zuber P., Losick R. Two amino acids in an RNA polymerase a factor involved in the recognition of adjacent base pairs in the -10 region of a cognate promoter // Proc. Natl. Acad. Sci. USA. 1990. V. 87. P. 8075-8079.

81. Darwin K.H., Miller V.L. Type III secretion chaperone-dependent regulation:activation of virulence genes by SicA and InvF in Salmonella typhimurium II EMBO J. 2001. V. 20. P. 1850-1862.

82. Davids W., Zhang Z. The impact of horizontal gene transfer in shaping operons and protein interaction networks direct evidence of preferential attachment // BMC Evol. Biol. 2008. V. 8. Article №23.

83. De la Cruz M.A., Fernandez-Mora M., Guadarrama C., Flores-Valdez M.A., Bustamante V.II., Vazquez A., Calva E. LeuO antagonizes II-NS and StpA-dependent repression in Salmonella enterica ompSl II Mol. Microbiol. 2007. V. 66. P. 727-743.

84. De Santis P., Palleschi A., Savino M., Scipioni A. Validity of the nearest-neighbor approximation in the evaluation of the electrophoretic manifestations of DNA curvature // Biochemistry. 1990. V. 29. P. 9269-9273.

85. Dekhtyar M., Morin A., Sakanyan V. Triad pattern algorithm for predicting strong promoter candidates in bacterial genomes // BMC Bioinform. 2008. V. 9. Article № 233.

86. Delgado M.A., Mouslim C., Groisman E.A. The PmrA/PmrB and RcsC/YojN/RcsB systems control expression of the Salmonella O-antigen chain length determinant // Mol. Microbiol. 2006. V. 60. P. 39-50.

87. Demeler B., Zhou G. Neural network optimization for E. coli promoter prediction // Nucl. Acids Res. 1991. V. 19. P. 1593-1599.

88. Dickerson R.E. Helix structure and molecular recognition by B-DNA / Oxford handbook of nucleic acid structure. Edited by S. Neidle. Oxford: Oxford University Press, 1999. P.145-197.

89. Diekmann S., Langowski J. Supercoiling couples DNA curvature to the"overall shape and the internal motion of the DNA molecule in solution // J. Mol. Struct. (Theochem). 1995. V. 336. P. 227-234.

90. Dietrich C., Nato A., Bost B., Le Marechal P., Guyonvarch A. Regulation of Idh expression during biotin-limited growth of Corynebaclerium glutamicwn II Microbiology. 2009. V. 155. P. 1360-1375.

91. DiGabriele A.D., Sanderson M.R., Steitz T.A. Crystal lattice packing is important in determining the bend of a DNA dodecamer containing an adenine tract // Proc. Natl. Acad. Sci. USA. 1989. V. 86. P. 1816-1820.

92. DiGabriele A.D., Steitz T.A. A DNA dodecamer containing an adenine tract crystallizes in a unique lattice and exhibits a new bend // J. Mol. Biol. 1993. V. 231. P. 1024-1039.

93. Djordjevic M. Redefining Escherichia coli a70 promoter elements: -15 motif as a complement of the-10 motif//J. Bacteriol. 2011. V. 193. P. 6305-6314.

94. Dombroski A.J., Walter W.A, Record M.T.Jr, Siegele D.A., Gross C.A. Polypeptides containing highly conserved regions of transcription initiation factor a70 exhibit specificity of binding to promoter DNA // Cell. 1992. V. 70. P. 501-512.

95. Dombroski A.J., Walter W.A., Gross C.A. Amino-terminal amino acids modulate a-factor DNA-binding activity // Gen. Dev. 1993. V. 7. P. 2446-2455.

96. Dobrindt U., Hochhut B., Hentschel U., Hacker J. Genomic islands in pathogenic andenvironmental microorganisms //Nat. Rev. Microbiol. 2004. V. 2. P. 414-424.

97. Dornenburg J.E., DeVita A.M., Palumbo M.J., Wade J.T. Widespread antisense transcription in Escherichia coli И mBio. 2010. V. 1. Article № e00024-10,

98. Doucleff M., Malak L.T., Pelton J.G., Wemmer D.E. The C-terminal RpoN domain of a54 forms an unpredicted helix-turn-helix motif similar to domains of a70 // J. Biol. Chem. 2005. V. 280. P. 41530-41536.

99. Doucleff M., Pelton J.G., Lee P.S., Nixon B.T., Wemmer D.E. Structural basis of DNA recognition by the alternative sigma-factor, a54 // J. Mol. Biol. 2007. V. 369. P. 1070-1078.

100. Dove S.L., Darst S.A., Hochschild A. Region 4 of a as a target for transcription regulation // Mol. Microbiol. 2003. V. 48. P. 863-874.

101. Down T.A., Hubbard T.J.P. NestedMICA: sensitive inference of over-represented motifs in nucleic acid sequence //Nucl. Acids. Res. 2005. V. 33. P. 1445-1453.

102. Drew H.R., Travers A.A. DNA bending and its relation to nucleosome positioning // J. Mol. Biol. 1985. V. 186. P. 773-790.

103. Dubey G.P., Ben-Yehuda S. Intercellular nanotubes mediate bacterial communication //Cell. 201 I.V. 144. P. 590-600.

104. Ebright R.H. RNA polymerase-DNA interactions: structures of intermediate, open and elongation complexes // Cold Spring Harbor Symp. Quant. Biol. 1998. V. 63. P. 11-20.

105. Ebright R.H. RNA polymerase: structural similarities between bacterial RNA polymerase and eukaryotic RNA polymerase II // J. Mol. Biol. 2000. V. 304. P. 687-698.

106. Ebright R.II., Busby S. The Escherichia coli RNA polymerase a subunit: structure and function // Curr. Opin. Gen. Dev. 1995. V. 5. P. 197-203.

107. Edwards K.J., Brown D.G., Spink N., Skelly J.V., Neidle S. Molecular structure of the B-DNA dodecamer d(CGCAAATTTGCG)2. An examination of propeller twist and minor-groove water structure at 2-2 A resolution // J. Mol. Biol. 1992. V. 226. P. 1161-1173.

108. Elgrably-Weiss M., Park S., Schlosser-Silverman E., Rosenshine I., Imlay J., Altuvia S. A Salmonella enterica serovar Typhimurium hemA mutant is highly susceptible to oxidative DNA damage // J. Bacteriol. 2002. V. 184. P. 3774-3784.

109. Eng С., Asthana С., Aigle В., Hergalant S., Mari J.-F., Leblond P. A new data mining approach for the detection of bacterial promoters combining stochastic and combinatorial methods//J. Comput. Biol. 2009. V. 16. P. 1211-1225.

110. Engels V., Wendisch V.F. The DeoR-type regulator SugR represses expression of ptsG in Corynebacterium glutamicum II J. Bacteriol. 2007. V. 189. P. 2955-2966.

111. Espariz M., Checa S.K., Audero M.E.P., Pontel L.B., Soncini F.C. Dissecting the Salmonella response to copper // Microbiology. 2007. V. 153. P. 2989-2997.

112. Estrem S.T., Gaal Т., Ross W., Gourse R.L. Identification of an UP element consensus sequence for bacterial promoters // Proc. Natl. Acad. Sei. USA. 1998. V. 95. P. 9761-9766.

113. Falconi M., Prosseda G., Giangrossi M., Beghetto E., Colonna B. Involvement of FIS in the H-NS-mediated regulation of virF gene of Shigella and enteroinvasive Escherichia coli II Mol. Microbiol. 2001. V. 42. P. 439^152.

114. Feklistov A., Darst S.A. Structural basis for promoter -10 element recognition by the bacterial RNA polymerase a subunit//Cell. 201 l.V. 147. P. 1257-1269.

115. Feng X., Oropeza R., Kenney L.J. Dual regulation by phospho-OmpR of ssrA/B gene expression in Salmonella pathogenicity island 2 // Mol. Microbiol. 2003. V. 48. P. 1131-1143.

116. Feng X., Walthers D., Oropeza R., Kenney L.J. The response regulator SsrB activates transcription and binds to a region overlapping OmpR binding sites at Salmonella pathogenicity island 2 // Mol. Microbiol. 2004. V. 54. P. 823-835.

117. Fenton M.S., Lee S.J., Gralla J.D. Escherichia coli promoter opening and -10 recognition: mutational analysis of a70 // EMBO J. 2000. V. 19. P. 1130-1137.

118. Fernandez-Mora M., Puente J.L., Calva E. OmpR and LeuO positively regulate the Salmonella enterica serovar Typhi ompS2 porin gene // J. Bacteriol. 2004. V. 186. P. 2909-2920.

119. Field Y., Kaplan N., Fondufe-Mittendorf Y., Moore I.K., Sharon E.-, Lubling Y., Widom J., Segal E. Distinct modes of regulation by chromatin encoded through nucleosome positioning signals // PLoS Comput. Biol. 2008. V. 4. Article № el000216.

120. Flores-Valdez M.A., Puente J.L., Calva E. Negative osmoregulation of the Salmonella ompSl porin gene independently of OmpR in an hns background // J. Bacteriol. 2003. V. 185. P. 6497-6506.

121. Friedel M., Nikolajewa S., Suhnel J., Wilhelm T. DiProDB: a database for dinucleotide properties // Nucl. Acids Res. 2009. V. 36. P. D37-D40.

122. Frunzke J., Bramkamp M., Schweitzer J.-E., Bott M. Population heterogeneity in Corynebacterium glutamicum ATCC 13032 caused by prophage CGP3 11 J. Bacteriol. 20086. V. 190. P. 5111-5119.

123. Gaal T., Rao L., Estrem S.T., Yang J., Wartell R.M., Gourse R.L. Localization of the intrinsically bent DNA region upstream of the E. coli rrnB PI promoter // Nucl. Acids Res. 1994. V. 22. P. 2344-2350.

124. Galas D.J., Eggert M., Waterman M.S. Rigorous pattern-recognition methods for DNA sequences. Analysis of promoter sequences from Escherichia coli II J. Mol. Biol. 1985. V. 186. P.117-128.

125. Gallegos M.-T., Buck M. Sequences in aN determining holoenzyme formation and properties//J. Mol. Biol. 1999. V. 288. P. 539-553.

126. Gardella T., Moyle H., Susskind M.M. A mutant Escherichia coli a70 subunit of RNA polymerase with altered promoter specificity // J. Mol. Biol. 1989. V. 206. P. 579-590.

127. Gemmill R.M., Jones J., I-Iaughn G., Calvo J.M. Transcription initiation sites of the leucine operons of Salmonella typhimurium and Escherichia coli II J. Mol. Biol. 1983. V. 170. P. 39-59.

128. Georgi T., Engels V., Wendisch V.F. Regulation of L-lactate utilization by the FadR-type regulator LldR of Corynebacterium glutamicum II J. Bacteriol. 2008. V. 190. P. 963-971.

129. Gershenzon N.I., Stormo G.D., Ioshikhes LP. Computational technique for improvement of the position-weight matrices for the DNA/protein binding sites // Nucl. Acids. Res. 2005. V. 33. P. 2290-2301.

130. Gcrstmeir R., Wendisch V.F., Schnicke S., Ruan H., Farwick M., Reinscheid D., Eikmanns B.J. Acetate metabolism and its regulation in Corynebacterium glutamicum II J. Biotechnol. 2003. V. 104. P. 99-122.

131. Ghosh T., Bose D., Zhang X. Mechanisms for activating bacterial RNA polymerase // FEMS Microbiol. Rev. 2010. V. 34. P. 611-627.

132. Gil F., Hernandez-Lucas I., Polanco R., Pacheco N., Collao B., Villarreal J.M., Nardocci G., Calva E., Saavedra C.P. SoxS regulates the expression of the Salmonella enterica serovar Typhimurium ompW gene // Microbiology. 2009. V. 155. P. 2490-2497.

133. Gillen K.L., Hughes K.T. Molecular characterization of flgM, a gene encoding a negative regulator of flagellin synthesis in Salmonella typhimurium // J. Bacteriol. 1991. V. 173. P.6453-6459.

134. Gimenes F., Takeda K.I., Fiorini A., Gouveia F.S., Fernandez M.A. Intrinsically bent DNA in replication origins and gene promoters // Gen. Mol. Res. 2008. V. 7. P. 549-558.

135. Goecke M., Gallant C., Suntharalingam P., Martin N.L. Salmonella typhimurium DsbA is growth-phase regulated II FEMS Microbiol. Lett. 2002. V. 206. P. 229-234.

136. Golubeva Ye.A., Slauch J.M. Salmonella enterica serovar Typhimurium periplasmic superoxide dismutase SodCI is a member of the PhoPQ regulon and is induced in macrophages // J. Bacteriol. 2006. V. 188. P. 7853-7861.

137. Goldman S.R., Sharp J.S, Vvedenskaya I.O., Livny J., Dove S.L., Nickels B.E. NanoRNAs prime transcription initiation in vivo // Mol. Cell. 2011. V. 42. P. 817-825.

138. Goldrick D., Yu G.-Q., Jiang S.-Q., Hong J.-S. Nucleotide sequence and transcription start point of the phosphoglycerate transporter gene of Salmonella typhimurium II J. Bacteriol. 1988. V. 170. P. 3421-3426.

139. Gopel Y., Luttmann D., Ileroven A.K., Reichenbach B., Dersch P., Gorke B. Common and divergent features in transcriptional control of the homologous small RNAs GlmY and GlmZ in Enterobacteriaceae //Nucl. Acids Res. 2011. V. 39. P. 1294-1309.

140. Gourse R.L., Ross W., Gaal T. UPs and downs in bacterial transcription initiation: the role of the alpha subunit of RNA polymerase in promoter recognition // Mol. Microbiol. 2000. V. 37. P. 687-695.

141. Grainger D.C., Iiurd D., Goldberg M.D., Busby S.J.W. Association of nucleoid proteins with coding and non-coding segments of the Escherichia coli genome // Nucl. Acids Res. 2006. V. 34. P. 4642^1652.

142. Gralla J.D., Carpousis A.J., Stefano J.E. Productive and abortive initiation of transcription in vitro at the lac UV5 promoter//Biochemistry. 1980. V. 19. P. 5864-5869.

143. Griffith F. The significance of pneumococcal types // J. I-Iyg. 1928. V. 27. P. 113-159.

144. Gross C.A, Chan C., Dombroski A., Gruber T., Sharp T., Tupy J., Young B. The function and regulatory roles of sigma factors in transcription // Cold Spring Harbor Symp. Quant. Biol. 1998. V. 63. P. 141-155.

145. Grossman A.D., Erickson J.W., Gross C.A. The htpR gene product of E. coli is a sigma factor for heat-shock promoters // Cell. 1984. V. 38. P. 383-390.

146. Gruber T.M., Gross C.A. Multiple sigma subunits and the partitioning of bacterial transcription space // Annu. Rev. Microbiol. 2003. V. 57. P. 441-466.

147. Guo Y., Lew C.M., Gralla J.D. Promoter opening by a54 and a70 RNA polymerases: o factor-directed alterations in the mechanism amd tightness of control // Gen. Dev. 2000. V. 14. P.2242-2255.

148. Gunn J.S., Alpuche-Aranda C.M., Loomis W.P., Belden W.J., Miller S.I. Characterization of the Salmonella lyphimwium pagC/pagD chromosomal region // J. Bacteriol. 1995. V. 177. P. 5040-5047.

149. Guo Y., Wang L., Gralla J.D. A fork junction DNA-protein switch that controls promoter melting by the bacterial enhancer-dependent sigma factor // EMBO J. 1999. V. 18. P. 3736-3745.

150. Gur-Arie R., Cohen C.J., Eitan Y., Shelef L., Hallerman E.M, Kashi Y. Simple sequence repeats in Escherichia coli: abundance, distribution, composition, and polymorphism // Genome Res. 2000. V. 10. P. 62-71.

151. Hagerman P.J. Sequence-directed curvature of DNA // Annu. Rev. Biochem. 1990. V. 59. P. 755-781.

152. Haldenwang W.G., Losick R. Novel RNA polymerase c factor from Bacillus subtilis II Proc. Natl. Acad. Sci. USA. 1980. V. 77. P. 7000-7004.

153. Hamilton S., Miller C.G. Cloning and nucleotide sequence of the Salmonella typhimurium dcp gene encoding dipeptidyl carboxypeptidase // J. Bacteriol. 1992. V. 174. P. 1626-1630.

154. Ilan S.O., Inui M., Yukawa H. Expression of Corynebaclerium glutamicum glycolytic genes varies with carbon source and growth phase // Microbiology. 2007. V. 153. P. 2190-2202.

155. Ilan S.O., Inui M., Yukawa II. Transcription of Corynebacterium glutamicum genes involved in tricarboxylic acid cycle and glyoxylate cycle // J. Mol. Microbiol. Biotechnol. 2008. V. 15. P. 264—276.

156. Haran T.E., Crothers D.M. Cooperativity in A-tract structure and bending properties of composite T„A„ blocks // Biochemistry. 1989. V. 28. P. 2763-2767.

157. Haran T.E., Mohanty U. The unique structure of A-tracts and intristic DNA bending // Quart. Rev. Biophys. 2009. V. 42. P. 41-81.

158. Harley C.B., Reynolds R.P. Analysis of E. coli promoter sequences // Nucl. Acids Res. 1987. V. 15. P. 2343-2361.

159. Harr R., Ilaggstrom M., Gustafsson P. Search algorithm for pattern match analysis ofnucleic acid sequences //Nucl. Acids Res. 1983. V. 11. P. 2943-2957.

160. Haugen S.P., Berkmen M.B., Ross W., Gaal T., Ward C., Gourse R.L. rRNA promoter regulation by nonoptimal binding of a region 1.2: an additional recognition element for UNA polymerase // Cell. 2006. V. 125. P. 1069-1082.

161. Haugen S.P., Ross W., Gourse R.L. Advances in bacterial promoter recognition and its control by factors that do not bind DNA // Nat. Rev. Microbiol. 2008a. V. 6. P. 507-519.

162. Haugen S.P., Ross W., Manrique M., Gourse R.L. Fine structure of the promoter-a region 1.2 interaction // Proc. Natl. Acad. Sci. USA. 2008b. V. 105. P. 3292-3297.

163. Hawley D.K., McClure W.R. Compilation and analysis of Escherichia coli promoter sequences//Nucl. Acids Res. 1983. V. 11. P. 2237-2255.

164. Helmann J.D. Compilation and analysis of Bacillus subtilis aA-dependent promoter sequences: evidence for extended contact between RNA polymerase and upstream promoter DNA // Nucl. Acids Res. 1995. V. 23. P. 2351-2360.

165. Helmann J.D. The extracytoplasmic function (ECF) sigma factors // Adv. Microb. Physiol. 2002. V. 46. P. 47-110.

166. Helmann J.D., dellaseth P.L. Protein-nucleic acid interactions during open complex formation investigated by systematic alteration of the protein and DNA binding partners // Biochemistry. 1999. V. 38. P. 5959-5967.

167. Henkin T.M. Transcription termination control in bacteria // Curr. Opin. Microbiol. 2000. V.3.P. 149-153.

168. Hertz G.Z., Stormo G.D. Escherichia coli promoter sequences: analysis and prediction // Meth. Enzymol. 1996. V. 273. P. 30^12.

169. Ilirsch M., Elliott T. Fis regulates transcriptional induction of RpoS in Salmonella enterica // J. Bacteriol. 2005. V. 187. P. 1568-1580.

170. Hook-Barnard I.G., Hinton D.M. Transcription initiation by mix and match elements: flexibility for polymerase binding to bacterial promoters // Gene Regul. Syst. Biol. 2007. V. LP. 275-293.

171. Horton P.B., Kanehisa M. An assessment of neural network and statistical approaches for prediction of E. coli promoter sites // Nucl. Acids Res. 1992. V. 20. P. 4331-4338.

172. Hosid S., Bolshoy A. New elements of the termination of transcription in prokaryotes //J. Biomol. Struct. Dyn. 2004. V. 22. P. 347-354.

173. Hsu L.M. Promoter clcarance and escape in prokaryotes // Biochim. Biophys. Acta. 2002. V. 1577. P. 191-207.

174. Huang C.J., Barrett E.L. Sequence analysis and expression of the Salmonella typhimurium asr operon encoding production of hydrogen sulfide from sulfite // J. Bacteriol.1991. V. 173. P. 1544-1553.

175. Huang Q., Cheng X., Cheung M.K., Kiselev S.S., Ozoline O.N., Kwan H.S. High-density transcriptional initiation signals underline gcnomic islands in bacteria // PLoS ONE. 2012. V. 7. Article №e33759.

176. I-Iuerta A.M., Collado-Vides J. Sigma70 promoters in Escherichia coli: specific transcription in dense regions of overlapping promoter-like signals // J. Mol. Biol. 2003. V. 333. P. 261-278.

177. Iluth J.R., Bewley C.A., Nissen M.S., Evans J.N., Reeves R., Gronenborn A.M., Clore G.M. The solution structure of an HMG-I(Y)-DNA complex defines a new architectural minor groove binding motif//Nat. Struct. Biol. 1997. V. 4. P. 657-665.

178. Ibanez-Ruiz M., Robbe-Saule V., Ilermant D., Labrude S., Norel F. Identification of RpoS (as)-regulated genes in Salmonella enterica serovar Typhimurium // J. Bacteriol. 2000. V. 182. P. 5749-5756.

179. Ikebe T., Iyoda S., Kutsukake K. Promoter analysis of the class 2 flagellar operons of Salmonella II Gen. Genet. Syst. 1999a. V. 74. P. 179-183.

180. Ikebe T., Iyoda S., Kutsukake K. Structure and expression of the JliA operon of Salmonella typhimurium II Microbiology. 19996. V. 145. P. 1389-1396.

181. Ishihama A. Subunit assembly of Escherichia coli RNA polymerase // Adv. Biophys. 1981. V. 14. P. 1-35.

182. Ishihama A. Functional modulation of Escherichia coli RNA polymerase // Annu. Rev. Microbiol. 2000. V. 54. P. 499-518.

183. Iyer L.M., Koonin E.V., Aravind L. Evolutionary connection between the catalytic subunits of DNA-dependent RNA polymerases and eukaryotic RNA-dependent RNA polymerases and the origin of RNA polymerases // BMC Struct. Biol. 2003. V. 3. Article № 1.

184. Iyer V., Struhl K. Poly(dA:dT), a ubiquitous promoter element that stimulates transcription via its intrinsic DNA structure // EMBO J. 1995. V. 14. P. 2570-2579.

185. Izaurralde E., Kas E., Laemmli U.K. Highly preferential nucleation of histone III assembly on scaffold-associated regions //J. Mol. Biol. 1989. V. 210. P. 573-585.

186. Jacques P.-E., Rodrigue S., Gaudreau L., Goulet J., Brzezinski R. Detection of prokaryotic promoters from the genomic distribution of hexanucleotide pairs // BMC Bioinform. 2006. V. 7. Article №423.

187. Jarmer II., Larsen T.S., Krogh A., Saxild H.II., Brunak S., Knudsen S. Sigma A recognition sites in the Bacillus subtilis genome // Microbiology. 2001. V. 147. P. 2417-2424.

188. Jeon Y.H., Yamazaki T., Otomo T., Ishihama A., Kyogoku Y. Flexible linker in the RNA polymerase alpha subunit facilitates the independent motion of the C-terminal activator contact domain // J. Mol. Biol. 1997. V. 267. P. 953-962.

189. Julias M., van der Meer J.R., Gaillard M., Harding R.M., Hood D.W., Crook D.W. Genomic islands: tools of bacterial horizontal gene transfer and evolution // FEMS Microbiol. Rev. 2009. V. 33. P. 376-393.

190. Kabanov A.V., Komarov V.M. Polymorphism of hydrogen bonding in the short double helixes of oligonucleotides: semiempirical quantum chemical study // Int. J. Quant. Chem. 2002. V. 88. P. 579-587.

191. Kanhere A, Bansal M. A novel method for prokaryotic promoter prediction based on DNA stability // BMC Bioinform. 2005. V. 6. Atricle № 1.

192. Karlin S„ Blaisdell B.E., Sapolsky R.J., Cardon L., Burge C. Assessments of DNA inhomogeneities in yeast chromosome III //Nucl. Acids Res. 1993. V. 21. V. 703-711.

193. Karlinsey J.E., Pease A.J., Winkler M.E., Bailey J.L., Hughes K.T. The flk gene of Salmonella typhimurhim couples flagellar P- and L-ring assembly to flagellar morphogenesis // J. Bacteriol. 1997. V. 179. P. 2389-2400.

194. Katahira M., Sugeta II., Kyogoku Y., Fujii S., Fujisawa R., Tomita K. One- and two-dimensional NMR studies on the conformation of DNA containing the oligo(dA)o!igo(dT) tract //Nucl. Acids Res. 1988. V. 16. P. 8619-8632.

195. Katti M.V., Ranjekar P.K., Gupta V.S. Differential distribution of simple sequence repeats in eukaryotic genome sequences // Mol. Biol. Evol. 2001. V. 18. P. 1161-1167.

196. Kazmierczak M.J., Wiedmann M., Boor K.J. Alternative sigma factors and their roles in bacterial virulence // Microbiol. Mol. Biol. Rev. 2005. V. 69. P. 527-543.

197. Keane O.M., Dorman C.J. The gyr genes of Salmonella enterica serovar Typhimurium are repressed by the factor for inversion stimulation, Fis // Mol. Gen. Genomics. 2003. V. 270. P. 56-65.

198. Kehres D.G., Janakiraman A., Slauch J.M., Maguire M.E. Regulation of Salmonella enterica serovar Typhimurium mntH transcription by II2O2, Fe2+, and Mn2+ // J. Bacteriol. 2002. V. 184. P. 3151-3158.

199. Keilty S., Rosenberg M. Constitutive function of a positively regulated promoter reveals new sequences essential for activity // J. Biol. Chem. 1987. V. 262. P. 6389-6395.

200. Kim B.I-L, Bang I.S., Lee S.Y., Hong S.K., Bang S.H., Lee I.S., Park Y.K.Expression of cspH, encoding the cold shock protein in Salmonella enterica serovar Typhimurium UK-1 //J. Bacteriol. 2001. V. 183. P. 5580-5588.

201. Kim M.-J., Lim S., Ryu S. Molecular analysis of the Salmonella typhimurium tdc operon regulation//J. Microbiol. Biotechnol. 2008. V. 18. P. 1024-1032.

202. Kintanar A., Klevit R.E., Reid B.R. Two-dimensional NMR investigation of a bent DNA fragment: assignment of the proton resonances and preliminary structure analysis // Nucl. Acids Res. 1987. V. 15. P. 5845-5862.

203. Kiryu H., Oshima T., Asai K. Extracting relations between promoter sequences and their strengths from microarray data // Bioinformatics. 2005. V. 21. P. 1062-1068.

204. Kobayashi M., Nagata K., Ishihama A. Promoter selectivity of Escherichia coli RNA polymerase: effect of base substitutions in the promoter -35 region on promoter strength // Nucl. Acids Res. 1990. V. 18. P. 7367-7372.

205. Komarov V.M., Polozov R.V., Konoplev G.G. Non-planar structure of nitrous bases and noncoplanarity of Watson-Crick pairs // J. Theor. Biol. 1992. V. 155. P. 281-294.

206. Koo H.S., Crothers D.M. Calibration of DNA curvature and a unified description of sequence-directed bending // Proc. Natl. Acad. Sei. USA. 1988. V. 85. P. 1763-1767.

207. Koo H.S., Drak J., Rice J.A., Crothers D.M. Determination of the extent of DNA bending by an adenine-thymine tract // Biochemistry. 1990. V. 29. P. 4227-4234.

208. Koo H.S., Wu I-I.M., Crothers D.M. DNA bending at adenine.thymine tracts // Nature. 1986. V. 320. P. 501-506.

209. Koonin E.V., Wolf Y.I. Genomics of bacteria and archaea: the emerging dynamic view of the prokaryotic world //Nucl. Acids Res. 2008. V. 36. P. 6688-6719.

210. Kozobay-Avraham L., Hosid S., Bolshoy A. Involvement of DNA curvature in intergenic regions of prokaryotes //Nucl. Acids Res. 2006. V. 34. P. 2316-2327.

211. Kremer W., Klenin K., Diekmann S., Langowski J. DNA curvature influences the internal motions of supercoiled DNA //EMBO J. 1993. V. 12. P. 4407-4412.

212. Krug A., Wendisch V.F., Bott M. Identification of AcnR, a TetR-type repressor of the aconitase gene acn in Corynebacterium glutamicum II J. Biol. Chem. 2005. V. 280. P. 585-595.

213. Kunkel G.R., Martinson II.G. Nucleosomes will not form on double-stranded RNA or over poly(dA).poly(dT) tracts in recombinant DNA // Nucl. Acids Res. 1981. V. 9. P. 68696888.

214. Kutsukake K., Ide N. Transcriptional analysis of the flgK and fliD operons of Salmonella typhimurium which encode flagellar hook-associated proteins // Mol. Gen. Genet. 1995. V. 247. P. 275-281.

215. Lang A.S., Zhaxybayeva O., Beatty J.T. Gene transfer agents: phage-like elements of genetic exchange //Nat. Rev. Microbiol. 2012. V. 10. P. 472^182.

216. Laundon C.IL, Griffith J.D. Curved helix segments can uniquely orient the topology of supertwisted DNA // Cell. 1988. V. 52. P. 545-549.

217. Lavigne M., Roux P., Buc II., Schaeffer F. DNA curvature controls termination of plus strand DNA synthesis at the centre of HIV-1 genome // J. Mol. Biol. 1997. V. 266. P. 507-524.

218. Lavigne M., Buc IT. Compression of the DNA minor groove is responsible for termination of DNA synthesis by IIIV-1 reverse transcriptase // J. Mol. Biol. 1999. V. 285. P. 977-995.

219. Lawrence C., Reilly A. An expectation maximization (EM) algorithm for the identification and characterization of common sites in unaligned biopolymer sequences // Proteins. 1990. V. 7. P. 41-51.

220. Lawrence C., Altschul S., Boguski M., Liu J., Neuwald A., Wootton J. Detecting subtle sequence signals: a Gibbs sampling strategy for multiple alignment // Science. 1993. V. 262. P. 208-214.

221. Lawrence J.G., Ochman II. Molecular archaeology of the Escherichia coli genome // Proc. Natl. Acad. Sci. USA. 1998. V. 95. P. 9413-9417.

222. Lazarevic V., Dusterhoft A., Soldo B., Hilbert II., Mauel C., Karamata D. Nucleotide sequence of the Bacillus subtilis temperate bacteriophage SP3c2 // Microbiology. 1999. V. 145. P.1055-1067.

223. Lederberg J., Tatum E.L. Gene recombination in Escherichia coli II Nature. 1946. V. 158. P. 558.

224. Lee E.-J., Groisman E.A. An antisense RNA that governs the expression kinetics of a multifunctional virulence gene // Mol. Microbiol. 2010. V. 76. P. 1020-1033.

225. Lee W., Tillo D., Bray N., Morse R.H., Davis R.W., Hughes T.R., Nislow C. A highresolution atlas of nucleosome occupancy in yeast //Nat. Genetics. 2007. V. 39. P. 1235-1244.

226. Lee D.J., Minchin S.D., Busby S.J.W. Activating transcription in bacteria // Annu. Rev. Microbiol. 2012. V. 66. P. 125-152.

227. Lejona S., Aguirre A., Cabeza M.L., Vescovi E.G., Soncini F.C. Molecular characterization of the Mg2+-responsive PhoP-PhoQ regulon in Salmonella enterica II J. Bacterid. 2003. V. 185. P. 6287-6294.

228. Leroy J.L., Charretier E., Kochoyan M., Gueron M. Evidence from base-pair kinetics for two types of adenine tract structures in solution: their relation to DNA curvature // Biochemistry. 1988. V. 27. P. 8894-8898.

229. Letek M., Valbuena N. Ramos A., Ordonez E., Gil J.A., Mateos L.M.Characterization and use of catabolite-repressed promoters from gluconate genes in Corynebacterium glutamicum H J. Bacteriol. 2006. V. 188. P. 40iM23.

230. Letek M., Ordonez E., Fiuza M., Honrubia-Marcos P., Vaquera J., Gil J.A., Mateos L.M. Characterization of the promoter region of ftsZ from Corynebacterium glutamicum and controlled overexpression of FtsZ 11 Int. Microbiol. 2007. V. 10. P. 271-282.

231. Levene S.D., Wu H.M., Crothers D.M. Bending and flexibility of kinetoplast DNA // Biochemistry. 1986. V. 25. P. 3988-3995.

232. Leung S., Mellish C., Robertson D. Basic Gene Grammars and DNA-ChartParser for language processing of Escherichia coli promoter DNA sequences // Biolinformatics. 2001. V. 17. P. 226-236.

233. Li X.Y., McClure W.R. Characterization of the closed complex intermediate formed during transcription initiation by Escherichia coli RNA polymerase II J. Biol. Chem. 1998. V. 273. P. 23549-23557.

234. Lightfield J., Fram N.R., Ely B. Across bacterial phyla, distantly-related genomes with similar genomic GC content have similar patterns of amino acid usage // PLoS ONE. 2011. V. 6. Article № el7677.

235. Lilja A.E., Jenssen J.R., Kalin J.D. Geometric and dynamic requirements for DNA looping, wrapping and unwrapping in the activation of E. coli glnAp2 transcription by NtrC // J. Mol. Biol. 2004. V. 342. P. 467-478.

236. Lim S., Yun J., Yoon II., Park C., Kim B., Jeon B., Kim D., Ryu S. Mlc regulation of Salmonella pathogenicity island I gene expression via hilE repression // Nucl. Acids Res. 2007. V. 35. P.1822-1832.

237. Lin Y.C., Choi W.S., Gralla J.D. TFIIH XPB mutants suggest a unified bacterial-like mechanism for promoter opening but not escape // Nat. Struct. Mol. Biol. 2005. V. 12. P. 603607.

238. Linial M., Shlomai J. Sequence-directed bent DNA helix is the specific binding site for Crithidia fascicular nicking enzyme // Proc. Natl. Acad. Sci. USA. 1987. V. 84. P. 8205-8209.

239. Lisser S., Margalit H. Compilation of E. coli mRNA promoter sequences // Nucl. Acids Res. 1993. V. 21. P. 1507-1516.

240. Liu Y., Bondarenko V., Ninfa A., Studitsky V.M. DNA supercoiling allows enhancer action over a large distance // Proc. Natl. Acad. Sci. USA. 2001. V. 98. P. 14883-14888.

241. Lombardo M.J., Lee A.A., Knox T.M., Miller C.G. Regulation of the Salmonella typhimurium pepT gene by cyclic AMP receptor protein (CRP) and FNR acting at a hybrid CRP-FNR site // J. Bacteriol. 1997. V. 179. P. 1909-1917.

242. Lonetto M.A., Rhodius V., Lamberg K., Kiley P., Busby S., Gross C. Identification of a contact site for different transcription activators in region 4 of the Escherichia coli RNA polymerase a70 subunit // J. Mol. Biol. 1998. V. 284. P. 1353-1365.

243. Losick R, Pero J. Cascades of sigma factors // Cell. 1981. V. 25. P. 582-584.

244. Lostroh C.P., Bajaj V., Lee C.A. The cis requirements for transcriptional activation by HilA, a virulence determinant encoded on SPI-1 // Mol. Microbiol. 2000. V. 37. P. 300-315.

245. Lostroh C.P., Lee C.A. The HilA box and sequences outside it determine themagnitude of HilA-dependent activation of Pprgn from Salmonella pathogenicity island 1 // J. Bacteriol. 2001. V. 183. P. 4876-4885.

246. Lu Q., Wallrath L.L., Elgin S.C. Nucleosome positioning and gene regulation // J. Cell. Biochem. 1994. V. 55. P. 83-92.

247. Lukashin A.V., Anshelevich V.Y., Amikikyan B.R., Gragerov A.J., Frank-Kamenetsky M.D. Neural network models for promoter recognition // J. Biomol, Struct. Dyn. 1989. V. 6. P. 1123-1133.

248. Lukes J., I-Iashimi II., Zikova A. Unexplained complexity of the mitochondrial genome and transcriptome in kinetoplastid flagellates // Curr. Genet. 2005. V. 48. P. 277-299.

249. Maeda H., Fujita N., Ishihama A. Competition between seven Escherichia coli a subunits: relative binding affinities to the core RNA polymerase // Nucl. Acids Res. 2000. V. 28. P.3497-3503.

250. Magnet S., Courvalin P., Lambert T. Activation of the cryptic aac(69)-Iy aminoglycoside resistance gene of Salmonella by a chromosomal deletion generating a transcriptional fusion // J. Bacteriol. 1999. V. 181. P. 6650-6655.

251. Mahadevan I., Ghosh I. Analysis of E. coli promoter structures using neural networks //Nucl. Acids Res. 1994. V. 22. P. 2158-2165.

252. Main-I-Iester K.L., Colpitts K.M., Thomas G.A., Fang F.C., Libby S.J. Coordinate regulation of Salmonella pathogenicity island 1 (SPI1) and SPI4 in Salmonella enterica serovar Typhimurium 11 Infect. Immun. 2008. V. 76. P. 1024-1035.

253. Mallios R.R., Ojcius D.M., Ardell D.H. An iterative strategy combining biophysical criteria and duration hidden Markov models for structural predictions of Chlamydia trachomatis a66 promoters // BMC Bioinform. 2009. V. 10. Article № 271.

254. Mares R., Urbanowski M.L., Stauffer G.V. Regulation of the Salmonella typhimurium metA gene by the MetR protein and homocysteine // J. Bacteriol. 1992. V. 174. P. 390-397.

255. Marini J.C., Levene S.D., Crothers D.M., Englund P.T. Bent helical strucutre in kinetoplast DNA // Proc. Natl. Acad. Sci. USA. 1982. V. 79. P. 7664-7668.

256. Mashburn-Warren L.M., Whiteley M. Special delivery: vesicle trafficking in prokaryotes // Mol. Microbiol. 2006. V. 61. P. 839-846.

257. Matthews K.S. DNA looping // Microbiol. Rev. 1992. V. 56. P. 123-136.

258. Maurelli A.T., Sansonetti P.J. Identification of a chromosomal gene controlling temperature-regulated expression of Shigella virulence // Proc. Natl. Acad. Sci. USA. 1988. V. 85. P. 2820-2824.

259. Mavrich T.N., Ioshikhes I.P., Venters B.J., Jiang C., Tomsho L.P., Q.i J., Schuster S.C., Albert I., Pugh B.F. A barrier nucleosome model for statistical positioning of nucleosomes throughout the yeast genome // Genome Res. 2008. V. 18. P. 1073-1083.

260. Mazel D. Intégrons: agents of bacterial evolution // Nat. Rev. Microbiol. 2006. V. 4. P. 608-620.

261. McClure W.R. Mechanism and control of transcription initiation in prokaryotes // Annu. Rev. Biochem. 1985. V. 54. P. 171-204.

262. McClure W.R., Cech C.L. On the mechanism of rifampicin inhibition of RNA synthesis // J. Biol. Chem. 1978. V. 253. P. 8949-8956.

263. McFarland K.A., Dorman C.J. Autoregulated expression of the gene coding for the leucine-responsive protein, Lrp, a global regulator in Salmonella enterica serovar Typhimurium // Microbiology. 2008a. V. 154. P. 2008-2016.

264. Merighi M., Septer A., Carroll-Portillo A., Bhatiya A., Porwollik S., McClelland M., Gunn J. Genome-wide analysis of the PreA/PreB (QseB/QseC) regulon of Salmonella enterica serovar Typhimurium // BMC Microbiol. 2009. V. 9. Article № 42.

265. Merrick M., Chambers S. The helix-turn-helix motif of a54 is involved in recognition of the-13 promoter region //J. Bacteriol. 1992. V. 174. P. 7221-7226.

266. Mirkovitch J., Mirault M.E., Laemmli U.K. Organization of the higher-order chromatin loop: specific DNA attachment sites on nuclear scaffold // Cell. 1984. V. 39. P. 223232.

267. Miroslavova N.S., Busby S.J.W. Investigations of the modular structure of bacterial promoters // Biochem. Soc. Symp. 2006. V. 73. P. 1-10.

268. Mitchell J.E., Zheng D., Busby S.J.W., Minchin S.D. Identication and analysis of "extended -10" promoters in Escherichia coli II Nucl. Acids Res. 2003. V. 31. P. 4689-4695.

269. Mouslim C., Groisman E.A. Control of the Salmonella ugd gene by three two-component regulatory systems // Mol. Microbiol. 2003. Y. 47. P. 335-344.

270. Mukhamedyarov D., Makarova K.S., Severinov K., Kuznedelov K. Francisella RNA polymerase contains a heterodimer of non-identical a subunits // BMC Mol. Biol. 2011. V. 12. Article № 50.

271. Munch R., Ililler K„ Grote A., Scheer M., Klein J., Schobert M., Jahn D. Virtual Footprint and PRODORIC: an integrative framework for regulon prediction in prokaryotes // Bioinformatics. 2005. V. 21. P. 4187-4189.

272. Murakami K.S., Darst S.A. Bacterial RNA polymerases: the wholo story // Curr. Opin. Struct. Biol. 2003. V. 13. P. 31-39.

273. Murakami K.S., Masuda S., Campbell E.A., Muzzin O., Darst S.A. Structural basis of transcription initiation: an RNA polymerase holoenzyme-DNA complex // Science. 2002. V. 296. P. 1285-1290.

274. Nadeau J.G., Crothers D.M. Structural basis for DNA bending // Proc. Natl. Acad. Sci. USA. 1989. V. 86. P. 2622-2626.

275. Nakamura Y., Itoh T., Matsuda II., Gojobori T. Biased biological functions of horizontally transferred genes in prokaryotic genomes // Nat. Genetics. 2004. V. 36. P. 760-766.

276. Nakata K., Kanehisa M., Maizel J.V. Discriminant analysis of promoter regions in Escherichia coli sequences // Comput. Appl. Biosci. 1988. V. 4. P. 367-371.

277. Negishi T., Fujita N., Ishihama A. Structural map of the alpha subunit of Escherichia coli RNA polymerase: structural domains identified by proteolytic cleavage //J. Mol. Biol. 1995. V. 248. P. 723-728.

278. Nelson H.C., Finch J. T., Luisi B.F., Klug A. The structure of an oligo(dA).oligo(dT) tract and its biological implications //Nature. 1987. V. 330. P. 221-226.

279. Nishimura T., Vertes A.A., Shinoda Y., Inui M., Yukawa II. Anaerobic growth of Corynebacterium glutamicum using nitrate as a terminal electron acceptor // Appl. Microbiol. Biotechnol. 2007. V. 75. P. 889-897.

280. Norte V.A., Stapleton M.R., Green J. PhoP-responsive expression of the Salmonella enlerica serovar Typhimurium slyA gene // J. Bacteriol. 2003. V. 185. P. 3508-3514.

281. Nudler E., Gottesman M.E. Transcription termination and anti-termination in E. coli II Genes Cells. 2002. V. 7. P. 755-768.

282. Olson W.K., Marky N.L., Jernigan R.L., Zhurkin V.B. Influence of fluctuations on DNA curvature. A comparison of flexible and static wedge models of intrinsically bent DNA // J. Mol. Biol. 1993. V. 232. P. 530-554.

283. O'Neill M.C. Escherichia coli promoters: neural networks develop distinct descriptions in learning to search for promoters of different spacing classes // Nucl. Acids Res. 1992. V. 20. P. 3471-3478.

284. O'Neill M.C. Training back-propagation neural networks to define and detect DNA-binding sites//Nucl. Acids Res. 1991. V. 19. P. 313-318.

285. Okibe N., Suzuki N., Inui M., Yukawa H. Isolation, evaluation and use of two strong, carbon source-inducible promoters from Corynebacterium glutamicum II Lett. Appl. Microbiol. 2010. V. 50. P. 173-178.

286. Olekhnovich I.N., Kadner R.J. DNA-binding activities of the I-IilC and HilD virulence regulatory proteins of Salmonella enterica serovar Typhimurium // J. Bacteriol. 2002. V. 184. P. 4148-4160.

287. Olekhnovich I.N., Kadner R.J. Role of nucleoid-associated proteins I-Iha and H-NS in expression of Salmonella enterica activators HilD, HilC, and RtsA required for cell invasion // J. Bacteriol. 2007. V. 189. P. 6882-6890.

288. Opalka N., Brown J., Lane W.J., Twist K.A., Landick R., Asturias F.J., Darst S.A. Complete structural model of Escherichia coli RNA polymerase from a hybrid approach // PLoS Biol. 2010. V. 8. Article № el000483.

289. Oshima T., Ishikawa S., Kurokawa K., Aiba II., Ogasawara N. Escherichia coli histone-like protein H-NS preferentially binds to horizontally acquired DNA in association with RNA polymerase // DNA Res. 2006. V. 13. P. 141-153.

290. Osterberg S., del Peso-Santos T., Shingler V. Regulation of alternative sigma factor use // Annu. Rev. Microbiol. 2011. V. 65. P. 37-55.

291. Ostrowski J., Jagura-Burdzy G., Kredich N.M. DNA sequences of the cysB regions of Salmonella typhimurium and Escherichia coli II J. Biol. Chem. 1987. V. 262. P. 5999-6005.

292. Ostrowski J., Kredich N.M. Negative autoregulation of cysB in Salmonella typhimurium: in vitro interactions of CysB protein with the cysB promoter 11 J. Bacteriol. 1991. V. 173. P.2212-2218.

293. Ostrowski J., Kredich N.M. Molecular characterization of the cysJIH promoters of Salmonella typhimurium and Escherichia coli: regulation by cysB protein and N-acetyl-L-serine //J. Bacteriol. 1989. V. 171. P. 130-140.

294. Osuna R., Lienau D., Hughes K.T., Johnson R.C. Sequence, regulation, and functions offis in Salmonella typhimurium II J. Bacteriol. 1995. V. 177. P. 2021-2032.

295. Ozoline O.N., Deev A.A. Predicting antisense RNAs in the genomes of Escherichia coli and Salmonella typhimurinm using promoter-search algorithm PlatProm // J. Bioinf. Comput. Biol. 2006. V. 4. P. 443-454.

296. Ozoline O.N., Deev A.A., Arkhipova M.V. Noncanonical sequence elements in the promoter structure. Cluster analysis of promoters recognized by Escherichia coli RNA polymerase //Nucl. Acids Res. 1997. V. 25. P. 4703-4709.

297. Ozoline O.N., Deev A.A., Arkhipova M.V., Chasov V.V., Travers A. Proximal transcribed regions of bacterial promoters have non-random distribution of A/T-tracts // Nucl. Acids Res. 1999a. V. 27. P. 4768^1774.

298. Ozoline O.N., Deev A.A., Trifonov E.N. DNA bendability — a novel feature in E. coli promoter recognition // J. Biomol. Struct. Dyn. 1999b. V. 16. P. 825-831.

299. Ozoline O.N., Fujita N., Ishihama A. Mode of DNA-protein interaction between the C-terminal domain of Escherichia coli RNA polymerase a subunit and T7D promoter UP element//Nucl. Acids Res. 2001. V. 29. P. 4909^1919.

300. Ozoline O.N., Fujita N., Ishihama A. Transcription activation mediated by the carboxyl-terminal domain of the RNA polymerase a-subunit. Multipoint monitoring using a fluorescent probe//J. Biol. Chem. 2000. V. 275. P. 1119-1127.

301. Ozsolak F., Song J.S., Liu X.S., Fisher D.E. High-throughput mapping of the chromatin structure of human promoters //Nat. Biotechnol. 2007. V. 25. P. 244-248.

302. Patek M., Nesvera J., Guyonvarch A., Reyes O., Leblon G. Promoters of Corynebacterium glutamicum II J. Biotechnol. 2003. V. 104. P. 311-323.

303. Paget M.S.B., Helmann J.D. The a70 family of sigma factors // Genome Biol. 2003. V. 4. Article № 203.

304. Panosa A., Roca I., Gibert I. Ribonucleotide reductases of Salmonella Typhimurium: transcriptional regulation and differential role in pathogenesis // PLoS ONE. 2010; V. 5. Article № el 1328.

305. Paul B.J., Ross W., Gaal T., Gourse R.L. rRNA transcription in Escherichia coli II Annu. Rev. Genet. 2004. V. 38. P. 749-770.

306. Pedersen A.G., Engelbrecht J. Investigation of Escherichia coli promoter sequences with artificial neural networks: new signals discovered upstream of the transcriptional startpoint //Proc. Int. Conf. Intell. Syst. Mol. Biol. 1995. V. 3. P. 292-299.

307. Perez J.C., Groisman E.A. Transcription factor function and promoter architecture govern the evolution of bacterial regulons // Proc. Natl. Acad. Sei. USA. 2009. V. 106. P. 43194324.

308. Perez-Martin J., de Lorenzo V. Clues and consequences of DNA bending in transcription//Annu. Rev. Microbiol. 1997. V. 51. P. 593-628.

309. Perez-Martin J., Rojo F., de Lorenzo V. Promoters responsive to DNA bending: a common theme in prokaryotic gene expression // Microbiol. Rev. 1994. V. 58. P. 268-290.

310. Perez-Rueda E., Collado-Vides J. The repertoire of DNA binding transcriptional regulators in Escherichia coli K-12 //Nucl. Acids Res. 2000. V. 28. P. 1838-1847.

311. Perdue S.A., Roberts J.W. a70-dependent transcription pausing in Escherichia coli II J. Mol. Biol. 2011. V. 412. P. 782-792.

312. Persson B.C., Bjork G.R. Isolation of the gene (miaE) encoding the hydroxylase involved in the synthesis of 2-methylthio-c/.y-ribozeatin in tRNA of Salmonella typhimurium and characterization of mutants //J. Bacteriol. 1993. V. 175. P. 7776-7785.

313. Pescaretti M.M., Lopez F.E., Morero R.D., Delgado M.A. Transcriptional autoregulation of the RcsCDB phosphorelay system in Salmonella enterica serovar Typhimurium//Microbiology. 2010. V. 156. P. 3513-3521.

314. Pescaretti M.M., Morero R., Delgado M.A. Identification of new promoter for the response regulator rcsB expression in Salmonella enterica serovar Typhimurium // FEMS Microbiol. Lett. 2009. V. 300. P. 165-173.

315. Peters J.M., Vangeloff A.D., Landick R. Bacterial transcription terminators: the RNA 3'-end chronicles // J. Mol. Biol. 2011. V. 412. P. 793-813.

316. Petersen L., Larsen T.S., Ussery D.W., On S.L.W., Krogh A. RpoD promoters in Campylobacter jejuni exhibit a strong periodic signal instead of a -35 box // J. Mol. Biol. 2003. V. 326. P. 1361-1372.

317. Pfannschmidt C., Langowski J. Superhelix organization by DNA curvature as measured through site-specific labeling // J. Mol. Biol. 1998. V. 275. P. 601-611.

318. Plamann L.S., Stauffer G.V. Nucleotide sequence of the Salmonella typhimurium metR gene and the metR-metE control region // J. Bacteriol. 1987. V. 169. P. 3932-3937.

319. Platts A.E., Quayle A.K., Krawetz S.A. In silico prediction and observations of nuclear matrix attachment // Cell. Mol. Biol. Lett. 2006. V. 11. P. 191-213.

320. Pontel L.B., Perez Audero M.E., Espariz M., Checa S.K., Soncini F.C. GolS controls the response to gold by the hierarchical induction of Salmonella-spccific genes that include a CBA efflux-coding operon // Mol. Microbiol. 2007. V. 66. P. 814-825.

321. Presnell S.R., Cohen F.E. Artificial neural networks for pattern recognition in biochemical sequences // Annu. Rev. Biophys. Biomol. Struct. 1993. V. 22. P. 283-298.

322. Pribnow D. Nucleotide sequence of an RNA polymerase binding site at an early T7 promoter // Proc. Natl. Acad. Sci. USA. 1975. V. 72. P. 784-788.

323. Price M.N., Dehal P.S., Arkin A.P. Horizontal gene transfer and the evolution of transcriptional regulation in Escherichia coli II Genome Biol. 2008. V. 9. Article № R4.

324. Prosseda G., Falconi M., Giangrossi M., Gualerzi C.O., Micheli G., Coionna B. The virF promoter in Shigella: more than just a curved DNA stretch // Mol. Microbiol. 2004. V. 51. P.523-537.

325. Prunell A. Nucleosome reconstitution on plasmid-inserted poly(dA).poly(dT) // EMBO J. 1982. V. 1. P. 173-179.

326. Puhl H.L., Gudibande S.R., Belie M.J. Polyd(A.T). and other synthetic polydeoxynucleotides containing oligoadenosine tracts form nucleosomes easily // J. Mol. Biol. 1991. V. 222. P. 1149-1160.

327. Purtov Yu.A., Ishihama A., Ozoline O.N. Free dimer of E. coli RNA polymerase a subunit is a potential transcription regulator // J. Biomol. Struct. Dyn. 2005. V. 22. P. 796.

328. Ragan M.A., Beiko R.G. Lateral genetic transfer: open issues // Phil. Trans. R. Soc. B. 2009. V. 364. P. 2241-2251.

329. Raghavan R., Groisman E.A., Ochman II. Genome-wide detection of novel regulatory RNAs in E. coli I I Genome Res. 2011. V. 21. P. 1487-1497.

330. Raibaud O., Schwartz M. Positive control of transcription initiation in bacteria // Annu. Rev. Genet. 1984. V. 18. P. 173-206.

331. Rajkumari K., Ishihama A., Gowrishankar J. Evidence for transcription attenuation rendering cryptic a as-dependent promoter of the osmotically regulated proU operon of Salmonella typhimurium II J. Bacteriol. 1997. V. 179. P. 7169-7173.

332. Ramachandran V.K., Shearer N., Jacob J.J., Sharma C.M., Thompson A. Thearchitecture and ppGpp-dependent expression of the primary transcriptome of Salmonella Typhimurium during invasion gene expression // BMC Genomics. 2012. V. 13. Article № 25.

333. Rauch C.A., Perez-Morga D., Cozzarelli N.R., Englund P.T. The absence of supercoiling in kinetoplast DNA minicircles //EMBO J. 1993. V. 12. P. 403-411.

334. Reeves R., Nissen M.S. The A.T-DNA-binding domain of mammalian high mobility group I chromosomal proteins. A novel peptide motif for recognizing DNA structure // J. Biol. Chem. 1990. V. 265. P. 8573-8582.

335. Reppas N.B., Wade J.T., Church G.M., Struhl K. The transition between transcriptional initiation and elongation in E. coli is highly variable and often rate limiting // Mol. Cell. 2006. V. 24. P. 747-757.

336. Rhodes D. Nucleosome cores reconstituted from poly(dA-dT) and the octamer of histones//Nucl. Acids Res. 1979. V. 6. P. 1805-1816.

337. Richter-Dahlfors A.A., Andersson D.I. Analysis of an anaerobically induced promoter for the cobalamin biosynthetic genes in Salmonella typhimurium II Mol. Microbiol. 1991. V. 5. P. 1337-1345.

338. Riggs D.L., Mueller R.D., Kwan H.-S., Artz S.W. Promoter domain mediates guanosine tetraphosphate activation of the histidinc operon // Proc. Natl. Acad. Sei. USA. 1986. V. 83. P. 9333-9337.

339. Rippe K., Schräder A., Riede P., Strohner R., Lehmann E., Langst G. DNA sequence- and conformation-directed positioning of nucleosomes by chromatin-remodeling complexes // Proc. Natl. Acad. Sei. USA. 2007. V. 104. P. 15635-15640.

340. Rivetti C., Guthold M., Bustamante C. Wrapping of DNA around the E. coli RNA polymerase open promoter complex 11 EMBO J. 1999. V. 18. P. 4464-4475.

341. Rombel I., North A., Hwang I., Wyman C., Kustu S. The bacterial enhancer-binding protein NtrC as a molecular machine // Cold Spring Harbor Symp. Quant. Biol. 1998. V. 63. P. 157-166.

342. Romling U., Bian Z., Hammar M., Sierralta W.D., Normark S. Curli fibers are highly conserved between Salmonella typhimurium and Escherichia coli with respect to operon structure and regulation // J. Bacteriol. 1998. V. 180. P. 722-731.

343. Rosenberg M., Court D. Regulatory sequences involved in the promotion and termination of RNA transcription//Annu. Rev. Genet. 1979. V. 13. P. 319-353.

344. Rosenshine I., Tchelet R., Mevarech M. The mechanism of DNA transfer in the mating system of an archaebacterium // Science. 1989. V. 245. P. 1387-1389.

345. Ross W., Gosink K.K., Salomon J., Igarashi K., Zou C., Ishihama A., Severinov K., Gourse R.L. A third recognition element in bacterial promoters: DNA binding by the a subunit of RNA polymerase// Science. 1993. V. 262. P. 1407-1413.

346. Ross W., Ernst A., Gourse R.L. Fine structure of E. coli RNA polymerase-promoter interactions: a subunit binding to the UP element minor groove // Gen. Dev. 2001. V. 15. P. 491-506.

347. Ross W., Schneider D.A., Paul B.J., Mertens A., Gourse R.L. An intersubunit contact stimulating transcription initiation by E. coli RNA polymerase: interaction of the a C-terminal domain and a region 4 // Gen. Dev. 2003. V. 17. P. 1293-1307.

348. Rubio A., Downs D.M. Elevated levels of ketopantoate hydroxymethyltransferase (PanB) lead to a physiologically significant coenzyme A elevation in Salmonella enterica serovar Typhimurium Hi. Bacteriol. 2002. V. 184. P. 2827-2832.

349. Sanderson A., Mitchell J.E., Minchin S.D., Busby S.J.W. Substitutions in the1.SEscherichia coli RNA polymerase a factor that affect recognition of extended -10 elements at promoters // FEBS Lett. 2003. V. 544. P. 199-205.

350. Satclnvell S.C., Drew H.R., Travers A.A. Sequence periodicities in chicken nucleosome core DNA // J. Mol. Biol. 1986. V. 191. P. 659-675.

351. Schechter L.M., Damrauer S.M., Lee C.A. Two AraC/XylS family members can independently counteract the effect of repressing sequences upstream of the hilA promoter // Mol. Microbiol. 1999. V. 32. P. 629-642.

352. Schechter L.M., Jain S., Akbar S., Lee C.A. The small nucleoid-binding proteins I-I-NS, HU, and Fis affect hilA expression in Salmonella enterica serovar Typhimurium // Infect. Immun. 2003. V. 71. P. 5432-5435.

353. Schleif R. DNA looping//Annu. Rev. Biochem. 1992. V. 61. P. 199-223.

354. Schnitzler G.R. Control of nucleosome positions by DNA sequence and remodeling machines//Cell. Biochem. Biophys. 2008. V. 51. P. 67-80.

355. Schreiner M.E., Fiur D., Holatko J., Patek M., Eikmanns B.J. El enzyme of the pyruvate dehydrogenase complex in Corynebacterium glutamicum: molecular analysis of the gene and phylogenetic aspects Hi. Bacteriol. 2005. V. 187. P. 6005-6018.

356. Schroder J., Jochmann N., Rodionov D.A., Tauch A. The Zur regulon of Corynebacterium glutamicum ATCC 13032 // BMC Genomics. 2010. V. 11. Article № 12.

357. Schweitzer J.-E., Stolz M., Diesveld R., Etterich II., Eggeling L. The serine hydroxymethyltransferase gene glyA in Corynebacterium glutamicum is controlled by GlyR // J. Biotechnol. 2009. V. 139. P. 214-221.

358. Seeburg P.H., Nusslein C., Schaller I-I. Interaction of RNA polymerase with promoters from bacteriophage fd // Eur. J. Biochem. 1977. V. 74. P. 107-113.

359. Segal E., Fondufe-Mittendorf Y., Chen L., Thastrom A., Field Y., Moore I.K., Wang J.P., Widom J. A genomic code for nucleosome positioning // Nature. 2006. V. 442. P. 772-778.

360. Segal E., Widom E. Poly(dA:dT) tracts: major determinants of nucleosome organization // Curr. Opin. Struct. Biol. 2009. V. 19. P. 65-71.

361. Sharma C.M., Darfeuille F., Plantinga T.II., Vogel J. A small RNA regulates multiple ABC transporter inRNAs by targeting C/A-rich elements inside and upstream of ribosome-binding sites // Gen. Dev. 2007. V. 21. P. 2804-2817.

362. Shavkunov K.S., Masulis I.S., Tutukina M.N., Deev A.A., Ozoline O.N. Gains and unexpected lessons in genome-scale promoter mapping // Nucl. Acids Res. 2009. V. 37. P. 4419-4431.

363. Shavkunov K.S., Tutukina M.N., Masulis I.S., Ozoline O.N. Promoter islands: the novel elements in bacterial genomes // J. Biomol. Struct. Dyn. 2011. V. 28. P. 1128-1129.

364. Shi Y., Latifi T., Cromie M.J., Groisman E.A. Transcriptional control of the antimicrobial peptide resistance ugtL gene by the Salmonella PhoP and SlyA regulatory proteins // J. Biol. Chem. 2004. V. 279. P. 38618-38625.

365. Shimizu M., Mori T., Sakurai T., Shindo H. Destabilization of nucleosomes by an unusual DNA conformation adopted by poly(dA).poly(dT) tracts in vivo IIEMBO J. 2000. V. 19. P. 3358-3365.

366. Shinhara A., Matsui M., Hiraoka K., Nomura W., Hirano R., Nakahigashi K., Tomita M., Mori II., Kanai A. Deep sequencing reveals as-yet-undiscovered small RNAs in Escherichia coli II BMC Genomics. 2011. V. 12. Article № 428.

367. Shukla R., Srivastava R.C. The statistical analysis of direct repeats in nucleic acid sequences // J. Appl. Prob. 1985. V. 22. P. 15-24.

368. Siegele D.A., Hu J.C., Walter W.A., Gross C.A. Altered promoter recognition by mutant forms of the a70 subunit of Escherichia coli RNA polymerase // J. Mol. Biol. 1989. V. 206. P.591-603.

369. Sierro N., Makita Y., de Hoon M., Nakai K. DBTBS: a database of transcriptional regulation in Bacillus subtilis containing upstream intergenic conservation information // Nucl. Acids Res. 2008. V. 36. P. D93-D96.

370. Sinoquet C., Demey S., Braun F. Large-scale computational and statistical analyses of high transcription potentialities in 32 prokaryotic genomes // Nucl. Acids Res. 2008. V. 36. P. 3332-3340.

371. Smits W.K., Grossman A.D. The transcriptional regulator Rok binds A+T-rich DNA and is involved in repression of a mobile genetic element in Bacillus subtilis II PLoS Genet. 2010. V. 6. Article № el001207.

372. Soncini F.C., Vescovi E.G., Groisman E.A. Transcriptional autoregulation of the Salmonella typhimurium phoPQ operon // J. Bacteriol. 1995. V. 177. P. 4364-4371.

373. Song J.S., Liu X., Liu X.S., He X. A high-resolution map of nucleosome positioning on a fission yeast centromere // Genome Res. 2008. V. 18. P. 1064-1072.

374. Sorensen K.I., Baker K.E., Kelln R.A., Neuhard J. Nucleotide pool-sensitive selection of the transcriptional start site in vivo at the Salmonella typhimurium pyrC and pyrD promoters 115. Bacteriol. 1993. V. 175. P. 4137^1144.

375. Southern E., Merrick M. 2000. The role of region II in the RNA polymerase a factoroN (a54) //Nucl. Acids Res. 2000. V. 28. P. 2563-2570.

376. Staden R. Computer methods to locate signals in nucleic acid sequences // Nucl. Acids Res. 1984. V. 12. P. 505-519.

377. Stapleton M.R., Norte V.A., Read R.C., Green J. Interaction of the Salmonella typhimurium transcription and virulence factor SlyA with target DNA and identification of members of the SlyA regulon // J. Biol. Chem. 2002. V. 277. P. 17630-17637.

378. Stevens A. Incorporation of the adenine ribonucleotide into RNA by cell fractions from E. coli B // Biochem. Biophys. Res. Commun. 1960. V. 3. P. 92-96.

379. Stormo G.D. Consensus patterns in DNA // Meth. Enzymol. 1990. V. 183. P. 211-221.

380. Stormo G.D. Motif discovery using expectation maximization and Gibbs' sampling // Meth. Mol. Biol. 2010. V. 674. P. 85-95.

381. Stormo G.D., Schneider T.D., Gold L., Ehrenfeucht A. Use of "Perceptron" algorithm to distinguish translational initiation sites inE. coli//Nucl. Acids Res. 1982. V. 10. P. 2997-3011.

382. Struhl K. Naturally occurring poly(dA-dT) sequences are upstream promoter elements for constitutive transcription in yeast // Proc. Natl. Acad. Sci. USA. 1985. V. 82. P. 8419-8423.

383. Sulavik M.C., Dazer M., Miller P.F. The Salmonella typhimurium mar locus: molecular and genetic analyses and assessment of its role in virulence // J. Bacteriol. 1997. V. 179. P. 1857-1866.

384. Suter B., Schnappauf G., Thoma F. Poly (dA.dT) sequences exist as rigid DNA structures in nucleosome-free yeast promoters in vivo // Nucl. Acids Res. 2000. V. 28. P. 4083-4089.

385. Szoke P.A., Allen T.L., deliaseth P.L. Promoter recognition by Escherichia coli RNA polymerase: effects of base substitutions in the -10 and -35 regions // Biochemistry. 1987. V. 26. P. 6188-6194.

386. Tartaglia L.A., Storz G., Ames B.N. Identification and molecular analysis of oxyR-regulated promoters important for the bacterial adaptation to oxidative stress // J. Mol. Biol. 1989. V. 210. P. 709-719.

387. Taylor M., Butler R., Chambers S., Casimiro M., Badii F., Merrick M. The RpoN-box motif of the RNA polymerase sigma factor gn plays a role in promoter recognition // Mol. Microbiol. 1996. V. 22. P. 1045-1054.

388. Theisen M., Kelln R.A., Neuhard J. Cloning and characterization of the pyrF operon of Salmonella typhimurium // Eur. J. Biochem. 1987. V. 164. P. 613-619.

389. Thomas C.M., Nielsen K.M. Mechanisms of, and barriers to, horizontal gene transfer between bacteria //Nat. Rev. Microbiol. 2005. V. 3. P. 711-721.

390. Thorner L.K., Fandl J.P., Artz S.W. Analysis of sequence elements important for expression and regulation of the adenylate cyclase gene (cya) of Salmonella typhimurium // Genetics. 1990. V. 125. P. 709-717.

391. Tinker J.K., Ilancox L.S., Clegg S. FimW is a negative regulator affecting type 1 fimbrial expression in Salmonella enterica serovar Typhimurium // J. Bacteriol. 2001. V. 183. P. 435-442.

392. Travers A.A. Promoter sequence for stringent control of bacterial ribonucleic acid synthesis//J. Bacteriol. 1980. V. 141. P. 973-976.

393. Tsen II., Levene S.D. Supercoiling-dependent flexibility of adenosine-tract-containing DNA detected by a topological method // Proc. Natl. Acad. Sci. USA. 1997. V. 94. P. 2817-2822.

394. Tu X., Latifi T., Bougdour A., Gottesman S., Groisman E.A. The PhoP/PhoQ two-component system stabilizes the alternative sigma factor RpoS in Salmonella enterica II Proc. Natl. Acad. Sci. USA. 2006. V. 103. P. 13503-13508.

395. Tucker A.C., Escalante-Semerena J.C. Biologically active isoforms of-CobB sirtuin deacetylase in Salmonella enterica and Envinia amylovora II J. Bacteriol. 2010. V. 192. P. 6200-6208.

396. Turnbough C.L.Jr. Regulation of gene expression by reiterative transcription // Curr. Opin. Microbiol. 2011. V. 14. P. 142-147.

397. Turnbull A.L., Kim W., Surette M.G. Transcriptional regulation of sdiA by cAMP receptor protein, LeuO, and environmental signals in Salmonella enterica serovar Typhimurium // Can. J. Microbiol. 2012. V. 58. P. 10-22.

398. Ulanovsky L., Bodner M., Trifonov E.N., Choder M Curved DNA: design, synthesis, and circularization // Proc. Natl. Acad. Sci. USA. 1986. P. 862-866.

399. Ulanovsky L.E., Trifonov E.N. Estimation of wedge components in curved DNA // Nature. 1987. V. 326. P. 720-722.

400. Urbanowski M.L., Plamann L.S., Stauffer G.V. Mutations affecting the regulation of the metB gene of Salmonella typhimurium LT2 // J. Bacteriol. 1987. V. 169. P. 126-130.

401. Urbanowski M.L., Stauffer G.V. Autoregulation by tandem promoters of the Salmonella typhimurium LT2 metJgene // J. Bacteriol. 1986. V. 165. P. 740-745.

402. Urbanowski M.L., Stauffer G.V. Nucleotide sequence and biochemical characterization of the metJ gene from Salmonella typhimurium LT2 // Nucl. Acids Res. 1985. V. 13. P. 673-685.

403. Vanet A., Marsan L., Sagot M.-F. Promoter sequences and algorithmical methods for identifying them//Res. Microbiol. 1999. V. 150. P. 779-799.

404. Vassylyev D.G., Sekine S., Laptenko O., Lee J., Vassylyeva M.N., Borukhov S., Yokoyama S. Crystal structure of a bacterial RNA polymerase holoenzyme at 2.6 A resolution // Nature. 2002. V. 417. P. 712-719.

405. Villesen P. FaBox: an online toolbox for FASTA sequences // Mol. Ecol. Notes. 2007. V. 7. P. 965-968.

406. Vockenhuber M.-P., Sharma C.M., Statt M.G., Schmidt D., Xu Z., Dietrich S., Liesegang II., Mathews D.H., Suess B. Deep sequencing-based identification of small noncoding RNAs in Streptomyces coelicolor IIRNA Biol. 2011. V. 8. P. 468-477.

407. Voskuil M.I., Chambliss G.II. The -16 region of Bacillus subtilis and other grampositive bacterial promoters //Nucl. Acids Res. 1998. V. 26. P. 3584-3590.

408. Voskuil M.I., Chambliss G.I-I. The TRTGn motif stabilizes the transcription initiation open complex Hi. Mol. Biol. 2002. V. 322. P. 521-532.

409. Vuthoori S., Bowers C.W, McCracken A., Dombroski A.J., Hinton D.M. Domain 1.1 of the a70 subunit of Escherichia coli RNA polymerase modulates the formation of stable polymerase/promoter complexes Hi. Mol. Biol. 2001. V. 309. P. 561-572.

410. Wada T., Tanabe Y., Kutsukake K. FliZ acts as a repressor of the ydiV gene, which encodes an anti-FlhD4C2 factor of the flagellar regulon in Salmonella enterica serovar Typhimurium // J. Bacteriol. 2011. V. 193. P. 5191 -5198.

411. Wade J.T., Roa D.C., Grainger D.C., Ilurd D., Busby S.J.W., Struhl K„ Nudler E. Extensive functional overlap between sigma factors in Escherichia coli II Nat. Struct. Mol. Biol.2006. V. 13. P. 806-814.

412. Wagner L.A., Weiss R.B., Driscoll R., Dunn D.S., Gesteland R.F. Transcriptional slippage occurs during elongation at runs of adenine or thymine in Escherichia coli II Nucl. Acids Res. 1990. V. 18. P. 3529-3535.

413. Waldburger C., Gardella T., Wong R., Susskind M.M. Changes in conserved region 2 of Escherichia coli o70 affecting promoter recognition//J. Mol. Biol. 1990. V. 215. P. 267-276.

414. Waldminghaus T., Ileidrich N., Brantl S., Narberhaus F. FourU: a novel type of RNA thermometer in Salmonella II Mol. Microbiol. 2007. V. 65. P. 413^24.

415. Wang IT., Benham C.J. Promoter prediction and annotation of microbial genomes based on DNA sequence and structural responses to superhelical stress // BMC Bioinform. 2006. V. 7. Atricle № 248.

416. Wang H., Noordewier M., Benham C.J. Stress-induced DNA duplex destabilization (SIDD) in the E. coli genome: SIDD sites are closely associated with promoters // Genome Res. 2004. V. 14. P. 1575-1584.

417. Wang L., Guo Y., Gralla J.D. Regulation of sigma 54-dependent transcription by core promoter sequences: role of-12 region nucleotides Hi. Bacteriol. 1999. V. 181. P. 7558-7565.

418. Whitehouse I., Tsukiyama T. Antagonistic forces that position nucleosomes in vivo II Nat. Struct. Mol. Biol. 2006. V. 13. P. 633-640.

419. Wiedenbeck J., Cohan F.M. Origins of bacterial diversity through horizontal genetic transfer and adaptation to new ecological niches // FEMS Microbiol. Rev. 2011. V. 35. P. 957-976.

420. Wigneslnveraraj S.R., Casaz P., Buck M. Correlating protein footprinting with mutational analysis in the bacterial transcription factor a54 (aN) //Nucl. Acids Res. 2002. V. 30. P. 1016-1028.

421. Wilms I., Overloper A., Nowrousian M., Sharma C.M., Narberhaus F. Deep sequencing uncovers numerous small RNAs on all four replicons of the plant pathogen Agrobacterium tumefaciens II RNA Biol. 2012. V. 9. P. 446^57.

422. Winther K.S., Gerdes K. Regulation of enteric vapBC transcription: induction by YapC toxin dimer-breaking //Nucl. Acids Res. 2012. V. 40. P. 4347-4357.

423. Wolffe A.P. Nucleosome positioning and modification: chromatin structures that potentiate transcription // Trends Biochem. Sci. 1994. V. 19. P. 240-244.

424. Wong C., Gralla J.D. A role for the acidic trimer repeat region of transcription factor a54 in setting the rate and temperature dependence of promoter melting in vivo II J. Biol. Chem. 1992. V. 267. P. 24762-24768.

425. Wosten M.M.S.M. Eubacterial sigma-factors // FEMS Microbiol. Rev. 1998. V. 22. P. 127-150.

426. Wosten M.M.S.M., Groisman E.A. Molecular characterization of the PmrA regulon // J. Biol. Chem. 1999. V. 274. P. 27185-27190.

427. Wozniak R.A., Waldor M.K. Integrative and conjugative elements: mosaic mobile genetic elements enabling dynamic lateral gene flow // Nat. Rev. Microbiol. 2010. V. 8. P. 552563.

428. Wu I-l.-M., Crothers D.M. The locus of sequence-directed and protein-induced DNA bending //Nature. 1984. V. 308. P. 509-513.

429. Xu K., Elliott T. An oxygen-dependent coproporphyrinogen oxidase encoded by the hemF gene of Salmonella typhimurium II J. Bacteriol. 1993. V. 175. P. 4990-4999.

430. Xu K., Elliott T. Cloning, DNA sequence, and complementation analysis of the Salmonella typhimurium hemN gene encoding a putative oxygen-independent coproporphyrinogen III oxidase // J. Bacteriol. 1994. V. 176. P. 3196-3203.

431. Yada T., Nakao M.,. Totoki Y. Nakai K. Modeling and predicting transcriptional units of Escherichia coli genes using hidden Markov models // Bioinformatics. 1999. V. 15. P. 987-993.

432. Yanagihara S., Iyoda S., Ohnishi K., lino T„ Kutsukake K. Structure and transcriptional control of the flagellar master operon of Salmonella typhimurium II Gen. Genet. Syst. 1999. V. 74. P. 105-111.

433. Yang J., Wang J., Chen L., Yu J., Dong J., Yao Z., Shen Y., Jin Q., Chen R. Identification and characterisation of simple sequence repeats in the genomes of Shigella species // Gene. 2003. V. 322. P. 85-92.

434. Youn J.-W., Jolkver E., Kramer R., Marin K., Wendisch V.F. Characterization of the dicarboxylate transporter DctA in Corynebacterium glutamicum // J. Bacteriol. 2009. V. 191. P. 5480-5488.

435. Youn J.-W., Jolkver E., Kramer R., Marin K., Wendisch V.F. Identification and characterization of the dicarboxylate uptake system DccT in Corynebacterium glutamicum II J. Bacteriol. 2008. V. 190. P. 6458-6466.

436. Young Y.A., Kim S.W., Yu J.E., Kim Y.H., Cha J., Oh J.-I., Eo S.K., Lee J.H., Kang

437. Y. Requirement of Fur for the full induction of dps expression in Salmonella enterica serovar Typhimurium // J. Microbiol. Biotechnol. 2007. V. 17. P. 1452-1459.

438. Yuan G.C., Liu Y.J., Dion M.F., Slack M.D., Wu L.F., Altschuler S.J., Rando O.J. Genome-scale identification of nucleosome positions in S. cerevisiae II Science. 2005. V. 309. P. 626-630.

439. Zakharova N., Hoffman P.S., Berg D.E., Severinov K. The largest subunits of RNA polymerase from gastric helicobacters are tethered // J. Biol. Chem. 1998. V. 273. P. 1937119374.

440. Zaharik M.L., Lamb S.S., Baker K.E., Krogan N.J., Neuhard J., Kelln R.A. Mutations in yhiT enable utilization of exogenous pyrimidine intermediates in Salmonella enterica serovar Typhimurium // Microbiology. 2007. V. 153. P. 2472-2482.

441. Zakharova N., Paster B.J., Wesley I., Dewhirst F.E., Berg D.E., Severinov K.V. Fused and overlapping rpoB and rpoC genes in Helicobacters, Campylobacters, and related bacteria//J. Bacteriol. 1999. V. 181. P. 3857-3859.

442. Zemanova M., Kaderabkova P., Patek M., Knoppova M., Silar R., Nesvera J. Chromosomally encoded small antisense RNA in Corynebacterium glutamicum II FEMS Microbiol. Lett. 2008. V. 279. P. 195-201.

443. Zhang N., Joly N., Buck M. A common feature from different subunits of a homomeric AAA+ protein contacts three spatially distinct transcription elements // Nucl. Acids Res. 2012. V. 40. P. 9139-9152.

444. Zhang Y., Feng Y., Chatterjee S., Tuske S„ Ho M.X., Arnold E., Ebright R.II. Structural basis of transcription initiation // Science. 2012. V. 338. P. 1076-1080.

445. Zhao G., Weatherspoon N., Kong W., Curtiss III R., Shi Y. A dual-signal regulatory circuit activates transcription of a set of divergent operons in Salmonella typhimurium II Proc. Natl. Acad. Sci. USA. 2008. V. 105. P. 20924-20929.

446. Zhao K., Kas E., Gonzalez E., Laemmli U.K. SAR-dependent mobilization of histone III by IIMG-I/Y in vitro-. HMG-I/Y is enriched in I-Il-depleted chromatin // EMBO J. 1993. V.12. P. 3237-3247.

447. Zhao K.X, Huang Y., Chen X., WangN.X, Liu S.J. PcaO positively regulates pcaHG of the beta-ketoadipate pathway in Corynebacterium glutamicum II J. Bacteriol. 2010a. V. 192. P. 1565-1572.

448. Zhao K., Liu M., Burgess R. Promoter and regulon analysis of nitrogen assimilation factor, o54, reveal alternative strategy for E. coli MG1655 flagellar biosynthesis I I Nucl. Acids. Res. 20106. V. 38. P. 1273-1283.

449. Zimmer C., Wahnert U. Nonintercalating DNA-binding ligands: specificity of the interaction and their use as tools in biophysical, biochemical and biological investigations of the genetic material // Progr. Biophys. Mol. Biol. 1986. V. 47. P. 31-112.

450. Zinder N.D., Lederberg J. Genetic exchange in Salmonella II J. Bacteriol. 1952. V. 64. P.679-699.