Бесплатный автореферат и диссертация по биологии на тему
Эволюция участков связывания бактериальных факторов транскрипции в последовательностях ДНК
ВАК РФ 03.00.02, Биофизика

Автореферат диссертации по теме "Эволюция участков связывания бактериальных факторов транскрипции в последовательностях ДНК"

На правах рукописи

Котельникова Екатерина Александровна

Эволюция участков связывания бактериальных факторов транскрипции в последовательностях ДНК

03 00 02 Биофизика

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук

- Москва 2005 -

Работа выполнена в лаборатории биоинформатики Государственного научно-исследовательского института генетики и селекции промышленных микроорганизмов ГосНИИ «Генетика»

Научные руководители:

кандидат физико-матемашческих наук, доктор биологических наук Гечьфанд Михаил Сергеевич кандидат физико-математических наук, Макеев Всеволод Юрьевич Официальные оппоненты:

доктор физико-математических наук, профессор

Туманян Владимир Гаевич

кандидат физико-математических наук

Алексеевский Андрей Вчадимирович

Ведущая организация:

Институт теоретической и экспериментальной биофизики РАН

Защита диссертации состоится « 23 » июня 2005 г в ч на заседании

Диссертационного совета К 501 001 08 при физическом факультете МГУ им M В Ломоносова, Москва, Ленинские горы, д 1, стр 2, физический факультет, аудитория *, у /-!

С диссертацией можно ознакомиться в библиотеке физического факультета МГУ им Ломоносова

Автореферат разослан « ч ^ » -1_2005 г

Ученый секретарь Диссертационного совета, кандидат физико-матемашческих наук

Хомутов Г Б

9 гз

Общая характеристика работы

Актуальность темы

Предсказание регуляции экспрессии генов является важным разделом компьютерной генетики и системной биологии Это связано с тем, что, с одной стороны, в настоящее время сравнительно легко осуществляется секвенирование геномов, а с другой - использование этой информации для описания возможного фенотипа встречает определенные трудности, обусловленные отставанием экспериментальной науки от темпов секвенирования

Связь генотипа и фенотипа у живых организмов осуществляется в первую очередь с помощью контроля экспрессии генов Одним из важнейших этапов регуляции экспрессии является специфическая инициация транскрипции, связанная с образованием сложных ДНК-белковых комплексов За последнее время в распоряжении исследователей появилось большое количество данных, включающих как последовательности взаимодействующих белков и ДНК, так и трехмерные структуры собственно ДНК-белковых комплексов Несмотря на весь этот значительный экспериментальный материал, понимание физико-химических процессов, происходящих при инициации транскрипции, до сих пор не достигнуто

За последние 20 лет было предложено несколько моделей, в которых описывалось переключение генов в ответ на изменение концентрации регуляторных факторов Подобные модели предсказывают некоторые особенности регуляции экспрессии генов у различных видов, геномы которых уже секвенированы В то же время, малые концентрации регуляторных факторов не позволяют осуществить экспериментальный выбор между этими моделями В этой связи, большое значение приобретают косвенные следствия тех или иных характеристик, которые бы позволяли определить физико-химические параметры ДНК-белкового взаимодействия В частности, актуальным является изучение закономерностей в изменении регуляторных областей различных генов родственных геномов, возникающих в ходе эволюции Особенности взаимодействия белковых факторов с регуляторными областями обуславливают ту или иную степень консервативности ДНК в регуляторных участках Это же взаимодействие определяет консервативность

аминокислот, входящих в ДНК-распознающие домены

Стремительное развитие биоинформатики, и связанный с ним быстрый рост доступных текстов ДНК, привело к появлению большого количества стандартных методов анализа последовательностей ДНК, позволяющих извлекать из них значительную информацию Например, при помощи исследования некодирующих участков генома можно определять потенциальные участки специфического связывания регуляторных белков с ДНК (регуляторные сигналы), что дает основания предполагать активацию или репрессию определенных генов этими регуляторными факторами Сравнительный анализ этих сигналов позволят делать выводы о характеристиках ДНК-белкового взаимодействия, например об аффинности свяшвания или о форме связывании белка с ДНК (в виде мономера или димера, взаимодействующего с одной или с разными нитями ДНК)

Кроме того, информация, полученная методами компьютерной биологии, позволяет предсказывать пути метаболизма плохо изученных видов прокариот В дальнейшем эти предсказания могут быть подтверждены или опровергнуты экспериментом, что делает разработку методов компьютерной геномики актуальной для обеспечения прогресса в биотехнологии и медицине

Цель и задачи исследования

Диссертация состоит из трех глав, в каждой из которых решаются различные, но связанные между собой задачи

Целью исследования, предсшвленного в первой главе, является применение современных методов сравнительной геномики к исследованию выработки антимикробных пептидов (бактериоцинов) и их регуляции у бактерий При этом решались следующие задачи'

• Описание структуры всех генетических локусов, содержащих гены, необходимые для выработки бактериоцинов в грамположительных бактериях

• Поиск в бактериальных геномах грамположительных бактерий новых генов, относящихся к системам выработки бактериоцинов

• Сравнительный анализ эволюции транскрипционных регуляторов и регуляторных

сигналов .систем- выработки' бактериоцинов • * -4-

Целью исследования, представленного во второй и третьей главах, является изучение

механизма распознавания регуляторных сигналов и эволюции этих сигналов В них

решались следующие задачи-

• Сравнение существующих подходов к распознаванию регуляторных сигналов, изучение доступных регуляторных сигналов, которые могут быть использованы в качестве обучающей выборки Разработка нового метода распознавания сигналов

• Изучение эволюции ортологичных регуляторных сайтов

Научная новизна и практическое значение

В работе впервые получены следующие результаты:

• Систематически описана структура всех локусов, содержащих гены регуляторных систем, транспорта, иммунитета, процессинга и посттрансляционной модификации антибактериальных пептидов для систем выработки антибактериальных пептидов (бактериоцинов) грамположительными бактериями.

• Для организма Streptococcus equi предсказана новая система выработки бактериоцинов.

• Показано, что эволюционное дерево транскрипционных регуляторов ответа системы выработки бактериоцинов соответствует дереву узнаваемых ими сайтов связывания; в соответствии с этим представлена классификация регуляторных систем.

• На основе анализа существующих способов распознавания регуляторных сигналов предложен новый подход к распознаванию

• Описан эффект ген-специфической эволюции регуляторных сайтов Показано, что в ортологичных сайтах неконсенсусные нуклеотиды сохраняются в большей степени, чем можно было ожидать, исходя из нейтральной модели Показано, что выбор нуклеотида обусловлен регулируемым геном Обсуждены возможные применения сделанного наблюдения для предсказания регуляторных систем в малоизученных организмах

Всё вышесказанное составляет практическую значимость работы и может представлять интерес для экспериментальной проверки

Апробация работы

Результаты работы представлялись на международных конференциях' 3-я конференция "Bioinformatics of Genome Regulation and Structure" (BGRS, Новосибирск, 2002), 1-я конференция "Moscow Conference on Computational Molecular Biology" (MCCMB, Москва, 2003), International Workshop "Structural approaches to sequence evolutions' Molecules, networks, populations" (STRAPP, Дрезден, 2004); Meeting of Howard Hughes International Research Scholars (Таллинн, 2004), VII Международная Энгельгардтовская конференция по молекулярной биологии (ICMB, Суздаль 2004)

По материалам диссертации опубликовано б печатных работ Объем и структура диссертации

Диссертация изложена на 110 с границах и состоит из введения, обзора литературы, описания материалов и методов, трех глав, и выводов В каждой главе содержится описание и обсуждения оригинальных результатов

Глава I посвящена генетическим аспектам выработки антибактериальных пептидов грамположительными бактериями Произведена классификация изученных регуляторных механизмов и предсказание системы выработки бактериоцинов в Streptococcus equi

Глава II посвящена анализу широко используемых для распознавания регуляторных сигналов моделей связывания транскрипционного фактора с ДНК, показаны недостатки и условия их применимости Предложен альтернативный подход для распознавания сигналов

Глава III содержит исследование эволюционных механизмов, действующих на регуляторные участки Показано давление отбора на неконсенсусные нуклеотиды сайтов связывания регуляторных белков

Список литературы, приведенный в конце диссертации, включает 150 наименований Работа содержит 5 рисунков и 11 таблиц

-6-

Содержание работы

Глава I. Предсказание и анализ транскрипционной регуляции выработки бактериоцинов

Большинство бактерий обладают способностью влиять на рост и развитие в среде других, обычно близкородственных, видов Часто этот процесс связан с выработкой этими бактериями белковых молекул, называемых бактериоцинами Бактериоцины грамположительных бактерий обычно подразделяются на три класса- класс I -лантибиотики, класс II - небольшие (<10 кДа), относительно термоустойчивые, немодифицированные бактериоцины; и класс III - большие, неустойчивые к изменениям температуры белки

Многие из грамположительных бактерий, вырабатывающих бактериоцины, обладают кворум-чувствительностью, т е способностью контролировать синтез различных белков в зависимости от плотности клеток в среде Для обеспечения этого механизма используется двухкомпонентная регуляторная система

Клетка синтезирует и преобразовывает небольшие сигнальные молекулы (феромоны, сигнальные пептиды), после чего секретирует их при помощи АТФ-зависимых транспортеров (ABC транспортеров) Эти феромоны являются входным сигналом для специфичных мембранных сенсорных белков, относящихся к бактериальной двухкомпонентной системе, в состав которой входят сенсор и регулятор ответа Сенсор, гистидинкиназа, при взаимодействии с феромоном фосфорилируется, после чего фосфорилирует регуляторный белок, который становится активным и запускает транскрипцию регулируемого оперона В составе опер она, как правило, находится пептид-предшественник сигнальной молекулы, что обеспечивает механизм авторегуляции

Ниже приведены результаты анализа генетических аспектов выработки бактериоцинов Для описания локусов выработки бактериоцинов и их регуляции в геномах стрептококков, для которых отсутствуют экспериментальные данные, были применены методы сравнительной геномики

Генетика выработки бактериоцинов

Гены, имеющие отношение к вырабо1ке бакюриоцинов, обычно организованы в мультигенные локусы, в организации которых можно выделить некоторые закономерности

Стандартные бактериоциновые геномные локусы содержат структурные гены (кодирующие бактериоцины), гены, ответственные за модификацию, процессинг, транспорт, иммунитет и регуляцию Вместе они образуют кластер с несколькими транскрипционными единицами, которые могут располагаться как на хромосоме, так и на мобильных элементах генома В работе приведены все известные классифицированные бактериоцины с подробным исследованием генетической организации соответствующих локусов.

Если в организме присутствует система кворум-чувствительности, то, как правило, гены, кодирующие сенсорный и регуляторный белок, располагаются друг за другом и транскрибируются совместно В локусах, связанных с выработкой лантибиотиков, сенсорный белок обычно следует за регуляторным, тогда как для бактериоцинов II класса часто порядок противоположный. Иногда перед описанными генами в том же опероне располагается ген сигнального пептида В случае бактериоцинов II класса зачастую (хотя и не всегда) феромон является одновременно и антибактериальным пептидом Непосредственно за структурным геном, как правило, следует ген, кодирующий белок иммунитета В некоторых организмах внутри генного кластера известны регулируемые промоторы и, на некотором расстоянии перед -35 областью, прямые повторы 9ти-10ти нуклеотидов, разделенные 12ю-14ю нп Эти повторы являются сайтами связывания соответствующих регуляторов ответа, тем самым, являясь важными элементами системы кворум-чувствительности

Регуляторные элементы системы выработки бактериоцинов класса II

Поскольку регуляторные повторы являются важным элементом для обеспечения транскрипционной регуляции выработки бактериоцинов, в работе приведены повторы, располагающиеся перед различными оперонами, ответственными за

выработку бактериоцинов TT класса Информация о большинстве оперонов была взята из литературы, после чего при помощи программы SignalX были найдены регуляторные участки в исследуемых локусах

На основе имеющихся данных производился поиск новых систем выработки бактериоцинов с использованием методов сравнительной геномики Для этого в доступных геномах идентифицировались гены, гомологичные известным генам бактериоциновых локусов в изученных геномах Это определяло потенциально важные для выработки бактериоцинов гены

Таким образом были описаны локусы выработки бактериоцинов класса II в геноме S equi. Один из этих локусов содержит транскрибируемые в одном направлении гены регулятора ответа и транспортного белка, другой -транскрибируемые навстречу друг другу гены транспорта, сходные с системой сотАВ в S pneumoniae, и гены двухкомпонентной системы

Для определения предположительных мест связывания регулятора ответа с ДНК, использовалась программа SignalX С ее помощью в геноме 5 pneumoniae производился поиск повторов заданного вида в некодируюхцих областях перед уже известными генами (или оперонами), предположительно значимыми для выработки бактериоцинов В результате были найдены повторы 11 н п., разделенных 10-ю н п. в областях перед различными генами Эти повторы в дальнейшем использовались как обучающая выборка для поиска регуляторных сигналов в S equi

По полученной таким образом выборке строилась матрица значимости нуклеотидов для каждой из позиций (весовая матрица) Используя процедуру поиска потенциальных сайтов программы GenomeExplorer, производился поиск похожих сайтов во всех доступных полных геномах грамположительных бактерий Варьируя параметры поиска, в геноме S equi были найдены повторы, похожие на повторы пневмоцинового локуса (см Таблицу 1) Эти повторы располагались в областях 3' от генов, связанных с выработкой бактериоцинов При более детальном исследовании с использованием процедуры ДНК-белкового выравнивания, на близлежащих участках генома, не содержащих аннотированных генов, были обнаружены небольшие последовательности, гомологичные последовательностям генов бактериоцин-подобных пептидов в S pneumoniae и Streptococcus thermophilus

ТАБЛИЦА 1. РЕГУЛЯТОРНЫЕ ПОВТОРЫ БАКТЕРИОЦИНОВ КЛАССА II.

Бактериоцины | Гены |Последовательности

Группа 1 (21,10)

Сакацин Р (Lactobacillus sake) sppT tgcagcatTAACGTTAATtttgataaacgTAACGTTAATggataatc

spplP agagttctTAACGTTAATccqaaaaaaacTAACGTTAATattaaaaa

sppA gcgcatatTAACGTTTAAccgataaagttGAACGTTAATattttttt

Плантарицин А (Lactobacillus plantarum) plnM gaattattGTACGATAATatctaaaaataTTACGTTTATaaaaatat

plnG' aaaattatGTACGTTAATagatagttggcATACGATAACatttgtta

plnJ ctttcaagTTACGTTAAAtcgattaaataGTACGATAACaaatttaa

plnA atggtgatTCACGTTTAAatttaaaaaatGTACGTTAATagaaataa

plnG1 cctgatgaGGACATTTATcataaaattatGTACGTTAATagatagtt

plnE ttggtattTGACGTTAAGagaacgtttttTTACTTTTATaatttttt

Группа 2 (22, 10)

Энтероцин А (Enterococcus faeci um) entT aaatttgATTCAGGAATgaaaaagttagtGTTCAAGAACtgttttea

entA aattcttATTCAGGAATtattttgctacgTTTCAAGAAGgaattgtt

orfl ttttactATTCAAGAATaaacttgataagTTTCAGGAAGatttttac

Сакацин А (Lactobacillus sake) orf4 tttaaccATTCAGGAATgatttctgtaagGTTCAGGAATttatttct

sapA gcaccctGTTTAGGAATgattictgtaggCTTCAAGAAGttatgcca

Карнобактериоцины (Carnoba с t еп um piscicola) cbnA aatcttcTTTTAGGACAtcaatcagtagtGTTCAGGATAtttttgac

cbaX tttattcATTCAAGACTatattcgatgttGTTCAGGATGttttttaa

cbnS tttattcATTCAAGACCgtattcgatgtaGTTCAGGATGttttttca

cbnB2 ttatttcATTTATGAATtcaaataccctgGTTCAAGATGtattttcc

cbnBMI TCGAGATAcgtttatccatgGTTCAGGATGattttatс

Orf5 tttctttTTTCAAGAACtcaaacaaataaGCTCAGGATGttttcacc

Группа 2- (21, 11)

Пневмоцины (Streptococcus pneumoniae) blpX/pncM tttaacaATTCAAGATGTttcgatgacaATTCAAGATTTggatgaaa

blpU aaagctaATTCAAGACGTttcgatgccaATTCAAGATTTggatgaaa

blpl/pncA aaagctaATTCAAGACGTttcgatgacaATTCAAGATCTggatgaaa

blpM/pncI ttttgcaATTCAAGACGTttcgatgactATTCAAAATCTggatgaaa

blpA/iA ttftaccATTCAGGAAGTtttaatgactATTCAAGATTTcataaaat

blpT cagcgcaATTCAAGACATttcaatgacaATTAAAGATTTgaataaaa

blpL/pncG ttttacaATTCAAGAGGTtttgatgaccATTTATGATTTgagtgatc

Streptococcus blpA 1 tattcccATTTAAGACGTttcaacgactATTCAAGACTAgctcagtt

eaui (.предсказанные) blpA 2 cattaccATTCAAGACGTttcgacgacaTTTTAAGACTTaaatactg

blpM~/pncl~ tattaccATTCAAGACGTttcgacgacaTTTTAAGACTTaaatactg

blpR1 atttaccATTTAAGACATaatcagtaccATTTAAGATTTtaactccc

transporter attgaccATTCACGACAAaataagaaccATTCAAGATTTttgagtgt

Указанные факты дают основание предполагать функциональную значимость рассмотренных генов и регуляторных повторов генома 5 44111 для выработки бактериоцинов в зависимости от клеточной плотности этого вида В других исследованных организмах подобная процедура не привела к предсказанию новых бактериоциновых локусов

Все известные регуляторные повторы для систем выработки бактериоцинов

грамположительными бактериями представлены в таблице 1 Видно, что для разных

- 10-

организмов повторы имеют некоторое сходство Это позволило построить по последовательностям, включающим в себя регуляторные сайты, филогенетическое дерево Оказалось, что регуляторные последовательности хорошо кластеризуются, и можно выделить три различных группы сайтов, которые мы обозначили как группы 1, 2 и 2-, Повторы в группах 2 и 2- похожи, однако расстояния между их плечами различаются на 1 нуклеотид Аналогично, было построено филогенетическое дерево белковых последовательностей соответствующих регуляторов ответа (в случае с S equi брали регуляторы ответа, находящиеся вблизи от предполагаемых сайтов) Было показано, что на филогенетическом дереве регуляторов ответа выделяются те же ветви, что и на дереве самих регуляторных повторов.

Глава II. Модели распознавания транскрипционным регулятором сайтов ДНК

Применение различных методов распознавания сигналов при малом объеме обучающей выборки зачастую приводит к неадекватным результатам. При поиске по консенсусам слабое место заключается в самой модели, которая слишком упрощена, в то время как слабое место модели весовых матриц заключается в невозможности статистически достоверного определения всех свободных параметров модели по обучающей выборке малого объема В данной главе обращено внимание на адекватность существующих моделей в условиях малого числа экспериментально показанных регуляторных сайтов, и предложена альтернативная модель, которая могла бы занять место между двумя описанными методами

Анализ существующих моделей связывания

Существующие на сегодняшний день модели связывания транскрипционного регулятора с ДНК, такие как "консеисусная" и "модель весовых матриц" (position weight matrix - PWM), широко используются для поиска регуляторных сигналов или для моделирования эволюционных процессов, однако каждая из них применима не во всех случаях

Консенсусная модель слишком упрощена, и используется для грубого приближения «похожести» последовательности на распознаваемый транскрипционным регулятором сайт, так как понятие консенсуса зачастую оказывается условным Действительно, часто в этом случае консенсус берется как самый часто встречаемый пуклсотид в выборке, который всегда, так или иначе, определен (иногда без достаточных на то оснований), тогда как говорить о действительном «предпочтении» нуклеотида регулятором можно лишь в случае значимого отличия в частоте его встречаемости по сравнению с остальными.

Весовая матрица - это двумерная матрица весов, отражающих значимость нахождения каждого возможного нуклеотида в каждой позиции исследуемого сигнала Для последовательностей ДНК весовая матрица имеет размер 4*Ь, что отвечает четырем нуклеотидам, и длине сигнала Ь В каждой из ячеек этой матрицы располагается вес определенного нуклеотида, как правило определенный на основе частоты встречаемости этого нуклеотида в обучающей выборке Таким образом, в модели весовых матриц для каждой позиции сигнала необходимо определить три независимых частотных параметра, которые, в свою очередь, и обеспечивают корректный поиск с помощью этой матрицы

Однако, в большинстве случаев число сайтов в геноме недостаточно для адекватного определения трех независимых параметров каждой позиции весовой матрицы Данные по представленности сайтов связывания рассмотренных транскрипционных факторов в различных геномах демонстрируют этот факт

Поскольку в основном рассматривались полностью секвенированные бактериальные геномы, указанные числа являются окончательными Это означает, что в описанных случаях малой представленности сайтов связывания, модель весовых матриц может быть переобучена, что ведет к занижению чувствительности метода

Альтернативная модель

Чтобы выяснить, можно ли модель весовых матриц упростить, не проигрывая в избирательности, для каждого генома и для каждого набора регуляторных сайтов транскрипционного фактора в этих геномах было проведено два теста

Первый тест на однородность (хи-квадрат тест с 5% уровнем значимости) проводился для частот встречаемости всех типов нуклеотидов в некоторой позиции регуляторного сигнала Данный тест показывал, есть ли какой-либо значимый консенсусный нуклеотид в определенной позиции сигнала, или распределение частот однородно, и позиция неинформативна Случай однородного распределения может быть охарактеризован как случай позиции со счабым консенсусом, если под «консенсусом» понимать просто наиболее часто встречающийся нуклеотид в выборке

Второй тест на однородность проводился уже с частотами неконсенсусных (всех, за исключением наиболее часто встречающегося в выборке) нуклеотидов той же позиции Этот тест показывал наличие неконсенсусного нуклеотида, который встречается в геноме значимо чаще, чем остальные неконсенсусные нуклеотиды Один из двух вариантов результата этого теста - позиция с выраженным консенсусом и вторым, неконсенсусным, предпочтительным нуклеотидом (случай двухбуквенного выбора), также может быть рассмотрен как случай позиций со слабым консенсусом

Единственный случай, когда позиция действительно может быть рассмотрена в терминах консепсусного и неконсенсусных нуклеотидов, отвечает результату тестов с одним доминирующим нуклеотидом (не пройден первый тест на однородность нуклеотидов), и статистически несущественной разницей между всеми неконсенсусными нуклеотидами (пройден второй тест)

Часто встречающаяся ситуация слабых консенсусов, говорит о том, что вместо модели весовых матриц, возможно, более адекватной будет модель с различным числом параметров для различных позиций Для позиций с сильным консенсусом и статистически однородными неконсенсусными нуклеотидами, можно использовать только два параметра определяемый из известных частот вес консенсусного нуклеотида и, определяемый так же, вес усредненного неконсенсусного нуклеотида (в отличие от консенсусной модели, где для всех позиций приписаны одинаковые постоянные консенсусные и неконсенсусные веса) Эта модель названа нами моделью взвешенных консенсуспых матриц (Weighted consensus matrix (WCM)) В отличие от модели весовых матриц, она не требует большого количества данных для своего определения В зависимости от типа позиции, она либо будет вносить вклад,

пропорциональный частоте встречаемости консенсусного нуклеотида (хорошо определенный консенсус), либо не будет вносить никакого вклада в общий вес (однородное распределение частот), либо будет вносить вклад, аналогичный модели весовых матриц (две ярко выраженные позиции при достаточном количестве наблюдений)

Глава III. Эволюционная стабильность неконесенсусных нуклеотидов в сайтах ДНК

В данной главе рассматривается эволюция сайтов связывания транскрипционных факторов с ДНК Показано, что неконсенсусные нуклеотиды во многих бактериальных сайтах транскрипционной регуляции эволюционируют гораздо медленнее, чем можно ожидать, исходя из предположения, что их появление обусловлено случайным отклонением от консенсуса. Это новое наблюдение свидетельствует о том, что на эти позиции существует давление отбора, которое их стабилизирует.

Влияние регулируемого гена на выбор неконсенсусного нуклеотида

сайта

Все рассмотренные ранее модели (консенсусная модель, модель взвешенных консенсусных матриц, модель весовых матриц) строятся на основе выравненных сайтов связывания из одного генома, и отражают общие характеристики сигнала внутри этого генома. Однако при рассмотрении ортологичных сайтов связывания транскрипционного фактора с ДНК была обнаружена не объяснимая из общих свойств связывания транскрипционного фактора с ДНК консервативность неконсенсусных нуклеотидов регуляторных сайтов (таблица 2). Заглавными буквами в таблице отмечены консенсусные нуклеотиды, строчными жирными буквами неконсенсусные

Если никакого давления отбора на неконсенсусные нуклеотиды нет, можно было

бы наблюдать случайные (то есть достаточно частые) замены одного из них на другой,

по крайней мере, на достаточно далеких эволюционных расстояниях Однако, даже

при сравнении сайтов из кишечной палочки и холерного вибриона, для которых

-14-

известно, что степень консервативности незначимых (некодирующих или синонимичных) позиций очень мала, в рассмотренных примерах существуют сохраненные неконсенсусные нуклеотиды

ТАБЛИЦА 2. ПРИМЕР КОНСЕРВАТИВНОСТИ НЕКОНСЕНСУСНЫХ НУКЛЕОТИДОВ

Транскрипцией Геном Регулируемый Последовательность

ный фактор ген

Sigma-32

Escherichia coli rpoB CTTGtcA- (13) -CCCtAT

Salmonella typhi rpoB CTTGtcA-(13)-CCCtAT

Yersinia pestis rpoB acTGAtc-(14)-CCCtAT

Yersinia enterocolitica rpoB CTTttcA-(13)-CCCtAT

Haemophilus influenzae rpoB tTTGAtA-(13)-CaCaAT

Erwinia carotovora rpoB CTTGtcA-(13)-CCCtAT

Klebsiella pneumoniae rpoB CTTGtcA-(13)-CCCtAT

Pasteurella multocida rpoB acTGAAA-(14)-CCCtAT

Vibrio cholerae rpoB gTTGAAg-(13)-aCttAa

Vibno fischen rpoB tTcGAcA-(14)-aCCCAT

PurR

Escherichia coli purL ACGCAAACGgTTtCGT

Salmonella typhi purL ACGCAAACGgTTtCGT

Yersinia pestis purL ACGCAAACGgTTtCGT

Haemophilus influenzae purL AtGCAAACGTTTGCtT

Pasteurella multocida purL ACGCAAACGTTTtCGT

Vibno cholerae purL ACGCAAACGgTTGCtT

LexA

Escherichia coli lexA TgCTGTATATActcACAGcA

Haemophilus influenzae lexA atCTGTATAcAataeCAGTt

Salmonella typhi lexA aACTGTATATActcACAGcA

Yersinia pestis lexA agCTGTATATActcACAGcA

Pasteurella multocida lexA TtCTGTATATAataACAGTt

Vibno cholerae lexA cACTGgATATActcACAGTc

Чтобы подтвердить описанное наблюдение и выяснить, зависит ли выбор

неконсенсусного нуклеотида в позиции регуляторного сайта от гена, перед которым этот сайт находится, и/или от рассматриваемого генома, с помощью программы 81аИзИса, для каждого транскрипционного регулятора был проведен многофакторный дисперсионный анализ (АЬЮУА тест) имеющихся данных в программе 81а1:15иса В качестве независимых были выбраны следующие параметры «Геном» (названия исследуемых геномов), «Ген» (названия регулируемых генов), «Позиция» (номер позиции регуляторного сигнала) и «Нуклеотид» (один из нуклеотидов А, Т, в, С, а, I, д, с) Зависимым параметром являлся «Счетчик», который принимал значения 1 или О, в зависимости от наличия или отсутствия указанного нуклеотида в определенных условиях В каждой позиции выбранного сайта нуклеотид мог быть консенсусным

(заглавная буква) или неконсенсусным (строчная буква) Определение консенсусов на основе имеющейся выборки производилось независимо для каждого генома

Для данного анализа использовались известные сайты связывания шести различных транскрипционных факторов PurR (пуриновый метаболизм), FruR (фруктозный катаболизм), LexA (регуляция SOS ответа), GalRS (галактозный катаболизм), Sigma-32 (реакция теплового шока), и ScrR (суктозный катаболизм).

Изменчивость внутри группы «Позиция»*«Нуклеотид» рассматривалась как внутригрупповая, с точки зрения многофакторного дисперсионного анализа, а межгрупповая изменчивость вычислялась для двух различных взаимодействий' «Геном» * «Позиция» * «Нуклеотид» и «Ген» * «Позиция»*«Нуклеотид»

Внутригрупповая дисперсия для взаимодействия «Позиция»* «Нуклеотид» одинакова в обоих случаях, и отражает важность расположения нуклеотида в сигнале Взаимодействие «Геном»*«Позиция»*«Нуклеотид» показывает, существенно ли различаются сигналы различных геномов (рассматривая все сайты одного генома в группе) Таким же образом, трехфакторное взаимодействие «Ген»*«Позиция»*«Нуклеотид» отражает различия между наборами ортологичных сайтов (рассматривая как группу весь набор ортологичных сайтов в разных геномах)

В работе детально изучались трехфакторные взаимодействия для каждого из рассмотренных транскрипционных факторов Рассмотрена значимость эффекта влияния третьего независимого фактора («Ген» или «Геном») на взаимодействие «Позиция» * «Нуклеотид»

Значимый эффект трехфакторного взаимодействия

«Геном»*«Позиция»*«Нуклеотид», отражает зависимость выбора нуклеотида в данной позиции от генома, и подтверждает то, что "предпочтения" транскрипционного фактора к связыванию с определенной последовательностью ДНК (в данном случае, к неконсенсусным позициям этой последовательности) могут меняться от генома к геному, т е что сигнал связывания может меняться в ходе молекулярной эволюции.

В свою очередь, значимый эффект трехфакторного взаимодействия

«Ген»*«Позиция»*«Нуклеотид» показывает зависимость выбора нуклеотида в данной

-16-

позиции от гена и подтверждает новое наблюдение, что неконсенсусные нуклеотиды в определенных позициях сайта связывания эволюционно стабильны, и зависят от регулируемого гена или оперона, перед которым этот сайт расположен

Было показано, что эффект взаимодействия «Ген»*«Позиция»*«Нуклсотид» для рассмотренных факторов всегда более значимый, чем эффект (<Геном»*«Позиция»*«Нуклеотид» Это объясняется тем, что рассматривались близкородственные геномы, а также хорошо сохраненные транскрипционные факторы, т е изменения в сигнале связывания в ходе молекулярной эволюции для них являются медленными

Нейтральная эволюция и эволюционная стабильность неконсенсусных

нуклеотидов.

На первый взгляд, очевидным объяснением наблюдаемой сохранности неконсенсусных нуклеотидов может быть небольшое эволюционное расстояние между геномами, т е высокая консервативность всех некодирующих участков геномов Если это объяснение верно, то частоты "неконсенсусных мутаций" (т.е мутаций неконсенсусных нуклеотидов, приводящих к другому неконсенсусному нуклеотиду) должны быть сравнимыми с частотами мутаций, наблюдаемых в почти нейтральных позициях, например, в третьих позициях синонимичных ко донов ортологичных генов из доступных геномов

Чтобы учесть эту возможность, для каждой пары геномов (в, Н) были рассмотрены все выравненные пары нуклеотидов во всех доступных ортологичных сайтах Такие пары были разделены на две группы группа, где оба нуклеотида в выравненной паре являются неконсенсусными, и группа, где хотя бы один нуклеотид в паре - консенсусный. Тогда для каждой позиции сигнала 1, значение с, (0,Н) для данной пары геномов (0,Н) определялось как доля нуклеотидных пар с одинаковыми неконсенсусными нуклеотидами среди группы нуклеотидных пар первого («неконсенсусного») типа.

По отношению к определенной таким образом величине, было выделено несколько типов выравненных позиций в заданной паре геномов консервативные

консенсусные позиции (с пренебрежимо малым количеством неконсенсусных пар, так что для пары геномов (G,H) величина с, (G,H) не определена); позиции со слабым консенсусом или разными консенсусами в разных геномах (величина с, (G,H) не может быть корректно определена), стандартные позиции (достаточно неконсенсусных нуклеотидов, величина с, (G,H) различна для разных пар геномов); и консервативные неконсенсусные позиции (со стабильно-высокой консервативностью с, (G,H) > '/2 для почти всех пар геномов (G,H)) Если эффект неконсенсусной консервации является следствием нейтральной эволюции, и нет никакого давления естественного отбора на неконсенсусные нуклеотиды, то сохранность всех неконсенсусных позиций должна быть практически одинакова Чтобы показать средний эффект в зависимости от времени, для каждого транскрипционного фактора и каждой пары геномов (G,H), была определена средняя неконсенсусная консервативность C(G,H) как доля пар с одинаковыми нуклеотидами среди неконсенсусных пар нуклеотидов в заранее выбранных консервативных неконсенсусных позициях

Стандартным приближением нейтральной эволюции является эволюция третьих позиций синонимичных кодонов (кодонов одинаковой аминокислоты) с различной степенью вырожденности (в зависимости от возможных кодонов для одной и той же аминокислоты) Несмотря на то, что эти позиции не совсем нейтральны, для нашего случая приближение является достаточным, т к. если будет показана «ненейтральность» эволюции позиций в сайтах по сравнению даже с этой моделью, то по сравнению с истинно нейтральной эволюцией, эффект будет выражен сильнее В случае нейтральной эволюции неконсенсусных нуклеотидов, консервативность C(G,H) должна быть такой же, как средняя консервативность, наблюдаемая в третьих позициях кодонов с трехкратной вырожденностью в наборе выравненных кластеров ортологичных генов (Clusters of Orthologous Genes - COG) из тех же геномов Поскольку только одна аминокислота (изолейцин) обладает тройной вырожденностью, были рассмотрены также случаи вырожденности 2 и 4 Чтобы вычислить значение нейтральной консервативности, для каждой пары геномов (G,H) были выбраны все выравненные кодирующие последовательности ДНК, принадлежащие к соответствующим COG-ам Консервативность для них была определена как число сохраненных третьих позиций кодонов среди всех сохраненных

-18-

аминокислот с определенной степенью вырожденности по отношению к общему числу этих аминокислот во всех выравненных ССЮ'ах Нами сравнивались значения С(0,Н) и соответствующей нейтральной консервативности в третьих позициях синонимичных кодонов (рисунок 1) Мерой расстояний между геномами служила медиана распределения расстояний между ортологичными генами этой пары геномов

РИСУНОК 1. КОНСЕРВАТИВНОСТЬ НЕКОНСЕНСУСНЫХ ПОЗИЦИЙ В ОРТОЛОГИЧНЫХ САЙТАХ СВЯЗЫВАНИЯ ЬЕХА ПО СРАВНЕНИЮ С ПСЕВДОНЕЙТРАЛЬНОЙ КОНСЕРВАТИВНОСТЬЮ В ТРЕТЬИХ ПОЗИЦИЯХ КОДОНОВ.

Расстояния между геномами . Нейтральная консервативность в синонимичных кодонах с вырожденностью 2 -"в- Нейтральная консервативность в синонимичных кодонах с вырожденностью 3 -"В- Нейтральная консервативность в синонимичных кодонах с вырожденностью 4 О Средняя неконсенсусная консервативностьСЮ,Н) в сайтах 1_ехА

Применением непараметрических статистических критериев (как Вальда-Вольфовица, и критерий Манна-Уитни и двухвыборочный критерий Колмогорова-Смирнова) было показано, что значения неконсенсусной консервативности, усредненные по заранее выбранным консервативным неконсенсусным позициям, всегда выше, чем нейтральная консервативность синонимичных кодонов даже для степени вырожденности 2 (не говоря уже о степенях вырожденности 3 и 4).

Таким образом, консервативность некоторых неконсенсусных позиций в ортологичных сайтах связывания существенно выше, чем можно было ожидать, исходя исключительно из данных о расстояниях между геномами

Сравнение консенсусной и неконсенсусной консервапшвностей

Чтобы показать поведение консенсусных и неконсенсусных позиций в сайтах связывания, и продемонстрировать эволюционную стабильность неконсенсусных позиций, рассматривалась консервативность тех или иных позиций по сравнению со средней консервативностью по всем позициям сигнала.

Для этого для каждой пары геномов (0,Н) и для всех выравненных пар нуклеотидов в ортологичных сайтах, последние делились на две группы выравненные пары, где оба нуклеотида - неконсенсусные, и выравненные пары, где присутствует хотя бы один консенсусный нуклеотид. Доля пар с одинаковыми выравненными нуклеотидами среди всех пар любого типа обозначалась как \У(0,Н)

Для каждой позиции ¡, доля пар с одинаковыми неконсенсусными нуклеотидами среди пар «неконсенсусного» типа обозначалась, как с, (С,Н) (так же, как и в предыдущем параграфе). Доля пар с одинаковым нуклеотидом (консенсусным) в выравненных позициях среди пар консенсусного типа (второго), обозначалась как с1, (С,Н) Чтобы учесть эволюционные расстояния между геномами, значения с,(С,Н) и с!,(0,Н) нормировались на величину \У(С,Н), отражающую среднюю консервативность сигнала После этого, нормированные величины с, (0,Н) и с1, (0,Н) усреднялись по различным парам геномов (О, Н) для каждой позиции \ Таким образом, все исследуемые регуляторные сигналы были представлены в виде гистограмм (рисунок 2), на которых отображались величины средней консервативности первого и второго типов (неконсенсусной и консенсусной), по сравнению со «средней» консервативностью сигнала Таким образом, величины, превышающие единицу, отражали сильную консервативность, а наличие таких значений для неконсенсусных позиций еще раз иллюстрировало неожиданную консервативность неконсенсусных нуклеотидов в ортологичных сайтах связывания

РИСУНОК 2. КОНСЕРВАТИВНОСТЬ КОНСЕНСУСНЫХ И НЕКОНСЕНСУСНЫХ НУКЛЕОТИДОВ В ОРТОЛОГИЧНЫХ САЙТАХ СВЯЗЫВАНИЯ ТРАНСКРИПЦИОННОГО ФАКТОРА LEXA."

1 2 3 4 5 6 7 а 9 10 11 12 13 14 15 16 17 18 19 20 ® ® 4-v-' + + в в Т 4---' в

Позиция сайта

□ Консенсусная консервативность d, ^—у—1 Консервативные консенсусные позиции

Ш Неконсенсусная консервативность с, ® Позиции со слабым консенсусом

«у» Стандартные позиции ^ Консервативные неконсенсусные позиции

Выводы

1 Описана структура всех локусов кворум-чувствительности в системах выработки бактериоцинов грам-положительными бактериями

2 Найдена новая предположительная система выработки бактериоцинов у бактерии Streptococcus equi.

Ч Показано, что эволюционное дерево транскрипционных регуляторов ответа соответствует дереву узнаваемых ими сайтов В соответствии с ним произведена классификация регуляторных сигналов

" Описание позиций см в тексте раздела «Нейтральная эволюция и эволюционная стабильность неконсенсусных нуклеотидов»

4 Проведен анализ существующих способов распознавания регуляторных сигналов, исследованы границы их применимости. Предложен новый подход к распознаванию регуляторных сигналов, основанный на модели взвешенных консенсусных матриц.

5 Описан эффект ген-специфической эволюции регуляторных сайтов' показана консервативность неконсенсусных нуклеотидов в ортологичных сайтах, т.е обусловленность нуклеотида регулируемым геном.

Список работ, опубликованных по теме диссертации

1 Е A Kotelmkova, V J Makeev, М S. Gelfand 2005. Evolution of transcription factor DNA binding sites. Gene Vol. 347, N 2.pp 255-263.

2 GelfandMS., Gerasimova A V, Kazakov A.E., Kotelmkova E A., Laikova ON, Mironov A A , Permina E A , Ravcheev D.A , Rodionov D.A , Vitreschak A G. 2004 Comparative genomics, metabolic reconstruction, and analysis of regulation in bacterial genomes. Proceedings of the "Meeting of Howard Hughes International Research Scholars" Tallinn, Estonia P 45.

3. E. A Kotelmkova 2003. Selecting a relevant model of a transcription factor binding site. Proceednmgs of the First International Moscow Conference on Computational Molecular Biology, Moscow, Russia, July 22-25 pp 116-117.

4. E А Котелъникова, МС.Гелъфанд 2002. Выработка бактериоцинов грам-положительными бактериями и механизмы транскрипционной регуляции. Генетика, Т 38, номер 6,2002, стр 628-641

5. ЕА. Котелъникова, МСГельфанд. 2002. Регуляция транскрипции в системе выработки бактериоцинов Streptococcus equi. Генетика, Т. 38, номер 7,2002, стр 761-765.

6 ЕА Kotelmkova and MS Gelfand 2002 Transcripional regulation of a new bacteriocin-producing system in Streptococcus equi. Proceedings of the Third International Conference on Bioinformatics of Genome Regulation and Structure Novosibirsk, Russia Vol 2 pp 23-25.

€1021 1

РНБ Русский фонд

2006А 6158

Заказ № 862 Подписано в печать 20 05 05 Тираж 50 экз Уст п л 0,84

ООО "Цифровичок", тет (095) 797-75-76 \v\vw сйти

Содержание диссертации, кандидата физико-математических наук, Котельникова, Екатерина Александровна

ВВЕДЕНИЕ.

ОБЗОР ЛИТЕРАТУРЫ.

Словарь.

Методы сравнительной геномики для изучения транскрипции.

Выработка бактериоцинов грам-положительными бактериями и механизмы транскрипционной регуляции.

Бактериальные взаимодействия.

Общие сведения о бактериоцинах.

Классификация бактериоцинов.

Формирование биологически активных молекул.

Регуляция выработки бактериоцинов.

Распознавание сайтов связывания транскрипционного фактора.

Наиболее распространенные модели: консенсусная и весовых матриц.

Другие модели.

Древо жизни и эволюция.

Молекулярные часы.

Теория отбора, нейтральная и почти нейтральная эволюции.

Определение расстояний между геномами и построение деревьев.

Эволюция ДНК сайтов связывания транскрипционных факторов.

МАТЕРИАЛЫ И МЕТОДЫ.

Исходные данные.

I Глава. Системы выработки бактериоцинов.

11-я и 111-я Главы. Анализ моделей связывания и эволюции.

Методы и программы, использованные в работе.

Поиск ортологов.

Распознавание ДНК-сигналов.

Межгеномные расстояния и кластеры ортологичных генов.

Математические методы.

Хи-квадрат тест на однородность.

Дисперсионный анализ (ANOVA).

Непараметрические критерии.

ГЛАВА I. ПРЕДСКАЗАНИЕ И АНАЛИЗ ТРАНСКРИПЦИОННОЙ РЕГУЛЯЦИИ

ВЫРАБОТКИ БАКТЕРИОЦИНОВ.

Генетика выработки бактериоцинов.

Генетическая организация бактериоцинных кластеров.

Регуляция транскрипции.

Регуляторные элементы системы выработки бактериоцинов класса II.

Регуляция транскрипции в системе выработки бактериоцинов Streptococcus equi.

Кластеризация регуляторных сайтов и регуляторов ответа.

Обсуждение.

ГЛАВА II. МОДЕЛИ РАСПОЗНАВАНИЯ ТРАНСКРИПЦИОННЫМ РЕГУЛЯТОРОМ САЙТОВ ДНК.

Анализ существующих моделей связывания.

Альтернативная модель.

Обсуждение.

ГЛАВА III. ЭВОЛЮЦИОННАЯ СТАБИЛЬНОСТЬ НЕКОНЕСЕНСУСНЫХ НУКЛЕОТИДОВ В САЙТАХ ДНК.

Влияние регулируемого гена на выбор неконсенсусного нуклеотида сайта.

Нейтральная эволюция и эволюционная стабильность неконсенсусных нуклеотидов.

Сравнение консенсусной и неконсенсусной консервативностей.

Обсуждение.

ВЫВОДЫ.

Введение Диссертация по биологии, на тему "Эволюция участков связывания бактериальных факторов транскрипции в последовательностях ДНК"

Актуальность темы

Предсказание регуляции экспрессии генов является важным разделом компьютерной генетики и системной биологии. Это связано с тем, что, с одной стороны, в настоящее время сравнительно легко осуществляется секвенирование геномов, а с другой - использование этой информации для описания возможного фенотипа встречает определенные трудности, обусловленные отставанием понимания механизмов дифференциальной экспрессии от темпов секвенирования.

Связь генотипа и фенотипа у живых организмов осуществляется в первую очередь с помощью контроля экспрессии генов. Одним из важнейших этапов регуляции экспрессии является специфическая инициация транскрипции, связанная с образованием сложных ДНК-белковых комплексов. За последнее время в распоряжении исследователей появилось большое количество данных, включающих как последовательности взаимодействующих белков и ДНК, так и трехмерные структуры собственно ДНК-белковых комплексов. Несмотря на весь этот значительный экспериментальный материал, понимание физикохимических процессов, происходящих при инициации транскрипции, до сих пор не достигнуто.

За последние 20 лет было предложено несколько моделей, в которых описывалось переключение генов в ответ на изменение концентрации регуляторных факторов. Подобные модели предсказывают некоторые особенности регуляции экспрессии генов у различных видов, геномы которых уже секвенированы. В то же время, малые концентрации регуляторных факторов не позволяют осуществить экспериментальный выбор между этими моделями. В этой связи большое значение приобретают косвенные следствия тех или иных характеристик, которые бы позволяли определить физико-химические параметры ДНК-белкового взаимодействия. В частности, актуальным является изучение закономерностей в изменении регуляторных областей различных генов родственных геномов, возникающие в ходе эволюции. Особенности взаимодействия белковых факторов с регуляторными областями обуславливают ту или иную степень консервативности ДНК в регуляторных участках. Это же взаимодействие определяет консервативность аминокислот, входящих в ДНК-распознающие домены.

Стремительное развитие биоинформатики, сопровождающее быстрый рост доступных текстов ДНК, привело к появлению большого количества стандартных методов анализа последовательностей ДНК, позволяющих извлекать из них значительную информацию. Например, при помощи исследования некодирующих участков генома можно определять потенциальные участки специфического связывания регуляторных белков с ДНК, что дает основания предполагать активацию или репрессию определенных генов этими регуляторными факторами. Сравнительный анализ этих сигналов позволят делать выводы о характеристиках ДНК-белкового взаимодействия, например о структуре ДНК-белкового комплекса (связывание в форме мономера или димера, взаимодействующего с одной или с разными нитями ДНК), или об афинности связывания.

Кроме того, информация, полученная методами компьютерной биологии, позволяет осуществлять предсказания специфических особенностей метаболизма плохо изученных видов прокариот. В дальнейшем эти предсказания могут быть подтверждены или опровергнуты экспериментом, что делает разработку методов компьютерной геномики актуальной для обеспечения прогресса в биотехнологии и медицине.

Цель работы

Предсказание регуляции экспрессии генов, связанных с выработкой бактериоцинов грамположительными бактериями. Анализ моделей связывания транскрипционного фактора с ДНК. Определение особенностей эволюции ДНК сайтов связывания бактериальных транскрипционных факторов.

Научная новизна и практическая значимость

Произведен обзор механизмов выработки антибактериальных пептидов -бактериоцинов грамположительными бактериями. Систематически описано устройство всех локусов, содержащих гены регуляторных систем, транспорта, иммунитета, процессинга и посттрансляционной модификации антибактериальных пептидов. Показано, что эволюционное дерево транскрипционных регуляторов ответа соответствует дереву узнаваемых ими сайтов связывания, в соответствии с этим произведена классификация регуляторных систем. Для организма Streptococcus еду/предсказана новая система выработки бактериоцинов.

Проанализированы существующие способы распознавания регуляторных сигналов, показаны условия их применимости. Предложен новый подход к распознаванию регуляторных сигналов.

Описан эффект ген-специфической эволюции регуляторных сайтов, а именно, сохранения неконсенсусных нуклеотидов в ортологичных сайтах, где выбор нуклеотида обусловлен регулируемым геном. Обсуждены возможные применения сделанного наблюдения для предсказания регуляторных систем в малоизученных организмах.

Всё вышесказанное составляет практическую значимость работы и является поводом для экспериментальной проверки.

Апробация работы

Результаты работы представлялись на международных конференциях: 3-я конференция "Bioinformatics of Genome Regulation and Structure" (BGRS, Новосибирск, 2002); 1-я конференция "Moscow Conference on Computational Molecular Biology" (MCCMB, Москва, 2003); International workshop "Structural approaches to sequence evolutions: Molecules, networks, populations" (STRAPP, Дрезден, 2004); Meeting of Howard Hughes International Research Scholars (Таллинн, 2004); VII Международная Энгельгардтовская конференция по молекулярной биологии (ICMB, Суздаль 2004).

Объём и структуры диссертации.

Диссертация изложена на 106 страницах и состоит из введения, обзора литературы, описания материалов и методов, и трех глав. В каждой главе содержится описание и обсуждения оригинальных результатов.

Заключение Диссертация по теме "Биофизика", Котельникова, Екатерина Александровна

Выводы

1. Описана структура всех локусов кворум-чувствительности в системах выработки бактериоцинов грам-положительными бактериями.

2. Найдена новая предположительная система выработки бактериоцинов у бактерии Streptococcus equi.

3. Показано, что эволюционное дерево транскрипционных регуляторов ответа соответствует дереву узнаваемых ими сайтов. В соответствии с ним произведена классификация регуляторных сигналов.

4. Проведен анализ существующих способов распознавания регуляторных сигналов, исследованы границы их применимости. Предложен новый подход к распознаванию регуляторных сигналов, основанный на модели взвешенных консенсусных матриц.

5. Описан эффект ген-специфической эволюции регуляторных сайтов: показана консервативность неконсенсусных нуклеотидов в ортологичных сайтах, т.е. обусловленность нуклеотида регулируемым геном.

Список работ, опубликованных по теме диссертации

• Е. A. Kotelnikova, V. J. Makeev, М. S. Gelfand. Evolution of transcription factor DNA binding sites. Gene. Vol. 347, N. 2. pp. 255-263.

• Gelfand M.S., Gerasimova A. V., Kazakov A.E., Kotelnikova E.A., Laikova O.N., Mironov A.A., Permina E.A., Ravcheev D.A., Rodionov D.A., Vitreschak A.G. 2004. Comparative genomics, metabolic reconstruction, and analysis of regulation in bacterial genomes. Proceedings of the "Meeting of Howard Hughes International Research Scholars" Tallinn, Estonia. P.45.

• E. A. Kotelnikova. 2003. Selecting a relevant model of a transcription factor binding site. Proceednings of the First International Moscow Conference on Computational Molecular Biology (MCCMB'2003), Moscow, Russia, July 22-25. pp.l 16-117.

• E.A. Котелъникова, М.С.Гелъфанд. 2002. Выработка бактериоцинов грам-положительными бактериями и механизмы транскрипционной регуляции. Генетика, Т. 38, номер 6, 2002, стр. 628-641.

• Е.А. Котелъникова, М.С.Гелъфанд. 2002. Регуляция транскрипции в системе выработки бактериоцинов Streptococcus equi. Генетика, Т. 38, номер 7, 2002, стр. 761-765.

• Е.А. Kotelnikova and M.S. Gelfand. 2002. Transcripional regulation of a new bacteriocin-producing system in Streptococcus equi. Proceedings of the Third International Conference on Bioinformatics of Genome Regulation and Structure. Novosibirsk, Russia. Vol.2, pp. 23-25.

Библиография Диссертация по биологии, кандидата физико-математических наук, Котельникова, Екатерина Александровна, Москва

1. Allison G.E., Worobo R.W., Stiles М.Е., Klaenhammer T.R. Heterologous expression of the lactacin F peptides by Carnobacterium piscicola LV17. Appl Environ Microbiol. 1995. V. 61. N. 4. P.1371-1377

2. Altena K., Guder A., Cramer C., Bierbaum G. Biosynthesis of the lantibiotic mersacidin: organization of a type В lantibiotic gene cluster. Appl.Envirom.Microbiol. 2000. V. 66. N. 6. P. 2565-2571.

3. Altschul S.F., Gish W., Miller W., Myers E.W., Lipman D.J. Basic local alignment tool. J. Mol. Biol. 1990; V. 215. N. 3. P. 403-410.

4. Axelsson L. and Hoick A. The genes involved in production of and immunity to sakacin A, a bacteriocin from Lactobacillus sake Lb706. J. Bacterid. 1995. V. 177. N. 8. P. 21252137.

5. Benos P. V., Bulyk M.L. and Stormo G. D. Additivity in protein-DNA interactions: how good an approximation is it? Nucleic Acids Research. 2002. V. 30 N. 20

6. Benson D.A., Karsch-Mizrachi I., Lipman D.J., Ostell J., Wheeler D.L. GenBank. Nucleic Acids Res. 2003.31:23-7.

7. BergJ., Willmann S., LassigM. Adaptive evolution of transcription factor binding sites. BMC Evol Biol. 2004. 4(1):42.

8. Berg O.G., von HippelP.H. Selection of DNA binding sites by regulatory proteins. J. Mol. Biol. 1987. 193,723-750.

9. Berg O.G. The evolutionary selection of DNA base pairs in gene-regulatory binding sites. Proc.Natl. Acad. Sci. USA. 1992. V.89. P. 7501-7505.

10. Bierbaum G., Brotz H., Koller K.P. and Sahl E.G. Cloning, sequencing and production of the lantibiotic mersacidin. FEMS Microbiol. Lett. 1995. V. 127. P. 121-126.

11. Bromham L., and Penny D. The modern molecular clock. Nat Rev Genet 2003.4:216-24.

12. Brurberg M.B., Nes I.F. and Eijsink V.G. Pheromone-induced production of antimicrobial peptides in Lactobacillus. Mol. Microbiol. 1997. V. 26 N. 2. P. 347-360.

13. Buckler N.E., Gerland U., Hwa T. On schemes of combinatorial transcription logic. Proc. Natl. Acad. Sci. USA. 2003. 100: 5136-5141.

14. Bulyk M.L., Johnson P.L.,and Church G.M. Nucleotides of transcription factor binding sites exert interdependent effects on the binding affinities of transcription factors. Nucleic Acids Res. 2002. 30: 1255-1261.

15. Bussemaker H.J., Li H., and Siggia E.D. Building a dictionary for genomes: Identification of presumptive regulatory sites by statistical analysis. Proc.Natl. Acad. Sci. USA. 2000. V. 97. P. 10096-10100

16. Casaus P., Nilsen Т., Cintas L.M., Nes I.F., Hernandez P.E., Holo H. Enterocin B, a new bacteriocin from Enterococcus faecium T136 which can act synergistically with enterocin A. Microbiology. 1997. V. 143. N. 7. P.2287-2294

17. Cintas L.M., Casaus P., Holo H., Hernandez P.E., Nes I.F., Havarstein L.S. Enterocins L50A and L50B, two novel bacteriocins from Enterococcus faecium L50, are related to staphylococcal hemolysins. J Bacteriol. 1998. V. 180. N. 8. P. 1988-1994.

18. Claverie J.M, Audic S. The statistical significance of nucleotide position-weight matrix matches. Comput Appl Biosci. 1996. N 12. P 431-9.

19. Day W.H., McMorris F.R. A consensus program for molecular sequences. Comput Appl Biosci. 1993. 9(6):653-6.

20. Diep D.B., Havarstein L.S., and Nes I.F. Characterization of the locus responsible for bacteriocin production in Lactobacillus plantarum CI 1. J. Bacteriol. 1996. V. 178. p. 44724483.

21. Djordjevic M., Sengupta A. M., Shraiman B.I. A biophysical approach to transcription factor binding site discovery. Genome Res. 2003.13(11):2381-90.

22. Donvito В., Etienne J., Denoroy L., Greenland Т., Benito Y., Vandenesch F. Synergistic hemolytic activity of Staphylococcus lugdunensis is mediated by three peptides encoded by a non-agr genetic locus. Infect Immun. 1997. V. 65. N. 1. P. 95-100.

23. Dufour A., Rince A., Uguen P. and Le Pennec J.P. IS 1675, a Novel Lactococcal Insertion Element, Forms a Transposon-Like Structure Including the Lacticin 481 Lantibiotic Operon. J. Bacteriol. 2000. V. 182. N. 19. P. 5600-5605.

24. Durbin R., Eddy S., KroghA., Mitchison G. Biological sequence analysis. Probabilistic models of proteins and nucleic acids. Cambridge University Press. 1998.

25. Ehrmann M.A., Remiger A., Eijsink KG. and Vogel R.F. A gene cluster encoding plantaricin 1.25beta and other bacteriocin-like peptides in Lactobacillus plantarum TMW1.25. Biochim. Biophys. Acta. 2000. V. 1490. N. 3. P. 355-361.

26. Eijsink F.G.H., Brurberg M.B., Middelhoven P.H., and Nes I.F. Induction of bacteriocin production in Lactobacillus sake by secreted peptide. J. Bacteriol. 1996. V. 178. N. 8. P. 2232-2237.

27. Felix,J.V., Papathanasopoulos.M.A., Smith,A.A., von Holy,A. and Hastings,J.W. Characterization of leucocin B-Talla: a bacteriocin from Leuconostoc carnosum Talla isolated from meat. Curr. Microbiol. 1994. V. 29. N. 4. P. 207-212.

28. Felsenstein J. Evolutionary trees from DNA sequences: a maximum likelihood approach. J Mol Evol. 1981; 17(6):368-76.

29. Fields D.S., He Y„ Al-Uzri A.Y., Stormo G.D. Quantitative specificity of the Mnt repressor.J Mol Biol. 1997. V. 271. N. 2. P. 178-94.

30. Fremaux C., Hechard Y. and Cenatiempo Y. Mesentericin Y105 gene clusters in Leuconostoc mesenteroides Y105. Microbiology 1995. V. 141. N. 7. P. 1637-1645.

31. Garver K.I., Muriana P.M. Purification and partial amino acid sequence of curvaticin FS47, a heat-stable bacteriocin produced by Lactobacillus curvatus FS47. Appl Environ Microbiol. 1994. V. 60. N. 6. P. 2191-2195.

32. Gelfand M.S. Recognition of regulatory sites by genomic comparsion. Res. Microbiol. 1999. V. 150. P. 755-771.

33. Gelfand M.S., Koonin E.V., Mironov A.A. Prediction of transcription regulatory sites in Archaea by a comparative genomic approach. Nucleic Acids Res. 2000. V. 28. P. 695705.

34. Gerasimova A.V., Rodionov D.A., Mironov A.A., Gel'fand M.S. Computer analysis of regulatory signals in bacterial genomes. Fnr binding segments. Mol Biol (Mosk). 2001. 35. 1001-1009.

35. Gerland U., Hwa T. On the selection and evolution of regulatory DNA motifs. J.Mol. Evol. 2002. V. 55. P.386-400.

36. Giacomini A., Squartini A. and Nuti M.P. Nucleotide sequence and analysis of plasmid pMD136 from Pediococcus pentosaceus FBB61 (ATCC43200) involved in pediocin A production. Plasmid. 2000. V. 43. N. 2. P. 111-122

37. Guder A., Wiedemann I., Sahl H.-G. Posttranslationally Modified Bacteriocins The Lantibiotics. Biopolymers (Peptide Science). 2000. V. 55. P. 62-73.

38. Jack R.W., TaggJ.R., and Ray B. Bacteriocins of Gram-Positive Bacteria. Microbiological Reviews. 1995. V. 59. N. 2. P. 171-200.

39. Hastings J.W., Sailer M., Johnson K, Roy K.L., Vederas J.C. and Stiles M.E. Characterization of leucocin A-UAL 187 and cloning of the bacteriocin gene from Leuconostoc gelidum. J. Bacteriol. 1991. V. 173. N. 23. P. 7491-7500.

40. Hechard Y., Berjeaud J.M. and Cenatiempo Y. Characterization of the mesB gene and expression of bacteriocins by leuconostoc mesenteroides YI05. Curr. Microbiol. 1999. V. 39. N. 5. P. 265-269.

41. Hertz G.Z., Hartzell G.W. 3rd, Stormo G.D. Identification of consensus patterns in unaligned DNA sequences known to be functionally related. Comput Appl Biosci. 1990. V. 6. N. 2. P. 81-92.

42. Hertz G.Z., Stormo G.D. Identifying DNA and protein patterns with statistically significant alignments of multiple sequences. Bioinformatics. 1999. V. 15. N. 7-8. P. 563-77.

43. Holo H., Jeknic Z., Daeschel M„ Stevanovic S., Nes I.F. Plantaricin W from Lactobacillus plantarum belongs to a new family of two-peptide lantibiotics. Microbiology. 2001. V. 147. N. 3. P. 643-51.

44. Holo H., Nilssen O., and Nes I. F. Lactococcin A, a new bacteriocin from Lactococcus lactis subsp. cremoris: isolation and characterization of the protein and its gene. J. Bacteriol. 1991. V. 173. P. 3879-3887.

45. Hynes W.L., Ferretti J.J. and Tagg J.R. Cloning of the gene encoding Streptococcin A-FF22, a novel lantibiotic produced by Streptococcus pyogenes, and determination of its nucleotide sequence. Appl. Environ. Microbiol. 1993. V. 59. N. 6. P. 1969-1971.

46. Jukes Т.Н. and Cantor C. Evolution of protein molecules. Mammalian Protein Metabolism. 1969. Acadenuc Press. P. 21-132.

47. Kaiser A.L., Montville T.J. Purification of the bacteriocin bavaricin MN and characterization of its mode of action against Listeria monocytogenes Scott A cells and lipid vesicles. // Appl Environ Microbiol. 1996. V. 62. N. 12. P. 4529-35

48. Kaletta C., Entian K.D. and Jung G. Prepeptide sequence of cinnamycin (Ro 09-0198): the first structural gene of a duramycin-type lantibiotic. Eur. J. Biochem. 1991. V. 199. N. 2. P. 411-415.

49. Kalmokoff M.L., Banerjee S.K., Cyr Т., Hefford MA, Gleeson T. Identification of a New Plasmid-Encoded sec-Dependent Bacteriocin Produced by Listeria innocua 743. Appl Environ Microbiol. 2001. V. 67. N. 9. P. 4041-4047

50. Kanatani K, Oshimura M„ and SanoK. Isolation and characterization of acidocin A and cloning of the bacteriocin gene from Lactobacillus acidophilus. Appl. Environ. Microbiol. 1995. V. 61. N. 3.P. 1061-1067.

51. Kanatani K., Tahara Т., Oshimura M., Sano K. and Umezawa C. Cloning and nucleotide sequence of the gene for acidocin 8912, a bacteriocin from Lactobacillus acidophilus TK8912. Lett. Appl. Microbiol. 1995. V. 21. N. 6. P. 384-386.63