Бесплатный автореферат и диссертация по биологии на тему
Симметричные структуры в нуклеотидных последовательностях сайтов инициации репликации ДНК прокариот
ВАК РФ 03.00.04, Биохимия

Текст научной работыДиссертация по биологии, кандидата биологических наук, Акберова, Наталья Ивановна, Казань

КАЗАНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

На правах рукописи

АКБЕРОВА НАТАЛЬЯ ИВАНОВНА

СИММЕТРИЧНЫЕ СТРУКТУРЫ В НУКЛЕОТИДНЫХ ПОСЛЕДОВАТЕЛЬНОСТЯХ САЙТОВ ИНИЦИАЦИИ РЕПЛИКАЦИИ

ДНК ПРОКАРИОТ

Специальность: 03 00 04 - биохимия

Диссертация на соискание ученой степени кандидата биологических наук

Научные руководители: доктор.биол.наук, профессор В.Г.Винтер, канд.физ-мат.наук, с.н.с. А.Ю.Леонтъев

КАЗАНЬ 1999

СПИСОК ИСПОЛЬЗУЕМЫХ СОКРАЩЕНИЙ

ДНК дезоксирибонуклеиновая кислота

А аденин

Т тимин

С цитозин

G гуанин

origin, ori сайт инициации репликации

oriC область хромосомы E.coli, в которой начинается

репликация

DnaA белок ициаторный белок, взаимодействие которого с oriC,

приводит к инициации репликации ДНК DnaA-бокс сайт связывания DnaA белка

DnaB, DnaC белки преинициирующего комплекса

DnaG праймаза (один из белков реплисомы)

АТФ аденозинтрифосфорная кислота

HU белок белок-помощник, участвует в инициации

репликации ДНК

IHF белок белок-помошник, участвует в инициации

репликации ДНК

FIS белок гистоноподобный белок, имеет сайт связывания в

oriC

IciA белок негистоновый белок,, имеет сайт связывания в oriC

Rob белок белок, имеющий сайт связывания в правой части

oriC

SeqA белок белок, участвующий в секвестрировании ori

Dam белок дезоксиаденозинметилаза

SDR (stable DNA replication) репликация ДНК, стабильно продолжающаяся в

отсутствии белкового синтеза DUE ДНК-расплетающий элемент

CK симметрийный консенсус

ИР инициация репликации ДНК

Обозначение симметричных преобразований в ДНК: Стп обычные повторы

Стр1 комплементарные повторы

RY повторы с преобразованиями пуринов в пурины и

пиримидинов в пиримидины КМ повторы с преобразованиями, сохраняющими

расположение амино-группы или кето-группы

ВВЕДЕНИЕ

СОДЕРЖАНИЕ

стр.

5

ГЛАВА 1. ОБЗОР ЛИТЕРАТУРЫ 10

1.1. Структура сайтов инициации репликации ДНК 10

1.2. Методы исследования генетических текстов функциональных сайтов 27

ГЛАВА 2. ОБЪЕКТЫ И МЕТОДЫ 34

2.1 ОБЪЕКТЫ 34

2.2 МЕТОДЫ 36

2.2.1. метод анализа симметрии генетического текста 36

2.2.2. метод оценки значимости выявленных элементов симметрии для функции оп 39

ГЛАВА 3. РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ 40

3.1.Симметричные структуры в нуклеотидных последовательностях прокариотических оп 40

3.2. Классификация изучаемых последовательностей, основанная на вхождение в них симметричных структур. 46

3.2.1.Классификация множества генетических текстов по признаку вхождения симметричных структур 46

3.2.2. Соответствие классификации изучаемых последовательностей, основанной на вхождение в них симметричных структур, содержательным классификациям. 57

3.3.Построение симметрийных консенсусов оп 63

3.3.1. Симметрийный консенсус для последовательностей группы

E.coli 64

3.3.2. Сравнение симметрийного консенсуса с экспериментальными данными о строении ori. 66

3.3.2.1.Сайты связывания с белками, участвующими в инициации репликации ДНК 66

3.3.2.2. В симметрийные консенсусы входят все типы экспериментально обнаруженных структурных элементов ori прокариот. 68

3.3.3. Симметрийный консенсус для последовательностей рода Pseudomonas. 71

3.3.4. Сравнение симметрийных консенсусов, построенных для последовательностей группы E.coli и последовательностей рода Pseudomonas. 74 3.4. Использование симметриных консенсусов для распознавания ori 76 3.4.1 .«Экспериментальный» образ ori 77 3.4.2. «Формальный» образ ori 80

ЗАКЛЮЧЕНИЕ 86

ЛИТЕРАТУРА 90

ПРИЛОЖЕНИЕ

116

ВВЕДЕНИЕ

Актуальность темы. Репликация ДНК, один из фундаментальных процессов, отличающий живые существа от неживой природы, контролируется на уровне инициации. Инициация репликации сложный многостадийный процесс, требующий участия многих белков, происходит в определенных участках хромосомы, которые называют сайтами инициации репликации или origin, orí. У прокариот инициация репликации ДНК происходит в единственном orí, тогда как у эукариот на каждой хромосоме существуют множественные orí репликации ДНК. Термин origin употребляется для обозначения двух различающихся понятий:

1). точечной позиции на хромосоме, в которой происходит встраивание первого нуклеотида дочерней цепи ДНК, т.е. понятие origin служит для обозначения точки начала, старта синтеза дочерней цепи ДНК;

2). так обозначают генетический элемент, который контролирует инициацию и определяет позиции сайтов инициации, что соответствует репликатору или сайту инициации репликации.

У прокариот эти два понятия перекрываются, совпадают, т.к. orí прокариот являются цис-действующими хромосомными репликаторами, которые содержат точки начала синтеза дочерних цепей.

Выяснение структуры ori важно для понимания молекулярных механизмов регуляции инициации репликации. Множество исследований посвящено решению этой фундаментальной проблемы современной биологии. Разработка новых экспериментальных методов привела к накоплению большого количества данных, проясняющих некоторые детали молекулярных механизмов регуляции инициации репликации ДНК. Об этом свидетельствуют результаты международной конференции по прокариотическим и эукариотическим репликонам ,^во Франции (International Jacques Monod Conference on Prokaryotic and Eukaryotic

Replicons, France, June 18-22, 1995) [Huberman J.A., 1995]. Проблемам репликации ДНК эукариот была посвящена конференция лаборатории в Колд-Спринг-Харборе 1997 года, на которой в большинстве представленных работ особый акцент был сделан на выяснении природы репликаторов эукариот, что, по мнению большинства исследователей, признано одной из самых актуальных проблем современной молекулярной биологии [Abstracts of CSH Meeting, 1997].

Кроме экспериментальных методов исследования процессов, в которых принимают участие определенные участки ДНК (таких как инициация репликации ДНК), в последние годы получили широкое распространение компьютерные методы. Целью этих методов, в частности, является теоретическое изучение строения первичной структуры ДНК, что очень важно для понимания её роли в исследуемом процессе. Такие исследования являются мощным инструментом, позволяющим сократить число дорогостоящих экспериментов и спланировать дальнейшие практические исследования. Особенно актуальной является разработка компьютерных методов исследования ori потому, что практические исследования инициации репликации ДНК трудоемки, результаты, как правило, трудно интерпретируемы в силу сложности используемых экспериментальных методов и самого предмета исследования.

По мере роста объемов банков генетической информации актуальной становится задача компьютерного анализа нуклеотидных последовательностей, которые можно рассматривать как генетические тексты. Представление о генетических текстах было введено в начале 70-х годов в работах Ратнера [ссылка в Ratner V.A., 1998]. Интерес к проблеме генетических текстов сильно возрос в связи с проблемой распознавания функциональных сайтов в геноме [Kel et al, 1995; Ponomarenko MP et al , 1997; Fickett, J.W., 1996]. Было предложено множество методов анализа тветических текстов, которые можно разделить на два класса: контекстные и контекстно-независимые. Контекстными являются широко

используемые консенсусные и матричные методы [Соловьев В.В и др., 1987; Bûcher Р., 1990; Karlin S, Brendel V., 1992; Quandt К. et al., 1995; Uberbacher E.C. et al, 1996; Chen Q.K. et al, 1997]. Контекстно-независимые методы более абстрактны [Brendel V. et al, 1986; Pevzner P.A. et al, 1989; Горбань и др., 1993; Martingale,С., Konopka, А.К, 1996].

Большинство методов распознавания функциональных областей генома основаны на использовании статистического подхода, что затрудняет их использование для практических потребностей экспериментальной молекулярной биологии. Основная проблема этих методов состоит в выборе вида распределения вероятностей той или иной статистики для оценки значимости полученных результатов. Хотя были предложены различные варианты моделей случайности, полученные на основе анализа большого количества текстов [Бородовский М.Ю., Певзнер П.А. , 1990; Сприжицкий Ю.А и др., 1988 ], однако корректность такого подхода не всегда удается обосновать. Для анализа генетических текстов функциональных областей необходимы контекстно-независимые методы, в которых в качестве формальных свойств последовательности используются внутренние свойства генетических текстов нестатистического характера. Известно, что повторы являются характерной чертой регуляторных районов генома как прокариот, так и эукариот [Day GR, Blake RD, 1982; Boulikas T, 1996 ] что предполагает их важность для функции этих регуляторных областей [Pearson et al, 1996; Boulikas T, Kong CF, 1993; Samadashwily GM et al , 1997]. В 1992 г. был предложен контекстно-независимый подход для анализа структуры генетического текста [Леонтьев А.Ю , 1992], основанный на выявлении внутренней симметрии текста, в котором в качестве характеристик генетического текста было предложено использовать наличие в них повторов 8-ми возможных типов симметрии. В данной работе такой симметрийный подход применяется для исследования генетических текстов .сайтов инициации репликации

прокариот и предлагается метод построения симметрийных консенсусов для изучения первичной структуры orí.

Интерес именно к первичной структуре сайта инициации репликации объясняется тем, что нуклеотидные последовательности этих сайтов у прокариот являются надежно установленным фактом. Построение моделей этих сайтов на уровне первичной структуры делает возможным выявления роли первичной структуры ДНК для функции инициации репликации. Очевидно, что анализ первичной структуры таких сложно устроенных функциональных сайтов, как прокариотические ori, позволит выявить в их нуклеотидных последовательностях структуры, необходимые для начальных этапов инициации, поскольку эти этапы должны быть наиболее сиквенс-специфичными. Кроме того, моделирование на уровне первичной структуры предполагает возможность непосредственного воздействия на процесс инициации репликации. Выявление участков нуклеотидной последовательности сайта инициации репликации, участвующих во взаимодействии с инициаторным белком, позволит изменять их с помощью методов современной молекулярной биологии (вставки и делеции оснований, направленный мутагенез), что означает возможность регулирования процессом инициации репликации. Цель и задачи:

Целью данной работы явилось выявление внутренней структуры сайта инициации репликации ДНК пркариот на уровне первичной структуры и установление, какую роль играют симметричные структуры генетических текстов этих сайтов в инициации репликации. Были поставлены следующие задачи:

1. Выявить повторы всех типов симметрии в генетических текстах сайтов инициации репликации ДНК прокариот.

2. Оценить эффективность симметрий как формальных признаков генетических текстов для функционально-значимой классификации^ изучаемых последовательностей.

3. Оценить эффективность предлагаемого симметрийного подхода для исследования структуры сайтов инициации репликации прокариот.

4. Построение формальной модели сайта инициации прокариот, пригодной для компьютерного распознавания orí в геноме прокариот.

Научная новизна:

Впервые предлагается контекстно-независимый, нестатистический метод для исследования структуры сайта инициации репликации и для классификации нуклеотидных последовательностей с функцией ori, основанный на внутренней симметрии нуклеотидных последовательностей.

Впервые было проведено систематическое исследование обобщенной симметрии генетических текстов 13-ти прокариотических сайтов инициации репликации и наряду с традиционно исследуемыми повторами ( простые и комплементарные) выявлены структуры обычно не рассматриваемых типов симметрии - КУ(пурин-пиримидин) и КМ (амино-кето)

Показана значимость для функции orí симметричных структур, выявленных в нуклеотидных последовательностях сайтов инициации репликации ДНК прокариот.

Практическая ценность:

Предложен контекстно-независимый метод анализа нуклеотидных последовательностей, основанный на внутренней симметрии генетического текста функциональных сайтов, который может быть использован для классификации последовательностей.

Предложенный метод позволяет выявлять в последовательности значимые для функции структуры.

Разработан метод описания симметричной структуры достаточно протяженных участков генетического текста (100-1000 и более), пригодный для создания образов распознавания функционального сайта в геноме.

ГЛАВА 1 ОБЗОР ЛИТЕРАТУРЫ

1.1. СТРУКТУРА САЙТОВ ИНИЦИАЦИИ РЕПЛИКАЦИИ ДНК.

Репликация ДНК, фундаментальный процесс, обеспечивающий передачу генетической информации от одного поколения к следующему, контролируется на уровне инициации.

У прокариот и низших эукариот имеются четкие сайты инициации репликации ДНК на хромосоме, в клетках высших эукариот инициация репликации происходит одновременно во множественных сайтах хромосомы. И в том, и в другом случае инициация сложный процесс, требующий участия многих белков.

Было предложено несколько моделей инициации репликации: теория репликона [Jacob et al, 1963], модель аккумулирования инициатора [Maaloe, Kjeldgaard, 1966; Mahaffy JM, Zyskind JW, 1989 ], модель разведения ингибитора [ Pritchard et al, 1969] и ауторепрессорная модель [Sompayrac, Maaloe, 1973]. Хотя эти модели предполагают различные типы контроля, все они утверждают существование триггерного белка, который включает, запускает инициацию. В настоящее время считается, что для инициации репликации необходимо взаимодействие репликатора, цис-элемента на хромосоме, и инициатора или транс-элемента, бежа или комплекса белков, узнающего репликатор [Brewer B.J., Fangman W.L., 1991; Stillman В. et al, 1992; Marahrens Y., Stillman В., 1994; Kelman Z., O'Donnell M., 1994; Hamlin J.L., Dijkwel P.A., 1995; Muzi-Falconi et al, 1996]. У прокариот инициатором является DnaA белок, а репликатором - сайты инициации репликации или origins [ Atlung et al, 1987; Mahafiy J.M., Zyskind J.W., 1989; Hansen F.G. et al, 1991; Ogasawara et al, 1991; Zyskind J.W., Smith D.W., 1992; Marians K.J., 1992; Skarstad K., Boye E., 1994; Herrick J. et al,1996].

Инициацию репликации прокариот принято описывать на примере Е. coli, т.к. именно на этом модельном объекте получено больше всего

сведений о строении ori. В норме репликация хромосомы Е. coli (4700 kb) начинается в участке, расположенном на 84,3 мин хромосомной карты, названном oriC, и инициация в этом случае зависит от DnaA белка [ Bramhill D., Kornberg А., 1988]. 10-40 мономеров DnaA белка, связанные с АТФ, связываются с oriC в присутствии бежа HU и IHF изменяют конформацшо ori [Sekimizu К. et al, 1987]. In vitro было показано, что образуется комплекс с соотношением 30 мономеров DnaA белка на oriC, в котором заняты все DnaA-боксы. [Margulies С., Kaguni J.M., 1996]. В результате присоединения DnaA белка к oriC образуется «открытый комплекс», в котором ДНК oriC частично расплетена в специфических районах в левой АТ-богатой части oriC [Bramhill, Kornberg, 1988; Baker, Kornberg, 1988; Gille, Messer, 1991], в результате становится возможной сборка реплисомы, организатором которой является DnaA белок [Messer W. et al., 1988]. Было показано, что домены DnaA белка взаимодействуют с DnaB белком, что ориентирует DnaB хеликазу в направлении движения репликационной вилки [Marszalek J. et al, 1996], становится возможным взаимодействие DnaC бежа с DnaB-белком , формируется пре-инициирующий (prepriming complex (преП) [Fminell et al, 1987, Sekimuzu et al, 1988] или препраймосома (preprimosome) [Masai et al, 1996]. Сюда же направляются праймаза (DnaG-белок) и холоэнзим ДНК-полимеразы Ш и формируется реплисома [Messer W. et al., 1988] В результате такого сложного взаимодействия запускается двунаправленный реплик анионный синтез [Kaguni JM et al, 1982].

Только фосфоршшрованные формы DnaA бежа способны к ИР. [Bramhill, D., Kornberg, А., 1988; Crooke Е et al, 1992]. Было показано, что АТФ необходима на самых ранних стадиях инициации репликации, в этом случае АТФ связана с сайтом DnaA бежа, имеющим высокое сродство к АТФ (high-affinity site ). Кроме этого, некоторое количество АТФ требуется на более поздних стадиях образования инициирующего комплекса, и эта АТФ взаимодействует с DnaA бежом в сайте с

пониженным сродством (low-affinity site) к АТФ [ Yung BY et al, 1990]. Имеются данные о том, что связывание с АТФ изменяет конформацию DnaA белка и таким образом регулирует его активность [ Mizushima Т et al, 1996; Kubota Т et al, 1997]. Недавно обнаружен негативный фактор инициации репликации, IdaA белок, инактивирующий DnaA белок, стимулируя гидролиз связанной с ним АТФ [ Mizushima Т et al, 1997;Kurokawa К et al, 1998]

В экспериментах на минихромосомах in vitro в отсутствии ДНК-лигазы были выявлены позиции точек старта репликационного синтеза на обеих цепях ДНК, которые находились близко к сайтам связывания DnaA белка (позиции 194/199 и 265/272 - на одной цепи и 209/219 и 254 - на другой ) [ Seufert, Messer, 1987]. Ранее этими же авторами были определены другие позиции старта репликационного синтеза: на ведущей цепи синтез стартовал в позициях с 248 по -44 минимального orí, на комплементарной цепи синтез начинался вне oriC, на несколько позиций левее от него [ Seufert, Messer, 1987]. В другой лаборатории при изучении репликационных вилок в системе с очищенными ферментами было показано, что концентрация праймазы определяет позиции старта репликационного синтеза. При низких концентрациях праймазы (8 пМ) наблюдался ассимметричный синтез