Бесплатный автореферат и диссертация по биологии на тему
Компьютерный анализ конформационных и физико-химических особенностей сайтов связывания транскрипционных факторов эукариот
ВАК РФ 03.00.15, Генетика

Содержание диссертации, кандидата биологических наук, Пономаренко, Юлия Владимировна

ВВЕДЕНИЕ.

Глава 1. ОБЗОР ЛИТЕРАТУРЫ.

1.1. Регуляция транскрипции в геномах эукариот: роль сайтов связывания ТФ

1.1.1. Основные типы регуляторных геномных последовательностей, контролирующих транскрипцию генов эукариот.

1.1.2. Формирование транскрипционных комплексов в геномах эукариот.

1.1.3. Взаимодействие ТВР белка с ТАТА-боксом.

1.1.4. Транскрипционные факторы и их взаимодействие с ДНК.

1.1.5. Активность сайтов связывания ТФ.

1.1.6. Роль хроматина в регуляции транскрипции.

1.2. ДНК: конформация, физико-химические свойства.

1.2.1. Структура ДНК.

1.2.2. Конформационные параметры и физико-химические свойства ДНК.

1.2.3. Зависимость конформации ДНК от последовательности.

1.2.4. Конформация ДНК в комплексах с транскрипционными факторами.

1.3. Компьютерные методы анализа сайтов связывания ТФ эукариот.

1.3.1. Базы данных по регуляции транскрипции.

1.3.2. Методы распознавания сайтов связывания ТФ.

1.3.3. Методы предсказания активности сайтов.

Введение Диссертация по биологии, на тему "Компьютерный анализ конформационных и физико-химических особенностей сайтов связывания транскрипционных факторов эукариот"

Актуальность проблемы

В настоящее время уже полностью расшифрованы геномы человека, мыши, дрозофилы, некоторых дрожжей и растений, в ближайшие годы будут расшифрованы геномы крысы, собаки и многих других организмов эукариот. В геноме человека картировано более 33 тыс. генов (.International Human Genome Sequencing Consortium, 2001). Началась так называемая пост-геномная эра, когда первоочередной становится задача аннотации всех генов человека и других организмов, а также регуляторных районов, контролирующих экспрессию генов. Одним из основных механизмов регуляции экспрессии генов на уровне транскрипции является процесс взаимодействия белков -факторов транскрипции (ТФ) с сайтами их связывания в геномах эукариот. Многочисленные экспериментальные данные, полученные за последние 15 лет, показывают, что ДНК, с которой взаимодействуют ТФ, неоднородна по конформации и своим физико-химическим свойствам, а эффективность специфического связывания ТФ со своими сайтами ДНК зависит от локальной конформации ДНК и ее физико-химических свойств. Накоплен большой объем экспериментальных данных по пространственному строению ДНК, ДНК-белковых комплексов и зависимости конформации и физико-химических свойств структуры ДНК от нуклеотидной последовательности, требующих компьютерного анализа и теоретического обобщения. Несмотря на огромное разнообразие транскрипционных факторов, функционирующих в организмах эукариот, по пространственной структуре ДНК-связывающих доменов они подразделяются всего на четыре больших суперкласса (Wingender et al., 2000). Однако связь нуклеотидного контекста сайтов связывания ТФ со структурой их ДНК-связывающих доменов до настоящего времени не изучалась.

Сайты связывания ТФ характеризуются не только нуклеотидной последовательностью и положением в геноме, но и величинами транскрипционной активности. Вариабельность уровней активности сайтов связывания ТФ определяет многообразие вариантов экспрессии генов. Благодаря прогрессу в развитии биохимии появились достаточно точные методы количественного измерения транскрипционной активности сайтов. В ряде работ (Stormo et al, 1986; Jonsson et al., 1993; Kraus et al., 1996 и др.) была показана возможность использования методов анализа нуклеотидных последовательностей сайтов для предсказания величин их активности в зависимости от последовательности. Однако, природа влияния нуклеотидного контекста на величины активности осталась не ясна самим авторам этих работ. Имеются экспериментальные данные о зависимости эффективности функционирования сайтов связывания ТФ в процессе транскрипции от локальной конформации ДНК и ее физико-химических свойств. Поэтому учет локальных контекстно-зависимых конформационных и физико-химических особенностей структуры ДНК для предсказания количественных величин активности сайтов и выяснение природы влияния нуклеотидного контекста на транскрипционную активность сайтов представляется актуальным и перспективным.

Многочисленные экспериментальные данные показывают, что сайты связывания одного и того же ТФ, расположенные в различных регуляторных участках одного генома или в одном и том же регуляторном участке генов различных организмов, могут различаться по уровню активности, т.е. величины функциональной активности сайтов связывания ТФ зависят от их нуклеотидного и клеточного окружения. Однако на уровне нуклеотидного контекста сайтов не было обнаружено каких-либо закономерностей, объясняющих эту зависимость. Поэтому исследование конформационных и физико-химических особенностей структуры ДНК представляется актуальным для выявления этих закономерностей, наличие которых необходимо для понимания устройства регуляторных районов генов и построения адекватной картины о взаимодействии с ними белков - факторов транскрипции.

Цели и задачи исследования

Целью работы было исследование контекстно-зависимых конформационных и физико-химических особенностей структуры ДНК сайтов связывания ТФ, значимых для их распознавания и функциональной активности. При этом решались следующие задачи:

1. Разработка теоретического метода выявления контекстно-зависимых конформационных и физико-химических особенностей структуры ДНК сайтов связывания ТФ; реализация его в виде компьютерных программ.

2. Создание выборок нуклеотидных последовательностей сайтов связывания ТФ из ДНК генов эукариот и документирование их в виде базы данных. Компьютерный анализ этих выборок с использованием разработанного метода. Документирование полученных результатов в виде базы знаний и создание программ для ее активизации. Классификация сайтов по отношению к четырем структурным типам ДНК-связывающих доменов ТФ (основных, цинк-содержащих, «спираль-поворот-спираль», (3-скэффолд).

3. Разработка теоретического метода анализа контекстно-зависимых конформационных и физико-химических особенностей структуры ДНК, определяющих функциональную активность ДНК-сайтов, и предсказания величин активности сайтов по их нуклеотидным последовательностям; реализация его в виде компьютерных программ.

4. Накопление и документирование в виде базы данных экспериментальной информации о количественных величинах транскрипционной активности сайтов связывания ТФ. Компьютерный анализ этих экспериментальных данных с использованием разработанного метода. Документирование полученных результатов в виде базы знаний и создание программ для ее активизации.

Научная новизна

Предложен новый метод выявления контекстно-зависимых конформационных и физико-химических особенностей структуры ДНК сайтов связывания ТФ. С помощью этого метода исследованы конформационные и физико-химические особенности структуры ДНК сайтов связывания ТФ 41 типа и показано, что каждый сайт характеризуется уникальным набором особенностей структуры ДНК, отличающих их от случайных последовательностей нуклеотидов. Впервые предложен подход к поиску потенциальных сайтов связывания ТФ с использованием конформационных и физико-химических особенностей структуры их ДНК. Показано существование конформационных и физико-химических особенностей структуры ДНК сайтов связывания ТФ эукариот, специфичных для четырех структурных типов ДНК-связывающих доменов ТФ. На их основе построены методы поиска сайтов связывания ТФ с заданным типом ДНК-связывающего домена.

Впервые осуществлена классификация сайтов связывания ТФ по отношению к четырем структурным типам ДНК-связывающих доменов ТФ (основных, цинк-содержащих, «спираль-поворот-спираль», /3-скэффолд) и показано, что данная классификация сайтов согласуется с известной классификацией пространственных структур ДНК-связывающих доменов ТФ.

Предложен новый метод анализа контекстно-зависимых конформационных и физико-химических особенностей структуры ДНК, определяющих функциональную активность сайтов ДНК, и предсказания величин активности сайтов по их нуклеотидным последовательностям. С помощью этого метода исследованы экспериментальные данные по транскрипционной активности сайтов связывания ТФ и показано, что величины активности сайтов определяются конформационными и физико-химическими особенностями структуры их ДНК. Показано, что использование конформационных и физико-химических особенностей структуры ДНК с учетом локального окружения сайта, значимого для активности сайта в одних условиях нуклеотидного или клеточного окружения, позволяет предсказывать величины его активности в других условиях.

Научная и практическая ценность

Разработанный метод выявления контекстно-зависимых конформационных и физико-химических особенностей структуры ДНК сайтов связывания ТФ может использоваться для анализа других сайтов ДНК помимо исследованных в настоящей работе. Результаты анализа последовательностей сайтов связывания ТФ 41 типа представлены в компьютерной системе B-DNA-Video, программы которой позволяют строить профили конформационных и физико-химических особенностей структуры ДНК сайтов и осуществлять их поиск в произвольных геномных последовательностях. B-DNA-Video доступна по сети Интернет {http://wwwmgs.bionet.nsc.ru/mgs/systems/bdnavideof). Собранные в базе данных SAMPLES выборки нуклеотидных последовательностей сайтов связывания ТФ из ДНК генов эукариот могут использоваться для анализа и обучения различными компьютерными программами, они доступны по сети Интернет {http://wwwmgs. bionet. nsc. ru/mgs/dbases/nsamplesf).

Собрана информация о более 500 экспериментальных данных по количественным величинам функциональной активности сайтов связывания ТФ. Эта информация представлена в виде базы данных, которая является уникальной и не имеет мировых аналогов. База данных является ценным источником сведений о влиянии нуклеотидных замен в последовательностях сайтов связывания ТФ на уровень их функциональной активности, а также содержит описание условий экспериментов. База данных доступна по сети Интернет (http://wwwmgs.bionet.nsc. ru/mgs/systems/activity/)

Разработанный метод анализа контекстно-зависимых конформационных и физико-химических особенностей структуры ДНК, определяющих функциональную активность сайтов ДНК, позволяет анализировать различные типы экспериментальных данных по активности последовательностей ДНК-сайтов. Созданные в данной работе методы предсказания сайтов связывания ТФ доступны по сети Интернет (,http://wwwmgs.bionet.nsc.ru/mgs/systems/activity/) и могут использоваться для анализа соответствующих сайтов в произвольных геномных последовательностях.

Структура и объем работы

Диссертация состоит из введения, трех глав, заключения, выводов и списка литературы.

Заключение Диссертация по теме "Генетика", Пономаренко, Юлия Владимировна

Основные результаты диссертации опубликованы в следующих работах:

1. Ponomarenko,М.P., Ponomarenko,J.V., Kel,A.E., Kolchanov,N.A. Conformation features significant for the pro-, eukaryotic TATA boxes have been optimized via evolution. The eleventh Rinshoken International Conference "Frontiers of structural biology", November 57, 1996, 87-88.

2. Ponomarenko,M.P., Ponomarenko,J.V., Kel,A.E., Kolchanov,N.A. Search for DNA conformational features for functional sites. Investigation of the TATA box. Proceedings of the 1997 Pacific Symposium. Altaian,R. (ed), Singapore, World Sci., 1997, 340-351.

3. Пономаренко,M.П., Пономаренко,Ю.В., Кель,А.Э., Колчанов,НА., Карас,Х., Вин-гендер,Э., Скленар,Х. Компьютерный анализ конформационных особенностей ДНК ТАТА-боксов промоторов эукариот. Молекулярная биология. 1997, 31, 733-740.

4. Пономаренко,М.П., Савинкова,J1.К., Пономаренко,Ю.В., Кель,А.Э., Титов,И.И., Колчанов,Н.А. Моделирование последовательностей ТАТА-боксов генов эукариот. Молекулярная биология. 1997, 31, 726-732

5. Колчанов,Н.А., Пономаренко,М.П., Пономаренко,Ю.В., Подколодный,Н.А., Фролов,А.С. Функциональные сайты геномов про- и эукариот: компьютерное моделирование и предсказание активности. Молекулярная биология. 1998, 32, 255-267.

6. Ponomarenko,М.Р., Ponomarenko,J.V., Frolov,A.S., Kolchanov,N.A., Podkolodny,N.L. A distributed, intelligent database for the activities of the functional sites in DNA, RNA. Proceedings of the 1998 Pacific Symposium on Biocomputing. 1998, 103-104.

7. Savinkova,L.K., Sokolenko,A.A., Rau,V.A., Kobzev,V.F., Ponomarenko,M.P., Ponomarenko,J.V., Kolchanov,N.A. Quantitative computer-assisted analysis of the TATA-binding protein affinity for complementary duplexes of synthetic oligodeoxyribonucleotides. Proceedings of The First International Conference of Bioinformatics of Genome Regulation and Structure, BGRS'98, Novosibirsk - Altai Mountains, Russia, August 24-31, 1998, Ed. N.Kolchanov et al., Novosibirsk, 165-169.

8. Ponomarenko,M.P., Frolov,A.S., Ponomarenko,J.V., Vorobiev,D.G., Levitsky,V.G., Podkolodnaya,O.A., Overton,G.C., Kolchanov,N.A. B-DNA-VIDEO: an active database for the significant B-DNA features of transcription factor binding sites. Proceedings of The First International Conference of Bioinformatics of Genome Regulation and Structure, BGRS'98, Novosibirsk, Russia, August 24-31, 1998, C. 66-70.

9. Пономаренко,M.П., Фролов,А.С., Пономаренко,Ю.В., Лаврюшов,С.В,. Колчанов, Н.А., Подколодный,H.JL, Ерохин,Г.Н. Компьютерное представление и автоматическая генерация знаний о функциональной активности молекул ДНК и РНК. Труды ИВМиМГСО РАН, Сер. Мат. Моделирование в геофизике, 1998, 5., 181-198.

10. Колчанов,Н.А., Пономаренко,М.П., Кель,А.Э., КондрахинДО.В., Фролов,А.С., Колпаков,Ф.А., Горячковская,Т.Н., Кель,О.В., Ананько,Е.А., Игнатьева,Е. В., Подколодная,О.А., Степаненко,И.Л., Меркулова,Т.И., Бабенко,В.В, Воробьев,Д.В., Лаврюшев,С.В., Пономаренко,Ю.В., Кочетов,А.В., Колесов,Г.Н., Подколодный, Н.Л., Миланези,Л., Вингендер,Э., Хейнемайер,Т., Соловьев,В.В, Овертон,Г.К. GeneExpress: интегратор баз данных и компьютерных систем, доступных по сети Интернет и предназначенных для изучения экспрессии генов эукариот. Биофизика, 1999, 44, 837841.

11. Ponomarenko,J.V., Ponomarenko,M.P., Frolov,A.S., Vorobyev,D.G., Overton,G.C., Kolchanov,N.A. Conformational, physicochemical DNA features specific for transcription factor binding sites. Bioinformatics, 1999, 15, 7/8, 654-668.

12. Kolchanov,N. A., Ponomarenko,M.P., Frolov,A.S., Ananko,E.A., Kolpakov,F.A., Ignatieva,E.V., Podkolodnaya,O.A., Goryachkovskaya,T.N., Stepanenko,I.L., Merkulova,T.I., Babenko,V.V., Ponomarenko,Yu.V., Kochetov,A.V., Podkolodny,N.L., Vorobiev,D.V., Lavryushev,S.V., Grigorovich,D.A., Kondrakhin,Yu.V., Milanesi,L., Wingender,E., Solovyev,V., Overton,G.C. Integrated databases, computer systems for studying eukaryotic gene expression. Bioinformatics, 1999, 15, 7/8, 669-686.

13. Ponomarenko,M.P., Ponomarenko,J.V., Frolov,A.S., Podkolodny,N.L., Savinkova,L.K., Kolchanov,N. A., Overton,G.C. Identification of sequence-dependent DNA features correlating to activity of DNA sites interacting with proteins. Bioinformatics, 1999, 15, 7/8, 687-703.

14. Ponomarenko,J.V., Ponomarenko,M.P., Podkolodnaya,O.A., Frolov,A.S. Sequence-dependent B-helix DNA features common for transcription factor superclasses. Abstracts of the First Cold Spring Harbor Workshop on computational biology "Bridging the Gap between Sequences and Functions ", September 7-9, 1999, New York, USA, p. 12.

15. Ponomarenko,J.V., Orlova,G.V., Ponomarenko,M.P., Lavryushev,S.V., Frolov,A.S., Zybova,S.V., Kolchanov,N A. SELEXDB: an activated database on selected randomized DNA/RNA sequences addressed to genomic sequence annotation. Nucleic Acids Res., 2000, 28, 205-208.

16. Ponomarenko,J.V., Ponomarenko,M.P. Common B-DNA features of a definite transcription factor binding sites superclass. Proceedings of The Second International Conference of Bioinformatics of Genome Regulation and Structure, BGRS'2000, Novosibirsk, Russia, August 7-11, 2000, Ed. N.Kolchanov et al., Novosibirsk, 1, 98-101.

17. Ponomarenko,M.P., Ponomarenko,J.V., Orlova,G.V., Frolov,A.S., Kolchanov,N.A., Sarai,A. Properties specific for protein/DNA free energy changes caused by single nucleotide substitutions. Genome Informatics, 2000, 11, 399-401.

18. Ponomarenko,J., Ponomarenko,M., Orlova,G., Kolchanov,N., Sarai,A. Conformational B-helix DNA properties specific to DNA free energy of protein binding to DNA with point mutation focused on SNP-analysis. Proceedings of The Pacific Symposium on Biocomputing (PSB'2001), January 3-7, 2001, Hawaii, USA, p. 118.

19. Ponomarenko,J.V., Furman,D.P., Frolov,A.S., Podkolodny,N.L., Orlova,G.V., Ponomarenko,M.P., Kolchanov,N. A., Sarai,A. ACTIVITY: a database on DNA/RNA sites activity adapted to apply sequence-activity relationships from one system to another. Nucleic Acids Res., 2001, 29, 284-287.

20. Ponomarenko,J.V., Orlova,G.V., Frolov,A.S., Gelfand,M.S., Ponomarenko,M.P. SELEXDB: a database on in vitro selected oligomers adapted for recognizing natural sites and for analyzing both SNPs and site-directed mutagenesis data. Nucleic Acids Res., 2002, 30(1), 195-199.

ЗАКЛЮЧЕНИЕ

Настоящая диссертационная работа посвящена исследованию контекстно-зависимых конформационных и физико-химических особенностей ДНК сайтов связывания ТФ, значимых для их распознавания и функциональной активности. Эти исследования направлены на решение одной из актуальных задач геномики пост-геномной эры -определение значимых параметров структуры ДНК регуляторных районов, контролирующих экспрессию генов эукариот для адекватной их аннотации.

В главе 2 диссертационной работы описана компьютерная система B-DNA-Video, позволяющая выявлять контекстно-зависимые конформационные и физико-химические особенности структуры ДНК сайтов, значимые для их распознавания. Система включает:

• базу данных нуклеотидных последовательностей сайтов связывания ТФ эукариот;

• базу данных конформационных параметров и физико-химических свойств ДНК;

• метод выявления значимых конформационных и физико-химических особенностей структуры ДНК сайтов;

• базу знаний по выявленным в ходе анализа значимым конформационным и физико-химическим особенностям структуры ДНК сайтов связывания ТФ.

С помощью системы B-DNA-Video исследованы нуклеотидные последовательности из ДНК генов эукариот сайтов связывания ТФ 41 типа. Установлено, что сайты каждого типа характеризуются уникальным набором значимых конформационных и физико-химических особенностей структуры ДНК, отличающих их от случайных последовательностей. Показано соответствие выявленных особенностей структуры ДНК сайтов с другими независимыми экспериментальными данными. На основе выявленных сайт-специфических особенностей структуры ДНК построены методы поиска 41 типа сайтов связывания ТФ в геномных последовательностях. Показана статистическая достоверность результатов предсказания сайтов с помощью этих программ. Показано также, что использование метода усреднения всех значимых конформационных и физико-химических особенностей сайта уменьшает ошибки распознавания по сравнению с использованием только отдельных параметров структуры ДНК. Данное наблюдение позволяет выдвинуть гипотезу о взаимозависимой оптимизации конформационных и физико-химических свойств структуры ДНК сайтов связывания ТФ в процессе эволюции.

Разработанный нами новый метод выявления контекстно-зависимых конформационных и физико-химических особенностей структуры ДНК и построения на их основе программ распознавания сайтов связывания ТФ использовался также для анализа других функциональных сайтов ДНК. А именно, сайтов связывания нуклеосом

Пономаренко и др., 1997а; Levitsky et al, 1999), сайтов разрезания ДНК топоизомеразой I (Кузин, 2001; Ponomarenko et al., 1998), сайтов связывания геномной ДНК с ядерным матриксом с участием белка ламины Drosophila melanogaster (Likhacheva et al., 1998). Использование, помимо нас, другими исследователями разработанных нами баз данных и программ компьютерной системы B-DNA-Video для задач распознавания промоторов эукариот (Ohler et al., 2001) и сравнительного анализа промоторов ортологичных генов растений (Goebel et al., 2000) свидетельствуют о перспективности использования разработанного нами метода для решения широкого круга задач, возникающих в процессе аннотации геномов.

В результате сравнительного анализа сайтов связывания ТФ эукариот по выявленным для них конформационным и физико-химическим особенностям структуры ДНК показано, что они подразделяются на две группы: 1) сайты связывания основных и цинк-содержащих ДНК-связывающих доменов ТФ и 2) сайты связывания ДНК-связывающих доменов типа «спираль-поворот-спираль» и р-скэффолд. Рассмотрено и показано соответствие разработанной нами классификации с известными молекулярными механизмами ДНК-белковых взаимодействий и независимой классификацией др. Э.Вингендера (Wingender et al., 2000; Вингендер, 1997) ДНК-связывающих доменов ТФ по их пространственным структурам. Предлагаемая нами классификация является статистически достоверной и устойчивой к варьированию методов кластерного анализа. Нами впервые показано существование конформационных и физико-химических особенностей структуры ДНК сайтов связывания ТФ эукариот, специфичных по отношению к четырем структурным типам ДНК-связывающих доменов ТФ (основных, цинк-содержащих, содержащих мотив «спираль-поворот-спираль», содержащих /3-скэффолд и/или контактирующих с ДНК по малой бороздке). На основе выявленных особенностей структуры ДНК построены методы поиска сайтов связывания ТФ в зависимости от структурного типа их ДНК-связывающего домена. Этот подход представляется перспективным для моделирования искусственных белков или поиска природных белков, связывающих участки ДНК с заданными конформационными и физико-химическими свойствами.

С использованием компьютерной системы B-DNA-Video был проведен детальный анализ конформационных и физико-химических особенностей структуры ДНК ТАТА-боксов промоторов эукариот (Пономаренко и др., 1997а-д; Ponomarenko et al., 1996, 1997, 19996). Высказанное нами на основе сравнения конформационных особенностей ТАТА-боксов и сайтов связывания нуклеосомы предсказание о том, что низкая величина угла спирального вращения ДНК ТАТА-боксов может способствовать вытеснению нуклеосомы в процессе связывания белка ТВР с ТАТА-боксом (Пономаренко и др., 1997а), недавно было экспериментально подтверждено (Kahn, 2000). Таким образом, анализ контекстно-зависимых конформационных и физико-химических особенностей структуры ДНК позволяет выявлять закономерности, отражающие тонкие особенности взаимодействия белка с окружающими сайт районами ДНК, предшествующих образованию функционально активного ДНК-белкового комплекса.

В главе 3 диссертации описана компьютерная система ACTIVITY, предназначенная для анализа контекстно-зависимых конформационных и физико-химических особенностей структуры ДНК сайтов, значимых для их функционирования. Система включает:

• базу экспериментальных данных по количественным величинам активности функциональных сайтов ДНК;

• базу данных, описывающую условия эксперимента;

• базу данных конформационных параметров и физико-химических свойств структуры ДНК;

• метод выявления контекстно-зависимых конформационных и физико-химических особенностей структуры ДНК сайтов, значимых для их функциональной активности;

• метод предсказания величин активности функциональных сайтов на основе значимых конформационных и физико-химических особенностей структуры их ДНК;

• базу знаний по выявленным в ходе анализа конформационным и физико-химическим особенностям структуры ДНК сайтов, значимым для их активности;

• программы предсказания количественных величин активности сайтов на основе выявленных особенностей;

• базу знаний по применению методов предсказания активности сайтов в разных средовых условиях.

В главе 3 диссертации подробно рассмотрены результаты исследования с использованием системы ACTIVITY сайтов связывания факторов USF, MEF-2, c-Myb, YY1, ТВР и Inr-элемента. Исследованы различные последовательности ДНК сайтов: природные, мутантные, а также полученные методами селекции через связывание с определенным фактором и последующей амплификации рандомизированных последовательностей нуклеотидов. В работе представлены результаты анализа данных 33 экспериментов, позволяющих прямо или косвенно оценить вклад конкретного сайта в уровень экспрессии генетического материала: например, по сродству белка к ДНК, по количеству выхода мРНК и белка и т.д. Выявлены конформационные и физико-химические особенности структуры ДНК, определяющие активность сайтов, в числе которых угол спирального вращения ДНК для связывания фактора USF с ДНК, изгибная жесткость ДНК для связывания с фактором c-Myb, персистентная длина ДНК для взаимодействия с фактором MEF-2, ширина малой бороздки ДНК для взаимодействия с белком ТВР и др. Во всех случаях показано согласие выявленных особенностей структуры ДНК с независимыми экспериментальными данными. В результате построены методы, позволяющие достоверно предсказывать количественные величины функциональной активности сайтов.

Данные сравнения выявленных закономерностей «величина активности - особенность структуры ДНК» для сайтов связывания факторов MEF-2, c-Myb и их мутантных вариантов подтвердили выдвинутое ранее в работах сотрудников лаборатории теоретической генетики ИЦиГ СО РАН (Ponomarenko et al., 1994; Kolchanov et al., 1994) предположение о существовании облигатных и факультативных особенностей структуры ДНК сайтов, значимых для их активности. Так например, в случае связывания MEF-2 белка персистентная длина ДНК является облигатной особенностью ДНК MEF-сайта, а ширина малой бороздки ДНК - факультативной. Эта особенность структуры ДНК объясняет изменение эффективности связывания белка с ДНК при наличии мутаций в N-концевом участке ДНК-связывающего домена фактора MEF-2 (Meierhans, Allemann, 1998). Для Myb-сайта облигатной является характерная величина изгибной жесткости ДНК, а факультативной - угол тилт. Значение угла тилт перестает быть значимым для связывания фактора c-Myb с ДНК, если в белке c-Myb имеется мутация, нарушающая конформационную подвижность в гидрофобном ядре ДНК-связывающего домена и тем самым ослабляющая связывание белка со своим сайтом (Ogata et al., 1996).

Применение разработанного нами метода анализа конформационных и физико-химических особенностей структуры ДНК, значимых для активности сайтов связывания ТФ, для исследования мутаций в белках, влияющих на их взаимодействие с ДНК, может рассматриваться как перспективное направление при решении задач конструирования белков с заданными свойствами.

Поскольку, как было показано экспериментально, величины функциональной активности сайтов связывания ТФ зависят от их нуклеотидного и клеточного окружения, то нами было проведено исследование для оценки предсказательных возможностей анализируемых параметров структуры ДНК при работе сайта в разных условиях среды. Исследование проводили с использованием наборов данных «последовательность сайта -величина активности» от 24 различных экспериментов, в которых были определены величины активности YY1-сайта и lnr-элемента, различающихся по последовательности. Было установлено, что величины активности сайтов в 14 экспериментах описываются линейными зависимостями от предсказанных величин активности соответствующих сайтов в базовых экспериментах, для которых были выявлены конформационные и физико-химические особенности структуры ДНК. Однако в остальных 8 экспериментах зависимости оказались более сложными, они включали учет локального нуклеотидного окружения сайтов.

Этот результат согласуется с современными представлениями о том, что в процесс опознавания ТФ специфического участка на ДНК вовлечены окружающие сайт нуклеотидные последовательности. Кроме того, на этот процесс оказывают также свое влияние нуклеосомная упаковка ДНК и белок-белковые взаимодействия, в которые может быть вовлечен транскрипционный фактор в составе транскриптосомы (Gall et al., 1999).

Транскрипционный комплекс, участвующий в транскрипции определенного гена, характеризуется по определению Джонсона и МакКнайта (Johnson, McKnight, 1989) своеобразной «мозаичностью» (Jigsaw puzzle). В сборке комплекса принимает участие множество ТФ, взаимно влияющих друг на друга посредством белок-белковых взаимодействий, и множество регуляторных участков ДНК, включая и их ближайшие окружения, вовлеченных во множество ДНК-белковых взаимодействий. Наши результаты по исследованию зависимости величин активности сайтов ДНК от конформационных и физико-химических особенностей структуры ДНК в различных средовых условиях, а также результаты исследования особенностей структуры ДНК сайтов связывания ТФ генов эукариот согласуются и объяснимы в рамках концепции «мозаики» и показывают, насколько важен может быть учет локального окружения сайтов при решении задач их распознавания и предсказания величин их активности. Другие теоретические исследования последних лет, в частности, по распознаванию сайтов связывания факторов CTF/NF-1 (Roulet et al., 1998, 1999) и E2F (Kel et al, 2001) также показали, что учет локального окружения сайтов позволяет увеличивать точность их распознавания.

Данные, используемые для анализа компьютерными программами, получены, как правило, в разных условиях эксперимента, в той или иной мере влияющих на характер ДНК-белковых взаимодействий. Поэтому необходимо детально документировать условия экспериментов, что было осуществлено нами путем создания специализированной базы данных SYSTEM. Различные условия эксперимента могут приводить к кажущейся противоречивости данных, полученных при измененных условиях. Так было, например, в случае исследования репрессионной и белок-связывающей активности YY1-сайтов (Hyde-DeRuyscher et al., 1995; см. раздел 3.3.1 диссертации). Поэтому дальнейшее развитие начатых нами исследований по изучению особенностей активности сайтов в различных условиях эксперимента представляется перспективным для создания генетических конструкций с заданными свойствами и предсказуемо функционирующих в определенных вне- и внутриклеточных условиях.

В настоящей диссертационной работе представлены результаты исследования закономерностей между величинами «активность сайта - конформационная (физико-химическая) особенность структуры ДНК» и условиями эксперимента, а также нуклеотидным окружением сайта. Следующим шагом в этих исследованиях, как актуальная задача пост-геномной эры (Roses, 2000), является изучение влияния сайт-направленных мутаций, а также одиночных нуклеотидных замен, с различной частотой распределенных в популяции (SNP, Single Nucleotide Polymorphisms) (Marth et al., 2001), для которых показана ассоциация с болезнями. Эти исследования проводятся автором в настоящее время совместно с лабораторией регуляции экспрессии генов ИЦиГ СО РАН (Ponomarenko et al., 2001).

Предложенные в работе подходы анализа и учета конформационных и физико-химических особенностей структуры ДНК могут быть перспективными при изучении искусственных сайтов связывания ТФ, полученных методами селекции-амплификации рандомизированных последовательностей ДНК. Эти исследования также проводятся в настоящее время в лаборатории теоретической генетики ИЦиГ СО РАН при участии соискателя (Ponomarenko et al., 2000, 2002) и рассматриваются как перспективные для аннотации геномов, анализа SNP, сайт-направленного мутагенеза, межвидовых полиморфизмов.

В процессе аннотации геномов возникает проблема интеграции постоянно растущего количества баз данных, посвященных различным аспектам регуляции транскрипции, и ресурсов для работы с ними. В связи с этим следует подчеркнуть, что все экспериментальные данные и полученные в ходе их анализа результаты, представленные в настоящей диссертационной работе, документированы в виде баз данных и компьютерных программ в системах B-DNA-Video и ACTIVITY. Они доступны по сети Интернет и могут использоваться как экспериментаторами, так и теоретиками для компьютерного анализа и аннотации геномных последовательностей эукариот.

Библиография Диссертация по биологии, кандидата биологических наук, Пономаренко, Юлия Владимировна, Новосибирск

1. Вингендер,Э. (1997) Классификация транскрипционных факторов эукариот. Молекулярная биология. 31, 584-600.

2. Дикерсон,Р.Э. (1984) Спираль ДНК. В Мире Науки. 2, 34-48.

3. Зенгер,В. (1987) Принципы структурной организации нуклеиновых кислот. Москва, Мир, стр. 413-463.

4. Квандт,К, Фреш,К, Вернер,Т (1997) Анализ регуляторных районов транскрипции основанный на изучение мутантных позиций сайтов связывания транскрипционных факторов. Мол, Биол., 31, 749-758.

5. Кель,А.Э. (1991) Теоретический анализ структуры, функции и эволюции коротких повторов в геномах. Автореферат диссертации на соискание ученой степени кандидата биологических наук. Новосибирск, 1991.

6. Кель,О.В. (2000) Регуляция транскрипции генов эукариот: композиционные элементы, базы данных и компьютерный анализ. Автореферат диссертации на соискание ученой степени кандидата биологических наук. Новосибирск, 2000.

7. Кель,О.В., Кель,А.Э., Ромащенко,А.Г., Вингендер,Э., Колчанов,Н.А. (1997) Композиционные регуляторные элементы: классификация и описание в базе данных COMPEL. Молекулярная биология. 31, 601-615

8. Кузин,Ф.Э. (2001) Топологическое состояние ДНК в интерфазных ядрах и метафазных хромосомах. Автореферат диссертации на соискание ученой степени кандидата биологических наук. Новосибирск, 2001.

9. Леман,Э. (1979) Проверка статистических гипотез. М.:Наука.

10. Подколодная,О.А., Степаненко,И.Л. (1997) Механизмы транскрипционной регуляции эритроид-специфичных генов, Молекулярная биология, 31, 671-683.

11. Пономаренко,М.П., Пономаренко,Ю.В., Под колодная, О. А., Фролов,А.С., Воробьев,Д.В., Колчанов,Н.А., Овертон,Г.К. (1999) Усреднее результатов распознавания сайтов может увеличить точность аннотации генома человека. Биофизика, Т. 44, С. 649-654.

12. Пономаренко,М.П., Пономаренко,Ю.В., Кель,А.Э., Колчанов,Н.А., Карас,Х., Вингендер,Э., Скленар,Х. (1997а) Компьютерный анализ конформационных особенностей ДНК ТАТА-боксов промоторов эукариот. Молекулярная биология. 31, 733-740.

13. Пономаренко,М.П., Савинкова,Л.К., Кель,А.Э., Колчанов,Н.А. (1997в) Компьютерноемоделирование последовательностей ТАТА-боксов промоторов эукариот. Доклады Академии наук, 355, 557-561.

14. Пономаренко,М.П., Савинкова,J1.К., Пономаренко,Ю.В., Кель,А.Э., Титов,И.И., Колчанов,Н.А. (19976) Моделирование последовательностей TATA боксов генов эукариот. Молекулярная биология. 31, 726-732

15. Трифонов,Э.Н. (1997) Генетическое содержание последовательностей ДНК определяется суперпозицией многих кодов. Молекулярная биология. 31, 759-767.

16. Фишберн,П. (1978) Теория полезности для принятия решений. М.: Наука.

17. International Human Genome Sequencing Consortium (2001) Initial sequencing and analysis of the human genome. Nature, 409, 860-921.

18. Adams,C.C., Workman,J.L. (1995) Binding of disparate transcriptional activators to nucleosomal DNA is inherently cooperative. Mol. Cell Biol. 15, 1405-1421.

19. Almouzni,G, Khochbin,S, Dimitrov,S, Wolffe,AP (1994) Histone acetylation influences both gene expression and development of Xenopus laevis. Dev. Biol. 165, 654-669.

20. Apone,L.M., Green,M.R. (1998) Transcription sans TBP. Nature, 393, 114-116.

21. Apone,LM, Virbasius,CM, Reese,JC, Green,MR (1996) Yeast TAF(II)90 is required for cell-cycle progression through G2/M but not for general transcription activation. Genes Dev. 10, 2368-2380.

22. Babcock,M.S., Pednault,E.P.D., Olson,W.K. (1993) Nucleic acid structure analysis: a users guide to a collection of new analysis programs. J. Biomol. Struct. Dynamics 11, 597-628;

23. Babcock,M.S., Pednault,E.P.D., Olson,W.K. (1994) Nucleic acid structure analysis. Mathematics for local Cartesian and helical structure parameters that are truly comparable between structures. J. Mol. Biol. 237, 125-156

24. Babenko, V. N., P. S. Kosarev, О. V. Vishnevsky, V. G. Levitsky, V. V. Basin, A. S. Frolov (1999) Investigating extended regulatory regions of genomic DNA sequences. Bioinformatics, 15, 7/8, 644-653.|

25. Baker W, van den Broek A, Camon E, Hingamp P, Sterk P, Stoesser G, Tuli MA (2000) The EMBL nucleotide sequence database. Nucleic Acids Res, 28(1),19-23.

26. Barrick,D.,Villanueba,K., Childs,J., Kalil,R., Schneider,T.D., Lawrence,C.E., Gold,L., Stormo,G.D. (1994) Quantitative analysis of ribosome binding sites in E.coli. Nucleic Acids Res., 22, 1287-1295.

27. Beato, M, Eisfeld, К (1997) Transcription factor access to chromatin. Nucleic Acids Res, 25, 3559-3563.

28. Becker,P.B. (1997) DNA-transcription factor interactions in the context of chromatin. In

29. Transcription factors in eukaryotes, Ed. Papavassiliou,A.G.

30. Bell,В., Tora,L. (1999) Regulation of gene expression by multiple forms of TFIID, other novel TAFII-containing complexes. Exp Cell Res., 246(1):11-19.

31. Bellorini,M, Dantonel,JC, Yoon,JB, Roeder,RG, Tora,L, Mantovani,R (1996) The major histocompatibility complex class II Ea promoter requires TFIID binding to an initiatorsequence. Mol Cell Biol, 16, 503 512.

32. Bendall,A.J., Molloy,P.L., (1994) Base preferences for DNA binding by the bHLH-Zip protein USF: effects of MgC12 on specificity, comparison with binding of Мус family members. Nucleic Acids Res., 22, 2801-2810.

33. Benson DA, Karsch-Mizrachi I, Lipman DJ, Ostell J, Rapp BA, Wheeler DL (2000) GenBank. Nucleic Acids Res, 28(1):15-18.

34. Berg,O.G., von Hippel,P.H. (1987) Selection of DNA binding sites by regulatory proteins.

35. Statistical-mechanical theory, application to operators, promoters. J. Mol. Biol. 193. 723750.

36. Berg,O.G.„ von Hippel,P.H. (1988) Selection of DNA binding sites by regulatory proteins.1.. The binding specificity of cyclic AMP receptor protein to recognition sites. J. Mol. Biol., 200, 709-723.

37. Berk,AJ (1999) Activation of RNA polymerase II transcription. Curr. Opin. Cell Biol., 11, 330-335.

38. Bewley, CA, Gronenborn,AM, Clore,GM (1998) Minor groove-binding architectural proteins: structure, function,, DNA recognition. Annu Rev Biophys Biomol Struct., 27, 105131.

39. Biedenkapp,H, Borgmeyer,U, Sippel,AE, Klempnauer,KH (1988) Viral myb oncogene encodes a sequence-specific DNA-binding activity. Nature, 335, 835-837.

40. Blomquist, P, Li Q, Wrange О (1996) The affinity of nuclear factor 1 for its DNA site is drastically reduced by nucleosome organization irrespective of its rotational or translational position. J Biol Chem, 271, 153-159.

41. Bolshoy,A., McNamara,P., Harrington,R.E., Trifonov,E.N. (1991) Curved DNA without A-A: experimental estimation of all 16 DNA wedge angles. Proc. Nath. Acad. Sci. U.S.A., 88, 2312-2316.

42. Boulikas,T. (1996) Common structural features of replication origins in all life forms. J. Cell Biochem. 60, 297-316.

43. Boyd,D.C., Turner,P.C., Watkins,N.J., Gerster,T., Murphy,S. (1995) Functional redundancy of promoter elements ensures efficient transcription of the human 7SK gene in vivo. J. Mol. Biol., 253, 677-690.

44. Bruckner,I., Sanchez,R., Suck,D., Pongor,S. (1995) Sequence-dependent bending propensity of DNA as revealed by DNase I: parameters for trinucleotides. EMBO J., 14, 1812-1818.

45. Bucher,P. (1990) Weight matrix descriptions of four eukaryotic RNA polymerase II promoter elements derived from 502 unrelated promoter sequences. J. Mol. Biol., 212, 563578.

46. Buratowski,S. (1994) The basics of basal transcription by RNA polymerase II. Cell, 77, 1-3.

47. Buratowski,S. (1997) Multiple TATA-binding factors come back into style. Cell, 91,13-15.

48. Buratowski,S., Hahn,S., Guarente,L., Sharp,P. (1989) Five intermediate complexes in transcription initiation by RNA polymerase II. Cell, 56, 549-561.

49. Burke,Т.W., Kadonaga,J.T. (1996) Drosofila TFIID binds to a conserved downstream basal promoter element that is present in many TATA-box-deficient promoters. Genes Dev. 10, 711-724.

50. Burley,S.K. (1996) The TATA box binding protein. Curr. Opin. Struct. Biol., 6, 69-75.

51. Burley,S.K., Roeder,R.G. (1996) Biochemistry, structural biology of transcription factor IID (TFIID). Annu. Rev. Biochem., 65, 769-799.

52. Calladine,C.R. (1982) Mechanics of sequence-dependent stacking of bases in B-DNA. J. Mol. Biol., 161, 343-352.

53. Calladine,C.R., Drew,H.R. (1984) A base-centered explanation of the B-to-A transition in DNA. J. Mol. Biol., 178, 773-785.

54. Calladine,C.R., Drew,H.R. (1986) Principles of sequence-dependent flexure of DNA. J Mol Biol., 192, 907-918.

55. Calladine,C.R., Drew,H.R., McCall,M.J. (1988) The intrinsic structure of DNA in solution. J. Mol. Biol. 201, 127-137.

56. Chalkley,GE, Verrijzer,CP (1999) DNA binding site selection by RNA polymerase II TAFs: a TAF(II)250-TAF(II)150 complex recognizes the initiator. EMBO J, 18, 48354845.

57. Chen,H, Li,B, Workman,JL (1994) A histone-binding protein, nucleoplasmin, stimulates transcription factor binding to nucleosomes, factor-induced nucleosome disassembly. EMBO ЛЪ, 380-390

58. Chen,L. (1999) Combinatorial gene regulation by eukaryotic transcription factors. Curr. Opin. Struct. Biol., 9, 48-55.

59. Chen,Q., Hertz,G., Stormo,G. (1995) Matrix search 1.0: a computer program that scans DNA sequences for transcriptional elements using a database of weight matrices. Comput. Applic. Biosci., 11, 563-566.

60. Chen,Q.K., Hertz,G.Z., Stormo,G.D. (1997) PromFD 1.0: a computer program that predicts eukaryotic pol II promoters using strings, IMD matrices. Comput. Appl. Biosci., 13, 29-35.

61. Chen,X, Vinkemeier,U, Zhao,Y et al. (1998) Crystal structure of a tyrosine phosphorylated STAT-1 dimer bound to DNA. Cell, 93, 827-839.

62. Cho,Y, Gorina,S, Jeffrey,PD, Pavletich,NP. (1994) Crystal structure of a p53 tu-mor suppressor-DNA complex: under-standing tumorigenic mutations. Science, 265, 346-455.

63. Choo,Y, Klug,A (1997) Physical basis of a protein-DNA recognition code. Current Opinion in Structural Biology, 1, 117-125.

64. Clark,KL, Hal ay,ED, Lai,E, Burley, SK. (1993) Co-crystal structure of the HNF-3/fork head DNA-recognition motif re-sembles histone H5. Nature, 364, 412-420.

65. Claverie,J.-M. (1997) Computational methods for the identification of genes in vertebrate genomic sequences. Hum. Mol. Genet. 6, 1735-1744.

66. Coleman,R., Taggart,A., Benjamin,L., Pugh,B. (1995) Dimerization of the TATA binding protein./. Biol. Chem. 270, 13842-13849.

67. Coleman,R.A., Pugh,B.F. (1995) Evidence for functional binding, stable sliding of the TATA binding protein on nonspecific DNA. J. Biol. Chem., 270, 13850-13859.

68. Coleman,R.A., Pugh,B.F. (1997) Slow dimer dissociation of the NFNF binding protein dictates the kinetics of DNA binding. PNAS USA, 94, 7221-7226.

69. Colgan,J., ManleyJ.L. (1995) Cooperation between core promoter elements influences transcriptional activity in vivo. Proc. Natl. Acad. Sci. USA, 92, 1955-1959.

70. Conaway,R.C., Conaway,J.W. (1993) General initiation factors for RNA polymerase II. Annu. Rev. Biochem. 62, 161-190.

71. Cox,JM, Hayward,MM, Sanchez,JF, Gegnas,LD, van der Zee,S, Dennis,JH, Sigler,PB, Schepartz,A (1997) Bidirectional binding of the TATA box binding protein to the TATA box. PNAS USA, 94, 13475-13480.

72. Cox,JM, Kays,AR, Sanchez,JF, Schepartz,A (1998) Preinitation complex assembly: potentially a bumpy path. Curr Opin Chem Biol. 2, 11-17.

73. Crowley,E.M., Roeder,K, Bina,M (1997) A statistical model for locating regulatory regions in genomic DNA, J. Mol. Biol., 268, 8-14.

74. Davis,NA, Majee,SS, KahnJD (1999) TATA box DNA deformation with and without the TATA box-binding protein. J. Mol. Biol., 291, 249-265.

75. Davis,NA, Majee,SS, KahnJD (1999) TATA box DNA deformation with and without the TATA box-binding protein. J Mol Biol, 291(2), 249-265.

76. Deng QL, Ishii S, Sarai A. (1996) Binding site analysis of c-Myb: screening of potentialbinding sites by using the mutation matrix derived from systematic binding affinity measurements. Nucleic Acids Res., 24, 766-774.

77. Diagana,T.T., North,D.L., Jabet,C., Fiszman,M.Y., Takeda,S., Whalen,R.G. (1997) The transcriptional activity of a muscle-specific promoter depends critically on the structure of the TATA element, its binding protein. J. Mol. Biol., 265, 480-493.

78. Dickerson,R.E. (1983,) Base sequence, helix structure variation in B, A DNA. J. Mol. Biol., 166,419-425.

79. Dickerson,R.E. et al. (1989a) Definitions, nomenclature of nucleic acid strucutre parameters. "EMBO Workshop". EMBOJ. 8. 1-5.

80. Dickerson,R.E., Bansal,M., Calladine,C.R., Diekmann,S., Hunter,W.N., Kennard,0.( 1989b) Definitions, nomenclature of nucleic acid strucutre parameters. "EMBO Workshop". J. Mol. Biol. 205, 787-791.

81. Dickerson,T.D., Drew,H.R. (1981) Structure of a B-DNA dodecamer. II. Influence of base sequence on helix structure. J. Mol. Biol. 149, 761-786.

82. Drew,HR, Travers,AA (1985) DNA bending and its relation to nucleosome positioning. J Mol Biol., 186(4), 773-790.

83. Drew,HR, Wing,RM, Takano,T, Broka,C, Tanaka,S, Itakura,K, Dickerson,RE (1981) Structure of a B-DNA dodecamer: conformation and dynamics. Proc Natl Acad Sci USA, 78(4), 2179-2183.

84. Durbin,R, Dear,S (1998) Base qualities help sequencing software. Genome Res, 8(3), 161162.

85. Duret,L, Bucher,P (1997) Searching for regulatory elements in human noncoding sequences. Curr Opin Struct Biol, 7(3), 399-406.

86. Eddy,SR (1996) Hidden Markov models. Curr Opin Struct Biol. 6(3), 361-365.

87. Efron,B., Tibshirani,R.J. (1991) Statistical data analysis in the Computer Age. Science, 253, 390

88. El Hassan,H.A., Calladine,C.R. (1995) The assessment of the geometry of dinucleotidesteps in double-helical DNA; a new local calculation scheme. J. Mol. Biol., 251, 648-664.

89. El Hassan,H. A., Calladine,C.R. (1996) Propeller-twisting of base-pairs, the conformational mobility of dinucleotide steps in DNA. J. Mol. Biol., 259, 95-103.

90. El Hassan,M.A., Calladine,C.R. (1997) Conformational characterics of DNA: empirical classification, a hypothesis for the conformational behaviour of dinucleotide steps. Phil. Trans. Roy. Soc. ser. A, 355, 43-100.

91. Ellenberger,T, Fass,D, Arnaud,M, Harrison,SC. (1994b) Crystal structure of transcription factor E47: E-box recognition by a basic region helix-loop-helix dimer. Genes Dev., 8, 970980.

92. Ellenberger,T. (1994a) Getting a grip on DNArecognition: structures of the basic region leucine zipper, the basic region helix-loop-helix DNA-binding domains. Curr. Opin. Struct. Biol., A, 12-21.

93. Ellenberger,TE, Brandl,CJ, Struhl,K, Harrison,SC. (1992) The GCN4 basic region leucine zipper binds DNA as a dimer of uninterrupted -helices: crys-tal structure of the protein-DNA com-plex. Cell, 71, 1223-1237.

94. Emami,K.H., Navarre,W.W., Smale,S.T. (1995) Core promoter specificities of the Spl, VP16 transcroptional activation domains. Mol. Cell Biol., 15, 5906-5916.

95. Emili,A, Ingles,CJ (1995) Promoter-dependent photocross-linking of the acidic transcriptional activator E2F-1 to the TATA-binding protein. J. Biol. Chem., 270, 1367413680.

96. Etzold,T., Argos,P. (1993) SRS an indexing, retrieval tool for flat file data libraries. Comput. Applic. Biosci., 9, 49-57.

97. Fairall,L, Schwabe,JW, Chapman,L, Finch,JT, Rhodes,D. (1993) The crystal structure of a two zinc-finger peptide reveals an extension to the rules for zinc-finger/DNArecognition. Nature, 366, 483-487.

98. Falvo,JV, Thanos,D, Maniatis,T. (1995) Reversal of intrinsic DNA bend in the IFN beta gene enhancer by transcription factors, architectural protein HMG I(Y). Cell, 83, 11011111.

99. Felsenfeld,G. (1992) Chromatin as essential part of the transcription mechanism. Nature, 355, 219-224.

100. Ferre-D'Amare,AR, Burley,SK. (1995) DNA recognition by helix-loop-helix proteins. Nucleic Acids Mol. Biol. 9:285-98

101. Ferre-D'Amare,AR, Pognonec,P, Roeder,RG, Burley,SK. (1994) Structure, function of the b/HLH/Z domain of USF. EMBOJ. 13, 180-189.

102. Ferre-D'Amare,AR, Prendergast,GC, Ziff,EB, Burley,SK. (1993) Recognition by Max of its cognate DNA through a dimeric b/HLH/Z domain. Nature, 363, 38-45.

103. Fickett, JW, Wasserman, WW (2000) Discovery, modeling of transcriptional regulatory regions. Curr. Opin. Biothechnology, 11, 19-24.

104. Fickett,J.W., Hatzigeorgiou,A.G. (1997) Eukaryotic promoter recognition. Genome Res., 1, 861-878.

105. Fickett,JW (1996) Finding genes by computer: the state of the art. Trends Genet, 12(8), 316-320.

106. Flatters,D., Lavery,R. (1998) Sequence-dependent dynamics of TATA-Box binding sites.1. Biophys. J., 75, 372-381.

107. Forster,E., Ronr,B. (1979) Methoden der korrelations- und regressions analyse. Verlag Die Wirtschafit, Berlin.

108. Freeh,K., Dietze,P., Werner,T. (1997b). Conslnspector 3.0: new library, enhanced functionality. Сотр. Applic. Biosci., 13, 109-110.

109. Freeh,K., Herrmann,G., Werner,T. (1993). Computer-assisted prediction, classification,, delimitation of protein binding sites in nucleic acids. Nucleic Acids Res., 21, 1655-1664.

110. Freeh,K., Quandt,K., Werner,T. (1997a). Software for the analysis of DNA sequence elements of transcription. Сотр. Applic. Biosci., 13, 89-97.

111. French,K., Quandt,K., Werner,T. (1998) Muscle actin genes: a first step towards computational classification of tissue specific promoters. In Sylico Biology, 1, 29-38.

112. Gall,JG, Bellini,M, Wu,Z, Murphy,C. (1999) Assembly of the nuclear transcription and processing machinery: Cajal bodies (coiled bodies) and transcriptosomes. Mol Biol Cell, 10(12): 4385-4402.

113. Gartenberg,M.R., Crothers,D.M., (1988) DNA sequence determinants of CAP-induced bending, protein binding affinity. Nature, 333, 824-829.

114. Gelfand,M. (1995) Prediction of function in DNA sequence analysis. J. Comput. Biol., 2, 87-115.

115. Gewirth,DT, Sigler,PB (1995) The basis for half-site specificity explored through a non-cognate steroid receptor-DNA complex. Nat Struct Biol., 2(5), 386-394.

116. Ghosh,D. (2000) Object-oriented transcription factors database (ooTFD). Nucleic Acids Res., 28(1), 308-310.

117. Ghosh,G, Duyne,GV, Ghosh,S, Sigler,PB. (1995) Structure of the NF-kappaB p50 homodimer bound to a kB site. Nature, 373, 303-310.

118. Ghosh,G, Van Duyne,GD (1996) Pieces of the puzzle: assembling the preinitiation complex of Pol II. Structure. 4, 891-895.

119. Glover,J.N., Harrison,S.C. (1995) Crystal structure of the heterodimeric bZIP transcription factor c-Fos-c-Jun bound to DNA. Nature, 373, 257-261.

120. Goodrich,JA, Schwartz,ML, McClure,WR (1990) Searching for predicting the activity of sites for DNA binding proteind: compilation, analysis of the binding sites for Escherichia coli integration host factor (IHF). Nucleic Acids Res. 18, 4993-5000.

121. Goodsell,D.S., Dickerson,R.E. (1994) Bending, curvature calculations in B-DNA. Nucleic Acids Res. 22, 5497-5503.

122. Gorin,A.A., Zhurkin,V.B., Olson,W.K., (1995) B-DNA twisting correlates with base-pair morphology. J. Mol. Biol., 247, 34-48.

123. Gotoh,0., Tagashira,Y. (1981) Stabilities of nearest-neighbor doublets in double-helical DNA determined by fitting calculated melting profiles to observed profiles. Biopolymers, 20, 1033-1042.

124. Grotewold,E, Drummond,BJ, Bowen,B, Peterson,T (1994) The myb-homologous P gene controls phlobaphene pigmentation in maize floral organs by directly activating a flavonoid biosynthetic gene subset. Cell, 76, 543-553.

125. Grove,A, Galeone,A, Yu,E, Mayol,L, Geiduschek,EP (1998) Affinity, stability and polarity of binding of the TATA binding protein governed by flexure at the TATA Box. J. Mol. Biol., 282, 731-739

126. Grzeskowiak,K. (1996) Sequence-dependent structural variation in B-DNA. Chem. Biol., 3, 785-790.

127. Guigo,R. (1997) Computational gene identification: an open problem. Comput. Chem. 21, 215-222.

128. Hagerman,P.J. (1984) Evidence for the existence of stable curvature of DNA in solution. Proc. Natl. Acad. Sci. USA 81, 4632-4636.

129. Hahn,S. (1998) The role of TAFs in RNA polymerase II transcription. Cell, 95, 579-582.

130. Hajek,P., Havranek,T. (1978) Mechanizing hypothesis formation Mathematical foundations for a general theory. Springer Verlag, Heidelberg.

131. Hampsey, M. (1998) Molecular genetics of the RNA polymerase II general transcriptional machinery. Microbiol Mol Biol Rev. 1998 Jun;62(2):465-503. Review.

132. Hampsey,M., Reinberg,D. (1999) RNA polymerase II as a control panel for multiple coactivator complexes. Curr. Opin. Gen. Dev., 9, 132-139.

133. Hardenbol,P., Wang,J.C., van Dyke,M.W. (1997) Identification of preferred hTBP DNA binding sites by the combinatorial method REPSA. Nucleic Acids Res., 25, 3339-3344.

134. Hawley,DK, McClure,WR (1983) Compilation, analysis of Escherichia coli promoter DNA sequences. Nucleic Acids Res. 11, 2237-2255.

135. Hegde,RS, Grossman,SR, Laimins,LA, Sigler,PB. (1992) Crystal structure at 1.7 A of the bovine papillomavirus-1 E2 DNA-binding domain bound to its DNA target. Nature, 359, 505-512.

136. Helmann,JD, Chamberlin,MJ (1988) Structure and function of bacterial sigma factors. Annu Rev Biochem, 51, 839-872

137. Herrera,RE, Nordheim,A, Stewart,AF (1997) Chromatin structure analysis of the human c-fos promoter reveals a centrally positioned nucleosome. Chromosoma, 106(5), 284-292.

138. Higo, K., Ugawa, Y., Iwamoto, M., Korenaga, T. (1999) Plant cis-acting regulatory DNA elements (PLACE) database: 1999. Nucleic Acids Res., 27, 297-300.

139. Hirsch,JA, Aggarwal,AK. (1995) Structure of the even-skipped homeodomain complexed with AT-rich DNA: new perspectives on homeodomain specificity. EMBO J., 14, 6280 -6291.

140. Hirst,J.D., Sternberg,MJ (1992) Prediction of structural and functional features of protein and nucleic acid sequences by artificial neural networks. Biochemistry, 31, 7211-7218.

141. Hoffman,A, Sinn,E, Yamamoto,T, Wang,J, Roy,A, Horikoshi,M, Roeder,RG (1990) Highly conserved core domain and unique N terminus with presumptive regulatory motifs in a human TATA factor (TFIID). Nature, 346, 387-390.

142. Hoffmann,A., Oelgeschlager,T., Roeder,R. (1997) Considerations of transcriptional control mechanisms: do TFIID-core promoter complexes recapitulate nucleosome-like functions? PNAS USA, 94, 8928-8935.

143. Hogan,M.E., Austin,R.H. (1987) Importance of DNA stiffness in protein-DNA binding specificity. Nature, 329, 263-266.

144. Hoopes,B.C., LeBlanc,J.F., Hawley,D.K. (1998) Contributions of the TATA box sequence to rate-limiting steps in transcription initiation by RNA polymerase II. J. Mol. Biol., 277, 1015-1031

145. Houbaviy,H.B., Usheva,A., Shenk,T., Burley,S.K. (1996) Cocrystal structure of YY1 bound to the adeno-associated Virus P5 Initiator. Proc. Nat. Acad. Sci. USA, 93, 1357713582.

146. Howe,KM, Watson,RJ (1991) Nucleotide preferences in sequence-specific recognition of DNA by c-myb protein. Nucleic Acids Res, 19, 3913-3919.

147. Hunter,C.A., Lu,X-J. (1997) DNA base-stacking interactions: a comparison of theoretical calculations with oligonucleotide X-ray crystal structures. J. Mol. Biol. 265, 603-619.

148. Huth,JR, Bewley,CA, Nissen,MS, Evans,JN, Reeves,R, Gronenborn,AM, Clore,GM (1997) The solution structure of an HMG-I(Y)-DNA complex defines a new architectural minor groove binding motif. Nat Struct Biol, 4(8), 657-665.

149. Hyde-DeRuyscher,R.P., Jennings,E., Shenk,T. (1995) DNA binding sites for the transcriptional activator/repressor YY1. Nucleic Acids Res., 23, 4457-4465.

150. Ince,T., Scotto,K.W. (1995) A conserved downstream element defines a new class of RNA polymerase II promoters. J. Biol. Chem. 270, 30249-30252.

151. Jackson,DA. (1997) Chromatin domains, nuclear compartments: establishing sites of gene expression in eukaryotic nuclei. Mol Biol Rep., 24, 209-220.

152. Jacobson,EM, Peng,L, Leon-del-Rio,A, Rosenfeld,MG, Aggarwal,AK (1997) Structure of Pit-1 POU domain bound to DNA as a dimer: unexpected arrangement, flexibility. Gen. Dev. 11, 198-212.

153. Javahery,R, Khachi,A, Lo,K, Zenzie-Gregory,B, Smale,ST (1994) DNA sequence requirements for transcriptional initiator activity in mammalian cells. Mol. Cell Biol. 14, 116-127.

154. Johnson,PF, McNight,SL (1989) Eukaryotic transcriptional regulatory proteins. Annu. Rev. Biochem., 58, 799-839.

155. Jonsson,J., Norberg,T., Carlsson,L., Gustafsson,C., Wold,S. (1993) Quantitative sequence-activity models (QSAM) tools for sequence design. Nucleic Acids Res., 21, 733-739.

156. Juo,Z.S., Chiu,T.K., Leiberman,P.M., Baikalov,I., Berk,A.J., Dickerson,R.E. (1996) How proteins recognize the TATA box. J. Mol. Biol., 261, 239-254.

157. Kabsch,W., Sander,S., Trifonov,E.N. (1982) The ten helical twist angles of B-DNA. Nucleic Acids Res. 10, 1097-1104.

158. Kadonaga,J.T. (1998) Eukaryotic transcription: an interlaced network of transcription factors, chromatin-modifying machines. Cell, 92, 307-317.

159. Kahn,JD (2000) Topological effects of the TATA box binding protein on minicircle DNA and a possible thermodynamic linkage to chromatin remodeling. Biochemistry, 39(13), 3520-3524.

160. Kaiser,К, Meisterernst,M (1996) The human general co-factors. Trends Biochem Sci. 21, 342-345.

161. Karas,H., Knuppel,R., Schulz,W., Sklenar,H., Wingender,E., (1996) Combining structural analysis of DNA with search routines for the detection of transcription regulatory elements. Comput. Applic. Biosci., 12, 441-446.

162. Karlin,S., Brendel,V. (1992) Chance, statistical significance in protein, DNA sequence analysis. Science, 257, 39-49.

163. Kaufmann,J, Smale,ST (1994) Direct recognition of initiator elements by a component of the transcription factor IID complex. Genes Dev, 8, 821-829.

164. Kel,A, Kel-Margoulis,0, Babenko,V, Wingender,E. (1999) Recognition of NFATp/AP-1 composite elements within genes induced upon the activation of immune cells. J. Mol. Biol., 288, 353.

165. Kel,AE, Kel-Margoulis,OV, Farnham,PJ, Bartley,SM, Wingender,E, Zhang,MQ (2001) Computer-assisted identification of cell cycle-related genes: new targets for E2F transcription factors. J Mol Biol, 309(1):99-120.

166. Keller,W., Konig,P., Richmond,T.J. (1995) Crystal Structure of a bZIP/DNA Complex at 2.2 Angstroms: Determinants of DNA Specific Recognition. J. Mol. Biol., 254, 657-667.

167. Kel-Margoulis OV, Romashchenko AG, Kolchanov NA, Wingender E, Kel AE (2000) COMPEL: a database on composite regulatory elements providing combinatorial transcriptional regulation. Nucleic Acids Res, 28(1), 311-315.

168. Kim,J., de Haan,G., Shapiro,D.J. (1996) DNA bending between upstream activator sequences increases transcriptional synergy. Biochemical, Biophisical Res. Communications, 226, 638-644.

169. Kim,J.L., Nikolov,D.B., Burley,S.K. (1993) Co-crystal structure of TBP recognizing the minor groove of a TATA element. Nature, 365, 520-527.

170. Kim,Y., Geiger,J.H., Hahn,S., Sigler,P.B. (1993) Crystal structure of a yeast TBP/TATA-box complex. Nature, 365, 512-520.

171. Kirchhamer,C.V., Yuh,C.-H., Davidson,E.H. (1996) Modular cis-regulatory organization of developmentally exspressed genes transcribed territorially in the sea urchin embryo,, additinal examples. Proc. Natl. Acad. Sci. USA, 93, 9322-9328.

172. Kissinger,C.R., Liu,В., Martin-Blanco,E„ Kornberg,T.B., Pabo,C.O. (1990) Crystal Structure of an Engrailed Homeodomain-DNA Complex at 2.8 Angstroms Resolution: A Framework for Understanding Homeodomain-DNA Interactions. Cell, 63, 579-590.

173. Klages,N., Strubin,M. (1995) Stimulation of RNA polymerase II transcription initiation by recruitment of TBP in vivo. Nature, 374, 822-823.

174. Klemm,JD, Rould,MA, Aurora,R, Herr,W, Pabo,CO. (1994) Crystal structure of the Oct-1 POU domain bound to an ос-tamer site: DNA recognition with teth-ered DNA-binding domains. Cell 77, 21-32.

175. Klug, A. (1993) Transcription. Opening the gateway. Nature, 365, 486-487.

176. Klug,A., Jack,A, Wiswamitra,M.A., Kennard,0, Shakked,Z., Steitz,T.A. (1979) A hypothesis on a specific sequence-dependent conformation of DNA, its relation to the binding of the /ас-repressor protein. J. Mol. Biol. 131, 669-680.

177. Klug,J, Knapp,S, Castro,I, Beato,M (1994) Two distinct factors bind to the rabbit uteroglobin TATA-box region and are required for efficient transcription. Mol Cell Biol, 14(9), 6208-6218.

178. Knight,JC, Udalova,I, Hill,AV, Greenwood,BM, Peshu,N, Marsh,K, Kwiatkowski,D (1999) A polymorphism that affects OCT-1 binding to the TNF promoter region is associated with severe malaria. Nature Genetics, 22, 145-150.

179. Kodandapani,R, Pio,F, Ni,C-Z, Piccailli,G, Klemsz,M, et al. (1996) A new pattern for helix-turn-helix recognition revealed by the PU.l Ets-domain-DNA complex.Nature 380, 456-459.

180. Koleske, A., Young, R. (1995) The RNA polymerase II holoenzyme and its implications for gene regulation. Trends Biochem. Sci., 20, 113-116.

181. Kondrakhin,Y.V., Kel,A.E., Kolchanov,N.A., Romashchenko,A.G., Milanesi,L. (1995) Eukaryotic promoter recognition by binding sites for transcription factors. Comput. Appl. Biosci., 11,477-488.

182. Konig,P, Richmond,TJ. (1993) The X-ray structure of the GCN4-bZip bound to ATF/CREB site DNA shows the com-plex depends on DNA flexibility. J. Mol. Biol. 233, 139-154.

183. Kono,H, Sarai,A (1999) Structure-based prediction of DNA taget sites by regulatory proteins. Proteins: Struct., Function, Genetics, 35, 114-131.

184. Kornberg,R.D., Lorch,Y. (1999) Twenty-five years of the nucleosome, fundamental particle of the eukaryote chromosome. Cell, 98, 285-294.

185. Koudelka,G.B., Harrison,S.C., Ptashne,M. (1987) Effect of non-contacted bases on the affinity of 434 operator for 434 repressor, Cro. Nature, 326, 886-888.

186. Kraus,R.J., Murray,E.E., Wiley,S.R., Zink,N.M., Loritz,K., Gelembiuk,G.W., Mertz,J.E. (1996) Experimentally determined weight matrix definitions of the initiator, TBP binding site elements of promoters. Nucleic Acids Res., 24, 1531-1539.

187. Krogh,A. (1998) Guide to Human Genome Computing (2nd edn) (Bishop,M.J., ed.) Academic Press, 261-274.

188. Lagrange,T, Kapanidis,AN, Tang,H, Reinberg,D, Ebright,RH (1998) New core promoter element in RNA polymerase Il-dependent transcription: sequence-specific DNA binding by transcription factor IIB.Genes Dev, 12(1), 34-44.

189. Latchman,D.S. (1995) Eukaryotic transcription factors. Academic Press, London.

190. Lavery, R., Zakrzewska,K., Sklenar,H. (1995) Сотр. Phys. Commun. 91, 135-158.

191. Lawrence,CE, Gold,L, Stormo,GD (1994) Quantitative analysis of ribosome binding sites in E.coli. Nucleic Acids Res 22, 1287-1295.

192. Lee,TI, Young,RA (1998) Regulation of gene expression by TBP-associated proteins. Genes Dev. 12(10):1398-408.

193. Levitsky,V.G., Ponomarenko,M.P., Ponomarenko,J.V., Frolov,A.S., Kolchanov,N.A. (1999) Nucleosomal DNA property database. Bioinformatics, 15, 7/8, 582-592.

194. Li,G, Chandler,SP, Wolffe,AP, Hall,TC (1998) Architectural specificity in chromatin structure at the TATA box in vivo: nucleosome displacement upon beta-phaseolin gene activation. Proc Natl Acad Sci USA, 95(8), 4772-4777.

195. Li,Q, Wrange,0 (1995) Accessibility of a glucocorticoid response element in a nucleosome depends on its rotational positioning. Mol Cell Biol., 15, 4375-4384.

196. Li,Q, Wrange,0, Eriksson,P (1997) The role of chromatin in transcriptional regulation. Int J Biochem Cell Biol., 29(5), 731-742.

197. Li,T, Stark,MR, Johnson,AD, Wolberger,C. (1995) Crystal structure of the Matal/Mata2 homeodomain het-erodimer bound to DNA. Science, 270, 262-269.

198. Liao,W.-C., Geng,Y., Johnson,L.F. (1994) In vitro transcription of the TATAA-less mouse thymidylate synthase promoter: multiple transcription start points, evidence for bidirectionality. Gene, 146, 183-189.

199. Liston,DR, Johnson,PJ (1993) Analysis of a ubiquitous promoter element in a primitive eukaryote: early evolution of the initiator element. Moll Cell Biol, 19, 2380-2388.

200. Love,JJ, Li,X, Case,DA, Giese,K, Grosschedl,R, et al. (1995) Structural basis by DNA bending by the architectural tran-scription factor LEF-1. Nature 376, 791-795.

201. Lu,X-J., El Hassan,M.A., Hunter,C.A. (1997) Structure, conformation of helical nucleic acids: rebuilding program (SCHNArP). J. Mol. Biol. 273, 681-691.

202. Luger,K., Mader,A.W., Richmond,R.K., Sargent,D.F., Richmond,T.J. (1997) Crystal structure of the nucleosome core particle at 2.8 A resolution. Nature,, 389, 251-260.

203. Luisi, BF, Xu WX, Otwinowski Z, Feedman LP, Yamamoto KR, et al. (1991) Crystallographic analysis of the interac-tion of the glucocorticoid receptor with DNA. Nature, 352, 497-505.

204. Ma,PCM, Rould,MA, Weintraub,H, Pabo,CO. (1994) Crystal structure of MyoD bHLH domain-DNA complex: perspectives on DNA recognition, implications for transcriptional activation. Cell 77, 451-459.

205. Marmorstein,R, Carey,M, Ptashne,M, Harrison,SC. (1992) DNA recognition by Gal4: structure of a protein-DNA complex. Nature, 356, 408-414.

206. Marmorstein,R, Harrison,SC. (1994) Crystal structure of a PPR1-DNA com-plex: DNA recognition by proteins containing a Zn 2 Cys 6 binuclear cluster. Genes Dev. 8, 25042512.

207. Marth,G., Yeh,R., Minton,M., Donaldson,R., Li,Q., Duan,S., Davenport,R., Miller,R.D., and Kwok,P.-Y. (2001) Single-nucleotide polymorphisms in the public domain: how useful are they? Nat. Genet., 27, 371-372.

208. Matthews,BW. (1988) Protein-DNA interaction. No code for recognition. Nature 335, 294295.

209. McCormick,A, Brady,H, Fukushima,J, Karin,M. (1991) The pituitary-specific regulatory gene GHF1 contains a minimal cell type-specific promoter centered around its TATA box. Genes Dev, 5, 1490 1503.

210. McKnight,S.L., Yamamoto,K.R. (1992) Transcriptional regulation. Cold Spring Harbor Laboratory Press, Cold Spring Harbor

211. Meierhans,D., Allemann,R.K (1998) The N-terminal methionine is a major determinant of the DNA binding specificity of MEF-2C. J. Biol. Chem., 273, 26052-26060

212. Meierhans,D., Sieber,M., Allemann,R.K. (1997) High affinity binding of MEF-2C correlates with DNA bending. Nucleic Acids Res., 25, 4537-4544.

213. Milanesi,L., Muselli,M., Arrigo,P. (1996) Hamming clustering method for signals prediction in 5', 3' regions of eukaryotic genes. Comput. Appl. Biosci. 12, 399-404.

214. Montecino,M, Lian,J, Stein,G, Stein,J (1996) Changes in chromatin structure support constitutive and developmentally regulated transcription of the bone-specific osteocalcin gene in osteoblastic cells. Biochemistry, 35(15), 5093-5102.

215. Muller,CW, Rey,FA, Sodeoka,M, Verdine,GL, Harrison,SC. (1995) Structure of the NF-kB p50 homodimer bound to DNA. Nature 373, 311-317.

216. Mulligan,M.E., Hawley,D.K., Entriken,R., McClure,W.R. (1984) Escherichia coli promoter sequences predict in vitro RNA polymerase selectivity. Nucleic Acids Res., 12, 789-800.

217. Myer,V.E., Young,R.A. (1998) RNA polymerase II holoenzymes, subcomplexes. J. Biol. Chem., 273, 27757-27760.

218. Nandi,A, Das,G, Salzman,NP (1985) Characterization of a surrogate TATA box promoter that regulates in vitro transcription of the simian virus 40 major late gene. Mol Cell Biol., 5(3), 591-594.

219. Neidle,S. (1994) DNA structure, recognition. New York: IRL Press.

220. Ng,KW, Ridgway,P, Cohen,DR, Tremethick,DJ (1997) The binding of Fos/Jun heterodimer can completely disrupt the structure of nucleosome. EMBO, 16, 2072-2085.

221. Nikolov,DB, Burley,SK (1997) RNA polymerase II transcription initiation: A structural view. Proc. Natl. Acad. Sci., 94, 15-22.

222. Nikolov,DB, Chen,H, Halay,ED, Hoffmann,A, Roeder,RG, et al. (1996) Crystal structure of a human TATA box-binding protein/TATA element complex. Proc. Natl. Acad. Sci. USA 93,4956-4961.

223. Novina,CD, Roy,AL (1996) Core promoters, transcriptional control. Trends Genet., 12(9), 351-355.

224. Nussinov,R. (1985) Large helical conformational deviations from ideal B-DNA, procaryotic regulatory sites. J. Theor. Biol. 115, 179-189.

225. O'Neill,M.C. (1990) Training back-propagation neural networks о define, detect DNA-binding sites. Nucleic Acids Res. 19, 313-318.

226. Ogata,K, Morikawa,S, Nakamura,H, Serikawa,A, Inoue,T, et al. (1994) Solution structure of a specific DNA complex of the Myb DNA-binding domain with cooperative recognition helices. Cell 79, 639-648.

227. Ohler,U., Niemann,H, Liao,Gc, Rubin,GM (2001) Joint modeling of DNA sequence and physical properties to improve eukaryotic promoter recognition. Bioinformatics, 17 Suppl l:S199-206.

228. Orphanides,G, Lagrange,T, Reinberg,D (1996) The general transcription factors of RNA polymerase II. Genes Dev 10, 2657-2683.

229. Owen-Hughes,Т., Workman,J.L. (1994) Experimental analysis of chromatin function in transcriptional control. Crit. Rev. Euk. Gene Expr. 8, 1-39.

230. Pabo,CO, Sauer,RT. (1992) Transcription factors: structural families, principles of DNA recognition. Annu. Rev. Biochem. 61, 1053-1095.

231. Papavassilious,A.G. (1997) Transcription factors in eukaryotes. Springer-Verlag GmbH & Co. KG, Heidelberg, Germany.

232. Parvin,J, McCormick,R, Sharp,P, Fisher,D. (1995) Pre-bending of a promoter sequence enhances affinity for the TATA-binding factor. Nature 273, 724—727.

233. Patikoglou,G., Burley,S.K. (1997) Eukaryotic transcription factor-DNA complexes. Annu Rev Biophys Biomol Struct. 26, 289-325.

234. Pauly,M, Treger,M, Westhof,E, Chambon,P (1992) The initiation accuracy of the SV40 early transcription is determined by the functional domains of two TATA elements. Nucleic Acids Res, 20, 975 982.

235. Pavletich,NP, Pabo,CO (1991) Zinc finger-DNA recognition: crystal struc-ture of a Zif268-DNA complex at 2.1 ° A. Science 252, 809-817.

236. Pavletich,NP, Pabo,CO (1993) Crystal structure of a five-finger GLI-DNAcom-plex: new perspectives on zinc fingers. Science 261, 1701-1707.

237. Pazin,MJ, Sheridan, PL et al. (1996) NF-kappa B-mediated chromatin reconfiguration, transcriptional activation of the HIV-1 enhancer in vitro. Genes Dev., 10, 37-49.

238. Pedersen,AG, Baldi,P, Brunak,S, Chauvin,Y (1996) Characterization of prokaryotic and eukaryotic promoters using hidden Markov models. Proc Int Conf Intell Syst Mol Biol 4, 182-191.

239. Pedersen,AG, Baldi,P, Brunak,S, Chauvin,Y (1998) DNA structure in human RNA polymerase II promoters. J Mol Biol, 281(4), 663-673.

240. Pellegrini,L, Tan,S, Richmond,TJ (1995) Structure of serum response fac-tor core bound to DNA. Nature 376, 490-498.

241. PerierRC, Praz,V, Junier,T, Bonnard,C, Bucher, P (2000) The eukaryotic promoter database (EPD). Nucleic Acids Res 28(1), 302-303.

242. Pickert,L., Reuter,I, Klawonn,F, Wingender,E (1998) Transcription regulatory region analysis using signal detection, fuzzy clustering, Bioinformatics, 14, 244-251.

243. Pio,F, Kodandapani R, Ni CZ, Shepard W, Klemsz M, McKercher SR, Maki RA, Ely KR (1996) New insights on DNA recognition by ets proteins from the crystal structure of the PU.l ETS domain-DNA complex. J Biol Chem, 271(38), 23329-23337.

244. Ponomarenko,J.V., Ponomarenko,M.P., Frolov,A.S., Vorobyev,D.G., Overton,G.C., Kolchanov,N.A. (1999) Conformational, physicochemical DNA features specific for transcription factor binding sites. Bioinformatics, 15, 7/8, 654-668.

245. Ponomarenko,M.P., Kolchanova,A.N., Kolchanov,N.A. (1997) Generating programs for predicting the activity of functional sites. J. Comput. Biol., 4, 83-90.

246. Ponomarenko,M.P., Ponomarenko,J.V., Kel,A.E., Kolchanov,N.A. (1997) Search for DNA conformational features for functional sites. Investigation of the TATA box. Proceedings of the 1997 Pacific Symposium. Altman,R. (ed), Singapore, World Sci., 340-351.

247. Ponomarenko, M.P., Ponomarenko J.V., Frolov A.S., Podkolodnaya O.A., Vorobyev D.G., Kolchanov N.A., Overton G.C. (1999) Oligonucleotide frequency matrices addressed to recognising functional DNA sites. Bioinformatics, 15, 7/8, 631-643.

248. Prestridge,D.S. (1996) SIGNAL SCAN 4.0: additional databases and sequence formats. Comput Appl Biosci. 12(2), 157-160.

249. Prestridge,D.S. (1999) Computer software for eukaryotic promoter analysis. Methods Mol Biol. 130, 265-295.

250. Pugh,BF (1996) Mechanisms of transcription complex assembly. Curr Opin Cell Biol. 8(3), 303-311.

251. Quandt, K., Freeh, K„ Karas, H., Wingender, E., Werner, T. (1995b). Matlnd, Matlnspector: new fast, versatile tools for detection of consensus matches in nucleotide sequence data. Nucleic Acids Res., 23, 4878-4884.

252. Ranish,JA, Hahn,S, (1996) Transcription: basal factors, activation. Curr. Opin. Genetics Dev.,в, 151-158.

253. Rao,A, Luo,C., Hogan,PG (1997) Transcription factors of NFAT family: regulation, function. Ann. Rev. Immunol., 15, 707-747.

254. Rastinejad,F, Perlmann,T, Evans,RM, Sigler,PB. (1995) Structural determinants of nuclear receptor assembly on DNAdi-rectrepeats. Nature 375, 203-211.

255. Rippe,K., Vonhippel,P.H., Langowski,J. (1995) Action at a distance: DNA-looping, initiation of transcription. Trends Biochem. Sci. 20, 500-506.

256. Roberts,R.W., Ja,W.W. (1999) In vitro selection of nucleic acids and proteins: what are we learning? Curr. Opin. Struct. Biol., 9, 521-529.

257. Robison,K., McGuire,A.M., Church,G.M. (1998) A comprehensive library of DNA-binding site matrices for 55 proteins applied to the complete Escherichia coli K-12 genome. J. Mol. Biol., 284, 241-254.

258. Roeder,RG (1991) The complexities of eukaryotic transcription initiation: regulation of preinitiation complex assembly. Trends Biochem Sci. 16(11), 402-408.

259. Roeder,RG (1996) The role of general initiation factors in transcription by RNA polymerase II. Trends Biochem Sci. 21(9), 327-335.

260. Rombauts,S, DMiais,P., Van Montagu,M., Rouzfi,P. (1999) PlantCARE, a plant czs-acting regulatory element database. Nucleic Acids Res., 27, 295-296.

261. Roses,A.D. (2000) Pharmacogenetics and the practice of medicine. Nature, 405, 857-865

262. Rost,B. (1990) Some basic principles of neural networks. Heidelberg, EMBL, preprint 28.

263. Roulet,E, Bucher,P, Schneider,R, Wingender,E, Dusserre,Y, Werner,T, Mermod,N (1999) Experimental analysis and computer prediction of CTF/NFI transcription factor DNA binding sites. J. Mol. Biol., 297(4), 833-848.

264. Roulet,E., Fisch,I., Bucher,P., Mermod,N. (1998) Evaluation of computer tools for prediction of transcription factor binding sites on genomic DNA. In Silico Biology, 1,2128.

265. Sadovsky,Y, Webb,P, Lopez G, Baxter JD, Fitzpatrick PM, Gizang-Ginsberg E, Cavailles V, Parker MG, Kushner PJ (1995) Transcriptional activators differ in their responses to overexpression of TATA-binding protein. Mol. Cell Biol., 15, 1554-1563.

266. Salgado,H., Santos,A., Garza-Ramos,U., van Helden,J., Diaz,E., Collado-Vides,J. (1999) RegulonDB (version 2.0): a database on transcriptional regulation in Escherichia coli. Nucleic Acids Res., 27, 59-60

267. Sarai,A, Takeda,Y (1989) Lambda repressor recognizes the approximately 2-fold symmetric half-operator sequences asymmetrically. Proc Natl Acad Sci USA, 86, 65136517.

268. Sarai,A., Mazur,J., Nussinov,R., Jernigan,R.L. (1988) Origin of DNA helical structure, its sequence dependence. Biochemistry, 27, 8498-8502.

269. Sarai,A., Mazur,J., Nussinov,R., Jernigan,R.L. (1989) Sequence dependence of DNA conformational flexibility. Biochemistry, 28, 7842-7849.

270. Satchwell,S.C., Drew,R., Travers,A.A. (1986) Sequence periodicities in chicken nucleosome core DNA. J. Mol. Biol., 191, 659-675

271. Schmiedeskamp,M., Klevit,R.E. (1994) Zinc finger diversity. Curr. Opin. Struct. Biol. 4, 28-35.

272. Schneider,T.D., Stormo,G.D., Gold,L., Ehrenfeucht,A. (1986) Information content of binding sites on nucleotide sequences. J. Mol. Biol., 188, 415-431

273. Schneider,TD, Stephens,RM (1990) Sequence logos: a new way to display consensus sequences. Nucleic Acids Res, 18(20), 6097-6100.

274. Schug, J., Overton, G. C. (1997). TESS: Transcription Element Search Software on the WWW. Technical Report CBIL-TR-1997-1001-vO.O of the Computational Biology, Informatics Laboratory, School of Medicine, University of Pennsylvania, 1997

275. Schwabe,JWR, Chapman,L, Finch,JT, Rhodes,D. (1993) The crystal structure of the oestrogen receptor DNA-binding domain bound to DNA: how receptors discriminate between their response el-ements. Cell 75, 567-578.

276. Seledtsov,IA, Solovyev,VV, Merkulova,TI (1991) New elements of glucocorticoid-receptor binding sites of hormone-regulated genes. Biochim Biophys Acta, 1089(3), 367-376.

277. Shakked,Z, Rabinovich,D (1986) The effect of the base sequence on the fine structure of the DNA double helix. Prog. Biophys. Molec. Biol., 47, 159-195.

278. Shapiro,B.A, Nussinov R, Lipkin LE, Maizel JV Jr (1986) A sequence analysis system encompassing rules for DNA helical distortion. Nucleic Acids Res. 14, 75-86.

279. Shim,Y.H., Bonner,J. J., Blumenthal,T. (1995) Activity of a C. elegans GATA transcription factor, ELT-1, expressed in RT yeast. J. Mol. Biol., 253, 665-676.

280. Shimizu,T, Toumoto A, Ihara K, Shimizu M, Kyogoku Y, Ogawa N, Oshima Y, Hakoshima T (1997) Crystal structure of PH04 bHLH domain-DNA complex: flanking base recognition. EMBO J, 16(15), 4689-4697.

281. Shpigelman,E.S., Trifonov,E.N., Bolshoy,A. (1993) CURVATURE: software for the analysis of curved DNA. Comput. Appl. Biosci., 9, 435-140.

282. Sjottem,E., Nersen,C., Johansen,T. (1997) Structural, functional analyses of DNA bending induced by Spl family transcription factors. J. Mol. Biol., 267, 490-504.

283. Sklenar,H. (1996) Proceedings of the International Workshop on Computational analysis of eukaryotic transcriptional regulatory elements / H: GBF. 1996. P. 44-47.

284. Smale,S.T (1997) Transcription initiation from TATA-less promoters within eukaryotic protein-coding genes. Biochim Biophys Acta. 1351(1-2), 73-88.

285. Smale,S.T., Baltimore,D. (1989) The "initiator" as a trnscription control element. Cell, 57, 103-113.

286. Sokolenko,AA, Sandomirskii,II, Savinkova,LK (1996) Interaction of yeast TATA-binding protein with short promotor segments. Mol Biol (Mosk) 30(2), 279-85.

287. Solano,R, Nieto,C, Avila,J, Canas,L, Diaz,I, Paz-Ares,J (1995) Dual DNA binding specificity of a petal epidermis-specific MYB transcription factor (MYB.Ph3) from Petunia hybrida. EMBO J, 14, 1773-1784.

288. Solovyev,V.V., Salamov,A.A., Lawrence,C.B. (1994a) Predicting internal exons by oligonucleotide composition, discriminant analysis of spliceable open reading frames. Nucleic Acids Res., 22, 5156-5163.

289. Spek,CA, Lannoy,VJ, Lemaigre,FP, Rousseau,GG, Bertina,RM, Reitsma,PH (1998) Type I protein С deficiency caused by disruption of a hepatocyte nuclear factor (HNF)-6/HNF-l binding site in the human protein С gene promoter. J Biol Chem, 273, 10168-10173.

290. Sponer,J., Kyrp,J. (1993) Theoretical analysis of the base stacking in DNA choice of the force-field, a comparison with the oligonucleotide crystal-structures. J. Biomol. Struct.1. Dynam. 11,277-292.

291. Staden,R (1989) Methods for calculating the probabilities of finding patterns in sequences. Comput Appl Biosci. 5(2), 89-96.

292. Staden,R. (1984) Computer methods to locate signals in nucleic acid sequences. Nucl. Acids Res. 12, 505-519.

293. Stamatoyannopoulos„J.A., Clegg,C.H., Li,Q. (1997) Sheltering of gamma-globin expression from position effects requires both an upstream locus control region, a regulatory element 3' to the(A)gamma-globin gene. Mol. Cell Biol. 17, 240-247.

294. Starich,MR, Wikstrom,M, Arst,HN Jr, Clore,GM, Gronenborn,AM (1998) The solution structure of a fungal AREA protein-DNA complex: an alternative binding mode for the basic carboxyl tail of GATA factor. J. Mol. Biol., 277, 605-620.

295. Starr,D.B., Hoopes,B.C., Hawley,D.K. (1995) DNA bending is an important component of site-specific recognition by the TATA binding protein. J. Mol. Biol., 250, 434-446.

296. Steitz,TA (1990) Structural studies of protein-nucleic acid interaction: the sources of sequence-specific binding. Q. Rev. Biophys. 23, 105-180.

297. Stepchenko,AG (1994) Noncanonical Oct-sequences are targets for mouse Oct-2B transcription factor. FEBSLett, 337, 175 178.

298. Stoeckert,JrC.J., Salas,F., Brunk,B., Overton,G.C. (1999) EpoDB: a prototype database for the analysis of genes expressed during vertebrate erythropoiesis. Nucleic Acids Res., 27, 200-203

299. Stormo,G.D., Schneider,T.D., Gold,L. (1986) Quantitative analysis of the relationship between nucleotide sequence, functional activity. Nucleic Acids Res., 14, 6661-6679.

300. Stormo,GD (1990) Consensus patterns in DNA. Methods Enzymol. 183, 211-221.

301. Stormo,GD, Schneider,TD, Gold,L, Ehrenfeucht,A (1982) Use of the 'Perceptron' algorithm to distinguish translational initiation sites in E. coli. Nucleic Acids Res, 10(9), 2997-3011.

302. Sugimoto,N, Nakano,S., Yoneyama,M., Honda,K. (1996) Improved thermodynamic parameters, helix initiation factor to predict stability of DNA duplexes. Nucleic Acids Res., 24, 4501-4505.

303. Suzuki,M. (1994) A framework for the DNA-protein recognition code. Structure, 2, 317326.

304. Suzuki,M., Amano,N., Kakinuma,J., Tateno,M. (1997) Use of a 3D structure data base for understanding sequence-dependent conformational aspects of DNA. J. Mol. Biol., 274, 421435.

305. Suzuki,M., Yagi,N. (1995) Stereochemical basis of DNA bending by transcription factors. Nucleic Acids Res., 23, 2083-2091.

306. Suzuki,M., Yagi,N., Finch,J.T. (1996) Role of base-backbone, base-base interactions in alternating DNA conformations. FEBSL., 379, 148-152.

307. Sykes,K., Kaufman,R. (1990) A naturally occurring gamma globin gene mutation enhances SP1 binding activity. Mol. Cell Biol., 10, 95-102.

308. Swaminathan,K., Flynn,P., Reece,RJ, Marmostein,R. (1997) Crystal structure of a PUT3-DNA complex reveals a novel mechanism for DNA recognition by a protein containing a Zn2Cys6 binuclear cluster. Nature Struct. Biology, 4, 751-759.

309. Tachibana,H, Ishihama,A (1985) Correlation between the rate of productive transcription initiation and the strand-melting property of Escherichia coli promoters. Nucleic Acids Res, 13(24), 9031-9042.

310. Taggart,A.K., Pugh,B.F. (1996) Dimerizasion of TFIID when not bound to DNA. Science, 272,1331-1333.

311. Takeda,Y, Sarai,A, Rivera,VM (1989) Analysis of the sequence-specific interactions between Cro repressor and operator DNA by systematic base substitution experiments. Proc Natl Acad Sci USA, 86, 439-443.

312. Tan,S, Richmond,TJ (1998) Eukaryotic transcription factors. Curr Opin Struct Biol. 8(1), 41-48.

313. Tanikawa J, Yasukawa T, Enari M, Ogata K, Nishimura Y, Ishii S, Sarai A (1993) Recognition of specific DNA sequences by the c-myb protooncogene product: role of three repeat units in the DNA-binding domain. Proc Natl Acad Sci USA, 90, 9320-9324.

314. Taylor,1С, Workman,JL, Schuetz,TJ, Kingston,RE (1991) Facilitated binding of GAL4, heat shock factor to nucleosomal templates: differential function of DNA-binding domains. Genes Dev 5, 1285-1298.

315. Tjian,R (1996) The biochemistry of transcription in eukaryotes: a paradigm for multisubunit regulatory complexes. Philos Trans R Soc bond В Biol Sci. 351(1339), 491499.

316. Travers,A (1996) Transcription: building an initiation machine. Curr Biol. 6(4), 401-403.

317. Trifonov,E.N. (1982) Sequence-dependent variations of B-DNA structure, protein-DNA recognition. Cold Spring Harbor Symp. Quant. Biol. 47, 271-278.

318. Tranche,F, Ringeisen F, Blumenfeld M, Yaniv M, Pontoglio M (1997) Analysis of the distribution of binding sites for a tissue-specific transcription factor in the vertebrate genome. J Mol Biol, 266(2), 231-245.

319. Usheva,A., Shenk,T. (1994) TATA-binding protein-independent initiation: YY1, TFIIB,, RNA polymerase II direct basal transcription on supercoiled template DNA. Cell, 76, 11151121.

320. Van Dyke,M., Roeder R.G., Sawadogo M. (1988) Physical analysis of transcription preinitiation complex assembly on a class II gene promoter. Science 241, 1335-1338.

321. Verrijzer,CP, Tjian,R. (1996) TAFs mediate transcriptional activation, promoter selectivity. Trends Bio chem Sci. 21(9), 338-342.

322. Wang,A.H.-J., Fujii,S., van Boom,J.H., Rich,A. (1982) Molecular structure of the octamer d(GGCCGGCC): modified A-DNA. Proc. Natl. Acad. Sci. USA. 79, 3968-3972.

323. Wang,A.H.-J., Quigley,G.J., Kolpak,F.J., Crawford,J.L., van Boom,J.H., van der Marel,G., Rich,A. (1979) Molecular structure of a left-handed double helical DNA fragment at atomic resolution. Nature, 282, 680-686.

324. Wang,JC, Van Dyke,MW (1993) Initiator sequences direct downstream promoter binding by human transcription factor IID. Biochim Biophys Acta, 1216(1), 73-80

325. Wasserman,WW, Fickett,JW (1998) Identification of regulatory regions which confer muscle-specific gene expression. J. Mol. Biol., 278, 167-181.

326. Watson,J.D., Crick,F.H.C. (1953) Nature, 171, 737

327. Weis,L, Reinberg,D (1997) Accurate positioning of RNA polymerase II on a natural TATA-less promoter is independent of TATA-binding-protein-associated factors, initiator-binding proteins. Mol Cell Biol., 17, 2973-2984.

328. Werner,M, Huth J, Gronenborn A, Clore M. (1995) Molecular basis of human 46X,Y sex reversal revealed from the three-dimensional structure of the hu-man SRY-DNA complex. Cell 81, 705-714.

329. Werner,MH, Clore GM, Fisher CL, Fisher RJ, Trihn L, et al. (1996) The solution structure of the human Etsl-DNA complex reveals a novel mode of DNA binding, true side chain intercalation. Cell 83, 761-771.

330. Werner,T (1999) Models for prediction and recognition of eukaryotic promoters. Mamm Genome. 10(2), 168-175.

331. Weston,K. (1992) Extension of the DNA binding consensus of the chicken c-Myb and v-Myb proteins. Nucleic Acids Res., 20, 3043-3049.

332. Wieczorek,E., Brand,M., Jacq,X., Tora,L. (1998) Function of TAF-containing complex without TBP in transcription by RNA polymerase II. Nature, 393, 187-191.

333. Wiley,S.R., Kraus,R.J., Mertz,J.E. (1992) Functional binding of the "TATA" box binding component of transcription factor TFIID to the -30 region of TATA-less promoters. Proc Natl Acad Sci U.S.A., 89, 5814-5818.

334. Wilson,DS, Guenther,B, Desplan,C, Kuriyan,J. (1995) Crystal structure of a paired (PAX) class cooperative home-odomain dimer on DNA. Cell 82:709-19

335. Wing,R.M., Drew, H.R., et al. (1980) Crystal structure analysis of a complete turn of B-DNA. Nature, 287, 755-758.

336. Wingender,E, Chen X, Hehl R, Karas H, Liebich I, Matys V, Meinhardt T, Pruss M, Reuter I, Schacherer F (2000) TRANSFAC: an integrated system for gene expression regulation. Nucleic Acids Res, 28(1), 316-319.

337. Wingender,E. (1993) Gene Regulation in Eukariotes. VCH, Germany.

338. Wolberger,C, Vershon,AK, Liu,B, Johnson,AD, Pabo,C (1991) Crystal structure of a MAT2 homeodomain-operator complex suggests a general model for homeodomain-DNA interactions. Cell 67, 517-528.

339. Wolfertstetter,F., Freeh,K., Herrmann,G., Werner,T. (1996). Identification of functional elements in unaligned nucleic acid sequences by a novel tuple search algorithm. Сотр. Appl. Biosci., 12, 71-80.

340. Wolffe,A.P., Hayes, J.J. (1999) Chromatin disruption, modification. Nucl. Acids Res., 27, 711-720.

341. Wolffe,AP (1994) Transcriptional activation. Switched-on chromatin. Curr Biol. 4(6), 525528.

342. Wolffe,AP, Kurumizaka,H (1998) The nucleosome: a powerful regulator of transcription. Prog Nucleic Acid Res Mol Biol. 61, 379-422.

343. Workman,JL, Kingston,RE (1998) Alteration of nucleosome structure as a mechanism of transcriptional regulation. Annu Rev Biochem 67, 545-579.

344. Wuttke,DS, Foster,MP, Case,DA, Gottesfeld,JM, Wright,PE (1997) Ssolution structure of the first three zinc fingers of TFIIIA bound to the cognate DNA sequence: determinants of affinity, sequence specificity. J. Mol. Biol. 273, 183-206.-225

345. Xu,W, Rould,MA, Jun,S, Desplan,C, Pabo,CO (1995) Crystal structure of a paired domain-DNA complex at 2.5 A resolution reveals structural basis for Pax developmental mutations. Cell 80, 639-650.

346. Yanagi,K., Prive,G.D., Dickerson,R.E. (1991) An analysis of local helix geometry in three decamers, eight dodecamers. J. Mol. Biol., 217, 201-214.

347. Yean,D., Gralla,J. (1997) Transcription reinitiation rate: a special role for the TATA box. Mol. Cell Biol., 17, 3809-3816.

348. Zadeh,L.A. (1965) Fuzzi sets. Information, Control. 8, 338-353.

349. Zawel,L., Reinberg,D. (1995) Common themes in assembly, function of eukaryotic transcription complexes. Annu. Rev. Biochem. 64, 533-561.

350. Zhao,YY, Zhou,J, Narayanan,CS, Cui,Y, Kumar,A (1999) Role of C/A polymorphism at -20 on the expression of human angiotensinogen gene. Hyperstension, 33, 108-115.

351. Zhu,J, Zhang,MQ (1999) SCPD: a promoter database of the yeast Saccharomyces cerevisiae. Bioinformatics 15(7-8), 607-611.

352. Zhurkin,V.B. (1983) Local mobility in the DNA double helix: comparison of conformational calculations with experiment. J. Mol. Biol. 17, 495-509.