Бесплатный автореферат и диссертация по биологии на тему
Текстуальный и статистический анализ регуляторных последовательностей ДНК и РНК
ВАК РФ 03.00.03, Молекулярная биология

Автореферат диссертации по теме "Текстуальный и статистический анализ регуляторных последовательностей ДНК и РНК"

российская академия наук

институт молекулярной биологии

ргб ОН

На правах рукописи

ШАБАЛИНА Светлана Алексеевна

удк 577.213: 577.214: 577.217

текстуальный и статистически! анализ регуляторных последовательностей днк и рнк

оз.оо.оз молекулярная биология

автореферат диссертации на соискание ученой степени кандидата биологических наук

Москва 1994

Работа выполнена в Институте математических проблем биологии РАН

Научный руководитель:

кандидат биологических наук А.С.Кондратов

Официальные оппоненты:

доктор биологических наук А.А.Александров

кандидат биологических наук В.В.Бельков

Ведущая организация:

Институт теоретической и экспериментальной биофизики РАН

Защита состоится 1994 года в часов на

заседании специализированного Совета Д 002.79.01 Института молекулярной биологии им. В.А.Энгельгардта РАН по адресу: Москва, ул. Вавилова, зг, ИМБ РАН. С диссертацией можно ознакомиться в библиотеке ИМБ РАН.

Автореферат разослан "ЛЬ* Ск/У^ЬС^Л^ 1994 г.

Ученый секретарь специализированного Совета, кандидат химических наук

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность проблемы

Разработка методов клонирования и секвенирования нуклеиновых кислот явилась началом нового этапа развития молекулярной биологии. Быстрое накопление данных о первичных структурах биополимеров поставило перед биологами-теоретиками и разработчиками программного обеспечения новые задачи. Изучение структурно-функциональной организации регуляторных последовательностей ДНК и РНК требует применения современных методов информатики, создания баз данных с современными средствами управления, разработки новейших методов сравнения, анализа и статистических исследований нуклеотидных последовательностей .

Актуальность решения задач, связанных с теоретическим исследованием последовательностей ДНК и РНК, определяется большим числом секвенированных нуклеотидных последовательностей и необходимостью осмысления содержащейся в них информации. Частоты и распределение текстуальных элементов в регуляторных сигналах содержат ценную информацию о механизмах регуляции генов и эволюции регуляторных районов ДНК. Особое место занимают статистические методы исследования функциональных сайтов регуляции транскрипции и мутационных изменений в них, как функционально нейтральных, так и влияющих на эффективность функционирования регуляторного сигнала.

Теоретические методы исследования уже в настоящее время позволяют внести значительный вклад как в расшифровку генетической информации, содержащейся в первичных последовательностях нуклеиновых кислот, так и в решение конкретных молекулярно-генети-ческих и биотехнологических задач (Колчанов и др., 1985; Ратнер и др., 1985; Миронов и Кистер, 1984, 1985; Tumanjan et al., 1992; MironoY .nd Lebedev, 1993; Александров, 1994; Лысов, 1994).

В связи с реализацией ряда проектов секвенирования, таких как проекты "Геном человека" или "Геном E.coli", особую важность приобретают исследования структурно-функциональной организации геномных последовательностей, участвующих в регуляции транскрипции и трансляции, призванные содействовать составлению полной энциклопедии генов с точным установлением их структуры и роли (Баев, 1991; Мирзабеков, 1991). Задачей компьютерного анализа является выяснение основных структурных особенностей генома, таких как локализация и взаимное расположение генов, знаков пунктуации (фрагментов, отвечающих за регуляцию основных генетических процессов), неслучайные повторы, палиндромы, периодичности и т. п. Статистический анализ позволяет также изучать взаимное

функциональное соответствие молекул рибосомных, матричных и транспортных РНК. Компьютерный анализ геномных последовательностей является удобным средством исследования структуры генов и семейств ственных генов, а также дает богатую информацию о регуляторных последовательностях и регуляторных цепях, то есть о том, как работает геном в целом, как функционируют гены и как одни гены управляют работой других.

Цель и задачи исследования

Целью данного исследования является изучение текстуальных и статистических закономерностей в регуляторных последовательностях ДНК и РНК, участвующих в процессах трансляции и транскрипции. Основными задачами работы являлись:

1) Изучение статистических характеристик и текстуальных закономерностей в коротких регуляторных сигналах транскрипции, функционально важные и нейтральные мутационные изменения в регуляторных районах генов.

2) Поиск участков взаимной комплементарное™ различных последовательностей РНК и выявление потенциальных участков нуклеино-во-нуклеиновых взаимодействий, предположительно реализующихся при межмолекулярной гибридизации и в процессе трансляции.

3) Исследование структурной и функциональной организации онкогена р53 человека.

Научная новизна и практическая ценность работы

Впервые был проведен комплексный статистический анализ регуляторных сайтов транскрипции. Мутационные изменения и замены в консервативных регуляторных сигналах ДНК прокариот и эукариот, участвующих в регуляции транскрипции, исследованы методами статистического анализа. Показано, что регуляторные области характеризуются асимметричным распределением нуклеотидов между цепями ДНК. (+) - цепь ДНК содержит меньше цитозина в регуляторных участках, функционально важные нуклеотидные позиции обогащены аденином. Изучены частоты нуклеотидов и нуклеотидных замен, распределение нуклеотидов в последовательностях регуляторных сайтов. Впервые изучены частоты ко-замен в регуляторных участках ДНК. Получены свидетельства о компенсаторном характере некоторых нуклеотидных замен.

Проведен компьютерный анализ профилей самокомплементарности и участков взаимной комплементарности последовательностей рибосомных матричных и транспортных РНК Escherichia coli и мыши. Анализ проводился предложенным нами методом поиска локальных стабильных гибридных структур, как в одной молекуле РНК, так и в различных моле-

кулах с использованием порогового значения свободной энергии. Выявлены фрагменты молекул рибосомной РНК, обладающие повышенной ком-плементарностью к последовательностям различных матричных РНК и транспортных РКК (клингер-фрагментш. Предполагается, что клингер--фрагменты являются потенциальными участками межмолекулярного взаимодействия. Выдвинута гипотеза, объясняющая образование стабильных гибридных структур при взаимодействии молекул рРНК и мРНК наличием многих взаимозаменяемых межмолекулярных контактов.

Проведен компьютерный анализ полной последовательности онкогена человека р53, выявлены уникальные и повторяющиеся участки последовательности, а также потенциальные регуляторные сайты и рамки считывания.

Разработаны новые алгоритмы и программы для исследования первичных структур биополимеров, в частности, программа подсчета нук-леотидных замен и ко-замен mutation, программа построения профиля монотонности частотных характеристик мономерных элементов в символьных последовательностях JUMP. Предложен метод суммирования, который широко применяется в различных программах сравнения символьных последовательностей пакета "САМСОН" для анализа первичных структур биополимеров, разработанного в ИМПБ РАН.

Апробация работы

Материалы диссертации докладывались и представлялись на ш Всесоюзном совещании "Теоретические'исследования и банки данных по молекулярной биологии и генетике" (Новосибирск, 1938), совещании по выработке концепции компьютерной поддержки программы "Геном человека" (Пущино, 1989), V школе-семинаре "Базы данных и пакеты прикладных программ для анализа структур биополимеров" (Москва, 1990), международной конференции "Моделирование и компьютерные методы в молекулярной биологии и генетике" (Новосибирск, 1990), на рабочем совещании "Применение компьютеров в биологии" (Мартинсри-эд, ФРГ, 1990) международной конференции "Биосинтез белка" (Пущино, 1991), международной конференции "Трансляционный аппарат" (Берлин, ФРГ, 1992), ill и I? Всероссийской конференциях "Геном человека" (Черноголовка, 1993, 1994). По материалам диссертации опубликовано 16 работ и г находятся в печати.

Структура и объем работы

Диссертация состоит из введения, обзора литературы, четырех глав, посвященных методам исследования, результатам и их обсувде-нию, заключения и выводов. Работа изложена на страницах машинописного текста, содержит рисунков и таблиц. Список литературы включает цитированных источников.

СОДЕРЖАНИЕ РАБОТЫ

I. МЕТОДЫ ИССЛЕДОВАНИЯ

При проведении компьютерного анализа нуклеотидных последовательностей ДНК и РНК использовались как собственные компьютерные разработки - программа подсчета нуклеотидных замен и ко-замен mutation, программа построения профиля монотонности частотных характеристик мономерных звеньев в символьных последовательностях jump, метод поиска локальных стабильных гибридных структур, как в одной молекуле РНК, так и в различных молекулах, при пороговом значении свободной энергии (программа hybridization) - так и ряд других программ из разработанного в ИШБ РАН пакета для анализа первичных структур биополимеров "САМСОН" (Вернослов и др., 1988; 1989; 1990; Shabalina et al., 1991; Matveeva and Shabalina, 1993).

В работе использовались база нуклеотидных последовательностей embl (17-30 выпуски) и собственная подбаза регуляторных последовательностей ДНК, созданная на основе литературных данных (Шабалина и др., 1988).

II. СРАВНИТЕЛЬНЫЙ АНАЛИЗ ТЕКСТУАЛЬНО СХОДНЫХ УЧАСТКОВ РЕГУЛЯТОРНЫХ ОБЛАСТЕЙ ДНК

Частотный анализ символов в функциональных сигналах днк

В настоящей работе исследованы 60 серий регуляторных последовательностей ДНК (15 прокариотических и 45 эукариотических), содержащих от 4 до 32 нуклеотидных посхедс!агельностей общей длиной около 7000 пар оснований (bp), скомгтон: _.с на основе литературных данных (1985-1990). При составлен::. се;,.:д подбирались последовательности с высокой, но не полной . легшей, участвующие (или предположительно участвующие; в регуляции транскрипции (Шабалина и др., 1988; Wingenberg, 1988). Больеья часть анализируемых последовательностей является сайтами узнавания Зелксв-активаторов и реп-рессоров транскрипции. Серии высококонсервативных нуклеотидных последовательностей, такие как сайты рестрикции, а также серии слабо консервативных последовательностей не включались е набор анализируемых данных.

Введем некоторые определения:

1). Нить ДНК, комплементарную смысловой, будем называть (+)-нитью. Смысловую нить ДНК будем называть (-)-нитью.

2). Позиции, содержащие в консенсусной последовательности любые символы. огличные от ы, будем называть "важными".

4

3). Любые различия между нуклеотидом в определенной позиции данной последовательности ДНК и символом в той же позиции консенсуса будем называть "заменой", при условии, что символ консенсуса отличается от n. Например, если консенсус в некоторой позиции содержит С, а нуклеотидная последовательность содержит т, имеет место замена о->Т. Цри рассмотрении двух реципрокных замен, например, а->с (т->ц) и с->а (с->т) мы будем использовать обозначение а<->с (т<->0).

4). Частота, с которой нуклеотид замещает другие символы (нуклеотидная замена) является частотой, с которой этот нуклеотид встречается в позициях консенсуса, содержащих другие символы.

5). Нуклеотидные замены в позициях, соседствуюцих с позициями, в которых произошли другие замены, будем называть "ко-замена-ми". Частоты ко-замен определяются аналогично частотам нуклеотид-ных замен.

В Таблице 1 представлены данные о частотах нуклеотидов в регуляторных и геномных последовательностях ДНК. Видно, что (+)-нить регуляторных участков ДНК прокариот содержит больше пуринов и меньше с, чем (-)-нить ДНК или другие прокариотические последовательности, что указывает на асимметричность цепей ДНК регуляторных участков. У эукариот (+)-нить регуляторйых участков ДНК содержит меньше с и больше А, чем другие эукариотические последовательности. В обоих случаях эти тенденции были более выражены в важных нуклеотидных позициях.

Таблица I. Частоты ($) нуклеотидов в последовательностях ДНК прокариот и эукариот: (а) база данных ишь, (б) все позиции последовательностей всех серий, (в) нуклеотида в важных позициях. Данные для (+)-нити ДНК.

А Т G С

Прокариоты IS! (В) 26,0 28.4 30.5 24,1 27,6 25,9 25,8 26,5 28,2 24,1 17.5 15,4

Эукариоты (а) (Ö (в 28,9 27,3 30,5 25,6 25,9 27,4 23,8 26,0 23,3 23,6 20,8 18,8

Распределения частот ди- и тринуклеотидов в регуляторных участках как прокариот, так и эукариот значимо отличаются от независимого (р>0,95). В частности, (+)-нить ДНК у эукариот обогащена тринуклеотидами aaa, cgg и тао, а у прокариот - тринуклеотидами tgc, gtg, gca и ctg. Содержание тринуклеотидов acg, тто и tag у

эукариот и тринуклеотидов tag, тта, тот, tcg, тсс, gtc, стт, сто и сст у прокариот ниже ожидаемого.

Распределение нуклеотидов в соседних позициях не является независимым в регуляторных участках как прокариот, так и эукариот. У прокариот пурины и пиримидины имеют тенденцию к чередованию, тогда как у эукариот они образуют блоки, что свидетельствует об асимметрии цепей ДНК.

Регуляторные участки прокариот обогащены динуклеотидами PuPy и РуРи, тогда как регуляторные участки эукариот обогащены динуклеотидами PuPu и РуРу. Эти текстуальные особенности ДНК влияют на формирование индивидуальной структуры регуляторных участков и могут приводить к структурной асимметрии регуляторных районов вследствие асимметрии распределения пуринов и пиримидинов между нитями ДНК.

Нуклеотидные замены в функциональных сигналах ДНК

Общие частоты нуклеотидных замен для прокариот и эукариот близки и составляют соответственно 0,157 и о,150.

В Таблице 2 представлены частоты нуклеотидных замен в регуляторных последовательностях ДНК прокариот и эукариот. Определялись также частоты ко-замен для регуляторных областей прокариот и эукариот.

Таблица 2. Частота нуклеотидных замен в регуляторных последовательностях ДНК прокариот и эукариот. Данные для двух цепей ДНК.

Пары Пары нуклеотидов в последовательностях ДНК

консенсусе а : т т : а g : с с : g

Прокариоты а : т g : с 0,825 0,070 0,075 0,035 0,0Ь7 0,865 0,033 0,029

Эука^иоты g : с 0,85 0,064 0,05 0,046 0,076 0,85 0,024 0,040

Нуклеотидные замены можно классифицировать следующим образом:

1). Замены символов на нуклеотиды сходного размера, сохраняющие геометрические черты спирали днк, например, транзиции а<->о (т<->с) и т<->с (а<->0);

2). Замены, сохраняющие прежнюю нуклеотидную пару в цепи ДНК, например, трансверсии а<->т (т<->а) и с<->с (с<->с);

3). Замены, изменяющие как геометрию, так и нуклеотидный состав спирали днк, например трансверсии а<->с (т<->0) и с<->т

(СХ-.-А).

Показано, что молекулярные механизмы спонтанных транзиций и трансверскй различаются (Полтев, Брусков, 1977). Считается, что для выполнения регуляторных функций важны и геометрия, и физико-химические свойства ДНК, зависящие от типов нар оснований, такие как энергия плавления (а:т плавится легче, чем 0:С) жесткость пар оснований (0:0 более жесткая, чем А:Т), распределение донорно--акцепторных групп в бороздках спирали ДНК. Поэтому естественно предположить, что замены третьего типа, изменяющие и геометрию и нуклеотидный состав ДНК, наиболее губительны для функции ДНК, и поэтому должны встречаться наиболее редко. Вместе с тем, трудно предсказать, какие из замен (первого или второго типа) более сказываются на функционировании регуляторных участков.

Наши данные для регуляторных последовательностей прокариот (Таблица 2) е целом подтверждают эти предположения. Во-первых, частоты "симметричных" замен, т.е., А<-чз (т<-лС) и 0<->А (0<->Т), очень близки. Замены третьего типа А<->0 (т<->0 и а<->т (и<->д) встречаются с низкой частотой. Транзиции (т.е., замены первого типа) встречаются в два раза чаще, чем замены третьего типа (Р>0,95), что свидетельствует о важности не только геометрических параметров спирали ДНК. Вместе с тем, частоты замен второго типа достоверно различались, при этом наиболее частыми были трансверсии А^->т (Т<->А) и наиболее родкими а<-.>с (с<->а). Объяснение этих результатов предполагает возможность ДНК-белкового взаимодействия в малой бороздке ДНК, поскольку трансЕерсия А<->Т (Т<->А) является единственной заменой, не изменяющей существенно рисунок донорно-акцепторных групп в этой бороздке (Зеешап et а!., 1976).

Трансверсия О---:с может существенно нарушать функционирование регуляторного участка, так как вследствие повышенной жесткости о-С пары изменения ее ориентации приводят к стабильным структурным изменениям ДНК и нарушению локальной асимметрии (3 и с между цепями ДНК. Можно полагать, что гуанин является наиболее важным элементом регуляторных участков прокариот.

У эукариот трансверсии всех видов встречаются реже транзиций. В отличие от прокариот, все замены второго типа у эукариот имеют близкие частоты встречаемости. Как и у прокариот, замены третьего типа у эукариот встречаются с наименьшей частотой, причем трансверсии 0<->Т встречаются вдвое чаще, чем трансверсии А<->0.

У прокариот транзиции А->о (в комплементарной цепи Т->0) и 0->А (С->Т) значительно реже (Р>0,95) сопровождаются отклонениями соседних нуклеотидов от консенсуса, чем трансверсии А->с ), о->с (С->С) и а-.>Т (с->А). Эти данные хорошо согласуются с концепцией нерегулярности структуры спирали ДНК (Б1скегэоп, 1981).

По-видимому, при заменах типа пурин-пурин или пиримидин-пиримидин структура спирали ДНК не меняется в значительной степени и измененная нуклеотидная последовательность сохраняет способность взаимодействия с белком-регулятором, при условии, что соседние нуклеотиды остаются неизменными. При заменах типа пурин-пиримидин, пиримидин-пурин первоначальная структура спирали ДНК нарушается, поэтому для сохранения способности взаимодействия с белком-регулятором замены А->с (т->0), G->c (C->G) и G->T (с->А) чаще сопровождаются заменами нуклеотидов в соседних позициях, что, вероятно, имеет компенсаторное значение для сохранения прежней структуры спирали ДНК.

Такая же закономерность, выраженная несколько менее отчетливо, прослеживается при анализе нуклеотидных замен в регуляторных консервативных участках ДНК эукариот.

Сравнение Физико-химических и структурных характеристик

регуляторных участков и геномной ДНК

Нами исследовались следующие физико-химические и структурные параметры регуляторных и среднегеномных последовательностей ДНК: средние значения для "twist"-углов, свободных энергий плавления и В-А перехода. Было показано, что эти параметры для сигнальных последовательностей прокариот значимо отличаются от среднегеномных (Р > 0,95). У эукариот не найдено достоверных различий этих величин. В целом сигнальные участки ДНК прокариот более легкоплавки, чем геномная ДНК, или сигнальные последовательности эукариот.

Изучено влияние нуклеотидных замен на структурные параметры спирали ДНК. При замене динуклеотида, исходный и новый динуклеотид часто не похожи между собой ни по структурным свойствам, ни по рисунку доноров и акцепторов. Однако, если рассматривать новый динуклеотид вместе с его неизмененными соседями, то такой тетранук-леотид хотя бы по параметру "twist"- углов близок к исходному тет-рануклеотиду (среднее абсолютное отклонение угла для каждого данного тетрануклеотида равно 1,0 градусу/ нуклеотид, тогда как среднее абсолютное отклонение между средними разных тетрануклеотидов составляет 2,5 градуса/ нуклеотид). Таким образом, по этому параметру нуклеотидные замены в соседних позициях действительно носят компенсаторный характер.

Общие закономерности структурной и текстуальной организации

регуляторных сигналов ДНК

Представленные данные позволяют сделать определенные выводы о структуре регуляторных участков ДНК прокариот и эукариот и выдви-

нуть некоторые предположения о характере их взаимодействия с белками-регуляторами .

Общим для прокариот и эукариот свойством исследованных участков оказалось пониженное содержание пиримидинов и, главным образом, цитозина в (+)-цепях ДНК по сравнении с комплементарными. Обогащенность пуринами одной из цепей, возможно, определяет направление транскрипции, так..как может приводить к асимметрии комплекса ДНК с белком вследствие асимметрии в структуре спирали ДНК участка или более сильного связывания с белком богатой пуринами цепи.

Сигнальные последовательности прокариот характеризуются менее регулярной структурой спирали ДНК по значениям "twist" - углов, большей гибкостью ДНК в направлении большой и малой бороздок, меньшей энергией плавления, чем геномные последовательности в среднем. Сигнальные последовательности эукариот, напротив, слабо отличаются от геномных по параметрам "twist" - углов и энергий плавления. Значимым отличием является повышенное содержание адениновых блоков длиной з и более нуклеотидов, способных к образованию стабильных изгибов на границе с B-формой (Коо et al., 1986; Diekmann, 1987).

Важным условием узнавания ДНК белком является сохранение структуры спирали ДНК. Об этом свидетельствует заметно более редкая встречаемость в регуляторных последовательностях прокариот и эукариот трансверсий по сравнению с транзициями. Трансверсии вызывают более значительные структурные изменения спирали ДНК и чаще сопровождаются заменами нуклеотидов в соседних позициях, что, вероятно, имеет компенсаторное значение для восстановления нативной структуры узнающего участка. При этом наиболее стабильным параметром спирали ДНК является сумма "twist" - углов участка, подвергшегося изменению, включая нуклеотиды, расположенные до и после измененных. Исключением являются часто встречающиеся трансверсии А<->т (у прокариот) и Т->А (у эукариот). Возможно, что этот факт, отражает взаимодействие регуляторного белка с малой бороздкой спирали ДНК, так как только при заменах А<->т рисунок акцепторов и доноров в малой бороздке не изменяется.

Таким образом, на взаимодействие ДНК с белком-регулятором влияет не только расположение детерминант узнавания в бороздках спирали ДНК, но и нерегулярность структуры ДНК на участке контакта. Наши результаты подтверждают предположение, что пара комплементарных нуклеотидов не является единицей взаимодействия. По-видимому, элементарная единица узнавания не является универсальной для всех молекул, взаимодействующих с белком, особенно у эукариот.

В целом, складывается следующее представление о характерных

чертах регуляторных участков: у прокариот - нерегулярные по сравнению с геномной ДНК участки, обогащенные аденином и тимином, с опорой на более жесткие и стабильные 0:С - пары, расположение которых определяет общую структуру регуляторного участка; у эукариот - гомогенные блоки, способные в случае адениновых блоков образовывать стабильный изгиб на границе с в -формой или соединенный гибкой А,Т - связкой.

Нами исследовался вопрос о возможности определения вкладов отдельных нуклеотидов в функциональную активность регуляторных сигналов ДНК и РНК. Как следует из теоремы Огурцова-Елькина, на основании полного набора, данных о первичной структуре и функциональной активности всех возможных последовательностей биополимера определенной длины возможно определение только относительных вкладов мономерных элементов в функционирование биополимера (Ogurtsov et al., 1993).

III. КОМПЬЮТЕРНЫЙ АНАЛИЗ УЧАСТКОВ КОЩЛШЕНТАРНОСТИ В МОЛЕКУЛАХ рРНК И мРНК

' Взаимодействие комплементарных участков молекул РНК играет важную роль в' процессах трансляции. Способность РНК к ме»юлеку-лярному взаимодействию во многом зависит от вторичных и третичных структур этих одноцепочечных молекул. Возможные пространственные структуры молекул НИ определяются первичной последовательностью и ее способностью образовывать внутримолекулярные комплементарные структуры. Вместе с тем, использование различных методов компьютерного моделирования вторичной структуры рибосомной РНК для предсказания ее вторичной структуры неоднозначно определяет состояние ряда участков последовательности рРНК. Вследствие этого при изучении межмолекулярных взаимодействий рРНК-мРНК и рРНК-тРНК представляется целесообразным рассмотрение вопроса о самокомпле-ментарности молекул РНК.

Ранее было экспериментально показано, что 18S рРНК и 28S РНК мыши способны образовывать стабильные гибридные комплексы с матричными РНК в условиях in vitro (Матвеева, Чумаков, 1992). Было продемонстрировано образование межмолекулярных гибридных структур молекулами рРНК и тРНК человека (Smardo and Calvet, 1987). Наиболее детально изучены участки комплементарного взаимодействия рибосомной и матричной РНК Escherichia coli, участвующие в инициации, элонгации и терминации транскрипции (Shine and Dalgarno, 1974; Тер-Аванесян и Сойдла, 1981; Jacob et al.. 1987; Weiss et al., 1988 И Др.).

Нами предложен метод поиска локальных стабильных гибридных

структур, как в одной молекуле РНК, так и в различных молекулах, с использованием порогового значения свободной энергии. Свободная энергия стабильных гибридных структур определяется как сумма энергий всех образующих данную структуру четверок нуклеотидов в параметризации Фриера (Frier et al., 1986). С помощью разработанного нами метода суммирования, позволяющего определять уровень самоком-плементарности и комплементарности молекул РНК, был проведен выбор наиболее вероятных участков межмолекулярного комплементарного связывания, прежде всего - не вовлеченных в формирование вторичных структур взаимодействующих РНК. Важной особенностью предлагаемого метода является его быстродействие, что позволяет анализировать достаточно длинные нуклеотидные последовательности.

В настоящей работе представлены результаты компьютерного исследования участков комплементарности молекул рРНК, мРНК и тРНК Е. coli, а также потенциальных участков гибридизации молекул рРНК-мРНК мыши. Обсуждается их возможная роль в регуляции трансляции как участков неспецифического межмолекулярного взаимодействия.

Самокомплементарность молекул 16s и 23S рибосомной РНК

Escherichia coli

Уровнем комплементарности (самокомплементарности) мы называем величину, характеризующую количество вхождений данного нуклеотида изучаемой последовательности в комплементарные участки сравниваемых последовательностей (той же последовательности)' с энергией взаимодействия ( дО выше заданной пороговой величины. В диссертации представлены результаты, полученные в основном для двух пороговых значений дО: -ю ккал/м и -17 ккал/м, позволяющие выявлять комплементарные фрагменты длиной 4 и более нуклеотидов и длиной более 6 нуклеотидов.

На Рисунке 1 представлен профиль самокомплементарности для ч последовательности рибосомной 16s рРНК E.coli, характеризующий частоты встречаемости комплементарных участков в данной последовательности. Проведена оценка ожидаемого числа стабильных гибридных комплексов различных типов в случайных последовательностях и верхних границ их доверительных интервалов. Выявлены те гибридные структуры, число которых в реальной последовательности достоверно (на уровне 0.5%) отличается от ожидаемого для случайной последовательности. Аналогичные данные получены для 23S рРНК E.coli.

Участки с высоким уровнем самокомплементарности характеризуются повышенным содержанием гуанина и цитозина и локализуются на компьютерной модели вторичной структуры 16s рРНК в основном в спиральных районах и на их границах (Рисунок 2). Это позволяет пред-

положить, что описанные участки с большой вероятностью могут инициировать образование внутримолекулярных спиралей. Два участка с высоким уровнем самокомплементарности, которые на модели вторичной структуры 16S рРНК представляются одноцепочечными (1399-1404 и 1534-1536), описываются, как участки третичных взаимодействий (Brimacombe, 1992).

Сопоставление результатов определения уровня самокомплементарности молекул 16s рРНК и 23S ррик при пороговой величине aG = -ю ккал/м показало, что для молекулы 16S рРНК минимальными значениями самокомплементарности являются 2-6, а нулевые значения отсутствуют. Вместе с тем, в молекуле 23S рРНК, несмотря на ее большую длину, присутствуют фрагменты 504-508 (A)AAAAG(AA) и 761-764 (А)АААА(ТТА) с нулевым уровнем самокомплементарности, локализованные в однонитевых областях.

Изучение комплементарности в молекулах табосомной, матричной и транспортной РНК Escherichia coli и мыши Нами исследовано распределение частот комплементарных олиго-нуклеотидов 16S и 233 рибосомной РНК в последовательностях матричных РНК Е. coli. На Рисунках 2, 3 и в Таблице з представлены участки последовательностей 16s рРНК е.coli, обладающие повышенной

Рисунок 2. Локализация клингер-фрагментов на компьютерной модели вторичной структуры рибосомной I6S FHK Escherichia coli (Woese et al., 1990).

Обозначения: ^»йэ- участки комплементарное™ к мРНК;

■—' - участки комплементарное™ к тРНК; *.»* - участки самокомплементарности.

1

I i

1 1 1 1 i 1 1 1 1. ii 1 1

¡■¡йшипн ИНГАМ » inri "'и f 14' 1 1 ' 1 ! ■ wim IUI III 1 я г 1 |i'h 1 ш ип ii пн 1 fl iii! 1 нии! г'ii iii iii! пш 11 im ::!i,t т (;-... '"' ii '. in iii in I1'-

<0

200 400 600 800 1000 1200 1400

Сшмарная гистограмма распре деления участков, 75 последовательностям матричных РНК, по длине

Рисунок 3.

комплементарных

последовательности рибосомной I6S РНК Escherichia coii (пороговая величина да = -17 ккал/М). Абсцисса и ордината те же, что на Рисунке I.

комплементарностыо к матричной РНК, значимо превышающей уровень комплементарности для случайных последовательностей того же нукле-отидного состава и последовательностей иной функциональной природы. Аналогичные данные получены для 23S рРНК е.coli.

Выявленные фрагменты рибосомной РНК, обладающие повышенным уровнем комплементарности к мРНК, далее мы будем называть клин-гер-фрагментами (Matveeva and. Shabalina, 1993).

На Рисунке г представлено расположение клингер-фрагментов на модели вторичной структуры 16S рРНК E.coli. Сопоставление профилей самокомплементарности 16s рРНК с гистограммами комплементарности этих рРНК к различным матричным РНК показало, что фрагменты рибо-сомных РНК, имеющие максимальное количество комплементарных олиго-нуклеотидов на матричных РНК, можно условно разделить на две группы: 1) - участки рРНК с низким уровнем самокомплементарности, и 2) - участки рРНК, характеризующиеся высокой самокомплементарностью.

Клингер-фрагменты первой группы расположены преимущественно в одноцепочечных структурах предполагаемой вторичной структуры 16S pFHK. Для некоторых из этих участков имеются экспериментальные свидетельства, подтверждающие их способность к межмолекулярному комплементарному взаимодействию. Так например, экспериментальные свидетельства связывания с олигонуклеотидами получены для следу-

Таблица З.Нуклеотидные фрагменты последовательности 165 рРНК Е. оо11, характеризующиеся максимальными частотами комплементарных олигонуклеотидов в последовательностях матричных РНК.

ющих выявленных наш участков 16s рРНК: ugggagcagocgcgg (515-529), gggggcc (924-930), cgu (1062-1064), cgcccg •(1399-1404), ccucc (1535-1539) (Weller anü Hill, 1992; Brimacombe, 1992).

Особый интерес представляет область 530 нуклеотида. Все вторичные структуры 1бв рРНК, предложенные различными авторами, представляют эту область в виде одноцепочечной петли. Защита района 530 синтетическими олигонуклеотидами и тРНК от, действия РНК-аз предполагает возможность межмолекулярного взаимодействия в этой области. Наблюдалась' одновременная сшивка матричной РНК с районом 1390-1400 и нунлеотидом 532, что свидетельствует о близком расположении области 530 к декодирующему центру рибосомы (Rinke-Appel et al., 1989). Предполагается, что область 530 нуклеотида является важным структурным компонентом контроля рамки' считывания в процессе трансляции, основанного на взаимодействии вырожденного мотива 3' CGA 5' с периодическим мотивом 5' GCU з', присутствующим в правильной рамке считывания на матричных РНК (Lagunez-Otero and Trifonov, 1992).

Сопоставление наших результатов с" данными экспериментов по сайт-направленному кросс-сцеплению 16s рРНК с аналогами мРНК (Rinke-Appel et al, 1991, Stade et al., 1989, Dontsova et al., 1991; weller and Hill, 1992) и данными по взаимодействию рРНК с мРНК в условиях гибридизации in vitro и в процессе трансляции (Fipro and Dalberg, 1990; Rinke-Appel et al., 1993) Обнаруживает их близкое соответствие.

Клингер-фрагменты второй группы, локализующиеся ' на моделях вторичной структуры в спиральных районах, являются потенциальными

Участок 16s рРНК

Нуклеотидные позиции

GCUGGCGGCAGG uggcggacgg ggcag agcggg

ugccagcagccgcgg

gcaggcgg

ccg

cgguggcg ccgccugg gggggcc cgu

gccagcgguccggccqgg

gcc

cgg

cgcccg gcg

35-46 102-111 349-353 440-445 515-529 580-587 612-614 719-726 878-885 924-930 1062-1064 1126-1143 1159-1161 1383-1385 1399-1404 1522-1 524

областями образования триплексных структур или кооперативных процессов (transient on-ofí base pairing) (Pipro and Dalberg, 1990).

Аналогичные данные получены нами при анализе последовательностей 18S рРНК, 28S рРНК и мРНК эукариотических организмов (мышь, человек).

Обнаруженные комплементарные участки последовательности 16S рРНК Е. coli и 18s рРНК мыши универсальны для матричных РНК различных генов. Локализация клингер-фрагментов и распределение частот комплементарных олигонуклеотидов универсальны для последовательностей матричной РНК генов различных функциональных групп, хотя при детальном рассмотрении выявляются участки потенциального межмолекулярного взаимодействия, характерные для различных функциональных групп генов.

Сопоставление результатов компьютерного анализа семейств мРНК и тРНК с данными для нуклеотидных последовательностей иной функциональной природы (интроны, нуклеотидные последовательности случайного состава, спейсеры между генами) показало, что последние характеризуются иным распределением частот комплементарных олигонуклеотидов вдоль последовательности рибосомной РНК, при этом максимальные частоты для последовательностей семейств мРНК и тРНК статистически значимо (на уровне 0.5Ж) отличаются от случайных последовательностей. Так например, максимальные частоты олигонуклеотидов, комплементарных клингер-фрагментам 183 рРНК мыши, в 2-3 раза ниже для случайных последовательностей, чем для семейства мРНК мыши. Вероятность образования дуплекса РНК-РНК зависит от частот комплементарных фрагментов во взаимодействующих молекулах, поэтому можно полагать, что клингер-фрагменты молекул 16S и 18S рРНК являются областями РНК-РНК взаимодействия. Участки с различной степенью комплементарности к клингер-фрагментам присутствуют как в 5'-некодирующей, так и в кодирующей областях матричной РНК.

Клингер-фрагменты как прокариот так и эукариот характеризуются высоким содержанием гуанина и цитозина. В клингер-фрагментах 16s рРНК Е.coli присутствует мотив ggc, cgg, CCG и GCC, для клин-гер-фрагментов 18S рРНК мыши характерны g- и с-блоки. Текстуальное сходство клингер-фрагментов прозволяет предположить, что участки контактов молекул рРНК и мРНК могут быть взаимозаменяемыми, т.е. каждый сайт мРНК может образовывать дуплексы с различными клин-гер-фрагментами рРНК, в свою очередь отдельный клингер-фрагмент способен комплементарно взаимодействовать с множеством участков на мРНК (Нечипуренко и др., 1994).

Следует отметить, что большинство обнаруженных нами клин-гер-фрагментов 18S рРНК мыши и человека содержат G-блоки из четырех и более гуанинов, что соответствует протяженным с-блокам в

матричных РНК. Любой участок мРКК, содержащий 4 и более о подряд обязательно кодирует пролин в последовательности белка, который как известно, может играть важную роль при создании изгибов и поворотов в полипептидной цепи. G-богатые блоки мРНК, взаимодействующие с с-богатыми клингер-фрагментами рРНК, кодируют глицин, который может существовать в конформационных состояниях, недоступных другим аминокислотам (Кантор и Шиммел, 1984). Таким образом, можно высказать предположение о важном значении участков мРНК, комплементарных клингер-фрагментам. рРНК, в упаковке белковых молекул.

Экспериментальные свидетельства того, что некоторые клин-гер-фрагменты 163 рРНК Е. coli способны к межмолекулярному взаимодействию, позволяют предположить, что по крайней мере часть клингер-фрагментов находится на поверхности рибосомы (Rinke-Appel et al., 1989, 1991, 1993; Weller and Hill, 1992; Pipro and Dalberg, 1990). В процессе трансляции рибосома расплетает матричный полинуклеотид, так что удерживаемый на рибосоме участок мРНК лишен вторичной и третичной структуры, при этом удержанию мРНК транслирующей рибосомой способствуют кодон-антикодоновые взаимодействия (Спирин, 1986).

В Таблице 4 и на Рисунке 2 приведены участки последовательности 16S рРНК е.coli, обладающие повышенными частотами комплементарное™ к тРНК. Особый интерес представляют участки, совпадающие с клингер-фрагментами или примыкающие к ним.

Вышеизложенные данные позволяют высказать предположение о том, что биологическая роль клингер-фрагментов рибосомной РНК состоит в неспецифическом связывании молекул мРНК и тРНК в процессе трансляции.

Мы полагаем, что взаимодействие клингер-фрагментов рРНК с молекулами матричной и транспортной РНК возможно как путем образования комплементарных контактов, так вследствие кооперативных процессов и образования триплексных структур. Это может приводить к относительному увеличению концентрации мРНК и тРНК в районе 30S субъединицы, повышая таким образом возможности трансляции мРНК (Pipro and Dahlberg, 1990). Локальное повышение концентрации молекул мРНК и тРНК может способствовать их правильному взаимному расположению на рибосоме при инициации трансляции, поддержанию правильной рамки считывания при элонгации трансляции, а также облегчать взаимодействие тРНК с мРНК, что является факторами повышения скорости трансляции. Эти предположения согласуются с экспериментальными данными и представлениями о важной роли образования коротких дуплексов между сайтами рРНК и мРНК на разных этапах процесса трансляции, развиваемыми в ряде работ (Shine and Dalgarno, 1974; Тер-Аванесян

Т7

И Сойдла, 1981; Hui and deBoer, 1987; Weiss et al., 1988; Sarge and Marwell, 1991; И др.).

Полученные данные свидетельствуют о взаимной функциональной приспособленности молекул.рРНК и мРНК и существовании общих механизмов регуляции трансляции различных матричных РНК.

Таблица 4. Нуклеотидные фрагменты последовательности 16S рРНК Е. coli, характеризующиеся максимальными частотами комплементарных олигонуклеотидов в последовательностях транспортных РНК (* - участки, совпадающие с клингер-фрагментами, приведенными в Таблице з, или примыкающие к ним).

[асток 16S рРНК Нуклеотидные позиции

GGCGGA 103-108 *

GGAGGGGG 140-147

GGGGGAC 200-205

UGGG 255-258

GG 346-347 *

GCGGGGAGG 441-449 *

GAGGG 537-541 *

CCCGGG 611-616 ♦

GAGGGGGGU 663-671

GGUGGC 720-725 *

GGCCCCCÜG 732-740

GGG 773-775

ACCGCCUGGGGA 877-888 #

GGGGGCCCG 924-932 *

CCUGG 983-987

GGCCGGG 1137-1143 *

GAG 1174-117ь

GGUGGG 1180-1185 *

GGA 1277-1279

GGAUUGGA 1303-1313

CGG 1383-1385 *

GGGAGGGC 1452-1459

GAA 1516-1518 *

IV. ИЗУЧЕНИЕ СТРУКТУРНО-ФУНКЩОНАЛЬНОИ ОРГАНИЗАЦИИ ОНКОГЕНА р53 ЧЕЛОВЕКА КОМПЬЮТЕРНЫМИ МЕТОДАМИ

Нами проведен компьютерный анализ полной первичной последовательности онкогена р53 человека (около гооооьр), секвенированной в лаборатории Н.М.Чумакова, ИМБ РАН.

В последовательности онкогена р53 были выделены нуклеотидные домены, характеризующиеся разной степенью гомологии к нуклеотидным последовательностям генома человека. Такими доменами являются участки последовательности онкогена, гомологии к которым встречаются в геномных последовательностях человека с близкой частотой, отделенные от участков с иной степенью гомологичности к геномным последовательностям человека.

Рисунок 4. Доменная структура первичной последовательности онкогена человека р53. Обозначения: А - уникальные участки; В -повторяющиеся участки iAlu-повторы); С - кодирующие области. Абсцисса: нуклеотидная последовательность онкогена р53. ордината: количество гомологичных фрагментов в базе данных ембь (release зо).

На Рисунке 4 представлена в виде гистограммы доменная структура последовательности онкогена р53 человека, отражающая степень уникальности различных участков его последовательности. Видно, что уникальные участки онкогена перемежаются с областями, обладающими различной степенью гомологичности к геномным последовательностям. Aiu-швторы выявляются на гистограмме как области высокой гомологии (например, нуклеотидные позиции 2580-2878, 3950-4604, 4786-5214), имеющие до 500 и более копий в банке нуклеотидных последовательностей человека, при этом различные участки Aiu-повторов характеризуются разным количеством гомологичных фрагментов в геномных последовательностях. Кодирующие районы (например, 11907-11928, 12011-12299) обнаруживаются как участки гомологии к присутствующим в базе данных емвъ экзонам онкогена р53.

Следует отметить, что интроны онкогена включают в себя как Aiu-повторы, так и полностью уникальные участки. Это обстоятельс -тво можно объяснить наличием в онкогене р53 второй рамки считывания. Другое возможное объяснение состоит в том, что данные области не являются на самом деле уникальными и гомологичны еще не расшифрованным участкам генома человека.

Анализ последовательности первого интрона, расположенной под 2-м промотором, позволил идентифицировать несколько потенциальных открытых рамок считывания. Одна из них включает область длиной 190 аминокислотных остатков с 1874 по 2444 нуклеотид, вторая потенциальная рамка считывания находится на комплементарной цепи и начинается с 1363 нуклеотида, ее длина - 215 аминокислотных остатков. Эти результаты подтверждаются анализом потенциальной экзон-интронной структуры данной области онкогена проведенного методом Гельфанда-Ройтберга (Gelfand and Roytberg, 1992).

В первом интроне онкогена р53 обнаружена область, обогащенная короткими мотивами, сходными с последовательностями регуляторных сайтов. Ранее в этой области первого интрона было экспериментально продемонстрировано наличие 2-ого промотора. Проведенное нами детальное изучение области 2-ого промотора позволило выявить набор содержащихся в ней потенциальных регуляторных сайтов.

ВЫВОДЫ

1. Проведен статистический и текстуальный анализ первичных структур ДНК и РНК с помощью собственных и разработанных в ИМПБ РАН компьютерных программ, основанных на оригинальных алгоритмах.

2. Исследованы общие закономерности текстуальной организации

консервативных сигналов ДНК, участвующих в регуляции экспрессии генов прокариот и эукариот.

а) Показано, что регуляторные области характеризуются асимметричным распределением нуклеотидов между цепями ДНК, (+)-цепь ДНК содержит меньше цитозина в регуляторных участках. Функционально важные нуклеотидные позиции обогащены аденином.

б) Распределения частот да- и тринуклеотидов в регуляторных участках как прокариот, так и эукариот значимо отличаются от независимого. Регуляторные участки .прокариот обогащены динуклеотидами PuPy и РуРи, тогда как регуляторные участки эукариот обогащены динуклеотидами PuPu, РуРу и адениновыми блоками длиной з и более нуклеотидов.

в) Проведен частотный анализ нуклеотидных замен и преложена классификация нуклеотидных замен по степени влияния на структуру спирали ДНК. Показано преобладание транзиций над трансверсиями. Показано, что нуклеотидные замены, изменяющие как геометрию, так и нуклеотидный состав спирали ДНК являются наиболее редкими.

г) Проведен частотный анализ ко-замен для регуляторных последовательностей прокариот и эукариот. Получены свидетельства о компенсаторном характере некоторых нуклеотидных замен.

д) Сигнальные последовательности прокариот характеризуются менее регулярной структурой спирали ДНК по значениям "twist" - углов и меньшей энергией плавления, чем геномные последовательности в среднем. Сигнальные последовательности эукариот, напротив, слабо отличаются от геномных по этим параметрам.

3. Проведено компьютерное исследование участков комплементарности последовательностей рРНК, мРНК и тРНК Echerichia coli и мыши. На последовательностях рибосомной I6S РНК Е. .coli и I8S РНК мыши выявлены фрагменты, комплементарные часто встречающимся в матричных РНК участкам (клингер-фрагменты). Показано, что локализация клингер-фрагментов и распределение максимумов и минимумов частот комплементарности к матричной РНК универсальны для всех исследованных последовательностей мРНК. Клингер-фрагменты рибосомной РНК характеризуются высоким содержанием гуанина и цитозина. Показано, что большая часть клингер-фрагментов I8S рРНК мыши и человека содержат G-блоки (4 или более <3), которые комплементарны участкам мРНК, кодирующим пролин. Предполагается, что выявленные клингер-фрагменты рРНК могут участвовать в неспецифическом взаимодействии с мРНК и тРНК в процессе трансляции, а комплементарные им участки мРНК могут играть важную роль в создании изгибов и поворотов полипептидной цепи.

4. Предложено теоретическое обоснование экспериментально об-

нарушенной межмолекулярной гибридизации мРНК - 18Б рРНК, мРНК -283 рРНК мыши (Матвеева и 'Чумаков, 1992), предполагающее образование множественных контактов между отдельными комплементарными сайтами этих молекул.

5. Исследована структурно-функциональная организация первичной последовательности онкогена р53 человека. Выявлены уникальные и повторяющиеся участки последовательности онкогена, потенциальные регуляторные сайты и рамки считывания.

СПИСОК ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ

1. Шабалина С.А., Юрьева о.В., Спиридонов Н.А., Кондратов А.С. Сравнительный анализ текстуально сходных участков регулятор-ных областей ДНК. ОНТИ НЦБИ АН СССР, Пущино,1988, 58 стр.

2. Вернослов С.е., Кондратов А.С., Ройтберг М.А., Шабалина С.А., Юрьева О.В., Назипова Н.Н. Пакет программ для анализа первичных структур биополимеров "САМСОН". Тезисы докладов. Всесоюзная конференция "Теоретические исследования и банки данных в молекулярной биологии и генетике", Новосибирск, 1988, стр. 30-31.

3. Шабалина С.А., Кондратов А.С. Текстуальное сходство регу-ляторных консервативных олигонуклеотидов аргининового и sos-pery-лонов Escherichia coli. Там же, стр. 81.

4. Вернослов С.Е., Кондратов А.С., Ройтберг М.А., Шабалина С.А., Юрьева О.В., Назипова Н.Н. Пакет программ для анализа первичных структур биополимеров "САМСОН". ОНТИ НЦБИ АН СССР, Пущино, 1989, часть 1 - 96 стр.

5. Вернослов С.Е., Кондратов А.С., Ройтберг М.А., Шабалина С.А., Юрьева О.В., Назипова Н.Н. Пакет программ для анализа первичных структур биополимеров "САМСОН". ОНТИ НЦБИ АН СССР, Пущино, 1989, часть 2-124 стр.

6. Shabalina S.A., Roytberg М.А., Kondrashov A.S., Vernoslov S.E. Some characteristic features of 5'-regulatory regions of heat shock protein genes. Abstracts of Int. Conf. "Modelling and computer methods in molecular biology and genetics", Novosibirsk, USSR, 1990, p. 16.

7. Shabalina S.A. On the frequencies of nucleotides and nucleotide substitutions in concervative regulatory DNA sequences. Abstracts of Workshop "Computer application in biosciences", Martinsried, FRG, 1990, p. 55-56.

8. Вернослов С.е., Кондратов А.С., Ройтберг М.А., Шабалина С.А., Юрьева О.В., Назипова Н.Н. Пакет программ для анализа пер-

вичных структур биополимеров "САМСОН". Молекулярная биология, 1990, Т.24, стр. 524-529.

9. Shabalina S.A., Yuryeva O.V., Kondrashov A.S. On the frequencies of nucleotide substitutions in conservative regulatory DNA sequences. J.Theor.Biol., 1991, V. 149, p. 43-51.

10. Matveeva O.V., Roytberg M.A., Shabalina S.A. Textual and statistical regularities in RNA nucleotide sequences. Abstracts of Int. ConI. "Protein biosynthesis", Pushchino, USSR, 1991, p. 81.

11. Matveeva, O.V., Shabalina, S.A. mRNA-rRNA in vitro hybridization and computer analysis of regularities in intermolecular complementary fragment distribution. Abstracts of Int. Conference "The translation apparatus", Berlin, FRG, 1992, p. 77.

12. Matveeva O.V., Shabalina S.A. Intermolecular mRNA-rRNA hybridization and the distribution of potential interaction regions in murine 18S rRNA. Nucleic Acids Research, 1993, v.21, p. 1007-1011.

13. Ogurtsov A.Yu., Elkin Yu.E., Shabalina S.A. Calculation of contributions of individual monomeric units into biopolymer functioning. J.Theor.Biol., 1993, v.164, p. 395-401.

14. Матвеева O.B., Шабалина С.А. Компьютерный метод оценки специфичности межмолекулярных взаимодействий. Тезисы докладов. Третья конференция "Геном человека-93", Черноголовка, 1993, стр. 127.

15. Шабалина С.А. Компьютерный анализ повторяющихся и уникальных участков в последовательностях онкогена р53 человека. Там же, стр. 146.

16. Исаев М.А., Нечипуренко Ю.Д., Шабалина С.А., Матвеева О.В., Попов Н.В. Разработка моделей и создание программного обеспечения для выбора оптимальных праймеров в ПЦР. Тезисы докладов. Четвертая конференция "Геном человека-94", Черноголовка, 1994, стр. 43.

17. Шабалина С.А. Поиск закономерностей в организации регуля-торных районов генов мыши, сравнение их между собой и с аналогичными районами генов других видов. Тезисы докладов. Отчетная конференция по ГНТП "Приоритетные направления генетики", в печати.

18. Нечипуренко Ю.Д., Попов Н.В., Исаев М.А., Шабалина С.А., Матвеева О.В. Модель множественных контактов, описывающая взаимодействие мРНК с сайтами рРНК в процессе трансляции. Биофизика, в печати.

05.03«94 г. Зак.6022Р. Тир.125 экэ. Уч.-изд.л. 1.5 Отпечатано на ротапринте в ОНТИ ГИЦ РАН