Бесплатный автореферат и диссертация по биологии на тему
Исследование конформационных возможностей олигонуклеотидных дуплексов усовершенствованными методами молекулярной механики
ВАК РФ 03.00.02, Биофизика

Автореферат диссертации по теме "Исследование конформационных возможностей олигонуклеотидных дуплексов усовершенствованными методами молекулярной механики"



на правах рукописи '"ч УДК 577.150.2

\

Нестерова Елена Николаевна

ИССЛЕДОВАНИЕ КОНФОРМАЦИОННЫХ ВОЗМОЖНОСТЕЙ ОЛИ ГОНУ КЛЕОТИДНЫХ ДУПЛЕКСОВ УСОВЕРШЕНСТВОВАННЫМИ МЕТОДАМИ МОЛЕКУЛЯРНОЙ МЕХАНИКИ.

03.00.02 - Биофизика '

Автореферат диссертации на соискание ученой степени кандидата физико-математических наук

Пущино - 1997

Работа выполнена в Институте математических проблем биологии РАН.

Научные руководители - доктор физико-математических наук, профессор, Полтев В.И. и

доктор физико-математических наук, Чуприна В.П.

Официальные оппоненты - доктор физико-математических наук, профессор,

Ю.А. Лазарев

кандидат биологических наук, Петров А. И.

Ведущая организация - Институт молекулярной биологии РАН, г. Москва.

Защита состоится д<?«5~ " рл -1997 г в часов

на заседании диссертационного совета Д 200.22.01 в Институте теоретической и экспериментальной биофизики РАН по адресу: 142292, Московская область, г.Пущино, ИТЭБ РАН.

С диссертацией можно ознакомиться в библиотеке ИТЭБ РАН.

Автореферат разослан " кЛЗ&рЗ^. 1997

Ученый секретарь диссертационного совета

кандидат биологических наук >1 ^И/^А^^ЬииН^/' П.А. Нелипович

г

Актуальность темы исследования.

Пространственная структура двойной спирали ДНК зависит от ее лслеотидной последовательности, условий среды и взаимодействий с другими элекулами. Детальные сведения о »информационных возможностях фрагментов зиродной и модифицированной под влиянием разных воздействий ДНК важны 1Я понимания молекулярных механизмов многих биологических процессов. Сотни (бот посвящены экспериментальному изучению пространственной структуры 1игонуклеотидных дуплексов. Исследование каждого дуплекса методами ЯМР в ¡створе или рентгеноструюурного анализа в кристаллах представляет собой дельную трудоемкую задачу. И не для всех дуплексов, особенно дуплексов с эдифицированными основаниями, удается получить надежные :спериментальные данные. Поэтому применение компьютерного моделирования 1Я теоретического предсказания конформационных возможностей и построение > ограниченным экспериментальным данным пространственных моделей рагментов природных и модифицированных нуклеиновых кислот представляет )бой актуальную задачу современной молекулярной биофизики. Для этого в азных лабораториях успешно применяется ряд компьютерных программ, многие ! которых требуют больших компьютерных ресурсов и рассчитаны на работу с эбыми типами молекул. Для систематического исследования олигонуклеотидных 'плексов с учетом экспериментальных данных требовалось разработать 1ециализированную компьютерную программу, предоставляющую возможность ¡ленаправленно изменять конформационные переменные, и ориентированную на >ступные ресурсы ЭВМ.

Диссертация посвящена разработке такой программы, ее применению для очнения структур в соответствии с экспериментальными данными и ¡следованию конформационных возможностей чередующихся пурин-(римидиновых последовательностей.

Цели работы.

1) Разработка новой компьютерной программы для исследования «формационных возможностей олигонуклеотидных дуплексов в пространстве габщенных структурных переменных, а также для уточнения их структуры в ютветствии с экспериментальными данными, представленными набором эхпротонных расстояний. Для программы предполагалось усовершенствовать [горитм, предложенный ранее (Хуторский и Полтев, Биофизика, 1976), для ¡шения нового круга задач, существенно увеличить размеры рассматриваемых 'плексов и повысить эффективность вычислений, заменив численное вычисление юизводных аналитическим градиентом.

2) Исследование конформаций дуплекса с нуклеотидной парой

8-оксигуанин:аденин (OG:A). Поиск низкоэнергетических конформаций этого дуплекса, согласующихся с экспериментальными данными; исследование влияния соседних с модифицированной парой оснований на соотношение конформеров с разными конфигурациями пары.

3) Исследование конформационных возможностей олигонуклеотидных дуплексов с чередующимися пурин-пиримидиновыми последовательностями в диапазонах значений структурных переменных, характерных для А- и В-семейств конформаций. Поиск связей между параметрами при конформационных изменениях внутри семейств. Выявление возможных путей изменения параметров при В-А переходе.

Научная новизна исследования.

Впервые разработана компьютерная программа для теоретического конформационного анализа в пространстве обобщенных структурных переменных, сочетающая в себе наличие замкнутых циклов, в которых одни информационные переменных вычисляются через другие, и аналитический градиент.

Впервые найдены протяженные области низкоэнергетических В-конформаций дуплексов с чередующимися пурин-пиримидиновыми последовательностями, характеризующиеся различными для двух степов соотношениями значений углов спирального вращения, расстояний между центрами пар вдоль оси спирали и различными сочетаниями конформаций Сахаров пуриновых и пиримидиновых нуклеотидов.

Исследованы протяженные области низкоэнергетических А-конформаций таких дуплексов, характеризующиеся различными соотношениями углов спирального вращения двух степов.

Впервые выявлены два конформационных параметра, последовательное или одновременное изменение которых приводит к В-А переходу. Описаны структуры, для которых значения одной части параметров характерны для А-семейства, а другой части - для B-семейства конформаций.

Практическая ценность работы.

Разработанная компьютерная программа CONAN может быть использована для предсказания конформационных возможностей фрагментов нуклеиновых кислот с заданной нуклеотидной последовательностью, содержащих как природные, так и модифицированные основания, и для уточнения их пространственной структуры в соответствии с экспериментальными данными. Выявленные конформационные возможности пурин-пиримидиновых и пиримидин-пуриновых степов могут быть использованы при построении моделей их взаимодействия с белком, а также моделей взаимодействия других биомолекул с разными нуклеотидными последовательностями.

Апробация работы. Результаты работы докладывались на семинарах ИМПБ Н, на VII конференции по спектроскопии биополимеров в Харькове (1991г).

Публикации. По материалам диссертации опубликовано 5 статей и 1 тезисы клада.

Структура и объем работы. Диссертация состоит из введения, четырех глав, ¡водов, списка литературы из 1JJ0 наименований. Содержание работы изложено ¿^страницах, включая 22. рисунков и 2 0 таблиц.

СОДЕРЖАНИЕ РАБОТЫ

Введение содержит общую характеристику работы, описание подходов к шенига поставленных задач и краткое изложение основных результатов.

ГЛАВА 1. Литературный обзор.

В первом разделе описываются и сравниваются различные компьютерные юграммы, разработанные ранее для конформационного анализа нуклеиновых слот, отмечаются их особенности и недостатки.

Во втором разделе рассматриваются экспериментальные данные о дуплексах чередующимися пурин-пиримидиновыми последовательностями. Результаты следований олигонуклеотидов в растворе методом ЯМР и рентгеноструктурных ¡следований полинуклеотидных волокон и кристаллов свидетельствуют, что рактерной чертой чередующихся последовательностей является различие нформаций пурин-пиримидинового и лиримидин-пуринового степов, гносительные значения параметров, характеризующих степы, различны в разных руктурах.

ГЛАВА 2. Программа CONAN как инструмент теоретического конформационного анализа.

Трехмерная структура фрагмента ДНК задается набором параметров -нстант и конформационных переменных. Все длины связей и большинство ¡лентных углов сахаро-фосфатного остова предполагаются постоянными, включение составляют внутренние валентные углы сахарных колец и валентные лы Р-ОЗ'-СЗ'. Основания считаются жесткими и плоскими структурами, только стильные группы могут вращаться вокруг связи, лежащей в плоскости основания.

Рассмотрим фрагмент двойной спирали ДНК, состоящий из Np пар оснований in Nc =2NP оснований. Две разнонаправленные цепи ДНК образованы >вторяющимися структурными единицами, каждая из которых включает

основание из фиксированного набора, содержащего 4 природных и ряд модифицированных оснований, остатки дезоксирибозы и фосфорной кислоты. Структурная единица представлена на рис.1. Структурные единицы нумеруются с З'-конца одной из цепей, 5'-конец содержит укороченную структурную единицу. Структурной единице п одной цепи соответствует структурная единица т второй цепи, (т=Ыс -п+1).

Рис.1. Структурная единица п в программе CONAN (заключена между пунктирными линиями). Основание обозначено прямоугольником, N обозначает N9 пуринов/NI пиримидинов. Атомы "главной цепи" СГ, С2\ СЗ', С4', С5', 05' и Р обозначены цифрами 1, 2, 3, 4, 5, 6, и 7, соответственно. Боковые атомы имеют двойные индексы. '

2.1. Основные конформационные переменные.

Конформационные переменные, позволяющие конструировать различные пы конформаций фрагмента ДНК, делятся на несколько групп:

1. переменные, описывающие конформации сахарных колец, S;

2. углы вращения вокруг гликозидных связей, характеризующих взаимное ложение Сахаров и оснований, X, (C6-N1-C1'-C2' для пиримидинов, C8-N9-C1'-!' для пуринов);

3. углы вращения метильных групп (для оснований с метильными группами);

4. переменные, задающие положение оснований в паре, К. Для п-го нования эти переменные задают вектор сдвига и три угла поворота носительно того положения, которое основание занимает в уотсаи-криковской ре. Положение комплементарного основания m задается аналогичными ¡ременными;

5. переменные, характеризующие положение пары оснований как целого носительно оси спирали, Н. Для пары п переменные включают вектор сдвига |ры по отношению к оси спирали в плоскости, нормальной к оси спирали; углы испона пары по отношению к оси спирали и угол взаимного поворота оснований паре. Если для фрагмента ДНК не определена единая линейная ось спирали, то )я каждой пары оснований вводится локальная ось спирали и положение пары :нований определяется относительно этой локальной оси спирали;

6. переменные, описывающие ход оси спирали, В, для п-ой пары включают -ол спирального поворота (п +1)-ой пары оснований по отношению к п-ой, т, и гответствующий вектор сдвига, h.

2.2. Алгоритм вычисления пространственной структуры фрагмента ДНК,

Вычисление конФормации сахара. В программе CONAN используются два этода вычисления конформации сахара:

двухпараметрический, по фазам (Р) и амплитудам (А) псевдовращения (Altona id Sundaralingam, J. Amer. Chem. Soc. 1972);

> четырехпараметрический; по двум валентным и двум торсионным углам >1числяются три валентных и три торсионных угла путем решения уравнений, чисывающих условия замыкания пятичленного цикла (Луговской и Дашевский, Ж. грукт. Химии, 1972).

Полученные способом а) углы в некоторых случаях могут не обеспечивать >чного замыкания сахарного кольца, что необходимо для дальнейших счислений. Поэтому реально этот метод применяется только как эедварительный этап, дающий значения четырех переменных, необходимых для

метода б), он бывает полезен для быстрого поиска подходящих конформаций Сахаров и как более наглядный способ описания их конформаций.

Определение положения оснований в паре и положения пар оснований по отношению к оси спирали. Для того, чтобы определить положение оснований по отношению к оси спирали, вводятся несколько систем координат, а именно:

- 1_В5(п), локальная система координат, жестко связанная с каждым основанием;

- 1РСБ(п), локальная система координат, связанная с центром пары;

- 1_НА5(п), локальная система координат, связанная с локальной осью спирали для каждой пары.

Для каждого типа оснований определена локальная система 1_В5(п), жестко связанная с основанием, относительно которой задано положение всех его атомов. Координаты атомов оснований, в системе, связанной с осью спирали, вычисляются путем последовательного перехода из 1_В5(п) в 1-РСЗ(п), а затем в -1.НА5(п). При необходимости координаты всех атомов вычисляются в единой системе, как правило, связанной с первой парой, ША5(1).

Вычисление конФормации сахаро-фосФатного остова. Для атомов сахаро-фосфатного остова вводятся локальные системы координат. Координаты атомов главной цепи ¡=4, 3, 2, 1 и соответствующих боковых вычисляются путем преобразования из ¡-ой локальной системы последовательно в локальные системы атомов с меньшими номерами, и далее, в ШАЗ(п).

Для вычисления координат атомов ¡=5, 6, 7 и связанных с ними боковых атомов, необходимо найти информационные переменные для участков остова С4'(п)...СЗ'(п+1), соединяющих соседние вдоль цепи сахара (рис.2). В соответствии с алгоритмом (Хуторский и Полтеа, Биофизика, 1976), в качестве 6 зависимых параметров участка С4'-С3' выбраны 5 торсионных углов: 95, ср5, <р7, фе, 99 и один валентный угол ад. Их значения вычисляются из условий замыкания цикла, т.е. совпадения координат атома 7.4 структурной единицы п с координатами атома 3.2 структурной единицы (п+1) в лабораторной системе координат, связанной с 4-ым атомом (рис.2).

В ситуации отсутствия решения ("разрыв цепи"), вводятся фиктивные атомы 8', 9', 10', образующие продолжение участка сахаро-фосфатной цепи (рис.2). Координаты фиктивных атомов вычисляются с использованием для торсионных углов Ф5, Фб, Ф7> 9а, Ф9 и валентного угла ощ либо значений предыдущего шага, либо значений, считанных из входного файла. При минимизации к энергии дуплекса добавляется штраф на отклонения фиктивных атомов от их положений в замкнутом цикле.

1С.2. Зависимые параметры фрагмента остова С4'-С3\ соединяющего две руктурные единицы. Лабораторная система координат, связанная с 4-ым омом, обозначена

2.3 Расчет энергии фрагмента ДНК.

Энергия, характеризующая конформацию фрагмента ДНК, вычисляется к сумма невалентных взаимодействий, рассчитываемых с помощью луэмпирических потенциальных функций, параметры которых специально добраны для ДНК (Журкин В.5 и др. 1980) и дополнительных слагаемых

м-

i<j bTij i<j

г12 r.6 У У

+ £^L[1+cos(n(pj)]_

n,J2

V

+ !—[!+ С05(п¥])1 + - V?)2 + К8(<хв -а£)2 + ЕШ

Первое слагаемое является суммой электростатических взаимодействий между эффективными зарядами е,, е, атомов I и ¡, находящихся на расстоянии гу. г - функция диэлектрической проницаемости. Второе слагаемое представляет собой потенциал Леннарда-Джонса ("6-12"). Для пар атомов, образующих водородные связи, используется потенциал "10-12".

Следующие два слагаемых описывают потенциал внутреннего вращения вокруг связей для сахаро-фосфатного остова и для остатков Сахаров.

Пятое слагаемое представляет энергию деформации валентных углов сахара. К8(а8 штрафной потенциал на отклонение угла ав от его среднего

значения в кристаллах.

При расчетах многих конформаций учитываются только взаимодействия между атомами соседних пар нуклеотидов. В тех же случаях, когда могут быть существенны и более удаленные контакты (например, в О-форме, при наличии изгиба оси спирали и т.д.) в рассмотрение включаются межатомные взаимодействия в пределах нескольких пар.

Дополнительные слагаемые энергии. В процессе минимизации при возникновении "разрыва цепи", к потенциальной энергии автоматически добавляется штраф на разрыв:

ва = fd1 I 1-3,2 -г81 2 + fdz I г3 - га I 2 I г4 - гю1 2]

где ¡¿2 и - коэффициенты штрафа.

При поиске конформаций, соответствующих определенному набору

диапазонов межатомных расстояний { г*0Б(1), г^0Е(2) I, (индексы в скобках 1 и 2

различают левую и правую границы диапазона), к потенциальной энергии добавляется сумма Бмое штрафов на отклонения межатомных расстояний от требуемых значений:

Skob = -rf°W

где fy1, fy2 - коэффициенты штрафа на расстояние слева и справа.

Для поиска конформаций с определенными значениями спиральных параметров, например, с заданной длиной дуплекса, добавляется слагаемое Sw, включающее Kw ограничений на значения Щ суммы (разности) одноименных переменных \мц, wa.....W\n:

ч

= ± w¡2 ± ...± )-

¡=1 ,...,К„} - штрафные коэффициенты.

2.4 Вычисление градиента энергии.

В работе предложен эффективный способ организации вычислений энергии и )адиента энергии по информационным переменным, реализующий принципы острого дифференцирования (Ким К.В и др, Докл. АН СССР, 1984).), в результате вменения которого в программе вычислительные затраты на градиент по завнению с затратами на вычисление самой энергии (100%) составляют эимерно от 95% для 4-х пар до 65% для 20 пар.

Дополнительные возможности,

Возможны расчеты для фрагментов ДНК в пределах 2-3 витков спирали, аксимально возможное число конформационных переменных для дуплекса из )р оснований - (33 -6) без учета переменных для метильных групп, таким зразом, для 2 пар - 60, для 10 - 324, для 20 - 654. Каждая информационная зременная может быть выбрана в качестве независимой при минимизации или иксированной. На исследуемый фрагмент ДНК легко наложить условия шметрии для описания гомополимерных, чередующихся или палиндромных ¡следовательностей, приписывая одну и ту же независимую переменную ютветствующим одноименным информационным переменным.

Программа позволяет делать расчеты для олигонуклеотидов со свободными >нцами и для "бесконечной" ДНК, содержащей повторяющуюся юледовательность рассчитываемых фрагментов. В последнем случае требуется шпадение первой и последней пар для корректного задания граничных условий.

Процедура "сканирования" используется для построения зависимости шргии от значения одной или нескольких переменных. Для этого задается (личество выбранных переменных, и для каждой из них - величина пошагового ¡менения и коэффициент фиксации. Шаг сканирования включает изменение этих временных на заданные величины, "частичную" минимизацию, во время которой 1ачения выбранных переменных "слабо" фиксированы, т.е. соответствующие (мпоненты градиента уменьшены пропорционально коэффициенту фиксации, гот шаг повторяется заданное количество раз.

2.5 Структура программы.

Для работы программы CONAN требуется несколько входных файлов со 1ачениями параметров-констант, с описанием задачи и стартовыми значениями

переменных. В процессе работы программы создается несколько выходных файлов, в том числе файл для записи текущих значений конформационных переменных, который может использоваться для возобновления счета или для других задач, а также для компактной записи полученных структур.

подпрограмм общим объемом более 7.000 операторов. Программа написана на алгоритмическом языке FORTRAN-77, была реализована на ЭВМ ЕС 1061, Vax 3600 и компьютерах IBM PC.

ГЛАВА 3. Конформации дуплекса, содержащего пару 8-оксигуанин:аденин.

В этой главе представлены результаты поиска низкоэнергетических В-конформаций додекануклеотада d(C1-C2-A3-C4-T5-A6-OG7-T8-C9-A10-C11-С12)-d(G13-G14-T15-G16-А17-А18-T19-A20-G21-T22-G23-G24), содержащего

модифицированное основание 8-оксигуанин. Расчеты проведены для дуплексов с двумя возможными конфигурациями пары OG7:A18, отвечающими минимумам энергии пары с двумя Н-связям между основаниями: СЮ(сш):А ( дуплекс М*) и OG(aHTM)'A (дуплекс М), а также для "нативного" дуплекса, в котором QG7 заменен на Т7 (дуплекс N). Для указанного дуплекса имелись экспериментальные данные, полученные методом ЯМР и заданные в виде набора диапазонов межатомных расстояний (Kouchadjian etat, Biochemistry, 1991).

треугольник указывает МА модифицированную пару.

Описана методика получения конформаций для дуплексов М и М\ содержащих пары с модифицированными основаниями, которые отличаются размерами от уотсон-криковских. Анализ низкоэнергетических конформаций дуплексов М* и N приводит к заключению, что влияние модифицированного

снования распространяется и на основания, отстоящие от него на 2-3 пары. Для .уплекса М отличия более существенные. Конформации дуплексов М*, М и N редставлены на рис.3.

Таблица I. Межпротонные расстояния для конформации дуплексов М, М*, конформации А и пределы изменения расстояний по данным ЯМР.

Расстояние М М* А ЯМР

внутри пары OG:A

HN7(OG7)-H2(A18) 7.5 2.7 2.6 2.1-3.3

HN7(OG7)-HN6(A18) 4.9 2.6 3.4 2.5-3.7

HN7(OG7)-HN6(A18) 6.4 4.1 4.8 3.0-5.0

внутри нуклеотидов

Н'(А6)-Н8(А6) 3.9 3.9 3.8 3.3-4.7

Н"(А6)-Н8(А6) 3.4 4.4 3.2 2.6-4.0

Н'(А6)-Н2"(А6) 2.4 2.3 2.5 2.1-3.5

H1'(OG7)-H2'(OG7) 3.0 3.0 2.5 2.7-4.1

Н1'(Т8)-Н6(Т8) 3.7 3.7 3.7 3.3-4.7

Н2'{Т8)-Н8(Т8) 2.3 2.3 2.2 2.0-3.4

Н1'(Т8)-Н2"(Т8) 2.3 2.3 2.5 2.0-3.4

Н1'(А17)-Н2"(А17) 2.4 2.4 2.5 2.1-3.5

Н1'(А18)-Н8(А18) 3.9 3.9 3.9 3.7-5.1

Н2'(А18)-Н8(А18) 2.4 2.4 2.3 2.0-3.4

Н1'(А18)-Н2'(А18) 3.0 3.0 3.0 2.4-4.2

Н1'(А18)-Н2"(А18) 2.3 2.3 2.5 2.1-3.5

Н1'(Т19)-Н6(Т19) 3.7 3.7 3.7 3.0-4.4

Н2'(Т19)-Н6(Т19) 2.8 2.3 2.1 2.0-3.4

Н2"(Т19)-Н6(Т19) 4.2 3.8 3.3 2.5-3.9

Н1'(Т19)-Н2'(Т19) 3.0 3.0 3.0 2.4-3.8

Н1'(Т19)-Н2"(Т19) 2.3 2.3 2,5 2.0-3.3

между нуклеотидами

Н1'(Т5)-Н8(А6) 4.4 3.8 3.4 2.7-4.5

Н2'(Т5)-Н8(А6) 3.1 2.8 4.6 3.3-4.7

H1'(OG7)-CH3(T8) 5.1 5.7 4.8 2,7-4.7

H1'(G16)-H8(A17) 3.7 3.5 3.4 3.1-4.5

НГ(А18)-Н6(Т19) 3.6 3.5 3.3 3.4-4.8

Н2'(А18)-Н6(Т19) 3.3 3.6 4.4 3.0-4.4

Н8(А18)-СНЗ(Т19) 3.7 3.8 4.1 2.2-4.5

Н1'(Т19)-Н8(А20) 4.4 3.8 3.3 3.3-4.7

Н2'(Т19)-Н8(А20) 2.2 3.2 4.5 2.7-4.1

В Таблице I приведены межпротонные расстояния в центральной частидля йденных нами конформаций дуплексов М* и М, а также конформации А тлекса, уточненной в работе (Kouchadjian eí al, Biochemistry, 1991) средствами лекулярной динамики с ограничениями с помощью программы AMBER, в бледней колонке даны возможные пределы расстояний по данным ЯМР. нформация А имеет межпротонные расстояния, согласующиеся с данными ЯМР, зме расстояний Н2'(Т19) - Н8(А20) и Н1'(А18) - Н6(Т19). Однако, для найденной ии конформации М*, эти расстояния лежат в требуемых пределах. Расстояние

же, попавшие вне заданных диапазонов, могут быть приведены в них путем наложения соответствующих ограничений, за счет небольшого изменения потенциальной энергии (около 10 ккал/моль дуплексов), при этом ограничения на другие расстояния не нарушаются.

Межпротонные расстояния в паре Ов(анги):А не лежат в пределах, определенных методом ЯМР (см. Таблицу 1), поэтому такие конформации не могут соответствовать экспериментально наблюдаемой в растворе структуре, но могли бы реализоваться для данного дуплекса в других условиях или в других нуклеотидных последовательностях. Расчеты для ряда додекануклеотидов, отличающихся от указанного выше парами оснований, соседними с модифицированной, показали, что замены пар, соседних с СЮ:А, не изменяют существенно относительной выгодности конформаций с двумя типами пар Ов:А.

ГЛАВА 4. Конформационные возможности олигонуклеотидных дуплексов с чередующимися пурин-пиримидиновыми последовательностями.

4.1. В-семейство конформаций.

В этом разделе систематически исследован вопрос о том, какие В-конформации могут принимать фрагменты ДНК с чередующимися пурин-пиримидиновыми последовательностями. Рассматривались дуплексы длиной в 7 нуклеотидных пар: с1(ТАТАТАТ), дуплекс АТ, и с!(С6С6ССС), дуплекс вС. Переменные заданы с учетом динуклеотидной симметрии. Описана методика вычислений, особенностью которой является использование при минимизации энергии ограничений на значения суммы углов спирального вращения двух последовательных степов, (т1 + тг), или на их разность, (ц - т2). Для исследования конформационного пространства между минимумами применялась процедура сканирования, при этом значения переменных, наиболее отличающихся для двух минимумов, менялись на величины, пропорциональные разностям их значений, а по другим переменным проводилась минимизация.

Расчеты позволили выявить в пространстве конформационных переменных протяженную область (овраг) низкоэнергетических В-конформаций, различающихся соотношениями спиральных параметров пурин-пиримидинового и пиримидин-пуринового степов, а также конформациями сахарных колец (рис. 4):

2 m укт<0

а s ■о

а >

с

ic.4. Основные типы минимумов B-семейства конформаций для дуплексов AT и J. Стрелки, указывают направление уменьшения потенциальной энергии. Шкалы я псевдовращения для пиримидинов (слева) и пуринов (справа) знонаправлены. т- средний угол спирального значения, Дт=т(Пир-Пур)-т (Пур-ip) Ah=h(nnp-nyp)-h(nyp-rinp).

Выявлено 6 основных типов минимумов. Три пары минимумов различаются нформациями Сахаров:

1 и 1р, имеют сахара как пуринов, так и пиримидинов в области С2'-эндо1, 1 и 2р,имеют сахара пуринов в С2'- эндо, пиримидинов 01 '-эндо областях; I и Зр имеют сахара пуринов в 01'-эндо, пиримидинов в С2'-эндо областях.

Минимумы в каждой паре различаются относительными значениями углов трального вращения пиримидин-пуринового и пурин-пиримидинового степов, = т(Пир-Пур)-т{ Пур-Пир): 1т, 2т и Зт имеют Дт<0, тогда как 1р, 2р и Зр имеют >0.

В пределах каждого типа низкоэнергетических конформаций осматривались структуры с вариациями энергии до 0.5-0.7 ккал/моль :леотидных пар. Границы области являются весьма условными, можно несколько ¡личить диапазоны изменения Дт за счет деформации Сахаров, мы, как правило, ;сматривали конформации, в которых амплитуды псевдовращения Сахаров были ,иапазоне от 30 до 45°.

Трем парам минимумов соответствуют различные средние значения угла фального вращения (Рис. 4). Для минимумов 1-го типа характерно среднее мение угла спирального вращения, тср, в диапазоне 35-37°, что соответствует здним значениям для кристаллов олигонуклеотидных дуплексов в B-форме и i B-формы ДНК в поликристаллических волокнах. Для минимумов 2-го типа

характерно тср в диапазоне 33-35°, близкое к значениям для ДНК в растворе. Для 3-го типа минимумов характерно еще большее раскручивание спирали, до 32-33°. Еще одно различие между тремя парами минимумов проявляется в соотношениях расстояний между центрами пар вдоль оси спирали для двух типов степов, ДЬ=Ь(Пир-Пур)-Ь(Пур-Пир). При этом для минимумов 2 типа ДЬ<0, для минимумов 3-го типа ДЬ)>0, а для минимумов 1 -го типа Д1т£0.

Вычисления показывают, что переходы между минимумами: 1т 2т, 1р 2р, 1т о 1р, 2т 2р, Зт Зр, 1т о Зт, 1р о Зр, возможны без существенного изменения энергии. Хотя при движении между минимумами вдоль дна оврага практически не наблюдалось потенциальных барьеров, небольшие (на 0.2-0.3А или на 2°-3°) отклонения переменных в других направлениях могут приводить к существенному возрастанию энергии.

Для каждого типа минимумов возможно изменение в достаточно широких пределах переменной определяющей сдвиг центра пары относительно оси спирали. Можно представить, что схема на рис.4 представляет собой срез по с1х, -по мере увеличения или уменьшения с1х допустимые диапазоны других переменных могут изменяться.

Для обоих дуплексов минимумы типа 2т и Зр имеют больший диапазон возможных значений Дт, чем минимумы 2р и Зт (см. рис.4), причем увеличение разности Лт по абсолютной величине сопровождается понижением энергии, а также уменьшением фазового угла псевдовращения Сахаров пиримидинов (2т) или пуринов (Зр) в СЛ'-экзо (и далее в СЗ'-эндо) область.

Конформации с сахарами пиримидинов в 01 '-эндо области (2т и 2р) имеют более низкие значения энергии, чем конформации со всеми сахарами в С2'-эндо области (1т и 1р), примерно на 1-1.5 ккал/моль пар для дуплекса АТ и на 1.5-2 ккал/моль пар для дуплекса вС. Поэтому при минимизации без ограничений вероятность получить минимум 2-го типа больше, чем минимум 1-го типа. Минимумы Зт и Зр ( в пределах 01'-эндо областей) энергетически несколько менее выгодны по сравнению с минимумами 1-го типа для обоих дуплексов.

Было показано, что диапазоны изменения конформационных параметров и относительные значения энергии разных минимумов для дуплексов с)(АТАТАТА) и сЦвСОСССС) отличаются.

4.2. A-семейство конформаций.

При исследовании конформационных возможностей дуплексов d(TATATAT) и 3GCGCGC) были выявлены протяженные области низкоэнергетических А-нформаций, отличающиеся значениями разности углов спирального вращения римидин-пуринового и пурин-пиримидинового степов, Дт=т(Пир-Пур)-1(Пур-ip). В отличие от В-семейства диапазон возможного изменения Лт оказался льшим как для дуплекса АТ(-30 <Дт<15°), так и для дуплекса GC(-35 <Дт<15°), менение же конформаций Сахаров во всем диапазоне возможного изменения Дт значительно.

Для дуплекса GC при увеличении и уменьшении Дт средние спиральные эактеристики примерно постоянны. Для дуплекса АТ при больших значениях >0 происходит значительное увеличение среднего угла спирального вращения и зличение наклона пар вдоль длинной оси пары по отношению к оси спирали чти до 40°, а при изменении Дт<0 при некоторых значениях среднего расстояния жду парами происходит растяжение дуплекса вдоль оси спирали, и уменьшение <лона пар вплоть до отрицательных значений.

4.3 Структуры, промежуточные между А- и В- семействами.

В процессе исследования конформационных возможностей А- и В-семейств ли были получены структуры с конформациями Сахаров одного типа ;леотидов в С2'-эндо области, а другого - с низкими фазовыми углами в 1астях СЗ'-эндо и СА'-экзо. Для таких конформаций характерна связь с юделенным соотношением углов спирального вращения Дт (см. рис.4), формации с сахарами пуриннуклеотидов с малыми углами псевдовращения :50°) энергетически существенно более выгодны при Дт>0 (обозначим их S3), да как для конформаций с сахарами пиримидиннуклеотидов с низкими фазами, iee выгодно соотношение Дт<0 (S2). На рис. 5(а) и 5(6) представлены две такие ¡формации, на рис.6 указаны примерные области их расположения на фазовой 1СК0СТИ. Конформации S3 выгоднее, чем В-конформации, только для дуплекса (на 2 ккал/моль пар), тогда как конформации S2 (с пиримидинами в СЗ'-эндо) однее и для дуплекса GC (на 2 ккал/моль пар) и для дуплекса АТ (на 1.4-1.5 л/моль пар).

Нами были получены структуры еще одного типа (S4)- с сахарами как инов, так и пиримидинов в области ОV-эндо (рис.5(в)). Энергии дуплексов GC Т в этих конформациях оказались выше энергии минимумов с обоими сахарами

Рис.5. Низкоэнергетические конформации, промежуточные между В- и А-семействами. (а) конформация Э2 дуплекса вС, (б) конформация БЗ дуплекса АТ, (в) конформация Б4 дуплекса вС, (г) конформация 85 дуплекса АТ.

С2'-эндо примерно на 1 и 2 ккал/моль пар, соответственно. Конформации 4-го та характеризуются средним значением угла спирального вращения 28-30°, и сличенным диаметром спирали, с!х=2.3А; Такие структуры оказались ¡устойчивыми, при минимизации энергии переходят в В-конформации 2-го или го типа.

4.4. В-А переход.

Исследованы несколько возможных путей В - А перехода. В качестве артовых использовались В-конформации 1-го типа, а также конформации 52, вЗ Э4 (см. рис.6). Оказалось, что для В-А перехода достаточно изменения нформации сахароз обоих типов нуклеотидов одновременно или поочередно и менения параметра, определяющего сдвиг центра пар от оси спирали, с!х. При менении одного из указанных факторов переход получить не удается.

1. Используя в качестве стартовых структуры Э4, имеющие низкие значения :3 псевдовращения обоих типов Сахаров, Р<90°, для получения конформации А-чейства обоих дуплексов оказалось достаточным постепенно увеличить ачения йх до 3-3.5А и провести затем свободную минимизацию. Таким образом, \ переход можно осуществить в два этапа: переведя сахара в 01 '-эндо область юсле этого увеличив сдвиг центров пар от оси спирали, с)х.

2. Используя в качестве стартовых В-конформации 1т и 1р при постепенном ¡личении с1х и одновременном изменении торсионных углов Сахаров из С2'-эндо СЪ'-эндо область, наблюдали переход остальных параметров в области ачений, характерных для А-конформаций. Потенциальный барьер для обоих шексов не превышал 2-3 ккал/моль пар, максимальное значение энергии ггигается для дуплексов АТ и вС в разных точках области Э4.

3. Используя в качестве стартовых конформации Б2 и ЭЗ, имеющие один из аров с низким значением фазового угла, при постепенном изменении «ионных углов другого сахара в области, соответствующие низким фазам, и ювременном увеличении с!х, осуществили В-А переход через несколько ьший потенциальный барьер, чем в варианте 2.

При изменении только конформаций Сахаров, получаются структуры, аметры которых не полностью соответствуют А-форме, имея СЗ'-эндо сахара, I характеризуются малым или отрицательным наклоном длинной оси пар, а >ке большим расстоянием между парами вдоль оси спирали (область Б5 на .6). Дуплекс АТ в конформации Б5 изображен на рис.5(г).

Рис. 6. Возможные пути В-А перехода. На рис.б(а) по осям отложены фазовые углы Сахаров пуринов и пиримидинов (град). М - диагональ фазовой плоскости, на рис.6(6) она является горизонтальной осью (град). По вертикальной оси отложен параметр с!х(А), определяющий сдвиг центров пар от оси спирали. Стрелки с обозначениями Р, с1х и Р+ с!х демонстрируют изменения структур при изменении фазового угла Сахаров, Р, сдвига центров пар от оси спирали, с/х, или при их одновременном изменении.

19

ВЫВОДЫ

Разработана компьютерная программа CONAN для теоретического конформационного анализа олигонуклеотидных дуплексов с природными и модифицированными основаниями, позволяющая моделировать регулярные и нерегулярные дуплексы. Программа осуществляет поиск низкоэнергетических конформации в пространстве структурных переменных, описывающих взаимное положение пар оснований, оснований в паре, оснований и Сахаров и конформации Сахаров. Используемый алгоритм включает аналитическое замыкание циклов. Градиент энергии вычисляется методом быстрого дифференцирования, что позволяет осуществлять расчеты для длинных фрагментов ДНК (до 3 витков спирали) на доступных ЭВМ.

Расчеты низкоэнергетических конформаций дуплекса

d(CCACTAOGTCACC)d(GGTGAATAGTCC) с парой OG(ctw):A в двух конфигурациях показали, что экспериментальным данным ЯМР в растворе отвечает конформация с парой 00(син)'Л. Почти все межпротонные расстояния имеют значения, лежащие в пределах, определенных методом ЯМР, другие расстояния приводятся в требуемые пределы минимизацией с ограничениями.

Выявлено 6 типов минимумов B-семейства для дуплексов с чередующимися последовательностями (АрТ)п и (GpC)n, различающихся соотношениями спиральных параметров пурин-пиримидинового и пиримидин-пуринового степов и конформациями Сахаров двух типов нуклеотидов. Найдены соотношения между конформационными параметрами, которые выполняются при структурных изменениях внутри семейства. Часть описанных структур соответствует экспериментальным данным, другие пока не обнаружены.

Остановлено, что для А-семейства конформаций дуплексов с чередующимися последовательностями АрТ)п и (GpC)n существуют большие диапазоны изменения относительных значений углов спирального вращения двух степов. Зыявлены различия конформационных возможностей этих двух гаследовательностей.

1сследованы возможные пути изменения конформационных параметров при В-^ переходе, выявлены конформационные параметры, последовательное или |ДН0временн0в изменение которых приводит к В-А переходу.

6. Описаны низкоэнергетические структуры, имеющие значения одних параметров характерные для А-семейства, а других - для В-семейства конформаций.

Основные результаты диссертации опубликованы в следующих работах:

1. Нестерова Е.Н., Чуприна В.П., Курочкин А.В., Чернов Б.В., Брусков В.И., Кутышенко В.П., Полтев В.И., Пространственная структура симметричного аналога Сго-оператора фага А по данным ЯМР-спектроскопии и теоретического конформационного анализа, тезисы VII конференции по спектроскопии биополимеров, Харьков 1991г.

2. Nesterova E.N. and Chuprina V.P., An efficient method of calculating analytical derivatives for direct NOE refinement of Macromolecuiar Structures, J. Magn. Reson., 101B (1993), 94-96.

3. В.И. Полтев, В.П. Чуприна, Е.Н. Нестерова, Молекулярные механизмы мутаций, возникающих при образовании 8-оксигуанина в ДНК, Молек. Биол. 28 (1994) 1087-1097.

4. Nesterova E.N., Fedorov O.Yu. Poltev V.I., and Chuprina V.P., The Study of Possible A and В Conformations of Alternating DNA Using a New Program for Conformational Analysis of Duplexes (CONAN), J. Biomol. Struct. Dynamics 14 (1997), 459-474.

5. C.B. Филиппов, Е.Н. Нестерова, В.П. Чуприна, В.И. Полтев, Моделирование изменений конформации и стабильности двойной спирали ДНК при генотоксической модификации оснований. I. Низкоэнергетические конформации нативного дуплекса. Молек. Биол. 30 (1997) 1100-1115.

6. Е.Н. Нестерова, В.П. Чуприна, В.И. Полтев, Возможные В-конформации фрагментов ДНК с чередующимися пурин-пиримидиновыми последовательностями, Молек. Биол. 31, No.3 (1998) ( в печати).