Бесплатный автореферат и диссертация по биологии на тему
Статистические потенциалы атомарной гидратации биополимеров
ВАК РФ 03.00.03, Молекулярная биология

Автореферат диссертации по теме "Статистические потенциалы атомарной гидратации биополимеров"

На правах рукописи

00345424(

РАХМАНОВ СЕРГЕЙ ВИКТОРОВИЧ

СТАТИСТИЧЕСКИЕ ПОТЕНЦИАЛЫ АТОМАРНОЙ ГИДРАТАЦИИ БИОПОЛИМЕРОВ

03.00.03 - молекулярная биология

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата биологических наук

О 5 ДЕК 2008

Москва - 2008

003454247

Работа выполнена в лаборатории биоинформатики ФГУП «Государственный научно-исследовательский институт генетики и селекции промышленных микроорганизмов (ФГУП «ГосНИИгенетика»),

Научный руководитель:

кандидат физико-математических наук Макеев Всеволод Юрьевич, ФГУП «ГосНИИ генетики и селекции промышленных микроорганизмов», г. Москва.

Официальные оппоненты:

Ведущая организация:

доктор биологических наук, профессор Карягина-Жулина Анна Станиславовна,

ГУ НИИ Эпидемиологии и микробиологии и\ почетного академика Н.Ф Гамалеи РАМН. г. Москва.

кандидат физико-математических наук Ройтберг Михаил Абрамович, Зав. лабораторией ИМПБ РАН

ГУ НИИ Биомедицинской химии им. В Н Ореховича РАМН, г. Москва

Защита состоится 16 декабря 2008 г. в 14 часов на заседании Диссертационного совета Д.217.013.01 при Государственном научно-исследовательском институте генетики и селекции промышленных микроорганизмов по адресу: 117545, Москва, 1-й Дорожный проезд, 1.

С диссертацией можно ознакомиться в библиотеке ФГУП «ГосНИИ генетика» Автореферат разослан «_»_ 200_г.

Учёный секретарь диссертационного совета, кандидат биологических наук

Г.Г. Заиграева

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность проблемы. Изучение гидратации макромолекул биополимеров -белков и нуклеиновых кислот - необходимо для понимания механизмов функционирования этих молекул. Одним из путей решения этой задачи является вычислительное моделирование внутримолекулярных взаимодействий.

В виду практической невозможности провести прямое моделирование межатомных взаимодействия в макромолекулах, основываясь непосредственно на физических законах, основные усилия исследователей в этой области направлены на создание упрощенных эмпирических математических моделей взаимодействия атомов Одним из классов моделей такого рода являются статистические модели взаимодействий, также часто называемые моделями, основанными на знаниях; при их построении производится статистическая обработка данных по большим количествам экспериментально определённых трехмерных структурах биополимеров При этом большое значение имеет нулевая гипотеза, на которой базируется статистическая обработка этих экспериментальных данных. В качестве таковой выстуает так называемое референсное состояние макромолекулы, в котором межатомные взаимодействия "выключаются" Ожидаемое распределение статистических параметров (в нашем случае межатомных расстояний) для такого референсного состояния используется для оценки интенсивности реальных межатомных взаимодействий.

В то время как основные усилия исследователей в последние десятилетия были в основном направлены на изучение взаимодействия собственно молекул биополимеров и составляющих их атомов между собой, описание функционирования белков и нуклеиновых кислот в водной среде оставалось сравнительно менее разработанной областью, несмотря на определяющую роль воды в определении укладки в и взаимодействия большинства биологических макромолекул

В то же время успехи в описании белковой сольватации могут быть использованы для решения ряда прикладных задач, в частности предсказание расположения связанной воды вокруг белков. Знание местоположения молекул связанной воды позволяет повысить качество построения интерфейсов белковых молекул в задачах оценки взаимодействия белков с другими белками, нуклеиновыми кислотами, малыми молекулами и лигандами, а также другими макромолекулами.

Кроме того, определяющая роль гидратации в формировании пространственной структуры белка позволяет использовать статистические модели относительно взаимодействия атомов белка с молекулами воды для выделения правильной укладки

белка среди множества неправильных вариантов укладки Такая задача возникает в ряде алгоритмов моделирования пространственных структур белков, т.е. так называемой задачи моделирования фолдинга.

Цель и задачи работы.

При построении статистических моделей межатомных взаимодействий основные трудности заключаются в построении т.н. референсных, или невзаимодействующих состояний, те. состояний с нулевой энергией взаимодействия (СНЭВ), характеризующих ожидаемое распределение контактных частот в случае "выключенных внутримолекулярных взаимодействий". Имея в руках удачное СНЭВ, можно достаточно однозначно построить эмпирические потенциалы межатомного взаимодействия. В настоящей работе для построения СНЭВ предложено использовать метод стохастического моделирования, также называемый методом Монте-Карло.

1. Разработка алгоритма построения СНЭВ с помощью метода Монте-Карло для получения СНЭВМК (состояний с нулевой энергией взаимодействий, полученных методом Монте-Карло).

2. Программное воплощение и проверка метода СНЭВМК применительно к различным структурам белков и нуклеиновых кислот.

3. Получение с помощью СНЭВМК потенциалов атомарной гидратации (ПАР) белков и нуклеиновых кислот, основанных на статистике парного взаимодействия различных атомов с молекулами воды в 1776 трехмерных структурах обучающей выборки.

4. Проверка ПАГ в тестах по предсказанию расположения связанной воды в трёхмерных структурах белков

5. Использование ПАГ для распознавания нативной укладки белков среди множества альтернативных неправильно уложенных структур - декоев

Научная новизна и практическая значимость работы.

• Разработан принципиально новый способ задания невзаимодействующих состояний в статистико-механических атомных ансамблях - СНЭВМК Этот способ учитывает размер и форму пространственной структуры, мономерный состав, число и распределение контактирующих атомов, и позволяет получать распределения ожидаемых межатомных контактных расстояний с любой требуемой точностью, на

неограниченном диапазоне контактных расстояний.

• Впервые для статистических межатомных потенциалов создан способ детального количественного исследования атомарного отталкивания на малых расстояниях, сравнимых и меньших, чем Ван дер Ваальсовские радиусы атомов.

• Впервые получены потенциалы атомарной гидрагации (ПАГ) белков и нуклеиновых кислот, основанные на статистиках парных взаимодействий различных атомов с молекулами воды в 1776 трехмерных структурах обучающей выборки.

• Показана способность ПАГ предсказывать, с высокой точностью, расположение связанной воды в белках и белковых комплексах.

• Показана возможность, при помощи вычисления энергии сольватации с использованием ПАГ, различать нативную укладку белка, среди множества неправильно уложенных структур-обманок (декоев)

• Разработан широкий программный инструментарий для количественного анализа белковой сольватации, на уровне отдельных атомов и аминокислот, для визуализации результатов, применяемый при создании новых лекарственных средств и термостабильных форм ферментов.

Апробация работы. Диссертационная работа была представлена на заседании секции молекулярной биологии Ученого Совета ФГУП «ГосНИИ Генетика» 14 марта 2008 г. Материалы исследований по теме диссертации докладывались на межлабораторных семинарах в ГосНИИГенетики (2001-2008), МГУ, ИБХ, СПБГУ, ИМПБ; на международных конференциях и школах BGRS'2004 (Bioinformatics of Genome Regulation and Structure, Новосибирск, Россия), MCCMB'05, (Moscow Conference on Computational and Molecular Bilogy Москва, Россия), FEBS-2006 (31st Congress of the Federation of European Biochemical Societies, Istanbul, Turkey), MCCMB'07, (Moscow Conference on Computational and Molecular Bilogy Москва, Россия), Ence-2008 (40th International Course m Erice, Italy - From Molecules To Medicine: Integrating Crystallography In Drug Discovery).

Публикации. По материалам диссертации опубликовано 10 печатных работ, включая три статьи, а также материалы докладов научных конференций.

Структура диссертации. Диссертационная работа изложена на 91 странице машинописного текста и состоит из трех основных разделов: введение, с обзором литературы, результаты и обсуждение, и выводов Раздел «Результаты и обсуждение» состоит из четырех глав, каждая из которых начинается с краткого резюме и содержит описание выполненных автором исследований, изложение полученных результатов и их

обсуждение. Список литературы, приведенный в конце диссертации, содержит 82 наименования. Работа содержит 23 рисунка и 3 таблицы

СОДЕРЖАНИЕ РАБОТЫ

Введение и обзор литературы. Содержит мотивировку поставленных задач, а также аналитический обзор современной литературы по проблемам, рассмотренным в диссертации.

Результаты и обсуждение.

Глава I. Построение распределений ожидаемых плотностей вероятности атомарной гидратации трёхмерных структур белков.

Для построения атомных контактных потенциалов, необходимо получить ожидаемые плотности вероятности межатомтшх контактов на разных расстояниях, п данном случае — контактов с белок-связанными молекулами воды.

В общепринятой формуле для вычисления статистических потенциалов (1),

здесь значение^хрМ) представляет собой ожидаемую частоту контактов между рассматриваемой парой атомов типов а и Ь на расстоянии d в так называемом референсном состоянии, т.е. виртуальном состоянии с нулевой энергией взаимодействия (СНЭВ) между атомами данных типов. Наблюдаемая частота контактов fBbS(d) определяется непосредственно из измеряемой статистики контактов атомов имеющихся типов в базе данных трехмерных структур

Для построения СНЭВ был предложен метод (Rahmanov and Makeev 2004), использующий технику Монте Карло, получивший название СНЭВМК В качестве невзаимодействующих элементов в нем используются точки со случайными координатами насыщающие все структурное пространство макромолекулы. Благодаря возможности использовать неограниченное число случайных проб, достигается любая заданная степень точности при вычислении ожидаемых плотностей вероятности парных контактов для любых атомов данной структуры Также, при нормировке на число случайных точек, естественным образом учитывается размер и форма белковой структуры, а также число и расположение изучаемых контактирующих элементов. Поскольку случайные точки могут располагаться на сколь угодно малых расстояниях от любых элементов структуры, они могут быть использованы для детального

(1)

количественного исследования атомарного огталкнвания на малых расстояниях и расстояниях, сравнимых с ван дер Ваальсовскими радиусами атомов Это позволило поднять детальность (уменьшить шаг гистограммы) при построении статистических потенциалов на один-два порядка, по сравнению с ранее существующими методами

Глава II. Получение потенциалов гидратации белковых и ДНК атомов разных типов, из статистики их контактных расстояний с водой в обучающей выборке экспериментально полученных пространственных структур.

Мы применили метод СНЭВМК для построения потенциалов гидратации электронно-плотных (неводородных) белковых и нуклеиново-кислотных атомов различных типов, на основе статистики их непосредственных контактов с кристаллографически определенными молекулами структурной воды (Rahmanov and Makeev 2006).

В качестве обучающей выборки была использована база данных из 1776 макромолекулярных (преимущественно белковых) трехмерных структур высокого разрешения, с низкой (не более 25%) парной гомологией (Hobohm and Sander 1994).

Было введено ограничение на величину парной гомологии (по последовательности) между любыми двумя структурами, входящими в обучающую выборку, необходимое для того, чтобы близкие белки, представленные большим числом копий, не искажали среднюю картину атомных взаимодействий, внося в нее особенности, характерные для сильно представленных семейств.

Для каждой струкутры из обучающей выборки, для всех молекул структурной воды, производилась пре-фильтрация по следующему алгоритму: в соответствии с приведенными в тексте файла структуры операторами пространственных трансформаций симметрии, генерировались симметричные положения молекул воды, принадлежащие соседним ячейкам кристаллографирования. В тех случаях, когда новое положение молекулы оказывалось ближе к белковой части исходной структуры (но при этом без перекрывания ван дер Ваальсовских радиусов атомов), происходило добавление воды в новое положение, с одновременным удалением из исходного. Необходимость данной процедуры объясняется тем, что довольно часто, в рентгеноскопированных структурах наблюдаются изолированные молекулы воды, отстоящие от макромолекулы на 10 ангстрем и более. Иногда, оказывается, что эти молекулы воды связаны с белком из соседней кристаллографической ячейки, в таких случаях вышеописанная процедура приводила к изменению положения соответствующих молекул относительно основной

белковой структуры Когда же вода в итоге не оказывалась ближе к белку, чем пороговое значение (обычно 4.5 ангстрема), она не использовалась в дальнейших вычислениях.

Для каждого типа атомов, из каждой структуры обучающей выборки, вычислялись и сохранялись расстояния до всех атомов кислорода молекул воды, указанных в .pdb-файле структуры. Типы атомов в данной работе определялись с учетом как химической природы, так и группы происхождения. Таким образом, CA_VaI обозначает Са-атом валина, отличный как от Ср-атома валина, так и, например, от Са-атома тирозина.

Сохраненные контактные расстояния от атомов всех имеющихся типов (за исключением атомов водорода, имеющих очень маленькую электронную плотность, и с трудом определяемых на кристаллограммах белков), до воды, нормализовывались путем деления на ранее определенные величиныfexf(d) (см. формулу 1).

После нормировки на число атомов данного типа, получающееся в результате описанной процедуры значения распределения нормированного отношения правдоподобия, как и следовало ожидать, колеблются в районе единицы на больших расстояниях, где взаимодействие практически отсутствует (см. рисунок 1)

На рисунке 1 приведены нормированные отношения правдоподобия для вазимодеяствия молекул связанной воды в белках между собой Они показывают плотность распределения частот наблюдения атомов кислорода молекул воды в зависимо ;ти от расстояния между ними, относительно аналогичного среднего распределения плотности встречаемости атомов кислорода молекул воды вокруг случайной точки в пространстве структуры Нормированное отношение правдоподобия на рис. 1 отражает, каким образом молекула связанной воды в белке в среднем влияет вокруг себя на плотность других молекул связанной с белком воды. Значения кривой выше единицы означают положительные контактные предпочтения (вероятности образования пар молекул воды на данном расстоянии), и наоборот. Приведённая на рисунке 1 аналогичная величина для жидкой воды общепринято носит обозначение gOO(r), или кислородно-кислородное радиальное распределение плотности, и может быть извлечена путём анализа экспериментальных данных о дифракции рентгеновских лучей либо измерений рассеяния нейтронных пучков (Head-Gordon and Hura 2002).

Рисунок 1. Нормированные отношения правдоподобия для взаимодействия атомов кислорода двух соседних молекул связанной воды в белковых кристаллах («водно-водный показатель контактных предпочтений»), вычисленный на основе статистики 54356851 парных контактов между 319024 молекул воды в структурах обучающей выборки. Нижняя кривая соответствует радиальной функции плотности водно-водных контактов (по кислородному атому) в жидкой воде, полученной экспериметально в работе (Head-Gordon and Hura 2002).

Полученная нами кривая усреднённой радиальной функции распределения близко повторяет расположение и относительные величины пиков функции gOO(r). Более высокие уровни распределения плотности водных контактов в кристаллах белков, по-видимому, связаны с наличием исключённого для воды объёма, занятого атомами белка, и с кластеризацией молекул воды преимущественно на поверхности белковой глобулы.

Наблюдаемые три пика контактной плотности при 2.75 А, 4.5 А и ~7 А отражают слои стр> ктурированной воды, также детектируемые в жидкой воде и во льду. Представляется заслуживаемым обсуждения тот факт, что до сих пор было распространено представление о характере водно-водных взаимодействий в окрестности белков, существенно отличном от классического, наблюдаемого в чистой воде (Makarov and Pettitt 2000). Наши данные (рис. 1) однозначно опровергают это представление.

ПА)

г(А)

Рисунок 2. Нормированные отношения правдоподобия атомарной гидратации для некоторых белковых кислородных (а) и углеродных (Ь) атомов.

На рисунке 2 показаны примеры нормированных отношений правдоподобия и потенциалов атомарной гидратации для нескольких типов белковых атомов. Примени' ельно к рис. 2(Ь) стоит особо отметить наблюдаемый для СО_Азр, углерода в гамма-положении боковой цепи аспартата, сдвиг первого пика потенциала в сторону меньших контактных расстояний, - как вершины, так и фронта. Проявленная в данном случае нехарактерная для атома углерода гидрофильность объясняется тем, что СО_Азр несёт частичный положительный заряд, вследствие оттягивания электронной плотности на сильно электроотрицательные кислородные атомы карбоксильной группы. Благодаря использованию СНЭВМК, количественные характеристики амфифильности всех типов тяжёлых атомов белков были впервые охарактеризованы с высокой детальностью и на всём диапазоне контактных расстояний, включая суб-ван-дер-Ваальсовские.

Рисунок 3. Нормированные отношения правдоподобия атомарной гидратации пар симметричных атомов углерода ароматических боковых цепей тирозина и фенилаланина.

Две пары симметричных атомов углерода ароматических боковых цепей тирозина и фенилаланина на рис. 3 представляют собой своего рода природный тест на величину статистической погрешности статистических потенциалов межатомного взаимодействия в белках: располагающиеся в симметричных положениях, химически идентичные атомы углерода находятся в неотличимом окружении. Атомы каждой пары находятся достаточно далеко друг от друга, чтобы иметь независимую статистику парных контактов с молекулами воды. При этом нет никаких физических причин для того, чтобы они имели различающиеся контактные потенциалы атомарной гидратации. Таким образом, все

2

т

о о

со

г(А)

различия должны быть обусловлены статистической погрешностью процедуры, вследствие, например, ограниченного размера обучающей выборки и т.п. Видно, что их потенциалы, как и следовало ожидать, мало отличаются друг от друга, при этом значимые компоненты потенциала отчетливы на фоне статистических флуктуаций, вызванных погрешнсстью метода.

Глава III. Тестирование полученных потенциалов атомной гидратации в задачах предсказания расположения связанной воды в белках.

Применимость полученных потенциалов атомарной гидратации была проверена на нескольких практически значимых задачах, первая из которых - задача предсказания расположения молекул связанной (структурной) воды в белках Нами было показано (Rahmanov and Makeev 2006), что полученные при помощи метода СНЭВМК статистические атомные потенциалы гидратации белков позволяют в несколько раз более точно предсказывать расположение молекул связанной воды в белках, нежели существу ощие методы, такие как молекулярная динамика и др. Это достигается при во много раз меньшем уровне пере-предсказания, и при этом требует значительно меньших вычислительных ресурсов, чем при использовании альтернативных методов.

Учет индивидуальных молекул воды часто очень важен для анализа функции белка (Garczarek and Gerwert 2006). Специфическим образом связанные со структурой молекулы воды часто опосредуют взаимодействия макромолекул друг сдругом и с малыми молекулами, включая лиганды - фармакологические агенты (Schneider et al 1995) Известны случаи, когда вытеснение единственной молекулы воды из белок-пептидного интерфейса, вследствие мутации предназначенной увеличить аффинность комплекса, приводило наоборот, к её падению на два порядка. Особенную актуальность задача предсказания расположения индивидуальных молекул воды приобретает в связи с тем, что альтернативные методы моделирования макромолекулярной сольватации, такие, как вычисления переменного диэлектрического континуума путем решения уравнений Пуассона-Боцмана, не позволяют уверенно предсказывать участки гидратации.

Задача определения мест расположения связанной воды в белках решается в несколько этапов На первом, происходит заполнение пространства гидратационпой оболочки макромолекулы мелкоячеистой сеткой (с шагом -0.1 - 0 4 ангстрема, в зависимости от потребности текущей задачи) из точек-проб, располагающихся в узлах. Гидратационная оболочка определяется здесь как область пространства, все точки которой отстоят от любого из атомов макромолекулы не ближе, чем 2 ангетрема, и не дальше, чем 4 5 ангстрема от хотя бы одного из атомов, принадлежащих структуре. Затем,

для всех узлов полученной сетки, вычисляется локальная энергия гидратации, как сумма вкладов - энергий I идратации, от всех близлежащих атомов макромолекулы На следующем этапе происходит определение подмножества проб, являющихся локальными минимумами гидрагационной энергии, в некотором заданном объеме. Использовалось значение 1.4 ангстрема, т е половина ван дер Ваальсовского расстояния между соседними атомами кислорода воды. Необходимость данного эгапа обусловлена тем, что для ускорения вычислений, необходимо уменьшить число рассмагриваемых далее проб, за счет наименее вероятных участков гидратации, которьми являются гочки с большей оцененной энергией гидратации На следующем, конечном, этапе, происходит уточнение расположения локальных минимумов энергии, за несколько шагов вычислений, по методу сопряженных градиентов, т е. путем последовательных сходящихся итераций блуждания проб в трехмерном пространстве структуры. На каждом шаге, происходит смещение проб в положения, соответствующие меньшим (более оптимальным) значениям оценки свободпой гидратации в данной точке. Эта процедура попеременно выполняется либо вдоль линий, соединяющих соседние пробы, обсчитанные на предыдущем шаге (способ сопряжённых градиентов), либо с использованием случайных точек, сгенерированных в заданной малой окрестности каждого локального минимума гидратационной энергии. В первом случае, смещение происходит по пространственному градиенту энергии, вдоль отрезка, соединяющего две близлежащие пробы, на расстояние, пропорциональное различию в их энергии Новая точка, в которой будет произведена оценка энергии гидратации в контексте окружающей белковой структуры, делит отрезок между двумя соседними пробами, на части, соотносящиеся между собой, как отношение между отклонениями энергии в каждой из вершин отрезка, от текущего среднего значения энергии для всех проб Во втором случае (с использованием случайных проб в окрестности локального минимума), симулируется процедура т н отжига, направленная на избегание «чересчур локальных» минимумов, на достижение действительных полных локальнь х минимов энергии.

Следует отметить, что исполняемая на данном этапе итеративная процедура является, во-первых, быстро сходящейся (к исчезающее малым смещениям положений локальных минимумов энергии), и, во-вторых, устойчивой к отклонениям как начальных параметров (положений проб и т п), так и деталей самой процедуры (величины шага покрытия гидратационной оболочки и т.д.).

Предсказания участков расположения связанной воды были получены для 16 белковых структур, для некоторых из которых были ранее сделаны аналогичные

предсказания, с использованием других методов (van Gunsteren, Berendsen et al. 1983), (Henchman and McCammon 2002), (Gelpi et al 2001), (Marrone, Resat et al. 1998).

Эмпирически обнаружено, что в среднем при использовании количества проб, равного числу молекул воды в моделируемой структуре, достаточно хорошо (с ошибкой не более 1.4 ангстрема, т.е. половины расстояния между двумя соседними молекулами воды) воспроизводятся примерно 50% сайтов связанной воды в белках. При использовании вдвое большего количества проб, этот параметр возрастает в среднем до 70-90%. Таким образом, уровень перепредсказания при предсказании сайтов гидратации в белках, в этой работе в среднем равен двум, что существенно (порой в десятки раз) ниже, чем в других опубликованных исследованиях.

Сводная таблица, объединяющая результаты предсказания участков гидратации -мест расположения связанной воды в белке, для 1 б структур различных белков, экспериментально полученных с высоким разрешением координат водной и белковой части, приведены в Таблице 1.

Таблица 1. Результаты предсказания участков гидратации - мест расположения

связанной воды в белке, для 16 различных белковых структур.

Белок Амино- Сайтов гидратации Среднее RMSD

## PDBID кислот эксперимент предсказан. предсказаний Z-score

1 1AJJ 37 30 60 1.02 6.97

2 1ЕСА 136 94 188 1.72 4.72

3 1ENH 54 33 66 0.87 5.36

4 1FFO 202 122 244 0.91 9.18

5 1IRD 287 325 650 1.44 2.69

6 1KR7 110 106 212 0.86 9.60

7 1МАА 540 187 374 1.32 5.41

8 1MOF 53 39 78 0.90 7.34

9 1SBX 103 79 158 0.86 10.41

10 1UOY 64 126 252 1.03 7.73

11 4МТ2 62 69 138 1.35 4.48

12 5PTI 58 63 126 1 07 8.53

13 1IFC 131 206 412 1 49 6.15

14 2РТН 193 175 350 1.68 5.91

15 ЗЕВХ 62 82 164 1 58 4.52

16 4PTI 58 57 114 1.29 7.28

Для оценки качества предсказания был взят Z-критерий (Z-score), вычисляемый следуют ш образом:

г = (RMSDnmdom - RMSDpred,aed) / SnuidoTi,

где RMSDpredlctcd- это квадратный корень из среднего квадратичного отклонения (root mean square deviation) между предсказанными положениями сайтов гидратации, и определенными экспериментально. RMSDrandc>m- аналогичная величина, вычисленная несколько раз и усредненная, для равного числа случайных проб в объеме данной структуры, с наложенными стерическими ограничениями, эквивалентными тем, которые действуют на экспериментально определенные участки гидратации в данной структуре srandom - величина разброса (дисперсии) отклонений положений случайных проб от равного числа экспериментальных точек гидратации, полученная в вычислительном эксперименте с использованием техники Монте Карло, и также усредненная для нескольких симуляционных прогонов

Глава IV. Тестирование полученных потенциалов атомной гидратации в задачах распознавания натнвнон укладки белка среди множества альтернативных неправильно уложенных структур.

Проблема проверки математических моделей трёхмерной полипептидной структуры требует набора стандартных тестов, которые бы позволили сравнивать результаты предсказания укладки с использованием различных методов Распространенным тестом для алгоритмов, моделирующих укладку белков, является задача нахождения нативной, экспериментально определённой конформации, среди множества искусственно полученных неправильных структур-«обманок» (decoys). В открытом доступе в интернете находятся несколько наборов белковых структур такого рода, в англоязычной научной литературе носящих название decoy sets, созданных разными группами авторов Тот факт, что водная среда играет определяющую роль в укладке и стабилизации структуры большинства белков, позволил нам применить атомарные потенциалы гидратации белков для анализа вариантов укладки полилептидной цепи и предсказания нативных конформации.

Данный тест, т е вычисление полной сольватационной энергии структуры, является наиболее естественным применением полученных потенциалов. Важность этой задачи сложно переоценить Достаточно сказать, что без её решения невозможно адекватное моделирование укладки и функционирования трёхмерной структуры белка, его

взаимодействия с другими молекулами клетки Тот факт, что по некоторым данным до 90% свободной энергии, стабилизирующей нативную конформацию большинства глобулярных белков, обеспечивается гидрофобными взаимодействиями (Makarov, Andrews et al 2000), (Li X, Liang 2006), говорит о важности методов определения этой энергии.

Применяя потенциалы гидратации белков к задаче распознавания нативной укладки белка, мы использовали наиболее простой критерий средней энергии гидратационной оболочки вокруг структуры. Гидратационная оболочка определяется нами как область пространства вокруг и внутри структуры, все точки которой лежат не далее 4.5 ангстрем и не ближе 2.5 ангстрем от любого не-водородного атома белка. Доля точек, падающих внутрь области ГО, от общего количества проб, сгенерированных в прямоугольнике, описывающем белок (плюс 4.5 ангстрема со всех сторон), позволяет приблизительно определить объем сложной формы ГО. Сольватационная энергия в каждой точке вычислялась так же, как и в предыдущих разделах, т е как сумма вкладов энергий от всех близлежащих атомов белка

Основной набор структур-«обманок», использованный для тестирования - это "Improved Rosetta decoy set" (Tsai, Baker et al 2003), является общепризнанно сложным тестом, в связи с большим количеством декоев (в среднем около 1800) для каждой нативной структуры, и повышенной частотой структур-обманок с высоким сходством с нативной структурой.

Полученные нами результаты различения нативных струтур при помощи вычисления свободной энергии сольватации структуры, приведены в таблице 2.

Таблица 2. Распознавание нативной укладки белка среди множества структур-обманок, при помощи вычислении полной энергии гидратации структуры, с использованием набора структур «КоэеИа».

Код Средняя энергия гидратации Отличие Ранг

# PDB структуры, кТ нативной нативной

структуры нативная декой структуры, AG, структуры,

Z-крит. %

1 Ires -11.30 -9.63 5.10 100

2 lptq -10.21 -9.70 0 68 74

3 luxd -10 04 -8 27 5 08 100

4 2pdd -8 68 -8 73 0.04 51

5 luba -9.01 -8 28 1 24 88

6 lgab -7.71 -5 98 3 25 100

7 1 vif -10.05 -8.70 2 37 98.5

8 lbq9 -10.22 -8.01 3 55 100

9 5pti -11.12 -8 31 4 70 100

10 laa3 -9.94 -7.76 3.78 100

11 lbw6 -7 962 -7.564 0 80 79

12 lore -8.944 -9 693 -1 04 15

13 lam3 -10.857 -9126 3.67 100

14 lpgx -10.211 -8 262 3.40 100

15 ltif -10 283 -8.416 3.33 100

16 lmsi -12 712 -10 401 3.69 100

17 2ptl -10 982 -7.708 6 89 100

18 lr69 -10316 -7.670 4.69 100

19 ltuc -10.564 -8 614 2.28 100

20 Idol -10 890 -8.611 3 68 100

21 lutg -7 998 -7.792 0.42 67

22 lesp -11.524 -8 227 4.30 100

23 la32 -9 844 -10 077 -0.50 28

24 2ezh -11.496 -9.431 3.74 100

25 Inre -8 198 -7 288 1.92 97

26 lsro -11.319 -9.443 2.85 99.5

27 2fow -9.442 -7.466 5.24 100

28 lail -10.957 -10 734 0.38 63

29 Ictf -8.758 -7 123 3 30 100

30 llfb -9.387 -7.908 3.18 100

31 Inkl -11 289 -10 048 221 99

32 lpou -11.890 -9 495 4.40 100

33 lmzra -12.126 -9.837 4.93 100

34 lafi -10 691 -9.655 2 28 99.5

35 5icb -9.006 -6 895 5 80 100

36 lkjs -10.521 -9.063 2 90 100

37 lhyp -14.662 -12.513 2.63 98.5

38 1сс5 -10.227 -9 895 0.64 77

39 1УСС -13.279 -11.533 2.71 100

40 2fxb -11.126 -8 699 4.37 100

41 1се1 -9.810 -9.589 0.43 65

Пятый столбец в Таблице 2 приводит различие в энергии гидратации между нативной структурой и средним для структур-обманок по Z-кpитepиIO (см. ниже) Последний столбец содержит величины доли декоев с оценкой свободной энергии выше (менее оптимальной) чем нативная структура.

Для оценки качества предсказания был, как и ранее, использован ¿-критерий, вычисляемый как:

2 ~ (Е&соу ~ Епа^уе) / ®с!ссоу,

где Ейесоу - это вычисленная средняя энергия сольватации для набора декоев, Епацус -энергия нашвной структуры, в^оу - величина разброса (дисперсии) энергий декоев

• Из таблицы 2 видно, что применение ПАГ позволяет различать нативную структуру белков среди множества структур-обманок. Для 26 из 41 структур из набора декоев «ЯозеПа», нативная структура оказалась абсолютно лучшей по оцененной средней энергии сольватации. Такие показатели дискриминации находятся на уровне лучших опубликованных систем моделирования структур белков. Полученный результат достигнут даже без учета внутренних взаимодействий в белковой макромолекуле, только за счёт оценки энергии взаимодействия белка с водой. Среди тех нативных структур, которые не были распознаны при помощи ПАГ в данном тесте, большинство заведомо не годятся для применения ПАГ. Так, например, белок lutg имеет форму полусферы, вогнутая внутренняя поверхность которой образована практически полностью гидрофобными аминокислотами. Представляется невероятным, чтобы подобная структура могла существовать как нативная в водной среде В действительности, существует в виде димера, в котором гидрофобные стороны плотно состыкованы. Другая нераспознанная структура, рибосомальный белок 1а32, представляет собой некомпактную, штопорообразную структуру, очевидно стабилизируемую в первую очередь контактами с множеством других рибосомальных белков и РНК, а не с растворителем.

Успешное использование ПАГ для выделения правильной конформации полипептида среди множества неправильных конформаций, предполагает, что различные варианты укладки белка, могут быть количественно проранжированы При этом каждой

конформации, схожей с нативной, сопоставляется некоторая вероятность её возникно зения, что в некоторых случаях может быть проинтерпретировано, как доля времени которую данный полипептид проводит в рамках данной конформации Полученные результаты позволяют надеяться, в перспективе, на построение динамической модели белковой структуры, в том числе и описывающей её взаимодействие с другими макромолекулами и малыми молекулами клетки.

выводы.

1. Разработан программный комплекс для анализа водной сольватации биологических макромолекул на основе вычисления свободной энергии атомарной гидратации.

2. Разработан метод стохастического моделирования для построения состояния невзаимодействующих атомов при определении статистических потенциалов межатомного взаимодействия

3. При помощи нового метода получены потенциалы атомной гидратации белковых макромолекул, обладающие высокой разрешающей способностью и широким контактным диапазоном.

4. Продемонстрирована возможность использования потенциалов гидратации для предсказания расположения связанной воды в белках.

5. Продемонстрирована эффективность использования полученных потенциалов для распознавания нативной укладки белка среди набора альтернативных конформаций.

СПИСОК РАБОТ, ОПУБЛИКОВАННЫХ ПО ТЕМЕ ДИССЕРТАЦИИ.

Статьи в научных журналах1

1. С.В. Рахманов и В Ю Макеев. Использование невзаимодействующих проб в пространстве белковой структуры для построения статистических потенциалов межатомного взаимодействиях Биофизика, 2008, том 53, вып 3, с. 389-396.

2. Rakhmanov S V , Makeev V.J Atomic hydration potentials using a Monte Carlo Reference State (MCRS) for protein solvation modeling BMC Structural Biology 2007, 7.19.

3. S.V. Rahmanov, V.J Makeev. Atomic hydration potentials using Monte Carlo reference state advance protein solvation modeling. FEBS Journal 2006,273 (si), 62-64.

Материалы научных конференций

1. Modeling of protein crystal hydration in topologically closed asymmetric unit using 3D motif empirical atomic potentials. Sergei V Rahmanov and VsevolodYu Makeev, 40th Erice Crystallographic Conference "From Molecules to Medicine. Integrating Crystallography in Drug Discovery", Ence, Italy 2008.

2. Knowledge-based potentials for protein atom interaction based on Monte Carlo reference state. Sergei V. Rahmanov and Vsevolod J. Makeev. Moscow Conference on Computational Molecular Biology MCCMB-2007. Moscow 2007

3 Статистические потенциалы взаимодействия белковых атомов В Ю. Макеев, С В Рахманов IV Московский международный конгресс «Биотехнология состояние и перспективы развития» (Мир БиоТехнологии-2007)

4. Atomic hydration potentials using Monte Carlo reference state advance protein solvation modeling Sergei V. Rahmanov and Vsevolod J Makeev. FEBS-2006, Istanbul, Turkey.

5. Энергетические потенциалы гидратации белков. Рахманов С В, Макеев В Ю Российская школа - конференция «Генетика микроорганизмов и биотехнология», посвященная 100-летию со дня рождения С. И Алиханяна. Москва 2006

6. Новый метод построения межатомных потенциалов для моделирования структуры и взаимодействий биополимеров Рахманов С.В Международная школа-конференции молодых ученых «Системная биология и биоинженерия» Звенигород, 2005.

7. Constructing detailed knowledge-based atomic potentials for water m proteins Rahmanov S.V., Makeev V.Yu, The Fourth International Conference on Bioinformatics of Genome Regulation and Structure (BGRS'2004), Novosibirsk, 2004

Подписано в печать 14.11.2008 г.

Печать трафаретная

Заказ № 1175 Тираж: 100 экз

Типография «11-й ФОРМАТ» ИНН 7726330900 115230, Москва, Варшавское ш., 36 (499) 788-78-56 www.autoreferat.ru

Содержание диссертации, кандидата биологических наук, Рахманов, Сергей Викторович

Оглавление.

Общие сведения о работе. Актуальность темы исследования

Цель и задачи исследования

Научная новизна и практическое значение работы

Апробация работы.

Введение Диссертация по биологии, на тему "Статистические потенциалы атомарной гидратации биополимеров"

Глава I. Обзор и анализ литературных источников по теме исследования.

1.1. Принципы построения статистических потенциалов 13

1.2. Значение исследования гидратационных взаимодействий для моделирования укладки белковой молекулы и межмолекулярных взаимодействий биополимеров 22

Результаты и обсуждение. 24

Заключение Диссертация по теме "Молекулярная биология", Рахманов, Сергей Викторович

Выводы

1. Разработан программный комплекс для анализа водной сольватации биологических макромолекул на основе вычисления свободной энергии атомарной гидратации.

2. Разработан метод стохастического моделирования для построения состояния невзаимодействующих атомов при определении статистических потенциалов межатомного взаимодействия.

3. При помощи нового метода получены потенциалы атомной гидратации белковых макромолекул, обладающие высокой разрешающей способностью и широким контактным диапазоном.

4. Продемонстрирована возможность использования потенциалов гидратации для предсказания расположения связанной воды в белках.

5. Продемонстрирована эффективность использования полученных потенциалов для распознавания нативной укладки белка среди набора альтернативных конформаций.

Библиография Диссертация по биологии, кандидата биологических наук, Рахманов, Сергей Викторович, Москва

1. Badger, J. and D. L. Caspar (1991). "Water structure in cubic insulin crystals." Proc Natl Acad Sci U S A 88(2): 622-6.

2. Badger, J., A. Kapulsky, et al. (1995). "Neutron diffraction analysis of the solvent accessible volume in cubic insulin crystals." Nat Struct Biol 2(1): 77-80.

3. Ben-Nairn, A. (1997). "Statistical potentials extracted from protein structures: Are these meaningful potentials?" The Journal of Chemical Physics 107: 3698-3706.

4. Buchete, N. V., J. E. Straub, et al. (2004). "Orientational potentials extracted from protein structures improve native fold recognition." Protein Sci 13(4): 862-74.

5. Burling, F. Т., W. I. Weis, et al. (1996). "Direct observation of protein solvation and discrete disorder with experimental crystallographic phases." Science 271(5245): 72-7.

6. Chan, H. S. and K. A. Dill (1990). "Origins of structure in globular proteins." Proc Natl Acad Sci U S A 87(16): 6388-92.

7. Chaplin, M. (2006). Water structure and behavior http:/Avww. lsbu.ac.uk/water/index.htmll.

8. Dinner, A. R., A. Sali, et al. (2000). "Understanding protein folding via free-energy surfaces from theory and experiment." Trends Biochem Sci 25(7): 331-9.

9. Dong, Q., X. Wang, et al. (2006). "Novel knowledge-based mean force potential at the profile level." BMC Bioinformatics 7: 324.

10. Doye, J. P. and D. J. Wales (2001). "Polytetrahedral clusters." Phys Rev Lett 86(25): 5719-22.

11. Eisenberg, D. and A. D. McLachlan (1986). "Solvation energy in protein folding and binding." Nature 319(6050): 199-203.

12. Ernst, J. A., R. T. Clubb, et al. (1995). "Demonstration of positionally disordered water within a protein hydrophobic cavity by NMR." Science 267(5205): 1813-7.

13. Finer-Moore, J. S., A. A. Kossiakoff, et al. (1992). "Solvent structure in crystals of trypsin determined by X-ray and neutron diffraction." Proteins 12(3): 203-22.

14. Finkelstein, A. V., A. Badretdinov, et al. (1995). "Why do protein architectures have Boltzmann-like statistics?" Proteins 23(2): 142-50.

15. Finkelstein, A. V., A. M. Gutin, et al. (1995). "Perfect temperature for protein structure prediction and folding." Proteins 23(2): 151-62.

16. Finkelstein, A. V. and O. Ptitsyn (2002). Protein Physics: A Course of Lectures (Soft Condensed Matter, Complex Fluids and Biomaterials). London, San Diego, Academic Press.

17. Fleming, P. J., N. C. Fitzkee, et al. (2005). "A novel method reveals that solvent water favors polyproline II over beta-strand conformation: conditional hydrophobic accessible surface area (CHASA)." Protein Sci 14(1): 111-8.

18. Garcia-Sosa, A. T. and R. L. Mancera (2006). "The effect of a tightly bound water molecule on scaffold diversity in the computer-aided de novo ligand design of CDK2 inhibitors." J Mol Model (Online) 12(4): 422-31.

19. Garczarek, F. and K. Gerwert (2006). "Functional waters in intraprotein proton transfer monitored by FTIR difference spectroscopy." Nature 439(7072): 109-12.

20. Gelpi, J. L., S. G. Kalko, et al. (2001). "Classical molecular interaction potentials in molecular dynamics simulations of proteins." Proteins 45(4): 428-37.

21. Gerstein, M. and C. Chothia (1996). "Packing at the protein-water interface." Proc Natl Acad Sci US А 93П9): 10167-72.

22. Godzik, A. (1996). "Knowledge-based potentials for protein folding: what can we learn from known protein structures?" Structure 4(4): 363-6.

23. Halle, B. (2004). "Protein hydration dynamics in solution: a critical survey." Philos Trans R Soc Lond В Biol Sci 359(1448): 1207-23; discussion 1223-4, 1323-8.

24. Halle, B. and M. Davidovic (2003). "Biomolecular hydration: from water dynamics to hydrodynamics." Proc Natl Acad Sci U S A 100(21): 12135-40.

25. Harano, Y. and M. Kinoshita (2005). "Translational-entropy gain of solvent upon protein folding." Biophys J 89(4): 2701-10.

26. Head-Gordon, T. and G. Hura (2002). "Water structure from scattering experiments and simulation." Chem Rev 102(8): 2651-70.

27. Henchman, R. H. and J. A. McCammon (2002). "Extracting hydration sites around proteins from explicit water simulations." J Comput Chem 23(9): 861-9.

28. Hobohm, U. and C. Sander (1994). "Enlarged representative set of protein structures." Protein Sci 3(3): 522-4.

29. Holm, L. and C. Sander (1992). "Evaluation of protein models by atomic solvation preference." J Mol Biol 225(1): 93-105.

30. Jaramillo, A. and S. J. Wodak (2005). "Computational protein design is a challenge for implicit solvation models." Biophys J 88(1): 156-71.

31. Jayaram, B. and T. Jain (2004). "The role of water in protein-DNA recognition." Annu Rev Biophys Biomol Struct 33: 343-61.

32. Kihara, D. and J. Skolnick (2003). "The PDB is a covering set of small protein structures." J Mol Biol 334(4): 793-802.

33. Koppensteiner, W. A. and M. J. Sippl (1998). "Knowledge-based potentials—back to the roots." Biochemistry (Mosc) 63(3): 247-52.

34. Lazaridis, T. and M. Karplus (1999). "Discrimination of the native from misfolded protein models with an energy function including implicit solvation." J Mol Biol 288(3): 477-87.

35. Li, X. and J. Liang (2006). Knowledge-based energy functions for computational studies of proteins. Computational Methods for Protein Structure Prediction and Modeling;. Y. Xu, D. Xu and J. Liang, Springer-Verlag.

36. Liang, X. L. a. J. (2006). Knowledge-based energy functions for computational studies of proteins. Springer.

37. Makarov, V., В. M. Pettitt, et al. (2002). "Solvation and hydration of proteins and nucleic acids: a theoretical view of simulation and experiment." Acc Chem Res 35(6): 376-84.

38. Makarov, V. А., В. K. Andrews, et al. (1998). "Reconstructing the protein-water interface." Biopolymers 45(7): 469-78.

39. Makarov, V. А., В. K. Andrews, et al. (2000). "Residence times of water molecules in the hydration sites of myoglobin." Biophys J 79(6): 2966-74.

40. Makarov, V. A., M. Feig, et al. (1998). "Diffusion of solvent around biomolecular solutes: a molecular dynamics simulation study." Biophys J 75(1): 150-8.

41. Marrone, T. J., H. Resat, et al. (1998). "Solvation studies of DMP323 and A76928 bound to HIV protease: analysis of water sites using grand canonical Monte Carlo simulations." Protein Sci 7(3): 573-9.

42. McGreevy, R. L., Pusztai, L. (1988). "Reverse Monte Carlo simulation: a new technique for the determination of disordered structures." Molec. Simul. 1: 359- 367.

43. Miyazawa, S. and R. L. Jernigan (1985). "Estimation of effective interresidue contact energies from protein crystal structures: quasi-chemical approximation." Macromolecules 18: 534-552.

44. Miyazawa, S. and R. L. Jernigan (1996). "Residue-residue potentials with a favorable contact pair term and an unfavorable high packing density term, for simulation and threading." J Mol Biol 256(3): 623-44.

45. Miyazawa, S. and R. L. Jernigan (1999). "Self-consistent estimation of inter-residue protein contact energies based on an equilibrium mixture approximation of residues." Proteins 34(1): 49-68.

46. Papoian, G. A., J. Ulander, et al. (2004). "Water in protein structure prediction." Proc Natl Acad Sci U S A 101(10): 3352-7.

47. Pettitt, В. M., V. A. Makarov, et al. (1998). "Protein hydration density: theory, simulations and crystallography." Curr Opin Struct Biol 8(2): 218-21.

48. Pierce, N. A. and E. Winfree (2002). "Protein design is NP-hard." Protein Erig 15(10): 779-82.

49. Pujadas, G. and J. Palau (2001). "Molecular mimicry of substrate oxygen atoms by water molecules in the beta-amylase active site." Protein Sci 10(8): 1645-57.

50. Rahmanov S.V., M. V. J. (2006). "Atomic hydration potentials using Monte Carlo reference state advance protein solvation modeling." FEBS Journal 273(sl): 62.

51. Rakhmanov, S. V. and V. J. Makeev (2007). "Atomic hydration potentials using a Monte Carlo Reference State (MCRS) for protein solvation modeling." BMC Struct Biol 7: 19.

52. Raymer, M. L., P. C. Sanschagrin, et al. (1997). "Predicting conserved water-mediated and polar ligand interactions in proteins using a K-nearest-neighbors genetic algorithm." J Mol Biol 265(4): 445-64.

53. Robinson, G. W. and С. H. Cho (1999). "Role of hydration water in protein unfolding." Biophys J 77(6): 3311-8.

54. Russ, W. P. and R. Ranganathan (2002). "Knowledge-based potential functions in protein design." Curr Opin Struct Biol 12(4): 447-52.

55. Samudrala, R. and M. Levitt (2000). "Decoys 'R' Us: a database of incorrect conformations to improve protein structure prediction." Protein Sci 9(7): 1399-401.

56. Samudrala, R. and J. Moult (1998). "An all-atom distance-dependent conditional probability discriminatory function." J Mol Biol 275(5): 895-916.

57. Schiffer, C. A. and W. F. van Gunsteren (1999). "Accessibility and order of water sites in and around proteins: A crystallographic time-averaging study." Proteins 36(4): 501-11.

58. Schneider, В. and H. M. Berman (1995). "Hydration of the DNA bases is local." Biophys J 69(6): 2661-9.

59. Shen, M. Y. and A. Sali (2006). "Statistical potential for assessment and prediction of protein structures." Protein Sci 15(11): 2507-24.

60. Shimada, J. and E. I. Shakhnovich (2002). "The ensemble folding kinetics of protein G from an all-atom Monte Carlo simulation." Proc Natl Acad Sci U S A 99(17): 11175-80.

61. Sippl, M. J. (1990). "Calculation of conformational ensembles from potentials of mean force. An approach to the knowledge-based prediction of local structures in globular proteins." J Mol Biol 213(4): 859-83.

62. Skolnick, J., A. Kolinski, et al. (2000). "Derivation of protein-specific pair potentials based on weak sequence fragment similarity." Proteins 38(1): 3-16.

63. Tan, M. L., L. Lucan, et al. (2006). "Study of multipole contributions to the structure of water around ions in solution using the soft sticky dipole-quadrupole-octupole (SSDQO) model of water." J Chem Phys 124(17): 174505.

64. Tanaka, S. and H. A. Scheraga (1975). "Model of protein folding: short-, medium-, and long-range interactions." Proc Natl Acad Sci U S A 72(10): 3802-6.

65. Tanaka, S. and H. A. Scheraga (1976). "Medium- and long-range interaction parameters between amino acids for predicting three-dimensional structures of proteins." Macromolecules 9(6): 945-50.

66. Teeter, M. M. (1984). "Water structure of a hydrophobic protein at atomic resolution: Pentagon rings of water molecules in crystals of crambin." Proc Natl Acad Sci U S A 81 (19): 6014-6018.

67. Thanki, N., Y. Umrania, et al. (1991). "Analysis of protein main-chain solvation as a function of secondary structure." J Mol Biol 221(2): 669-91.

68. Thomas, P. D. and K. A. Dill (1996). "Statistical potentials extracted from protein structures: how accurate are they?" J Mol Biol 257(2): 457-69.

69. Tsai, J., R. Bonneau, et al. (2003). "An improved protein decoy set for testing energy functions for protein structure prediction." Proteins 53(1): 76-87.

70. Wang, J. Y., H. M. Lee, et al. (2005). "Prediction and evolutionary information analysis of protein solvent accessibility." Proteins 61(3): 481-91.

71. Watterson, J. G. (1988). "The role of water in cell architecture." Mol Cell Biochem 79(2): 101-5.

72. Wlodawer, A., J. Deisenhofer, et al. (1987). "Comparison of two highly refined structures of bovine pancreatic trypsin inhibitor." J Mol Biol 193(1): 145-56.

73. Yu, В., M. Blaber, et al. (1999). "Disordered water within a hydrophobic protein cavity visualized by x-ray crystallography." Proc Natl Acad Sci U S A 96(1): 103-8.

74. Zegers, I., D. Maes, et al. (1994). "The structures of RNase A complexed with 3'-CMP and d(CpA): active site conformation and conserved water molecules." Protein Sci 3(12): 2322-39.

75. Zhou, H. and Y. Zhou (2002). "Distance-scaled, finite ideal-gas reference state improves structure-derived potentials of mean force for structure selection and stability prediction." Protein Sci 11(11): 2714-26.

76. Волькепштейн, M. B. (1966). Молекулы и жизнь. Москва, Наука.

77. Ландау Л.Д., Л. Е. М. (2002). Лекции по физике, Физматлит.

78. Розанов, Ю. А. (1989). Теория вероятностей, случайные процессы и математическая статистика. Москва, Наука.

79. Сюняев, Ш. Р., Е. Н. Кузнецов, et al. (1995). "Статистические условия применимости описаний пространственной структуры, используемых в обратной задаче формирования белковой глобулы." Биофизика 40(6): 1165-1170.