Бесплатный автореферат и диссертация по биологии на тему
Стерическая избирательность белок-белковых и белок-нуклеиновых контактов
ВАК РФ 03.00.02, Биофизика

Автореферат диссертации по теме "Стерическая избирательность белок-белковых и белок-нуклеиновых контактов"

на правах рукописи УДК 577.322.23: 577.112.7

АНАШКИНА АНАСТАСИЯ АНДРЕЕВНА

Стерическая избирательность белок-белковых и белок-нуклеиновых контактов

03.00.02. - биофизика

Автореферат диссертации на соискание ученой степени кандидата физико-математических наук

Москва 2008

003454004

Работа выполнена в Учреждении Российской академии наук Институте молекулярной биологии им. В. А. Энгельгардта РАН и на кафедре Молекулярной биофизики Факультета молекулярной и биологической физики Московского физико-технического института (государственного университета).

Научный руководитель:

доктор физико-математических наук, профессор Туманян Владимир Гайевич

Официальные оппоненты: доктор физико-математических наук Намиот Владимир Абрамович доктор физико-математических наук Нечипуренко Юрий Дмитриевич

Ведущая организация:

Институт теоретической и экспериментальной биофизики РАН, г. Пущино

Защита состоится // декабря 2008 г. в час.^мин. на заседании диссертационного совета Д 501.001.96 при Московском государственном университете им. М.В. Ломоносова, Москва (Россия 119991, Москва, Ленинские горы 1, корп. 12, МГУ, Биологический факультет, кафедра биофизики).

С диссертацией можно ознакомиться в библиотеке Московского государственного университета им. М.В. Ломоносова.

•V

Автореферат разослан «ту ноября 2008 г.

Ученый секретарь диссертационного Совета доктор биологических наук, профессор

Общая характеристика работы

Введение. Актуальность проблемы

Общепринято, что физико-химические свойства макромолекул определяются последовательностью их химических единиц. Знание принципов взаимодействия биологических макромолекул, понимание связи между последовательностью аминокислот, строением и взаимодействием белков дает возможность для развития фундаментальных подходов, а также служит основой для компьютерного моделирования взаимодействий белковых молекул, что, в свою очередь, может существенно изменить процесс создания новых лекарственных средств. Адекватный способ моделирования взаимодействий между белковыми молекулами позволит существенно сократить временные и финансовые затраты, связанные с исследованием свойств новых препаратов.

Белок-белковые взаимодействия являются решающими практически во всех основных биологических процессах, таких как клеточная регуляция, пути биосинтеза и распада, передача сигнала, инициация репликации ДНК, транскрипция и трансляция, образование олигомеров и мультимолекулярных комплексов, упаковка вирусов и иммунный ответ. Благодаря своей важности взаимодействия белков - предмет многих исследований. Однако расшифровка природы взаимодействий белков является достаточно трудной задачей. С физико-химической точки зрения имеет место сложный баланс относительного вклада различных взаимодействий, и большое разнообразие мотивов, составляющих область взаимодействия.

Проблема определения контактов между аминокислотными остатками является довольно сложной и требует усовершенствованных методов анализа. В большинстве случаев эффекты зависят от параметров, используемых при вычислении контактов. Поэтому желательно, если это возможно, применение непараметрического метода. Разбиение Вороного-Делоне -классический непараметрический метод, позволяющий определять прямые контакты между атомами, и, следовательно, между аминокислотами. Разбиение Вороного-Делоне уже давно

положительно зарекомендовало себя в структурной биологии. С помощью этого разбиения исследовали плотность упаковки атомов в белках, средние объемы аминокислот, объемы атомов на поверхности белков, а также средние объемы атомов в пространственных структурах большого числа неорганических соединений и белков.

Предсказывать возможные области взаимодействия между двумя данными белками, а также конкретные аспекты таких взаимодействий в настоящее время возможно лишь с ограниченной точностью и большими временными затратами. Структуры белков состоят из большого числа атомов, остатки аминокислот зачастую довольно подвижны, и имеют много степеней свободы, а потому процесс реконструкции взаимодействия сопряжен с большой трудоемкостью в вычислительном смысле. Даже возрастающие с каждым годом мощности суперкомпьютеров и кластеров не позволяют провести такой анализ для всего банка белковых структур. В связи с этим встает задача разработки новых подходов к моделированию взаимодействий белковых цепей и конструированию областей взаимодействия, а для этого необходимо знать характерные особенности таких взаимодействий.

Вопрос о том, какие взаимодействия играют ключевую роль в формировании белковых комплексов, в том числе ван-дер-ваальсовые взаимодействия, солевые мостики, водородные связи, является самым существенным вопросом в понимании белок-белковых ассоциаций. И хотя этот вопрос поднимается в большом числе исследований, окончательный ответ еще не ясен. Ответ на этот вопрос должен не только пролить свет на механизм белкового узнавания, но и позволит создать базу для конструирования эффективно связывающихся лигандов.

Цель и задачи исследования

Главной целью проведённой работы было установление статистических закономерностей, характерных для контактов аминокислот во взаимодействиях между белковыми молекулами и между молекулами белка и ДНК. В задачи работы входило:

• разработка метода оценки поверхностей контакта белок-белковых и белок-нуклеиновых комплексов на основе

разбиения Вороного-Делоне и создание комплекса программ, позволяющего выявлять и анализировать контакты внутри биологических макромолекул и между ними, начиная с атомного уровня организации;

• создание невырожденных выборок белок-белковых интерфейсов, домен-доменных интерфейсов и белковых цепей, а также белок-нуклеиновых комплексов;

• построение разбиения Вороного-Делоне для каждого белка/комплекса выборки и определение контактов, начиная с атомного уровня;

• разработка модели случайно взаимодействующих аминокислотных остатков (остатков и нуклеотидов) на поверхности области взаимодействия и установление свойств модели;

• определение пар аминокислотных остатков (остатков и нуклеотидов), взаимодействующих чаще или реже, чем можно ожидать из модели случайных взаимодействий.

Научная новизна

Впервые для определения контактирующих атомов использовано разбиение Вороного-Делоне. Предложен и использован алгоритм, время работы которого пропорционально числу рассматриваемых атомов, что позволяет применить построение Вороного-Делоне к структурам белковых и белок-нуклеиновых комплексов. Показана устойчивость метода к достаточно большим вариациям в координатах атомов, т.е. адекватность результатов для белков, определенных с достаточно низким разрешением РСА.

Впервые проанализированы выборки максимально возможного объема различных типов белок-белковых и белок-нуклеиновых интерфейсов. Контакты определены на атомарном уровне, на основе этих данных установлены контакты между химическими единицами.

Построены модели случайного и специфического контактирования аминокислот на поверхности белок-белкового или белок-нуклеинового взаимодействия. На основе этих моделей

определены предпочтения для взаимодействия аминокислотных остатков на поверхности контактов в белок-белковых или белок-нуклеиновых комплексах.

Впервые показано, что наибольшая предпочтительность наблюдается для взаимодействий между двумя цистеинами, как на поверхности взаимодействия двух идентичных белковых цепей (гомодимеров), так и на поверхности взаимодействия разных белковых цепей (гетерокомплексов), а также для взаимодействий между идентичными и разными белковыми доменами.

Показано, что для всех типов белок-белкового взаимодействия, а также для взаимодействия между аминокислотами в рамках одной белковой цепи важную роль играют противоположно заряженные пары аминокислот, демонстрирующие высокий уровень предпочтения.

Установлены специфические (предпочтительные) взаимодействия между аминокислотами и нуклеотидами. Показано, что с цитозином специфически связываются отрицательно заряженные аминокислоты - аспарагиновая и глютаминовая кислоты.

Практическое значение работы

Полученные в результате проведенных исследований данные по аминокислотным предпочтениям могут представлять ценность при создании системы предсказания областей белок-белкового и белок-нуклеинового узнавания и связывания, исследовании пространственных структур фибриллярных и глобулярных белков, при разработке новых биологически активных веществ с заданными свойствами. Кроме того, они вносят вклад в понимание механизмов формирования структуры белковых молекул. Использовать такой материал можно будет в различных прикладных областях, в том числе в области медицины и фармакологии.

Апробация работы и публикации

Основные результаты диссертации были представлены на ХЫУ научной конференции МФТИ (2001 г.), на 13-й и 14-й Международных зимних молодежных научных школах

«Перспективные направления физико-химической биологии и биотехнологии», на VIII международной конференции: образование, экология, экономика, информатика (Астрахань, 2003), на III съезде биофизиков России (Воронеж, 2004), на XII международной конференции "Математика. Компьютер. Образование" (Пущино, 2005), на Международной московской конференции по вычислительной молекулярной биологии (МССМВ'05), на семинаре Института проблем управления им. В.А.Трапезникова "Экспертные оценки и анализ данных" 24 мая 2006 г, на совместном собрании 52-й Конференции американского биофизического общества и 16-го Международного биофизического конгресса (Лонг Бич, 2008).

По материалам диссертации опубликовано 11 печатных работ, в том числе 2 статьи в реферируемых журналах из списка ВАК, 3 в материалах международных и российских конференций, 6 в тезисах международных и российских конференций.

Объём и структура диссертации

Диссертация изложена на 95 страницах, иллюстрирована 22 рисунками и содержит 27 таблиц, список литературы включает 145 ссылок. Диссертация состоит из введения, шести глав, включая обзор литературы, выводов, списка цитированной литературы и приложения.

Краткое содержание работы

Введение

Введение содержит обоснование актуальности темы диссертации, ее научной новизны и практической значимости, приведены положения, выносимые на защиту.

Глава 1. Обзор литературы

В обзоре литературы рассматриваются: - классификация белок-белковых комплексов и областей взаимодействия; роль гидрофобных и гидрофильных взаимодействий в процессе сворачивания белка и белок-белковом узнавании; результаты изучения интерфейсов белок-

белковых комплексов и аминокислотных предпочтений другими авторами;

- специфическое и неспецифическое связывание нуклеиновых кислот белком; вклад различных факторов во взаимодействия между белком и ДНК: водородные связи, ионные пары, Ван дер Ваальсовые взаимодействия; опосредованные водой контакты; гидрофобный эффект; взаимные конформационные перестройки.

В обзоре литературы подробно анализируются работы по исследованию пространственной структуры сайтов связывания и взаимодействию между аминокислотами на поверхности сайтов связывания, а также аминокислотному составу сайтов связывания. Работы по определению аминокислотного состава и предпочтениям сделаны, как правило, на небольших выборках, от 70 до 170 белок-белковых комплексов. Определения предпочтения сделаны на разных типах мест связывания или внутренних местах связывания, и сравнивать или комбинировать результаты таких исследований оказывается затруднительным. Следует отметить, что во всех без исключения рассмотренных работах контактирующие атомы определялись по критерию расстояния, т.е. если на расстоянии, например, 5 А от данного атома находится атом из другой белковой цепи, данный атом считается участвующим во взаимодействии с ним.

Многочисленные исследователи, изучая группу гомологичных белков, определяют важные для распознавания и связывания аминокислоты в рамках данной группы, однако общих, универсальных правил или «кода» распознавания для всех белков по-прежнему не найдено.

Делается вывод о необходимости развития новых подходов к исследованию предпочтений взаимодействия аминокислот на поверхности белок-белковых комплексов и белок-нуклеиновых комплексов.

Глава 2. Методы

В первой части главы содержится описание разбиения Вороного-Делоне, обсуждаются возможности метода, дается сравнение с методом определения контактов по расстоянию, а

также показана устойчивость результатов к варьированию координат. Вторая часть главы посвящена моделям случайного и неслучайного типов контактов на поверхности белок-белковых взаимодействий. В третьей части главы описываются использованные в данной работе статистические методы и понятия, в числе последних - предлагаемый индекс представленности контактов.

Разбиение Вороного-Делоне

Подробно описывается разработанная методика построения разбиения Вороного-Делоне для белков и нуклеиновых кислот. Приводится алгоритм программы, обсуждаются особенности и тонкости построения разбиения. Достаточно подробно описано применение метода для определения параметров атомов и аминокислот, таких как объем и площадь поверхности. В этом разделе также приводятся значения определяемых величин из литературных источников и их сравнение с данными, полученными в этом исследовании. Проведено сравнение разбиения Вороного-Делоне и метода определения контактов по расстоянию. Подробно описано исследование устойчивости к варьированию координат.

В качестве исходной информации используются пространственные координаты всех атомов белковой молекулы. В разбиении Вороного-Делоне пространство внутри белковой глобулы распределяется между всеми ее атомами по следующему принципу: разделяющая плоскость проводится между двумя соседними атомами через середину отрезка, соединяющего эти атомы и перпендикулярно ему. Такие плоскости образуют вокруг каждого атома выпуклый многогранник произвольного вида, называемый полиэдром Вороного. Область внутри многогранника лежит ближе к данному атому, чем к любому другому. Таким образом, контакт между двумя атомами существует, если у этих атомов есть общая грань полиэдра Вороного с площадью, отличной от нуля. Следовательно, контакт между двумя аминокислотами определяется как совокупность общих граней полиэдров Вороного составляющих их атомов.

Применение разбиения Вороного-Делоне к структурам белковых и белок-нуклеиновых комплексов стало возможным

благодаря принципиально новому алгоритму вычислений. Все ранее применяемые методы использовали алгоритмы, в которых зависимость времени работы от числа рассматриваемых точек N была пропорциональна Ы3, в лучших алгоритмах В нашей

работе предложен и использован алгоритм, время работы которого пропорционально числу точек N в рассматриваемом ансамбле.

С помощью вычислений демонстрируется замечательная устойчивость разбиения Вороного-Делоне. По этому свойству метод Вороного-Делоне значительно превосходит существующие методы определения контактов по расстоянию. Варьирование каждой координаты атомов возможно до 1 А в любом направлении без потери значимых контактов. Кроме того, в рамках данного метода можно оценивать значимость каждого контакта по размеру площади и расстоянию между атомами.

Статистические модели случайно и специфически контактирующих аминокислот

Для полноценной интерпретации полученных данных, для того, чтобы оценить и выявить отклонения от случайных процессов, была разработана математическая статистическая модель контактирующих аминокислот: два круга бросают на некоторую область случайным образом, и каждый раз фиксируют площадь перекрывания. Выразим плотность вероятности ^ случайных

пересечений как зависимость от площади пересечения 5 в

параметрическом виде:

[с!Р

В случае специфических взаимодействий можно предположить, что контакты обладают некоторой, отличной от нуля средней площадью контакта, обусловленной физико-химической природой взаимодействия остатков. В этом случае распределение расстояний между центрами кругов подчиняется нормальному

(1)

распределению. Выразим распределение площадей неслучайных контактов также в параметрическом виде:

О "Л О ич О и-) о

СЧ М СП

Площадь контакта между остатками, А , согласно модели

Рисунок 1. Графики, отражающие системы (1) и (2), моделируют распределения площадей случайных (А) и неслучайных (В) контактов. (А) График системы (1) в параметрической форме. График отражает распределение площадей случайных контактов. (В) График системы (2) в параметрической форме. График отражает распределение площадей неслучайных контактов. (С) Сумма графиков (А) и (В),

Зависимость (1) показана на Рис.1, кривая А. По мере увеличения площади контакта число контактов резко уменьшается. Другими словами, распределение для случайных контактов показывает наличие большого числа малых по площади контактов. Зависимость (2) показана ниже на Рис.1, кривая В. Кривая имеет колоколообразную форму, несимметричную, с некоторым, существенно отличным от нуля средним значением. Распределение для неслучайных контактов отражает существование некоторой характерной площади контакта.

Статистические методы

Рассматриваются использованные в данной работе статистические понятия и методы, в том числе методы оценки статистической значимости, влияние размера выборки, сравнение наборов данных, коэффициент корреляции наборов данных, метод оценки ошибок и индекс представленности контактов. Оценивается минимальный размер выборки, необходимый для того, чтобы оцениваемый параметр находился в доверительном интервале заданной длины с требуемой точностью. Для оценки аминокислотного состава интерфейсов с точностью 2% в доверительном интервале 95% минимальное количество исследованных интерфейсов должно быть около 460.

Индекс представленности контакта

В качестве величины, отражающей соотношение между числом наблюдаемых и ожидаемых контактов, был выбран индекс представленности контакта %1р как отношение числа наблюдаемых контактов Су (вычисленных по разбиению Вороного; два остатка считаются взаимодействующими, если два атома имеют общую грань с ненулевой площадью поверхности) и ожидаемых значений, определенных для таблиц сопряженности:

8<; = ГТ7 >

где р,*Ы - ожидаемые частоты для таблиц контактов.

Вероятность случайного контакта ру между остатками г и у типов:

V С4)

Р» N N '

где общее число контактов .V = , а п, = , т] = .

II I '

Эта величина (3) отражает соотношение между наблюдаемым числом контактов и ожидаемым. Если ожидаемое число контактов близко к наблюдаемому, g,; принимает значение, близкое 1. ^ меньше 1, если ожидаемое число контактов больше наблюдаемого, и больше 1, если ожидаемое число контактов меньше наблюдаемого.

Глава 3. Исследование белок-белковых взаимодействий

Представленные в этой Главе результаты относятся к изучению контактов между аминокислотами в белок-белковых интерфейсах гомодимеров и гетерокомплексов.

Выборка белок-белковых комплексов

Для изучения закономерностей, существующих в белок-белковых интерфейсах, использовалась репрезентативная выборка из 4602 белок-белковых интерфейсов из работы (ММг, 8Ьи1шап-Ре1е£ е1 а1. 2005). Данная выборка содержит 3067 интерфейсов, образованных идентичными цепями (гомодимеры) и 1535 интерфейсов, образованных различными цепями (гетерокомплексы).

Статистика атом-атомных контактов

Основываясь на списке контактов между атомами, было построено распределение расстояний между контактирующими атомами, распределение площадей межатомных контактов и корреляция между расстоянием и площадью контакта взаимодействующих атомов. Всего в данной выборке исследовано 2 057 304 межатомных контактов.

Аминокислотный состав белок-белковых интерфейсов

В этом разделе приводятся полученные данные по аминокислотному составу интерфейсов, а также подробное сравнение с результатами, полученными другими авторами.

Контакты между аминокислотными остатками

Полный список исследованных взаимодействий содержит 4602 интерфейса, 421 956 контактов между аминокислотами и 2 057 304 контакта между атомами.

Также в данном разделе рассматривается распределение площадей контакта между аминокислотами, взаимосвязь между площадью интерфейса и количеством участвующих в его формировании аминокислот, а также исследование площадей интерфейсов. В данном разделе также приводятся таблицы чисел контактов между остатками типов г и у для гомодимеров и

гетерокомплексов. В обоих случаях очевидна «склонность» к образованию контактов между противоположно заряженными аминокислотами (около 24% всех контактов) и между гидрофобными остатками (Leu, Val, lie, Phe, Ala) (около 33% всех контактов).

Предпочтения в контактах между остатками

В этом разделе подробно обсуждаются индексы представленности (3), вычисленные отдельно для гомодимеров и гетерокомплексов, сравнение их между собой и с литературными данными.

Получены следующие результаты:

• статистически значимы индексы представленности для контактов между двумя цистеинами, как для гомодимеров, так и для гетерокомплексов. Для гомодимеров это значение gy составляет 4.85, а для гетерокомплексов 3.48, что свидетельствует о максимальной предпочтительности такого контакта;

• следующими по величине индекса представленности gy идут контакты между остатками противоположного знака. Это характерно как для гомодимеров, так и для гетерокомплексов; отклонение от 1 также статистически значимо.

• гидрофобные остатки образуют парные контакты со значениями индекса представленности, хотя и больше 1, но не имеющими строгой статистической значимости;

• самые низкие значения индексов представленности наблюдаются для взаимодействий одинаково заряженных аминокислот;

• индексы представленности для контактов между остатками одного типа в случае взаимодействия идентичных цепей выше, чем для гетерокомплексов. Этот эффект замечен и другими авторами. Следует отметить, что свойства интерфейсов, образованных двумя идентичными белковыми цепями, отличаются от свойств интерфейсов гетерокомплексов. В частности, первые содержат контакты, образованные симметричными парами аминокислот. В центральной области взаимодействия происходит пространственное сближение остатков, имеющих одинаковые номера в полипептидной цепи,

тем самым сближаются остатки одного типа. Обнаружено 6600 таких контактов среди 167000 контактов между остатками в интерфейсах гомодимеров. В литературе также встречаются упоминания, что интерфейсы гомодимеров содержат больше контактов между аминокислотами одного типа благодаря оси симметрии второго порядка;

• приведенная гистограмма расстояний между атомами серы контактирующих остатков цистеина демонстрирует специфические взаимодействия меэвду остатками цистеина. В области 2 А наблюдается четко выраженный пик, представляющий собой межцепочечные дисульфидные мостики. Сравнение гистограмм площади для всех контактов остатков цистеина и для дисульфидных связей подтверждает гипотезу о том, что полное распределение состоит из распределения площадей случайных контактов, когда контакт происходит вследствие сближения, и распределения площадей специфических контактов, обусловленных физико-химическими взаимодействиями. Специфические контакты S-S, обусловленные формированием дисульфидной связи, имеют среднюю площадь взаимодействия 8,23 А2;

• проведена оценка ошибок для величин gy с использованием метода «складного ножа». Диапазон значений ошибки от 0,03% до 0,18%, среднее значение 0,06%. Максимальная ошибка составляет 0,18% для контактов Gly-Pro (0,0027), а минимальная 0,03% для контактов Arg-Asp (0,0005) и Arg-Leu (0,0002).

Глава 4. Исследование междоменных взаимодействий в глобулярных белках

Данная глава посвящена исследованию взаимодействий доменов, определенных в базе данных доменов САТН. Рассматриваются контакты между тремя типами домен-доменных интерфейсов: образованных доменами, расположенными в разных белковых цепях и имеющими разную классификацию по САТН; интерфейсов, образованных одинаковыми по классификации САТН доменами, принадлежащими разным белковым цепям; интерфейсов, образованных доменами, расположенными в одной белковой цепи

Невырожденная подборка интерфейсов составила: 342 интерфейса, образованных разными доменами, расположенными в разных белковых цепях; 557 интерфейсов, образованных одинаковыми доменами, принадлежащими разным белковым цепям; 377 интерфейсов, образованных доменами, расположенными в одной белковой цепи.

Всего рассмотрено 274 656 атомных контактов, составляющих 56 843 контактов между аминокислотными остатками. Построено распределение расстояний между контактирующими атомами и площади межатомных контактов, корреляция между площадью контакта и расстоянием, взаимосвязь между площадью интерфейса и количеством участвующих в его формировании атомов.

Аминокислотный состав домен-доменных интерфейсов

Определен аминокислотный состав интерфейсов во взаимодействиях домен-домен. Заряженные аминокислоты Arg, Asp, Glu, Lys на поверхности домен-доменных интерфейсов составляют 24% от общего количества аминокислот. Гидрофобные аминокислоты Ala, Ile, Leu, Val и Phe составляют 32%. Ser и Thr 11%. Мало His (3%), Met(2%), Trp(2%) и Cys(l%).

Контакты между аминокислотными остатками

Построена гистограмма площади контакта между аминокислотами на поверхности домен-доменных интерфейсов, вычислена корреляция между площадью области связывания и числом аминокислот. Среднее значение площади интерфейса получилось 400 Â2, среднее число контактов между аминокислотными остатками на интерфейс 44.5, а средняя площадь контакта 8.6 Â2.

Предпочтения в контактах между остатками

В этом разделе подробно обсуждаются числа контактов и индексы представленности, вычисленные отдельно для: 1) взаимодействий между доменами одной белковой цепи, 2) между разными доменами разных цепей и 3) между одинаковыми доменами, принадлежащими разным белковым цепям и сравнение их между собой.

Получены следующие результаты:

• во всех указанных выше случаях самые большие числа контактов наблюдаются для взаимодействий между противоположно заряженными аминокислотами (Arg, Lys - Asp, Glu) и между гидрофобными аминокислотами (Leu, Ala, Ile, Phe, Thr, Val). Однако, если говорить о сравнении межцепочечных и внутрицепочечных взаимодействий между доменами, то (если сравнивать относительное число контактов) взаимодействия между доменами, расположенными в разных белковых цепях, более богаты контактами между заряженными остатками, такими как Arg, Asp, Glu, Lys, a также Gin и Asn, и менее богаты гидрофобными взаимодействиями, такими как Leu, Ile, Phe, Val, Trp;

• следует отметить увеличение индекса представленности на главной диагонали матрицы индексов для контактов между идентичными доменами, расположенными в разных белковых цепях. Это усиление диагонали напоминает таковое для контактов между гомодимерами. Все рассуждения относительно контактов, образованных вследствие сближения остатков с одинаковыми номерами, и, следовательно, одного типа, применимы и в данном случае;

• значение индекса представленности контакта Cys-Cys для взаимодействия между одинаковыми доменами составляет 5,8, что является самым большим значением. Отметим, что для взаимодействий между разньми доменами значение индекса составляет только 1,24 для одной цепи и 1,17 для доменов, расположенных в разных белковых цепях;

статистически значимыми также можно считать отклонения для контактов между противоположно заряженными остатками: Arg-Asp, Arg-Glu, Lys-Asp, Lys-Glu для всех трех типов рассматриваемых интерфейсов. Также в эту категорию попадают контакты His-Asp и His-Glu для взаимодействий между доменами в одной белковой цепи;

• все индексы представленности для контактов между гидрофобными аминокислотными остатками лежат в «серой зоне»-величины от 1,20 до 1,58. Значение р-уровня для этих величин составляет около 0,28, что не позволяет сделать вывод о значимости отклонений;

• контакты между гидрофобными и заряженными остатками, за редкими исключениями, имеют величины индексов меньше единицы: от 0,53 до 0,94. Это свидетельствует о том, что контакты такого типа реализуются реже, чем можно было бы предположить из случайной модели;

• одинаково заряженные остатки также имеют величины индексов меньше 1, от 0,29 до 0,99. Это, также как и в случае контактов между гидрофобными и заряженными остатками, свидетельствует о том, что контакты такого типа реализуются реже, чем можно было бы предположить из случайной модели;

• следует отметить, что статистически значимыми являются индексы представленности контактов Cys-Lys (1,88) и Cys-Ser (1,73) для взаимодействий между разными доменами, принадлежащими разным белковым цепям. Также, на фоне усиленной центральной диагонали, отметим контакты His-His (1,74) и Met-Met (2,15) для взаимодействий идентичных доменов, расположенных в разных белковых цепях.

• проведена оценка ошибок для величин gv с использованием метода «складного ножа». Диапазон значений ошибки составил от 0,12% до 0,78%, среднее значение 0,28%. Максимальная ошибка составляет 0,78% для контактов Cys-Asn (0,0057), а минимальная 0,12% для контактов Leu-Val (0,0017).

Глава 5. Исследование взаимодействий белок-ДНК

В этой главе изложены результаты исследования взаимодействий белок-ДНК с помощью разбиения Вороного-Делоне.

Получены следующие результаты:

• построено распределение площадей контактов между аминокислотами и нуклеотидами ДНК;

• определен аминокислотный и нуклеотидный состав интерфейсов исследованных белок-нуклеиновых комплексов;

получены таблицы чисел контактов между атомами аминокислот и нуклеотидов и суммарно на уровне аминокислота -нуклеотид (Таблица 1);

• приблизительно треть всех контактов составляют контакты с положительно заряженными аминокислотами Arg и Lys, 32,3%. Ser и Thr дают следующий по величине вклад - 15%. Asn образует 6 % контактов, также как и Gly;

Таблица 1. Контакты и индексы представленности для взаимодействий аминокислотных остатков с нуклеотидами

ДНК.

Число контактов,с V Индексы

представленности, #„

A T G С S А Т G С

ALA 1283 1456 1313 1268 5320 0,95 0,98 0,97 1,13

ARG 6092 6192 6463 4698 23445 1,02 0,94 1,08 0,95

ASN 2013 2284 1746 1499 7542 1,05 1,08 0,91 0,94

ASP 660 476 1162 804 3102 0,84 0,55 1,47 1,23

CYS 149 183 165 155 652 0,90 1,00 0,99 1,13

GLN 1561 1564 1349 1486 5960 1,03 0,94 0,89 1,18

GLU 869 893 1036 1091 3889 0,88 0,82 1,05 1,33

GLY 1933 2235 1772 1552 7492 1,02 1,06 0,93 0,98

HIS 953 1379 1014 627 3973 0,94 1,24 1,00 0,75

ILE 1090 1215 1011 827 4143 1,04 1,05 0,96 0,95

LEU 1069 1196 882 829 3976 1,06 1,07 0,87 0,99

LYS 4527 4654 4291 3630 17102 1,04 0,97 0,98 1,01

MET 383 599 545 359 1886 0,80 1,13 1,13 0,90

PHE 852 1144 953 645 3594 0,93 1,13 1,04 0,85

PRO 961 1016 712 701 3390 1,12 1,07 0,82 0,98

SER 2298 2667 2527 1862 9354 0,97 1,02 1,06 0,95

THR 2432 2831 2244 2003 9510 1,01 1,06 0,93 1,00

TRP 276 330 294 401 1301 0,83 0,90 0,89 1,46

TYR 1287 1480 1505 1157 5429 0,93 0,97 1,09 1,01

VAL 1256 1461 1053 863 4633 1,07 1,12 0,89 0,89

• получена таблица индексов представленности (Табл.1) контактов между аминокислотами и нуклеотидами ДНК. Согласно индексам представленности, можно выделить следующие предпочтения: для аденина - Pro; для тимина - His, а также Met, Phe, Val; для гуанина - Asp, с чуть меньшим предпочтением Met;

для цитозина - значительный пик для Trp, Glu, Asp, а также для Gin, Cys, Ala.

• проведена оценка ошибок для величин g у с использованием метода «складного ножа» теста. Величина ошибки не превышает 0,3%. Диапазон значений ошибки составил от 0,0004 до 0,0034, среднее значение 0,0012. В процентном отношении средняя ошибка составляет 0,12%. Максимальная ошибка составляет 0,32% для контактов Cys-A (0,0029), а минимальная 0,04% для контактов Arg-Т (0,0004).

Далее рассмотрено изменение индекса представленности при последовательном исключении малых контактов, имеющих площадь от 1 до 9 À (Таблица 2).

Таблица 2. Основные результаты изменения индекса представленности при последовательном исключении малых по

площади контактов.

Увеличение индекса Максимальное значение

А Val, Pro Val

Т His, Ala, Leu His

G Asp, Arg, Ile Asp

С Glu, Cys, Trp Glu

Далее рассмотрены взаимодействия между белком и ДНК на уровне атомарных контактов. Представлены числа контактов между атомами белка и атомами ДНК. Все атомы белка рассортированы на две группы - атомы основной цепи и атомы остатков, а все атомы ДНК разделены на четыре группы - атомы сахара, фосфатной группы и нуклеинового основания, выходящие в малую или большую бороздку двойной спирали.

Получены следующие результаты:

Arg дает наибольший вклад - около 22% всех контактов наблюдаются между атомами аргинина и атомами нуклеотидов. Lys дает 13% всех атом-атомных контактов, тогда как Thr - 7%, Ser -6,6%, Asn - 5,9%, Туг - 5,8%. Вклад каждой из остальных аминокислот не превышает 5%.

Следует отметить, что контакты атомов бокового радикала Arg с атомами ДНК составляют более 90% всех контактов атомов Arg, из них 60% это контакты атомов бокового радикала Arg с

сахарофосфатным остовом ДНК, и около 30% составляют контакты между атомами бокового радикала и атомами нуклеинового основания. Контакты атомов Arg с атомами нуклеотидов осуществляются как по малой, так и по большой бороздке спирали ДНК. Заметим, что с А взаимодействие происходит чуть чаще по малой бороздке, а с Т, G, С - преимущественно по большой бороздке. Lys, также как и Arg, преимущественно взаимодействует с сахарофосфатным остовом ДНК. Также наблюдаются контакты между атомами бокового радикала Lys и атомами большой бороздки нуклеинового основания ДНК, однако с G их наблюдается в два раза больше, чем с А или Т, а с С приблизительно в два раза меньше. Взаимодействия Ser, Thr и Туг главным образом касаются сахарофосфатного остова ДНК, однако также наблюдаются контакты между атомами этих аминокислот и атомами большой бороздки нуклеинового основания T. Asn, как и Gin, образует контакты с сахарофосфатным остовом. Они также образуют контакты между атомами бокового радикала и атомами нуклеиновых оснований ДНК, причем контактов по большой бороздке приблизительно втрое больше. Следует отметить, что Phe взаимодействует как с сахарофосфатным остовом ДНК, так и с нуклеиновыми основаниями. Контакты с нуклеиновыми основаниями А и Т проходят преимущественно по малой бороздке, тогда как контактов Phe с G и С по большой бороздке наблюдается больше, чем по малой.

Теперь рассмотрим, какие атомные контакты характерны для взаимодействий из таблицы 2. Для Glu с С боковой радикал глютаминовой кислоты образует контакты с атомами нуклеинового основания, выходящими в большую бороздку, а также с атомами сахара. Для атомов бокового радикала Asp с G, в порядке убывания, характерны контакты с сахаром, фосфатной группой, большой бороздкой, малой бороздкой. Для His с Т - с сахаром, большой бороздкой, фосфатной группой, малой бороздкой. Для Val с А характерны контакты атомов бокового радикала с сахаром, малой бороздкой, фосфатной группой, большой бороздкой.

Далее рассматриваются примеры из литературы, когда отрицательно заряженные аминокислотные остатки важны для

ДНК-белкового узнавания и связывания. Можно предположить, что связывание полианионной ДНК зависит от кластеров положительно заряженных аминокислот в сближенной с ДНК областью ДНК-связывающего белка. Однако такие кластеры положительно заряженных аминокислот были бы электростатически невыгодными без стабилизирующих взаимодействий с соответствующими отрицательно заряженными остатками. Вместе с тем отрицательно заряженные остатки создают возможность для последующей диссоциации белка и ДНК.

Глава 6. Обсуждение результатов

Выявление характерных аминокислотных контактов и особенностей взаимодействия аминокислот на поверхности белок-белковых сайтов связывания - это необходимые шаги на пути к пониманию пространственной структуры белковых комплексов, а значит и к созданию системы компьютерного моделирования таких взаимодействий.

В этом исследовании продемонстрирована обоснованность применения разбиения Вороного-Делоне. Этот непараметрический метод позволяет по атомным координатам определить контакты между атомами и аминокислотами однозначно и математически строго. Математическая процедура была протестирована на небольших отклонениях в значениях координат атомов, и продемонстрировала стабильность результатов. Разбиение Вороного-Делоне показало замечательную устойчивость к ошибкам, даже при больших отклонениях в координатах (до 1 А). Кроме того, данный метод позволил оценивать значимость каждого контакта по размеру площади и расстоянию.

Разработана статистическая математическая модель контактирующих аминокислот в следующем приближении: два круга бросают на некоторую область случайным образом или прицельно. Аналитически определена плотность вероятности случайных и неслучайных пересечений как зависимость от площади пересечения. На примере общего распределения площадей контактов и распределении площадей контактов между двумя остатками цистеина показана адекватность модели. В рамках

модели можно оценить предпочтительность каждого типа контактов. Сравнение распределения площадей контактов и модельных распределений позволяет сделать вывод о случайном или неслучайном взаимодействии, а также о соотношении случайных и неслучайных контактов. Несколькими статистическими методами показано, что таблицы контактов отражают неслучайный характер образования контактов

Проведенный анализ контактов аминокислот на поверхности взаимодействия различных типов белковых комплексов позволил выявить статистически значимые отклонения от случайной модели. Так, наиболее предпочтительными являются контакты между остатками цистеина, а также между остатками с противоположными зарядами.

Если говорить о сравнении межцепочечных и внутрицепочечных взаимодействий между доменами, то (если сравнивать относительное число контактов) взаимодействия между доменами, расположенными в разных белковых цепях более богаты контактами между заряженными остатками, такими как Arg, Asp, Glu, Lys, a также Gin и Asn, и менее богаты гидрофобными взаимодействиями, такими как Leu, Ile, Phe, Val, Trp.

Важное отличие интерфейсов, образованных разными и одинаковыми белковыми единицами, заключатся во встречаемости контактов между остатками одного типа. Остатки с одинаковыми номерами (и, как следствие, одного типа) пространственно сближаются в центральной области интерфейса. Этот эффект становится очевидным при сравнении диагональных элементов таблиц индексов представленности.

На основании проведенных исследований специфичности взаимодействий остатков и нуклеотидов на интерфейсах белок-ДНК показано, что значимыми являются отклонения для контактов Asp-G, Trp-C, Glu-C, Asp-C и His-T. На атомном уровне наибольший вклад дает Arg - около 22% всех контактов наблюдаются между атомами Arg и атомами нуклеотидов. Lys дает 13% всех атом-атомных контактов, тогда как Thr - 7%, Ser - 6.6%, Asn - 5.9%, Туг - 5.8%. Вклад каждой из остальных аминокислот не превышает 5%.

Выводы

1. Для определения контактирующих атомов и оценки поверхности взаимодействия белок-белок или белок-ДНК разработан метод на основе разбиения Вороного-Делоне. В рамках метода предложен способ оценки случайности образования контактов, который включает статистическую модель случайных и неслучайных контактов, позволяющую оценивать статистическую значимость обнаруженных контактов.

2. Предложен алгоритм, время работы которого пропорционально числу атомов. Разработано программное обеспечение, включающее модули для разбиения Вороного-Делоне, последующей обработки информации о контактах, а также визуализации пространственных построений.

3. Составлены невырожденные выборки интерфейсов белок-белковых и белок-нуклеиновых взаимодействий. С помощью разработанного комплекса программ изучена поверхность взаимодействия в больших выборках белок-белковых и белок-нуклеиновых комплексов.

4. Показано, что для всех рассмотренных типов белок-белковых взаимодействий статистически значимыми отклонениями от случайной модели являются контакты между остатками цистеина, а также между остатками с противоположными зарядами. Установлено, что для белковых комплексов, образованных двумя идентичными субъединицами, характерно увеличение доли контактов между аминокислотными остатками одного типа.

5. На основании проведенных исследований специфичности взаимодействий аминокислотный остатков и нуклеотидов на интерфейсах белок-ДНК сделан вывод, что значимыми являются контакты типа Авр-й, Тгр-С, 01и-С, Аэр-С и Иэ-Т. Предложен механизм участия отрицательно заряженных остатков в специфических взаимодействиях белок-ДНК.

Список работ, опубликованных по теме диссертации

1. Анашкииа А.А., Туманян В.Г., Кузнецов Е.Н., Галкин А.В., Есипова Н.Г. Геометрический анализ ДНК-белковых взаимодействий на основе метода Вороного-Делоне. Биофизика, 2008, т. 53, с. 402-406.

2. Anashkina А.А., Kuznetsov Е., Esipova N., Tumanyan V. Protein-Protein Interfaces: Amino Acids Bias for Heterocomplexes and Homodimers. Joint Meeting of the Biophysical Society 52nd Annual Meeting and 16th International Biophysics Congress 2-6 February, 2008, Long Beach, CA, USA

3. Anashkina A.A., Kuznetsov E.N., Esipova N.G., Tumanyan V.G. Comprehensive Statistical Analysis of Residues Interaction Specificity at Protein-Protein Interfaces. Proteins, 2007, v. 67, p. 1060-1077

4. Анашкина А.А.,' Кузнецов E.H. и др. Статистический анализ распределения контактов в белок-белковых комплексах. Третья международная конференция по проблемам управления (20 - 22 июня 2006 года). Пленарные доклады и избранные труды. -М.: Институт проблем управления. 2006.

5. Anashkina А.А., Tumanyan V.G. Voronoi-Delaune tessellation for protein-protein complexes modeling. Proceedings of the international Moscow conference on computational molecular biology. Moscow, Russia, July 18-21,2005, pp. 36-37.

6. Anashkina A. A., Tumanyan V. G. Voronoi-Delaune tesselation for protein-protein complexes modeling. Russia, Moscow. "Математика. Компьютер. Образование". Сб. трудов XII международной конференции. Под общей редакцией Г.Ю. Ризниченко. Ижевск: Научно-издательский центр "Регулярная и хаотическая динамика", 2005. Vol. 3, pp. 877889.

7. Анашкина А.А., Туманян В.Г. Применение построения Вороного-Делоне для исследования пространственных отношений в белковой глобуле. III съезд биофизиков России, 24-29 июня 2004 г, Воронеж, стр. 751.

8. Анашкина A.A., Туманян В.Г. Исследование доменной структуры глобулярных белков с помощью построения Вороного-Делоне. VIII международная конференция: образование, экология, экономика, информатика. Астрахань, Россия, сентябрь 15-20, 2003.

9. Анашкина A.A., Туманян В.Г. Исследование доменной структуры глобулярных белков с помощью построения Вороного-Делоне. 14-я Международная зимняя молодежная научная школа «Перспективные направления физико-химической биологии и биотехнологии», 11-15 февраля 2002 г.

10. Анашкина A.A., Туманян В.Г. Применение построения Вороного-Делоне для исследования доменной структуры глобулярных белков. XLIV научная конференция МФТИ, 2001

11. Анашкина A.A., Березовский И.Н., Есипова Н.Г., Туманян В.Г. Анализ доменной структуры некоторых глобулярных белков и их комплексов. 13-я Международная зимняя молодежная научная школа «Перспективные направления физико-химической биологии и биотехнологии», февраль 2001 г.

Напечатано с готового оригинал-макета

Издательство ООО "МАКС Пресс" Лицензия ИД N 00510 от 01.12.99 г. Подписано к печати 31.10.2008 г. Формат 60x90 1/16. Уел печ л. 1,5. Тираж 100 экз. Заказ 629. Тел. 939-3890. Тел./факс 939-3891. 119992, ГСП-2, Москва, Ленинские горы, МГУ им. М.В. Ломоносова, 2-й учебный корпус, 627 к.

Содержание диссертации, кандидата физико-математических наук, Анашкина, Анастасия Андреевна

Введение.

Цели и задачи исследования.

Научная новизна.

Практическое значение работы.

Глава 1. Обзор литературы.

Взаимодействия белок-ДНК.

Глава 2. Методы.

Разбиение Вороного-Делоне.

Модели случайно и неслучайно контактирующих химических единиц амннокислот/нуклеотидов).

Использованные статистические подходы.

Глава 3. Исследование белок-белковых контактов.

Исследованная выборка белок-белковых комплексов.

Статистика атом-атомных контактов.

Аминокислотный состав белок-белковых интерфейсов.

Контакты между аминокислотными остатками.

Предпочтения в контактах между аминокислотными остатками.

Глава 4. Исследование междоменных контактов в глобулярных белках

Исследованная выборка.

Аминокислотный состав областей взаимодействия доменов.

Контакты между аминокислотными остатками.

Предпочтения в контактах между аминокислотными остатками.

Глава 5. Исследование контактов в комплексах белок-ДНК.

Статистика контактов между аминокислотными остатками и нуклеотндами в области взаимодействий белок-ДНК.

Влияние малых но площади контактов на величину индекса представленности.

Статистика атом-атомных контактов при взаимодействиях белок-ДНК.

Глава 6. Обсуждение результатов.

ВЫВОДЫ.

Введение Диссертация по биологии, на тему "Стерическая избирательность белок-белковых и белок-нуклеиновых контактов"

Общеизвестно, что физико-химические свойства макромолекул определяются последовательностью их химических единиц. Знание принципов взаимодействия биологических макромолекул, понимание связи между аминокислотной последовательностью, строением и взаимодействием белков даст возможность для развития фундаментальных подходов, а также компьютерного моделирования взаимодействий белковых молекул, что существенно изменит процесс создания новых лекарственных средств. Адекватный способ моделирования взаимодействий между белковыми молекулами позволит существенно сократить временные и финансовые затраты, связанные с исследованием свойств новых белковых препаратов.

Белок-белковые взаимодействия являются решающими практически во всех основных биологических процессах, таких как клеточная регуляция, пути биосинтеза и распада, передача сигнала, инициация репликации ДНК, транскрипция и трансляция, образование олигомеров и мультимолекулярных комплексов, упаковка вирусов и иммунный ответ. Благодаря своей важности взаимодействия белков - предмет многих исследований. Однако расшифровка природы взаимодействий белков является достаточно трудной задачей. С физико-химической точки зрения имеет место сложный баланс относительного вклада различных взаимодействий, и большое разнообразие мотивов, составляющих область взаимодействия.

Проблема контактов между аминокислотными остатками носит довольно сложный характер и требует усовершенствованных методов анализа. В большинстве случаев наблюдаемые эффекты зависят от параметров, используемых при вычислении. Поэтому желательно, если это возможно, применение непараметрического метода. Разбиение Вороного-Делоне - классический непараметрический метод, позволяющий определять прямые контакты между атомами, и, соответственно, между аминокислотами. Разбиение Вороного-Делоне уже давно прекрасно зарекомендовало себя в структурной биологии. С помощью этого разбиения исследовали плотность упаковки атомов белков, средние объемы аминокислот, объемы атомов на поверхности белков, а также средние объемы атомов в пространственных структурах большого числа неорганических соединений и белков.

Предсказывать возможные области контактов между двумя данными белками, а также конкретные аспекты таких взаимодействий в настоящее время возможно лишь с ограниченной точностью и большими временными затратами. Структуры белков состоят из большого числа атомов, остатки аминокислот зачастую довольно подвижны, и имеют много степеней свободы, а потому процесс реконструкции взаимодействия сопряжен с большой трудоемкостью в вычислительном смысле. Даже возрастающие с каждым годом мощности суперкомпьютеров и кластеров не позволяют провести такой анализ для всего банка белковых структур. В связи с этим встает задача разработки новых подходов к моделированию взаимодействий белковых цепей и конструированию областей их контактов, а для этого необходимо знать характерные особенности таких взаимодействий.

Наиболее часто для изучения ключевых для взаимодействия аминокислот используют сайт-направленный мутагенез, кинетику равновесных и неравновесных состояний, анализ рН, изотопное разделение и равновесное связывание. Многочисленные исследователи, при изучении группы гомологичных белков, определяют важные для распознавания и связывания аминокислоты в рамках данной группы, однако общих, универсальных правил или «кода» распознавания для всех белков по прежнему не найдено (Mandel-Gutfreund, Schueler et al. 1995; Pabo and Nekludova 2000; Benos, Lapedes et al. 2002; Coulocheri, Pigis et al. 2007; Siggers and Honig 2007). По нашему мнению, причина этого - отсутствие адекватного метода количественной оценки реальных контактов между аминокислотными остатками/нуклеотидами.

Цели и задачи исследования

Главной целью проведённой работы было установление статистических закономерностей, характерных для контактов аминокислот во взаимодействиях между белковыми молекулами и между молекулами белка и ДНК. В задачи работы входило:

• разработка метода оценки поверхностей контакта белок-белковых и белок-нуклеиновых комплексов на основе разбиения Вороного-Делоне и создание комплекса программ, позволяющего выявлять и анализировать контакты внутри биологических макромолекул и между ними, начиная с атомного уровня организации;

• создание невырожденных выборок белок-белковых интерфейсов, домен-доменных интерфейсов и белковых цепей, а также белок-нуклеиновых комплексов;

• построение разбиения Вороного-Делоне для каждого белка/комплекса выборки и определение контактов, начиная с атомного уровня;

• разработка модели случайно и неслучайно взаимодействующих аминокислотных остатков на поверхности области взаимодействия и установление свойств модели;

• определение пар аминокислотных остатков/нуклеотидов, взаимодействующих чаще или реже, чем можно ожидать из модели случайных взаимодействий; доказательство статистической значимости отклонений; • определение ошибок.

Научная новизна.

Впервые для определения контактирующих атомов использовано разбиение Вороного-Делоне. Предложен и использован алгоритм, время работы которого пропорционально числу рассматриваемых атомов, что позволяет применить построение Вороного-Делоне к структурам белковых и белок-нуклеиновых комплексов. Показана устойчивость метода к достаточно большим - вариациям в координатах атомов, т.е. адекватность результатов для белков, определенных с достаточно низким разрешением РСА.

Впервые проанализированы выборки максимально возможного объема различных типов белок-белковых и. белок-нуклеиновых интерфейсов. Контакты определены на атомарном уровне, на основе этих данных установлены контакты между химическими единицами.

Построены модели случайного и специфического контактирования аминокислот на поверхности белок-белкового или белок-нуклеинового взаимодействия. На основе этих моделей определены предпочтения для взаимодействия аминокислотных остатков на поверхности контактов в белок-белковых или белок-нуклеиновых комплексах.

Впервые показано, что наибольшая предпочтительность наблюдается для взаимодействий между двумя цистеинами, как на поверхности контактов двух идентичных белковых цепей (гомодимеров), так и на поверхности контактовы разных белковых цепей (гетерокомплексов), а также для взаимодействий между идентичными и разными белковыми доменами.

Показано, что для всех типов белок-белкового взаимодействия, а также для взаимодействия между аминокислотами в рамках одной белковой цепи важную роль играют противоположно заряженные пары аминокислот, демонстрирующие высокий уровень предпочтения.

Установлены специфические (предпочтительные) взаимодействия между аминокислотами и нуклеотидами. Показано, что с цитозином специфически связываются отрицательно заряженные аминокислоты — аспарагиновая и глютаминовая кислоты.

Практическое зпаченис работы.

Полученные в результате проведенных исследований данные по аминокислотным предпочтениям могут представлять ценность при создании системы предсказания областей белок-белкового и белок-нуклеинового узнавания и связывания, исследовании пространственных структур фибриллярных и глобулярных белков, при разработке новых биологически активных веществ с заданными свойствами. Кроме того, они вносят вклад в понимание механизмов формирования структуры белковых молекул. Использовать такой материал можно будет в различных прикладных областях, в том числе в области медицины и фармакологии.

Заключение Диссертация по теме "Биофизика", Анашкина, Анастасия Андреевна

Отрадно сознавать, что использование новой методики на основе разбиения Вороного-Делоне и моделей с оценкой ожидаемого и наблюдаемого количества контактов с введением понятия «индекс предпочтительности» позволило разделить контакты на случайные и неслучайные и оценить, таким образом, отношение каждого из контактов к варианту специфических или неспецифических взаимодействий. ВЫВОДЫ

1. Для определения контактирующих атомов и оценки поверхности взаимодействия белок-белок или белок-ДНК разработан метод на основе разбиения Вороного-Делоне. В рамках метода предложен способ оценки случайности образования контактов, который включает статистическую модель случайных и неслучайных контактов, позволяющую оценивать статистическую значимость обнаруженных контактов.

2. Предложен алгоритм, время работы которого пропорционально числу атомов. Разработано программное обеспечение, включающее модули для разбиения Вороного-Делоне, последующей обработки информации о контактах, а также визуализации пространственных построений.

3. Составлены невырожденные выборки интерфейсов белок-белковых и белок-нуклеиновых взаимодействий. С помощью разработанного комплекса программ изучена поверхность взаимодействия в больших выборках белок-белковых и белок-нуклеиновых комплексов.

4. Показано, что для всех рассмотренных типов белок-белковых взаимодействий статистически значимыми отклонениями от случайной модели являются контакты между остатками цистеина, а также между остатками с противоположными зарядами. Установлено, что для белковых комплексов, образованных двумя идентичными субъедшшцами, характерно увеличение доли контактов между аминокислотными остатками одного типа.

5. На основании проведенных исследований специфичности взаимодействии аминокислотный остатков и нуклеотидов на интерфейсах белок-ДНК сделан вывод, что значимыми являются контакты типа Asp-G, Trp-C, GIu-C, Asp-C и His-T. Предложен механизм участия отрицательно заряженных остатков в специфических взаимодействиях белок-ДНК.

Библиография Диссертация по биологии, кандидата физико-математических наук, Анашкина, Анастасия Андреевна, Москва

1. Aloy, P., H. Ceulemans, et al. (2003). "The relationship between sequence and interaction divergence in proteins." J Mol Biol 332(5): 989-98.

2. Aloy, P. and R. B. Russell (2002). "Interrogating protein interaction networks through structural biology." ProcNatl AcadSciUS A 99(9): 5896-901.

3. Amadasi, A., F. Spyrakis, et al. (2006). "Mapping the energetics of water-protein and waterligand interactions with the "natural" HINT forcefield: predictive tools for characterizing the roles of water in biomolecules." J Mol Biol 358(1): 289-309.

4. Amblar, M., M. G. de Lacoba, et al. (2001). "Biochemical analysis of point mutations in the 5-3' exonuclease of DNA polymerase I of Streptococcus pneumoniae. Functional and structural implications." J Biol Chem 276(22): 19172-81.

5. Anashkina, A., E. Kuznetsov, et al. (2007). "Comprehensive statistical analysis of residues interaction specificity at protein-protein interfaces." Proteins 67(4): 1060-77.

6. Angelov, В., J. F. Sadoc, et al. (2002). "Nonatomic solvent-driven Yoronoi tessellation of proteins: an open tool to analyze protein folds." Proteins 49(4): 446-56.

7. Ansari, S. and V. Helms (2005). "Statistical analysis of predominantly transient protein-protein interfaces." Proteins 61(2): 344-55.

8. Aqvist, J. and M. Fothergill (1996). "Computer simulation of the triosephosphate isomerase catalyzed reaction." J Biol Chem 271(17): 10010-6.

9. Argos, P. (1988). "An investigation of protein subunit and domain interfaces." Protein Eng 2(2): 101-13.

10. Bahadur, R. P., P. Chakrabarti, et al. (2003). "Dissecting subunit interfaces in homodimeric proteins." Proteins 53(3): 708-19.

11. Bahadur, R. P., P. Chakrabarti, et al. (2004). "A dissection of specific and non-spccific protein-protein interfaces." J Mol Biol 336(4): 943-55.

12. Bahar, I. and R. L. Jernigan (1997). "Inter-residue potentials in globular proteins and thedominance of highly specific hydrophilic interactions at close separation." J Mol Biol 266(1): 195-214.

13. Baker, T. A. and L. Luo (1994). "Identification of residues in the Mu transposase essential for catalysis." Proc Natl Acad Sci U S A 91(14): 6654-8.

14. Balandina, A., D. Kamashev, et al. (2002). "The bacterial histone-like protein HU specifically recognizes similar structures in all nucleic acids. DNA, RNA, and their hybrids." J Biol Chem 277(31): 27622-8.

15. Benanti, E. L. and P. T. Chivers (2007). "The N-terminal arm of the Helicobacter pylori Ni2+-dependent transcription factor NikR is required for specific DNA binding." J Biol Chem 282(28): 20365-75. '

16. Benezra, R. (1994). "An intermolecular disulfide bond stabilizes E2A homodimers and is required for DNA binding at physiological temperatures." Cell 79(6): 1057-67.

17. Benos, P. Y., A. S. Lapedes, et al. (2002). "Is there a code for protein-DNA recognition? Probab(ilistical)ly." Bioessays 24(5): 466-75.

18. Benos, P. V., A. S. Lapedes, et al. (2002). "Probabilistic code for DNA recognition by proteins of the EGR family." J Mol Biol 323(4): 701-27.

19. Bergman, L. W. and W. M. Kuehl (1979). "Formation of intermolecular disulfide bonds on nascent immunoglobulin polypeptides." J Biol Chem 254(13): 5690-4.

20. Berman, H. M., J. Westbrook, et al. (2000). "The Protein Data Bank." Nucleic Acids Res 28(1): 235-42.

21. Bohm, H. J. (1994). "The development of a simple empirical scoring function to estimate the binding constant for a protein-ligand complex of known three-dimensional structure." J Comput Aided Mol Pes 8(3): 243-56.

22. Brennan, R. G., S. L. Roderick, et al. (1990). "Protein-DNA conformational changes in thecrystal structure of a lambda Cro-operator complex." Proc Natl Acad Sci U S A 87(20): 8165-9.

23. Brown, J. H. (2006). "Breaking symmetry in protein dimers: designs and functions." Protein Sci 15(1): 1-13.

24. Chakrabarti, P. and J. Janin (2002). "Dissecting protein-protein recognition sites." Proteins 47(3): 334-43.

25. Chen, D. L. and G. E. Kellogg (2005). "A computational tool to optimize ligand selectivitybetween two similar'biomacromolecular targets." J Comput Aided Mol Pes 19(2): 69-82.

26. Cherfils, J., S. Duquerroy, et al. (1991). "Protein-protein recognition analyzed by docking simulation." Proteins 11(4): 271-80.

27. Choo, Y. and A. Klug (1997). "Physical basis of a protein-DNA recognition code." Curr Opin Struct Biol 7(1): 117-25.

28. Chothia, C. (1976). "The nature of the accessible and buried surfaces in proteins." J Mol Biol 105(1): 1-12.

29. Christensen, S. W. andN. W. Thomas (1999). "Structure characterization and predictability by Voronoi analysis." Acta Crvstallogr A 55(Pt 5): 811-820.

30. Cooper, A. (2005). "Heat capacity effects in protein folding and ligand binding: a re-evaluation of the role of water in biomolecular thermodynamics." Biophvs Chem 115(2-3): 89-97.

31. Coulocheri, S. A., D. G. Pigis, et al. (2007). "Hydrogen bonds in protein-DNA complexes: where geometry meets plasticity." Biochimie 89(11): 1291-303.

32. Cozzini, P., M. Fornabaio, et al. (2002). "Simple, intuitive calculations of free energy of binding for protein-ligand complexes. 1. Models without explicit constrained water." J Med Chem 45(12): 2469-83.

33. Cozzini, P., M. Fornabaio, et al. (2004). "Free energy of ligand binding to protein: evaluation of the contribution of water molecules by computational methods." Curr Med Chem 11(23): 3093-118.

34. Dasgupta, S., G. H. Iyer, et al. (1997). "Extent and nature of contacts between protein molecules in crystal lattices and between subunits of protein oligomers." Proteins 28(4): 494-514.

35. DeMeo, S. D., R. M. Lombel, et al. (2008). "Specificity of DNA-binding by the FAX-1 and

36. NHR-67 nuclear receptors of Caenorhabditis elegans is partially mediated via a subclass-specific P-box residue." BMC Mol Biol 9: 2.

37. Draper, D. E. (1993). "Protein-DNA complexes: the cost of recognition." Proc Natl Acad Sci U S A 90(16): 7429-30.

38. Eldridge, M. D., C. W. Murray, et al. (1997). "Empirical scoring functions: I. The development of a fast empirical scoring function to estimate the binding affinity of ligands in receptor complexes." J Comput Aided Mol Pes 11(5): 425-45.

39. Fornabaio, M., F. Spyrakis, et al. (2004). "Simple, intuitive calculations of free energy of binding for protein-ligand complexes. 3. The free energy contribution of structural water molecules in HIV-1 protease complexes." J Med Chem 47(18): 4507-16.

40. Garner, M. M. and M. B. Burg (1994). "Macromolecular crowding and confinement in cells exposed to hypertonicity." Am J Physiol 266(4 Pt 1): C877-92.

41. Garner, M. M. and D. C. Rau (1995). "Water release associated with specific binding of gal repressor." Embo J 14(6): 1257-63.

42. Gerstein, M., J. Tsai, et al. (1995). "The volume of atoms on the protein surface: calculated from simulation, using Voronoi polyhedra." J Mol Biol 249(5): 955-66.

43. Glaser, F., D. M. Steinberg, et al. (2001). "Residue frequencies and pairing preferences at protein-protein interfaces." Proteins 43(2): 89-102.

44. Goodford, P. J. (1985). "A computational procedure for determining energetically favorable binding sites on biologically important macromolecules." J Med Chem 28(7): 849-57.

45. Gorfe, A. A. and I. Jelesarov (2003). "Energetics of sequence-specific protein-DNA association: computational analysis of integrase Tn916 binding to its target DNA." Biochemistry 42(40): 11568-76.

46. Greene, L. H., Т. E. Lewis, et al. (2007). "The CATH domain structure database: new protocols and classification levels give a more comprehensive resource for exploring evolution." Nucleic Acids Res 35(Patabase issue): D291-7.

47. Guharoy, M. and P. Chakrabarti (2005). "Conservation and relative importance of residues across protein-protein interfaces." Proc Natl Acad Sci U S A 102(43): 15447-52.

48. Gurlie, R., Т. H. Duong, et al. (1999). "The role of DNA-protein salt bridges in molecular recognition: a model study." Biopolymers 49(4^: 313-27.

49. Gurskii, G. V., V. G. Tumanian, et al. (1975). "A code governing specific binding of regulatory proteins to DNA and structure of stereospecific sites of regulatory proteins." Mol Biol £Mosk) 9(5): 635-51.

50. Gurskii, G. V. and A. S. Zasedatelev (1978). "Precise relationships for calculating the binding of regulatory proteins and other lattice ligands in double-stranded polynucleotides." Biofizika 23(5): 932-46.

51. Halford, S. E. and J. F. Marko (2004). "How do site-specific DNA-binding proteins find their targets?" Nucleic Acids Res 32(10^): 3040-52.

52. Harbury, P. В., Т. Zhang, et al. (1993). "A switch between two-, three-, and four-stranded coiled coils in GCN4 leucine zipper mutants." Science 262(5138): 1401-7.

53. Harrington, R. E. (1992). "DNA curving and bending in protein-DNA recognition." Mol Microbiol 6(18): 2549-55.

54. Hendlich, M., P. Lackner, et al. (1990). "Identification of native protein folds amongst a largenumber of incorrect models. The calculation of low energy conformations from potentials of mean force." J Mol Biol 216(1): 167-80.

55. Hendsch, Z. S. and B. Tidor (1994). "Do salt bridges stabilize proteins? A continuum electrostatic analysis." Protein Sci 3(2): 211-26.

56. Higashibata, H., M. A. Siddiqui, et al. (2003). "Surface histidine residue of archaeal histone affects DNA compaction and thermostability." FEMS Microbiol Lett 224ГП: 17-22.

57. Hollenbeck, J. J., D. L. McClain, et al. (2002). "The role of helix stabilizing residues in GCN4 basic region folding and DNA binding." Protein Sci 11(11): 2740-7.

58. Honda, M., J. Inoue, et al. (2006). "Identification of the RecR Toprim domain as the binding site for both RecF and RecO. A role of RecR in RecFOR assembly at double-stranded DNA-single-stranded DNA junctions." J Biol Chem 281(27): 18549-59.

59. Honig, B. and A. Nicholls (1995). "Classical electrostatics in biology and chemistry." Science 268(5214): 1144-9.

60. Honig, B. and A. S. Yang (1995). "Free energy balance in protein folding." Adv Protein Chem 46: 27-58.

61. Honig, В. H. and W. L. Hubbell (1984). "Stability of "salt bridges" in membrane proteins." Proc Natl Acad Sci U S A 81(17^): 5412-6.

62. Horton, N. and M. Lewis (1992). "Calculation of the free energy of association for protein complexes." Protein Sci 1(1): 169-81.

63. Hubbard, S. (1992). ACCESS: A program for calculating accessibilities. Department of Biochemistry and Molecular Biology. University College of London.

64. Hubbard, S. J. and P. Argos (1994). "Cavities and packing at protein interfaces." Protein Sci 3(12): 2194-206.

65. Jang, Y. J. and D. Sanford (2001). "Modulation of fine specificity of anti-DNA antibody by CDR3L residues." Mol Immunol 38(5): 383-7.

66. Janin, J. (1999). "Wet and dry interfaces: the role of solvent in protein-protein and protein-DNA recognition." Structure 7(12): R277-9.

67. Janin, J. and C. Chothia (1978). "Role of hydrophobicity in the binding of coenzymes. Appendix. Translational and rotational contribution to the free energy of dissociation." Biochemistry 17(15): 2943-8.

68. Janin, J., S. Miller, et al. (1988). "Surface, subunit interfaces and interior of oligomeric proteins." JMol Biol 204(1'): 155-64.

69. Janin, J., S. Wodak, et al. (1978). "Conformation of amino acid side-chains in proteins." J. Mol. Biol. 125: 357-386

70. Jayaram, B. and T. Jain (2004). "The role of water in protein-DNA recognition." Annu Rev Biophys Biomol Struct 33: 343-61.

71. Jones, S. and J. M. Thornton (1996). "Principles of protein-protein interactions." Pro с Natl Acad SciUS А93Ш: 13-20.

72. Jones, S., P. van Heyningen, et al. (1999). "Protein-DNA interactions: A structural analysis." J Mol Biol 287(5): 877-96.

73. Jordan, S. R. and С. O. Pabo (1988). "Structure of the lambda complex at 2.5 A resolution: details of the repressor-operator interactions." Science 242(4880): 893-9.

74. Kabsch, W. and C. Sander (1983). "Dictionary of protein secondary structure: patternrecognition of hydrogen-bonded and geometrical features." Biopolymers 22(12): 2577637.

75. Kalodimos, C. G., N. Biris, et al. (2004). "Structure and flexibility adaptation in nonspecific and specific protein-DNA complexes." Science 305(5682): 386-9.

76. Kendall M. and A. Stuart (1998). Kendall's Advanced Theory of Statistics.

77. Keskin, О., I. Bahar, et al. (1998). "Empirical solvent-mediated potentials hold for both intramolecular and inter-molecular inter-residue interactions." Protein Sci 7(12): 2578-86.

78. Keskin, О., C. J. Tsai, et al. "(2004). "A new, structurally nonredundant, diverse data set of protein-protein interfaces and its implications." Protein Sci 13(4): 1043-55.

79. Kim, W. K. and J. C. Ison (2005). "Survey of the geometric association of domain-domain interfaces." Proteins 61(4): 1075-88.

80. Mandel-Gutfreund, Y. and H- Margalit (1998). "Quantitative parameters for amino acid-baseinteraction: implications for prediction of protein-DNA binding sites." Nucleic Acids Res 26(10): 2306-12.

81. Mandel-Gutfreund, Y., IT. Margalit, et al. (1998). "A role for CH.O interactions in protein-DNA recognition." J Mol Biol 277(5): 1129-40.

82. Mandel-Gutfreund, Y., О. Schueler, et al. (1995). "Comprehensive analysis of hydrogen bonds in regulatory protein DNA-complexes: in search of common principles." J Mol Biol 253(2): 370-82.

83. Matthew, J. B. (1985). "Electrostatic effects in proteins." Annu Rev Biophys Biophys Chem 14: 387-417.

84. Matthews, B. W. (1988). "Protein-DNA interaction. No code for recognition." Nature 335(6188): 294-5.

85. Minton, A. P. (1998). "Molecular crowding: analysis of effects of high concentrations of inert cosolutes on biochemical equilibria and rates in terms of volume exclusion." Methods Enzvmol 295: 127-49.

86. Mintz, S., A. Shulman-Peleg, et al. (2005). "Generation and analysis of a protein-proteininterface data set with similar chemical and spatial patterns of interactions." Proteins 61(1): 6-20.

87. Monecke, P., T. Borosch, et al. (2006). "Determination of the interfacial water content in protein-protein complexes from free energy simulations." Biophys J 90(3): 841-50.

88. Mozzarelli, A. and G. L. Rossi (1996). "Protein function in the crystal." Annu Rev Biophys Biomol Struct 25: 343-65.

89. Nooren, I. M. and J. M. Thornton (2003). "Diversity of protein-protein interactions." Embo J 22(14): 3486-92.

90. Oda, M. and H. Nakamura (2000). "Thermodynamic and kinetic analyses for understanding sequence-specific DNA recognition." Genes Cells 5(5): 319-26.

91. Pabo, С. O. and L. Nekludova (2000). "Geometric analysis and comparison of protein-DNA interfaces: why is there no simple code for recognition?" J Mol Biol 301(3): 597-624.

92. Pabo, С. O. and R. T. Sauer (1984). "Protein-DNA recognition." Annu Rev Biochem 53: 293321.

93. Pabo, С. O. and R. T. Sauer (1992). "Transcription factors: structural families and principles of DNA recognition." Annu Rev Biochem 61: 1053-95.

94. Papoian, G. A., J. Ulander, et al. (2003). "Role of water mediated interactions in protein-protein recognition landscapes." J Am Chem Soc 125(30): 9170-8.

95. Park, J., M. Lappe, et al. (2001). "Mapping protein family interactions: intramolecular andintermolecular protein family interaction repertoires in the PDB and yeast." J Mol Biol 307(3): 929-38.

96. Parsegian, V. A., R. P. Rand, et al. (1995). "Macromolecules and water: probing with osmotic stress." Methods Enzvmol 259: 43-94.

97. Pearson, W. R. (1990). "Rapid and sensitive sequence comparison withFASTP and FASTA." Methods Enzvmol 183: 63-98.

98. Ponder, J. W. and F. M. Richards (1987). "Tertiary templates for proteins. Use of packingcriteria in the enumeration of allowed sequences for different structural classes." ,T Mol Biol 193(4): 775-91.

99. Ponstingl, H., K. Henrick, et al. (2000). "Discriminating between homodimeric and monomeric proteins in the crystalline state." Proteins 41(1): 47-57.

100. Ponting, C. P. and R. R. Russell (2002). "The natural history of protein domains." Annu Rev Biophys Biomol Struct 31: 45-71.

101. Poupon, A. (2004). "Voronoi and Voronoi-related tessellations in studies of protein structure and interaction." Curr Opin Struct Biol 14(2): 233-41.

102. Prlic, A., F. S. Domingues, et al. (2000). "Structure-derived substitution matrices for alignment of distantly related sequences." Protein Eng 13(8): 545-50.

103. Pullman, B. (1983). "Electrostatics of Polymorphic DNA." J Biomol Struct Dvn 1(3): 773-94.

104. Quillin, M. L. and B. W. Matthews (2000). "Accurate calculation of the density of proteins." Acta Crvstallogr D Biol Crystallogr 56 (Pt 7): 791-4.

105. Reddy, С. K., A. Das, et al. (2001). "Do water molecules mediate protein-DNA recognition?" J Mol Biol 314(3): 619-32.

106. Richards, F. M. (1974). "The interpretation of protein structures: total volume, group volume distributions and packing density." J Mol Biol 82(1): 1-14.

107. Robert, С. H. and P. S. Ho (1995). "Significance of bound water to local chain conformations in protein crystals." Proc Natl Acad Sci U S A 92(16): 7600-4.

108. Rodier, F., M. Chiadmi, et al. (1990). "An array processor program for computing the neighbours in molecular packing." Acta Cryst A46:37.

109. Rothwell, D. G., B. Hang, et al. (2000). "Substitution of Asp-210 in HAP1 (APE/Ref-1)eliminates endonuclease activity but stabilises substrate binding." Nucleic Acids Res 28(11): 2207-13.

110. Saha, R. P., R. P. Bahadur, et al. (2005). "Interresidue contacts in proteins and protein-protein interfaces and their use in characterizing the homodimeric interface." J Proteome Res 4(5): 1600-9.

111. Saito, A., H. Iwasaki, et al. (1995). "Identification of four acidic amino acids that constitute the catalytic center of the RuvC Holliday junction resolvase." Proc Natl Acad Sci U S A 92(16): 7470-4.

112. Schneider, В., К. Patel, et al. (1998). "Hydration of the phosphate group in double-helical DNA." Biophvs J 75(5): 2422-34.

113. Schultz, S. C., G. C. Shields, et al. (1991). "Crystal structure of a CAP-DNA complex: the DNA is bent by 90 degrees." Science 253(5023): 1001-7.

114. Schwabe, J. W. (1997). "The role of water in protein-DNA interactions." Curr Opin Struct Biol 7(1): 126-34.

115. Secman, N. C., J. M. Rosenberg, et al. (1976). "Sequence-specific recognition of double helical nucleic acids by proteins." Proc Natl Acad Sci U S A 73(3): 804-8.

116. Shieh, F. K. and N. O. Reich (2007). "AdoMet-dependent methyl-transfer: Glul 19 is essential for DNA C5-cytosine methyltransferase M.Hhal." J Mol Biol 373(5): 1157-68.

117. Sidorova, N. Y. and D. C. Rau (2001). "Linkage of EcoRI dissociation from its specific DNA recognition site to water activity, salt concentration, and pH: separating their roles in specific and non-specific binding." J Mol Biol 310(4): 801-16.

118. Siggers, T. W. and B. Honig (2007). "Structure-based prediction of C2H2 zinc-finger binding specificity: sensitivity to docking geometry." Nucleic Acids Res 35(4): 1085-97.

119. Sinha, S. K., S. Chakraborty, et al. (2008). "Thickness of the hydration layer of a protein from molecular dynamics simulation." J Phys Chem В 112(27): 8203-9.

120. Skorvaga, M., K. Theis, et al. (2002). "The beta -hairpin motif of UvrB is essential for DNAbinding, damage processing, and UvrC-mediated incisions." J Biol Chem 277(2): 1553-9.

121. Soyer, A., J. Chomilier, et al. (2000)." Voronoi tessellation reveals the condensed matter character of folded proteins." Phys Rev Lett 85(16): 3532-5.

122. Spyrakis, F., P. Cozzini, et al. (2007). "Energetics of the protein-DNA-water interaction." BMC Struct Biol 7: 4.

123. Sternberg, M. J., H. A. Gabb, et al. (1998). "Predictive docking of protein-protein and protein-DNA complexes." Curr Opin Struct Biol 8(2): 250-6.

124. Swaisgood, H. E. (2005). "The importance of disulfide bridging." Biotechnol Adv 23(11: 71-3.

125. Tsai, C. J., S. L. Lin, et al. (1996). "A dataset of protein-protein interfaces generated with a sequence-order-independent comparison technique." J Mol Biol 260(4): 604-20.

126. Tsai, C. J., S. L. Lin, et al. (1997). "Studies of protein-protein interfaces: a statistical analysis of the hydrophobic effect." Protein Sci 6(1): 53-64.

127. Tsai, J., M. Gerstein, et al. (1997). "Simulating the minimum core for hydrophobic collapse in globular proteins." Protein Sci 6(12): 2606-16.

128. Tsai, J., N. Voss, et al. (2001). "Determining the minimum number of types necessary to represent the sizes of protein atoms." Bioinformatics 17(10): 949-56.

129. Wright, J. D. and C. Lim (2007). "Mechanism of DNA-binding loss upon single-point mutation in p53." JBiosd 32(5): 827-39.

130. Xu, D., S. L. Lin, et al. (1997). "Protein binding versus protein folding: the role of hydrophilic bridges in protein associations." J Mol Biol 265(1): 68-84.

131. Young, L., R. L. Jernigan, et al. (1994). "A role for surface hydrophobicity in protein-protein recognition." Protein Sci 3(5): 717-29.

132. Zhang, W., W. D. Funk, et al. (1993). "Novel DNA binding of p53 mutants and their role in transcriptional activation." Oncogene 8(9): 2555-9.

133. Анашкина, А. А., В. Г. Туманян, et al. (2008). "Геометрический анализ ДНК-белковых взаимодействий на основе метода Вороного-Делоне." Биофизика 53(3): 402-6.

134. Медведев, Н. Н. (2000). Метод Вороного-Делоне в исследовании структуры некристаллических систем. Новосибирск, НИЦ ОИГГМ СО РАН.