Бесплатный автореферат и диссертация по биологии на тему
Молекулярный докинг при исследовании белок-лигандных комплексов
ВАК РФ 03.00.04, Биохимия

Автореферат диссертации по теме "Молекулярный докинг при исследовании белок-лигандных комплексов"

российская академия медицинских наук

научно-исследовательский институт биомедицинской химии

V

На правах рукописи

СКВОРЦОВ Владлен Станиславович

5

МОЛЕКУЛЯРНЫЙ ДОКИНГ ПРИ ИССЛЕДОВАНИИ БрХЖ-ЛИГАНДНЫХ КОМПЛЕКСОВ

03.00.04 - биохимия

Автореферат диссертации на соискание ученой степени кандидата биологических наук

Москва - 1998

Работа выполнена в лаборатории молекулярно-графическог конструирования лекарств Института биомедицинской химии РАМЕ

Научный руководитель:

доктор биологических наук A.C. Иванов Официальные оппоненты:

доктор физико-математических наук, профессор В.Г. Туманян доктор биологических наук В.В. Поройков

Ведущая организация:

Химический факультет МГУ им. М.В. Ломоносова

Защита диссертации состоится " ij/cJ> 1998г

В часов на заседании диссертационного совета Д 001.10.0 при ИБМХ РАМН по адресу - 119832 Москва, ул. Погодинская, д 10.

С диссертацией можно ознакомиться в библиотеке ИБМХ РАМН. Автореферат разослан " " ^-//cFIi'¿puS_ 1998г.

Ученый секретарь Диссертационного совета Кандидат биологических наук

Общая характеристика работы

Введение. Актуальность темы

Лекарственные соединения управляют биохимическими процессами, как правило, взаимодействуя с макромолекулами-мишенями: белками и нуклеиновыми кислотами. Образование комплексов лекарство-мишень характерно для действия биологически активных соединений разного типа, в том числе активаторов и ингибиторов различных ферментов. В таких комплексах молекулы-лиганды пространственно (геометрически) комплементарны участку связывания на поверхности белка и удерживаются на нем благодаря кулоновскому и/или вандерваальсову взаимодействию, водородным связям и т.п.

Создание новых лекарственных препаратов с необходимостью включает поиск соединений, которые комплементарны функционально важным участкам белков. Современные компьютеры позволяют осуществить такой поиск посредством вычислительного эксперимента, суть которого - в своего рода «прилаживании» пространственных образов лиганда и белка. Эта процедура называется геометрическим докингом. Наиболее адекватным подходом при этом является использование данных о структуре белка, полученных рентгеноструктурным методом; в случае их отсутствия сведения о пространственном строении участка связывания (часто называемого рецепторным) могут быть получены путем анализа структуры уже известных эффективных лигандов.

Компьютерные программы, осуществляющие геометрический докинг, позволяют выявлять комплементарные молекулы в обширных базах химических структур, в том числе и в каталогах коммерчески доступных соединений. Однако известные программы этого типа далеки от идеала в отношении как скорости, так и точности.

Далее, пространственная комплементарность лиганда к рецепторному участку является необходимым, но далеко не всегда достаточным условием эффективного связывания. Поэтому геометрический докинг как средство поиска потенциальных лигандов среди десятков и сотен тысяч органических соединений должен сочетаться с оценкой энергии взаимодействия лиганда с белком, равно как и с процедурами, позволяющими в определенных пределах максимизировать эту энергию. Настоящая работа посвящена разработке оптимального алгоритма геометрического докинга, созданию на его основе программного обеспечения поиска потенциальных лигандов в базах химических структур, а также выработке методологии использования результатов докинга для оценки устойчивости соответствующих комплексов.

Поиск потенциальных низкомолекулярных лигандов - далеко не единственная область применения геометрического докинга. В частности, эта процедура может быть также использована для нахождения контактирующих участков при моделировании взаимодействия белковых молекул.

Цель работы

Разработка нового алгоритма геометрического докинга и его применени для моделирования межбелковых комплексов и поиска потенциальны низкомолекулярных белковых эффекторов.

Основные задачи работы

1. Разработка нового алгоритма геометрического докинга и создани на его основе соответствующего программного обеспечения.

2. Оптимизация процедуры максимизации энергии взаимодействия в систем лиганд-белок посредством конформационной адаптации лиганда и уточнени его положения на рецепторном участке белка.

3. Выработка совокупности критериев для оценки эффективности лиганд белкового взаимодействия в комплексах, найденных в вычислительно эксперименте.

4. Создание программного комплекса, позволяющего быстро выявлят потенциальные лиганды белков в обширных базах, содержащих десятки тыся структур органических соединений.

5. Применение геометрического докинга для моделирования белок-белковь комплексов.

А. Моделирование комплекса цитохрома Р450сат с водорастворимк фрагментом цитохрома (белок с известной трехмерной структурой) .

Б. Создание трехмерной модели полной структуры цитохрома и er комплекса с цитохромом Р450сат.

6. Применение геометрического докинга для поиска потенциальны лигандов для белков с известной трехмерной структурой (цитохром Р450сагг субтилизин, нейраминидаза), а также для белков, о строении рецепторног участка которых можно судить по структуре их ингибиторов и субстратс (моноаминооксидаза А).

Положения, выносимые на защиту

1. Разработан алгоритм геометрического докинга, обладают^ существенными преимуществами по сравнению с описанными в литературе.

2. Создано программное обеспечение, позволяющее удовлетворитель> моделировать строение белок-белковых комплексов и быстро выявляв потенциальные эффекторы белков среди большого числа органических соединенга

Научная новизна и практическая ценность работы

Геометрический докинг - давно известный метод моделирования комплексе биологических макромолекул. В разных вариантах он входит как один i инструментов в состав различных специализированных программных комплексе (например, GRAMM [Vakser, 1995] или FLOG [Miller, 1994]). Тем не мене« существовала потребность в универсальной и автономно функционируют^

2

программе докинга, возможности которой отвечают уровню современной вычислительной техники.

Универсальность алгоритма докинга обеспечивается адекватностью описания молекул как совокупности атомов, а не их блоков, представленных сферами или эллипсоидами. Повышение точности описания молекул при докинге расширяет область его применения и улучшает надежность результатов, особенно для низкомолекулярных лигандов.

Автономность программы геометрического докинга позволяет более гибко сочетать его с различными методами оценки результатов, а также другими подходами и инструментами компьютерного моделирования биологически активных соединений.

Обоим этим требованиям удовлетворяет разработанная в настоящей работе программа геометрического докинга DockSearch, которая по вышеуказанным свойствам превосходит обычно используемую программу DOCK [Kuntz, 1982, 1994].

Возможности и ограничения программы DockSearch были изучены при решении различных проблем, связанных с моделированием межбелковых взаимодействий и поиском низкомолекулярных эффекторов ферментов. Разработана методология препроцессинга банков структур, выбора критериев селекции гипотетических комплексов, предложен и проверен новый метод моделирования участка связывания слепком с пространственно совмещенных известных лигандов.

В ходе тестирования и практического применения программы DockSearch предсказаны новые потенциальные лиганды субтилизина, нейраминидазы вируса гриппа, цитохрома Р450сат и монооксидазы А.

Апробация работы

Основные положения диссертации были доложены на следующих симпозиумах и конференциях:

■ International Conference on Molecular Structural Biology, Vienna, 1995.

■ 3rd IUBMB Conference «Molecular Recognition», Singapore, 1995.

■ XI international Symposium on Microsomes and Drug Oxidation, Los Angeles, USA, 1996.

■ 17th International Congress of Biochemistry and Molecular Biology, San Francisco, USA, 1997.

• NATO ASI Molecular & Applied Aspects of Oxidative Drug Metabolizing Enzymes. Tekirova, Turkey. 1997.

■ 2nd International Conference on Molecular Structural Biology, Vienna, 1997.

Апробация диссертации состоялась на совместной научной конференции лабораторий НИИ Биомедицинской химии РАМН 30 сентября 1998 года. По теме диссертации опубликовано 12 работ.

Структура и объем работы

Диссертация изложена на 102 страницах машинописного текста, состой' из следующих разделов: введение, обзор литературы, материалы и методы результаты и обсуждение, заключение, выводы и список литературы. Работ иллюстрирована 15 таблицами и 50 рисунками; библиографический указател включает 120 публикаций.

Результаты и обсуждение

Программа БоскЗвагсЬ

Разработанный алгоритм геометрического докинга реализован в вид программы ОоскБеагсЬ, которая написана на языке С и может быть использован на разных платформах. Этот алгоритм базируется на следующих исходны положениях:

1. Из двух молекул, участвующих в докинге, одна - неподвижная объявляется мишенью, а другая - подвижная - лигандом.

2. Мишень и лиганд существуют в собственных декартовых система координат, центры которых не совпадают.

3. Лиганд имеет три вращательные и три поступательные степени свободы отнесенные к его системе координат.

4. Мишень и лиганд рассматриваются как набор неводородных атомов их пространственное расположение отвечает выбранной конформации молекул которая не изменяется в ходе докинга.

5. Атомы описываются сферами равного радиуса (рекомендуется 1.6 ?) центры которых совпадают с центрами атомов.

6. На поверхности каждой атомной сферы равномерно размещается заданно и равное число точек. Точка считается расположенной на поверхности молекуль если пробная сфера (она обычно имеет радиус 1.4 ?, что соответствуе эффективному радиусу молекулы воды) касается в ней данной атомной сфер и при этом не пересекается с другими атомными сферами.

Процедура докинга заключается в последовательном выполнении следуют-операций:

1. Ориентация лиганда фиксируется в пространстве заданием углов е1 поворота относительно осей подвижной системы координат.

2. Рассматривается набор векторов смещения центра координат лигащ относительно центра координат мишени. Каждый такой вектор получаете совмещением двух поверхностных точек лиганда и мишени, для которых нормал к атомным сферам антиколлинеарны.

3. Исключаются вектора смещения, при которых пересекаются атомнь сферы лиганда и мишени. Оставшиеся расположения лиганда и мише! рассматриваются как потенциальные комплексы этих молекул. Для ш вычисляется число поверхностных точек лиганда и мишени, которые в комплекс перестали быть поверхностными. Доля таких точек коррелирует со скрытс

4

поверхностью комплекса (то есть с поверхностью, недоступной для молекул воды).

4 . Углы поворота лиганда относительно осей подвижной системы координат изменяются, после чего осуществляется возврат к п. 2.

Таким образом, генерируется очень большой набор комплексов, каждый из которых характеризуется величиной скрытой поверхности. Их число сокращается путем кластеризации по среднеквадратичному отклонению расстояний между атомами, так чтобы центру кластера отвечал комплекс с максимальной скрытой поверхностью.

Оценка эффективности программы DockSearch

Для проверки эффективности программы были отобраны 10 белок-лигандных комплексов с известной трехмерной структурой DockSearch в базе данных Protein Data Bank (PDB). Лиганды и белки при докинге сохраняли ту же конформацию, что и в комплексах, а начальная ориентация лигандов в подвижной системе координат была случайной.

Для оценки результатов докинга гипотетические комплексы ранжировались по доле скрытой поверхности, после чего определялось положение (ранг) комплекса, который по среднеквадратичной разности расстояний между тождественными атомами (RMSD) наиболее близок к реальному. Оказалось, что в большинстве случаев такой комплекс обладает наивысшим рангом (см. Табл. 1), причем соответствующее ему значение RMSD, безусловно, можно считать удовлетворительным для предсказания. Таким образом, докинг позволил, как выявить участки связывания лигандов на белковой поверхности, так и определить расположение на них соответствующих лигандов.

Таблица 1. Сравнение гипотез о строении комплексов с реальными кристаллическими структурами.

Код в PDB Число неводородных атомов лиганда Число комплексов Минимальное значение RMSD (А) Ранг комплекса с наименьшим значением ЯМБО по величине скрытой поверхности

latp 157 36 11.681 9

lbmm 35 3 0.304 1

lbtx 32 38 1.355 1

lcpi 49 1 0.832 1

ldwc 35 98 0.226 1

lelb 33 181 0.202 1

lhpx 46 1 0.600 1

lmmb 32 25 0.299 1

lmmp 32 49 0.693 1

lmnc 25 27 1.025 1

Уточнение результатов докинга

Геометрическому докингу как методу определения структуры лиганд белковых комплексов присущи некоторые недостатки. Во-первых, он предполагав неизменность конформаций лиганда и мишени, которые, в действительности адаптируются друг к другу. Во-вторых, площадь скрытой поверхности отражае пространственную комплементарность взаимодействующих молекул, но н позволяет оценить энергию их взаимодействия и предсказать устойчивост комплексов. В принципе, может оказаться, что в реальном комплексе скрыта поверхность меньше максимально возможной, т.к. при этом более эффективно скажем, кулоновское взаимодействие или образуются дополнительные водородны связи.

Перечисленные принципиальные недостатки удалось преодолеть, сочета докинг с последующей оптимизацией структуры гипотетических комплексо при использовании в качестве критерия вычисленные значения энерги связывания. Выбор соответствующих процедур зависит от особенностей задачи Так в данной работе, при моделировании комплекса двух белков оптимизаци учитывала конформационную подвижность обоих белков (лиганда и мишени) Если лигандами служили низкомолекулярные соединения, то учитывалась тольк их конформационная подвижность.

Результаты оптимизация структуры гипотетических комплексов, описанны выше, приведены в Табл. 2, где представлен ранг комплекса, наиболе близкого к реальному. Из нее видно, что гипотетические комплексы с наиболыде вычисленной энергией белок-лигандного взаимодействия чаще всего по структур наиболее близки к реальным. На примере комплекса видно, что оптимизаци

позволяет увеличить вероятность предсказания «правильной» структур гипотетического комплекса.

Объем вычислений, связанных с оптимизацией может быть сокращен, есл предварительно отбросить гипотетические комплексы, заведомо неудачные п легко оцениваемому критерию, например, по энергии электростатическог взаимодействия между лигандом и мишенью. Данные о такого рода фильтраци представлены в Табл. 2.

Об эффективности сочетания докинга с последующей оптимизацией можн судить по результатам ОЗЛИ-предсказаний констант диссоциации гипотетически комплексов. Такие предсказания были произведены с помощью двух регрессионнь уравнений, построенных по данным о 54 белок-лигандных комплексах с известно структурой и свойствами. Эти уравнения различались наличием в первом к них энергии электростатического взаимодействия. Из Табл. 3 следует, чт чаще всего наибольшая устойчивость предсказывается для комплексов, г структуре максимально сходных с реальными, а нарушения этой закономерное! могут быть обусловлены неудачным выбором регрессионных параметров.

Вычислительные эксперименты, связанные с оценкой эффективности докинга

Таблица 2. Сравнение гипотез о строении минимизированных комплексов с реальными кристаллическими структурами.

Код в PDB. Минимальное значение RMSD (А), полученное после минимизации Число комплексов Число комплексов, для которых ДЕр < 0 отрицательна Ранг по ДЕф для комплекса с наименьшим значением RMSD Ранг по ДЕ комплекса с наименьшим значением RMSD

latp 11.603 36 28 2 2

lbmm 1.135 3 3 3 2

lbtx 1.401 38 17 1 1

lepi 0.605 1 1 1 1

ldwc 0.181 98 59 9 1

leib 0.148 181 100 10 1

lhpx 0.280 1 1 1 1

lmmb 0.289 25 14 1 1

lmmp 0.688 49 29 17 1

lmnc 0.882 27 22 1 2

ДЕ<} - величина энергии электростатического взаимодействия в комплексе;

ДЕ - сумма величин энергии электростатического и вандерваальсового взаимодействий в

комплексе.

сочлененного с оптимизацией структуры гипотетических комплексов, привели к созданию программного обеспечения, которое позволяет осуществить все процедуры в автоматическом режиме без вмешательства оператора. Этот программный комплекс был испытан на 20 выбранных наугад белковых комплексах, структура которых представлена в PDB. Во всех случаях первым этапом был геометрический докинг случайным образом ориентированного лиганда к свободному белку (конформации обоих партнеров те же, что в комплексе).

Из Табл. 4 видно, что в 14 случаях положение лигандов было «угадано» с точностью < 2.0 А, что может считаться вполне удовлетворительным результатом. Участок связывания лиганда на поверхности белка всегда отыскивался безошибочно, в то время как в ориентации лиганда наблюдались некоторые отклонения.

Моделирование комплекса цитохром Р450сат - цитохром bs.

В исследованиях монооксигеназных систем животных большое внимание уделяется механизму переноса электронов между темами цитохромов Р450 и цитохрома bs. Оба цитохрома - мембранные белки, что создает значительные методические трудности при изучении этого явления. Поэтому в качестве эквивалентного объекта часто используют бактериальные водорастворимые белки - цитохром P450cam (Pseudomonas putida) и его естественный партнер

Таблица 3. Оценка гипотетических комплексов с использованием предсказания константы диссоциации (К.<1).

Код в РОВ Известная величина Кд (нм) Минимальное значение (ШББ (А), полученное после минимизации Ранг по Кё для комплекса с наименьшим значением ЯМБР Предсказанная величина К.(1 (нМ) для комплекса с наименьшим значением ЯМБО

Регрессионное уравнение 1

Шр 2.10 11.603 2 12.96

1Ьтш 78.90 1.135 1 6.73

1Ых 7.00 1.401 1 630.09

1 ср1 39.00 0.605 1 10.40

1сЫс 19.00 0.181 1 62.93

1е1Ь 70.00 0.148 5 605.20

1Ьрх 0.01 0.280 1 9.10

1ттЬ 0.60 0.289 1 310.56

1ттр 570.00 0.688 1 620.84

1тпс 2.00 0.882 1 593.20

Регрессионное уравнение 2

Ыр 2.10 11.603 2 9.94

1Ьтт 78.90 1.135 1 5.49

1Ых 7.00 1.401 10 541.83

1ср1 39.00 0.605 1 2.80

1с1\\'с 19.00 0.181 1 27.51

1е1Ь 70.00 0.148 32 86.10

1Ьрх 0.01 0.280 1 0.66

1ттЬ 0.60 0.289 1 75.44

1ттр 570.00 0.688 26 901.04

1тпс 2.00 0.882 1 256.64

путидаредоксин. Известно, что цитохром Ь} конкурирует с путидаредоксино за место связывания на цитохроме Р450сат [Stayton 1989], причем свойств образующихся комплексов зависят от того, использовался ли сам цитохром ^ или его водорастворимый фрагмент, получаемый обработкой нативного белк трипсином [1уапоу, 1997]. Строение этих комплексов не установлено, потому представляло интерес получить сведения о нем посредство вычислительного эксперимента с использованием геометрического докинга Исходно были известны трехмерные структуры цитохрома Р450сат

Таблица 4. Результаты работы полностью автоматизированного докинга.

Код в PDB Число комплексов Минимальное значение RMSD (Á) после минимизации Ранги по различным параметрам для комплекса с минимальным значением ЯМБО

DS ED FED Kd

lcil 17 0.308 11 12 13 6

leim б 0.353 4 1 2 5

leat 82 9.569 63 2 8 71

leau 53 6.275 39 4 11 42

leib 5 3.178 3 1 1 3

lflíg 5 0.221 2 2 1 1

lhbv 1 0.637 1 1 1 1

lhfs 1 3.035 1 1 1 1

lhsg 1 0.316 1 1 1 1

lhsh 2 0.515 1 1 2 2

ljan 126 0.782 102 37 119 34

Ijap 181 1.035 147 77 160 95

lmmq 13 1.177 8 1 2 11

lnlo 1 3.960 1 1 1 1

lnlp 6 0.752 3 1 2 1

lppc 7 1.257 5 2 3 2

lsbg 5 0.172 5 1 1 5

4est 132 9.970 114 32 84 91

6tmn 7 1.667 3 2 3 5

7gch 4 0.435 1 1 1 4

DS - скрытая поверхность комплекса;

ED - энергия взаимодействия в комплексе с учетом действия электростатических и вандерваальсовых сил;

FED - энергия электростатического взаимодействия в комплексе с учетом сольватации, вычисленная программой Fiesta;

Kd - константа диссоциации, предсказанная по регрессионному уравнению 2.

водорастворимого фрагмента цитохрома Ь5, определенные рентгеноструктурным методом.

На первом этапе было необходимо построить модель трехмерную структуры нативного цитохрома Ь5. Эта часть исследования включала следующие стадии: 1. Моделирование трехмерной структуры мембранно-связанного фрагмента

цитохрома bs (остатки 89-133) с помощью программного модуля COMPOSE [Topham, 1990]. Для построения структуры использовались данные о упаковке гомологичных фрагментов Оелков, найденных в PDB.

2. Оптимизация полученной структуры в среде, моделирующей мембранно окружение (неполярный растворитель).

3. Создание модели полной структуры цитохрома bsпутем объединения структу мембранно-связанного и водорастворимого фрагментов.

4. Оптимизация структуры цитохрома Ь5 в двухфазной среде из полярного неполярного растворителя с использованием молекулярной динамики.

Результаты геометрического докинга цитохрома Ь5 и его водорастворимог фрагмента с цитохромом Р450сат приведены в Табл. 5. Число гипотетически комплексов, найденных с помощью программы DockSearch, было значительн редуцировано с помощью описанных выше процедур кластеризации и фильтраци по энергии электростатического взаимодействия. Оставшиеся комплексы был подвергнуты оптимизации по энергии межбелкового взаимодействия (с помощь программного комплекса Sybyl) с изменением конформации как лиганда, та и мишени. После отбрасывания неудачных гипотетических комплексов, у которы полная энергия межбелкового взаимодействия (?Е) меньше -80 ккал/моль оказалось, что оставшиеся комплексы могут быть объединены по сходству строении в небольшое число групп: три - для водорастворимого фрагмента всего две - для полного цитохрома Ь5.

Таблица 5. Число гипотетических комплексов цитохрома Р450сат с водорастворимым фрагментом цитохрома b5 (t-bs) и моделью полного цитохрома b5 (fl-b5).

Процедура Количество комплексов P450cam/<-ij Количество комплексов Р450сат//7-/>5

Геометрический докинг 3667 2798

Кластеризация 70 65

Отбор по значению энергии электростатического взаимодействия (ДЕ, < 0 ккал/моль) 37 27

Отбор по значению полной энергш; межбелкового взаимодействия (ДЕ > -80 ккал/моль) 3 2

Выбор между этими вариантами связывания не может быть пока осуществле чисто вычислительными приемами, однако он вполне реален с помощью чист химических методов (ковалентные сшивки, флуоресцентные и/или ЭПР-метки) поскольку каждому предполагаемому типу связывания соответствуют различны наборы аминокислотных остатков в цитохроме Р450сат, находящихся в контакт со связанными белковыми лигандами (см. Табл. 6).

Таблица 6. Аминокислотные остатки, образующие на поверхности цитохрома Р4 50сат место связывания для водорастворимого фрагмента цитохрома ¿5 (£—¿35) и для модели полного цитохрома Ь5 .

Номер участка Аминокислоты

Участки связывания для t-bs

1 Е152 Е273 Q400 Е156 Е276 Р403 D182 D339 D407 D188 S382 Т410 S190 A3 84 К.266 G386 Р268 А387 Е269 Q388

2 Q69 R109 А283 S354 R72 R112 Y305 L356 Е73 А113 R330 Q360 Е76 N116 Q343 Н361 R79 Q117 К344 R364 Н80 М121 Н347 Р106 Р122 Н352 Q108 D125 G353

3 Е94 R240 Е198 D202 1205 Е209 S235 D236 Е237

Участки связывания для fl-b5

1 Е76 Р122 R364 Y78 Р282 R79 А283 Р106 Q343 R109 К344 R112 Н352 А113 S354 MI21 Н361

2 Р13 Е195 Р16 К197 Е20 Е198 R57 D236 Е84 К239 R90 D304 Е91 К313 Е94 КЗ 14

Применение программы DockSearch при поиске низкомолекулярных лигандов для ферментов

Число коммерчески доступных органических соединений столь велико, что есть шанс обнаружить среди них либо готовые эффекторы для данного фермента, либо соединения, которые могут послужить их прототипам!, нуждающимися в некоторой оптимизации структуры. Речь идет о молекулах, которые комплементарны участку связывания либо субстрата и/или конкурентного ингибитора, либо аллостерического регулятора. Поиск таких соединений с помощью вычислительных методов может значительно упростить и удешевить разработку новых ферментных субстратов, ингибиторов и активаторов. В настоящей работе показано, что программа DockSearch с успехом может быть использована при таком поиске и предложена методология ее применения в различных ситуациях. В качестве источника структур потенциальных лигандов использовались базы данных MayBridge (>45000 соединений) и CMC (6300 биологически активных соединений).

1. Поиск лигандов к ферментам с известной трехмерной структурой

В принципе геометрический докинг специфических субстратов и/или конкурентных ингибиторов позволяет выявить общий участок их связывания на поверхности белка (см. выше). Однако в данной работе новые потенциальные

лиганды разыскивались для ферментов, у которых этот участок мог Сыт: определен из данных о структуре соответствующих комплексов. Докин: потенциальных лигандов не ко всей поверхности белковой глобулы, а лишь выделенному на ней сравнительно небольшому участку связывания значительн> сокращает объем вычислений и делает возможным скрининг большого числ. органических молекул за разумное время (5 - 10 секунд на структуру).

Субтилизин

Субтилизины - сериновые эндопротеиназы, которые не проявляют заметно: специфичности к отдельным аминокислотным остаткам в субстратах. Извести: весьма эффективные белковые конкурентные ингибиторы субтилизинов, образующи с ферментами прочные нековалентные комплексы; строение некоторых из ни: определено рентгеноструктурным анализом.

Для вычленения участка связывания субстратов была сравнена структур комплексов субтилизинов с белковыми ингибиторами из ячменя, пиявки (эглин и Streptomyces albogriseous. Во всех этих комплексах пептидная цеп лиганда имеет сходную конформацию и размещается между двум антипараллельными ей участками цепи фермента, причем в связывании последним участвует не более 5-6 последовательно расположенных остатко ингибитора. Оказалось, что независимо от аминокислотного состава эти участков в контакте с ними находятся практически одни те же аминокислотны остатки фермента (32, 33, 62, 64, 65, 99-104, 107, 125-131, 135, 152-156 167, 168, 188, 189, 217-222), а остатки GlylOO, Glyl20 и Glyl27 неизменн образуют с ингибиторами сетку водородных связей - своего рода островок ? структуры. Эти данные были использованы при выделении участка на поверхност: молекулы субтилизина NOVO, к которому производился докинг потенциальны низкомолекулярных лигандов. С помощью программы DockSearch из 4500 соединений, включенных в базу MayBridge, было найдено 300, обладающи наибольшей скрытой поверхностью гипотетических комплексов. Структура эти комплексов была оптимизирована с помощью программы LeapFrog (программны комплекс Sybyl, Tripos), однако при этом не произошло существенных изменени положения и конформации лигандов. Оптимизация сопровождалась вычисление энергии белок-лигандного взаимодействия, что позволило ранжироват потенциальные лиганды по этому параметру. Лучшие из них представлены н рис. 1. Все эти молекулы имеют слегка изогнутые протяженные структуры которые в активном центре субтилизина занимают то же пространство, что его белковые (и пептидные) конкурентные ингибиторы.

сосн.

-----. &0, N N

ЭЕК_01910 (123, 91) г.с С Г.

( У-СНг-ННСО—( ') " ......'<

г,С сг,

С 10 7 5 5 (122, 67)

СИ,о

Ш,и'......<

ГН (У

- СОНКЫНССМН-

ВТВ_01095 (119, 101.5)

-сн,—

ЗРВ_0257 9 (118 , 83 . 7 )

ВТВ_11110 (117, 107)

0919 (117, 95)

С н.оос

.... . N. ,он

,7-ся—г......[, ,[

СГ,

х

ЭРВ_03941 (119, 92.3) о сы

Л

>4

о сн,сн,— г

БЕИ 03307 (117, 88)

,аюа(,ои. с1

КМ_07836 (119, 60.3)

СН, N ' ( СОШЫНСО — СН—^-N

01867 (118, 111)

ВТВ_078 92 (117 , 69.5)

{Л, 4111.

-г 1

-5 ■ сн

V • «очнкгкостжа* <' \ -

1 к,

КМ 02874 (117, 36)

Рисунок 1. Найденные лиганды субтилизина с максимальным значением скрытой поверхности комплекса. В скобках: сначала - число контактов (скрытая поверхность), затем - расчетная энергия взаимодействия, |ДЕI, (ккал/моль).

Нейраминидаза вируса гриппа

Нейраминидаза вируса гриппа - хорошо изученный фермент, для которог известно множество эффективных конкурентных ингибиторов. В отличие о субтилизина в активном центре нейраминидазы расположено много полярных заряженных групп (остатки Агд118, С1и119, Азр151, Агд152, 61и227, С1и276 61и277, Агд296,Агд371). У комплексов нейраминидазы с субстратом (сиалова кислота) и с его аналогами - конкурентными ингибиторами, значительны вклад в энергию лиганд-белкового взаимодействия вносят водородные связ и электростатика. Это обстоятельство существенно сказывается на возможностя и ограничениях геометрического докинга при поиске лигандов к такого род ферментам.

Белком-мишенью служила нейраминидаза штамма А/ТОКУО/3/67 (2ВАТ п классификации РОВ) в конформации, отвечающей ее комплексу с сиалово кислотой. Докинг выполнялся к участку на поверхности мишени, включавшем область, экранируемую сиаловой кислотой, и все указанные выше аминокислотны остатки.

Поиск потенциальных лигандов осуществлялся среди соединений, включении в базу данных МауВг1бде и удовлетворяющих следующим условиям:

1. общее число неводородных атомов в молекуле не менее 15;

2. разрешенные неводородные атомы: С, О (не менее двух), Ы, Р, Б.

Результаты препроцессинга базы данных, докинга и последующей обработки его результатов отражены в Табл. 7. При соблюдении этих условий оказалось, что наибольшей скрытой поверхностью обладают гипотетические комплексы нейраминидазы с молекулами, представляющими собой мультизамещенные пяти или шестичленные циклы, главным образом, производные бензола. Эти циклы в комплексах располагались там же, где цикл сиаловой кислоты и обычно были ему копланарны.

В базе МауВг1с1де большая часть карбоновых и сульфокислот, а такя аминов представлена в недиссоциированной форме (за исключением бетаинов) Неудивительно поэтому, что у большинства гипотетических комплексов, даз после оптимизации конформации и положения лиганда, энергии лиганд-белк0В01 взаимодействия, были малы по сравнению со значениями, вычисленными дг комплексов сиаловой кислоты и ее аналогов.

Поэтому структуры молекул, образующих гипотетические комплексы достаточно большой скрытой поверхностью были преобразованы программны!, средствами в заряженные формы (карбоксильные группы - в карбоксилатньк а алифатические аминогруппы - в аммонийные). Последующая оптимизащ положения и конформации лигандов, выполненная с помощью программы ЬеарГгос позволила выявить комплексы, у которых не только достаточно велика до: скрытой поверхности, но, кроме того, заряженные и полярные группы лигандс должным образом размещены относительно комплементарных им заряженных

Таблица 7. Количество молекул и комплексов на различных этапах поиска лигандов нейраминидазы вируса гриппа.

Количество комплексов Количество молекул

База данных Maybridge - -45000

Препроцессинг базы по правилам, описанным в тексте - -16000

Результат работы программы DockSearch -600000 -

Отбор комплексов по величине скрытой поверхности в месте связывания (не менее 80%) -41000 -

Минимизация и отбор по энергии связывания Leapfrog (не менее 50 ккал/моль) 246 246

полярных групп фермента.

В связывании сиаловой кислоты участвует так много полярных и заряженных групп белка, что вероятность случайно наткнуться на молекулу, способную реализовать в комплексе все эти потенциальные взаимодействия, - ничтожно мала. Это было подтверждено отрицательным результатом поиска готовых лигандов в базе MayBridge. Тем не менее, были выявлены структуры, не встречавшиеся среди известных лигандов нейраминидаз, которые, согласно экспертным оценкам, могут быть использованы как исходные при конструировании новых ингибиторов. К их числу относятся, в частности, производные 4-аминометилбензойной кислоты и трипептиды с С-концевым остатком гидроксипролина.

Цитохром Р450сат

При поиске низкомолекулярных лигандов для белков наиболее значимым критерием отбора является расчетное значение константы диссоциации гипотетических комплексов. Методология использования этого критерия при скрининге большого числа структур с помощью геометрического докинга была выработана на примере цитохрома Р4 50саш - фермента, для которого известна как трехмерная структура, так и локализация участка связывания субстратов. Этот участок был принят в качестве области докинга потенциальных лигандов.

На первом этапе данные о трехмерной структуре и устойчивости 15 комплексов этого фермента с различными лигандами были использованы для построения QSAR-модели с использованием в качестве независимых дескрипторов энергетических параметров hint_hh и hint_hb по Келлогу [Kellogg, 1992], вычисленных с помощью программы HINT [Kellogg, 1991]. В результате было получено регрессионное уравнение:

ЮООрКс! = -6315.51 + 2.32*1и.пЪ_Ы1 - 6.91*ЫпЬ_Ьр

Стандартная ошибка вычислений (ЭЕ) : 784.029.

Коэффициент множественной корреляции (И2): 0.560.

С помощью программы БоскЗеагсЬ был выполнен поиск потенциальных лигандо среди соединений, представленных в базе МауВг1с1де и содержащих 10-3 неводородных атомов. Из ~20000 таких молекул только 6300 могут быт размещены во внутримолекулярной полости, представляющей собой участо связывания субстратов цитохрома Р450саш. Из ~106 генерированных таки образом гипотетических комплексов были отобраны 77000 комплексов (-190 молекул), у которых доля скрытой поверхности не менее 80%.

В среднем на каждую отобранную молекулу приходится несколько десятко «удачных» гипотетических комплексов. Эта, не вполне обычная ситуаци возникает благодаря тому, что молекулы, по форме близкие к сфере, могу занимать в квазисферической полости многие положения, близкие по величин скрытой поверхности. Кроме того, многие молекулы обладают внутренне симметрией, которую не может распознать программа ОоскЭеагсЬ. Чтоб сократить объем вычислений, максимальное число гипотетических комплексо на молекулу было ограничено 20, имеющими наибольшую долю скрыто поверхности. После такой селекции общее число гипотетических комплексо сократилось до 23000.

Структура этих комплексов была оптимизирована с помощью программ ЬеарГгод, использующей в качестве критерия вычисленное значение энерги лиганд-белкового взаимодействия, ДЕ. Далее, из них были отобраны п одному «лучшему» комплексу для каждой молекулы при условии, чт ДЕ < - 35 ккал/моль. В результате такой фильтрации осталось 8 63 комплекс (молекулы).

Константы устойчивости этих комплексов, вычисленные с помощь регрессионного уравнения лежат в пределах 1мкМ < Ка< 8000 мкМ. Для 1 соединений предсказывается величина Ка < 100 мкМ. Эти соединения предстой испытать в качестве потенциальных лигандов цитохрома Р450саш.

2. Поиск лигандов к ноноаыинооксидазе А - ферменту с неизвестной трехмерной структурой

Геометрический докинг лигандов предполагает знание профиля участи

их связывания на поверхности молекулы-мишени. Косвенно об этом профш

можно судить, если известно достаточно много родственных по структур соединений, заведомо однотипно связывающихся на этом участке. Для этог следует наложить их молекулы друг на друга так, чтобы совпали общие дг них структурные фрагменты, и изготовить объемный «слепок». Че представительнее выборка молекул, тем больше оснований ожидать сходсте

между профилями «слепка» и реального участка связывания.

Этот подход лег в основу применения геометрического докинга для поиска новых лигандов монооксидазы А - фермента, для которого получено множество синтетических конкурентных ингибиторов, но неизвестна трехмерная структура.

Для получения «слепка» участка связывания в моноаминооксидазе А был использован 41 известный ингибитор - производные индола и пиразинокарбазола. Эти молекулы были совмещены по общим для них индольным фрагментам с помощью программы DISCO (программный комплекс Sybyl, Tripos).

Программа DockSearch была использована для докинга к полученному кслепку» 6300 биологически активных соединений, представленных в базе цанных CMC (MDL Information Systems). Из молекул, которые могут быть размещены внутри «слепка», были отобраны 200, которым отвечали 13000 гипотетических комплексов. Критерии отбора комплексов (доля скрытой поверхности > 50%, среднеквадратичное отклонение при кластеризации -25А; ср. выше) были не слишком жесткими ввиду очевидной ограниченной адекватности «слепка» истинному профилю участка связывания. По этой же причине были опущены стадии оптимизации и селекции по расчетной энергии взаимодействия.

Далее для отобранных комплексов были предсказаны значения 1С50 с помощью QSAR-модели с использованием CoMFA, построенной для указанных зыше 41 ингибиторов (см. Табл. 8). Некоторые из лучших найденных потенциальных лигандов представлены в Табл. 9. Среди них оказался и пиразидол - соединение, входившее в исходный набор ингибиторов, и летралиндол, по активности сходный с пиразидолом, но не входивший в этот -¡абор.

Таблица 8. Параметры 3D-QSAR+COMFA модели, в основе которой лежит информация о структурах, биологической активности и пространственном взаиморасположении 41 производного пиразинокарбазола, индола и изатина - ингибиторов МАО-А.

Параметр Значение

Коэффициент множественной корреляции для анализа со скользящим контролем (Я2СУ) 0.704

Стандартная ошибка для анализа со скользящим контролем (БЕ«) 0.652

Оптимальное число компонентов (п) 2

Коэффициент множественной корреляции без скользящего контроля (Я2) 0.919

Стандартная ошибка для анализа без скользящего контроля (БЕ) 0.350

Критерий значимости (И) 103

Таблица 9. Восемь лучших лигандов МАО-А найденных в базе данных CMC и предсказанные для них величины ингибиторной активности.

Структура CAS-номер и название Предсказанное значение 1С50(мкМ)

106100-65-6 Фасиплон 0.43

121459-89-0 Сульфенамид 0.44

•-V-^rS 342-69-8 Мстилтиоинозин 0.68

cc^l. 36950-96-6 Циклопрофен 0.85

54188-38-4 Метралиндол 0.91

'N 56119-96-1 Фуродазол 2.24

60762-57-4 Пиразидол 2.63

,о ^ ^^ л хх;4з 67199-66-0 Данхидон 3.02

Заключение.

Опыт, полученный при тестировании программы ОоскБеагсЬ и при ее фименении для моделирования комплексов белков с другими белками и с [изкомолекулярными лигандами позволяет предложить некоторые общие правила I рекомендации.

Геометрический докинг, как правило, применяется не сам по себе, а как >дин из инструментов при исследовании межмолекулярных взаимодействий !см. Рисунок 2).

Непосредственной целью докинга может быть:

а) отыскание участка связывания на поверхности мишени, когда известны :труктуры мишени и специфического лиганда;

б) моделирование строения исследуемого комплекса;

в) поиск новых лигандов когда известна структура участка связывания.

Сущность докинга состоит в генерации набора стерически допустимых

>азмещений лиганда относительно мишени (гипотетических комплексов) . Выбор ¡3 них более предпочтительных зависит от применяемого критерия. В программе )оскЗеагсЬ таким критерием служит пространственная комплементарность, щениваемая по доле скрытой поверхности комплекса, лиганда и мишени. Это >значает, что для селекции гипотетических комплексов по иным критериям ^например, по энергии взаимодействия лиганд-мишень) необходимо привлекать (ругие программные модули.

Вместе с тем ранжирование гипотетических комплексов по доле скрытой юверхности является инструментом, позволяющим успешно решать многие жльтрационные задачи:

а) отбор по наибольшей скрытой поверхности комплекса выявляет наилучшее ю комплементарности расположение лиганда относительно мишени;

б) отбор по наибольшей скрытой поверхности лиганда при сниженных ■ребованиях к скрытой поверхности участка связывания позволяет разыскать 1ебольшие молекулы, которые могут служить блоками при конструировании юлее крупных специфичных лигандов;

в) отбор по наибольшей скрытой поверхности участка связывания при :ниженных требованиях к скрытой поверхности лиганда позволяет разыскать :рупные молекулы, у которых лишь отдельные фрагменты взаимодействуют с шшенью (характерный пример - белковые ингибиторы субтилизина; см. выше).

Эффективность отбора гипотетических комплексов по критерию скрытой юверхности тем ниже, чем больший вклад в их устойчивость вносят не :онтактные - вандерваальсовы, - а направленные - водородные связи и щектростатические - взаимодействия (ср. выше поиск лигандов для субтилизина [ нейраминидазы).

Затраты времени на поиск потенциальных лигандов среди множества молекул 1 базах данных, существенно сокращаются, если докингу предшествует селекция

19

1. Структурное моделирование молекулярных комплексов.

2. Поиск лигандов к мишени с известной трехмерной структурой.

3. Поиск лигандов к мишени с неизвестной трехмерной структурой

Область докинга - вся поверхность молекулы-мишени.

Область докинга -известный участок связывания на поверхности молекулы-мишени.

Область докинга -слепок с поверхности одного или нескольких известных лигандов.

Набор гипотетических комплексов (ОоскЗеагсЬ).

Оптимизация структуры полученных комплексов и оценка их энергетических параметров. Оптимизация структуры найденных лигандов и оценка энергетических параметров их связывания с мишенью.

Оценка качества Оценка экспертом

полученных гипотез в данной области

на основании исследования.

экспериментальных —^

данных о топологии

места связывания..

Предсказание

целевой

биологической

Ч активности

методами СоМРА,

ОБАИ и ЗО-С^АЯ.

Рисунок 2. Место программы РоскБеагсЬ в структуре исследований.

молекул по структурным критериям: числу и типу атомов, наличию или отсутств определенных циклов и функциональных групп и т.п., в основе которой леж информация об индивидуальных особенностях молекулы мишени. Так препроцессинг при необходимости должен включать «диссоциацию» ионогенн групп, а если в гибкой молекуле их несколько, то и оптимизацию ее конформаи (в базах данных обычно представлены неионизованные формы).

Выводы

Предложен новый алгоритм геометрического докинга и на его основе разработана программа DockSearch, которая может быть с успехом использована для адекватного компьютерного моделирования комплексов типа белок-белок и белок-низкомолеклярный лиганд.

Разработана методология использования геометрического докинга при поиске участков связывания лигандов на поверхности белка, для моделирования межбелковых комплексов, а также для поиска низкомолекулярных эффекторов ферментов.

Разработанный метод успешно апробирован на ряде комплексов белок-белок (цитохромов Р450сат и bs) и белок-лиганд (цитохрома Р450сат, субтилизина NOVO, нейраминидазы вируса и моноаминоксидазы А).

Основные материалы диссертации изложены в следующих работах:

V.S.Skvortsov, A.S.Ivanov, A.I.Archakov Computer modelling of cytochromes P450cam-b3 complex by molecular docking. XI International Symposium on Microsomes and Drug Oxidation, Los Angeles, USA, July 2124 1996, P145.

Skvortsov V.S., Sechenykh A.A., Ivanov A.S., Ivanov Yu.D., Archakov A.I. P85. Computer modelling of intermolecular interaction of cytochromes P450 101, 2B4 and b5 by docking simulation and comparison with biosensor data. The FASEB Journal, Abstracts of 17th International Congress of Biochemistry and Molecular Biology, San Francisco, 1997, 11 (9), A78 6.

Skvortsov V.S., Sechenykh A.A., Ivanov A.S., Archakov A.I. P6. Computer modelling of intermolecular interaction of cytichromes P450 101, 2B4 and bs by docking simulation and comparison with biosensor data. NATO Advanced Study Institute on Molecular & Applied Aspects of Oxidative Drug Metabolizing Enzymes. Book of abstracts lecture notes. Tekirova, Antalya, Turkey. 1997, 80.

Sechenykh A.A., Skvortsov V.S., ShkrobA.M., Ivanov A.S. P7. Database mining for new inhibitors of cytochrome P450cam using docking procedure. NATO Advanced Study Institute on Molecular & Applied Aspects of Oxidative Drug Metabolizing Enzymes. Book of abstracts lecture notes. Tekirova, Antalya, Turkey. 1997, 81.

Ivanov A.S., Sechenykh A.A., Skvortsov V.S., Shkrob A.M., Archakov A.I. P62. Database mining for new inhibitors of cytochromes P450. Proceedings of the 2nd International Conference on Molecular Structural Biology, Vienna, 1997, 126.

6. Ivanov A.S., Medvedev A.E., Ivanova T.N., Skvortsov V.S. Computi modelling of substrate/inhibitor binding site of monoamine oxidase

(MAO-A). 3rd IUBMB Conference «Molecular Recognition», 1995, Sing, pore, 173.

7. A.S.Ivanov, V.S.Skvortsov, A.B.Rumjantsev, A.I.Archakov. Computi modelling of 3D structure of cytochrome bs membrane binding domai; Proceedings of the International Conference on Molecular Structur. Biology, Vienna, 1995, 272, P65.

8. A.S.Ivanov, A.B.Rumjantsev, v.S.Skvortsov, A.I.Archakov. Education program for macromolecules structure examination. J. Chem. Inf. Comput. Sci., 1996, v.36, 660-663.

9. A.S.Ivanov, A.B.Rumjantsev, V.S.Skvortsov, A.I.Archakov ONIX: an interactive PC program for the examination of protein 3D structure from PDB. Сотр. Appl. Biosci. 1997, v.13, No 1, 111-113.

10.A.Ivanov, V.Skvortsov, A.Rumjantsev, A.Archakov. Computer modellin and molecular dynamics of cytochrome b5. Karadeniz J. Med. Sci., 1995, v.8, N4, 210-211.

11. A.E.Medvedev, A.S.Ivanov, A.V.Veselovsky, V.S.Skvortsov,

A.I.Archakov. QSAR analysis of indole analogues as monoamine oxidase inhibitors. J. Chem. Inf. Comput. Sci., 1996, v.36, 664-671.

12.Иванов А.С., Люлькин Ю.А., Скворцов B.C., Румянцев А.Б. Рациональное компьютерное конструирование новых лекарственных средств: обзор методов. Вестник РАМН, 12, 51-56 (1995).

Текст научной работыДиссертация по биологии, кандидата биологических наук, Скворцов, Владлен Станиславович, Москва

РОССИЙСКАЯ АКАДЕМИЯ МЕДИЦИНСКИХ НАУК НАУЧНО-ИССЛЕДОВАТЕЛЬСКИЙ ИНСТИТУТ БИОМЕДИЦИНСКОЙ ХИМИИ

На правах рукописи

СКВОРЦОВ Владлен Станиславович

МОЛЕКУЛЯРНЫЙ ДОКИНГ ПРИ ИССЛЕДОВАНИИ БЕЛОК-ЛИГАНДНЫХ КОМПЛЕКСОВ

03.00.04 - биохимия

Диссертация на соискание ученой степени кандидата биологических наук

Научный руководитель:

доктор биологических наук A.C. Иванов

Москва - 1998

ОГЛАВЛЕНИЕ

Оглавление ....................................................... 2

Список сокращений ................................................ 4

Введение.........................................................5

Цель работы......................................................7

Основные задачи работы ........................................... 7

Положения, выносимые на защиту ................................... 8

Литературный обзор...............................................9

Локирование целой молекулы: виртуальный скрининг..............10

Фрагментарные методы: создание лигандов de novo...............14

Методы оптимизации счета......................................17

Материалы и методы..............................................19

Аппаратная база работы........................................19

Программная база работы.......................................19

Оптимизация комплекса двух молекул..............................19

Оптимизация конформации лиганда при поиске в базах данных.......21

Моделирование полного цитохрома Ь5..............................22

QSAR модели и их параметры......................................23

Параметры работы программы DockSearch...........................24

Информационные ресурсы, использованные в работе...............26

Результаты и обсуждение ......................................... 30

Программа DockSearch .......................................... 30

Оценка эффективности программы DockSearch ....................... 34

Уточнение результатов докинга ................................... 35

Полностью автоматизированная процедура локирования..............42

Моделирование комплекса цитохром Р4 50саш - цитохром bs.........4 4

Моделирования полного цитохрома Ь5..............................4 4

Моделирование комплексов цитохромов Р450саш и Ь5................50

Применение программы ОоскБеагсИ при поиске низкомолекулярных лигандов для ферментов ........................................ 60

1. Поиск лигандов к ферментам с известной трехмерной структурой .60

2. Поиск лигандов к моноаминоксидазе А - ферменту с неизвестной

трехмерной структурой ........................................... 8 0

Заключение......................................................84

Выводы .......................................................... 87

Список литературы...............................................8 8

СПИСОК СОКРАЩЕНИИ

SPL - Sybyl Programming Language.

QSAR - Quantitative Structure-Activity Relationship.

PDB - Protein Data Bank.

Kd - константа диссоциации.

CoMFA - Comparative Molecular Field Analysis.

R - коэффициент множественной корреляции.

R2cv - коэффициент множественной корреляции для анализа со

скользящим контролем. RMSD - среднеквадратичная разность расстояний между тождественными атомами.

fl-b5 - модель полной структуры цитохрома Ь5. t~Ъ>5 - водорастворимый фрагмент цитохрома Ь5. SCR - структурно-консервативные регионы. МАО-А - моноаминоксидаза А

ВВЕДЕНИЕ.

Лекарственные соединения воздействуют на биохимическиу процессы, как правило, взаимодействуя с макромолекулами-мишенями: белками и нуклеиновыми кислотами. Образование комплексов лекарство-мишень характерно для действия биологически активных соединений разного типа, в том числе активаторов и ингибиторов различных ферментов. В таких комплексах молекулы-лиганды пространственно (геометрически) комплементарны участку связывания на поверхности белка и удерживаются на нем благодаря кулоновским и вандерваальсовым взаимодействиям, водородным связям и т.п.

Создание новых лекарственных препаратов с необходимостью включает поиск соединений, которые комплементарны функционально важным участкам белков. Современные компьютеры позволяют осуществить такой поиск посредством вычислительного эксперимента, суть которого - в своего рода «прилаживании» пространственных образов лиганда и белка. Эта процедура называется геометрическим докингом. Наиболее адекватный подход основан на использовании данных о структуре белка, полученных рентгеноструктурным методом; в случае их отсутствия сведения о пространственном строении участка связывания (часто называемого рецепторным) могут быть получены путем анализа структуры уже известных эффективных лигандов.

Компьютерные программы, осуществляющие геометрический докинг, позволяют выявлять комплементарные молекулы в обширных базах химических структур, в том числе и в каталогах коммерчески доступных соединений. Однако известные программы этого типа далеки от идеала в отношении как скорости, так и точности.

Далее, пространственная комплементарность лиганда к рецепторному участку является необходимым, но далеко не всегда достаточным условием эффективного связывания. Поэтому

геометрический докинг как средство поиска потенциальных лигандов среди десятков и сотен тысяч органических соединений должен сочетаться с оценкой энергии взаимодействия лиганда с белком, равно как и с процедурами, позволяющими в определенных пределах

максимизировать эту энергию. Настоящая работа посвящена разработке оптимального алгоритма геометрического докинга, созданию на его основе программного обеспечения поиска потенциальных лигандов в базах данных химических структур, а также выработке методологии использования результатов докинга для оценки устойчивости соответствующих комплексов.

Поиск потенциальных низкомолекулярных лигандов - далеко не единственная область применения геометрического докинга. В частности, эта процедура может быть также использована для нахождения контактирующих участков при моделировании

взаимодействия белковых молекул.

ЦЕЛЬ РАБОТЫ

Разработка нового алгоритма геометрического докинга и его

применение для моделирования межбелковых комплексов и поиска

потенциальных низкомолекулярных белковых эффекторов.

ОСНОВНЫЕ ЗАДАЧИ РАБОТЫ

1. Разработка нового алгоритма геометрического докинга и создание на его основе соответствующего программного обеспечения.

2. Оптимизация процедуры максимизации энергии взаимодействия в системе лиганд-белок посредством конформационной адаптации лиганда и уточнению его положения на рецепторном участке белка.

3. Выработка совокупности критериев для оценки эффективности лиганд-белкового взаимодействия в комплексах, найденных в вычислительном эксперименте.

4. Создание программного комплекса, позволяющего быстро выявлять потенциальные лиганды белков в обширных базах данных, содержащих десятки тысяч структур органических соединений.

5. Применение геометрического докинга для моделирования белок-белковых комплексов.

5.1. Моделирование комплекса цитохрома Р450саш с водорастворимым фрагментом цитохрома £>5 (белок с известной трехмерной структурой).

5.2. Создание трехмерной модели полной структуры цитохрома Ь5 и его комплекса с цитохромом Р450саш.

6. Применение геометрического докинга для поиска потенциальных лигандов для белков с известной трехмерной структурой (цитохром Р450саш, субтилизин, нейраминидаза), а также для белков, о строении рецепторного участка которых можно судить по структуре их ингибиторов и субстратов (моноаминоксидаза А).

ПОЛОЖЕНИЯ, ВЫНОСИМЫЕ НА ЗАЩИТУ

1. Разработан алгоритм геометрического докинга, обладающий существенными преимуществами по сравнению с описанными в литературе.

2. Создано программное обеспечение, позволяющее удовлетворительно моделировать строение белок-белковых комплексов и быстро выявлять потенциальные эффекторы белков среди большого числа органических соединений.

ЛИТЕРАТУРНЫЙ ОБЗОР.

Алгоритмы, позволяющие выявлять особенности связывания небольшой молекулы в полости макромолекулярной мишени, становятся все более разнообразными и полезными для исследователей. Автоматический докинг, как процесс, на который в настоящее время обычно ссылаются, включает использование различных методических подходов и приближений. В данной главе будут описаны некоторые разработки в области процедуры локирования, которые должны предсказывать, будет ли предпочтительно взаимодействовать данная небольшая молекула с белком, и если будет, то каким именно образом. Если с помощью подобного подхода тестируется библиотека молекулярных структур, этот процесс соответствует виртуальному скринингу. Потенциальным преимуществом такого метода являются ясные указания для разработки новых лекарств, так как, основываясь на способности небольших молекул укладываться в место связывания макромолекулярной мишени, предварительно может быть отобран целый набор химических соединений для последующего биологического скрининга. Альтернативным подходом может быть построение молекул de novo на поверхности места связывания, использующим фрагменты, дополняющие место связывания и оптимизирующие межмолекулярное взаимодействие. Этот класс методов может также быть назван фрагментарным докингом (или докингом фрагментов), поскольку он включает оптимизацию взаимодействия между макромолекулярной мишенью и небольшими молекулярными фрагментами. В данном обзоре основное внимание уделяется этим двум классам методических подходов. Дополнительно рассматриваются алгоритмы, специально разработанные для геометрической оптимизации взаимодействий в процессе связывания. Такие шаги оптимизации часто выполняются перед фильтрацией данных, сформированных алгоритмами локирования. Отсутствие подобной оптимизации во многих случаях может сделать локирование бессмысленной процедурой. В обзоре также описаны методы, позволяющие предсказывать энергии связывания молекул в комплексе.

Локирование целой молекулы: виртуальный скрининг.

Во всех описанных в мировой литературе методиках докинга молекулой мишенью, как правило, являются высокомолекулярные соединения, такие как нуклеиновые кислоты и белки. В качестве лигандов же могут быть использованы любые молекулы, однако, для докинга небольших молекул и молекул белков обычно применяются различные подходы, что связано с особенностями вычислений.

Программа DOCK [Kuntz, 1982] является одной из самых ранних и наиболее широко применяемых для стыковки лиганда и мишени. Метод заключается в заполнении полости места связывания локально комплементарными макромолекулярной поверхности сферами, как это определено Конолли [Conolly, 1983] . Сферы создают пространственно заполненный слепок, который дополняет геометрические

характеристики места связывания и эти сферы применяются для поиска соответствий с потенциальными лигандами. Далее в базе данных, содержащей трехмерные структуры потенциальных лигандов, проводится поиск молекул, в которых межатомные расстояния соответствуют расстояниям между сферами слепка места связывания. Программа может также принять во внимание физико-химические характеристики, приписанные сферам, например, чтобы определенный тип атома соответствовал конкретной сфере. Обычно каждое соединение в базе данных хранится в виде единственной конформации и его многочисленные ориентации в пределах места связывания оцениваются с использованием некоторой функции. Предварительно рассчитанные решетки, подобные тем, которые используются при вычислениях энергии взаимодействия в молекулярной механике, описывают макромолекулярную статическую мишень и применяются для увеличения эффективности оценки. В итоге каждое соединение имеет наилучшую ориентацию и вычисленную оценку взаимодействия, связанную с данной ориентацией. Соединения из базы данных получившие наилучшую оценку, наиболее комплементарны месту связывания в белке-мишени, и таким образом считаются потенциальными лигандами.

Основной протокол поиска по базам данных является общим для большинства методов виртуального скрининга. Согласно нему

определяют лучшую комплементарность поверхностей лиганда и белка по оценивающей функции и затем проводят отсев результатов посредством различных критериев оценки. DOCK-метод достаточно широко используется [Gschwend 1996; Kuntz 1994]. В своем исходном варианте этот алгоритм проверен только для стерической комплиментарности [Kuntz, 1982; Schoichet, 1992]. Недавние разработки были ориентированны на усложнение различных функций оценки. В наиболее широко используемой версии рассмотрены молекулярные поля сил [Meng, 1992], возможна химическая идентификация сфер [Schoichet, 1993], а также может быть учтена гидратация [Meng, 1994].

Тогда как в пакете DOCK для небольших молекул предполагается только жесткая конформация, в ряде работ до некоторой степени принимается во внимание конформационная гибкость лиганда [Leach, 1992]. В данной процедуре сначала некая выбранная жесткая часть (якорный фрагмент) молекулы лиганда располагается в месте связывания, а затем генерируются и кластеризуются возможные ориентации гибких частей. В конечном счете, отбираются представители из каждого кластера. Подобный анализ исспользуется в качестве исходной точки для оценки того, как конформационная изменчивость лиганда может влиять на процесс связывания.

Другой подход к описанию места связывания в молекуле белка был предложен группой Рут Нусинов [Fischer, 1995; Sandak 1995]. Набор критических узлов, сформированный из впадин, выпуклостей и седловин на молекулярной поверхности белка и его потенциального лиганда, используется для определения вероятных соответствий между молекулами. Этот метод использует технику геометрического перемешивания (рандомизации), применяемую в технологиях компьютерной визуализации, и большей частью приспособлен для стыковки поверхностей в крупных системах. Также существует подход, который локирует молекулярные поверхности, основываясь на совмещении решеточных моделей методом наименьших квадратов [Bacon, 1992]. Точечная решеточная модель, именуемая паутиной, принимает во внимание сольватацию с учетом электростатических взаимодействий

и скрытых областей поверхности. Тестовые вычисления демонстрируют эффективность методики. Для вычисления максимального числа соответствий между точками поверхности рецептора и лиганда также использовалась теория графов [Kasinos, 1992]. Идея использования исключительно стерических критериев путем формирования матриц представления молекулярных поверхностей в виде двухмерных решеток позволяет проводить исчерпывающий анализ возможной ориентации белка, выявляя подматрицы согласования [Helmer-Citterich, 1994; Walls,1992].

В вопросах решения проблем межмолекулярного соответствия весьма перспективна программа GRAMM, предлагающая некоторые интересные альтернативы. В ее основу положено сглаживание функции энергии межмолекулярного взаимодействия путем варьирования атом-атомных потенциалов, что позволяет учитывать масштаб стерических препятствий в самом начале процесса. Этот способ не требует дополнительного описания места связывания, необходимы только координаты лиганда и мишени [Katchalski-Katzir, 1992; Vakser, 1994; Vakser, 1995; Vakser, 1996a; Vakser, 1996b].

В последние годы все более многочисленны попытки учета гибкости лигандов. Программа FLOG [Miller, 1994], развившаяся из DOCK, учитывает гибкость лигандов путем использования серии конформеров, которые для каждой молекулы хранятся в базе данных. Описывается только один, получивший наилучшую оценку, конформер лиганда. FLOG использует концепцию критических точек, где используются определенные центры строго соответствующие атомам лиганда. FLOG имеет также несколько других особенностей, изначально отличающих его от DOCK. Однако по многим особенностям функционирования самые новые реализации DOCK эквивалентны FLOG.

Существует целый ряд других подходов, рассматривающих конформационную вариабельность лиганда. Например, предложен метод, где вероятные способы связывания находятся и оцениваются с точки зрения образования водородных связей [Mizutani, 1994]. Рассчитываются и рассматриваются все модели взаимодействия для всех конформаций лиганда, после оценки строения моделей выбирается

лиганд в конформации с наилучшими параметрами. Другая программа, GREEN, опирается на метод построения решеточных моделей и разработана той же группой. GREEN имеет многочисленные встроенные функции для минимизации и покомпонентного анализа энергии, существенно облегчающие процесс локирования [Tomioka, 1994].

Разрабатываются подходы и с использованием более сложных систем, включая методы основанные на технологии виртуальной реальности. Пользовательский интерфейс STALK программы CAVEAT [Lauri, 1994] является системой виртуальной реальности, позволяет визуализировать процесс оптимизации и разрешает пользователю напрямую взаимодействовать с алгоритмом путем изменения параметров. Autodock использует протокол оценки решеточных моделей в сочетании с моделированием отжига для конформационного поиска. Основное его преимущество - использование метода Монте-Карло при моделировании отжига, что позволяет исследовать возможные варианты взаимодействии лигандов с молекулой мишенью [Morris, 1996]. Docking-d представляет собой инструмент, разработанный как часть большого программного п