Бесплатный автореферат и диссертация по биологии на тему
Предсказание аффинности и спектра действия лигандов ядерных рецепторов стероидных гормонов методами компьютерного моделирования
ВАК РФ 03.01.09, Математическая биология, биоинформатика

Автореферат диссертации по теме "Предсказание аффинности и спектра действия лигандов ядерных рецепторов стероидных гормонов методами компьютерного моделирования"

На правах рукописи

ФЕДЮШКИНА Ирина Викторовна

ПРЕДСКАЗАНИЕ АФФИННОСТИ И СПЕКТРА ДЕЙСТВИЯ ЛИГАНДОВ ЯДЕРНЫХ РЕЦЕПТОРОВ СТЕРОИДНЫХ ГОРМОНОВ МЕТОДАМИ КОМПЬЮТЕРНОГО МОДЕЛИРОВАНИЯ

03.01.09 - математическая биология, биоинформатика

7 НОЯ 2013

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата биологических наук

005537698

Москва-2013

005537698

Работа выполнена в Федеральном государственном бюджетном учреждении «Научно-исследовательский институт биомедицинской химии имени В.Н.Ореховича» Российской академии медицинских наук.

Научный руководитель: кандидат биологических наук,

Скворцов Владлен Станиславович

Официальные оппоненты: Иванов Алексей Сергеевич,

доктор биологических наук, профессор ФГБУ «ИБМХ» РАМН, зав. лабораторией

Омельченко Андрей Владимирович,

кандидат биологических наук, ФГБУН Институт проблем экологии и эволюции имени А. Н. Северцова РАН, научный сотрудник

Ведущее учреждение: Федеральное государственное бюджетное

учреждение науки «Институт физиологически активных веществ» РАН.

Защита состоится «28» ноября 2013г. в II00 часов на заседании диссертационного совета Д 001.010.01 при Федеральном государственном бюджетном учреждении «Научно-исследовательский институт биомедицинской химии имени В. Н. Ореховича» Российской академии медицинских наук (ФГБУ «ИБМХ» РАМН) по адресу: 119121, Москва, ул. Погодинская, д. 10, стр. 8.

С диссертацией можно ознакомиться в библиотеке ФГБУ «ИБМХ» РАМН. Автореферат разослан «26» октября 2013 г.

Ученый секретарь Диссертационного совета, кандидат химических наук -^'Г1 ^ Карпова Е.А.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность работы. Поиск лекарственных препаратов с целенаправленным эффектом является одной из востребованных задач медицинской химии, с которой встречаются исследователи всего мира. Особое внимание в современной медицине уделяется специфичности действия лекарственных препаратов с целью уменьшения вредного влияния на человеческий организм и достижение максимального лечебного результата. На ранних стадиях исследований наиболее эффективным, быстрым и недорогим подходом в направленном поиске лекарственных соединений с заданными свойствами является применение различных компьютерных технологий: био- и хемо-информатики, молекулярного моделирования, SAR и QSAR подходов и математической статистики. Компьютерные (виртуальные) эксперименты не могут отменить по своей сути реальные, но позволяют существенно сократить сроки работы, проверить различные идеи, а также подсказать новые направления для развития исследования.

В современной медицине стероидные гормоны являются одной из широко применяемых групп химических соединений. Они представляют собой основной класс регуляторов физиологических процессов у животных и человека. Биологический эффект этих молекул опосредован их связыванием со специфическими внутриклеточными (ядерными) рецепторами, которые представляют собой ДНК-связывающие транскрипционные фактор и имеют общую доменную организацию и единый механизм действия.

Лиганды ядерных рецепторов стероидных гормонов можно условно разделить на 3 группы в зависимости от способности вызывать биологический эффект: агонисты, частичные агонисты, антагонисты. Связывание рецептора с агонистами или с антагонистами приводит к различным конформационным изменениям рецепторов, что оказывает влияние на взаимодействие с корегуляторами и приводит к изменению транскрипции генов.

Некоторые биологические эффекты стероидные препараты проявляются благодаря тому факту, что они могут перекрёстно взаимодействовать с другими рецепторами своего класса [Wilkinson et al., 2008]. Это обусловливает их мультифункциональность в организме, которая приводит к возникновению побочных реакций при их применении в качестве лекарственных средств [Bagamasbad et al., 2011]. Предсказание спектра действия лекарственного препарата помогает снизить побочные эффекты и даёт возможность применять соединения для комплексного воздействия.

Таким образом, при создании лекарственного прототипа желательно заранее определить два его свойства: аффинность к целевому рецептору и селективность по отношению к группе сходных рецепторов.

Цель работы: создание системы предсказания аффинности стероидных лигандов к подгруппе ядерных рецепторов стероидных гормонов

с последующим прогнозом типа их действия (агонист/антагонист/неактивное соединение).

Задачи исследования:

1. Сформировать рабочие выборки, содержащие данные о структурах стероидных соединений, экспериментальных оценках аффинности к 5-ти ядерным рецепторам стероидных гормонов и типе действия.

2. Разработать модели предсказания оценки аффинности стероидных лигандов к ядерных рецепторам стероидных гормонов.

3. Разработать классификационные модели для предсказания спектра действия стероидных лигандов ядерных рецепторов стероидных гормонов.

4. Провести валидацию созданных моделей на тестовых выборках. Положения, выносимые на защиту.

1. Модели предсказания величины аффинности стероидных лигандов к ядерным рецепторам стероидных гормонов с использованием методов ЗО-С^АК могут разделять стероиды на высоко и низкоаффинные группы.

2. Модели предсказания величины аффинности на основе методов молекулярного докинга, молекулярной динамики и искусственных нейронных сетей можно использовать для определения степени сродства лиганда к рецептору и точной сортировки лигандов по связыванию в ряду исследуемых стероидов.

3. Комплексный подход оценки аффинности и последующего типа действия позволяет получить результаты, хорошо коррелирующие с экспериментальными данными.

Научная новизна. Впервые для всей группы ядерных рецепторов стероидных гормонов разработана единая система предсказаний аффинности стероидных лигандов, совмещающая методы докинга, молекулярной динамики и искусственных нейронных сетей; впервые создана модель предсказания аффинности прегна-О'-пентаранов к рецептору прогестерона; впервые показана возможность применения метода 81МСА для оценки типа действия (агонист/антагонист/неактивное соединение) стероидных лигандов.

Практическая значимость. Разработанная методика предсказания аффинности и спектра действия стероидных лигандов ядерных рецепторов стероидных гормонов может быть использована для отбора новых кандидатов с заданной биологической активностью при направленном конструировании и/или поиске высокоселективных гормональных препаратов. В сочетании с геномным и протеомным анализом, это также даст возможность по-новому подойти к индивидуальному подбору лекарств при терапии широкого спектра заболеваний. Программная реализация дискриминационных моделей может быть использована в научно-исследовательских учреждениях, работающих в областях фармацевтической химии, а также, применяться в учебном процессе высших учебных заведений соответствующего профиля.

Апробация работы. Результаты работы были представлены на российских и международных конференциях: XV международная конференция «Гетероциклы в биоорганической химии», Латвия, Рига, 2013; Всероссийская школа-конференция молодых ученых, аспирантов и студентов с международным участием «Химия биологически активных веществ», Россия, Саратов, 2012; III международная интернет-конференция «Актуальные проблемы биохимии и бионанотехнологии», Россия, Казань, 2012; XIV и XVI Российский национальный конгресс «Человек и лекарство», Россия, Москва, в 2007 и 2010; Третий международный симпозиум «Методы и применения компьютерной химии» (МАСС-3), Украина, Одесса-Краков, 2009; Всероссийская научная конференция «Органическая химия для медицины» (Орхимед 2008), Россия, Черноголовка, 2008.

Публикации. По материалам диссертации опубликовано 12 научных работ, из них 5 в отечественных и зарубежных рецензируемых научных изданиях (4 из списка ВАК) и 7 работ в трудах конференций.

Структура и объем диссертации. Диссертационная работа изложена на 115 страницах машинописного текста, содержит 22 рисунка и 13 таблиц, состоит из введения, трех глав, заключения, списка литературы, содержащего 152 ссылки.

В первой части главы дана краткая характеристика подсемейства ядерных рецепторов стероидных гормонов, их филогении, структуры, природных лигандов (рис. 1), принципов доменной организации, лиганд-связывающего домена (ЛСД) и структурных изменений при взаимодействии с эффекторами.

ОБЗОР ЛИТЕРАТУРЫ

он

Корпгеол (РГ)

Эстрадиол (РЭ)

Тестостерон (РА)

Прогестерон (РП)

Алъдостероп (РМ)

Рисунок 1. Природные лиганды рецепторов стероидных гормонов.

Каждый из рецепторов описан в виде отдельного подраздела. Отдельно описан класс селективных модуляторов рецептора прогестерона - прегна-О'-пентараны (рис. 2), производных прогестерона, сочлененных в 16а, Па-положениях с трех-шестичленными карбоциклами, синтезированных сотрудниками лаборатории химии стероидных соединений Института органической химии им. Н.Д. Зелинского РАН при участии д.х.н. И.С. Левиной, на примере которых подробно описана методика работы в последующих разделах.

Во второй части главы приведён обзор вычислительных методов, используемых в работе, таких как ЗО-С^АЯ, молекулярный докинг, симуляция молекулярной динамики, ММ-РВБА, искусственные нейронные сети (ИНС), методики классификации и дискриминантного анализа.

МАТЕРИАЛЫ И МЕТОДЫ ИССЛЕДОВАНИЯ Выборки для предсказания аффинности стероидных лигандов к ядерным рецепторам стероидных гормонов.

Для предсказания аффинности стероидных лигандов к ядерным рецепторам стероидных гормонов (рецепторам прогестерона - РП, эстрогенов - РЭ, андрогенов - РА, глюкокортикоидов - РГ, минералокортикоидов - РМ) в диссертационной работе были собраны выборки, содержащие данные о структурах стероидных лигандов и экспериментальные данные по их связыванию с соответствующими рецепторами.

В качестве обучающей выборки для РП в работе использовались данные о структуре 42 аналогов прогестерона - прегна-О'-пентаранов и их величинах аффиности (Ка) к рецептору прогестерона крысы и кролика. Эти соединения являются высокоселективными лигандами РП и уникальны тем, что имеют дополнительное Б' кольцо, примыкающее к а-области кольца Б структуры прогестерона (рис. 2). Синтез и биологическое тестирование этих пентаранов были выполнены ранее [Бгтгпоу й а1., 2000; Ьеута й а1., 2002; Категпкзкн й а1., 2005; Ьеута е1 а1., 2005]. Все данные были любезно предоставлены д.х.н. И.С. Левиной. Значения относительной конкурентной активности (ОКА) были получены как отношение значения К^ прогестерона к соответствующему значению К(1 для лиганда, измеренному по конкуренции с прогестероном, меченым тритием. При создании моделей предсказания,

4

если значения ОКА для РП кролика отсутствовали, то их вычисляли по корреляционному уравнению, связывающему значения ОКА для крысы и кролика. Анализ пространственной структуры ЛСД РП крысы, кролика и человека показал, что все аминокислотные остатки находятся вдали от места связывания с прогестероном. Это позволило объединить данные по связыванию РП человека, крысы и кролика в одну общую выборку.

Выборка лигандов РЭ была собрана из литературных источников и содержала данные о структурах 29 стероидных лигандов РЭ-а - аналогов эстрадиола и других стероидов [Sutherland et al., 2003]. Экспериментальные данные об ОКА этих соединений были получены для РЭ-а матки крысы.

Выборка лигандов РА содержала данные о структурах 27 стероидов, с различной функциональной активностью (PubChem BioAssay AID625228). Величины ингибиторной активности этих соединений были представлены в виде 1С50.

Лиганды РГ: 41 соединение, включающее две группы - сложные эфиры глюкокортикоидов, которые используются в медицине для лечения воспалительных заболеваний кожи [Hammer et al., 2003; Spreafico et al., 2009], и селективные лиганды РГ человека - производные хинолина (нестероидные соединения, но структурно подобные стероидам), обладающие функциональной глюкокортикоидной активностью, равноценной преднизолону [Coghlan et al., 2001]. Обе группы достаточно хорошо могут быть пространственно выровнены при использовании методов компьютерного моделирования. В качестве характеристики аффинности были взяты экспериментальные данные о Kj этих соединений с РГ человека.

Лиганды РМ - 20 стероидных соединений, метаболитов прогестерона и 18-замещенных кортикостероидов, обладающих агонистической и антагонистической активностью на РМ человека [Grassy et al., 1997; Quinkler et al., 2002] с данными о Kj.

Во всех случаях при построении корреляций использовались логарифмические величины характеристик аффинности.

Трехмерные структуры комплексов лиганд-связывающих доменов рецепторов прогестерона (1А28), эстрадиола (1А52), андрогенов (2АМ9), минералокортикоидов (2АА2), глюкокортикоидов (1M2Z) человека и их природных лигандов были взята в Protein Data Bank (в скобках указаны идентификационные коды PDB).

Выборки для предсказания спектра действия стероидных лигандов к ядерным рецепторам стероидных гормонов.

Отдельно были подготовлены выборки соединений стероидной природы с экспериментально установленным типом действия. Всего было сформировано 10 выборок. В каждую входили вещества, для которых было показано наличие конкретного типа действия (например, "агонист РП" или другая выборка "антагонист РП") и соединения, для которых было показано его отсутствие. Для РП в качестве агонистов использовались природные и

синтетические прогестины [Бертрам, 2008], в качестве его антагонистов -синтетические производные мифепристона (они же являются антагонистами и для РГ) [Nickisch et al., 2013]. Агонисты РГ - синтетические кортикостероиды - аналоги флутиказона [Millan et al., 2011]. Агонисты РЭ -натуральные и синтетические эстрогены [Зайдиева, 2001; Бертрам, 2008], антагонисты - синтетические производные 1 Vß-эстрадиола [Jiang et al., 2013]. Агонисты PA - набор природных и синтетических андрогенов [Fang et al., 2003], антагонисты - синтетические стероиды, включающие дополнительные гетероциклы [Singh et al., 2000]. Агонисты РМ -синтетические производные альдостерона [Kirk et al., 1993], Антагонисты -производные 17-спиронолактона [Kandemirli et al., 2002]. Учитывая, что для прогестинов показана перекрестная гормональная активность [Kühl, 2005], они были добавлены в выборки для других рецепторов согласно описанным эффектам. В качестве соединений «без эффекта» для РА были использованы агонисты РМ [Bledsoe et al., 2005] и прогестины [Kühl, 2005]. Для остальных были взяты агонисты PA [Fang, Tong et al., 2003], так как они не имеют прямого перекрестного взаимодействия с другими рецепторами [Дегтярь, 2005].

Методы построения моделей предсказания аффинности.

В работе использовались 2 группы основных методов: 3D-QSAR, включая CoMFA (сравнительный анализ молекулярных полей) или CoMSIA (сравнительный анализ молекулярных индексов), и процедуру, основанную на прямом моделировании комплексов лиганд/лиганд-связывающий домен (ЛСД) рецептора методами молекулярного докинга и симуляции молекулярной динамики.

В первом варианте для каждого набора соединений проводилась начальная оптимизации структуры с использованием молекулярной механики (пакет Sybyl-X) и частичных атомных зарядов рассчитанных по эмпирической схеме Gasteiger-Huckel. Пространственное выравнивание лигандов выполнялось с использованием модуля Sybyl/GALAHAD [Richmond et al., 2006]. В результате отбирались 20 лучших выравниваний, для каждого из них строились модели предсказания аффиности методом частичных наименьших квадратов на основании полей CoMFA и CoMSIA. Лучшая модель рассматривалась как конечный результат.

Во втором варианте моделирование комплексов осуществляли посредством докинга (Dock 6.5 [Kuntz et al., 1982]) молекул потенциальных лигандов к участку связывания природного лиганда ЛСД рецептора. До 3-х наиболее предпочтительных вариантов виртуальных комплексов подвергались дальнейшей оптимизации средствами программы Amber 9.0 (поля сил AMBER99 и GAFF) по следующему алгоритму:

• Сольватация комплекса водой явным образом (модель воды TIP3P),

слой воды до границ прямоугольного бокса не менее 4 ангстрем.

• Минимизация общей энергии системы - 1000 шагов.

• Разогрев системы от ОК до ЗООК - симуляция молекулярной динамики -10 пс с шагом в 2 фс в периодических граничных условиях (NTV ансамбль) с заторможенной структурой белка.

• Выравнивание плотности системы при ЗООК - симуляция молекулярной динамики - 10 пс с шагом в 2 фс в периодических граничных условиях (NTP ансамбль) с заторможенной структурой белка.

• Уравновешивание системы при ЗООК - симуляция молекулярной динамики - 10 пс с шагом в 2 фс в периодических граничных условиях (NTP ансамбль).

• Симуляция молекулярной динамики (продуктивная динамика) при ЗООК, 10 пс с шагом в 2 фс в периодических граничных условиях (NTP ансамбль).

Кроме функции оптимизации структуры продуктивная динамика методом MM-PBSA также служила для оценки аффинности ЛСД рецепторов к лигандам [Kollman et al., 2000]. Усреднение производилось по 10 шагам симуляции через равные промежутки времени. Отбор конечного варианта производился по минимальному значению изменения свободной энергии комплекса, рассчитанному по методу MM-PBSA. Величины отдельные энергетических вкладов (величины электростатического и ван-дер-ваальсовых взаимодействий и др.), входящих в общую функцию MM-PBSA, а так же собственные характеристики лиганда (молекулярный вес, объём, площади полярной и общей поверхности) использовались как независимые переменные для построения корреляционных уравнений.

Для построения корреляционных моделей использовались как классическая линейная регрессия, так и метод искусственных нейронных сетей (ИНС). Была применена однонаправленная нейронная сеть с сигмоидальной функцией активации в скрытом слое и линейной функцией передачи в выходном слое. Обучение ИНС осуществлялось методом обратного распространения ошибки. Минимизация ошибки между целевым и вычисленным значениями выполнялась по методу Левенберга-Марквардта. С целью снижения ошибки переобучения в каждом случае начальная выборка была увеличена в 4 раза путем генерации новых точек в пределах погрешности (статистический бутстрап).

Методы предсказания типа действия.

В работе были использованы 2 основных подхода PASS и SIMCA. Программный продукт PASS (Prediction of Activity Spectra for Substance) предназначен для прогнозирования различных типов биологической активности химических соединений на основе их структурной формулы [Poroikov et al., 2000; Филимонов et al., 2006; Lagunin et al., 2010]. Для описания структуры химического соединения в PASS применяются дескрипторы многоуровневых атомных окрестностей — MNA (Multilevel Neighbourhoods of Atoms) [Filimonov et al., 1999]. В текущей версии PASS

имеется возможность предсказать все 10 целевых эффектов: «агонист/неактивное соединение» и «антагонист/неактивное соединение» для рецепторов прогестерона, эстрогенов, андрогенов, глюкокортикоидов и минералокортикоидов.

Метод SIMCA или метод формального независимого моделирования аналогий классов [Wold, 1976; Dunn III et al., 1995] - классификационный метод с обучением. Главным преимуществом метода является сохранение работоспособности, если число дескрипторов существенно превышает число объектов, даже если число объектов мало. В качестве распознаваемых классов для моделей предсказания эффекта агонист/антагонист были установлены два: наличие эффекта (1) и его отсутствие (0). В работе использовали параллельно две группы дескрипторов, рассчитанных на основании структурных формул. Первая группа была рассчитана с помощью web-приложения E-Dragon [Tetko et al., 2005; VCCLAB, 2005]. Вторая группа была рассчитана на основе MNA дескрипторов.

Таким образом, всего рассматривалось 3 варианта моделей, которые оценивались с помощью метода скользящего контроля и частным случаем этого метода с исключением по одному. Так как для оценки качества прогноза PASS используется встроенный инвариантный критерий точности прогноза (IAP), рассчитываемый на данных обучающей выборки по методу скользящего контроля с исключением по одному и численно равный величинам ROC AUC, IAP использовался также и для оценки моделей SIMCA. Критерий IAP дает выборочную оценку вероятности того, что случайным образом выбранная из генеральной совокупности пара из положительного и отрицательного примеров будет классифицирована правильно, т.е. положительному примеру будет дано предпочтение перед отрицательным. Для оценки качества работы SIMCA для всех лигандов была рассчитана мера молекулярного подобия с природным агонистом рецептора -коэффициент Танимото [Wold et al., 1976]. Затем случайным образом вся выборка делилась на тестовую (20%) и обучающую (80%). При этом наборы выбирались так, чтобы наблюдения в тестовой выборке равномерно покрывали весь диапазон изменения коэффициента Танимото.

РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ Создание моделей предсказания аффинности.

Последовательность этапов в данной части работы может быть продемонстрирована на примере прегна-Б'-пентаранов - лигандов РП. На рисунке 3 представлено лучшее выравнивание лигандов, полученное модулем Sybyl/GALAHAD. Для сравнения справа приведено положение тех же лигандов, полученных моделированием виртуальных комплексов с ЛСД РП в месте связывания.

Рисунок 3. Пространственное выравнивание лигандов РП (прегна-Б'-пентаранов) полученное модулем 5уЬу1/САЬАНАО (слева) и в результате моделирования виртуальных комплексов (справа).

Полная выборка -10% "выбросов"

Использованный метод CoMFA CoMSIA CoMFA CoMSIA

Число соединений 42 42 37 37

Q2 в LOO 0,37 0,38 0,59 0,57

Стандартная ошибка в LOO 1,28 1,30 1,08 1,12

R2 обучения 0,82 0,92 0,91 0,93

Стандартная ошибка обучения 0,68 0,47 0,52 0,41

Критерий Фишера 42,44 66,68 76,18 77,33

Выравнивание является определяющей процедурой при использовании методов СоМРА и СоМ81А. В последнее время появилась тенденция использовать в качестве выравнивания совмещённые в пространстве положения лигандов, полученные из модельных комплексов, однако для данной выборки выравнивание по характеристическим точкам давало лучший результат. В таблице 1 представлено 2 набора моделей, рассчитанных для полной выборки и с учётом так называемых «выбросов». Наличие «выбросов» очень характерно для методов СоМРА и СоМБ1А, так как оценка качества моделей ведётся по процедуре скользящего контроля. В этом случае наличие молекул, имеющих уникальные боковые радикалы, или неудачно выровненных молекул может давать существенные флуктуации. Как правило, их отбрасывают. Однако даже с учётом отбрасывания в процедуре скользящего контроля методом выбрасывания по одному предсказательная сила моделей невелика (рис. 4).

Экспериментальные значения

Экспериментальные значения

СоМРА

СоМ81А

$ -4

О2 = 0,59

• •• I

-5 -4 -3 -2 -1 0 Экспериментальные значения !Е(ИВА)

I 0

к -1

5

X

т 2 га

5 -з 01

| -4

X

ё -5

и 5

I -6

Л

ей

-6 -5 -4 -3 -2-10 Экспериментальные значения 1Е(КВА)

СоМРА -10% СоЛША -10%

Рисунок 4. Сравнение экспериментальных и вычисленных ЗО-С^АЯ величин ^(ОКА) в процедуре скользящего контроля для РП.

Следующим этапом для создания предсказательной модели была попытка построить линейную регрессионную модель на основании параметров, рассчитанных методом \4M-PBSA для смоделированных комплексов лиганд/ЛСД рецептора, и физико-химических параметров, описывающих свойства лиганда (рис. 5). Результаты (Я2 обучения 0,6 и при процедуре скользящего контроля 0,41) неудовлетворительны. Однако, несмотря на существенный разброс, наличие определённой зависимости просматривается, и отличить слабо связывающиеся и сильно связывающиеся лиганды с помощью данной модели возможно.

И последним этапом стало создание предсказательной модели с использованием искусственных нейронных сетей. В качестве входных параметров были взяты те же величины, что и для линейной регрессионной модели. Число нейронов в скрытом слое составило 8 штук, минимизация при

настройке весов сети проводилась по среднеквадратичной ошибке. Также во время минимизации проводился контроль на переобучение ИНС. Результаты представлены на рисунке бив сводной таблице 2 для всех рецепторов. Из всех построенных моделей ИНС даёт самые лучшие результаты, средняя ошибка предсказания при скользящем контроле в 4 раза меньше чем в лучшем варианте моделей ЗЭ-С^АЯ.

= 0,60

• V ^

• Ь г*••

-5 -3 -1 1

Экспериментальные значения 1§(ОКА)

Процедура обучения

-5 -3 -1 1

Экспериментальные значения !^(ОКЛ)

Скользящий контроль

Рисунок 5. Сравнение экспериментальных и вычисленных по уравнению линейной регрессии величин ]§(ОКА) при обучении и в процедуре скользящего контроля для РП.

£. 0

Экспериментальные значения ^(13ВА)

-5 -3 -1 1

Экспериментальные значения ^(ЯВА)

Процедура обучения Скользящий контроль

Рисунок 6. Сравнение экспериментальных и вычисленных методом ИНС величин ^(ОКА) при обучении и в процедуре скользящего контроля для РП.

Для более адекватной оценки предсказательной способности полученных моделей была использована независимая тестовая выборка. Для

8 соединений из ряда пентаранов были выполнены предсказания по 3 моделям, а затем эти вещества были синтезированы и изучены in vitro. Экспериментальные данные были любезно предоставлены д.х.н. И.С. Левиной. Результаты представлены на рисунке 7. Предсказания, выполненные с помощью 3D-QSAR и линейной модели, имеют большую дисперсию: (R2 равны 0,39 и 0,37 соответственно). Нейронная же сеть даёт очень хороший результат (R2=0,77), т.е. модель имеет хорошую предсказательную силу.

-3 -2-10 i

Экспериментальные значения Ig(OKA)

<

2С О

» о

5 -2

R2 = 0,77

-3 -2-10 1

Экспериментальные значения Ig(OKA)

СоМРА (-10%) Искусственная нейронная сеть

Рисунок 7. Сравнение экспериментальных величин 1§(ОКА) для РП и результатов предсказания методами СоМРА (с учетом «-10% выбросов» при построении модели) и ИНС для независимой тестовой выборки.

Таблица 2. Статистические параметры лучших 3D-QSAR моделей.

Использованный метод (рецептор) CoMFA (РП) CoMSIA (РМ) CoMSIA (РГ) CoMSIA (РЭ) CoMSIA (РА)

Q2 в LOO 0,59 0,63 0,55 0,64 0,70

Стандартная ошибка в LOO 1,08 0,73 0,61 0,82 0,69

R2 обучения 0,91 0,97 0,88 0,99 0,94

Стандартная ошибка обучения 0,52 0,22 0,31 0,15 0,32

Критерий Фишера 76,18 91,34 69,83 258,35 93,16

В таблице 2 представлены результаты лучших моделей предсказания аффинности лигандов ядерных рецепторов стероидных гормонов, полученных методами СоМРА и СоМБГА с учетом «выбросов». Лучшая из них модель с применением метода СоМ81А для рецептора андрогенов. R2 равен 0,94, а О2 равно 0,70. Метод СоМРА для РА тоже даёт хороший результат. Однако в общем случае для всех 5 рецепторов предсказательная сила моделей при данном подходе невелика. Модели с использованием

линейной регрессии также не показали хорошей предсказательной силы. Эти 2 группы моделей можно использовать только для грубой классификации лигандов на «сильно» и «слабо» связывающиеся.

В отличие от ЗО-С^АЯ искусственные нейронные сети, как и в случае рецептора прогестерона, дают значительно лучшие результаты (табл. 3). Среднее С?2 в процедуре скользящего контроля для всех 5 рецепторов составило 0,92 (0,86 для самого «худшего» варианта РГ). Данные модели можно использовать для определения степени сродства лиганда к рецептору и точной сортировки лигандов по связыванию в ряду исследуемых компьютерными методами стероидных соединений.

Таблица 3. Статистические параметры моделей «молекулярный докинг+молекулярная динамика+ИНС».___

Статистические параметры РА РЭ ГР РМ РП

Настройка сети И2 для обуч. выборки 0,95 0,98 0,95 0,98 0,98

И2 для контр, выборки 0,94 0,98 0,95 0,96 0,97

Я2 для тест, выборки 0,96 0,98 0,97 0,98 0,96

И2 для обшей выборки 0,95 0,98 0,96 0,97 0,98

Скользящий контроль <г2 0,95 0,92 0,86 0,94 0,91

Среднеквадратичная ошибка 0,22 0,25 0,37 0,24 0,29

Среднее отклонение 0,20 0,24 0,46 0,18 0,29

Построение моделей предсказания типа действия.

В ходе работы было построено 3 варианта по 10 моделей, каждая из которых предсказывала наличие или отсутствие соответствующего эффекта агониста или эффекта антагониста. Предсказания программой PASS выполнялись на текущей версии ПО, с обучением по той же выборке, которая использовалась для метода SIMCA. Результаты валидации (табл. 4) показывают, что построенные модели устойчивы и сохраняют хорошую прогностическую способность (среднее IAP для кросс-валидации более 0,79 и среднее IAP для скользящего контроля более 0,80 для всех 3 вариантов). Также был проведён независимый тест (табл. 5), для которого использовалась выборка из 23 природных и синтетических стероидов с экспериментальными данными о типе их действия на все 5 ядерных рецепторов стероидных гормонов [Wilkinson, Hayes et al., 2008]. Наибольшее совпадение с экспериментальными данными наблюдается при использовании метода SIMCA и дескрипторов DRAGON (среднее 1АР=0,76).

Имеются существенные расхождения в оценках IAP в случае кросс-валидации и независимого теста для PASS. Наиболее вероятное объяснение -

особенности обучающего алгоритма PASS, предназначенного в первую очередь для работы с большими и разнородными выборками, в результате чего значения IAP при обучении на выборке ограниченной узкой группой стероидных соединений завышены. Модели, полученные с использованием метода SIMCA и дескрипторов DRAGON, могут быть применены в дальнейшем для прогноза спектра действия стероидных лигандов ядерных рецепторов стероидных гормонов. Среднее IAP при кросс-валидации во время построения моделей составило 0,84.

Таблица 4. Инвариантная точность прогноза (1АР) при валидации моделей предсказания типа действия лигандов ядерных рецепторов стероидных гормонов._

Стероидные соединения PASS SIMCA+MNA SIMCA+DRAGON

Эффект Всего П н IAP ОО IAP CV IAP OO IAP CV IAP OO IAP CV

АГРА 51 21 30 0,96 0,96 0,63 0,62 0, 77 0,75

АН РА 51 18 33 0,94 0,93 0,59 0,60 0,75 0,74

АГ РЭ 44 10 34 0,79 0,79 0,73 0,73 0,91 0,89

АН РЭ 44 22 22 0,99 0,99 0,89 0,86 0,95 0,93

АГ РГ 50 24 26 0,95 0,95 0,90 0,88 0,85 0,79

АН РГ 38 10 28 1 1 0,96 0,88 0,95 0,86

АГ РМ 35 10 25 1 1 0,91 0,89 0,88 0,85

АН РМ 47 14 33 0,93 0,94 0,83 0,82 0,85 0,78

АГ РП 45 21 24 0,99 0,99 0,70 0,69 0,87 0,86

АН РП 33 10 23 1 1 0,90 0,90 1 0,89

Сред, знач. 0,95 0,95 0,80 0,79 0,89 0,84

Условные обозначения: CV - кросс-валидация (итеративное выбрасывание по 20%); LOO - процедура скользящего контроля с исключением по одному; П -позитивный (наличие эффекта); Н - негативный (отсутствие эффекта); АГ — агонист; АН - антагонист.

Таблица 5. Инвариантная точность прогноза независимого теста для моделей предсказания типа действия лигандов ядерных рецепторов стероидных гормонов.___________

АГ PA АГ РЭ АГ РГ АГ PM АГ РП AH PA AH РЭ AH РГ AH PM AH РП Сред, знач.

SIMCA+ DRAGON 0,81 0,63 0,70 0,79 0,76 0,71 0,81 0,91 0,77 0,75 0,76

SIMCA+ MNA 0,53 0,50 0,59 0,50 0,60 0,32 0,45 0,50 0,50 0,58 0,50

PASS 0,48 0,58 0,77 0,54 0,76 0,53 0,74 0,64 0,53 0,58 0,61

Результат можно считать приемлемым для предварительного отбора первоочередных вариантов из множества кандидатов при планировании экспериментов и дальнейших исследований. На основе этих моделей (51МСЛ+011А0(Ж) была создана программа предсказания эффекта агониста или эффекта антагониста, доступная на сайте ФГБУ «ИБМХ» РАМН (http://www.ibmc.msk.ru/rll/departments/32?start=3).

Таблица 6. Комплексная оценка стероидных молекул, совмещающая предсказание аффинности и типа действия лигандов ядерных рецепторов стероидных гормонов.__

РП Оценка аффинности Оценка эффекта

ОКА пред. ОКА эксп. АГпред. АГ эксп. АН пред. АН эксп.

прогестерон 1,21 1,00 1 1 0 0

РЭ RBA пред. RBA эксп. АГпред. АГ эксп. АН пред. АН эксп.

17р-эстрадиол 0,87 1,00 1 1 0 0

РГ RBA пред. RBA эксп. АГ пред. АГ эксп. АН пред. АН эксп.

дексаметазон 1,00 1,00 1 1 0 0

метилпреднизолон 3,58 3,89 1 1 0 0

преднизолон 12,91 10,72 0 0 1 1

РМ RBA пред. RBA эксп. АГпред. АГ эксп. АН пред. АН эксп.

альдостерон 1,00 1,00 1 1 0 1

кортикостерон 0,24 0,21 1 0 0 0

кортизол 0,80 0,86 1 1 1 1

дексаметазон 0,25 0,29 1 1 0 0

прогестерон 0,29 0,34 0 0 1 1

РА IC50 (цМ) пред. IC50 (fiM) эксп. АГпред. АГэксп. АН пред. АН эксп.

дигидротестостерон 0,003 0,002 1 1 0 0

даназол 0,019 0,012 1 1 0 0

дексаметазон 18,416 24,558 1 0 0 I

17р-эстрадиол 0,247 0,353 0 0 1 0

эстрон 12,454 11,617 0 0 1 1

этистерон 0,049 0,067 1 1 0 0

метилпреднизолон 0,225 0,214 1 1 0 0

норэтиндрон 0,028 0,022 1 1 0 0

прогестерон 22,496 26,681 1 1 0 0

тестостерон 0,008 0,006 1 1 0 0

Таким образом, в результате работы были созданы 2 группы моделей (молекулярный докинг+молекулярная динамика+ИНС и 81МСА+1ЖЛСОЫ), независимо предсказывающие аффинность к 5 ядерным рецепторам стероидных гормонов и спектр действия стероидных лигандов. Эту систему можно применить для комплексной оценки произвольно выбранного стероидного соединения. Это можно продемонстрировать на примере соединений из независимой тестовой выборки, использованной для

15

верификации моделей предсказания типа действия, которые также имелись в обучающих выборках с данными по аффинности. Эти соединения представляют собой как природные лиганды ядерных рецепторов стероидных гормонов, так и их синтетические аналоги — лекарственные препараты, применяемые в клинической практике (табл. 6). Данные по аффинности для наглядности были пересчитаны в ОКА относительно природного эффектора, исключая рецептор андрогенов (использовалось 1С50). Экспериментальные и предсказанные эффекты агонистов и эффекты антагонистов обозначаются «1» - наличие эффекта и «О» - отсутствие эффекта. Как результат предсказания были использованы значения полученные в процедуре скользящего контроля, когда предсказываемое соединение исключалось из обучающей выборки. Комплексный подход оценки аффинности и последующего типа действия позволяет получить результаты, хорошо коррелирующие с экспериментальными данными (средняя ошибка предсказания величины аффинности составила 21% и предсказания типа действия - 7%).

выводы

1. Разработаны модели для предсказания величины аффинности стероидных лигандов к ядерным рецепторам прогестерона, эстрогенов, андрогенов, глюкокортикоидов и минералокортикоидов, с использованием методов ЗБ-С^ЛЯ, имеющих среднюю предсказательную силу (среднее О2=0,62), и модели на основе комплексного подхода, совмещающего методы молекулярного докинга и динамики, искусственных нейронных сетей с высокой предсказательной силой (среднее р2=0,92).

2. С использованием метода 81МСА создан набор классификационных моделей для предсказания спектра действия стероидных лигандов с хорошей предсказательной силой. Среднее значение инвариантного критерия точности при кросс-валидации составило 0,79.

3. Разработанная комплексная модель предсказания аффинности и спектра действия стероидов показала хорошую предсказательную способность. Величина Я2 для прогноза аффинности на независимой выборке для рецептора прогестерона составила 0,77, среднее значение инвариантного критерия точности прогноза спектра действия 23 стероидов составило 0,76.

СПИСОК РАБОТ, ОПУБЛИКОВАННЫХ ПО ТЕМЕ ДИССЕРТАЦИИ

1. Федюшкина И.В., Ромеро Рейес И.В., Лагунин А.А., Скворцов B.C. Предсказание спектра действия лигандов рецепторов стероидных гормонов. // Биомедицинская химия. 2013. Т. 59. № 5. С. 591-599.

2. Stulov S.V., Mankevich O.V., Novikov R.A., Tkachev Y.V., Timofeev V.P., Dugin N.O., Pozdnev V.F., Fedyushkina I.V., Scherbinin D.S., Veselovsky A.V., Misharin A.Y. Synthesis and molecular modeling of (4'R)- and (4'S)-4'-substituted 2'-{[(E)-androst-5-en-17-ylidene]-methyl}oxazolines. // Steroids. 2013. V. 78. P. 521-527.

3. А) Федюшкина И.В., Стулов С.В., Дугин Н.О., Мишарин А.Ю., Мехтиев А.Р., Морозевич Г.Е., Веселовский А.В., Молекулярное моделирование взаимодействия 17(20) и 17(20)Е-прегна-5,17(20)-диен-21-оиламидов с ядерным рецептором LXRb. // Биомедицинская химия. 2013, Т. 59 №3. С. 321-329.

Б) Fedyushkina I.V., Stulov S.V., Dugin N.O., Misharin A.Y., Mehtiev A.R., Morozevich G.E., Veselovsky A.V. Molecular Modeling of the Interaction of 17(20)Z-and 17(20)E-Pregna 5,17(20)-Dien-21-Oyl Amides with the Nuclear Receptor LXRp. // Biochemistry (Moscow) Supplement Series B: Biomedical Chemistry. 2013. V. 7. P. 196-201.

4. Romero Reyes I., Fedyushkina I., Skvortsov V., Filimonov D. Prediction of progesterone receptor inhibition by high-performance neural network algorithm. // International Journal Of Mathematical Models And Methods In Applied Sciences. 2013. № 7. C. 303-310.

5. Fedyushkina I., Romero Reyes I. Prediction of glucocorticoid receptor inhibition by high-performance neural network algorithm. // Advances in Mathematical and Computational Methods. 2012. V. 4. P. 203-207.

6. Stulov S.V., Novikov R.A., Fedyushkina I.V., Misharin A.Yu. Synthesis, structure and molecular modeling of 2'-{[(E)-androst-5-en-17-ylidene]-methyl}oxazolines. // XV International conference "Heterocycles in Bio-organic chemistry", Latvia, Riga, 2013, P. 173.

7. Федюшкина И.В., Стулов C.B., Мишарин А.Ю., Веселовский А.В. Дизайн, моделирование и синтез новых азастероидных агонистов ядерных рецепторов ЬХКаи LXRp. // Материалы докладов III международной интернет-конференции «Актуальные проблемы биохимии и бионанотехнологии». Казань, Россия, 2012. С. 295-300.

8. Стулов С.В., Манкевич О.В., Федюшкина М.В., Дугин И.О., Новиков Р.А. Новые азотсодержащие производные прегна-5,17(20)-диена: синтез, структура, молекулярное моделирование и оценка биологической активности. // Материалы докладов конференции «Химия биологически активных веществ: Межвузовский сборник научных трудов Всероссийской школы - конференции молодых ученых, аспирантов и студентов с международным участием. Саратов, Россия, 2012. С. 128-129.

9. Федюшкина И.В., Скворцов B.C., Захаров А.В., Левина И.С. Предсказание селективности действия эффекторов рецепторов стероидных гормонов. // Материалы докладов Симпозиума «Биоинформатика и компьютерное конструирование лекарств» в рамках XVI Российского национального конгресса «Человек и лекарство». Москва, Россия, 2010. С. 732. lO.Skvortsov V.S., Fedushkina I.V., Oparina N.J., Levina I.S. Prediction of selectivity and activity spectrum of nuclear receptors ligands by analysis of virtual interactions. // Abstr. Methods and Applications of Computational Chemistry. Odesa, Ukraine, 2009. P. 78. П.Томилов Ю.В., Левина И.С., Шулишов E.B., Камерницкий А.В., Тимофейчук А.С., Федюшкина И.В., Смирнов А.Н., Семейкин А.В. Синтез и биологическая активность замещенных 16альфа, 17альфа-циклопропанопрогестеронов. // Материалы докладов Всероссийской научной конференции «Органическая химия для медицины». Черноголовка, Россия, 2008. С. 265. 12.Федюшкина И.В., Скворцов B.C., Левина И.С. Молекулярный докинг и 3D-QSAR аналогов прогестерона - лигандов рецептора прогестерона. // Материалы докладов Симпозиума «Биоинформатика и компьютерное конструирование лекарств» в рамках XIV Российского национального конгресса «Человек и лекарство». Москва, Россия, 2007. С. 324-325.

Подписано в печать 24.10.2013. Бумага офсетная. Печать цифровая. Тираж ЮОэкз. Заказ № 1251 Типография ООО "Ай-клуб" (Печатный салон МДМ) 119146, г. Москва, Комсомольский пр-т, д.2 8 Тел. 8(495)782-88-39

Текст научной работыДиссертация по биологии, кандидата биологических наук, Федюшкина, Ирина Викторовна, Москва

Федеральное государственное бюджетное учреждение «Научно-исследовательский институт биомедицинской химии имени В.Н.Ореховича»

Российской академии медицинских наук

На правах рукописи

Федюшкина Ирина Викторовна

ПРЕДСКАЗАНИЕ АФФИННОСТИ И СПЕКТРА ДЕЙСТВИЯ ЛИГАНДОВ ЯДЕРНЫХ РЕЦЕПТОРОВ СТЕРОИДНЫХ ГОРМОНОВ МЕТОДАМИ КОМПЬЮТЕРНОГО МОДЕЛИРОВАНИЯ

03.01.09 - математическая биология, биоинформатика

Диссертация

на соискание ученой степени кандидата биологических наук

Научный руководитель к.б.н. Скворцов B.C.

Москва - 2013

ОГЛАВЛЕНИЕ

СПИСОК СОКРАЩЕНИЙ...............................................................................................5

ВВЕДЕНИЕ........................................................................................................................8

ГЛАВА 1. ОБЗОР ЛИТЕРАТУРЫ.................................................................................12

1.1. Ядерные рецепторы стероидных гормонов........................................................12

1.2. Общая структура ЯР - доменная организация...................................................13

1.3. Лигандсвязывающий домен.................................................................................16

1.4. Представители класса...........................................................................................16

1.4.1. Рецептор прогестерона......................................................................................16

1.4.1.1. Механизм действия..................................................................................18

1.4.1.2. Лиганды РП...............................................................................................21

1.4.2. Рецепторы эстрогенов....................................................................................24

1.4.2.1. Лиганды РЭ..............................................................................................26

1.4.3. Рецептор андрогенов......................................................................................27

1.4.3.1. Лиганды РА..............................................................................................29

1.4.4. Рецептор глюкокортикоидов.........................................................................29

1.4.4.1. Лиганды РГ..............................................................................................31

1.4.5. Рецептор минералокортикоидов...................................................................31

1.4.5.1. Лиганды РМ.............................................................................................33

1.5. Методы компьютерного моделирования............................................................34

1.5.1. Метод ЗБ-С^АЯ.............................................................................................35

1.5.2. Метод докинга.................................................................................................37

1.5.3. Метод молекулярной динамики....................................................................38

1.5.4. Метод нейронных сетей.................................................................................41

1.5.5. Методы классификации.................................................................................44

1.5.5.1. Метод SIMCA...........................................................................................45

1.5.6. Метод PASS.....................................................................................................47

ГЛАВА 2. ОБЪЕКТЫ И МЕТОДЫ ИССЛЕДОВАНИЯ.............................................49

2.1. Объекты..................................................................................................................49

2.1.1. Выборки для предсказания аффинности стероидных лигандов к ядерным рецепторам стероидных гормонов..........................................................................49

2.1.1.1. Лиганды рецептора прогестерона...........................................................49

2.1.1.2. Лиганды рецептора эстрогенов...............................................................54

2.1.1.3. Лиганды рецептора андрогенов..............................................................54

2.1.1.4. Лиганды рецептора глюкокортикоидов.................................................54

2.1.1.5. Лиганды рецептора минералокортикоидов...........................................55

2.1.1.6. Кристаллические структуры лигандсвязывающего домена ЯРСГ.....55

2.1.2. Выборки для предсказания спектра действия стероидных лигандов к ядерным рецепторам стероидных гормонов..........................................................56

2.2. Методы...................................................................................................................57

2.2.1. Методы построения моделей предсказания аффинности...........................57

2.2.2. Методы предсказания типа действия...........................................................61

ГЛАВА 3. РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ..............................................................66

3.1. Создание моделей предсказания аффинности...................................................66

3.1.1. ЗБ-С^АК модели предсказания аффинности РП к стероидным лигандам ....................................................................................................................................66

3.1.2. Моделирование комплексов лиганд/ЛСД рецептора РП и линейно регрессионный анализ..............................................................................................69

3.1.3. Предсказание аффинности лигандов к РП с использованием искусственных нейронных сетей............................................................................71

3.1.4. Предсказание аффинности прегна-Б'б-пентаранов к РП на независимой тестовой выборке......................................................................................................73

3.1.5. Построение ЗО-С^АЯ моделей предсказания аффинности РЭ, РГ, РМ и РА к стероидным лигандам.....................................................................................75

3.1.6. Линейные модели предсказания аффинности РЭ, РГ, РМ и РА к стероидным лигандам..............................................................................................86

3.1.7. Предсказание аффиности стероидных лигандов для ядерных рецепторов стероидных гормонов с использованием искусственных нейронных сетей......88

3.2. Построение моделей предсказания типа действия............................................90

3.3. Программная реализация.....................................................................................95

ЗАКЛЮЧЕНИЕ................................................................................................................99

ВЫВОДЫ.......................................................................................................................100

СПИСОК ЛИТЕРАТУРЫ.............................................................................................101

СПИСОК СОКРАЩЕНИЙ

3D-QSAR трехмерный QSAR (three-dimensional QSAR) CoMFA метод сравнительного анализа молекулярных полей (Comparative Molecular Field Analysis)

CoMSIA

GB

Hsp

LBDD

LDA

метод сравнительного анализа индексов молекулярного подобия (comparative molecular similarity indices analysis) обобщенный метод Борна (Generalized Born) белок теплового шока (Heat shock proteins) конструирование лекарств на основе структур лигандов (Ligand-Based Drug Design) линейный дискриминантный анализ (Linear Discriminant Analysis)

MM-GBSA покомпонентный метод расчета изменения свободной энергии на основе симуляции молекулярной динамики по обобщенной модели Борна (Molecular Mechanic/ Generalized Born Surface Area)

MM-PBSA покомпонентный метод расчета изменения свободной энергии на основе симуляции молекулярной динамики по модели Пуассона-Больцмана (Molecular Mechanic/ Poisson-Boltzmann Surface Area)

NRs ядерные рецепторы (nuclear receptors)

PB метод Пуассона-Больцмана (Poisson-Boltzmann)

QSAR количественная взаимосвязь структура-активность (Quantitative

structure-activity relationship)

RBA Относительная связывающая аффинность (relative binding

affinity) - аналог величины ОКА RP рекурсивное разделение (recursive partitioning)

SAR взаимосвязь структура-активность (structure-activity

relationship)

SBDD конструирование лекарств на основе структуры мишени

(Structure-Based Drug Design) SIMCA метод формального независимого моделирования аналогий

классов (Soft independent modeling of class analogy) THC стероидный лиганд РЭ (5,ll-cis-diethyl-5,6,ll,12-tetra-

hydrochrysene-2,8-diol) АД автономный трансактивационный домен

АФ активационная функция

БТШ белки теплового шока

ДСД ДНК-связывающий домен

ДТ дигидротестостерон

ЖКТ желудочно-кишечный тракт

ИНС искусственные нейронные сети

ЛСД лигандсвязывающий домен

ЛСК лигандсвязывающий карман

ОКА относительная конкурентная активность

РА рецептор андрогенов

РГ рецептор глюкокортикоидов

РМ рецептор минералокортикоидов

РП рецептор прогестерона

РСА рентгеноструктурный анализ

РЭа иРЭр рецепторы эстрогенов а и (3

СМРЭ селективные модуляторы рецепторов эстрогена

Т тестостерон

ЦНС центральная нервная система

ЯР ядерные рецепторы

ЯРСГ ядерные рецепторы стероидных гормонов

ВВЕДЕНИЕ

Поиск лекарственных препаратов с целенаправленным эффектом является одной из востребованных задач медицинской химии, с которой встречаются исследователи всего мира. Особое внимание в современной медицине уделяется специфичности действия лекарственных препаратов с целью уменьшения вредного влияния на человеческий организм и достижение максимального лечебного результата. На ранних стадиях исследований наиболее эффективным, быстрым и недорогим подходом в направленном поиске лекарственных соединений с заданными свойствами является применение различных компьютерных технологий: био- и хемо-информатики, молекулярного моделирования, SAR и QSAR подходов и математической статистики. Компьютерные (виртуальные) эксперименты не могут отменить реальные, но позволяют существенно сократить количество экспериментов, сроки работы, проверить различные идеи, а также подсказать новые направления для развития исследования.

В современной медицине стероидные гормоны являются одной из широко применяемых групп химических соединений. Они представляют собой основной класс регуляторов физиологических процессов у животных и человека и синтезируются из холестерина в коре надпочечников (глюкокортикоиды, минералокортикоиды и андрогены), в семенниках (андрогены, эстроген), в яичниках и плаценте (эстрогены и прогестины). Это липофильные молекулы, которые легко проникают через плазматическую мембрану внутрь клетки-мишени. Биологический эффект стероидных гормонов опосредован их связыванием со специфическими внутриклеточными (ядерными) рецепторами, которые представляют собой ДНК-связывающие транскрипционные факторы, имеют

общую доменную организацию, единый механизм действия и, в отсутствие лиганда, находятся в виде комплексов с белками теплового шока (БТШ), главным образом, Нзр90. Связывание рецептора со своим гормоном вызывает конформационные изменения, благодаря которым происходит высвобождение Нзр90 от рецептора, после чего комплекс рецептор-гормон связывается со специфическими участками ДНК и регулирует транскрипцию генов-мишеней [1, 2]. Лиганды ядерных рецепторов стероидных гормонов можно условно разделить на 3 группы в зависимости от способности вызывать биологический эффект: агонисты, частичные агонисты, антагонисты. Связывание рецептора с агонистами или с антагонистами приводит к различным конформационным изменениям рецепторов, что оказывает влияние на взаимодействие с корегуляторами и приводит к изменению транскрипции генов.

Природные гормоны воздействуют на большинство клеток организма. Глюкокортикоиды оказывают влияние на все виды обмена и играют важную роль при адаптации к стрессам, минералокортикоиды регулируют водно-солевой обмен, женские половые гормоны участвуют в процессах полового созревания, репродукции и поддержании беременности, мужские половые гормоны влияют не только на функции размножения и полового созревания, но также обладают анаболическим действием. Синтетические аналоги гормонов этих классов нашли широкое применение в клинической практике. Аналоги глюкокортикоидов используются как противовоспалительные, противоаллергические препараты, они также эффективны при лечении бронхиальной астмы. Антагонисты рецептора минералокортикоидов используют как диуретические средства для лечения застойной сердечной недостаточности и тяжелых форм гипертонии. Препараты

эстрогенов и прогестннов широко применяют в контрацепции, при заместительной гормональной терапии в постменопаузе, а также для лечения гормонозависимых опухолей [2, 3].

Некоторые биологические эффекты стероидных препаратов проявляются благодаря тому факту, что они могут перекрёстно взаимодействовать с другими рецепторами своей группы [4]. Это обусловливает их мультифункциональность в организме, которая приводит к возникновению побочных реакций при проведении лекарственной терапии [5]. Предсказание спектра действия лекарственных препаратов помогает снизить побочные эффекты и даёт возможность применять их для комплексного воздействия.

Таким образом, при создании лекарственного прототипа возникает проблема селективности лиганда, когда необходимо заранее определить аффинность и спектр возможных взаимодействий конкретного вещества. При этом конечный результат действия любого лиганда зависит не только от его сродства к рецептору, но и от того, какие конкретно изменения будут инициированы далее. В случае ядерных рецепторов это означает, что любой лиганд может оказаться как агонистом природного гормона, так и антагонистом. При поиске новых лекарственных препаратов селективность лиганда и тип его действия должны быть подтверждены экспериментально. Однако предсказания аффинности и последующего эффекта методами компьютерного моделирования могут существенно упростить процедуру планирования эксперимента и обосновать выбор кандидата.

Цель и задачи исследования

Целью данной работы является создание системы предсказания аффинности стероидных лигандов к подгруппе ядерных рецепторов стероидных гормонов с последующим прогнозом типа их действия (агонист/антагонист/неактивное соединение).

Для достижения этой цели были поставлены следующие задачи:

1. Сформировать рабочие выборки, содержащие данные о структурах стероидных соединений, экспериментальных оценках аффинности к 5-ти ядерным рецепторам стероидных гормонов и типе действия.

2. Разработать модели предсказания оценки аффинности стероидных лигандов к ядерным рецепторам стероидных гормонов.

3. Разработать классификационные модели для предсказания спектра действия стероидных лигандов ядерных рецепторов стероидных гормонов.

4. Провести валидацию созданных моделей на тестовых выборках.

ГЛАВА 1. ОБЗОР ЛИТЕРАТУРЫ

1.1. Ядерные рецепторы стероидных гормонов

Рецепторы стероидных гормонов представляют собой класс белков, которые входят в состав суперсемейства ядерных рецепторов. Эти протеины относятся к факторам транскрипции и обеспечивают функционирование многоклеточного организма на всех уровнях. Они участвуют в процессах эмбрионального развития, роста и дифференцировки клеток, регулируют апоптоз и обмен веществ. В отличие от других факторов транскрипции, активность ядерных рецепторов проявляется только после связывания с соответствующими лигандами - небольшими липофильными молекулами, которые легко проникают через биологические мембраны в кровь, а затем внутрь клетки-мишени [6].

Гены всех ядерных рецепторов имеют общую филогению, что легло в основу их классификации по типу ЫЯхуг, где х означает подсемейство, у - группу, а ъ-ген [7]. Таким образом, суперсемейство ядерных рецепторов было разбито на шесть подсемейств и 26 групп; при этом рецепторы, которые содержат только один домен ДНК-связывающий (ДСД) или лигандсвязывающий (ЛСД), объединены, независимо от происхождения, в отдельное подсемейство N110 [8]. Ядерные рецепторы стероидных гормонов (ЯРСГ) объединены в подсемейство N113, при этом рецепторы эстрогенов аир (РЭа и РЭР) относятся к группе ЗА, а рецепторы глюкокортикоидов (РГ), минералокортикоидов (РМ), прогестерона (РП) и андрогенов (РА) относятся к группе ЗС.

Их природные лиганды - это стероидные гормоны, физиологически активные вещества, которые синтезируются в организме позвоночных из общего предшественника - холестерина. По химическому строению и биологическому

действию их можно разделить на С2\-стероиды, обладающие скелетом прегнана (прогестины и кортикоиды), С|9-стероиды со скелетом андростана (андрогены) и С^-стероиды со скелетом эстрана (эстрогены). На рисунке 1 показаны представители этих классов.

Кортнзоп (РГ) Эстрадиоп (РЭ)

Тестостерон (РА) Прогестерон (РП) Альдостерон (РМ)

Рисунок 1. Природные лиганды рецепторов стероидных гормонов.

В отсутствие лиганда, все эти рецепторы находятся в цитоплазме в связанном виде с молекулами шаперонов, которые поддерживают рецепторы в конформации, позволяющей связывать лиганд, но не ДНК. После связывания с гормоном происходит конформационное изменение белка-рецептора, приводящее к освобождению от шаренов, образованию димерного комплекса и связыванию с ДНК. [5]

1.2. Общая структура ЯР - доменная организация

Ядерные гормональные рецепторы имеют общую структурную организацию и состоят из нескольких доменов. Общая структура всех представителей подсемейства N113 представлена на рисунке 2.

Область специфических изо форм

ДНК-свяэывающий домен

Лиганд-связывающий домен

1 II II- 1

N — АД^— АД Г ДСД ^^^^ лсд 1АФ-2>

А/В С й Е

1 _1 1-1 1 II 1

АФ-1: конституционно активная область трансактивации

АД: автономный трансактивационный домен

Димеризация

Димеризация

I

Взаимодействие домена с корепрессорами и коактиваторами

Рисунок 2. Схематическое изображение доменной структуры ЯРСГ.

Ы-концевая область (А/В домен) может сильно отличаться как по длине, так

и по последовательности аминокислот (от 50 до более 500) у различных рецепторов. За счет модификаций именно этого домена возникают различные изоформы рецепторов. А/В домен содержит, по крайней мере, одну активационную функцию-1 (АФ-1) и несколько автономных трансактивационных доменов (АД), которые осуществляют стимуляцию транскрипции с участием других белков. АФ-1 действует совместно с лигандзависимой активационной функцией-2 (АФ-2), локализованной на С-конце молекулы и обеспечивает специфическую активность рецептора в зависимости от клеточного контекста. Ядерные рецепторы стероидных гормонов имеют значительное сходство по аминокислотным последовательностям в двух высоко консервативных доменах - ДНК-связывающем - С домен (ДСД) и лигандсвязывающем - Е домен (�