Бесплатный автореферат и диссертация по биологии на тему
Моделирование биологической активности низкомолекулярных органических соединений с применением компьютерных методов анализа мультипараметрических данных
ВАК РФ 03.01.04, Биохимия

Автореферат диссертации по теме "Моделирование биологической активности низкомолекулярных органических соединений с применением компьютерных методов анализа мультипараметрических данных"

ИВАНЕНКОВ ЯН АНДРЕЕВИЧ

МОДЕЛИРОВАНИЕ БИОЛОГИЧЕСКОЙ АКТИВНОСТИ НИЗКОМОЛЕКУЛЯРНЫХ ОРГАНИЧЕСКИХ СОЕДИНЕНИЙ С ПРИМЕНЕНИЕМ КОМПЬЮТЕРНЫХ МЕТОДОВ АНАЛИЗА МУЛЬТИПАРАМЕТРИЧЕСКИХ ДАННЫХ

03.01.04 - «Биохимия»

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата биологических наук

2 5 НОЯ 2010

Уфа-2010

004613830

Работа выполнена в Исследовательском институте химического разнообразия (ИИХР) совместно с Учреждением Российской академии наук Институт физиологически активных веществ РАН (ИФАВ РАН)

Научный руководитель

Официальные оппоненты:

доктор химических наук Балакин Константин Валерьевич

доктор биологических наук Вахитова Юлия Венеровна Институт биохимии и генетики Уфимского научного центра РАН

доктор биологических наук

Татьяненко Лилия Васильевна

Институт проблем химической физики РАН

Ведущая организация

Химический Факультет Московского Государственного Университета им. М.В.Ломоносова

Ж И

Защита состоится _ _

Объединенного диссертационного совета

2010 г. в «_» часов на заседании

ДМ 002.133.01 при Учреждении

Российской академии наук Институте биохимии и генетики Уфимского научного центра РАН по адресу: 450054, Уфа, пр. Октября, 71.

С диссертацией и авторефератом можно ознакомиться в Научной библиотеке УНЦ РАН (Уфа, пр. Октября, 71) и на сайте ИБГ УНЦ РАН: ibg.anrb.ru/dissov.html: e-mail: molgen@anrb.ru

Автореферат разослан « L0 » октября 2010 г.

Ученый секретарь диссертационного совета

Бикбулатова С.М.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ Актуальность работы. Исследование биологической активности низкомолекулярных органических соединений является одним из наиболее актуальных направлений в современной биологической, медицинской и компьютерной химии [Rydzewski, 2008]. Однако изучение столь комплексного свойства сопряжено с целым рядом проблем, решение которых зависит от интенсивных теоретических и экспериментальных работ в области биохимии, молекулярной биологии, геномики, компьютерного моделирования, органического синтеза, медицины и фармакологии [Makriyannis, et al., 2004; Hüser, 2006]. Наибольшее практическое значение такие исследования имеют в области разработки новых лекарственных субстанций, которые в большинстве своем являются синтетическими молекулами. На ранних стадиях этого процесса особое внимание уделяется исследованию и компьютерному моделированию ключевых свойств физиологически активных веществ, включая терапевтически значимый механизм действия, а также ряд ключевых фармакокинетических и фармакодинамических параметров [Ng, 2004; Hüser, 2006; Rognan, 2006]. Такой подход позволяет делать математически обоснованные предположения о фармакологической направленности и эффективности исследуемых структур [Böhm, et al., 2000; Alvarez, et al., 2005; Ekins, 2006; Schneider, 2008; Puzyn, et al., 2009].

Компьютерное моделирование в настоящее время становится неотъемлемой частью процесса исследования биологической активности [Tozer, 2006; Balakin, et al., 2009]. Несмотря на сравнительно недолгую историю существования специализированных методов компьютерной биологической и медицинской химии, существует целый ряд эффективных алгоритмов, позволяющих моделировать и в дальнейшем прогнозировать различные биохимические свойства органических соединений, включая их метаболическую стабильность и способность образовывать активные комплексы с биологическими мишенями. Среди таких алгоритмов особое место занимают методы нелинейного картирования [Zupan, et al., 1999; Balakin, 2009]. Помимо высокой предсказательной способности такие методы весьма удобны для визуального восприятия; они позволяют исследователю проводить комплексный анализ найденных закономерностей. На основании полученной нелинейной проекции исследуются причины и основные факторы, обусловливающие разделение

категорий соединений, обладающих различной биологической активностью (БА). Кроме методов нелинейного картирования существует ряд других, не менее эффективных подходов, позволяющих осуществлять комплексный анализ многомерных данных, среди которых наиболее перспективными в практическом аспекте являются классические искусственные нейронные сети (ИНС) [Наукт, 2009].

Моделирование осуществляется с использованием, как правило, расчетных молекулярных дескрипторов (признаков), в общем случае представляющих из себя числовой эквивалент свойства молекулы (структуры), например, молекулярный вес, общая площадь полярной поверхности, количество потенциальных доноров и акцепторов водородной связи и др. Таким образом, исследователь получает в свои руки эффективный компьютерный инструмент, без которого в условиях современного развития биотехнологий, в частности, высокопроизводительного биологического скрининга, обойтись просто невозможно.

Несмотря на очевидную целесообразность использования компьютерных моделей для анализа и предсказания различных биохимических свойств низкомолекулярных органических соединений, их разработка является в высшей степени сложной и трудоемкой задачей. Во многих случаях недостаточность исходных данных, их неоднородность, а также невоспроизводимость в условиях единого эксперимента, не позволяют исследователю построить статистически значимую т эШсо модель с адекватным и достаточным теоретическим обоснованием обнаруженных закономерностей. Отсутствие независимого тестирования и правильной трактовки полученных результатов делает такие модели несостоятельными в отношении корректности классификации и предсказания БА новых структур. В силу этих и целого ряда других объективных причин на сегодняшний день количество эффективных, с точки зрения качества предсказания, компьютерных моделей весьма ограничено. Некоторые из них узкоспециализированы и могут использоваться исключительно для определенного класса химических структур, что существенно сужает рамки их практического применения.

Учитывая сказанное выше, работы по компьютерному моделированию биологической активности органических соединений на основе алгоритмов нелинейного анализа мультипараметрических данных являются в высшей степени актуальными и, с практической точки зрения, крайне востребованными.

Цель и задачи исследования. Основной целью настоящей диссертационной работы является разработка подходов к компьютерному моделированию и прогнозированию комплексных биологических свойств органических соединений. Среди наиболее значимых задач исследования можно перечислить следующие:

1. Сбор, анализ и подготовка к компьютерному моделированию представительных баз данных химических структур с экспериментально определенными биохимическими свойствами.

2. Расчет и отбор наиболее значимых молекулярных дескрипторов с привлечением специализированных компьютерных алгоритмов.

3. Компьютерное моделирование биохимической активности низкомолекулярных органических соединений с применением нелинейных методов анализа мультипараметрических данных.

4. Создание специализированных компьютерных программ для анализа химического пространства, моделирования и предсказания биологической активности.

Научная новизна. Разработан ряд оригинальных компьютерных моделей, позволяющих оценивать биологическую активность и фармакокинетические свойства низкомолекулярных органических веществ с использованием нелинейных алгоритмов анализа мультипараметрических данных, включая самоорганизующиеся карты Кохонена [КоЬопеп, 1990], метод Сэммона [Эаттоп, 1969], а также классические искусственные нейронные сети. В алгоритм Кохонена внесен ряд модификаций и усовершенствований, повышающих его производительность и точность. Созданы прогностические системы для анализа наиболее значимых фармакокинетических характеристик: метаболической стабильности веществ по отношению к семейству цитохромов Р450, степени проникновения через биологические мембраны, цито- и орган-специфичной токсичности, объема распределения вещества в организме, времени полужизни в плазме крови, степени связывания с белками крови и Р-гликопротеинами, а также возможности образовывать прочные нековалентные комплексы с различными биологическими мишенями, имеющими терапевтическую значимость. Показано, что точность классификации и предсказания с применением методов нелинейного картирования и искусственной нейронной сети классической архитектуры превосходит по качеству более простые регрессионные и корреляционные модели, а также тривиальные структурные и физико-химические фильтры и правила.

Практическая значимость работы. Созданные уникальные базы данных химических соединений с экспериментально определенными биохимическими свойствами, включая ряд ключевых фармакокинетических параметров, имеют очевидную практическую значимость, в первую очередь, для медицинской и биологической химии. Структуры подвергались тщательному анализу и специальной процедуре фильтрации, в ходе которой из рассмотрения исключались высокомолекулярные соединения, редкие органометаллические комплексы, вещества с недопустимыми структурными элементами, которые не являются drug like молекулами и в процессе моделирования дают существенные статистические погрешности. Для каждого соединения из собранных баз данных рассчитан широкий набор молекулярных дескрипторов. В зависимости от особенностей решаемой задачи с привлечением специализированных математико-статистических алгоритмов определены оптимальные наборы признаков, с использованием которых строились компьютерные модели. Структурные базы данных с оптимизированным набором дескрипторов крайне востребованы в области биологической и медицинской химии: они используются в качестве обучающих выборок, с применением которых осуществляется компьютерное моделирование; на их основе создаются специализированные аннотированные библиотеки физиологически активных веществ [Savchuk et al, 2004]. Разработанные нами компьютерные модели прошли экспериментальное тестирование с привлечением независимых контрольных выборок и результатов реальных биологических испытаний, осуществленных в Исследовательском институте химического разнообразия (ИИХР, г. Химки) и Институте физиологически активных веществ РАН (ИФАВ РАН, г. Черноголовка).

Созданные компьютерные программы и интегрированные в них модели, описанные в диссертационной работе, используются в ряде институтов и организаций, занимающихся разработкой физиологически активных соединений, (ИИХР, ИФАВ РАН, МГУ им. М.В.Ломоносова и др.).

Апробация работы. Результаты работы были представлены на более чем 20-ти научных конференциях и симпозиумах, в том числе: «Drug Discovery Technology Europe» (Stuttgart, 2003), «Drug Science & Technology Summit» (New York, 2003), «SBS 9th Ann. Conference and Exhibition» (Portland, 2003), «BioNorth 10'h Anniversary Conference» (Ottawa, 2003), «SCIpharm Intern. Pharm. Industry Conference» (Edinbourgh, UK, 2004), XII Российский национальный конгресс «Человек и

лекарство» (Москва, 2005), Международный конгресс «Биотехнология: состояние и перспективы развития» (Москва, 2005), Международная конференция «Биологические мишени для действия лекарственных препаратов нового поколения. Перспективы интеграции российских ученых в международную кооперацию» (Химки, 2006), «Proceedings of the III Congress of Pharmacology» (Санкт-Петербург, 2008).

Публикации. По материалам диссертации опубликована 21 работа (помимо глав в книги и докладов на научных конференциях и симпозиумах), из них 9 публикаций в журналах из официального Перечня ВАК РФ.

Структура и объем работы. Диссертация состоит из введения, литературного обзора, экспериментальной части, обсуждения результатов, заключения, выводов и списка использованной литературы. Работа изложена на 172 страницах, включает 55 рисунков и 28 таблиц. Список литературы включает 306 источников.

СОДЕРЖАНИЕ РАБОТЫ

Во введении кратко изложена актуальность темы диссертационной работы, а также ее структура, сформулированы основные цели и задачи исследования, отражены научная новизна и практическая значимость.

Обзор литературы «Современные подходы к моделированию биологической активности органических веществ и разработке новых лекарственных соединений» описывает фундаментальную концепцию и ключевые этапы разработки новых физиологически активных веществ (ФАВ). Подчеркивается значимая роль компьютерного моделирования в современной триаде высокоэффективных технологий, используемых в биологической и медицинской химии. Приводится общая структура, основные принципы работы и целевая дифференцировка алгоритмов компьютерного моделирования, включая искусственные нейронные сети и методы нелинейного картирования, эффективность которых продемонстрирована на ряде примеров, имеющих отношение к представленному исследованию. Описываются принципиальные этапы в планировании и осуществлении типового компьютерного эксперимента по моделированию БА, а также реального высокопроизводительного биологического скрининга (ВПС).

В «Экспериментальной части» описана общая методология проведения компьютерного моделирования, состоящего из нескольких важных этапов. На

первой стадии эксперимента на основании тщательного литературного поиска, а также информации, полученной из специализированных баз данных, включая Prous Integrity Database (Prous Science, Испания), Beilstein Cross-Fire (Beilstein, США), MetaDrug (GeneGo, Inc., США), ToxSys (SciVision Inc. & ToxSys, США), проводили подготовку обучающих выборок, их анализ и фильтрацию. В настоящей работе обучающие выборки представляли из себя набор структур ФАВ с экспериментально найденным значением исследуемого биохимического свойства. В качестве признаков выступали молекулярные дескрипторы, рассчитанные при помощи компьютерных программ SmartMining (собственная разработка автора работы, ИИХР, Россия) и Dragon (Миланский Университет, Италия). В зависимости от специфики решаемой задачи, количества обучающих примеров и особенностей химических структур, из общего числа рассчитанных дескрипторов выделяли наиболее оптимальный набор с привлечением специализированных методов анализа мультипараметрических данных, включая анализ главных компонентов (АГК) [Jolliffe, 2002], t-статистику Стьюдента [Gösset, et al., 1908], генетический алгоритм [Sivanandam, et al., 2007] и анализ чувствительности [Yeung, et al., 2010]. На основании этого набора осуществляли компьютерное моделирование исследуемого свойства с использованием алгоритма самоорганизующихся карт Кохонена, метода Сэммона, а также классической ИНС с обратным распространением ошибки. Эксперимент осуществляли с использованием компьютерных программ SmartMining, Informagenesis (собственная разработка автора работы, ИФАВ РАН) и NeuroSolutions (NeuroDimension, США) в операционной системе Windows 2000. В общем случае, первые два алгоритма позволяют получать дву- или трехмерные отображения многомерного пространства дескрипторов, что весьма удобно для анализа и восприятия результатов моделирования. С применением третьего метода удается найти неявную многопараметрическую нейро-сетевую функцию, описывающую входное пространство признаков. Большинство представленных в работе моделей построено с применением методов нелинейного картирования. Тестирование моделей осуществляли с привлечением независимых выборок соединений, а также на основании результатов реальных биологических испытаний с применением технологии ВПС [Janzen, 2002; Reymond, 2006; Hüser, 2006; Vogel, 2007]. Большинство моделей было интегрировано в программу SmartMining; программирование осуществлялось на языке Visual С++.

РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЙ И ИХ ОБСУЖДЕНИЕ Моделирование метаболизма

Раздел посвящен разработке интегральной прогностической системы для оценки общего метаболического профиля низкомолекулярных органических веществ.

Моделирование метаболической стабильности органических соединений по отношению к семейству цитохромов P4S0. Исследование метаболической стабильности, являющейся одним из важнейших факторов, определяющих фармакологический профиль лекарственных соединений (ЛС), составляет весьма актуальную задачу современной биологической и медицинской химии. Нами предложен оригинальный подход к моделированию и прогнозированию метаболической устойчивости органических веществ под действием цитохромов Р450. Он основан на представительной обучающей выборке, собранной с использованием литературных источников, структур из специализированной базы данных, а также на алгоритме самоорганизующихся карт Кохонена. В исходном массиве данных были выделены две категории соединений: первая состояла из 485 субстратов метаболических реакций, вторая включала в себя 523 продукта целевых трансформаций, для которых не было найдено сведений об их дальнейших метаболических превращениях. Относительно второй категории было сделано рациональное предположение, что эти соединения проявляют свойства несубстратов. Необходимо отметить, что одно и то же соединение может служить субстратом для нескольких представителей семейства цитохромов Р450, а также в зависимости от количества метаболически неустойчивых связей давать на одном и том же цитохроме несколько продуктов, что обуславливает разницу в количестве субстратов и продуктов. Подобное объединение вполне укладывается в концепцию эксперимента, целью которого является обнаружение общих свойств органических соединений, оказывающих влияние на их метаболический профиль.

Для полной обучающей выборки было рассчитано 500 молекулярных дескрипторов, из числа которых при помощи алгоритма АГК были отобраны семь наиболее значимых: MW (молекулярный вес), LogD (расчетный логарифм распределения вещества в системе 1-октанол/вода при рН=7,4), TPS А (общая площадь полярной поверхности), PPSA (частичная площадь полярной поверхности), Hb_don и НЬ_асс (количество потенциальных доноров и акцепторов водородной связи, соответственно), HOMO (энергия высшей занятой

молекулярной орбитали). На основании этих дескрипторов была построена общая карта Кохонена для субстратов и не-субстратов (рис. 1). Объекты, близко расположенные на карте, обладают схожими свойствами в исследуемом мультипараметрическом пространстве признаков.

а б

Рис. 1. Модель Кохонена для субстратов (а) и не-субстратов (б) метаболических реакций, катализируемых цитохромами Р450; для удобства восприятия области

показаны отдельно.

Как видно из рис. 1, соединения, принадлежащие двум полярным категориям, занимают различные положения на карте. Для субстратов точность классификации на модельной выборке составила 77%, в то время как для несубстратов - 63%. С целью количественной оценки специфики распределения соединений, была построена дополнительная дифференциальная карта (рис. 2).

а б

Рис. 2. Двумерное (а) и трехмерное (б) представление дифференциальной карты Кохонена, показывающие области преобладания субстратов над не-субстратами.

Каждый узел этой карты содержит результат деления процентного содержания субстратов, содержащихся в этой «ячейке», на процентное содержание не-субстратов, содержащихся в этой же «ячейке». Дифференциальная карта служит удобным средством визуального анализа, позволяющего различить области, в которых процентное содержание субстратов в 5-10 раз превышает

процентное содержание не-субстратов по сравнению со случайным распределением. Было осуществлено независимое экспериментальное тестирование разработанной модели, по результатам которого можно говорить о ее высокой дискриминирующей способности.

Необходимо отметить, что во всех компьютерных экспериментах, описанных в представленной работе, удалось достичь статистически значимого и визуально различимого разделения исследуемых категорий соединений. Высокая предсказательная способность большинства моделей была подтверждена в ряде экспериментов с привлечением независимых тестовых выборок и реальных процедур ВПС.

Оценка эффективности связывания с активным центром цитохромов Р450. Вопросы взаимодействия низкомолекулярных органических соединений с активными центрами ферментов метаболических систем организма привлекают пристальное внимание исследователей. В частности, образование прочных нековалентных комплексов такого типа может приводить к ингибированию действия фермента, что в свою очередь может повлечь за собой как благоприятные, так и неблагоприятные терапевтические последствия. В ходе эксперимента обнаружены существенные корреляции между расчетными молекулярными дескрипторами и экспериментально найденными величинами Кт (константа Михаэлиса). Обучающая выборка, содержащая сведения о более чем 500 соединениях с найденными в литературе экспериментальными значениями Кт, была создана на основе специализированной базы данных. Каждая структура была отнесена как минимум к одной фермент-специфичной группе, внутри которой была принята следующая условная категоризация соединений в соответствии с величиной Кт: сильное связывание (А'т<10 цМ, категория 1), умеренное связывание (АГт=10-100 (хМ, категория 2), слабое связывание (Л"т> 100 цМ, категория 3). Из числа рассчитанных молекулярных дескрипторов при помощи АГК были отобраны шесть наиболее значимых индивидуальных признаков. С использованием алгоритма Кохонена была построена общая карта, на которой поочередно были выявлены области, соответствующие различным группам соединений и ферментов (рис. 3). Качество предсказания на модельной выборке оценивалось для двух полярных классов молекул (кат. 1 и кат. 3) и составило в среднем 94% для структур из группы СУРЗА4 и более 98% - для СУР206 (для наилучших моделей). В большинстве описанных ниже экспериментов качество

классификации и предсказания также оценивалось для двух принципиально различных категорий веществ, что вполне оправдано в условиях статистической классификации.

а б в г

Рис. 3. Локализация соединений на карте Кохонена: (а) прочное связывание с СУРЗА4 (38 соединений), (б) слабое связывание с СУРЗА4 (32 соединения), (в) прочное связывание с СУР2В6 (45 соединений), (г) слабое связывание с СУР2Б6

(7 соединений).

Предсказательная способность модели была оценена с использованием независимой выборки соединений с экспериментально установленной Кт, не принимавших участие в обучении (табл. 1). По результатам тестирования было показано, что разработанная модель обладает высокой дискриминирующей способностью между двумя обозначенными группами соединений.

Таблица 1

Качество предсказания на независимых выборках для моделей Кохонена

Модель Категории (эксп.) Качество п редсказания Всего соединений Средний процент предсказания

кат. 1 кат. 3

СУРЗА4 кат. 1,СУР(+) 31 (94%) 2 (6%) 33 93,5

кат. 3, СУР(-) 1 (7,7%) 12 (92,3%) 13

сургэб кат. 1, СУР(+) 17(85%) 3(15%) 20 92,5

кат. 3, СУР(-) 0 (%) 7(100%) 7

Общая карта Кохонена для всех цитохромов Р450, вошедших в общую обучающую выборку (12 подтипов), показывающая области распределения двух исследуемых групп соединений (кат. 1 и 3), представлена на рис. 4. Агенты, принадлежащие этим категориям, занимают различные области на карте, что говорит о наличие в исследуемом многомерном пространстве набора признаков, обуславливающих такое интегральное разделение. Для соединений с АГт<10 дМ качество классификации составило 91,2%, в то время как для соединений с Кт>100 цМ - 95,8%.

л

6

5

4

3

2

_________,_____^..Ж___I

1 2 3 4 5 6 7

шш алгьное сзвзывание. К ' 10

Рис. 4. Интегральная карта Кохонена для сильно- и слабосвязывающихся соединений с ферментами группы цитохрома Р450.

Для двух наиболее значимых изоформ цитохрома Р450 (СУРЗА4 и СУР206) были построены две отдельные модели Сэммона. Общее количество соединений в обучающих выборках составило 126 структур для СУРЗА4 и 75 молекул для изоформы СУР2Г)6. В качестве входных признаков выступали шесть молекулярных дескрипторов, использованных ранее для построения модели Кохонена. В качестве примера на рис. 5 представлена результирующая двумерная карта Сэммона, показывающая особое распределение соединений из экспериментальной группы СУРЗА4.

Рис. 5. Двумерная карта Сэммона, показывающая распределение соединений из обучающей выборки CYP3A4; оптимальная граница разделения двух крайних категорий объектов показана сплошной линией.

Оптимальная граница разделения объектов в двумерном пространстве находилась с использованием метода опорных векторов Вапника (MOB). Среднее качество классификации для двух построенных моделей Сэммона составило 94,1% для CYP3A4 и 100% для CYP2D6. На основании полученных результатов можно сделать вывод о том, что в исходном шестимерном пространстве свойств имеется оптимальная гиперплоскость, позволяющая с высокой точностью разделить две крайние категории объектов.

Кт=10-!00

• кт<10 о ктиоо

Моделирование скоростей реакций N-дезалкилирования, катализируемых цитохромами P4S0. Вопросам прогнозирования кинетических параметров взаимодействия органических веществ с метаболическими ферментами, преимущественно цитохромами Р450, посвящено значительное число исследований [Ekins et al., 2001, Lewis et al., 2002, Jones et al., 2002, Singh et al., 2003, Korolev et al., 2003]. Стандартным подходом к решению подобных задач служит нахождение количественных зависимостей структура-свойство. Однако моделирование такого сложного свойства связано с рядом объективных проблем, которые в первую очередь обусловлены сложностями при создании корректной обучающей выборки и отсутствием независимого тестирования [Darvas, 1988, Mulder, 1990, Hayashi, et al., 1991, Kato et al., 1995]. В связи с этим в ходе настоящего исследования была разработана оригинальная компьютерная модель, позволяющая предсказывать скорости метаболических реакций N-дезалкилирования, катализируемых цитохромами CYP3A4 и CYP2D6. В качестве обучающих данных было использовано 66 метаболических реакций (30 структур для CYP3A4 и 36 структур для CYP2D6), с известными величинами logVmax. Одним из важных нововведений, предложенных в настоящей работе, является независимое рассмотрение трех различных элементов топологической организации молекул субстратов (рис. 6), что обусловлено необходимостью учета ряда принципиальных факторов, влияющих на кинетику исследуемого процесса [Szklarz, et al., 2000; Ekins, et al., 2001; de Groot, et al., 2002; Korolev et al., 2003].

N^^o^, [01/CYP3A4 Me0 I

IX'°9Vm„1.17 Xl + Uv

ci

NHj Цисаприд NH.

места разрыва связи

'XI

тип А тип Б тип В

полная молекула центроид места уходящий фрагмент протекания реакции

Рис. 6. Три элемента структурной организации субстратов цитохромов Р450 на

примере Цисаприда.

Например, структура центроида определялась тремя ближайшими атомами от ключевого азота (топологическая окрестность), по которому осуществляется

реакция Л'-дезалкилироваиия. Молекулярные дескрипторы были рассчитаны для каждого из трех таких элементов. Для отбора наиболее значимых признаков был использован специальный компьютерный алгоритм, названный в научной литературе анализом чувствительности. В отличие от описанных ранее примеров, для выполнения сформулированной задачи была использована классическая архитектура ИНС обратного распространения ошибки. Также был проведен многоступенчатый процесс оптимизации настроек ИНС. Ключевой эксперимент проводили с использованием нескольких рандомизаций, валидацию моделей осуществляли с применением процедуры LOO (сокр. от англ. leave-one-out - метод тестирования модели). Таким образом, в ходе эксперимента было построено несколько десятков различных моделей. В результате осуществления всех указанных выше процедур, мы выделили наиболее удачную финальную модель. На рис. 7 показаны корреляционные графики зависимости между значениями предсказанных скоростей реакции Л'-дезалкилирования и экспериментально найденными значениями этой же величины. Среднее значение достоверности линейной аппроксимации на модельной выборке (г2) и тестовых примерах (q2) в условиях процедуры LOO указано на рисунке.

Рис. 7. Корреляционные диаграммы зависимости между экспериментальными и предсказанными значениями 1о§Утах для группы СУРЗА4 (а) и для СУР2Б6 (б).

Предсказательная способность моделей была исследована с использованием независимых наборов соединений с экспериментально найденным значением 1с^Утах; точность предсказания составила 0,90 для СУРЗА4 и 0,94 для СУР206. Следует особо отметить высокую производительность такого подхода: с использованием построенных моделей можно осуществлять прогноз для десятков и сотен тысяч структур за довольно короткий промежуток времени, измеряемый минутами, что приобретает особую значимость на стадии планирования этапа

(agVM(3*cn)

а

tojV^SKCn.) б

ВПС.

Моделирование степени проникновения органических соединений через биологические барьеры

Раздел посвящен разработке компьютерных моделей для анализа и предсказания степени проникновения низкомолекулярных органических соединений через гематоэнцефалический барьер (ГЭБ) и стенки желудочно-кишечного тракта (ЖКТ).

С применением алгоритмов Кохонена и Сэммона нами был разработан ряд in silico моделей, способных эффективно и статистически достоверно предсказывать упомянутые выше свойства. В результате тщательного литературного поиска были собраны две представительные обучающие выборки соединений с экспериментально установленной степенью проникновения через ГЭБ и стенки ЖКТ. Выборки включали в себя несколько категорий веществ: (а) хорошо проникающие через ГЭБ(+) (267 соединений) и ЖКТ(+) (114 соединений), (б) плохо проникающие через ГЭБ(-) (189 соединений) и ЖКТ(-) (61 соединение), (е) умеренно проникающие через ЖКТ(±) (145 соединений). В случае ГЭБ критерием категоризации послужил экспериментально найденный логарифм соотношения концентраций соединения в мозговом веществе и в крови (в равновесном состоянии). Для классификации структур из второй группы использовали значение относительной абсорбции (Fa), или долю вещества (в %), проникающего через стенки ЖКТ в кровоток. Собранные базы отличаются разнообразием структурных хемотипов и гомогенностью физико-химических свойств. Для обеих обучающих выборок был использован идентичный набор дескрипторов (6 признаков), рассчитанных при помощи программы SmartMining. Далее были построены карты Сэммона, соответствующие двум обучающим выборкам, ЖКТ и ГЭБ (рис. 8).

• жктм;

о ЖКТ(-) [

• ГЭБ(+) о ГЭБ(-)

а

б

Рис. 8. Карты Сэммона, демонстрирующие различия свойств соединений, обладающих высокой и низкой способностью проникновения через стенки ЖКТ (а) и ГЭБ (б).

После этого была определена степень разделения интересующих нас категорий соединений при помощи оптимальной разделяющей линии, найденной по MOB. Средняя точность классификации для обоих моделируемых свойств приближается к 88%.

С использованием тех же самых обучающих выборок и аналогичных молекулярных дескрипторов были построены две модели Кохонена (рис. 9а,б и 9в,г). Хорошо видно, что в обоих случаях противоположные категории соединений преимущественно локализованы в различных областях карт. Средняя точность классификации для обоих моделируемых свойств составила 88%. Предсказательная способность описанных моделей была оценена при помощи независимых тестовых выборок, а также в условиях эксперимента LOO. Эти модели с успехом используются в научно-экспериментальной практике ИФАВ РАН и ИИХР для классификации и отбора химических структур на стадии комбинаторного синтеза (КС) и ВПС.

2468 10 2468 10 "23456 23456

а б в г

Рис. 9. Локализация соединений из групп ГЭБ(+) (а) и ГЭБ(-) (б), а также ЖКТ(+) (в) и ЖКТ(-) (г) на двух модельных картах Кохонена.

Прогнозирование других фармакокинетических параметров

Раздел посвящен разработке компьютерных моделей для предсказания объема распределения вещества в организме (Уд), времени полужизни в плазме крови (1:1/2), степени связывания с белками плазмы крови (РРВ) и взаимодействия с Р-гликопротеинами (Р-§р).

На первом этапе моделирования на основании различных литературных источников была разработана аннотированная база данных, в которую вошли более 1400 органических молекул, в большинстве своем - известные ЛС, а также агенты, находящиеся на различных стадиях клинических испытаний. Каждое соединение было отнесено к одной или более групп, с экспериментально найденными значениями перечисленных выше свойств. В каждой группе были

выделены условные категории соединений с высокими, средними и низкими значениями исследуемого свойства (табл. 2).

Таблица 2

Статистические характеристики обучающих выборок и результаты моделирования с использованием алгоритма Сэммона

Фармакокинети-ческий параметр Категория соединений Количество соединений в категориях Качество классификации Общее количество соединений

Связывание с белками плазмы крови (РРВ) 1 РРВ(+), РРВ>90% 200 (100%) 169 (84,5%) 549

2 РРВ(+/-), РРВ=50-90% 172 -

3 РРВ(-), РРВ<50% 177(100%) 143 (80,8%)

Сродство к Р-гликопротеинам (Р-ЙР) 1 Р^р(+), субстраты 89 (100%) 66 (74,2%) 167

3 Р-ёР(-)> не субстраты 78 (100%) 62 (79,5%)

Объем распределения (Уа) 1 У<1(+), Уа<0,4 л/кг 47(100%) 39 (83,0%) 253

2 V<)(+/-), V(1=0,4-8 л/кг 162 -

3 У„(-), Уа>8 л/кг 44 (100%) 34 (77,3%)

Время полужизни в плазме крови (Т,д) 1 Т,/2(+), Т1й>20 ч 63 (100%) 51 (81,0%) 458

2 Тм(+/-), Т1/2=1-20 ч 347 -

3 Т„2(-), Т1/2<1 ч 48 (100%) 40 (83,3%)

Далее для всех структур было рассчитано широкое разнообразие молекулярных дескрипторов, из числа которых с привлечением специализированных алгоритмов анализа данных были отобраны оптимальные наборы, наиболее подходящие для моделирования исследуемого фармакокинетического свойства. С применением метода Сэммона были построены соответствующие модели, представленные на рис. 10. Очевидное разделение соединений из полярных категорий говорит о наличии в исходных пространствах признаков кластеров, преимущественно содержащих в себе отдельную группу веществ. Качество классификации на модельных выборках приведено в таблице 2.

Рис. 10. Двумерные карты Сэммона, показывающие распределение соединений из обучающих выборок (а) (б) Т1/2; (в) РРВ и (г) Р^р.

Для построения модели Кохонена были использованы аналогичные обучающие выборки и молекулярные дескрипторы. Пример карты приведен на рис. 11.

0|

Рис. 11. Модель Кохонена, показывающая распределение соединений из обучающей выборки РРВ: (а) РРВ(+) и (б) РРВ(-).

Среднее качество классификации и предсказания для моделей Кохонена представлено в таблице 3. Классификационная способность всех описанных выше прогностических систем была также оценена с использованием независимых тестовых выборок и подтверждена в ряде реальных in vitro экспериментов, с применением технологии ВПС.

Таблица 3

Средняя точность предсказания (%) с применением процедуры LTO*

Модель Обучающая выборка Независимая тестовая выборка (10%)

кат. 1 (+) кат. 3 (-) кат. 1 (+) кат. 3 (-)

vd 73,5 77,5 83,3 81,8

Т]/2 80,4 83,8 75,4 79,0

РРВ 90,4 86,7 89,4 85,4

p-gp 80,4 76,9 77,4 80,6

LTO - сокр. от англ. leave-ten-out (метод тестирования модели)

Моделирование токсических эффектов

Раздел посвящен разработке т $Шсо моделей для предсказания цито- и

орган-специфичной токсичности низкомолекулярных органических соединений.

Компьютерная модель для предсказания клеточной токсичности основана на

представительной обучающей выборке веществ (10 тыс. разнообразных структур)

с экспериментально определенной степенью токсичности по отношению к

нормальным фибробластам человека. Было обнаружено, что 2263 соединения

(классы 1-3, табл. 4, см ниже) из числа протестированных проявляют

19

цитотоксичность от слабой до весьма сильной. Выживаемость клеток под действием этих соединений (концентрация 10 мкмоль/л) составила от 0 до 75%. Для веществ из класса 4 в условиях эксперимента не было выявлено значимых цитотоксических эффектов.

Таблица 4

Классификация соединений из обучающей выборки по токсичности для

нормальных фибробластов человека

класс 1 (высокая токсичность) класс 2 (умеренная токсичность) класс 3 (низкая токсичность) класс 4 (отсутствие токсичности)

Выживаемость клеток, % 0-25 26-50 51-75 >75

Диапазон величин ЬС5о, цМ <3 3-10 >10 >50

Число соединений 414 540 1309 7737

Десять молекулярных дескрипторов, использованных для моделирования, были отобраны из числа более чем 300 изначально рассчитанных признаков при помощи АГК. С использованием этих дескрипторов была построена общая карта Кохонена (здесь не показана), на которой последовательно были выявлены области, соответствующие категориям соединений из таблицы 4. Для количественной оценки степени заселенности областей мы построили вспомогательную дифференциальную карту (рис. 12).

а б

Рис, 12. Двумерное (а) и «трехмерное» (б) представление дифференциальной карты Кохонена; показаны области преобладания нетоксичных соединений над

токсичными.

В рассматриваемом примере хорошо видны области на карте, в которых процентное содержание нетоксичных соединений в 4-18 раз превышает процентное содержание токсичных соединений по сравнению со случайным

20

распределением. Валидация модели осуществлялась с применением внутренних тестируемых наборов структур (20% от общего числа соединений в исходной обучающей выборке) в составе трех независимых рандомизаций. Результаты этих экспериментов, представленные в табл. 5, демонстрируют пригодность модели для решения практических задач, связанных с оценкой потенциальной токсичности органических соединений.

Таблица 5

Доля корректно классифицированных соединений для модели Кохонена и ИНС

токсичные нетоксичные

ранд. 1 ранд. 2 ранд. 3 среднее ранд. 1 ранд. 2 ранд. 3 среднее

Карты Кохонена 74,3% 79,0% 75,1% 76,1% 76,3% 79,1% 80,1% 78,5%

ИНС 72,1% 77,2% 77,5% 75,6% 69,1% 71,2% 75,6% 72%

Помимо алгоритма Кохонена для моделирования клеточной токсичности была использована классическая ИНС обратного распространения ошибки. Результаты моделирования показали, что возможности этого алгоритма для решения обсуждаемой задачи не уступают методу нелинейного картирования; сравнительные данные по корректности предсказания приведены в табл. 5.

Для моделирования орган-специфичной токсичности использовалась обучающая выборка соединений, включающая в себя более 22 тыс. различных молекул, большинство из которых составляли органические соединения, с экспериментально определенным значением LDso по отношению к различным видам млекопитающих, включая человека. В базе также имелась возможность дифференцировать соединения по их токсичности к специфическим органам (печень, легкие, ЖТК и т.д.) в зависимости от способа введения (оральный, внутривенный и т.д.). Все соединения были условно разделены на три категории: сильно токсичные (LD5O<300 мг/кг, 13398 соединений), вещества с умеренной токсичностью (LD50=300-400 мг/кг, 2451 соединение) и слаботоксичные (LD5o>400 мг/кг, 6608 соединений). Результирующая карта Кохонена представлена на рис. 13. Для моделирования использовалось 16 молекулярных дескрипторов, включая, помимо упомянутых ранее, различные топологические и электротопологические индексы (Zagreb, Balaban, SS), расчетный логарифм растворимости вещества в воде (LogSvv), энергии низшей свободной и высшей занятой молекулярных орбиталей (НСМО и ВЗМО, соответственно), суммарный положительный (PEOE_RPC+) и отрицательный (PEOE_RPC-) заряд молекулы и т.д. Среднее

качество классификации на модельной выборке составило более 80%, Модель успешно прошла испытания в ряде реальных экспериментов с привлечением технологии ВПС.

2 4 6 8 10 12 14 2 4 6 8 10 12 14

а б

Рис. 13. Распределение слаботоксичных (а) и сильно токсичных (б) соединений на

карте Кохонена.

Моделирование и предсказание орган-специфичной токсичности осуществлялось с привлечением алгоритма Сэммона. Всего было создано 10 различных моделей, средняя предсказательная способность которых составила 70%.

Моделирование профиля мишень-специфичной активности органических соединений

Раздел посвящен разработке интегральной модели Кохонена для предсказания мишень-специфичной активности (МСА) органических соединений.

Одна из отличительных особенностей этого метода состоит в том, что он

позволяет в рамках одной модели предсказывать эффективность связывания не с

одной, а с целым рядом терапевтически значимых биологических мишеней.

Структуры всех соединений, вошедших в обучающую выборку, были собраны на

основании тщательного литературного поиска, а также взяты из базы данных Prous

Integrity Database. В итоге обучающая выборка составила 17 тыс. ЛС с

экспериментально определенной и подтвержденной МСА, куда вошли молекулы,

обладающие активностью по отношению к различным группам биологических

мишеней, например тирозиновым киназам, рецепторам, связанным с G-белками,

ядерным рецепторам, каспазным и протеазным ферментам, гистондиацетилазам,

хемокиновым рецепторам, липоксигеназам и т.д. Всего в пределах обучающей

выборки насчитывалось более 200 уникальных типов биологических мишеней.

Для всех структур был рассчитан ряд дескрипторов, из числа которых в результате

22

комплексных процедур было отобрано семь наиболее значимых признаков, способных адекватно описать МСА, а также учитывать изомеризацию тестируемых соединений. Для полной обучающей выборки была построена интегральная карта Кохонена (рис. 14а). После построения общей карты на ней поочередно были выявлены области преимущественной локализации групп ЛС, обладающих различной МСА; примеры представлены на рис. 14б-г.

11 14 1

,-6

6 9 11 14 1

в

6 9 11 14 Г

Рис. 14. (а) Карта Кохонена (14x14) для полной исходной обучающей выборки (17 тыс. соединений); области; (б) антагонистов/агонистов йРСЯ рецепторов (5432 соединения), (в) ингибиторов каспазных ферментов (50 соединений), (г) липоксигеназ (114 соединений).

Очевидно, что наблюдаются заметные различия в положениях соединений из репрезентативных групп. При этом для каждой группы можно выделить компактные регионы как повышенной заселенности, так и малой заселенности. Средний процент разделения модельных групп соединений составил 75%, что свидетельствует о сравнительно высокой дискриминирующей способности разработанной модели, которая находит свое незаменимое применение в повседневной научно-исследовательской практике ИФАВ РАН и ИИХР.

Разработанная модель также может с успехом использоваться в области хемогеномики - сравнительно молодой научной дисциплины, фундаментальным теоретическим постулатом которой является предположение о том, что похожие на генетическом уровне биологические мишени предпочтительно взаимодействуют с одним и тем же лигандом или его биоизостерными аналогами (соединения, которые после введения в их структуру изостерных групп, сохраняют первоначальную биологическую активность) при условии комплементарности активных сайтов связывания. Более детально возможности модели для решения актуальных задач хемогеномики обсуждаются в нашей недавней главе, опубликованной в книге издательства Springer [Balakin & Ivanenkov, et al., 2009].

выводы

1. С использованием различных литературных источников, специализированных химических баз данных, процедур фильтрации и статистического анализа создано 12 уникальных обучающих выборок органических соединений с экспериментально установленной биохимической активностью, включая метаболическую стабильность, токсичность, мишень-специфичность, объем распределения и время полужизни в плазме крови, связывание с белками крови и Р-гликопротеинами.

2. Для всех соединений рассчитано более 500 различных молекулярных дескрипторов, из числа которых, в зависимости от исследуемого биохимического свойства, с применением специальных математических алгоритмов, выявлен наиболее оптимальный набор (от 6 до 16 дескрипторов).

3. С использованием специализированных алгоритмов анализа мультипараметрических данных и отобранных молекулярных дескрипторов разработан ряд компьютерных моделей для предсказания биохимической активности органических соединений.

4. Все компьютерные модели продемонстрировали хорошую точность классификации на обучающих примерах и высокую предсказательную способность на независимых выборках, включая результаты реального биологического тестирования, осуществленного с применением технологии высокопроизводительного биологического скрининга.

5. Разработаны три оригинальные компьютерные программы, позволяющие моделировать и предсказывать биохимическую активность низкомолекулярных органических соединений, рассчитывать различные молекулярные дескрипторы, осуществлять нелинейный комплексный анализ мультипараметрических данных с использованием алгоритмов Кохонена и Сэммона, а также классических искусственных нейронных сетей.

Список публикаций по теме диссертационной работы

1. Korolev D, Balakin K.V., Ivanenkov Y.A., et al. Modeling of human cytochrome P450-mediated drug metabolism using unsupervised machine learning approach // J. Med. Chem. 2003. V. 46. P. 3631-3643.

2. Ivanenkov Y.A., Balakin K.V., Skorenko A.V., et al. Application of advanced machine learning algorithm for profiling specific GPCR-active compounds // Chem. Today. 2003. V.21.P. 72-75.

3. Nikolsky Y., Balakin K.V., Ivanenkov Y.A., et al. Intelligent machine learning technologies in pre-synthetic combinatorial design // PharmaChem. 2003. V. 4. P. 68-72.

4. Ivanenkov Y.A., Balakin K.V., Savchuk N.P. et al. Advanced data mining tools for compounds libraries // European Biotechnology News. 2003. V. 2. P. 40-41.

5. Balakin K.V., Ekins S., Ivanenkov Y.A., et al. Quantitative structure-metabolism relationship modeling of the metabolic Л'-dealkylation rates // Drug Metab. Dispos.

2004. V. 32. P. 1111-1120.

6. Tkachenko S.E., Okun I., Ivanenkov, Y.A., et al. Efficient optimization strategy for marginal hits active against Abl tyrosine kinases // Current Drug. Disc. Techn. 2004. V. l.P. 201-210.

7. Балакин K.B., Иваненков Я.А., Скоренко A.B. и др. Построение классификационных моделей для виртуального скрининга // Журн. Орг. Фарм. Хим. 2004. Т. 2, № 3. С. 47-53.

8. Balakin K.V., Ekins S., Ivanenkov Y.A., et al. Kohonen maps for prediction of binding to human cytochrome P450 // Drug Metab. Dispos. 2004. V. 32. P. 1183-1189.

9. Соловьев М.Ю., Филимонов С.И., Иваненков Я.А. и др. Синтез, строение и свойства ряда 3-сульфамидных производных пиридина // Изв. ВУЗов. Химия и хим. технология. 2004. Т. 47, № 2. С. 28-36.

10. Балакин К.В., Иваненков Я.А., Коваленко С.Н. и др. Построение классификационной модели для виртуального скрининга ингибиторов тирозиновых киназ // Журн. Орг. Фарм. Хим. 2004. Т. 2, № 4. С. 48-53.

11. Иваненков Я.А., Балакин К.В. Компьютерные методы прогнозирования метаболизма физиологически активных веществ // Биомедицинская химия. 2005. Т. 51, № 2. С. 384-412.

12. Журавель И.А., Коваленко С.Н., Иваненков Я.А. и др. Синтез и виртуальный скрининг библиотек 2//-пирано[2,3-с]пиридинов с целью рационального отбора соединений-кандидатов для биологических испытаний на киназную активность // Журн. Орг. Фарм. Хим. 2005. Т. 1. С. 6-11.

13. Balakin K.V., Ivanenkov Y.A., Savchuk N.P., et al. Comprehensive computational assessment of ADME properties using mapping techniques // Curr. Drug Disc. Techn.

2005. V. 2. P. 99-113.

14. Дорогов M.B., Балакин K.B., Иваненков Я.А. и др. Профилирование мишень-специфичной активности комбинаторных библиотек органических соединений с использованием карт Кохонена// Журн. Орг. Фарм. Хим. 2005. Т. 3, № 1. С. 6-11.

15. Кравченко Д.В., Иваненков Я.А., Балакин К.В. и др. Дизайн и синтез новых непептидных ингибиторов каспазы-3 // Химико-фармацевтический журнал. 2006. Т.З.С. 125-129.

16. Балакин К.В., Иваненков Я.А., Иващенко А.А. Компьютерные методы прогнозирования мишень-специфической активности в разработке новых

противоопухолевых соединений // Психофармакология и биологическая наркология. 2007, Т. 7, №4. С. 1598.

17. Chekmarev D.S., Kholodovych V., Ivanenkov Y.A., et al. Shape signatures: New descriptors for predicting cardiotoxicity in silico II Chem. Res. Toxicol. 2008. V. 21, № 6. P. 1304-14.

18. Ivanenkov Y.A., Savchuk, N.P., Ekins S., et al. Computational mapping tools for drug discovery // Drug Discovery Today. 2009. V. 14. P. 767-75.

19. Иваненков Я. А., Бовина E.B., Балакин К.В. Методы нелинейного картирования для прогнозирования фармакологических свойств химических соединений// Успехи химии. 2009. Т. 78, № 5. С. 503-523.

20. Balakin K.V., Ivanenkov Y.A., Savchuk N.P. Compound library design for target families // Methods Mol. Biol. 2009. T. 575, C. 21-46.

21. Волкова Т.Г., Балакин КВ., Иваненков Я.А., Клюев М.В. Прогнозирование биологической активности структурных аналогов бензилиденанилина // Жидкие кристаллы и их практическое использование. 2010. Т. 3. С. 57-63.

Список сокращений

Fa - относительная абсорбция (сокр. от англ. Fractional absorption)

GPCR - сокр. от англ. G-protein-coupled receptors (рецепторы, связанные с G-белками)

LC50 (LD50) - концентрация (доза) соединений, при которой гибнет 50% клеток

(организмов)

LOO - сокр. от англ. Leave-one-out (метод тестирования предсказательной способности модели)

LTO - сокр. от англ. Leave-ten-out (метод тестирования предсказательной способности модели)

P-gp - Р-гликопротеины (также известны как MDR1 или АВСВ1)

РРВ - связывание с белками крови (сокр. от англ. Plasma-protein binding)

Т1/2 - время полужизни вещества в плазме крови (от англ.: Half-life time)

Vd - объем распределения вещества в организме (от англ.: Volume of distribution)

АГК - анализ главных компонент (от англ. Principal Component Analysis, РСА)

БА - биологическая активность

ВПС - высокопроизводительный биологический скрининг

ГЭБ - гематоэнцефалический барьер

ЖКТ- желудочно-кишечный тракт

ИНС - искусственные нейронные сети (сеть)

КС - комбинаторный синтез

J1C - лекарственные соединения (субстанции)

MOB - метод опорных векторов Вапника

МСА - мишень-специфичная активность

ФАВ - физиологически активные вещества

Подписано в печать: 18.10.10 Объем: 1,5 усл.п.л. Тираж: 100 экз. Заказ № 769157 Отпечатано в типографии «Реглет» 119526, г. Москва, пр-т Вернадского,39 (495) 363-78-90; www.reglet.ru

Содержание диссертации, кандидата биологических наук, Иваненков, Ян Андреевич

СПИСОК ИСПОЛЬЗУЕМЫХ СОКРАЩЕНИЙ

ВВЕДЕНИЕ

Часть 1. ОБЗОР ЛИТЕРАТУРЫ

Глава 1. Современные подходы к моделированию биологической активности органических веществ и разработке новых лекарственных соединений

1.1. Методы компьютерного моделирования для оценки биологической 7 активности органических соединений

1.2. Биологические основы искусственных нейронных сетей

1.2.1. Методы нелинейного картирования для оценки биологической активности органических соединений

1.3. Методы in vitro исследований биологической активности органических 28 соединений при помощи платформ высокопроизводительного биологического скрининга

Часть 2. ЭКСПЕРИМЕНТАЛЬНАЯ ЧАСТЬ

Глава 2. Методология компьютерного эксперимента

2.1. Основная стратегия компьютерного моделирования биологической 33 активности. Референсные базы данных и обучающие выборки

2.2. Расчет и отбор молекулярных дескрипторов

2.3. Процедура моделирования биологической активности с применением 41 алгоритмов нелинейного картирования

2.3.1. Самоорганизующиеся нелинейные карты Кохонена

2.3.2. Алгоритм редуцирования многомерных пространств признаков 47 Сэммона

Часть 3. ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ

Глава 3. Моделирование метаболизма

3.1. Метаболизм органических веществ. Ключевые ферменты метаболизма

3.2. Разработка in silico моделей

3.2.1. Моделирование метаболической стабильности органических со- 58 единений по отношению к семейству цитохромов Р

3.2.2. Оценка эффективности связывания с активным центром 62 цитохромов Р

3.2.3. Моделирование скоростей реакций //-дезалкилирования, 69 катализируемых цитохромами Р

Глава 4. Моделирование степени проникновения органических соединений, через биологические барьеры

4.1. Биологические мембраны. Механизмы транспорта

4.1.1. Особенности строения и функции гематоэнцефалического 76 барьера. Транспорт веществ через ГЭБ

4.1.2. Транспорт веществ через стенку ЖКТ 83 4.2. Разработка in silico моделей

4.2.1. Основные подходы к прогнозированию мембранопроникаемости

4.2.2. Компьютерное моделирование мембранопроникаемости 91 органических соединений через ГЭБ и стенку ЖКТ

Глава 5. Прогнозирование других фармакокинетических параметров

5.1. Объем распределения

5.2. Время полужизни в плазме крови

5.3. Степень связывания с белками плазмы крови

5.4. Связывание с Р-гликопротеинами

5.5. Экспериментальная оценка точности предсказания разработанных 126 моделей

Глава 6. Моделирование токсических эффектов

6.1. Проблема предсказания токсичности химических соединений

6.2. Разработка in silico моделей

6.2.1. Клеточная токсичность

6.2.2. Орган-специфичная токсичность

Глава 7. Моделирование профиля мишень-специфичной активности 140 органических соединений

7.1. Модель Кохонена '

Введение Диссертация по биологии, на тему "Моделирование биологической активности низкомолекулярных органических соединений с применением компьютерных методов анализа мультипараметрических данных"

Настоящая диссертационная работа посвящена разработке специализированных компьютерных моделей для анализа и предсказания биохимической активности низкомолекулярных органических соединений. Моделирование осуществлялось с привлечением эффективных методов анализа мультипараметрических данных.

Актуальность работы. Исследование биологической активности низкомолекулярных органических соединений является одним из наиболее актуальных направлений в современной биологической, медицинской и компьютерной химии [1]. Однако изучение столь комплексного свойства сопряжено с целым рядом проблем, решение которых зависит от интенсивных теоретических и экспериментальных работ в области биохимии, молекулярной биологии, геномики, компьютерного моделирования, органического синтеза, медицины и фармакологии [2,3]. Наибольшее практическое значение такие исследования имеют в области разработки новых лекарственных субстанций, которые в большинстве своем являются, синтетическими молекулами: На- ранних стадиях этого процесса особое внимание уделяется исследованию и компьютерному моделированию ключевых свойств физиологически активных веществу включая терапевтически значимый механизм действия, а также ряд ключевых фармакокинетических и фармакодинамических параметров [3-5]. Такой подход позволяет делать математически обоснованные предположения о фармакологической направленности и эффективности исследуемых структур [6-10].

Компьютерное моделирование в настоящее время становится неотъемлемой частью процесса исследования биологической активности [11,12]. Несмотря на сравнительно недолгую историю существования специализированных методов компьютерной биологической и медицинской химии, существует целый ряд эффективных алгоритмов, позволяющих моделировать и в дальнейшем прогнозировать различные биохимические свойства органических соединений, включая их метаболическую стабильность и способность образовывать активные комплексы с биологическими мишенями. Среди таких алгоритмов особое место занимают методы нелинейного картирования [12,13]. Помимо высокой предсказательной способности такие методы весьма удобны для визуального восприятия; они позволяют исследователю проводить комплексный, анализ найденных закономерностей. На основании полученной нелинейной проекции исследуются' причины и основные факторы, обусловливающие разделение категорий соединений, обладающих различной биологической активностью (БА). Кроме методов нелинейного картирования существует ряд других, не менее эффективных подходов, позволяющих осуществлять комплексный анализ многомерных данных, среди которых наиболее перспективными в практическом аспекте являются классические искусственные нейронные сети (ИНС) [14]. Моделирование осуществляется с использованием, как правило, расчетных молекулярных дескрипторов (признаков), в общем случае представляющих из себя числовой эквивалент свойства молекулы (структуры), например, молекулярный вес, общая площадь полярной поверхности, количество потенциальных доноров и акцепторов водородной связи и др. Таким образом, исследователь получает в свои руки эффективный компьютерный инструмент, без которого в условиях современного развития биотехнологий, в частности, высокопроизводительного биологического скрининга, обойтись просто невозможно.

Несмотря на очевидную целесообразность использования компьютерных моделей для анализа и предсказания различных биохимических свойств низкомолекулярных органических соединений, их разработка является, в высшей степени сложной и трудоемкой задачей. Во многих случаях недостаточность исходных данных, их неоднородность, а также невоспроизводимость в условиях единого эксперимента, не позволяют исследователю построить статистически значимую- т яШсо модель с адекватным и достаточным теоретическим обоснованием обнаруженных закономерностей. Отсутствие независимого тестирования, и правильной трактовки полученных результатов делает такие модели несостоятельными в отношении корректности классификации и предсказания-БА новых структур. В силу этих и целого ряда других объективных причин на сегодняшний день«количество эффективных, с точки зрения качества предсказания, компьютерных моделей весьма ограничено. Некоторые из них узкоспециализированы и могут использоваться исключительно для определенного класса химических структур, что существенно сужает рамки их практического применения.

Учитывая сказанное выше, работы по компьютерному моделированию биологической активности органических соединений на основе алгоритмов нелинейного анализа мультипараметрических данных являются в высшей степени актуальными и, с практической точки зрения, крайне востребованными.

Цель и задачи исследования. Основной целью настоящей диссертационной работы является разработка подходов к компьютерному моделированию и прогнозированию комплексных биологических свойств органических соединений. Среди наиболее значимых задач исследования можно перечислить следующие: г

1. Сбор, анализ и подготовка к компьютерному моделированию представительных баз данных химических структур с экспериментально определенными биохимическими свойствами.

2. Расчет и отбор наиболее значимых молекулярных дескрипторов с привлечением специализированных компьютерных алгоритмов.

3. Компьютерное моделирование биохимической активности низкомолекулярных органических соединений с применением нелинейных методов анализа мультипараметрических данных.

4. Создание специализированных компьютерных программ для анализа химического пространства, моделирования и предсказания биологической активности.

Научная новизна. Разработан ряд оригинальных компьютерных моделей, позволяющих оценивать биологическую активность и фармакокинетические свойства низкомолекулярных органических веществ с использованием нелинейных алгоритмов анализа мультипараметрических данных, включая самоорганизующиеся карты Кохонена [15], метод Сэммона [16], а также классические искусственные нейронные сети. В алгоритм Кохонена внесен ряд модификаций и усовершенствований, повышающих его производительность и точность. Созданы прогностические системы для анализа наиболее значимых фармакокинетических характеристик: метаболической стабильности веществ по отношению к семейству цитохромов Р450, степени проникновения через биологические мембраны, цито- и орган-специфичной токсичности, объема распределения вещества в организме, времени полужизни в плазме крови, степени связывания с белками крови и Р-гликопротеинами, а также возможности образовывать прочные нековалентные комплексы с различными биологическими мишенями, имеющими терапевтическую значимость. Показано, что точность классификации и предсказания с применением методов нелинейного картирования и искусственной нейронной сети классической архитектуры превосходит по качеству более простые регрессионные и корреляционные модели, а также тривиальные структурные и физико-химические фильтры и правила.

Практическая значимость работы. Созданные уникальные базы данных химических соединений с экспериментально определенными биохимическими свойствами, включая ряд ключевых фармакокинетических параметров, имеют очевидную практическую значимость, в первую очередь, для медицинской и биологической химии. Структуры подвергались тщательному анализу и специальной процедуре фильтрации, в ходе которой из рассмотрения исключались высокомолекулярные соединения, редкие органометаллические комплексы, вещества с недопустимыми структурными элементами, которые не являются drug like молекулами и в процессе моделирования дают существенные статистические погрешности. Для каждого соединения из собранных баз данных рассчитан широкий набор молекулярных дескрипторов. В зависимости от особенностей решаемой задачи с привлечением специализированных математико-статистических алгоритмов определены оптимальные наборы признаков, с использованием которых строились компьютерные модели. Структурные базы данных с оптимизированным набором дескрипторов крайне востребованы в области биологической и медицинской химии: они используются в качестве обучающих выборок, с применением которых осуществляется компьютерное моделирование; на их основе создаются специализированные аннотированные библиотеки физиологически активных веществ [17]. Разработанные нами компьютерные модели прошли экспериментальное тестирование с привлечением независимых контрольных выборок и результатов реальных биологических испытаний, осуществленных в Исследовательском институте химического разнообразия (ИИХР, г. Химки) и Институте физиологически активных веществ РАН (ИФАВ РАН, г. Черноголовка).

Созданные компьютерные программы и интегрированные в них модели, описанные в диссертационной работе, используются вряде институтов и организаций, занимающихся разработкой физиологически активных соединений, (ИИХР, ИФАВ РАН, МГУ им. М.В.Ломоносова и др.).

Апробация работы. Результаты работы были представлены на более чем 20-ш научных конференциях и симпозиумах, в том числе: «Drug Discovery Technology Europe» (Stuttgart, 2003), «Drug Science & Technology Summit» (New York, 2003), «SBS 9th Ann. Conference and Exhibition» (Portland, 2003), «BioNorth 10th Anniversary Conference» (Ottawa, 2003), «SCIpharm Intern. Pharm. Industry Conference» (Edinbourgh, UK, 2004), XII Российский национальный конгресс «Человек и лекарство» (Москва, 2005), Международный конгресс «Биотехнология: состояние и перспективы развития» (Москва, 2005), Международная конференция «Биологические лшшени для действия лекарственных препаратов нового поколения. Перспективы интеграции российских ученых в международную Koonepaifuio» (Химки, 2006), «Proceedings of the III Congress of Pharmacology» (Санкт-Петербург, 2008).

Публикации. По материалам диссертации опубликована 21 работа (помимо глав в книги и докладов на научных конференциях и симпозиумах), из них 9 публикаций в журналах из официального Перечня ВАК РФ.

Структура и объем работы. Диссертация состоит из введения, литературного обзора, экспериментальной» части, обсуждения результатов, заключения, выводов и списка

Заключение Диссертация по теме "Биохимия", Иваненков, Ян Андреевич

выводы

1. С использованием различных литературных источников, специализированных химических баз данных, процедур фильтрации и статистического анализа создано 12 уникальных обучающих выборок органических соединений с экспериментально установленной биохимической активностью, включая метаболическую стабильность, токсичность, мишень-специфичность, объем распределения и время полужизни в плазме крови, связывание с белками крови и Р-гликопротеинами.

2. Для всех соединений рассчитано более 500 различных молекулярных дескрипторов, из числа которых, в зависимости от исследуемого биохимического свойства, с применением специальных математических алгоритмов, выявлен наиболее оптимальный набор (от 6 до 16 дескрипторов).

3. С использованием специализированных алгоритмов анализа мультипараметрических данных и отобранных молекулярных дескрипторов разработан ряд компьютерных моделей для предсказания биохимической активности органических соединений.

4. Все компьютерные модели продемонстрировали хорошую точность классификации на обучающих примерах и высокую предсказательную способность на независимых выборках, включая результаты реального биологического тестирования, осуществленного с применением технологии высокопроизводительного биологического скрининга.

5. Разработаны три оригинальные компьютерные программы, позволяющие моделировать и предсказывать биохимическую активность низкомолекулярных органических соединений, рассчитывать различные молекулярные дескрипторы, осуществлять нелинейный комплексный анализ мультипараметрических данных с использованием алгоритмов Кохонена и Сэммона, а также классических искусственных нейронных сетей.

Заключение

Бурно развивающиеся технологии вносят свои коррективы во многие стороны научной деятельности, в том числе и такие консервативные, как биология и синтетическая органическая химия. Как говорилось во вступительной части работы, в условиях современных научных подходов междисциплинарные исследовательские направления приобретают все большую значимость и актуальность. С этой точки зрения, научное направление, в котором изучаются вопросы комплексного взаимодействия органических веществ с различными биомолекулами и организмом человека в целом, рассматривается как передовой оплот многих научных дисциплин, включая биохимию, молекулярную биологию, энзимологию и генетику, физическую и органическую химию, математику и статистику, интенсивное развитие которых за последние пол века привело в итоге к рождению высокотехнологичной триады экспериментальных методов. Именно по этим причинам весьма плодотворный союз современной биологической, медицинской и компьютерной химии рассматривается сегодня в качестве наиболее надежного фундамента для разработки новых, физиологически активных веществ и анализа их биологической»активности:

С появлением высокопроизводительных экспериментальных методов резко возрос объем сопутствующей информации, уже непосильной для. анализа* традиционными методами математической статистики. Так, в отличие от классического органического синтеза, производительность комбинаторного синтеза исчисляется десятками тысяч индивидуальных соединений в день! Современные специализированные установки твердофазного и жидкофазного синтеза позволяют получать различные по структуре молекулы в автоматическом режиме. Предложено множество уникальных синтетических схем, адаптированных под формат комбинаторной химии, включая знаменитые реакции Уги, Дильса-Альдера и Пассерини. С точки зрения медицинской и биологической химии, этот высокотехнологичный подход предоставляет широкое химическое пространство, с помощью которого возможно углубленное исследование индуцированных биологических ответов, осуществление анализа взаимосвязи структура-свойство, оптимизация фармакокинетических параметров, создание аннотированных библиотек химических структур и биомишеней.

Непосредственное биологическое тестирование синтезированных с привлечением методов комбинаторного синтеза соединений немыслимо без технологии высокопроизводительного биологического скрининга. Исследователь получает возможность в автоматическом режиме осуществлять единовременный анализ

149 биохимической активности, токсичности и селективности веществ по отношению к целому ряду биологических мишеней. На основании результатов тестирования строятся новые гипотезы, предлагаются обоснованные пути дальнейших исследований и развития.

К пониманию необходимости создания специализированных компьютерных моделей для анализа вероятного спектра биохимической активности органических соединений пришли не так давно. Отчасти это было связано с крайней потребностью в рациональной селекции структур еще на стадии планирования некомпьютерных экспериментальных процедур, что вовсе не удивительно, учитывая одно немаловажное обстоятельство. Традиционная органическая химия имела дело с небольшими рядами соединений, синтезируемыми в ходе малопроизводительных лабораторных процедур. В этих условиях, даже если существовала необходимость отбора и синтеза наиболее желательных молекул из числа возможных, то с этой задачей легко справлялся человек-эксперт, основываясь на опыте, интуиции и доступных ресурсах. Однако ситуация резко изменилась с появлением методов комбинаторной химии и экспериментального тестирования органических соединений. При планировании схем комбинаторного синтеза исследователи столкнулись с необходимостью отбора малой части соединений из колоссального числа возможных "виртуальных" структур. Как следствие, появилась потребность в разработке методов направленной, рациональной селекции вещества соответствии с особенностями конкретных биологических задач. Так, с привлечением методов компьютерного моделирования удается обнаруживать значимые взаимосвязи между структурой активного соединения, соответствующими физиологическими эффектами, в частности активностью по отношению к белковым рецепторам и ферментам, а также физико-химическими свойствами.

С другой точки зрения, компьютерное моделирование биохимической активности имеет весьма значимую теоретическую составляющую. Как было неоднократно продемонстрировано в представленной диссертационной работе, довольно часто анализ полученных результатов приводит к новым теоретическим обоснованиям исследуемого явления. Например, на основании комплексного анализа разработанной интегральной модели для предсказания степени проникновения органических веществ через биологические мембраны, было показано, что транспорт через гемагоэнцефалический барьер и стенки желудочно-кишечного тракта не определяется исключительно липофильностью органических соединений, барьеры имеют разную природу и свойства.

Именно такие конкретные, прикладные и теоретические задачи решались в рамках настоящей диссертационной работы. Основным ее отличительным качеством является целенаправленное комбинирование теоретических знаний в области

150 биологической и медицинской химии с передовыми алгоритмами анализа мульгипараметрических данных. Одной из основных целей такого подхода является повышение экономической эффективности современных исследовательских программ, связанных с разработкой новых лекарственных субстанций, анализом механизмов их действия и фармакокинетического профиля.

Для современной науки характерно бурное аккумулирование эмпирических фактов и наблюдений. Этот естественный процесс, в целом обеспечивающий эволюцию наших представлений о мире материальных объектов, к сожалению, еще нельзя приравнивать к обретению новых знаний. Более того, он несет в себе реальную опасность дробления целостного научного восприятия мира, кроющуюся под маской специализации. Указанный феномен характерен для многих научных дисциплин, накопивших к настоящему времени колоссальный экспериментальный багаж. По мнению автора, научной дисциплине, базирующейся на анализе больших массивов эмпирических данных, внутренне присуща потребность в сборе, кластеризации и всестороннем изучении этой накопленной информации. Следовательно, эта дисциплина несет в себе именно то объединяющее начало, так необходимое современной науке, препятствующее ее дезинтеграции и позволяющее, в соответствии с известным диалектическим законом, трансформировать количество статичных фактов в качество новых знаний. * *

Подходящий к своим финальным строкам труд аккумулирует в себе результаты многолетних лабораторных исследований, напряженного анализа различных литературных источников и специализированных химических баз данных, интенсивных компьютерных экспериментов, неизбежных ошибок и интуитивных прозрений, творческих обсуждений и личных размышлений. Очевидно, некоторые утверждения носят весьма дискуссионный характер, а часть разработанных компьютерных моделей требует дополнительных теоретических и практических изысканий. Вынося эту работу на суд глубокоуважаемых оппонентов и рецензентов, а также общей читательской аудитории, автор надеется на благосклонное и внимательное к ней отношение.

Библиография Диссертация по биологии, кандидата биологических наук, Иваненков, Ян Андреевич, Уфа

1. Rydzewski R.M. Real world drug discovery: a chemist's guide to biotech and pharmaceutical research / Elsevier. - 2008. 515 P.

2. Makriyannis A., Biegel D. Drug discovery strategies and methods / Marcel Dekker. 2004. 348 P.

3. Hiiser J. High-throughput screening in drug discovery. Methods and principles in medicinal chemistry / Wiley-VCH. 2006. 343 P.

4. RickNg. Drugs: from discovery to approva / Wiley-IEEE. 2004.355 P.

5. Rognan D. Ligand design for G protein-coupled receptors / Wiley-VCH. 2006.264 P.

6. Bohm H-J., Schneider G. Virtual screening for bioactive molecules / Wiley-VCH. 2000. 307 P.

7. Alvarez J., Brian Shoichet. Virtual screening in drug discovery / Taylor & Francis. 2005. 470 P.

8. Ekins S. Computer applications in pharmaceutical research and development / John Wiley and Sons.-2006. 805 P.

9. Schneider G., Baringhaus K-H. Molecular design: concepts and applications / Wiley-VCFI. 2008. 262 P.

10. Puzyn Т., Leszczynski J., Mark T.D. Cronin. Recent Advances in QSAR Studies: Methods and Applications / Springer. 2009. 423 P.

11. Thomas N.T., Rowland M. Introduction to pharmacokinetics and pharmacodynamics: the quantitative basis of drug therapy / Lippincott Williams & Wilkins. 2006. 326 P.

12. Balakin K.V., Ekins S. Pharmaceutical Data Mining: Approaches and Applications for Drug Discovery / John Wiley and Sons. 2009,- 565 P.

13. Zupan J., Gasteiger J. Neural networks in chemistry and drug design / Wiley-VCH. 1999. 380 P.

14. Haykin S.S. Neural networks and learning machines / Prentice Hall. 2009. 906 P.

15. Kohonen T. Self-organizing maps, 3rd ed. / Springer-Verlag. -2001. 528 P.

16. Sammon J.W. A non-linear mapping for data structure analysis // IEEE Trans. Comput. 1969. V. 18. P. 401-409.

17. Savchuk N.P., Balakin K.V., Tkachenko S.E. Exploring the chemogenomic knowledge space with annotated chemical libraries // Curr. Opin. Chem. Biol. 2004. V. 8. №. 4. P. 412-417.

18. Petersen F., Amstutz R Natural compounds as drugs. Progress in drug research, vol. 2. / Birkhauser.- 2008.427 P.

19. Bannwarth W., Felder E. Combinatorial Chemistry: a Practical Approach / Wiley-VCH. 2000. P. 430.

20. Иващеико A.B., Иваненков Я.А., Кисиль В., Красавин М., Ильин А.П. Многокомпонентные реакции изоцианидов в синтезе гетероциклов // Успехи Химии. 2010. Т. 79. №. 9. С. 861-893.

21. Sotriffer С. Virtual Screening: Principles, Challenges, and Practical Guidelines / John Wiley & Sons, Limited. 2011.460 P.

22. Kubinyi H. QSAR. Hansch analysis and related approaches // In Methods and principles in medicinal chemistry, vol. 1./ Wiley-VCH. 1993. P. 57-68.

23. Varnek A., Tropsha A. Chemoinformatics approaches to virtual screening / Royal Society of Chemistry.-2008.338 P.

24. Балакин K.B., Иваненков Я.А., Скоренко А.В., Коваленко С.Н., Журавель И.А., Черных В.П. Построение классификационных моделей для виртуального скрининга / Укр. Журн. Орг. Хим. 2004. V. 2. № 3. С. 48-53.

25. Ivanenkov Y.A., Bovina E.V., Balakin K.Y. Nonlinear mapping techniques for prediction of pharmacological properties of chemical compounds // Russian Chemical Reviews. 2009. V. 78. № 5. P. 465-483.

26. Merlot С., Domine D., Cleva С., Church D.J. Chemical substructures in drug discovery // Drug Discov. Today. 2003. V. 8. № 13. P. 594-602.

27. Sheridan R.P., Kearsley S.K. Why do we need so many chemical similarity search methods? // Drug Discov. Today. 2002. V. 7. № 17. P. 903-911.

28. Tkachenko S.E., Okun I., Balakin K.V., Petersen C.E., Ivanenkov Y.A., Savchuk N.P., Ivachtchenko A.A. Efficient optimization strategy for marginal hits active against Abl tyrosine kinases // Current Drug. Disc. Techn. 2004. V. 1. P. 201-210.

29. Balakin K.V., Tkachenko S.E., Okun I., Skorenko A.V., Ivanenkov Y.A., Savchuk N.P., Ivachtchenko A.A., Nikolsky Y. Bioisosteric morphing in primary hit optimization // Chem. Today. 2004. V. 22. P. 15-18.

30. Savchuk N.P., Balakin K.V. Efficient primary hit optimization strategy based on.concept of bioisosterism // Curr. Drug Disc. 2004. V. 5. P. 23-27.

31. Sammon J.W.Jr. A nonlinear mapping for data structure analysis // IEEE Trans. Comput. 1969. V С18. P. 969-975.

32. Bigus J.P. Data mining with neural networks /McGraw-IIill. 1996.220 P.

33. Devillers J. Neural networks in QSAR and drug design / Academic Press. 1996.284 P.

34. Vapnik V. Statistical learning theory / Wiley. 1998. 768 P.

35. Ivanenkov Y.A., Khandarova L.M. Advanced methods of artificial intelligence in the design of pharmaceutical agents // In Pharmaceutical data mining: approaches and applications for drug discovery / John Wiley & Sons, be. -2009. P. 457-490.

36. Pletnev I., Ivanenkov Y.A., Tarasov A. Dimensionality reduction techniques for pharmaceutical data mining / In Pharmaceutical data mining: approaches and applications for drug discovery / John Wiley & Sons, Inc. 2009. P. 425-455.

37. Cramer R.D., Poss M.A., Hermsmeier M.A., Hermsmeier M.A., Cauleeld T.J., Kowala M.C., Valentine M.T. Prospective identification of biologically active structures by topomer shape similarity searching//J. Med. Chem. 1999. V. 42. № 19. P. 3919-3933.

38. Langer Т., Hoffmann R.D., Mannhold R., Kubinyi H., Folkers G. Pharmacophores and pharmacophore searches. Methods and principles in medicinal chemistry, vol. 32 / Wiley-VCH. -2006. 395 P.

39. Holtje H-D. Molecular modeling: basic principles and applications. Methods and principles in medicinal chemistry, vol. 5 / Wiley-VCH. 2008.310 P.

40. Koiyakova A.G., Ryzhova E.A., Ivanenkov Y.A. Novel aiyl and heteroaryl substituted 7V-3-(4-phenylpiperazin-l-yl)propyl.-l,2,4-oxadiazole-5-carboxamides as selective GSK-3 inhibitors // Bioorg. & Med. Chem. Lett. 2008. V. 18. P. 3661-3666.

41. Kravchenko D.V., Ivanenkov Y.A., Balakin K.V., Kisil V.M., Tkachenko S.E., Okun' I.M., Ivashchenko A.V. Design and synthesis of new nonpeptide caspase-3 inhibitors // Pharm. Chem. J. 2006. V. 40. №3. P. 127-131.

42. Dreyius G. Neural networks: methodology and applications / Birkhauser. 2005.497 P.

43. Levine M.D. Vision in man and machine / McGraw-Hill. 1985. 574 P.

44. Smolinski T.G. Applications of computational intelligence in biology: current trends and open problems / Springer. 2008:428 P.

45. Покровский B.M., Коротько Г.Ф. Физиология человека. Серия: Учебная литература для* студентов медицинских вузов / Медицина. 2007. 656 С.

46. McCulloch W.S., Pitts W. A logical calculus of the ideas immanent in nervous activity // Bull.Math.Biophys. 1943. V.5. P.115-133.

47. Kohonen T. The self-organizing map // Proc. Inst. Electr. Electron. Eng. 1990. V. 78. P. 14641480.

48. Agrafiotis D.K. Stochastic proximity embedding // J. Comput. Chem. 2003. V. 24. № 10. P. 1215-1221.

49. Brown R.D., Martin Y.C. Use of structure-activity data to compare structure-based clustering methods and descriptors for use in compound selection // J. Chem. Inf. Сотр. Sci. 1996. V. 36. P. 572-584.

50. Agrafiotis D.K., Bandyopadhyay D., Farnum M. Radial clustergrams: visualizing the aggregate properties of hierarchical clusters // J. Chem. Inf. Model. 2007. V. 47. P: 69-75.

51. Nadler В., Lafon S., Coifman R.R., Kevrekidis I.G. Diffusion maps, spectral clustering and the reaction coordinates of dynamical systems // Appl. Comput. Harm. Anal. 2006. V. 21. P. 113-127.

52. Balasubramanian M, Schwartz EL. The Isomap algorithm and topological stability // Science. 2002. V. 295. № 5552. P. 7.

53. Ivanenkov Y.A., Savchuk N.P., Ekins S., Balakin K.V. Computational mapping tools for drug discoveiy // Drug Discovery Today. 2009. V. 14. № 15-16. P. 767-75.

54. Nikolsky Y., Balakin K.V., Ivanenkov Y.A., Ivachtchenko A.A., Savchuk N.P. Intelligent machine learning technologies in pre-synthetic combinatorial design // PharmaChem. 2003. V. 4. P. 68-72.

55. Ivanenkov Y.A., Balakin K.V., Savchuk N.P., Ivachtchenko A.A., Skorenko A.V., Nikolsky Y. Advanced data mining tools for compounds libraries // European Biotechnology News. 2003. V. 2. P. 40-41.

56. Балакин K.B., Иваненков Я.А., Скоренко A.B., Коваленко С.Н., Журавель И.А., Черных В.П. Построение классификационных моделей для виртуального скрининга // Журн. Орг. Фарм. Хим. 2004. Т. 2. № 3. С. 47-53.

57. Balakin K.V., Savchuk N.P., Kiselyov A. Computer algorithms for selecting molecule libraries for synthesis II In Computer applications in pharmaceutical research and development / John Wiley & Sons, Inc. 2006. P. 353-377.

58. Ekins S. Applications of QSAR to enzymes involved in toxicology // In Computational toxicology: risk assessment for pharmaceutical and enviromental chemicals / John Wiley & Sons, Inc.-2007. P. 277-295.

59. Labute P., Nilar S., Williams С. A probabilistic approach to high throughput drug discovery // Comb. Chem. & High Throughput Scr. 2002. V. 5. № 2. P. 135-145.

60. Gao H., Williams C., Labute P., Bajorath J. Binary quantitative structure-activity relationship (QSAR) analysis of estrogen receptor ligands // J. Chem. Inf. Comput. Sci. 1999. V. 39. № 1. P. 164168.

61. Savchuk N.P., Tkachenko S.E., Balakin K.V. Rational design of GPCR-specific combinational libraries based on the concept of privileged substructures // In Chemoinformatics in Drug Discovery / Wiley-VCI-I. 2005. P. 287-313.

62. Rabow A.A., Shoemaker R.H., Sausville E.A., Covell D.G. Mining the National Cancer Institute's tumor-screening database: identification of compounds with similar cellular activities // J. Med. Chem. 2002. V. 45. №4. P. 818-840.

63. Derwent World Drug Index. Dervvent Information, London, England. http://science.tliomsonreuters.com

64. Maybridge Chemicals Company Ltd., England, http://www.mavbridge.com

65. Wilson A.G., White A.C., Mueller R.A. Role of predictive metabolism and toxicity modeling in drug discoveiy — a summary of some recent advancements // Curr. Opin. Drug Discov. Devel. 2003. V. 6.№ l.P. 123-128.

66. McKinney J.D., Richard A., Waller C., Newman M.C., Gerberick F. The practice of structure activity relationships (SAR) in toxicology //Toxic. Sci. 2000. V. 56. № 1. P. 8-17.

67. Russom C.L., Brandbury S.P., Broderius S J., Hammermeister D.E., Drummond D.A. Predicting modes of toxic action from chemical structure: Acute toxicity in the fathead minnow"// Environ.-Toxicol. Chem. 1997. V. 16: № 5. P. 948-967.

68. Balakin K.V., Ivanenkov Y.A., Skorenko A.V., Nikolsky Y.V., Savchuk N.P., Ivachtchenko A.A. In silico estimation of DMSO solubility of organic compounds for bioscreening // J. Biomol. Scr. 2004. V. 9. P. 22-31.

69. Balakin K.V., Ivanenkov Y.A., Skorenko A.V., Nikolsky Y., Savchuk N.P., Ivashchenko A.A.1.ng-term experimental observations and theoretical studies- of physicochemical determinants ofth

70. DMSO solubility of organic substances // Abstract book of SBS 9 Ann. Conference and Exhibition. Portland, USA. 2003. Abstr. P05005. P. 67.

71. Balakin K.V. DMSO solubility and bioscreening // Current Drug Disc. 2003. № 8. P. 27-30.

72. Lerner В., Guterman H., Aladjem M., Dinstein I. A Comparative study of neural network based feature extraction paradigms // Pattern Recognit. Lett. 1999. V. 20. P. 7-14.

73. Lerner В., Guterman H., Dinstein I., Romem Y. Medial axis transform based features and a neural network for human chromosome classification//Pattern Recognit. 1995. V. 28. № 11. P. 1673- 1683.

74. Sadowski J., Wagener M., Gasteiger J. Assessing similarity and diversity of combinatorial libraries by spatial autocorrelation functions and neural networks // Angew. Chem., Int. Ed. Engl. 1995. V. 34. P. 2674-2677.

75. Gedeck P., Willett P. Visual and computational analysis of structure-activity relationships in high-throughput screening data // Curr. Opin. Chem. Biol. 2001. V. 5. №4. P. 389-395.

76. Toronen P., Kolehmainen M., Wong G., Castren E. Analysis of gene expression data using self-organizing maps //FEBS Lett. 1999. V. 451. № 2. P. 142-146.

77. Rassokhin D.N., Agrafiotis D.K. A modified update rule for stochastic proximity embedding // J. Mol. Graphics Modell. 2003. V. 22. P. 133-140.

78. Demartines P., Herault J. Curvilinear component analysis: a self-organizing neural network for nonlinear mapping of data sets // IEEE Trans. Neural Netw. 1997. V. 8. № 1. P. 148-154.

79. Ivanenkov Y.A., Balakin K.V., Skorenko A.Y., Tkachenko S.E., Savchuk N.P., Ivachtchenko A.A. Nikolsky Y. Application of advanced machine learning algorithm for profiling specific GPCR-active compounds// Chem. Today. 2003. V. 21. № 6. P. 72-75.

80. Ivachtchenko A., Okun I., Tkachenko S., Kiselyov A., Ivanenkov Y., Balakin K. Non-peptide small molecule inhibitors of caspases // In Design of caspase inhibitors as potential clinical agents / Taylor & Francis Group. 2007. 299 P.

81. Balakin K.V., Ivanenkov Y.A., Kiselyov A.S., Tkachenko S.E. Histone deacetylase inhibitors in cancer therapy: Latest developments, trends and medicinal chemistry perspective // Anti-Cancer Agents Med. Chem. 2007. V. 7. № 5. P. 576-592.

82. Ivanenkov Y.A., Balakin K.V., Tkachenko S.E. New approaches to the treatment of inflammatory disease: focus on small-molecule inhibitors of signal transduction pathways // Drugs RD. 2008. V. 9. № 6. P. 397-434.

83. Lavrovsky Y., Ivanenkov Y.A., Balakin K.V., Medvedeva D.A., Ivachtchenko A.V. CXCR4 receptor as a promising target for oncolytic drugs // Mini. Rev. Med. Chem. 2008. V. 8. № 11. P. 1075-1087.

84. Balakin K.V., Ivanenkov Y.A., Tkachenko SE, Kisclyov AS, Ivachtchcnko AV. Regulators of chemokine receptor activity as promising anticancer therapeutics // Curr. Cancer Drug Targets. 2008. V. 8. № 4. P. 299-340.

85. Ekins S., Balakin K.V., Savchuk N., Ivanenkov Y. Insights for human ether-a-go-go-relatedgene potassium channel inhibition using recursive partitioning and Kohonen and Sammon mapping techniques // J. Med. Chem. 2006. V. 49. № 17. P. 5059-5071.

86. Kiselyov A., Tkachenko S.E., Balakin K.V., Ivachtchenko A.V. Small molecule modulators of 5 Hh and Wnt signaling pathways // Expert Opinion. 2007. V. 11. № 8. P. 1087-1101.

87. Kiselyov A.S., Milligan D., Ouyang X. Novel inhibitors of VEGF receptors-1 and -2 based on azole-5-carboxamide templates // Bioorg. Med. Chem. Lett. 2007. V. 17. № 13. P. 3550-3557.

88. Rosenblatt R. The Perceptron: A probabilistic model for information storage and organization in the brain // Psychological Review. 1958. V. 65. P. 386-408.

89. Ritter H. Self-organizing feature maps: Kohonen maps II In The handbook of brain theory and 5 neural networks /MIT Press. 1995. P. 846-851.

90. Kaas J.H., Merzenich M.M., Killackey H.P. The reorganization of somatosensory cortexfollowing peripheral nerve damage in adult and developing mammals // Annual Review of Neurosciences. 1983. V. 6. P. 325-356.

91. Hubel D.H., Wiesel T.N. Functional architecture of macaque visual cortex // Proceedings of the Royal Society. 1977. V. 198. P. 1-59.

92. Neuroscience. 1987. V. 10. P. 41-65.

93. Willshaw, D.J., von der Malsburg C. Flow patterned neural connexions can be set up by selforganisation // Proc. Roy. Soc. B. 1976. V. 194. P. 431-445.

94. Networks. 1991. V. 2. P. 427-436.1115. Luttrell S.P. Self-organization: A derivation from first principle of a class of learning algorithms

95. II IEEE Conference on Neural Networks. Washington, DC. 1989. P. 495-498.I

96. Coleman M. Fluman drug metabolism: an introduction / John Wiley and Sons. 2010.360 P.ii 117. Erhardt P.W. Drug metabolism: Drug metabolism data: past, present and future considerations //I

97. Drug metabolism / Cambridge: University Press. 1999. P. 17-22.t

98. Bodor N. Retrometabolic approaches for drug design and targeting // Die Pharmazie. 1997. V. 52. P. 491-499.

99. Deutsch H.M., Glinski J.A., Hernandez M., Haugwitz R.D., Narayanan V.L., Suflhess M., Zalkow L.H. Synthesis of congeners and prodrugs. Water-soluble prodrugs of taxol with potent antitumor activity // J. Med. Chem. 1989. V. 32. № 4. P. 788-792.

100. Hwang S.K, Juhasz A., Yoon S.II, Bodor N. Soft drugs. Design, synthesis, and-evaluation of soft bufuralol analogues // J. Med. Chem. 2000. Y. 43. № 8. P. 1525-1532.

101. Ioannides C., Cytochromes P450: Metabolic and toxicological aspects / CRC Press. 1996. 411 P.

102. Celeste L.M. Cytochrome P450: Biochemistry, biophysics and molecular biology / John Libbey Eurotext.-1994.916P.

103. Smith D.A, van de Waterbeemd H, Walker D.K, Mannhold R, Kubinyi H, Timmerman H. Pharmacokinetics and metabolism in drug design / Wiley-VCH. 2001. 187 P.

104. Граник В.Г. Основы медицинской химии / Москва. Вузовская книга. 2001. 384 С.

105. Randall P.I., Shephard Е.А. Cytochrome Р450 protocols / Humana Press. 2006. 363 P.

106. Klaassen C. Casarett and Doull's toxicology: the basic science of poisons / McGraw-Hill Professional. 2007. 1280 P.

107. Gillis A.M, Kates R.E. Clinical pharmacokinetics of the newer antiarrhythmic agents // Clin. Pharmacokinet. 1984. V. 9. № 5. P. 375-403.

108. Rodrigues A.D. Use of in vitro metabolism studies in drug development: an-industrial perspective//Biochem. Pharmacol. 1994. V. 48. P. 2147-2156.

109. Балакин K.B., Иваненков Я.А. Компьютерные методы прогнозирования метаболизма физиологически активных веществ // Биомедицинская Химия. 2004. Т. 51. № 2. С. 384-413.

110. Balakin K.Y., Ivanenkov Y.A., Ivashchenko А.А., Savchuk N.P., Nikolsky Y.V. Prediction ofcompounds' binding affinity to the active sites of human cytochromes: a 3D pharmacophore andth

111. Kohonen self-organizing map-based model // SBS 9 Annual Conference and Exhibition. Portland, USA. September, 2003.

112. Savchuk N.P., Balakin K.V., Nikolsky Y., Ivanenkov Y.A., Skorenko A.V., Ivashchenko A.A. In silico ADME/Tox methods as part of a rational lead optimization strategy // Drug Discovery Technology Europe 2003. Stuttgart, Germany. March 31 April 03,2003.

113. Balakin K.V., Ivanenkov Y.A., Savchuk N.P., Ivashchenko A.V. Computation approaches for early assessment of drug binding affinities to plasma proteins and cytochromes P450 // Drug Disc. Techn. Congress, Boston, MA, USA. Aug 8-13, 2004.

114. Nassar A.F., Hollenberg P.F., Scatina J. Drug metabolism handbook: concepts and applications / John Wiley and Sons. -2009.1041 P.

115. Smith D.A., van de Waterbeemd H., Walker D.K. Pharmacokinetics and metabolism in drug design / Wiley-VCH. 2006. 187 P.

116. Ekins S. In silico approaches to predicting drug metabolism, toxicology and beyond // Biochem. Soc. Trans. 2003. V. 31. P. 611-614.

117. Cruciani G., Meniconi M., Carosati E., Zamora I., Mannhold R. Drug bioavailability: VOLSURF: a tool for drug ADME-properties prediction // In Drug bioavailability / Wiley-VCH. -2003. P. 406-419.

118. Shen M., Xiao Y., Golbraikh A., Gombar V.K., Tropsha A. Development and validation of k-nearest-neighbor QSPR models of metabolic stability of drug candidates // J. Med. Chem. 2003. V. 46. №14. P. 3013-3020.

119. Ekins S., de Groot M.J., Jones J.P. Pharmacophore and three-dimensional quantitative structure activity relationship methods for modeling cytochrome P450 active sites // Drug Metab. Dispos. 2001. V. 29. №7. P. 936-944.

120. Ekins S., Berbaum J., Harrison R.K. Generation and validation of rapid computational filters for CYP2D6 and CYP3A4//Drug Metab. Dispos. 2003. V. 31. № 9. P. 1077-1080.

121. Lewis D.F., Modi S., Dickins M. Structure-activity relationship for human cytochrome P450 substrates and inhibitors // Drug Metab. Rev. 2002. V. 34. № 1-2. P. 69-82.

122. Smith D.A., Ackland M.J., Jones B.C. Properties of cytochrome P450 isoenzymes and their substrates Part 1: active site characteristics // Drug Disc. Today. 1997. V. 2. № 10. P. 406-414.

123. Smith D.A., Ackland M.J., Jones B.C. Properties of cytochrome P450 isoenzymes and their substrates Part 2: properties of cytochrome P450 substrates // Drug Disc. Today. 1997. V. 2. № 10. P. 479-486.

124. Мари P., Греннер Д., Мейес П., Родуэлл В. Биохимия человека / Москва. Мир. 1993. Т. 1.384 С.

125. Lewis D.F., Eddershaw P. J., Dickins M., Tarbit M.I I., Goldfarb P.S. Structural determinants of cytochrome P450 substrate specificity, binding affinity and catalytic rate // Chem. Bio. Interact. 1998. V. 115.№3.P. 175-199.

126. Jones S.A., Moore L.B., Wisely G.B., Kliewer S.A. Use of in vitro pregnane X receptor assays to assess CYP3A4 induction potential of drug candidates //Methods Enzymol. 2002. V. 357. P. 161170.

127. Darvas F. Predicting metabolic pathways by logic programming // J. Mol. Graphics. .1988. V. 6. P.80-86.

128. Mulder G.J. Conjugation reactions in drug metabolism / Taylor & Francis. 1990.413 P.

129. Hayashi S., Watanabe J., Kawajiri K. Genetic polymorphisms in the 5'-flanking region change transcriptional regulation of the human cytochrome P450IIE1 gene // J. Biochem. 1991. V. 110. P. 559-565.

130. Hansch C. Quantitative relationships between lipophilic character and drug metabolism // Drug Metab. Rev. 1972. V. l.P. 1-14.

131. Borodina Y., Sadym A., Filimonov D., Blinova V., Dmitriev A., Poroikov V.J. Predicting biotransformation potential from molecular structure // J. Chem. Inf. Comput. Sci. 2003. V. 43. № 5. 1636-1646.

132. Talele T.T., Kulkarni V.M. Three-dimensional quantitative structure-activity relationship (QSAR) and receptor mapping of cytochrome P-450 inhibiting azole antifungal agents // J. Chem. Inf. Comput. Sci. 1999. V. 39. № 2. P. 204-210.

133. Jones B.C., Hawksworth G., Home V.A., Nevvlands A., Morsman J., Tute M.S., Smith D.A. Putative active site template model for cytochrome P4502C9 (tolbutamide hydroxylase) // Drug Metab. Dispos. 1996. V. 24. № 2. P. 260-266.

134. Ekins S., Bravi G., Wikel J.H., Wrighton S.A. Three-dimensional-quantitative structure activity relationship analysis of cytochrome P-450 3A4 substrates // J. Pharmacol. Exp. Ther. 1999. V. 291. № 1. P. 424-433.

135. Szklarz G.D, Paulsen M.D. Molecular modeling of cytochrome P450 1A1: enzyme-substrate interactions and substrate binding affinities // J. Biomol. Struct. Dyn. 2002. V. 20. № 2. P. 155-162.

136. Long A., Walker J.D. Quantitative structure-activity relationships for predicting metabolism and modeling cytochrome P450 enzyme activities // Environ. Toxicol. Chem. 2003. V. 22. № 8. P. 18941899.

137. Buchwald P., Bodor N. Quantitative structure-metabolism relationships: steric and nonsteric effects in the enzymatic hydrolysis of noncongener carboxylic esters // J. Med. Chem. 1999. V. 42. № 25. P. 5160-5168.

138. Darvas F., Dormán G., Papp A. Diversity measures for enhancing ADME admissibility of combinatorial libraries // J. Chem. Inf. Comput. Sci. 2000. Y. 40. № 2. P. 314-322.

139. Ekins S., Ring B J., Binkley S.N., Hall S.D., Wrighton S.A. Autoactivation and activation of the cytochrome P450s // Int. J. Clin. Pharmacol. Ther. 1998. V. 36. № 12. P. 642-651.

140. Ito K., Iwatsubo T., Kanamitsu S., Ueda K., Suzuki H., Sugiyama Y. Prediction of pharmacokinetic alterations caused by drug-drug interactions: metabolic interaction in the liver // Pharm. Rev. 1998. V. 50. № 3. P. 387-411.

141. Thummel K.E., Wilkinson G.R. In vitro and in vivo drug interactions involving CYP3A // Ann. Rev. Pharmacol. Toxicol. 1998. V. 38. P. 389-430.

142. Manners C.N., Pay ling D.W., Smith D.A. Distribution coefficient, a convenient term for the relation of predictable physico-chemical properties to metabolic processes // Xenobiotica. 1988. V. 18.№3. P. 331-350.

143. Dohgu S., Banks W.A. Lipopolysaccharide-enhanced transcellular transport of FHV-1 across the blood-brain barrier is mediated by the p38 mitogen-activated protein kinase pathway // Exp. Neurol. 2008. V. 210. № 2. P. 740-749.

144. Brodie B.B., Kurz PI., Schanker L.S. The importance of dissociaton constant and lipid-solubility in influencing the passage of drugs into the cerebrospinal fluid // J. Pharmacol. Exp. Ther. 1960. V. 130. P. 20-25.

145. Plansch C., Bjorkroth J.P., Leo A. Hydrophobicity and central nervous system agents: on the principle of minimal hydrophobicity in drug design // J. Pharm. Sci. 1987. V. 76. № 9. P. 663-687.

146. Fu X.C., Wang G.P., Shan PI.L., Liang W.Q., Gao J.Q. Predicting blood-brain barrier penetration from molecular weight and number of polar atoms // Eur. J. Pharm. Biopharm. 2008. V. 70. №2. P. 462-466.

147. Hammarlund-Udenaes M., Paalzow L.K., de Lange E.C. Drug equilibration across the blood-brain barrier pharmacokinetic considerations based on the microdialysis method // Pharm. Res. 1997. V. 14. №2. P. 128-134.

148. Oprea T.I., Davis A.M., Teague S J., Leeson P.D. Is there a difference between leads and drugs? A historical perspective//! Chem. Inf. Comput. Sci. 2001. V. 41. № 5. P. 1308-1315.

149. Lipinski C.A., Lombardo F., Dominy B.W., Feeney P.J. Experimental and computational approaches to estimate solubility and permeability in drug discovery and development settings // Adv. Drug Delivery Rev. 2001. V. 46. № 1-3. P. 3-26.

150. Ecker G., Chiba P., Mannhold R. Transporters as drug carriers: structure, function, substrates / Wiley-VCH, 2009.449 P.

151. Ajay A, Walters W.P, Murcko M.A. Can we learn to distinguish between "drug-like" and "nondrug-like" molecules?//J. Med. Chem. 1998. V. 41. № 18. P. 3314-3324.

152. Sadowski J, Kubinyi H. A scoring scheme for discriminating between drugs and nondrugs // J. Med. Chem. 1998. V. 41. № 18. P. 3325-3329.

153. Соловьев М.Ю, Филимонов С.И, Скоренко А.В, Иваненков Я.А, Балакин К.В, Дорогов М.В. Синтез, строение и свойства ряда 3-сульфамидных производных пиридина // Изв. ВУЗов. Химия и Хим. Техн. 2004. Т. 47. № 2. С. 28-36.

154. Balakin K.V, Konarkowski Н.А.Е, Skorenko A.V, Stepanov V.A, Lang S.A, Ivashchenko A.A, Savchuk N.P. Blood-brain barrier permeability modeling using machine learning technologies // LaborWelt. 2002. № 4. P. 24-25.

155. Balakin K.V, Savchuk N. Advanced data mining techniques // Manufact. Chem. 2004. V. 75. №7. P. 31-33.

156. Balakin K.V, Ivanenkov Y.A, Ivashchenko A.A, Savchuk N.P.' Modeling blood-brain barrier partitioning using unsupervised learning approach // Drug Science & Technology Summit. New York, USA. 2003. March 30 April.01.

157. Barrett К.Е, Johnson L.R, Ghishan F.K, Merchant J.L, Said H.M, Wood J.D. Physiology of the gastrointestinal tract, volume 1 / Academic Press. 2006.2080 P.

158. Harrison A.P, Erlwanger K.H, Elbrond V.S, Andersen N.K, Unmack M.A. Gastrointestinal-tract models and techniques for use in safety pharmacology // J. Pharmacol. Toxicol. Methods. 2004. V. 49. №3. P. 187-199.

159. Kobiler D, Lustig S, Shapira S. Blood-brain barrier: drug delivery and brain pathology / Springer.-2001.434 P.

160. Norinder U, Haeberlein M. Computational approaches to the prediction of the blood-brain distribution//Adv. Drug. Del. Rev. 2002. V. 54. №3. P. 291-313.

161. Yoshida F, Topliss J.G. QSAR model for drug human oral bioavailability // J. Med. Chem. 2000. V. 43. № 13. P. 2575-2585.

162. Clark D.E. Rapid calculation of polar molecular surface area and its application to the prediction of transport phenomena. 1. Prediction of intestinal absorption // J. Pharm. Sci. 1999. V. 88. № 8. P. 807-814.

163. Norinder U, Osterberg T, Artursson P. Theoretical calculation and prediction of intestinal absorption of drugs in humans using MolSurf parameterization and PLS statistics // Eur. J. Pharm. Sci. 1999. V. 8. №1. P. 49-56.

164. Kelder J., Grootenhuis P.D., Bayada D.M., Delbressine L.P., Ploemen J.P. Polar molecular surface as a dominating determinant for oral absorption and brain penetration of drugs // Pharm. Res. 1999. V. 16. № 10. P. 1514-1519.

165. Crivori P., Cruciani G., Carrupt P.A., Testa B. Predicting blood-brain barrier permeation from three-dimensional molecular structure // J. Med. Chem. 2000. V. 43. № 11. P. 2204-2216.

166. Brewster M.E., Pop E., Huang M-J., Bodor N. AMl-based model system for estimation of brain/blood concentration ratios // Int. J. Quantum Chem. 1996. V. 60. P. 51-63.

167. Avdeef A. Physicochemical profiling (solubility, permeability and charge state) // Curr. Top. Med. Chem. 2001. V. 1. № 4. P. 277-351.

168. Clark D.E., Grootenhuis P.D. Progress in computational methods for the prediction of ADMET properties // Curr. Opin. Drug Discov. Devel. 2002. V. 5. № 3. P. 382-390.

169. Raevsky O.A., Schaper K.J., Artursson P., McFarland J.W. A novel approach for prediction of intestinal absorption of drugs in humans based on hydrogen bond descriptors and structural similarity // Quant. Struct. Act. Relat. 2001. V. 20. P. 402-413.

170. Niwa T. Using general regression and probalistic neural networks to predict human intestinal absorption with topological descriptors derived from two-dimensional chemical structures // J. Chem. Inf. Comp. Sci. 2003. V. 43. № 1. P. 113-119.

171. Ekins S., Boulanger B., Swaan P.W., Hupcey M.A. Towards a new age of virtual ADME/TOX and multidimensional drug discovery // J. Comput. Aided Mol. Des. 2002. V. 16. № 5-6. P.' 381-401.

172. Thummel K., Shen D.D. Design and optimization of dosage regimens: pharmacokinetic data // In Goodman and Gilman's the pharmacological basis of therapeutics / McGraw-Hill. 2001. P. 19242023.

173. Penzotti J.E., Lamb M.L., Evenson E., Grootenhuis P.D. A computational ensemble pharmacophore model for identifying substrates of P-glycoprotein // J. Med. Chem. 2002. V. 45. № 9. P. 1737-1740.

174. Ekins S., Kim R.B., Leake B.F., Dantzig A.H., Schuetz E., Lan L.B., Yasuda K., Shepard R.L. Three-dimensional quantitative structure-activity relationships of inhibitors of P-glycoprotein // Mol. Pharmacol. 2002. V. 61. № 5. P. 964-973.

175. Guttmann L. Some necessary conditions for common factor analysis // Psychometrika. 1954. V. 19. №2. P. 149-161.

176. Catell R.B. The scree test for the number of factors // Multi Behav. Res. 1966. V. 1. № 2. P. 245276.

177. Tozer T.N., Malcolm R. Introduction to pharmacokinetics and pharmacodynamics: the quantitative basis of drug therapy // Lippincott Williams & Wilkins. 2006.326 P.

178. Benet L.Z., Oie S., Schwartz J.B. Design and optimization of dosage regimens; pharmacokinetic data II In Goodman and gillman's the pharmacological basis for therapeutics / McGraw-Hill. 1995. P. 1707-1792.

179. Smith D.A., Jones B.C., Walker D.K. Design of drugs involving the concepts and theories of drug metabolism and pharmacokinetics // Med. Res. Rev. 1996. V. 16. № 3. P. 243-266.

180. Mason R.P., Rhodes D.G., Herbette L.G. Reevaluating equilibrium and kinetic binding parameters for lipophilic drugs based on a structural model for drug interaction with biological membranes //J. Med. Chem. 1991. V. 34. № 3. P. 869-877.

181. Foulds G., Shepard R.M., Johnson R.B. The pharmacokinetics of azithromycin in human serum and tissues // J. Antimicrob. Chemother. 1990. V. 25. P. 73-82.

182. Fowle W.A., Butz A.S.E., Jones E.C., Waetherly B.C., Welch R.M., Posner J. Comparative disposition of codeine and pholcodine in man after single oral doses // Br. J. Clin. Pharmacol. 1986. V. 22. № 1. P'61-71.

183. Cook C.S., McDonald S.J., Karim A. Importance of pharmacokinetic and physicochemical data in the discovery and development of novel anti-arrhythmic drugs // Xenobiotica. 1993. V. 23. № 11. P. 1299-1309.

184. Pharm D., Murphy J.E. Clinical pharmacokinetics, 4th ed. / ASIIP. 2008.488 P.

185. Haller M., Akbulut C., Brechtelsbauer PI., Fett W., Briegel J., Finsterer U., Peter K. Determination of plasma volume with indocyanine green, in man // Life Sci. 1993. V. 53. № 21. P. 1597-1604.

186. Schoenwald R.D. Pharmacokinetics in drug discovery and development // CRC Press. 2002. 440 P.

187. Weiss M., Krejcie T.C., Avram M.J. Circulatory transport and capillary-tissue exchange as determinants of the distribution kinetics of inulin and antipyrine in dog // J. Pharm. Sci. 2007. V. 96. №4. P. 913-926.

188. Walker D.K., Humphrey M.J., Smith- D.A. Importance of metabolic stability and hepatic distribution to the pharmacokinetic profile of amlodipine // Xenobiotica. 1994. V. 24. № 3. P. 243250.

189. Spruill V.J., Blouin R.A., Pruemer J.M., Wade V.E., DiPiro J.T. Concepts in clinical pharmacokinetics, 5th ed. / ASIIP. 2010.250 P.

190. Lombardo F., Obach R.S., Shalaeva M.Y., Gao F. Prediction of volume of distribution values in humans for neutral and basic drugs using physicochemical measurements and plasma protein binding data// J. Med. Chem. 2002. V. 45. № 13. P. 2867-2876.

191. Balakin K.V., Ivanenkov Y.A., Savchuk N.P., Ivachtchenko A.A., Ekins S. Comprehensive computational assessment of ADME properties using mapping techniques // Curr. Drug Disc. Techn. 2005. V. 2. P. 99-113.

192. Colmenarejo G., Alvarez-Pedraglio A., Lavandera J.-L. Cheminformatic models to predictbinding affinities to human serum albumin // J. Med. Chem. 2001. V. 44. № 25. P. 4370-4378.

193. Saiakhov R., Stefan L.R., Klopman G. Multiple computer-automated structure evaluation model of the plasma protein binding affinity of diverse drugs // Persp. Drug Disc. Design. 2000. V. 19. № 1. P.133-155.

194. Hein K.L., Kragh-Hansen U., Morth J.P., Jeppesen M.D., Otzen D., Möller J.V., Nissen P. Crystal structure of human serum albumin complexed with Lidocaine // J. Struct. Biol. 2010. V. 171. №3. P. 353-360.

195. Zunszain P.A., Ghuman J., McDonagh A.F., Curry S. Crystallographic analysis of human serum albumin complexed with 4Z,15E-bilirubin-IXalpha // J. Mol. Biol. 2008. V. 381. № 2. P. 394-406.

196. Yang F., Bian C., Zhu L., Zhao G., Huang Z., Huang M. Effect of human serum albumin on drug metabolism: structural evidence of esterase activity of human serum albumin // J. Struct. Biol. 2007. V. 157. № 2. P. 348-3455.

197. Ghuman J., Zunszain P.A., Petitpas I., Bhaltachaiya A.A., Otagiri M., Curry S. Structural basis of the drug-binding specificity of human serum albumin // J. Mol. Biol. 2005. V. 353. № 1. P. 38-52.

198. Peters T.Jr. All about albumin: biochemistry, genetics, and medical applications // Academic Press. 1995.432 P.

199. Zunszain P.A., Ghuman-J., Komatsu T., Tsuchida E., Curry S. Crystal structural analysis of human serum albumin complexed with hemin and fatty acid // BMC Struct. Biol. 2003. Y. 3. P. 6.

200. Rajbar S. An abnormal hemoglobin in red cells of diabetics // Clin. Chim. Acta. 1968. V. 22. № 2. P. 296-298.

201. Day J.F., Thorpe S.R., Baynes J.W. Nonenzymatically glucosylated albumin. In vitro preparation and isolation from normal human serum // J. Biol. Chem. 1979. V. 254. № 3. P. 595-597.

202. Iberg N., Flückiger R. Nonenzymatic glycosylation of albumin in vivo. Identification of multiple glycosylated sites//J. Biol. Chem. 1986. V. 261. №29. P. 13542-13545:

203. Jakus V., ITrnciarova M., Cärsky J., Krahulec B., Rietbrock N. Inhibition of nonenzymatic protein glycation and lipid peroxidation by drugs with antioxidant activity // Life Sei. 1999. V. 65. № 18-19. P. 1991-1993.

204. Ickstein H., Wolff D., Stange J., Frei E., Härtung G. Prolonged survival of renal allograft in rats by methotrexate-albumin conjugates as immunosuppressive therapy // Transplant Proc. 2008. V. 40. № 10. P. 3725-3727.

205. Yamazaki K., Kanaoka M. Computational prediction of the plasma protein-binding percent of diverse pharmaceutical compounds // J. Pharm. Sei. 2004. V. 93. № 6. P. 1480-1494.

206. Kratochwil N.A., Huber W., Muller F., Kansy M., Gerber D. Predicting plasma protein binding of drugs: anew approach//Biochem. Pharmacol. 2002. V. 64. JM° 9. P. 1355-1374.

207. Rodgers S.L., Davis A.M., Tomkinson N.P., van de Waterbeemd H. QSAR modeling using automatically updating correction libraries: application to a human plasma protein binding model // J. Chem. Inf. Model. 2007. V. 47. № 6. P. 2401-2407.

208. Andrews C.W., Bennett L., Yu L.X. Predicting human oral bioavailability of a compound: development of a novel quantitative structurebioavailability relationship // Pharm. Res. 2000. V. 17. №6. P. 639-644.

209. Kerns E. Drug-like properties: concepts, structure design and methods: from adme to toxicity optimization // Academic Press. 2008. 552 P.

210. Binghe W. Drug delivery: principles and applications / Wiley-Interscience. — 2005.464 P.

211. Beverly A. Teicher cancer drug resistance / Humana Press. 2006. 640 P.

212. Zhang E.Y., Phelps M.A., Cheng C., Ekins S., Swaan P.W. Modeling of active transport systems // Adv. Drug Del. Rev. 2002. V. 54. № 3. P. 329-354.

213. Stouch T.R., Gudmundsson O. Progress in understanding the structure-activity relationships of P-glycoprotein // Adv. Drug Del. Rev. 2002. V. 54. № 3. P. 315-328.

214. Pajeva I.K., Wiese M. Pharmacophore model of drugs involved in P-glycoprotein multidrug resistance: explanation of structural variety // J. Med. Chem. 2002. V. 45. № 26. P. 5671-5686.

215. Langer T., Eder M., Hoffmann R.D., Chiba P., Ecker G.F. Lead identification for modulators of multidrug resistance based on in silico screening with a pharmacophoric feature model // Arch. Pharm. 2004. V. 337. № 6. P. 317-327.

216. Pajeva I.K., Globisch C., Wiese M. Structure function relationships of multidrug resistance P-glycoprotein // J. Med. Chem. 2004. V. 47. № 10. P. 2523-2533".

217. Garrigues A., Loiseau N., Delaforge M., Ferte J., Garrigos M., Andre F., Orlowski S. Characterization of two pharmacophores on the multidrug transporter P-glycoprotein // Mol. Pharmacol. 2002. V. 62. № 6. P. 1288-1298.

218. Cronin M.T. Computer-aided prediction of drug toxicity and metabolism // Exp. Suppl. 2003. V. 93. P. 259-278.

219. Savchuk N.P., Balakin K.V. Data mining approaches for enhancement of knowledge-based content of de novo chemical libraries // In Virtual screening in drug discovery / CRC Press. 2005. P. 121-149.

220. Chekmarev D.S., Kholodovych V., Balakin K.V., Ivanenkov Y., Ekins S., Welsh W.J. Shape signatures: New descriptors for predicting cardiotoxicity in silico // Chem. Res. Toxicol. 2008. V. 21. №6. P. 1304-14.

221. Cronin M.T. The current status and future applicability of quantitative structure-activity relationships (QSARs) in predicting toxicity // Altern. Lab. Anim. Suppl. 2002. V. 2. P. 81-84.

222. King A.V., Jones P.A. In-house assessment of a modified in vitro cytotoxicity assay for higher throughput estimation of acute toxicity // Toxicol. In Vitro. 2003. V. 17. № 5-6. P. 717-722.

223. Schneider G., Baringhaus K-H. Molecular design: concepts and applications / Wiley-VCPI. -2008. 262 P.

224. Балакин К.В., Иваненков Я.А., Иващенко А.А. Компьютерные методы прогнозирования мишень-специфической активности в разработке новых прошвоопухолевых соединений // Психофармакология и биологическая наркология. 2007. Т. 7. № 4. С. 1598.

225. Selzer P., Ertl P. Applications of self-organizing neural networks in virtual screening and diversity selection//J. Chem. Inf. Model. 2006. V. 46. № 6. P. 2319-2323.

226. Балакин K.B., Иваненков Я.А., Скоренко A.B., Коваленко С.Н., Журавель И.А., Черных В.П. Построение классификационной модели для виртуального скрининга ингибиторов тирозиновых киназ // Журн. Орг. Фарм. Хим. 2004. Т. 2. № 4. С. 48-53.

227. Savchuk N.P., Tkachenko S.E., Balakin K.V. Rational design of GPCR-specific combinatorial libraries based on the concept of privileged substructures / In Cheminformatics in drug discovery / Wiley VCH. 2004. P. 287-313.

228. Балакин К.В., Иваненков Я.И., Бовина Е.В. Методы нелинейного картирования для прогнозирования фармакологических свойств химических соединений // Тезисы докладов на УП Всероссийской конференции с Молодежной научной школой. УФА, 2009 г. 1-5 шоля. С. 7.

229. Trepalin S.V., Gerasimenko V.A., Kozyukov A.V., Savchuk N.P., Ivashchenko А.А. New diversity calculations algorithms used for compound selection // J. Chem. Inf. Comput. Sci. 2002. V. 42. №2. P. 249-258.

230. Catell R.B, Vogelmann S. A comprehensive trial of the Scree and KG-Criteria for determining the number of factors // Multi. Behav. Res. 1977. V. 12. P. 289-325.

231. Anzali S, Gasteiger J, Holzgrabe U, Polanski J, Sadowski J, Teckentrup A, Wagener M. The use of self-organizing neural networks in drug design // In 3D QSAR in drug design, vol. 2 / Dordrecht: Kluwer(ESCOM). 1998. P. 273-299.

232. Brustle M., Beck В., Schindler T., King W„ Mitchell T., Clark T. Descriptors, physical properties, and drug-likeness // J. Med. Chem. 2002. V. 45. № 16. P. 3345-3355.

233. Ghosh P, Bagchi M.C. QSAR modeling for quinoxaline derivatives using genetic algorithm and simulated annealing based feature selection // Curr. Med. Chem. 2009. V. 16. № 30. P. 4032-4048.

234. Spencer E.H. Development of a structure prediction method for G-protein coupled receptors / Thesis. California Institute of Technology, Pasadena, CA. 2005.

235. Кравченко Д.В, Иваненков Я.А, Балакин К.В, Кисиль В.М, Ткаченко С.Е, Окунь И.М, Иващенко А.В. Дизайн и синтез новых непептидных ингибиторов каспазы-3 // Химико-фармацсвгический журнал. 2006. Т. 3. С. 125-129.

236. Волкова Т.Г, Балакин К.В, Иваненков Я.А, Клюев М.В. Прогнозирование биологической активности структурных аналогов бензилиденанилина // Жидкие кристаллы и их практическое использование. 2010. Т. 3. С. 57-63.к A с/