Бесплатный автореферат и диссертация по биологии на тему
Компьютерный анализ сходства фармакологических веществ с эндогенными биорегуляторами рецепторного действия и их синтетическими аналогами
ВАК РФ 03.00.04, Биохимия

Автореферат диссертации по теме "Компьютерный анализ сходства фармакологических веществ с эндогенными биорегуляторами рецепторного действия и их синтетическими аналогами"

РОССИЙСКАЯ АКАДЕМИЯ МЕДИЦИНСКИХ НАУК

НАУЧНО-ИССЛЕДОВАТЕЛЬСКИЙ ИНСТИТУТ БИОМЕДИЦИНСКОЙ ХИМИИ

На правах рукописи БОРОДИНА Юлия Владиленовна

КОМПЬЮТЕРНЫЙ АНАЛИЗ СХОДСТВА ФАРМАКОЛОГИЧЕСКИХ ВЕЩЕСТВ С ЭНДОГЕННЫМИ БИОРЕГУЛЯТОРАМИ РЕЦЕПТОРНОГО ДЕЙСТВИЯ И ИХ СИНТЕТИЧЕСКИМИ АНАЛОГАМИ

Специальность 03.00.04 — Биохимия

Автореферат диссертации на соискание ученой степени кандидата биологических наук

Москва 1998

Работа выполнена в Институте биомедпшшской ли.мни Российской Академии медицинских наук.

Научный руководитель доктор биологических наук, профессор В. В. Поройков.

Научный -консультант кандидат физико-математических наук Д. Л. Филимонов.

Официальные оппоненты: доктор биологических наук, профессор А. С. Иванов, кандидат химических наук В. А. Палюлин.

Ведущая организация: Институт молекулярной биологин им. В. А. Энгельгардта РАН.

Защита состоится « . » . _ 1998 г

ъ Л1. час. мин. на заседании диссертационного совета

Д.001.10.01 при НИИ биомедицинской химии РАМН .по адресу: 119832, Москва, ул. Погодинская, д. 10.

С диссертацией можно ознакомиться в библиотеке Института.

Автореферат разослан « . » 1998 года

Ученый секретарь диссертационного совета

кандидат биологических наук В. С. Былинкинэ.

АКТУАЛЬНОСТЬ ПРОБЛЕМЫ

В последнее время интенсивно ведутс.ч разработки новых стратегий создания лекарственных препаратов на основе исследования взаимодействия биологически активных веществ с определенными рецепторами, ферментами или ионными каналами. Ежегодно открываются новые механизмы действия лекарственных соединений. Современная классификация выделяет 130 видов рецепторов, различающихся по биохимической специфичности, механизмам передачи сигнала в клетку и аминокислошым последовательностям (TiPS Receptor and Ion Channel Nomenclature Supplement, 1996). В ряде случаев одни и те же фармакологические эффекты могут быть вызваны действием на различные клеточные рецепторы. С другой стороны, взаимодействие химического соединения с несколькими рецепторами может уменьшать эффекты, вызванные его действием на каждый из них ио-отделыюсти. Таким образом, предсказание возможных рецепторных механизмов действия исследуемого соединения важно для создания лекарства с требуемым набором фармакологических эффектов.

Структурное сходство . потенциального лекарственного препарата с высокоселективным эндогенным или экзогенным лигандом позволяет предполагать как аналогичные механизмы их действия, так и возможные неблагоприятные эффекты, вызнанные нарушением регулирования в соответствующей цепи биохимических реакций.

Компьютерный анализ сходства веществ позволяет выдвинуть обоснованные предположения о необходимости определенно! о набора тестов для оценки эффективности и безопасности действия конкретного соединения (Гор]iss J.G., 1995). С другой стороны, необходимость разработки методов прямой оценки сходства с эндогенными биорегуляторами (нейротрансмиттерами, медиаторами, гормонами) обусловлена неполнотой нашего знания их физиологических функций в норме и при различных патологиях.

Компьютерная оценка сходства химических соединений широко обсуждается в литературе (Dean P.M., 1995; Warr W.A., 1997; VVillet P., 1997; Lajiness M.S., 1996). С ее помощью решаются такие ixuimii, как отбор химических соединений с максимальным рагзичием из fus данных синтезированных веществ для целей скрининга или генерации новых базовых соединении (Van Gcerestein V.C., et al., 1997), создание комбинаторных библиотек (Lewis R.A, et al., 1997), иронии фишко-химичеекпх свойств (Basak. S.C. and Gmnwald G.I)., 1994) и отдельных видов биологической активности соединений (Kubinji 11., 19()7;

Good А. С., 1995). В то же время мет единого мнения о том, какой из методов является "лучшим" для анализа связи "структура-свойство", в особенности принимал во внимание разнообразие свойств химических веществ. К тому же, большинство методов анализа сходства доступны только на коммерческой основе и не могут широко использоваться российскими исследователями.

Таким образом, разработка и исследование возможностей компьютерного анализа сходства потенциальных лекарственных соединений с эндогенными и экзогенными биорегуляторами для прогноза широкого спектра биологической активности является актуальным направлением современной биохимии и биохимической фармакологии.

ЦЕЛЬ ИССЛЕДОВАНИЯ

Разработать методику комплексной компьютерной оценки сходства низкомолекулярных фармакологических веществ с эндогенными и экзогенными лигандами широкого спектра рецепторов и оценить возможности прогноза на этой основе потенциальных рецепторных механизмов действия для новых веществ.

ЗАДАЧИ ИССЛЕДОВАНИЯ

1. Разработка метода анализа сходства низкомолскулярных веществ и его программная реализация.

2. Создание базы данных селективных лигандов для широкого спектра рецепторов, включая: адрено-, холимо-, гистамино-, дофамино-, серотонино-, пуримо-, ГАМК, глутамата, глицина и другие.

3. Оценка эффективности анализа сходства с эндогенными и экзогенными лигандами для прогноза рецепторных мишеней на веществах с известной активностью.

4. Оценка сходства новых соединений различных химических классов с эндогенными и экзогенными лигандами рецепторов и и отбор веществ с заданными свойствами для поиска новых потенциальных лекарственных препаратов.

НАУЧНАЯ НОВИЗНА

Разработана оригинальная компьютерная система "SIMEST" для комплексной опенки сходства новых химических соединений с высокосслективнымн низкомолекулярными лигандами широкого спектра рецензоров, включающая в себя про!рамму анализа сходства

химических соединений и базу данных эндошнных лигандов селективных агониетов и антагонистов для 98 различных подтипов рецепторов.

Впервые; проанализированы возможности прогноза 50 рецепторных механизмов действия на оспЪве сходства химических соединений с эндогенными и экзогенными лигандами. Показано, что средняя точность прогноза рецепторных механизмов действия, составляет 87% для агонистов и 76% для апгагоннсгов них рецепторов.

Анализ сходства веществ из базы данных СЬетВпске, содержащей около 200000 соединений, с изиесшычи лпганда'ми рецепторов позволил отобрать ряд новых вешестп, перспективных для экспериментального тестирования.

ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ

Сходство потенциального лекарственного препарат с эндогенным биорегулятором позволяет предположить наличие у препарата аналогичных механизмов связывания с определенным типом рецепторов в организме человека. Диализ сходства с селективными агонистами и антагонистами данного рецептора позволяет уточнить специфичность действия исследуемого соединения по отношению к известным подтипам рецептора. Таким образом, компьютерная оценка сходства веществ дает возможность:

1. выдвинуть обоснованные предположения о возможных макромолскулярных мишенях для нового потенциального лекарственного вещества;

2. наметить определенный набор биохимических и фармакологических тестов для оценки эффективности и безопасности нового потенциального лекарственною вещества, что позволяет существенно снизить временные и финансовые затраты при поиске новых лекарственных препаратов.

Работа выполнена при поддержке ГНТП "Создание новых лекарственных средств методами химическою и биологического синтеза", направление 04 "Компьютерное конструирование новых лекарственных средств", проект 04.02.13/96.

АПРОБАЦИЯ РАБОТЫ

Основные положения диссертации были доложены на следующих симпозиумах и конференциях:

III Российском национал!.ном конгрессе "Человек и лекаретпо" (Москва, 16-20 апреля 1996 гола).

11" European Symposium on Quantitative Structure-Activity Relationships., Lausanne, September 1-6, 1996.

IV Российском национальном конгрессе "Человек и лекарство" (Москва, Х-12 апреля 19()7 гола).

WojI - hop "Quantitative modeling approaches for understanding and predicting mutagenicity and carcinogenicity", Rome, September 3-5, 1997.

V Российском национальном кошрессе "Человек и лекарство" (Москва, 21-25 апреля 1998 года).

Second International Electronic Conference on Synthetic Organic Chemistry (September 1-30, 1998).

12"' European Symposium on Quantitative Structure-Activity Relationships (Copenhagen, August 23-28, 1998).

ПУБЛИКАЦИИ

I lo материалам диссертации опубликовано 8 работ, включая 2 статьи и (i тезисов докладов.

ОБЪЕМ И СТРУКТУРА ДИССЕРТАЦИИ

Диссертация состоит из введения, литературного обзора, 5 глав, содержащих результаты собственных исследований и их обсуждение^ заключения, выводов и списка литературы, включающего "flO источников. Работа изложена на/^£'страницах машинописного текста и содержит^ рисунков и/'¿таблиц.

МАТЕРИАЛЫ И МЕТОДЫ

Для представления химической структуры использованы электрогопологические индексы и дескрипторы атомных окрестностей, предложенные Д.А. Филимоновым (1998).

Сопоставление :>ффективности разработанных нами методов оценки сходства с другими методами анализа сходства проводилось на основе данных статьи Basak S.C. and Grunwald G.D. Molecular Similarity and Risk Assessment: Analog Selection and Property Estimation Using Graph Invariants. SAR and QSAR in Environmental Research. 2, 289-307(1994).

База данных зндо1сниых биорегуляторов, их селективных агоннетов и антагонистов разработана в среде СУБД ISIS/Base 2.0 (MDL Information Systems, Inc.).

Модуль анализа сходства структур реализован как ISIS/Basc-приложенне на языке PL.

Оценка эффективности анализа сходстпа с эндогенными и экзогенными лигандами для прогноза рецепторных мишеней проводилась на 17124 биологически активных соединениях из базы данных MDDR 96.2 (MDL Information Systems, Inc.).

Оценка сходства новых структур, исследуемых с целью создания лекарственных препаратов, с эндогенными и экзогашымн лигандами и отбор перспективных для тестирования веществ проводились на основе базы данных химических образцов ChemBridge (http://www.chembridge.com), содержащей около 200000 веществ.

РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЙ

РАЗРАБОТКА МЕТОДА АНАЛИЗА СХОДСТВА ХИМИЧЕСКИХ СОЕДИНЕНИИ

Для комплексной оценки сходства потенциального лекарственного средства с набором веществ, обладающих различными видами активности и относящихся к разным химическим классам, метод анализа сходства должен одновременно удовлетворять следующим требованиям:

1. Метод должен выявлять сходство соединений, облачающих одинаковым биологическим действием (механизмы, эффекты) и различать соединения с разным биологическим действием.

2. Метод расчета сходства должен быгь достаточно быстрым для работы с большими базами данных химических соединений, содержащими 100000- 1000000 веществ.

Анализ литературы показал, что методы опенки сходсп'.а, основанные па двумерном представлении химической crpvKivpi.i вещества, наилучшим образом удовлетворяют данным требованиям (Sheridan, R. P., et al., 1996; Brown, R. D. and Martin, Y. C„ 1996; Brown R.D. and Martin Y.C, 1997; Matter II., 1997).

Нами было разработано и апробировано в компьютерных экспериментах два метода анализа сходства:

1. Оценка сходства на основе элекротопологическнч индексов, основанных на представлении структуры в виде плоскою молекулярного графа и учтывающих электронные характеристики атомов.

2. Оценка сходства на основе дескршнорон аюмныч окрестностей, основанных на специфическом фрш мешарпом описании структуры.

Оценка сходства на основе элсктротопологмчсских индексов

Представление структуры основано на матрице смежности С и матрице свойств аюмов Р. Матрица смежности состотгт из 0 и I, где С^С'иН, если атом 1 связан с атомом к. Г! матрице смежности С учитывается наличие всех связей между атомами в молекуле, включая атомы водорода, однако без учета их спецификации. Матрица свойств Р содержит численные характеристики свойств аюмов: равновесный атомный потенциал р и равновесный заряд ц, определяемые как:

Р' 2 ' 41 Ии-Ц,)^'

где: 1„ -первый потенциал ионизации атома ц На1 - энергия сродства к электрону агома т.

Паш опыт показал, что для оценки молекулярного свойства целесообразно использовать нормализованные величины:

, " , n

р, - г _ 1V г 1 ^ —2

р. = —■—; р = -лр1; °р = -2.(р1-р) ир 1 1

я, - Ц _ 1 Д 2 1V"

ч, =-; ч = ~2л; ач = ~Л(Ч1-чг

Каждая молекула характеризуется набором

электротопологических матриц {ТМ), ТМ2,...ТМптах}, определяемых как:

РТ-С"-Р

-• п=1-2.....

где: N - общее число аюмов в молекуле;

С" -.матрица С в степени п; пт1Ч- максимальная длина пути;

р - нормализованная матрица свойств, ¡л строка которой представляет

собой вектор (1, р ч ); рт - транспонированная нормализованная

матрица свойств.

Для расчета молекулярного сходства все элементы матриц

ТМ|.....ТМпл,а^, кроме первых элементов, используются как единый

набор электроюпологичсских индексов {Т1|, ТЬ,..., Ит}, т=птах*5.

Коэффициент сходства между соединениями к1 и к2 определяли

как:

1

к2) =----,

1 + ¿[ТЬ-.Х1( }-ТЕ1аС к2 > ]2

тде: Т1:!,(к1) и 11:1,(к2) - элект роюпо.югический индекс т для-соединении к! и к2 соответственно; т - обитее число индексов, равное 5*п„,..

Оценка сходства па основе подструкгуримх дескрипторов

Молекула представляется п виде набора дескрипторов многоуровневых aroMin.ix окрестностей (MNA) с помощью следующей итеративной процедуры:

1. Выделяются дескрипторы первого уровня, которые имеют вид сА(сВ1, сВ2,..., сВпт), где А - класс рассматриваемого атома, с -указатель па принадлежность атома к циклической системе, (сВ1, сВ2. ...сВпт) - список классов соседних атомов в лексикографическом порядке.

2. Дескрипторы следующего уровня генерируются итератвно и включают дескрипторы предыдущего уровня для рзеемжрннаемою атома и всех его соседей: сА(сВ1(сС1,сС2...), сВ2(сС1.сС2....).... сВт(сС1,сС2,...))

3. IlJar 2 повторяется до любого заданного уровня вложенности дескрипторов. Каждый уникальный дескриптор записывается в словарь дескрипторов.

Для оценки сходства соединений мы предложили модификацию коэффициента Танимото, позволяющую учесть частоту встречаемое!» MNA дескрипторов в молекулах: •

м

£min[A(i),B(i)]

s(A, В) = -£--^-

VA(i) + XB(i)-Xmin[A(i),B(i)]'

1-T 1-!

где A(i) н B(i) частота встречаемости i-ro дескриптора в молекулах А н В соответственно; М - общее число дескрипторов в словаре.

Сравнительная оценка точности paipafiorainibiv меюдоп анализа сходства п меюдоп, описанных п лшершуре

Было проведено сравнеппе разработанных нами меюлов с 4-мя другими методами, широко применяемыми для анализа сходства веществ (Basak and Grunwald, 1994). Было проведено предскаинпе величии температуры киненпя 139 углеводородных соединении (одно из физико-химических свойств веществ) и мутагенности (один н< видов биологической активности) 15 пнгрозамннов. которые определяются экспериментально с достаточно высокой ючноеи.ю. Прогноз свойств соединений проводился на основе метода ближайшего соседа. Для оценки эффекпншосш меюдоп использовались коэффициент корреляции (г) и стандарта» ошибка (s.e). между оценками н реальными значениями нсс.тед\емы\ свонав.

Показано, что оба разработанных нами метода (МЫЛ, ТЕ1) дают хорошие оценки исследуемых свойств (см. табл.1, 2). Метод анализа сходства дескрипторов атомных окрестностей является лучшим для оценки мутагенности но сравнению с другими методами (г = 0.945, р<0.0001, Б.е. = 1.25). Это позволяет утверждать, что разработанные методы могут успешно применяться для прогноза свойств химических соединений.

Таблица 1

Сравнение эффективности 6 методов анализа сходства

для предсказания температуры кипения 139 углеводородов

Метод оценки сходства г s.e. Р

Tis" 0.993 19.34 <0.0001

Лра 0.986 26.26 <0.0001

МЫЛ 0.985 27.89 <0.0001

Ti„' 0.983 29.36 <0.0001

Pcs" 0.966 41.29 <0.0001

ТЕ I, nm,4=2 0.959 45.37 <0.0001

* - результаты, полученные S. Basak и G. Grunwald (1994)

Таблица 2

Сравнение эффективности 6 методов анализа сходства для _предсказания мутагенное! и 15 нитрочаминов_

Метод оценки сходства г s.e. • Р

М^ 0.945 1.25 <0.0001

Ар" 0.944 1.26 <0.0001

ТЕ1, птах=2 0.931 1.43 <0.0001

и* 0.923 1.47 <0.0001

IV 0.830 2.33 <0.0001

п,' 0.740 2.67 <0.0016

* - результаты, полученные Б. Ваэак и О. СгшпуаИ (1994)

Анализ возможностей применения разработанных методов для прогнои биологической активности

Для ■ того, чтобы оценить возможности применения разработанных методов анализа сходства при прогнозе биологической активности, была использовала процедура скользящего контроля. На каждом шаге процедуры одно из соединений поочередно исключалось из обучающей выборки и оценивалась вероятность его отнесения к классу активных веществ:

р(к)=-

10 i где: s, и Sj - сходства соединения к с i-iim активным и j-ым

неактивным соединением соответственно, оцененные с помощью

одного из двух методов анализа сходства; щ и п0 - число активных и

неактивных соединений в обучающей выборке.

Для оценки качества прогноза мы использовали следующий критерий:

п, -п0

где N{p, > р0} - число случаев, когда вероятность быть активным для активного соединения больше, чем для неактивного, вычисленное по всем парам активных и неактивных соединений.

Апробация предложенных методов была выполнена ни 17124 соединениях с известной активностью (по отношению к какому-либо из рассматриваемых нами рецепторов), взятых из базы данных MDDR 96.2. Скользящий контроль для 16 видов активности показал, что средняя точность прогноза активности составляет 86% для метода оценки сходства по электротопологическим индексам и 96% для метода оценки сходства по дескрипторам атомных окрестностей.

На основе результатов скользящего контроля и сравнения с другими подходами, применяемыми для анализа сходства, метод сходства дескрипторов многоуровневых атомных окрестностей, обеспечивающий лучшие результаты прогноза, был выбран как базовый для компьютерной системы анализа сходства с эндогенными и экзогенными биорегуляторами.

РАЗРАБОТКА БАЗЫ ДАННЫХ ЭНДОГЕННЫХ БИОРЕГУЛЯТОРОВ И ИХ СИНТЕТИЧЕСКИХ АНАЛОГОВ

Разработка структуры базы данных

При разработке базы данных мы руководствовались следующими принципами:

1. Характеристика специфики подтипа рецептора основывается на исследовании особенностей его взаимодействия с определенными ннзкомолекулярпымп лигапдамн.

2. Сходство потенциального лекарственного препарата с эндогенным биорегулятором позволяет предположить у него наличие аналогичных механизмов связывания с определенным типом рецепторов.

3. Лнатиз сходства с селективными агонистамн и антагонистами данного рецептора позволяет уточшггь специфичность действия исследуемого соединения по отношению к известным подтипам рецепторов.

Структура полей, содержащихся в разработанной базе данных приведена на рис.1.

<MOL>

— MOI.RF.GNO .— MOLNAME

— C1IEMJNAME

— MOI.STRUCTURE

— <ACTIVITY>

ËACTIVITY_CLASS

COMMENTS

I.IT_REF

Рис. 1. Значения полей: MOLREGNO - регистрационный номер в базе данных; MOLNAMK - название соединения; CHEM NAME - химическое название; MOI.STRUCTURE - химическая структура; ACTIVITY_CLASS - наименование активности; COMMENTS - комментарии; LIT REF -литературные ссылки.

Словарь активностей разработан на основе современных классификаций рецепторов (The RBI Handbook of Receptor Classification and Signal Transduction, Eds. Waling K.., Kebabian J., Neumcycr J., USA, 1995; TiPS Receptor and Ion Channel Nomenclature Supplément, 1996) и включает 360 наименований биологической активности. Каждая строка в словаре активности (поле ACTIVITYCL.ASS) содержит название рецептора и тип его взаимодействия с лигандом (агонист, антагонист, модулятор, и д).

Поле "COMMENTS" предназначено для записи дополнительной информации о взаимодействии лиганда с рецептором, например Kd, 1С50 и т.д.

Наполнение базы данных

Баш данных разработана в среде СУБД ISIS/Base (MDL Information Systems, Inc.) и содержит информацию о шпкомолекулярных эндогенных лигандах, селективных агонистах и

антагонистах 98 различных рецепторных подтипов (см. таблицу 3). Пример представления информации в базе данных дан на рис.2.

Таблица 3

NN Типы рецепторов, представленных в базе данных Число селективных лнгандов

1 Acetylhoüne 1

2 Muscarinic 9

3 Muscarinic Ml 5

4 Muscarinic M2 2

5 Muscarinic M3 3

6 Muscarinic M4 2

7 Nicotinic 8

8 Adenosine 2

9 Adenosine (Л1) 6

10 Adenosine (A2) 1

11 Adenosine (A2a) 2

12 Adenosine (A2b) 2

13 Adenosine (A3) 1

14 Adrenergic (alpha) 3

15 Adrenergic (alphal) 4

16 Adrenergic (alpha I A) 2

17 Adrenergic (alphal B) 2

18 Adrenergic (alphal D) ; 2

19 Adrcncrgic (a!pha2) 10

20 Adrenergic (alpha2A) 1

21 Adrenergic (alpha2B) 1

22 Adrenergic (a!pha2C) 1

23 Adrenergic (beta) 5

24 Adrenergic (beta 1) ->

25 Adrcncrgic (bcta2) 1

26 Dopamine 3

27 Dopamine (Dl-Like) 5

28 Dopamine (Dl) 2

29 Dopamine (D5) 1

30 Dopamine (D2-Like) 5

31 Dopamine (D2) 6

32 Dopamine (D3) 4

33 Dopamine (D4) 2

34 GABA 1

35 GABA A 4

36 GABA В 5

37 GABA С 7

38 Benzodiazepine 10

39 Galanin t

40 Glutamate *>

41 Glutamate (mGluRI) 2

42 Glutamate (mGluR2)

43 Glutamate (mGluR3) 2

44 Glutamate (müluR4) 1

45 Glutamate (mGluR5) 1

46 Glutamate (niGIuR6) I

47

48

49

50

51

52

53

54

55

56

57

58

59

60

61

62

63

64

65

66

67

68

69

70

71

72

73

74

75

76

77

78

79

80

81

82

83

84

85

86

87

88

89

90

91

92

93

94

95

96

97

98

Glutamate (mGluR7) NMDA Glutamate Site NM DA Glycinc Site kainate Glycinc

Histamine '

Histamine (Hl)

Histamine (112)

Histamine (113)

Imidazoline

Imidazoline (11)

Imidazoline (12)

Intracellular Receptor (Steroid)

Estrogen

Glucocorticoid

Progesterone

Androgen

Mineral corticoid

Intracellular Receptor (Non-Steroid)

Retinoid Acid

Retinoid X

Thyroid Hormone

Vitamin D

Melatonin

Melatonin (ML-2)

Octopamine

Octopamine Phentolamine-Sensitivc

Octopamine Mianserin- and Cyproheptadine-Sensitive (Brain)

Octopamine Mianserin- and Cyproheptadine-Sensitive (Fat)

P2 Punnoceptor

P2X

P2Y

P27.

P2T

P2U

P2D

5 HT

5 HTI

5 HTI A

5IIT1B

5 IIT1D

5 I1T1E

5 III IK

5 H F2

HT2A 5 HT2B 511T2C 5HT3 5 IIT4 5 IIT5 5HT6 5 11T7

IS1

[~Forms |~Query | Browse ^ j

<MOL> Search Domain: ЛП

us of zzz

MOLNAME Melatonin

MOLSTRUCTURE

о

activ_class COMMENTS LIT_REF

IC50=150pM Reppert. S M,

Endogenous human 1 Science, 242.

hypothalamus p78,1S88

Melatonin Agonist

Рис.2. Представление информации о лигалдах в базе данных. MOLNAME - название соединения; MOLSTRUCTURE - химическая структура; activ_class - наименование активности; COMMENTS -комментарии; LIT_REF - литературные ссылки

ОПИСАНИЕ КОМПЬЮТЕРНОЙ СИСТЕМЫ АНАЛИЗА СХОДСТВА ВЕЩЕСТВ "SIMEST"

Компьютерная система SIMEST включает в себя:

0 базу данных эндогенных биорегуляторов и их синтетических аналогов, описанную выше;

О программу анализа сходства соединений, являющуюся lSlS/Base-приложением и реализующую представленный выше алгоритм анализа сходства на основе подструктурных дескрипторов MNA.

С помощью системы SIMEST пользователь может в диалоговом режим1 ввести структурную формулу нового химического соединения и оценить его сходство с эндогенными и экзогенными лигандами из базы данных. Результатом поиска является список лнгандов, упорядоченных по убыванию коэффициента сходства. Пример анализа сходства для 5-НТ4 агониста MOSAPRIDE CITRATE из базы данных MDDR 96.2 приведен на рисунке 3.

Forms | Query j Update | c кп<М^ск . i r 1 Krnrrh ilnmiin: Subnet of 222

PATTERN MoLilM^ARiTY MOLSTRUCTURE MOLNAME

4ti 0.3523 SC-53116

Чг

Э 0 3472 -o^'di о Spiperone

¿¡¡а О i ° 0 3-162 • CGS

0 3295 о AV Metocloprarnide

clrii, . _ . ________!

5 И i"4 .»■'.i jriic.t

«-7Т----«

Рис.3. Пример работы программы 51МЕ5Т. Слева - соединение для которого оценивается сходство. Справа - список лигандов из базы данных, упорядоченных по убыванию коэффициента сходства. Внизу -активность соединения с максимальным коэффициентом сходства.

ОЦЕНКА ЭФФЕКТИВНОСТИ АНАЛИЗА СХОДСТВА ДЛЯ ПРОГНОЗА РЕЦЕИТОРНЫХ МЕХАНИЗМОВ ДЕЙСТВИЯ ВЕЩЕСТВ

Мы грзвели оценку эффективности распознавания химических соединен!¡л, проявляющих активность вида "агонист/антагонист" по отношению к специфическому виду рецепторов на основе анализа сходства с их эндогенными и экзогенными лигандами. Эндогенные и экзогенные лиганды, содержащиеся в разработанной базе данных, использовались в качестве паттернов для сравнения. Тестирование проводилось на 17124 соединениях с известной активностью из базы данных МОИ!? 96.2. Соединения считались активными по отношению I определенному виду рецепторов, если в базе данных МБОЯ для них была указана активность вида "агонист/антагонист" по отношению к данному рецептору. Если такой активности не было указано, то соединение считалось неактивным но отношению к данному виду рецепторов. Точность распознавания активных в отношении определенного рецептора соединений оценивалась как:

пГпо '

где: Ы{51>5о} - число случав, когда активное соединение больше похоже на паттерн, чем неактивное, когда сравниваются все пары активных и неактивных соединений тестовой выборки; 111 и по - число активных и неактивных соединений в тестовой выборке.

Если одному виду активности соответствовало несколько паттернов, то общая точность распознавания определялась путем усреднения точности распознавания по всем паттернам. Результаты тестирования приведены в таблицах 4-5.

Таблица 4

Точность распознавания для агонистов, представленных

в тестовой выборке

NN AKTHBHOCTb nl nO Число паттернов IAR, %

1 Vitamin D Agonist 66 17058 2 100

2 Melatonin Agonist 7 17117 2 100

3 Adenosine (A2) Agonist 17 17107 1 99

4 Histamine (H3) Agonist 1 17123 2 99

5 Androgen Agonist 1 17123 6 99

6 Adenosine (Al) Agonist 14 17110 4 98

7 5 HT4 Agonist 28 17096 1 97

8 Retinoid Acid Agonist 49 17075 1 97

9 Estrogen Agonist 21 17103 2 95

10 5 HT1 Agonist 22 17102 1 94

11 ' 5 HT1B Agonist 3 17121 2 93

12 5 HT1D Agonist 55 17069 4 92

13 Adrenergic (beta) Agonist 34 17090 2 91

14 Dopamine (Dl) Agonist 16 17108 1 90

15 GABA B Agonist 4 17120 2 89

16 Dopamine (D2) Agonist 31 17093 3 89

17 Adrenergic (betal) Agonist 3- 17121 1 88

18 Adrenergic (alpha2) Agonist 9 17115 7 81

19 Benzodiazepine Agonist 42 17082 3 76

20 5 ! IT 1A Agonist 156 16968 5 75

21 5 HT3 Agonist 6 17118 3 74

22 Dopamine Agonist 27 17097 3 64

23 Muscarinic M1 Agonist 138 16986 2 62

24 Thyroid Hormone Agonist 2 17122 2 56

Среднее:_

Таблица 5

Точность распознавания для антагонистов, представленных в тестовой __выборке_

NN Активность nl nO Число паттернов 1AR, %

1 Р2Т Antagonist 2 17122 1 100

2 Adrenergic (betal) Antagonist 10 17114 1 95

3 Adrenergic (beta) Antagonist 37 17087 3 93

4 Adrenergic (alphal) Antagonist 68 17056 2 92 '

5 Dopamine (D4) Antagonist 25 17099 '3 91

6 Histamine (H3) Antagonist 13 17111 2 89

7 5 HT3 Antagonist 204 16920 5 86

8 Muscarinic Antagonist 204 16920 5 86

9 5 HT2 Antagonist 105 17019 1 85

10 Adrenergic (a!pha2) Antagonist 33 17091 4 83

11 Benzodiazepine Antagonist 6 17118 1 83

12 5 HT Antagonist 22 17102 1 82'

13 Dopamine (D2) Antagonist 89 17035 3 79

14 Adenosine (Al) Antagonist 28 17096 2 79

15 5 I1T1A Antagonist 48 17076 5 79

16 AMPA Antagonist 40 17084 4 76

17 GABA В Antagonist 6 17118 3 75

18 Dopamine (Dl) Antagonist 33 17091 1 75

19 Adrenergic (alpha) Antagonist 17 17107 1 71

20 5 11T2A Antagonist 3 17121 5 67

21 Muscarinic M3 Antagonist 3 17121 3 67

22 NMDA Antagonist 234 16890 3 60

23 5 HT2C Antagonist 16 17108 4 57

24 Muscarinic M2 Antagonist 3 17121 1 53

25 5 HT2B Antagonist 5 17119 1 46

26 Adenosine (A2a) Antagonist 1 17123 1 36

Среднее:__76

Средняя точность распознавания агонистов и антагонистов составляет 82%.

OUEIIKA СХОДСТВА НОВЫХ СТРУКТУР С ЭНДОГЕННЫМИ II ЭКЗОГЕННЫМИ ЛИГАНДЛМИ

Мы провели анализ сходства около 200000 химических соединений, содержащихся в базе данных ChcmBridge с эндогенными и экзогенными лигандами 6 рецепторных подтипов: Adrenergic (alphal), Adrenergic (alpha2), Adrenergic (betal), Adrenergic (beta2), Muscarinic, Benzodiazepine. Целью исследования было отобрать перспективные для тестирования вещества с учетом их прогнозируемого действия на вышеуказанные рецепторы. Эндогенные и экзогенные лиганды данных рецепторов, из нашей базы данных, использовались в качестве паттернов для сравнения.

На первом этапе были отобраны вещества, для которых коэффициент сходства с каким-либо из паттернов превышал пороговую величину 0.5. Количество соединений, отобранных по каждому га 6-ти видов активности, дано в таблице 6.

Таблица 6

Результаты отбора соединений из базы данных ChemBridge

Рецептор Число отобранных соединений

Adrenergic (alphal) 191

Adrenergic (alpha2) 66

Adrenergic (betal) 123

Adrenergic (beta2) 33

Muscarinic 583

Benzodiazepine 100

11 соединений с максимальным значением коэффициента сходства были рекомендованы для экспериментального тестирования (см. рис. 4).

Еще 2 соединения были отобраны для экспериментального тестирования га псртия ч.чпн Кят данных веществ, синтезированных к.х.н.

С.Б. Гончаренко (ВНЦ БАВ, Купавна).

Таким образом, благодаря применению системы 51МЕЯТ, вместо скрининга свыше 200000 веществ для исследования отобрано всего '■ишь 13 соединений, имеющих высокую вероятность взаимодействия со специфическими подтипами рецепторов.

Sn

237727' Ad renergic(alpha 1 f Adrenergic(alpha2)

228932 Adrenergic(alpha2)

ivo<

ГЧ

r

217375 Adrener(;ic(betal) Adrenergic(beta2)

246021 Muscarinic

555357 Muscarinic

657803 Benzodiazepine

л ofc

N^-O'

647776 570795 T

Benzodiazepine Benzodiazepine Muscarinic

4'

Muscarinic

Рис. 4 Соединения, отобранные для тестирования.

а - регистрационный номер вещества в базе данных СЬетВпс^е ь

- предполагаемый реценгор с - соединения 7 и 4 синтезированы к.х.н. С.Б. Гончаренко

Для того, чтобы оценить селективность действия отобранных соединений по отношению к исследуемым видам рецепторов, мы оценили их сходство со всеми эндогенными и экзогенными лигандамн данных рецепторов. Максимальные значения коэффициента сходства приведены в таблице 7.

Таблица 7

Сходство отобранных соединений с лигандамн реие1 гторов

ГО а1 «2 (51 [52 Миэсапшс Веп/осНаг.

657803 0.2405 0 2656 0.2676 0.2517 0.4000 0.5639

647776 0.2871 0.2871 0.1884 0.2258 0.3171 0.8333

570795 0.2400 0.2400 0.1736 0.1967 0.2807 0.7746

569027 0.3895 0.3200 0.7045 0.4464 0.3451 0.3125

555357 0.3220 0 4000 0.2667 0.2917 0.6637 0.3390

310783 0.3800 0.3143 0.7528 0.5556 0.3390 0.2963

246021 0.3585 0.3458 0.2857 0 2429 0.6762 0.3774

237727 0.5443 0.6232 0.2787 0.2522 0.2743 0.3626

228932 0.4130 0.6216 0.3016 0.2160 0.2462 0.2941

217375 0.3585 0.3458 0.7802 0.5536 0.3280 0.2950

132269 0.2128 0.1748 0.2479 0.1970 0.6571 0.2160

4 0.4965 0.3356 0.2857 0.2292 0.6372 0.3942

7 0.3659 0.3012 0.1798 0.2485 0.5448 0.2184 _

Отобранные вещества 657803, 570795, 310783, 217375, 132269, для которых удхтось получить образцы из фирмы "СЬетВг^с", и соединения 4, 7, представлены на тестирование к.м.н. В.В. Малыгину и к.х.н. Г,Ф. Махаевой (ИФАВ РАН) с использованием тест-системы для ' оценки радиолигандного связывания на препаратах лнофилизированных мембран из мозга крыс (1_МЯР-1).

ЗАКЛЮЧЕНИЕ

В результате выполненной работы нами разработана компьютерная система БМЕБТ для комплексной оценки сходства новых лекарственных соединении с низкомолекулярными эндогенными и экзогенными лигандамн 98 рецепторов. Система являете" открытой и допускает пополнение базы данных эндогенных биорегуляторов и их синтетических аштогов с целью расширения структурного и функционального разнообразия рассматриваемых лигандов. В компьютерных экспериментах показано, что оценка сходства веществ с помощью системы 51МЕ8Т даег возможность выдвигать обоснованные предположения о возможных макромолекулярных мишенях новых биологически активных веществ

и отбирать наиболее перспективные соединения для

экспериментального исследования.

ВЫВОДЫ

1. Сравнение различных методов анализа сходства химических соединений показало, что использование в качестве структурных дескрипторов многоуровневых атомных окрестностей наиболее эффективно при прогнозе биологической активности веществ.

2. Средняя точность прогноза (82%) биологической активности с помощью разработанной нами методики комплексной оценки сходства новых лекарственных соединений с низкомолекулярными эндогенными и экзогенными лигандами широкого спектра рецепторов достаточно высока для ее практического использования.

3. Созданная нами база данных низкомолекулярных эндогенных биорегуляторов и их аналогов охватывает 98 различных рсцеиторпых подтипов, включая адрено-, холпно-, гистамино, дофампно-, серогопино-, пурино-, ГЛМК, глутамата, глицина и другие, что является основанием для компьютерной оценки безопасности и эффективности новых фармакологических веществ по отношению к этим рецепторам.

4. Анхнп базы данных Chemßridge, содержащей около 200000 веществ, показал, что с использованием разработанной нами методики эффективность отбора веществ рсцепторного типа действия существенно повышается.

СПИСОК РАБОТ, ОПУБЛИКОВАННЫХ НО ТЕМЕ ДИССЕРТАЦИИ

1. Бородина Ю.В., Филимонов Д А., Поройков В.В. Предсказание активности пролскарств с помощью компьютерной системы PASS, Хим.-фарм. журнал 1996, т.30, N. 1, с.39-42.

2. Borodina Yu V., Poroikov V.V., Filimonov D.A. Computer aided prediction of drug biological action on the basis of prodrug structure. Abstr.l l"' European Symposium on Quantitative Structure-Activity Relationships., Lausanne, 1996, p-33C.

3. Бородина 10.В., Поройков В.В., Филимипов Д.А.. Возможности аиалша сходства химических соединений с холино- и адренофогшыми веществами. Тезисы докладов IV Российского пационхи.пого конгресса «Человек и Лекарство», Москва, 1997, с. 248.

4. Poroikov V.V., Filimonov D.A., Borodina Yu.V. Computer aided analysis of new compound similarity with endogenous substances as a tool for assessment of its side and toxic actions. Abstr. Workshop Quantitative modeling approaches for understanding and prediclir.g mutagenicity and carcinogenicity. Rome, 1997, p 20.

5. Бородина Ю.В., Фнлимоноп Д.А., Поройков В.В., Компьютерная оценка сходства потенциальных лекарственных средств с эндогенными биорегуляторами. Теэнсы докладов V Российского национального конгресса «Человек и Лекарство», Москва, 1998, с. 550

6. Borodina Yu., Filimonov D., and Poroikov V. Computer-Aided Estimation of Synthetic Compounds Similarity with Endogenous Bioregulators, Quantitative Structure-Activity Relationships, 1998, 17, 5, 459-464.

7. Borodina Yu., Filimonov D., Poroikov V. Predicting the Probable Receptor Targets for a Potential Drugs Based on the Assessment of Their Similarity With Endogenous Ligands, Second International Electronic Conference on Synthetic Organic Chemistry, September 1-30, 1998, еОООЗ.

8. Borodina Yu., Filimonov D., Poroikov V. Prediction of probable receptor targets for a new compound based on similarity assessment with endogenous ligands. 12th European Symposium on Quantitative Structure-Activity Relationships, Copenhagen, August 23-28, 1996, P. 114.