Бесплатный автореферат и диссертация по биологии на тему
Компьютерный прогноз биотрансформации ксенобиотиков
ВАК РФ 03.00.28, Биоинформатика
Автореферат диссертации по теме "Компьютерный прогноз биотрансформации ксенобиотиков"
На правах рукописи
Рудик Анастасия Владимировна
КОМПЬЮТЕРНЫЙ ПРОГНОЗ БИОТРАНСФОРМАЦИИ КСЕНОБИОТИКОВ
03 00.28 - биоинформатика
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата биологических наук
Москва - 2007
003060758
Работа выполнена в Государственном > институт биомедицинской химии им медицинских наук.
Научный руководитель
кандидат физико-математических наук
Официальные оппоненты:
доктор физико-математических наук, профессор
учреждении Научно-исследовательский В.Н Ореховича Российской академии
Филимонов Дмитрий Алексеевич
Шайтан Константин Вольдемарович
доктор биологических наук, профессор
Иванов Алексей Сергеевич
Ведущая организация: Институт физиологически активных веществ РАН
Защита состоится 28 июня 2007 года в И 00 часов |на заседании Диссертационного совета Д 001 010.01 ¡при ГУ НИИ Биомедицинской химии им. В.Н. Ореховича РАМН по адресу 119121, Москва, ул Погодинская, д 10.
С диссертацией можно ознакомиться в ¡библиотеке ГУ НИИ Биомедицинской химии им В Н Ореховича РАМН. I
Автореферат разослан <<2ъ» мая 2007
года
Ученый секретарь Диссертационного совета, кандидат химических наук [
Карпова Е А
1. ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
1.1. Актуальность проблемы
Интерес к биотрансформации органических ксенобиотиков, среди которых лекарства занимают особое место по важности для человека и по контролю за их безопасностью, вызван многими причинами Образующиеся в результате реакции биотрансформации метаболиты могут быть более токсичными, чем исходные соединения, или проявлять нежелательные побочные эффекты, а могут быть и более фармакологически активными
Исследование процесса биотрансформации включает анализ образующихся метаболитов, их стабильности, и определение ферментов, осуществляющих реакции биотрансформации, что важно для изучения зависимости от локализации в органах и тканях действия лекарств и исследования совместимости лекарственных средств
Существующие экспериментальные методы in vitro и in vivo -сложный, дорогостоящий, трудоемкий и длительный процесс, возможности проведения экспериментов в клинике весьма ограничены, а результаты изучения биотрансформации т vitro и т vivo не всегда совпадают с таковыми для человека
Компьютерные методы позволяют прогнозировать биотрансформацию и метаболиты органических соединений на основе химической структуры их молекул еще до проведения химического синтеза и биологического тестирования, что, благодаря сокращению количества соединений, которые будут подвергнуты биологическому тестированию, позволяет сократить время и затраты на разработку новых лекарств.
В настоящее время известно несколько компьютерных методов прогноза возможных путей биотрансформации органических ксенобиотиков. Это, прежде всего, методы молекулярного моделирования Они ориентированы на изучение механизмов взаимодействия определенных ферментов с субстратами Основным их недостатком является продолжительность расчетов и необходимость использования мощных вычислительных ресурсов, что не приемлемо для высокопроизводительного скрининга Помимо этого, необходимы данные о трехмерной структуре, как субстрата, так и фермента, информация о которых во многих случаях не доступна.
Экспертные системы для предсказания метаболизма основаны на формализации знаний экспертов и предсказывают возможные метаболические сети Их недостатком является генерирование большого количества метаболитов, отсев которых также основан на экспертных знаниях, и, как правило, они не предсказывают ферменты, которые могут осуществлять реакции биотрансформации [Langowski J, 2002]
г
1.2. Цель и задачи исследования.
Цель диссертационной работы - разработка нового метода компьютерного прогноза биотрансформации органических ксенобиотиков по структурным формулам
Метод должен быть высокопроизводительным, предсказывать реакции биотрансформации и осуществляющие их ферменты, предсказывать возможные метаболиты и оценивать точность предсказания
В ходе выполнения работы решались следующие задачи:
1 Разработать метод генерации продуктов биотрансформации
2 Разработать метод прогноза типов биотрансформации
3. Разработать метод прогноза сайтов биотрансформации и метаболитов.
4 Исследовать устойчивость прогноза при модификациях обучающей
выборки
1.3. Научная новизна.
В диссертационной работе предложен новый подход к прогнозу биотрансформации органических ксенобиотиков Впервые разработан метод, позволяющий одновременно предсказывать вероятность реакций биотрансформации которым может подвергнуться субстрат, с учетом ферментной системы и конкретной изоформы фермента, ответственных за метаболизм Для решения задачи прогноза метаболитов разработаны оригинальные дескрипторы, отражающие структурные изменения субстрата в ходе реакции биотрансформации
1.4. Практическое значение работы.
Разработанный метод прогноза биотрансформации может быть использован при поиске и создании новых лекарственных субстанций, для прогноза биодеградации веществ в окружающей среде и идентификации структуры исходных веществ по их метаболитам
1.5. Апробация работы.
Результаты работы были представлены на X, XI, XII, XIII и XIV Российских национальных конгрессах "Человек и лекарство" (Москва, 2003 -2007 г.г ), 3-ей Всероссийской конференции «Молекулярное моделирование» (Москва, 2002 г), на XII международной конференции «Новые информационные технологии в медицине, биологии, фармакологии и экологии» (Украина, Гурзуф, 2004 г.), на 4-ом Международном симпозиуме по фармацевтической химии в г Стамбуле (Турция, 2003 г.), на 15-ом европейском симпозиуме, посвященном С^АЯ и молекулярному моделированию в г Стамбуле (Турция, 2004 г.), на 2-м Международном симпозиуме «Компьютерные методы в токсикологии и фармакологии» (Греция, 2003 г )
1.6. Публикации.
Результаты диссертации опубликованы в 15 печатных работах, включая 2 статьи в рецензируемых журналах, 11 публикаций в сборниках трудов научных конференций и один патент на программу.
1.7. Объем и структура диссертации.
Основное содержание работы изложено на 95 страницах, содержит 43 рисунка и 21 таблиц Диссертация состоит из введения и шести глав, включая литературный обзор и 3 приложений Список цитированной литературы содержит 116 наименований, в том числе 92 зарубежных публикации.
2. МАТЕРИАЛЫ И МЕТОДЫ
В работе были использованы две коммерчески доступные базы данных (БД) - Metabolite (MDL, Elsevier) и Metabolism (Accelrys). В первой, в основном, содержится информация о биотрансформадиях лекарственных соединений, для некоторых реакций есть также данные об осуществляющих реакции ферментах Во второй содержатся данные о биотрансформации лекарственных соединений, агрохимических веществ, пищевых добавок и пестицидов В базе данных Metabolite V 2001 1 содержатся 16922 соединений и более 55000 реакций, в базе данных Metabolism V 2002 1 содержится более 25000 реакций и 4254 соединений, 1723 из которых встречаются в БД Metabolite.
2.1. Метод прогноза типов биотрансформации
На основе информации из БД формируются обучающие выборки, состоящие из структур соединений и связанных с ними названий типов биотрансформации.
Тип биотрансформации - это, в первую очередь, название реакции биотрансформации При наличии соответствующей информации тип биотрансформации может содержать название семейства ферментов, участвующих в биотрансформации, и данные об изоформе фермента-
Название реакции биотрансформации [(Фермент [,Изофермент])]
(данные, заключенные в квадратные скобки, не являются обязательными)
На рис. 1 приведен пример записи типов биотрансформации для реакции окислительного N-деалкюшрования молекулы теофиллина цитохромом Р450 (изоформа CYP1А2)
о
о
Oxidative N-Dealkylation
Oxidative N-Dealkylation (Cytochrome P450)
Oxidative N-Dealkylation (Cytochrome P450, CYP1A2)
Рис. 1. Окислительное N-деалкилирование молекулы теофилина цитохромом Р450 CYP1A2
При прогнозе типов биотрансформаций структуры органических соединений описываются множеством дескрипторов многоуровневых атомных окрестностей MNA (Multilevel Neighborhood of Atoms) (Filimonov et al, 1999), а алгоритм прогноза (в диссертационной работе проводилось исследование применимости алгоритма, реализованного в программе PASS (ДА Филимонов, ВВ. Поройков, РХЖ, 2006, L, N2, 66-75) состоит в следующем.
В ходе обучения для каждого типа биотрансформации субстраты соответствующих реакций из обучающей выборки являются положительными примерами, а все остальные отрицательными примерами субстратов этого типа биотрансформации Для каждого дескриптора D, оценивается условная вероятность того, что органическое соединение, содержащее D, в множестве описывающих его структуру дескрипторов, является субстратом реакции биотрансформации типа Bj.
где и Вкф,) - характеристические функции принадлежности субстрата с номером к множеству положительных примеров и множеству соединений, содержащих в описании структуры дескриптор 1)„ соответственно
Априорная вероятность биотрансформации типа BJ оценивается так:
По множеству дескрипторов ]УСЧА, описывающих структуру органического ксенобиотика, для каждого типа биотрансформации вычисляется оценка ее возможности I
p(Bj |Dj) =Ik fkiBjMD,)/ ZkgkiD,),
p(Bj) =Ek fk(Bj) X,gk (D,)/ Ski, gk(D,),
i = (l+(i-i0)/(l-s.j0))/2, s = Sin(Z, ArcSm(2,p(B/di)-1 )/m), s0 = 2,p(Bj)-l,
где суммирование ведется только по тем m дескрипторам, которые описывают данную структуру и имеются в структурах субстратов обучающей выборки При t=0 соединение не может быть субстратом биотрансформации данного типа, а при t=l практически достоверно им является
При обучении рассчитываются величины t и функции их распределения для положительных (tt) и отрицательных (tf) примеров.
При прогнозе сравнение вычисленного значения t с распределениями величин tt и tf дает оценки вероятностей быть (Pt) и не быть (Pf) данному органическому соединению субстратом реакции биотрансформации соответствующего типа
Для оценки точности прогноза используется процедура скользящего контроля с исключением по одному На каждом шаге процедуры одно соединение исключается из обучающей выборки, и для него выполняется прогноз. Точность прогноза каждого типа биотрансформации оценивается по инвариантному критерию точности прогноза
IAP = (1)
где N(t+>t) - число случаев, когда значение t, рассчитанное для положительного пример, выше чем t, рассчитанное для отрицательного примера, N+ и N. - число положительных и отрицательных примеров, соответственно
В результате обучения создается SAR base, содержащая множества дескрипторов MNA субстратов, их типы биотрансформаций, распределения величин tt и tf и LAP для каждого типа биотрансформации
2.2. Метод прогноза сайтов биотрансформации
Задача прогноза сайтов биотрансформации ставилась как задача прогноза сайтов определенной реакции биотрансформации, те., например, прогноз сайтов Ароматического гидроксилирования. В этом случае задача прогноза сайта определенной реакции аналогична задаче нахождения метаболита этой реакции
Для того чтобы используемые в прогнозе дескрипторы содержали информацию о произошедших во время реакции структурных изменениях, на основе дескрипторов MNA были разработаны дескрипторы RMNA (Reacting Multilevel Neighborhood of Atom)
Главным отличием RMNA является учет сразу двух структур -структуры субстрата и продукта и дополнительные метки для атома
RNMAl(A) =([-]A[T]A,[B]A2[BJ..AJB]...),
где А - тип атома, /^метка, обозначающая, что атом не входит в цикл, /Т/метка для изменяющегося атома (может принимать значение «<» для присоединяемого и «>» для удаляемого атомов, соответственно), А], ,А/. -типы ближайших соседей атома в лексикографическом порядке, [В] - метка для связи, изменяющейся во время биотрансформации (может принимать значение "/" в случае, если связь между А и одним из соседних атомов разрушается, - если связь образуется, "]" если изменяется тип связи в субстрате и"[" если изменяется тип связи в продукте)
¡ШЛА дескрипторы последующих уровней строятся как конкатенация дескрипторов предыдущего уровня атома и его ближайших соседей.
Пример генерации дескрипторов разного уровня (до второго включительно) приведен на рис 2.
Атом ЮЛИЛО гшим шиАг
1 с с-нсс (С-НСС) (С-НСС)(С-]ЧСС)(-НС)
2 с с-нсс (С-НСС) (С-НСС) (-НС)Г с-о<сс\)
3 с с-о<сс (С-ОсСС\ ) (С-НСС) (С-НСС) (-СК-Н<С\\)
4 с с-нсс (С-НСС) (С-НСС) (-НСН с-о<сс\)
5 с с-нсс (С-НСС) (С-НСС)(С-1ЧСС)(-НС)
6 с С-ГССС (С-1ЧСС) (С-НСС) (С-НССХ -!Ч-Н-НС)
7 N -1Ч-Н-НС (-ТЧ-Н-НСХ С-1ЧССХ -Н-ГГ) (-Н-1Ч)
8 О -о<-н<с (-0«-Н<С\\)( С-0<СС\)(-Н<-0<\)
Рис. 2. Пример 1ШКА дескрипторов для типа биотрансформации «Ароматическое гидроксилирование»
Алгоритм прогноза сайтов биотрансформации соответствует вышеописанному алгоритму прогноза типов биотрансформации.
2.3. Метод генерации продуктов биотрансформации
Генерация продуктов (потенциальных метаболитов) биотрансформации осуществляется с помощью созданных фрагментов реакции, которые представляют собой пару фрагментов структур -«фрагмент структуры субстрата» и «фрагмент структуры продукта» Во фрагменты структур включены только атомы и связи, изменяющиеся во
время реакции, а также их ближайшие соседи Чтобы отличать ароматические молекулы, добавлен тип связи «ароматическая».
Словарь фрагментов реакций был создан в полуавтоматическом режиме: вначале из БД Metabolite были автоматически выделены фрагменты всех реакций, после чего отобраны фрагменты, соответствующие только одной реакции, и не отражающие многостадийные процессы.
При создании словаря было поставлено условие, что одному фрагменту реакции должно соответствовать одно название реакции биотрансформации, в то же время одному названию реакции биотрансформации могут соответствовать несколько фрагментов реакций.
Например, реакции биотрансформации «Алифатическое гидроксилирование» соответствуют шесть фрагментов (рис 3).
„/ —- j 'Т* — ж *т* — Д,
* я *
о о
—- —- J —-
» «
Рис 3. Пример фрагментов реакции «Алифатическое гидроксилирование».
Чтобы избежать повторов и сделать словарь компактней, было принято решение не описывать все реакции биотрансформации, а создать иерархическую систему классификации и заносить в словарь фрагментов только самые нижние уровни
Например, реакция биотрансформации «С-гидроксилирование» включает в себя «Ароматическое гидроксилирование» и «Алифатическое гидроксилирование». В словарь фрагментов заносятся только фрагменты реакции, относящихся к нижним уровням. При генерации продуктов реакций используются фрагменты всех нижестоящих реакций Например, при генерации продуктов «С-гидроксилирования» используются фрагменты реакций «Ароматическое гидроксилирование» и «Алифатическое гидроксилирование
В результате работы, проделанной совместно с к х н В Г Блиновой, и аспирантом AB Дмитриевым, была построена система классификации, основанная на следующих принципах1
1 Реакция биотрансформации относится к одной из 4-ех основных групп реакций окисление, восстановление, конъюгация и гидролиз.
2 Внутри иерархии введены отношения «частное-общее», верхний уровень включает в себя все реакции нижних уровней.
Ниже, в качестве примера, приведен фрагмент классификации биотрансформации.
A Hydroxylation
1) C-Hydroxylation
a Aromatic Hydroxylation b Aliphatic Hydroxylation
2) N-Hydroxylation
3) S-Hydroxyiation
4) P-Hydroxylation B. Dealkylation
Созданный словарь фрагментов реакций используется для генерации продуктов биотрансформации Для этого производится поиск «фрагмента структуры субстрата» в структуре субстрата и если он найден, то производится его замена на соответствующий «фрагмент структуры продукта», в результате чего генерируется структура продукта. Задача поиска фрагмента структуры в целой структуре является задачей нахождения изоморфного вложения подграфа в граф
3. РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ
3.1. Прогноз типов биотрансформации
Для прогноза типов биотрансформации было создано несколько обучающих выборок. Две выборки (одна на основе БД Metabolite, другая -Metabolism) были созданы без изменения оригинальных названий, т.е. были использованы названия реакций биотрансформации, как они указанны в базах данных. В двух других выборках использовались автоматически формализованные названия Для формализации названий использовался созданный словарь фрагментов - если фрагмент реакции (состоящий из двух частей - фрагмента структуры до и после реакции) найден в искомой реакции, то ей приписывается соответствующее название реакции биотрансформации Помимо этого реакции присваиваются названия реакций биотрансформации вышестоящих уровней из созданной классификации. Например, если искомой реакции соответствует название реакции биотрансформации «Aromatic Hydroxylation», то к реакции прибавляются еще три названия - «Aromatic Hydroxylation», «С-Hydroxylation» и «Hydroxylation»
Ниже представлены характеристики созданных выборок и рассчитанная точность прогноза при выборе четырех различных уровней дескрипторов
Как видно из Таблицы 1, оптимальным уровнем дескрипторов для прогноза типов биотрансформаций является второй (MNA2); точность прогноза в выборке, использующей формализованные названия из БД Metabolism выше, чем в выборке, использующей оригинальные названия из БД Metabolism, а точность прогноза для выборок из БД Metabolite соотношение обратное
Таблица 1.
Зависимость точности прогноза типов биотрансформации от уровня _ дескрипторов МЫА_
Наименование выборки и ее характеристика Кол-во соединений Кол-во прогнозир типов биотрансф Точность прогноза по скользящему контролю (IAP-LOO)
MNA1 MNA2 MNA3 MNA4
Выборка I Источник - БД Metabolite (MDL&Elsevier) Оригинальные названия 14577 2317 82.7% 85.0% 83.1% 81.2%
Выборка П Источник - БД Metabolism (Accelrys) Оригинальные названия 3581 170 81.1% 84.6% 82.8% 79.2%
Выборка III Источник - БД Metabolite (MDL&Elsevier) Формализованные названия 7310 830 79.9% 83.2% 80.8% 79.7%
Выборка IV Источник - БД Metabolism (Accelrys) Формализованные названия 1695 24 87.3% 89.7% 86.6% 83.8%
Сравнение точности прогноза по выборкам, использующим формализованные названия и использующим оригинальные названия только по пересекающимся названиям реакции биотрансформации представлены в Таблице 2
Практически для всех сравненных типов биотрансформаций точность прогноза при автоматическом способе формализации названий возросла, причем средняя точность прогноза увеличилась почти на 2% (а для БД Metabolism - на 3%)
Недостатком автоматической формализации является его зависимость от словаря фрагментов реакций, что не дает возможности выполнить прогноз по некоторым присутствующим в БД реакциям биотрансформации (например, реакция «Covalent Binding» не будет описана в словаре трансформаций, а будут описаны только «Protein Binding» и «DNA Binding»)
Таблица 2. Результаты прогноза для двух выборок В первой используются оригинальные названия из БД Metabolite, во второй используются _автоматически формализованные названия
Тип биотрансформации Оригинальные названия Формализовании е названия
Кол-во соед. IAP-LOO\% Кол-во соед. IAP- LOO*, %
Aliphatic Hydroxylation 1464 73.3 1977 81.8
Aliphatic Hydroxylation(Cytochrome P450) 427 75.1 516 81.2
Aliphatic Hydroxylation(Cytochrome 51 80.2 56 81.1
Aliphatic Hydroxyiation(Cytochrome 133 75.5 143 79.2
Aromatic Hydroxylation 1564 79.2 1485 81.6
Aromatic Hydroxylation(Cytochrome 71 85.2 69 87.1
C-Hydroxylation 2570 70.4 3104 76.3
C-Hydroxylation(Cytochrome P450) 840 75.0 804 77.5
Deacylation 32 86.6 90 98.0
Hydroxylation(Cytochrome P450) 72 75.9 880 76,7
N-Dealkylation 1663 87.6 789 92.1
N-Dearylation 35 81.5 63 97.2
N-Demethylation 757 92.2 273 97.1
N-Demethylation(Cytochrome P450) 203 88.6 56 94.3
N-Hydroxylation 179 86.4 505 88.7
O-Dealkylation 821 88.5 787 93.9
0-Dealkylation(Cytochrome P450) 199 86.9 156 87.2
O-Glucuronidation 1533 81.8 1837 87.0
S-Oxidation 486 91.7 171 94.8
.«•
В среднем 8742 so 7310 81.9
После обучения системы на созданных выборках можно выполнить прогноз типов биотрансформации для органического соединения. Ниже приведен пример прогноза для молекулы галоперидола, который выполнен на основе SAR base, построенной по обучающей выборке I (MNA 2) (см табл. 1)
Известные типы биотрансформации для галоперидола
Структура галоперидола и предсказанные для него типы биотрансформации
Aromatic Hydroxylation Aromatization
Aromatization(Cytochrome P450)
Aromatization(Cytochrome P450.CYP3A)
Aromatization(Reductase)
C-Oxidation
Cyanidation
Decarboxylation
Dehydration
Dehydration(Cytochrome P450) Dehydration(Cytochrome P450.CYP3A) Dehydration(Reductase) Dehydrogenation
Dehydrogenation(Cytochrome P450)
Dehydrogenation(Cytochrome
CYP3A)
Dehydrogenation(Reductase) Dehydroxylation
Dehydroxylation(Cytochrome P450) Dehydroxylation(CytochromeP450,CYP3A) Dehydroxylation(Reductase) Hydrogénation
Hydrogenation(Aldoketoreductase)
Hydrogenation(Carbonyl Reductase)
Hydrogenation(Cytochrome P450)
Hydrogenation(CytochromeP450,CYP2D6)
Hydrogenation(Cytochrome P450,CYP3A4)
Hydrogenation(Ketoreductase)
Hydrogenation(Reductase)
Hydrolysis
N-Dealkylation
N-Dealkylation(Cytochrome P450)
N-Dealkylation(Cytochrome P450,CYP3A4)
N-Dealkylation(Peroxidase)
N-Oxidation
Oxidation
Quatermzation
Quaternization(Cytochrome P4S0)
Quatermzation(Cytochrome P450.CYP3A)
Quatermzation(Reductase)
Reduction
Reduction(Aldoketoreductase) Reduction(Carbonyl Reductase) Reduction(Cytochrome P450) Reduction(Cytochrome P450,CYP2D6) Reduction(Cytochrome P450,CYP3A4) Reduction(Ketoreductase) Reduction(Reductase)
/=\ Q
Q /=\
a-
W //
w //
732 Possible of 2317 Biotransformations at Pt > Pu
Pt Pf for Biotransformation 0.996 0.002 N-Dealkylation (Cytochrome P450,CYP2C12) 0 996 0 002 N-Demethylation (Cytochrome P450.CYP2A2) 0.997 0 005 Dehydration (Cytochrome P450.CYP2E1)
0.996 0.004 Aromatization (Peroxidase) 0 991 0 003 N-Demethylation (Cytochrome P450,CYP2C6) 0.994 0.005 Reduction (Peroxidase) 0.994 0.008 Aromatic Hydroxylation (Monoamine Oxidase)
0.989 0.004 N-Dealkylation (Cytochrome P450.CYP2C6)
0.966 0.003 Dehydrogenation (Cytochrome P450.CYP2A6)
0.980 0.019 Oxidation (Peroxidase) 0.991 0.036 Oxidation (Lipoxygenase) 0.925 0.615 Reduction (Flavoprotem-Lmked Monooxygenase)
0.910 0.186 Dehydrogenation (Aldehyde Oxidase)
0.783 0.003 Quatermzation (Cytochrome P450) 0.727 0.198 Reduction (CytochromeP450,CYP2D6)
0.719 0.235 Reduction (N-Acetyltransferase) 0.672 0.029 Dehydration
0.622 0.079 Aromatic Hydroxylation 0.621 0.012 Dehydration (Cytochrome P4S0) 0.58S 0.041 Reduction (Cytochrome P4S0)
0.697 0 192 Epoxidation (N-Acetyltransferase) 0 608 0105 Optical Resolution (Cytochrome P450) 0.594 0.111 Cyanidation (Cytochrome P450) 0 590 0 098 Hydroxylation (Cytochrome P450,CYP1A1)
0.568 0.068 N-Oxidation (Cytochrome P450,CYP3A4)
0.549 0.055 Oxidation(Cytochrome P450,CYP2B1) 0.528 0.036 N-Dealkylation(Cytochrome P450,CYP3A4)_
Утолщенным шрифтом выделены спрогнозированные типы биотрансформации, у которых совпадает название реакции
биотрансформации с известным для этого соединения (левый столбец в Таблице) Курсивом и утолщенным шрифтом выделены спрогнозированные типы биотрансформации, у которых совпадает название реакции биотрансформации и метаболизирующие ферменты с известными для этого соединения
Как видно, на верхних строчках результатов прогноза, в основном, находятся типы биотрансформации, найденные экспериментально для галоперидола
3.2. Прогноз сайтов биотрансформации
Задача прогноза сайтов биотрансформации имеет существенное отличие от задачи прогноза типов биотрансформации В обоих случаях для прогноза необходимо иметь отрицательные примеры При прогнозе типов биотрансформаций отрицательными примерами являются все субстраты в обучающей выборке, которые не являются субстратами реакций данного типа биотрансформаций А при прогнозе сайтов биотрансформации есть проблема отсутствия отрицательных примеров Чтобы определить, в каком положении пойдет реакция, желательно иметь примеры положений, в которых эта реакция не произойдет Эти примеры и будут являться отрицательными В базах данных таких примеров нет Есть только реакции рассматриваемого типа биотрансформации (например, реакции ароматического гидроксилирования), которые рассматриваются алгоритмом прогноза как положительные, и реакции совершенно других типов биотрансформаций, которые не целесообразно брать как отрицательные, так как в них не отражено, в каком положении интересующая нас реакция биотрансформации не произойдет
Поэтому отрицательные примеры для задачи прогноза сайтов биотрансформации генерируются автоматически Например, при генерации отрицательных примеров ароматического гидроксилирования гидроксил будет добавлен ко всем свободным ароматическим углеродам После чего из полученной выборки удаляются положительные примеры, тем самым получается выборка, содержащая только отрицательные примеры
Обучающие выборки для прогноза сайтов биотрансформации создавались двумя способами В первом случае в качестве положительных примеров были взяты все реакции определенной биотрансформации (например, реакции Алифатического гидроксилирования) из базы данных Во втором случае происходил автоматический отбор реакций А именно -выделялись фрагменты структур субстрата и метаболита, изменяющиеся во время реакции После этого выделенный фрашент сравнивался с существующими в словаре фрагментов реакций Если искомый фрагмент был найден, то данная реакция рассматривалась в качестве положительного
примера. Эта процедура проводилась для отсечения многостадийных реакций
В Таблице 3 представлены характеристики выборок из БД Metabolite, использованные для прогноза на основе оригинальных названий биотрансформаций Как и в случае прогноза типов биотрансформации, был проведен эксперимент по выбору оптимального уровня дескрипторов для прогноза сайтов биотрансформации.
Из Таблицы 3 видно, что для прогноза метаболитов биотрансформации «Ароматическое гидроксилирование» лучше всего использовать четвертый уровень дескрипторов, а для остальных, напротив, RMNA4 дает наихудший результат Это связано с тем, что при прогнозе ароматического гидроксилирования для учета ароматического кольца целиком необходимо учитывать большее количество соседей, а для других реакций информации о ближайших соседях реакционного центра более чем достаточно для прогноза
Таблица 3. Характеристика выборок из БД Metabolite (положительные
примеры не отбираются) для прогноза метаболитов
Количество примеров IAP, %
Химическая трансформация положител отрицател RMNA2 RMNA3 RMNA4
Aliphatic Hydroxylation 2329 10849 71 41 76.12 76.41
Aromatic Hydroxylation 2773 5104 99.42 95.81 88.91
N-Demethylation 1100 352 82 74 78 21 73.91
O-Glucuronidation 1765 2257 98.47 97.81 97 25
При отборе положительных примеров произошло ухудшение точности почти для всех реакций Это можно объяснить тем, что, получая более «чистую» выборку, мы можем потерять часть положений, по которым пойдет реакция (например, если этот сайт указан совместно с сайтом другой реакции) Если не производится отбор положительных реакций, то сайты других реакций вносят свой вклад в дескрипторы, что может повысить точность прогноза (отличать положительные примеры от отрицательных становится проще)
После обучения систем на созданных выборках можно выполнить прогноз сайтов биотрансформации для органического соединения.
Для нового субстрата генерируются все возможные продукты определенной химической реакции, для каждой пары «субстрат-продукт» формируется набор ЯМЫА дескрипторов, и рассчитываются величины Р( и - вероятности того, что сгенерированный продукт будет и не будет являться метаболитом, соответственно.
В Таблице 4 приведен пример прогноза положения ароматического гидроксилирования для субстрата, приведенного на рис 4, при использовании обучающей выборки без отбора положительных примеров.
acid.
Все продукты были сгенерированы автоматически, после чего для них был выполнен прогноз. Серым цветом выделены ячейки, в которых находятся экспериментально найденные метаболиты этого субстрата (есть информация в БД).
В Таблице 4 приведен «идеальный случай», когда для экспериментально найденных метаболитов разность Р, - Ри положительная, для остальных продуктов реакции ароматического гидроксилирования -отрицательная. Средняя точность прогноза по всей выборке (см. табл. 3) составляет 76%.
Таблица 4. Прогноз сайта ароматического гидроксилирования для субстрата
3.3. Исследования устойчивости прогноза при модификациях обучающей выборки.
Состав и объем обучающей выборки существенным образом влияют на точность прогноза Анализ полученных ранее данных по робастности PASS (V V Poroikov et al., 2000) позволил предположить следующую полуэмпирическую формулу.
IA = !А,„У(1 + L7N_ + L+/N+) = A(1 - mJN_ - nu/N+)/(l + LJN_ + L+/N+),
где IA - инвариантная точность, связанная с инвариантной точностью прогноза (1) следующей формулой IA=2IAP-1, IAmf - предельно достижимая точность, N+ и N. - число положительных и отрицательных примеров, соответственно, т_ - количество примеров, ошибочно классифицированных как отрицательные (не найденные, еще не исследованные положительные примеры), т+ - количество примеров, ошибочно классифицированных как положительные, например, из-за ошибок в использованных для формирования выборки данных, или из-за ошибок исследователей, и т п. Коэффициенты L_ > 1 и L+ > 1 отражают разнообразие примеров в выборке, и чем оно больше, тем больше величина L+ и/или L_
Если предположить, что L+ и L_ не зависят или слабо зависят от N+ и N. то можно попытаться оценить числитель А(1 - m_/N_ - m+/N+) при изменении объема выборки с сохранением пропорций m7N_ и m+/N+ (включение/удаление положительных и/или отрицательных примеров независимо от результатов прогноза) через оценку асимптотического поведения знаменателя (1 + L_/N_ + L+/N+).
Изменения объема выборки с сохранением пропорций m_/N_ и m+/N+ можно добиться, удаляя случайным образом субстраты, т е. и положительные и отрицательные примеры с их участием Это эксперимент №2 (МИ""" 'Г-^'п) по модификации обучающей выборки. Другие исследованные в диссертационной работе способы модификации обучающей выборки
Эксперимент №1 (т—- , г,т—,-гт'.■""!) - из обучающей выборки случайным образом удалялась часть положительных примеров (они автоматически попадали в отрицательные примеры);
Эксперимент №3 (шимд^ ..............- из обучающей выборки
случайным образом удалялась часть положительных примеров
Эксперимент №4 (ииюо i) - из обучающей выборки
случайным образом удалялась часть отрицательных примеров
Оценка точности прогноза была выполнена с усреднением 100 реализаций каждой модификации обучающей выборки на основе инвариантного критерия точности по методу скользящего контроля с исключением по одному
Резкими «Алифатическое гидрокеилирование» и «О-глюкуронидация» прогнозируются достаточно хорошо даже при значительных модификациях выборки (см. Табл. 5), поэтому эксперименты по расчету предельно достижимой точности для этих реакций не проводились.
Реакции «Ароматическое гидроксилирование» и «М-деметшшрование» прогнозируются хуже. Результаты экспериментов представлены в Таблице 6,
Таблица 5. Зависимость от объема ныборки точности прогноза метаболитов для двух реакций биотрансформации.
20% 40% 60% 80% 100%
Эксперимент № 1
Aliphatic Hydroxylation 81.6 87.5 89.3 94.67 99.4
О -G1 ucuroni dat i on 76.6 81.3 85.8 92.8 98.47
Эксперимент №2 r ■ yf
Aliphatic Hydroxylation 97,7 98.0 98.2 98.7 99.4
О- G luc uro nidation 95.7 96.9 97.8 98.1 98.47
Таблица 6. Сводная таблица зависимости точности прогноза метаболитов от состава выборки для двух реакций биотрансформации.
50% 60% 70% 80% 90% 100%
Aromatic Hydroxylation , ------ -. , .- . ;
Эксперимент №1 63.07 65.2 67.76 70.0 73.2 76.4
Эксперимент №2 70.62 72.0 73.5 74.2 75,4 76.4
Эксперимент №3 74.6 74.97 75.53 76.05 76,27 76.4
Эксперимент №4 72.0 73.13 74.12 75.06 75.9 76.4
N-Demethylation HsSifcifc .OÁlí; ".i тш
Эксперимент №1 58.66 60.70 63.12 67.66 72.03 82.70
Эксперимент №2 76.3 78.7 79.9 80.7 81.8 82.70
Эксперимент №3 82.4 82.65 82.74 82.65 82.69 82.70
Эксперимент №4 81.1 82.4 81.9 82,37 82.58 82.70
По данным Таблицы 6 были рассчитаны предельно достижимые точности прогноза. Для этого мы построили графики зависимостей 50/(1АР-50) от 1/(1-р), где р - доля отбрасываемых данных.
Для реакции «Ароматическое гидроксилирование» получены оценки: предельно достижимая точность прогноза = 86.07% , Ь-ЛчГ- = 0.09 (Хо=459 ), и/И, =0,26 (Ь+=720).
Для реакции «М-демег вотирование» получены оценки: предельно достижимая точность прогноза = 92.67%, ЬЖ = 0.23 (Ь=81), Ь+/Ы- =0,29 а.-319).
Aromatic Hydroxylation
141-Р)
Рис. 5. Аппроксимация данных прогноза по трем экспериментам на бесконечный объем выборки для реакции «Ароматическое гидроксилирование»
N-Demethylation
y»o.3W4x+iim*
у В 0.0951X4-1.4428
________ __^^^а•*" ■ —— — — — ■
у = 0Л121х + 1 515
♦ ЗксмримелМв
* Эксперимент №3
Эксперимент №4
■—■—Линейный (Эксперимент №2)
— -Линейный (Эксперимент №3)
— * Линейный (Экемдаект ОД
а 0.6 1 и 2 2 л
1К-Р)
Рис. 6. Аппроксимация данных прогноза по трем экспериментам на бесконечный объем выборки для реакции «Ы-деметилирование»
Как видно, предельно достижимая точность для двух исследуемых реакций примерно на 10% больше, чем достигнутая в настоящее время. Пополняя обучающую выборку новыми данными по этим реакциям биотрансформации, можно увеличить точность прогноза метаболитов этих реакций
4. ВЫВОДЫ
1 Разработан метод генерации продуктов биотрансформации 2. Разработанный метод прогноза типов биотрансформации позволяет по структурной формуле органического соединения выполнить прогноз типов биотрансформации, включая ферментные системы и изоформы ферментов, участвующие в биотрансформации, со средней точностью более 85%
3 Разработанный метод прогноза метаболитов (прогноз сайтов биотрансформации) позволяет по структуре субстрата с учетом реакции биотрансформации прогнозировать возможные метаболиты со средней точностью более 80%.
Созданные RMNA дескрипторы отражают изменения в субстрате в ходе биотрансформации.
4 Исследования устойчивости прогноза при модификации обучающей выборки показали, что даже при удалении 50% объема выборки точность прогноза для некоторых реакций остается выше 85%. Рассчитанная предельно достижимая точность прогноза сайтов ароматического гидроксилирования и N-деметилирования составила 86% и 92% соответственно.
Публикации по теме диссертации
1 Borodina Yu., Sadym A (Rudik А V.), Filimonov D., Blinova V, Dmitnev
A, Poroikov V. Predicting Biotransformation Potential from Molecular Structure // J Chem. Inf Comput Sci.- 2003 - Vol 43( 5) - P. 1636-1646
2 Бородина Ю.В., Садым A.B. (Рудик А В ), Филимонов Д А, Поройков
B.В. Компьютерный прогноз биотрансформации ксенобиотиков //Аллергия, астма и клиническая иммунология.- 2003- Т 7 (8).- С 85-89
3 Sadym A.V. (Rudik AV), Borodina YuV, Filimonov DA, Poroikov V V., Dmitriev A., Blmova V Computer predicting of dng-like substances' metabolism, from biotransformation reactions to metabolic network.// Abstr. 4th International Symposium on Pharmaceutical Chemistry - Istanbul (Turkey).-2003-P 259-260
4. Y Borodina, A. Sadym (A. Rudik), D. Filimonov & V. Poroikov Computer predicting of biotransformation potential from molecular structure //Abstr Computational Methods in Toxicology and Pharmacology. Integrating Internet Resources (CMTPI-2003) - Greece -2003 -P 39.
5. A.V Sadym (Rudik A.V.), Y V. Borodina, A Dmitnev, V G Blmova, D.A Filimonov, V V. Poroikov Computer generation of metabolites for drug-like molecules.//Abstr. Computational Methods m Toxicology and Pharmacology Integrating Internet Resources (CMTPI-2003). - Greece -2003 - P 67.
6 Бородина Ю В , Садым А В (Рудик А В ), Филимонов Д А, Поройков
B.В Компьютерный прогноз биотрансформации лекарственных веществ// Сборник трудов X Российского национального конгресса «Человек и лекарство» . - Москва - 2003. - С. 697
7. Бородина Ю.В., Рудик А В , Филимонов Д А, Блинова В.Г, Дмитриев А.В., Харчевникова Н.В, Поройков В В Компьютерный прогноз биотрансформации ксенобиотиков.//Сборник материалов ХП Международной конференции и дискуссионного научного клуба «Новые информационные технологии в медицине, биологии, фармакологии и экологии» - Гурзуф (Украина) - 2004 - С 77-79
8 Рудик А.В., Бородина Ю.В, Дмитриев А В., Филимонов Д А, Поройков В.В., Блинова В.Г., Харчевникова НВ. Компьютерный прогноз биотрансформации по структуре химических соединений// Сборник материалов XI Российского национального конгресса «Человек и лекарство -Москва -2004 — С 891.
9 А V Dmitriev, A.V.Rudik, Y.V Borodma, D A. Fihmonov, V.V Poroikov, VG. Blinova, N.V. Kharchevnikova. Computer predicting of aromatic hydroxylation site for drug-like compounds. //Abstr The 15th European Symposium on Quantitative Strukture-Activity Relationships & Molecular Modelling (Euro QSAR 2004). - Turkey. - 2004 - P. 104.
10.Borodina Yu., Rudik A., Filimonov D., Kharchevnikova N , Dmitriev A, Blinova V., Poroikov, V A New Statistical Approach to Predicting Aromatic Hydroxylation Sites. Comparison with Model-Based Approaches.// J. Chem Inf Comput. Sci -2004. - Vol. 44(6) - P. 19982009
11.Поройков B.B., Филимонов Д.А., Бородина ЮВ., Рудик А В. Свидетельство об официальной регистрации программы для ЭВМ METAPREDICT № 2004610666 от 12 марта 2004 г., Москва Российское агенство по патентам и товарным знакам
12 Дмитриев А.В, Харчевникова Н.В, Рудик А В., Поройков ВВ. Разработка метода для предсказания региоселективности изоформы ЗА4 цитохрома Р450 // Сборник материалов XII Российского национального конгресса «Человек и лекарство» . - Москва. - 2005. -
C. 750.
13 Дмитриев А В , Рудик А.В , Блинова В Г ,Филимонов Д А, Поройков В В Предсказание классов биотрансформации ксенобиотиков на основе базы фрагментов. // Сборник материалов Х1П Российского национального конгресса «Человек и лекарство» . - Москва - 2006 -С 14
14 Рудик А В , Филимонов Д.А., Поройков В.В Анализ устойчивости алгоритма прогноза сайтов биотрансформации органических ксенобиотиков // Сборник материалов XIV Российского национального конгресса «Человек и лекарство» - Москва - 2007. -С. 315
15 Дмитриев А.В , Рудик A.B., Блинова В.Г, Филимонов Д А, Поройков В.В Предсказание сайтов биотрансформации окисления с использованием программы Metapredict и набора фрагментов // Сборник материалов XIV Российского национального конгресса «Человек и лекарство» - Москва - 2007 - С. 283
ь
Подписано в печать 24 05 2007 г. Печать на ризографе Тираж 100 экз Заказ № 395 Объем 1,1 п л Отпечатано в типографии ООО "Алфавит 2000", ИНН. 7718532212, г. Москва, ул Маросейка, д 6/8, стр. 1, т 623-08-10, www.alfavit2000.ru
Содержание диссертации, кандидата биологических наук, Рудик, Анастасия Владимировна
ВВЕДЕНИЕ.
Цель и задачи исследования.
ГЛАВА 1. ОБЗОР ЛИТЕРАТУРЫ.
1.1. Экспериментальные методы исследования метаболизма веществ.
1.1.1. Методы оценки метаболической стабильности in vitro.
1.1.2. Определение структуры метаболитов.
1.1.3. Определение метаболизирующих ферментов.
1.2. Способы описания структурной химической информации.
1.3. Дескрипторы.
1.4. Форматы описания структуры химических соединений.
1.4.1. Формат MDL Elsevier.
1.4.2. Формат SMILES.
1.4.3. Формат InChI.
1.5. Компьютерные методы прогноза биотрансформации.
1.5.1. Методы молекулярного моделирования.
1.5.2. Квантово-химические методы.
1.5.3. Метод нейронных сетей.
1.5.4. ДСМ метод.
1.5.5. Методы, прогнозирующие продукты биотрансформации.
A. Эмпирический подход.
Описание трансформационных преобразований.
Поиск и замена фрагмента в структуре химического соединения.
Оценка полученных продуктов.
Критерий останова процесса генерации метаболитов.
B. Неэмпирические подходы.
Подход, основанный на BE матрицах.
Метод программы SYNGEN.
ГЛАВА 2. МАТЕРИАЛЫ И МЕТОДЫ.
База данных Metabolite (Elsevier, MDL).
База данных Metabolism (Accelrys).
2.1. Метод генерации продуктов биотрансформации.
2.1.1. Словарь фрагментов.
2.1.2. Алгоритм поиска и замены фрагмента в структуре химического соединения
2.2. Метод прогноза типов биотрансформации.
2.2.1. Формализация названий типов биотрансформации.
2.2.2. Дескрипторы MNA.
2.2.3. Алгоритм программы PASS.
2.2.4. Анализ точности прогноза.
2.3. Метод прогноза сайтов биотрансформации.
2.3.1. Дескрипторы RMNA.
Глава 3. РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ.
3.1. Метод компьютерного прогноза типов биотрансформации ксенобиотиков.
3.1.1. Создание обучающих выборок, содержащих структуры веществ и данные о типах биотрансформации.
3.1.2. Исследование применимости алгоритма PASS для прогноза типов биотрансформации.
3.2. Метод компьютерного прогноза сайтов биотрансформации.
3.2.1. Создание обучающих выборок, содержащих структуры веществ и данные о сайте биотрансформации.
3.2.2. Исследование применимости алгоритма PASS для прогноза сайтов биотрансформации и метаболитов.
ГЛАВА 4. ПРОВЕРКА УСТОЙЧИВОСТИ АЛГОРИТМА ПРОГНОЗА.
ГЛАВА 5. ИНТЕРФЕЙС ПРОГРАММЫ METAPREDICT.
Введение Диссертация по биологии, на тему "Компьютерный прогноз биотрансформации ксенобиотиков"
Стремительные темпы развития промышленности приводят к появлению огромного количества разнообразных химических соединений, постоянно загрязняющих биосферу и пагубно влияющих на живую природу. Эти вещества могут взаимодействовать друг с другом, образуя новые соединения с неизвестными токсикологическими характеристиками [1].
Чужеродные для организма соединения (которые не используются ни для производства энергии, ни для выработки тканевых компонентов, не являются химическими посредниками или кофакторами) называют ксенобиотиками (от греч. хепо -чужой) [2,3].
Биохимический процесс изменения структуры соединения под действием ферментной системы получил название биотрансформации или метаболизма веществ [2, 4, 5]. Исходное соединение называют «субстрат биотрансформации», получившийся продукт - «метаболит биотрансформации». Один субстрат, как правило, преобразуется не в один, а в несколько метаболитов, в результате чего получается метаболическая сеть, пример которой для нитразепама - психотропного лекарственного вещества из ряда бенздиазепинов, - приведен на рисунке 1 [6]. и Н
Рисунок 1. Метаболическая сеть нитразепама.
Интерес к биотрансформации органических ксенобиотиков, среди которых лекарства занимают особое место по важности для человека и по контролю за их безопасностью, вызван многими причинами. Образующиеся в результате реакции биотрансформации метаболиты могут быть более токсичными, чем исходные соединения, или проявлять нежелательные побочные эффекты, а могут быть и более фармакологически активными.
Примеры возможных путей биотрансформации приведены ниже:
1) Инактивация, в течение которой активное лекарство преобразуется в неактивный метаболит. Пример - фенобарбитал (обладающий противосудорожным, снотворным действием) в ходе реакции гидроксилирования превращается в гидроксифенобарбитал [7].
2) Активация, в течение которой неактивное лекарство (пролекарство) преобразуется в фармакологически активный первичный метаболит. Примером может служить гетацилин (Hetacillin) в исходном состоянии не обладающий антибактериальной активностью, а после гидролиза преобразующийся в антибиотик ампицилин (Ampicillin) [8,9].
3) Модификация активности, после превращения активного лекарства в метаболит, который также обладает фармакологической активностью. Например, морфий (Morphine) (анальгетик) после реакции глюкуронидации метаболизируется в морфий-6-глюкоронид (M6G) (Morphine-6-glucuronide) (анальгетик) [10,11].
4) Интоксикация (летальный синтез), при которой образуются токсичные матаболиты. Например, парацетамол (Acetaminophen) после окисления превращается в токсичный нестабильный метаболит (N-ацетил-п-аминобензохинон) (NAPQI). При истощении запасов глютатиона, который его инактивирует, NAPQI связывается с белками плазмы с образованием комплексов, вызывающих некроз клеток [12-14].
Как правило, метаболизм ксенобиотиков проходит в две фазы. Реакции первой фазы обусловливают специфическую перестройку в молекуле субстрата с образованием функциональных групп [5]. Биотрансформация в ходе таких реакций обычно предшествует реакциям конъюгации (II фаза). Пример ферментных систем, ответственные за прохождение определенных реакций первой фазы биотрансформации, представлен в таблице 1 [4].
Таблица 1. Основные реакции и ферментные системы 1-ой фазы биотрансформации ксенобиотиков.
Реакция Ферментные системы
Окисление алкоголь дегидрогеназа альдегид дегидрогеназа альдегид оксид аза ксантин оксид аза моноамин оксидаза диамин оксидаза простагландин Н синтаза рибофлавин-монооксигеназы цитохром р450
Восстановление азо и нитро редуктаза карбонил редуктаза дисульфид редуктаза сульфоксид редуктаза бензохинон редуктаза редуктивная дегалогеназа
Гидролиз эстеразы пептидазы эпоксид гидролазы
Вторую фазу (конъюгацию) выполняют, в основном, глюкоронозидтрансферазы, ацетилтрансферазы, сулфотрансферазы, метилтрансферазы, глютатионтрансферазы и аминокислотные трансферазы.
Исследование процесса биотрансформации включает анализ образующихся метаболитов, их стабильности, и определение ферментов, осуществляющих реакции биогрансформации, что важно для изучения зависимости от локализации в органах и тканях действия лекарств и исследования совместимости лекарственных средств.
Существующие экспериментальные методы in vitro и in vivo - сложный, дорогостоящий, трудоемкий и длительный процесс, возможности проведения экспериментов в клинике весьма ограничены, а результаты изучения биотрансформации in vitro и in vivo не всегда совпадают с таковыми для человека.
Компьютерные методы позволяют прогнозировать биотрансформацию и метаболиты органических соединений на основе химической структуры их молекул еще до проведения химического синтеза и биологического тестирования [15], что, благодаря сокращению количества соединений, которые будут подвергнуты биологическому тестированию, позволяет сократить время и затраты на разработку новых лекарств.
В настоящее время известно несколько компьютерных методов прогноза возможных путей биотрансформации органических ксенобиотиков [15-18]. Это, прежде всего, методы молекулярного моделирования. Они ориентированы на изучение механизмов взаимодействия определенных ферментов с субстратами. Основным их недостатком является продолжительность расчетов и необходимость использования мощных вычислительных ресурсов, что не приемлемо для высокопроизводительного скрининга. Помимо этого, необходимы данные о трехмерной структуре, как субстрата, так и фермента, информация о которых во многих случаях не доступна.
Экспертные системы для предсказания метаболизма основаны на формализации знаний экспертов и предсказывают возможные метаболические сети. Их недостатком является генерирование большого количества метаболитов, отсев которых также основан на экспертных знаниях, и, как правило, они не предсказывают ферменты, которые могут осуществлять реакции биотрансформации [17].
Цель и задачи исследования
Цель диссертационной работы - разработка нового метода компьютерного прогноза биотрансформации органических ксенобиотиков по структурным формулам.
Метод должен быть высокопроизводительным, предсказывать реакции биотрансформации и осуществляющие их ферменты, предсказывать возможные метаболиты и оценивать точность предсказания.
В ходе выполнения работы решались следующие задачи:
1. Разработать метод генерации продуктов биотрансформации.
2. Разработать метод прогноза типов биотрансформации.
3. Разработать метод прогноза сайтов биотрансформации и метаболитов.
4. Исследовать устойчивость прогноза при модификациях обучающей выборки.
Заключение Диссертация по теме "Биоинформатика", Рудик, Анастасия Владимировна
ВЫВОДЫ
1. Разработан метод генерации продуктов биотрансформации.
2. Разработанный метод прогноза типов биотрансформации позволяет по структурной формуле органического соединения выполнить прогноз типов биотрансформации, включая ферментные системы и изоформы ферментов, участвующие в биотрансформации, со средней точностью более 85%.
3. Разработанный метод прогноза метаболитов (прогноз сайтов биотрансформации) позволяет по структуре субстрата с учетом реакции биотрансформации прогнозировать возможные метаболиты со средней точностью более 80%. Созданные дескрипторы ЮЖА отражают изменения в субстрате в ходе биотрансформации.
4. Исследования устойчивости прогноза при модификации обучающей выборки показали, что даже при удалении 50% объема выборки точность прогноза для некоторых реакций остается выше 85%. Рассчитанная предельно достижимая точность прогноза сайтов ароматического гидроксилирования и М-деметилирования составила 86% и 92% соответственно.
БЛАГОДАРНОСТИ
Автор выражает искреннюю признательность научному руководителю к.ф-м.н. Д.А. Филимонову, а также к.х.н. В.Г. Блиновой за помощь в создании словаря фрагментов, аспиранту А.В. Дмитриеву за создание совместно с В.Г. Блиновой классификации реакций биотрансформации, фирме MDL Information Systems, Inc. за предоставление возможности использования ISIS/Base и базы данных Metabolite.
Работа выполнена при частичной поддержке государственного контракта с Федеральным агентством по науке и инновациям №43.07.1.1.2530.
ГЛАВА 6. ЗАКЛЮЧЕНИЕ
В результате выполненной работы был создан метод и компьютерная программа METAPredict для прогноза биотрансформации лекарственных соединений. В основу системы положен метод анализа связей «структура-активность», используемый в программе PASS (Prediction of Activity Spectrum for Substances). Созданная программа METAPredict позволяет прогнозировать типы биотрансформации, где, помимо названия реакции биотрансформации, используются названия семейств ферментов и изоферментов. Эта информация важна как для изучения поведения органических ксенобиотиков в различных органах и тканях, так и для исследования совместимости лекарственных средств.
Помимо этого для некоторых реакций биотрансформации генерируются метаболиты и оценивается вероятность их образования. Основу метода генерации метаболитов составляет разработанный и созданный в полуавтоматическом режиме словарь фрагментов реакций, отражающий структурные изменения в субстрате в ходе реакции биотрансформации.
Созданная программа METAPredict может быть использована на ранних этапах разработки лекарственных препаратов с целью оптимизации экспериментальных исследований соединений.
Программа METAPredict (прогноз классов биотрансформации, язык программирования: Object Pascal в среде Delphi; ОС: Windows 98/XP/NT) официально зарегистрирована в РОСПАТЕНТЕ за номером 2004610666.
Библиография Диссертация по биологии, кандидата биологических наук, Рудик, Анастасия Владимировна, Москва
1. Общая токсикология, Под редакцией Б. А. Курляндского, В. А. Филова, Медицина, 2002 г., 608 стр.
2. Парк Д., Биохимия чужеродных соединений, «Медицина», Москва, 1973
3. В. М. Юрин "Основы ксенобиологни", учебное пособие, Минск, БГУ, 2001,234 с.
4. Wermuth С. G. et al., Glossary of terms used in medicinal chemistry, Ann. Rep. Med. Chem. 1998,33,385-395.
5. Лакин К. M., Крылов Ю. Ф., Биотрансформация лекарственных соединений. Москва, "Медицина", 1981,342с.
6. Shutzt H Benzodiazepines: A Handbook, N.Y., Berlin, Heidelberg: Springer-Verlag, 1982
7. Hadama A, Ieiri I, Monta T, Kimura M, Urae A, Irie S, Kaneda T, Mamiya K, Tashiro N, Higuchi S, Otsubo K. P-hydroxylation of phénobarbital: relationship to (S)-mephenytoin hydroxylation (CYP2C19) polymorphism, Ther Drug Monit. 2001 Apr;23(2):l 15-118.
8. Levy GN, Ioia JV, Kuchinskas EJ. Interconversion of ampicillin and hetacillin in vitro. J Pharm Sci. 1974 Aug;63(8):l 197-1201.
9. Wittwer E, Kern SE. Role of morphine's metabolites in analgesia: concepts and controversies. A APS J. 2006 May 26;8(2):E348-52. Review.
10. Benson GD, KoffRS,Tolman KG. The therapeutic use of acetaminophen in patients with liver disease, J Ther. 2005 Mar-Apr; 12(2): 133-41.
11. Toes MJ, Jones AL, Prescott L., Drug interactions with paracetamol.,J Ther. 2005 Jan-Feb;12(l):56-66
12. E.Gillam, The dark side of a 'detoxification' mechanism, TRENDS in Pharmacological Sciences Vol. 22 No.l January 2001
13. H. Waterbeemd and E. Gifford, ADMET in silicomodelling: towards prediction paradise, NATURE REVIEWS: Drug Descovery, 2003, Vol.2,192-204.
14. G. Terstappen and A. Reggiani, In silico research in drug discovery, RENDS in Pharmacological Sciences Vol. 22 No.l January 2001
15. Langowski J., Long A., Computer system for the prediction of xenobiotic metabolism, Advanced Drug Delivery Reviews, 2002, 54,407-415.
16. A. Rostami-Hodjegan and G. Tucker, Simulation and prediction of in vivo drug metabolism in human populations from in vitro data, NATURE REVIEWS: Drug Descovery, 2007, Vol.6,140-148.
17. FerreroJ.L, Brendel K. (1997) Adv. Pharmacol. 43,131 -169.
18. Fisher R.L., UlreichJ.B., Nakazato P.Z., Brendel K. (2001) Toxicol. Methods 11(2), 59-79.
19. Vanhulle V.P., Martial G.A., Verbeeck R.K., Horsmans Y., Calderon P.B., Eeckhoudt S.L.
20. Ekins S., Ring B.J., Grace J., McRobie-Belle D.J., Wrighton S.A. (2000) J. Pharm. Toxicol.Methods 44(1), 313-324.
21. Cross DM., Bayliss MX. (2000) Drug Metab. Rev. 32(2), 219-240.
22. Guillouzo A., Rialland L., Fautrel A., Guyomard C (1999) Chem.-Biol. Interact. 121(1), 716.
23. Li A,P. (1999) Chem.-Biol. Interact. 121(1), 1-5.
24. Umehara K., Kudo S., Hirao Y„ Morita S., Uchida M., Odomi M., Miyamoto G. (2000)
25. CrespiC.L. (1999) Curr. Opin. Drug Discov. Dev. 2(1), 15-19.
26. Caldwell G. W., MasucciJ.A., Chacon E. (1999) Comb. Chem. High Throughp. Scr. 2(1),39-51.
27. WattA.P., Morrison D., Evans D.C (2000) Drug Discovery Today 5(1), 17-24.
28. White R.E. (2000) Annu. Rev. Pharm. Toxicol. 40,133-157.
29. CoxK.A., Clarke N.J., RindgenD., Korfinacher W.A. (2001) Am. Pharm. Rev. 4(1), 45-46.
30. ZhouL., Thakker D.R., Voyksner R.D., AnbazhaganM., Boykin D.W., Hall J.E., TidwellR.R. (2004) J. Mass Spectrom. 39(4), 351-360.
31. YuX., CuiD., Davis M.R. (1999) J. Am. Soc. Mass Spectrom. 10(2), 175-183.
32. Lopez L.L., YuX., CuiD., Davis M.R. (1998) Rapid Commun. Mass Spectrom. 12(22),1756-1760.
33. Fernandez-Metzler C.L, Owens K.G., Baillie T.A., KingR.C. (1999) Drug Metab. Dispos.
34. Owens K.G. (1991) Appl. Spectrosc. Rev. 27(1), 1 -49.
35. Van Breemen R.B., Nikolic D., Bolton J.L. (1998) Drug Metab. Dispos. 26(2), 85-90.
36. Nikolic D., Fan P. W., Bolton J.L, Van Breemen R.B. (1999) Comb. Chem. High Throughp.Scr. 2(3), 165-175.
37. Nikolic D., Habibi-Goudarzi S., Corley D.G., Gainer S., Pezzuto J.M., Van Breemen R.B.(2000) Anal. Chem. 72(16), 3853-3859.
38. Wilson I.D., Nicholson J.K., Lindon J. С (1999) in: Handbook of Drug Metabolism: The role of nuclear magnetic resonance spectroscopy in drug metabolism (T.F.Woolf ed.)Marcel Dekker Inc., New York, pp. 523-550.
39. Dear G.J., Plumb R.S., Sweatman B.C., Parry P.S., Roberts A.D., Lindon J.C., NicholsonJ.K., Ismail JM. (2000) J. Chromatogr.; B: Biomed. Sei. Appl. 748(1), 295-309.
40. Dear G.J., Plumb R.S., Sweatman B.C., Ayrton J., Lindon J.C, Nicholson J.K., Ismail I. M.(2000) J. Chromatogr.; B: Biomed. Sei. Appl. 748(1), 281-293.
41. Lindon J.C, Nicholson J.K., Wilson I.D. (2000) J. Chromatogr.; B: Biomed. Sei. Appl.748(l), 233-258.
42. Erhardt P. W. (2002) in: High-throughput ADMETox estimation (F.Darvas and G.Dormaneds.) BioTechniques Press, pp. 49-68.
43. Бутлеров A.M. Избранные работы по органической химии. М.: Изд. АН СССР, 1951
44. A.Vedani, М. Dobler, 5D-QSAR: the key for simulating induced fit?, J. Med. Chem, 2002 May 23;45(ll):2139-49.
45. SYBYL Overview Brochure (http://www.tripos.com/data/SYBYL/SYBYLBH.pdf)48. http://www.hyper.com/,
46. Getting Started with Spartan, Wavefunction, Inc., 2004,290 p.
47. Barone R., Chanon M. A Computer-Assisted Synthesis Design (CASD), in:Gasteiger (Ed). Handbook of Chemoinformatics, WILEY-VCH, Weinheim, 2003
48. Balaban, A.T., Chem. Phys. Lett., 1982,89,399
49. Randic M, Croat.Chem. Acta. 1993,66,2853. http://www.mdl.com/downloads/public/ctfile/ctfile.pdf54. http ://www.daylight.com/dayhtml/doc/theory/theory.smiles.html55. http://www.iupac.org/inchi/56. http://www.daylight.com/smiles/
50. Lewis D., COMPACT: a structural approach to the modeling of cytochromes P450 and their interactions with xenobiotics, J. Chem. Technol. Biotechnol. 2001,76,237-244.
51. Jones J.P., Mysinger M. and.Korzekwa K.// Drug Metabolism and Disposition 2002.-Vol.30, N1.- P.7-12
52. The Camitro Corporations http://www.camitro.com
53. Evelyn Jabri, P450 on Drugs, Nat Struct Biol. 2003 Aug;10(8):587
54. Smith D, Ackland M., Jones В., Properties of cytochrome P450 isoenzymes and their substrates. I. Active site characteristics, Drug Dev. Today, 1997,2,479-486
55. Jones, В. C.; Hawksworth, G.; Home, V. A.; Newlands, A. Morsman, J.; Tute, M. S.; Smith, D. A. Putative active site template model for cytochrome P4502C9 (tolbutamide hydroxylase). Drug Metab. Dispos. 1996,24,260 266.
56. Cruciani G, Carosati E, De Boeck B, Ethirajulu K, Mackie C, Howe T, Vianello R., MetaSite: Understanding Metabolism in Human Cytochromes from the Perspective of the Chemist, J. Med. Chem. 2005 Nov 3; 48(22):6970-9.
57. Korzekwa K. R., Trager W., Gouterman M., Sprangler, P. and Loew G. H. J. Amer. Chem. Soc. -1985. -Vol. 107. P. 4273 -4279
58. Singh S., Shen L., Walker M., A Model for Predicting Likely Sites of CYP3A4-mediated Metabolism on Drug-like Molecules. J. Med. Chem., 2003,46, 1330-1336
59. Swingler K., Applying neural networks. A Practical Guide, Academic Press Inc., 1996
60. Korolev D., Balakin K., Nikolsky Yu., Ivanenkov Y., Savchuk N., Ivashchenko A., Nikolskaya Т., Modeling of Hyman Cytochrome P450-Mediated Metabolism Using Unsuprised Machine Learning Approach, J. Med. Chem., 2003,46(17):3631-43.
61. Chemical Diversity Labs. Inc., 2002 http://www.chemdiv.com70. http://www.nd.com
62. В.Г.Блинова, З.И.Жолдакова, Н.В.Харчевникова., Прогноз токсичности замещенных бензолов с помощью ДСМ-метода автоматического порождения гипотез и квантовохимических расчетов. Хим-фарм журнал,
63. Т.Гергей, В.К.Финн, Экспертные системы: состояние и перспективы, под ред. Д.А.Поспелова, Наука, Москва (1989) сс.9-20.
64. Фабрикантов Е.Ф., Применение ДСМ рассуждений для интеллектуального анализа данных и автоматического порождения гипотез о путях биотрансформаций, Информ. процессы и системы, 2002, №2
65. V.A.Avidon, J.A.Pomerantsev, V.E.Golender, A.B.Rozenblit, J. Chem. Inf. Сотр. Sci., 22, 207-214(1982).
66. Авидон B.B., Лексина Л.А. НТИ, Сер. 2,1974, № 3, с. 22-25.
67. Авидон В.В. Хим.-фарм.журн., 1974, № 8, с. 22-25.
68. Зефиров Н.С., Компьютерный синтез. Соровский образовательный журнал, 1997 №7
69. Klpman G., Dimayuga М., Talafous J., МЕТА 1. A program for the evaluation of metabolic transformation of chemicals, J. Chem. Inf. Сотр. Sci., 1994,34,1320-1325.
70. Testa B, Balmat AL, Long A, Judson P. Predicting drug metabolism~an evaluation of the expert system METEOR, Chem. Biodivers. 2005 Jul; 2(7):872-885.
71. МЕТА V. A model of photodegradation for the prediction of photoproducts of chemicals under natural-like conditions. Chemosphere. 2001 Nov;45(6-7):971-81.
72. Talafous J, Sayre LM, Mieyal JJ, Klopman G., META. 2. A dictionary model of mammalian xenobiotic metabolism. J. Chem. Inf. Сотр. Sci., 1994 Nov-Dec;34(6):1326-33.
73. Wang Ke, Wang L., Yuan Q., Luo Sh., Yao J., Yuan Sh., Zheng Ch., Brandt J., Constructuin of generic reaction knowledge base by reaction data mining, J. Mol. Grphics Modell, 2001,19(5), 427-433.
74. М.И. Нечепуренко, B.K. Попков, C.M. Майнагашев и др, Алгоритмы и программы решения задач на графах и сетях, «Наука», Новосибирск, 198884. http://umbbd.ahc.umn.edu/predict
75. Нои Во, Wackett L., Ellis L., Microbial Pathway Prediction: A Functional Group Approach, J. Chem. Inf. Сотр. Sci., 2003,43,1051-1057
76. Button W., Judson Ph., Long A., Vessey J., Using Absolute and relative reasoning in the Prediction of the potential Metabolism of Xenobiotics, J. Chem. Inf. Сотр. Sci. 2002, A-G
77. Klpoman G., Tu M., Talafous J., META 3. A Genetic Algorithm for Metabolic Transform Priorities Optimization, J. Chem. Inf. Сотр. Sci., 1997,37,329-334
78. Darvas F., Predicting metabolic pathways by logic programming, J. Mol. Graphics, 1988, 6,80-86.
79. Socorro IM, Taylor K, Goodman J M. ROBIA:A Reaction Prediction Program, Org Lett. 2005 Aug 4;7(16), p 3541-3544.
80. Socorro IM, Goodman J M. The ROBIA program for predicting organic reactivity.
81. J.C. Bart, E.Garagnagi, Z. Naturforsh. 1976,32b, 678-683
82. J. Blair, J. Gasteiger, C. Gillespie, P.D. Gillespie, I.Ugi, Computer Representation and Manipulation of Chemical Information, W.T.Wipke, S.R. Heller, R.J. Feldmann, E.Hyde, Eds.; Wiley: New York, 1974, pp.129-145
83. The Philosophy of EROS (http://www2.chemie.uni-erlangen.de/software/eros/manual/manual-01.html)
84. J.B. Hendrickson, T.L. Sander, Chem. Eur. J., 1995,1,4449-45395. http://www.mdl.com/products/metabolitelit.html96. www.accelrys.com
85. D.R. Hawkins (Ed.), Biotransformations, Vol. 1-7, Royal Society of Chemistry, Cambridge, UK, 1988-1996.
86. Sadym A, Lagunin A, Filimonov D, Poroikov V. Prediction of biological activity spectra via the Internet. SAR QSAR Environ Res. 2003 Oct-Dec;14(5-6):339-47. Review.
87. Filimonov D., Poroikov V., Borodina Yu., Gloriozova T. Chemical Similarity Assessment through Multilevel Neighborhoods of Atoms: Definition and Comparison with the Other Descriptors. J. Chem. Inf. Сотр. Sci., 1999,39 (4), 666-670.
88. Филимонов Д.А., Поройков B.B. Прогноз спектров биологичеоской активности органических соединений, Российский химический журнал, 2006, т. L, №2, стр. 66-75
89. Poroikov V, Filimonov D, Lagunin A, Gloriozova T, Zakharov A. PASS: identification of probable targets and mechanisms of toxicity. SAR QSAR Environ Res. 2007 Jan-Mar;18(l-2):101-10.
90. Borodina Yu., Sadym A. (Rudik A.V.), Filimonov D., Blinova V., Dmitriev A., Poroikov V. Predicting Biotransformation Potential from Molecular Structure. // J. Chem. Inf. Сотр. Sci., 2003,43(5), 1636-1646.
91. Бородина Ю.В., Садым A.B. (Рудик A.B.), Филимонов Д.А., Поройков В.В. Компьютерный прогноз биотрансформации ксенобиотиков. //Аллергия, астма и клиническая иммунология.- 2003- Т. 7 (8).- С.85-89.
92. Публикации по теме диссертации
93. Borodina Yu., Sadym A. (Rudik A.V.), Filimonov D., Blinova V., Dmitriev A., Poroikov V. Predicting Biotransformation Potential from Molecular Structure. // J. Chem. Inf. Comput. Sci.- 2003. Vol. 43(5). - P. 1636-1646.
94. Бородина Ю.В., Садым A.B. (Рудик A.B.), Филимонов Д.А., Поройков В.В. Компьютерный прогноз биотрансформации ксенобиотиков. //Аллергия, астма и клиническая иммунология,- 2003- Т. 7(8).- С.85-89.
95. Бородина Ю.В., Садым A.B. (Рудик A.B.), Филимонов Д.А., Поройков В.В. Компьютерный прогноз биотрансформации лекарственных веществ.// Сборник трудов X Российского национального конгресса «Человек и лекарство» . Москва. -2003.-С. 697.
96. И. Поройков B.B., Филимонов Д.А., Бородина Ю.В., Рудик A.B. Свидетельство об официальной регистрации программы для ЭВМ METAPREDICT № 2004610666 от 12 марта 2004 г., Москва: Российское агенство по патентам и товарным знакам.
97. Дмитриев А.В., Харчевникова Н.В., Рудик А.В., Поройков В.В. Разработка метода для предсказания региоселективности изоформы ЗА4 цитохрома Р450. // Сборник материалов XII Российского национального конгресса «Человек и лекарство» . -Москва.-2005.-С. 750.
98. Рудик А.В., Филимонов Д.А., Поройков В.В. Анализ устойчивости алгоритма прогноза сайтов биотрансформации органических ксенобиотиков. // Сборник материалов XIV Российского национального конгресса «Человек и лекарство» . -Москва.-2007.-С. 315.
99. Sadym A. (Rudik A.), Lagunin A., Filimonov D., Poroikov V. (2003). Prediction of biological activity spectra via Internet. SAR and QSAR in Environmental Research, 14 (56), 339-347.
100. V. Poroikov, D. Filimonov, N. Sadym (N. Rudik) & A. Lagunin. (2003). Prediction of biological activity spectra via Internet. Computational Methods in Toxicology and Pharmacology. Integrating Internet Resources. (CMTPI-2003), Greece, p.l 1.
101. A.B. Садым (A.B. Рудик), A.A. Лагунин, Д.А. Филимонов, В.В. Поройков. (2003). Интернет-ресурс для прогноза спектра биологической активности ХС. 3-я Всероссийская конференция «Молекулярное моделирование».Тезисы к конференции, Москва, стр.106.
102. Садым A.B. (A.B. Рудик), Лагунин A.A., Филимонов Д.А., (2002) Интернет-система прогнозирования биологической активности химических соединений. Доклад на электронной конференции «ИВТН-2002» (апрель-май 2002) (http: // www/ ncgroup. ru/ conference)
103. A.B. Садым (A.B. Рудик), B.B. Поройков, Д.А. Филимонов (2001) Интернет-система прогнозирования биологических активностей химических соединений. Тез. докл. Технологии информационного общества Интернет и современное общество, Спб., с. 57-58.
- Рудик, Анастасия Владимировна
- кандидата биологических наук
- Москва, 2007
- ВАК 03.00.28
- Компьютерный прогноз взаимодействия ксенобиотиков с цитохромами Р450 человека
- Биомаркерная оценка состояния популяции бычка-кругляка Neogobius melanostomus в прибрежных районах Азовского моря
- Влияние поступления ксенобиотиков на качество вод
- Эколого-физиологическое изучение действия эндогенных ксенобиотиков на растения
- Структурный полиморфизм кандидатных генов при аллергических заболеваниях (бронхиальная астма, аллергический ринит, атопический дерматит) у детей