Бесплатный автореферат и диссертация по биологии на тему
Компьютерное конструирование ферментативных систем, обеспечивающих синтез макролидов с заданными свойствами
ВАК РФ 03.00.28, Биоинформатика

Автореферат диссертации по теме "Компьютерное конструирование ферментативных систем, обеспечивающих синтез макролидов с заданными свойствами"

На правах рукописи

□03 166889

Сергейко Анастасия Павловна

КОМПЬЮТЕРНОЕ КОНСТРУИРОВАНИЕ ФЕРМЕНТАТИВНЫХ СИСТЕМ, ОБЕСПЕЧИВАЮЩИХ СИНТЕЗ МАКРОЛИДОВ С ЗАДАННЫМИ СВОЙСТВАМИ

03 00 28 - биоинформатика

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата биологических наук

1 6 АПР 2008

Москва - 2008

003166889

Работа выполнена в Государственном Учреждении Научно-исследовательский институт биомедицинской химии имени В Н Ореховича Российской академии медицинских наук

Научный руководитель1

доктор биологических наук, профессор

Поройков Владимир Васильевич

Официальные оппоненты:

доктор физико-математических наук, профессор

Туманян Владимир Гаевич

доктор биологических наук,

Гельфанд Михаил Сергеевич

профессор

Ведущая организация:

Федеральное государственное унитарное предприятие Государственный научно-исследовательский институт генетики и селекции промышленных микроорганизмов

Защита состоится 24 апреля 2008 года в 11 00 часов на заседании Диссертационного совета Д 001 010 01 при ГУ НИИ БМХ РАМН по адресу 119121, Москва, ул Погодинская, д 10

С диссертацией можно ознакомиться в библиотеке ГУ НИИ БМХ РАМН

Автореферат разослан « 21 » марта 2008 г

Ученый секретарь Диссертационного совета кандидат химических наук

Е А Карпова

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность проблемы. Среди применяемых в настоящее время лекарственных средств большую группу составляют природные соединения и их производные Примерно 50% принципиально новых препаратов (NCE), открытых с 2000 по 2006 годы, являются природными соединениями [Newman D J , 2007]

Макролиды - это одна из групп природных соединений, общей структурной особенностью которых является наличие макролактонового кольца К группе макролидов относятся антибиотики, противогрибковые, противопаразитарные и противоопухолевые средства, иммуносупрессанты, и др [Omura S, 2002] Благодаря структурному разнообразию и многообразию проявляемых биологических эффектов, макролиды являются перспективной группой веществ для поиска среди них новых биологически активных соединений Особенно актуален поиск новых антибиотиков в связи с развитием резистентности бактерий к уже существующим лекарствам

В настоящее время поиск новых биологически активных макролидов осуществляется тремя путями 1) скрининг биологических образцов, 2) химический синтез/модификация известных соединений, 3) модификация бактерий-продуцентов методами генной инженерии, приводящая к синтезу ими новых веществ Последний подход активно развивается в последние годы и получил название «комбинаторный биосинтез» [Khosla С , 2006]

Разработка и применение методов комбинаторного биосинтеза стали возможны благодаря расшифровке механизма синтеза макролидов Макролактоновое кольцо макролидов синтезируется из небольших углеродных фрагментов посредством повторяющихся реакций конденсации, подобно жирным кислотам Этот процесс катализируется модульными поликетидсинтазами (поликетидсинтазами типа I) Модульные поликетидсинтазы (PKS) являются крупными ферментативными системами, состоящими из нескольких белков Каждый белок имеет доменное строение, и соответственно, несколько центров, обладающих разными каталитическими активностями Группа доменов, отвечающая за один цикл конденсации, образует «модуль» [Donadio S , 1991] Модуль состоит минимум из 3-х доменов кетосинтазного (KS), ацилтрансферазного (AT) и ацилпереносящего (АСР) Помимо этих основных доменов, модуль PKS может содержать дополнительные домены кеторедуктазный (KR), дегидратазный (DH), енол-редуктазный (ER) Наличие или отсутствие этих доменов в модуле определяет степень восстановления той части, которая добавлена предшествующим модулем в поликетидную цепь В процессе биосинтеза происходит последовательное удлинение строящейся поликетидной цепи на два атома углерода каждым модулем Когда поликетидная цепь полностью синтезирована, она отделяется от PKS с помощью тиоэстеразного домена (ТЕ), затем происходит ее циклизация "хвост

1

к голове" Образовавшееся макролактоновое кольцо обычно подвергается пост-поликетидным модификациям (гидроксилирование, гликозилирование, ацилирование и др ), в результате чего окончательно определяются структура и биологические функции синтезируемой молекулы Методами комбинаторного биосинтеза можно изменять количество и набор доменов и модулей в РК8, и, таким образом, изменять структуру синтезируемого РКБ макролида

Теоретически методами комбинаторного биосинтеза можно получить огромное количество новых макролидов [Оопга1е7-1.ег§1е1 J, 2005], однако провести генно-инженерные эксперименты по получению такого большого числа микроорганизмов-продуцентов невозможно Также заранее неизвестно, будут ли синтезируемые ими вещества проявлять требуемую биологическую активность Таким образом, является актуальной разработка компьютерного метода, позволяющего отбирать среди множества возможных вариантов макролидов структуры с требуемыми свойствами и определять состав необходимых для их биосинтеза ферментативных систем

В настоящее время в литературе описано две попытки использования компьютерных методов для рационального поиска новых соединений из группы макролидов [втш М А е1 а1, 2000, Ас^Ыешввоп Н е1 а1, 2000] Однако в этих работах генерация структур ограничивалась аналогами определенных макролидов, а в основе алгоритма отбора лежал механизм действия базового вещества Общая задача генерации разнообразных структур макролидов в соответствии их метаболическими путями и отбора среди них перспективных соединений на основе прогноза совокупности видов их биологической активности в настоящее время не решена

Цель работы Разработка метода конструирования т зйюо ферментативных систем синтеза макролидов, генерации соответствующих комбинаторных библиотек вторичных метаболитов и отбора тех вариантов ферментативных систем, которые обеспечивают получение веществ с заданным профилем биологической активности Задачи исследования-

1 Создание компьютерной программы для генерации виртуальных библиотек структурных формул макролидов и описаний синтезирующих их ферментативных систем

2 Создание базы данных, содержащей информацию о структуре и биологической активности макролидов

3 Оценка применимости используемого метода прогноза биологической активности для предсказания биологической активности макролидов

4 Апробация предложенного метода на примере генерации и скрининга виртуальной библиотеки аналогов эритромицина

Научная новизна. Предложен оригинальный подход к конструированию доменного состава ферментативных систем, обеспечивающих синтез новых макролидов с требуемым профилем биологический активности

Впервые созданы компьютерная программа Blogenerator, позволяющая генерировать виртуальные библиотеки структур макролидов и синтезирующих их ферментативных систем, и база данных, содержащая информацию о структуре и видах биологической активности более 1000 макролидов

Практическая значимость. Предложенный метод обеспечивает возможность конструирования новых биологически активных структур макролидов и необходимых для их биосинтеза наборов доменов в модульных РКБ Сконструированные ферментативные системы могут быть реализованы в бактериях-продуцентах с помощью методов генной инженерии Описанный метод дает возможность рационального планирования генно-инженерных экспериментов по модификации бактерий-продуцентов макролидов Применение описанного подхода позволит значительно сократить число экспериментов по получению структур макролидов и тестированию их биологической активности, и, следовательно, существенно снизить временные и финансовые затраты при поиске новых лекарственных препаратов группы макролидов

Апробация работы. Основные положения диссертационной работы были доложены на Московской международной конференции «Биотехнология и медицина» (Москва, 2006 г ), 14-й Международной конференции и дискуссионном научном клубе «Новые информационные технологии в медицине, биологии, фармакологии и экологии» (Словакия, Низкие Татры, 2006 г), IV Московском международном конгрессе «Биотехнология состояние и перспективы развития» (Москва, 2007 г), научной конференции ГУ НИИ БМХ РАМН (Москва, 2007 г), 4-ом Международном симпозиуме «Компьютерные методы в токсикологии и фармакологии, включающие Интернет-ресурсы (СМТР1-2007)» (Москва, 2007 г)

Публикации По материалам диссертации опубликовано 6 печатных работ (3 статьи, 2 из них в рецензируемых журналах, 1 - в сборнике трудов конференции, 3 -материалы докладов на конференциях) Получено 2 свидетельства Роспатента об официальной регистрации компьютерных программ

Объем и структура диссертации Диссертационная работа изложена на 108 страницах, содержит 20 рисунков и 8 таблиц Работа состоит из введения, обзора литературы, описания материалов и методов исследования, собственных результатов, их обсуждения, выводов, списка цитированной литературы, включающего 120 источников, приложения

МАТЕРИАЛЫ И МЕТОДЫ ИССЛЕДОВАНИЯ

Предлагаемый нами подход состоит в генерации in sihco структур макролидов в соответствии с механизмом их биосинтеза и последующем анализе полученных виртуальных библиотек на основе компьютерного предсказания биологической активности Такой анализ позволяет предварительно отобрать наиболее перспективные вещества, согласно прогнозу обладающие требуемыми фармакодинамическими свойствами Для структур макролидов определяется количество модулей, их последовательность и набор доменов в каждом модуле PKS типа I, которые обеспечивают синтез отобранных соединений, то есть конструируется ферментативная система, необходимая для биосинтеза определенной структуры

Для создания базы данных по структурам макролидов и проявляемым ими видам биологической активности были использованы данные из следующих источников Discovery Gate, PubChem, PubMed, ChemldPlus, Heterocycles Database, Dictionary of Natural Pioducts Макролидами считали те вещества, для которых это было указано в соответствующих полях баз данных или в публикациях

Biogenerator. Для генерации виртуальных библиотек ферментативных систем и синтезируемых ими структур макролидов нами разработана программа Biogenerator (см «Результаты и обсуждение») Расчетная часть программы написана на языке Си++, графическая оболочка - на языке скриптов Tcl/Tk

PASS. Для прогноза биологической активности соединений использовалась программа PASS версии 2006 (Prediction of Activity Spectra for Substances - прогноз спектров биологической активности органических соединений) [Филимонов Д А, Порой ков ВВ, 2006] Под спектром биологической активности понимается весь комплекс биологических эффектов, которые вещество способно вызывать при определенных условиях взаимодействия с биологическими объектами Биологическая активность представлена в PASS качественно (наличие/отсутствие) Программа PASS версии 2006 позволяет по структурной формуле вещества оценивать вероятность проявления (Ра) или отсутствия (Pi) около 2800 видов биологической активности

В программе PASS в качестве основы для описания структуры органических соединений используется структурная формула Для описания структурной формулы используются «MNA-дескрипторы» [Filimonov DA, 1999] Для прогноза в PASS используется SAR base, которая создается на основе анализа обучающей выборки, содержащей структурные формулы и известные из эксперимента спектры активности органических соединений В PASS версии 2006 SAR base содержит данные о 68038 лекарствах и биологически активных веществах Словарь MNA-дескрипторов включает 47858 уникальных дескрипторов 1-го и 2-го уровней

Оценка точности прогноза

Для оценки точности прогноза использовали инвариантный критерий точности прогноза - IAP (Invariant Accuracy of Prediction) Для каждого вида активности IAP подсчитывается по формуле

IAp __N(Pa(s.)>Pa(s.y) Na Ni

где N(Pa(So) > Pa(s,)) - число случаев, когда Ра для активных соединений превышает Ра для неактивных соединений, Na и Ni - число активных и неактивных соединений в выборке

Средняя точность прогноза PASS версии 2006 составляет около 93% при скользящем контроле с исключением по одному

PharmaExpert. Для анализа результатов прогноза PASS использовалась экспертная система PharmaExpert [Poroikov V et al, 2004], описывающая взаимосвязи между фармакологическими эффектами и механизмами действия физиологически активных веществ

ISIS/Base Для создания базы данных структур макролидов, а также визуализации виртуальных библиотек макролидов и синтезирующих их ферментативных систем, была использована СУБД ISIS/Base (www mdl сот)

РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ

Компьютерная программа Biogenerator для генерации виртуальных библиотек макролидов и описаний синтезирующих их ферментативных систем

Созданная нами программа Biogenerator позволяет моделировать комбинаторные перестановки доменов и модулей в поликетидсинтазах типа I и, в соответствии с этим, генерировать виртуальные библиотеки ферментативных систем и синтезируемых ими макролидов Результаты генерации сохраняются в SDF-файлах, которые содержат структуры молекул и описания соответствующих им PKS Описание PKS включает порядок следования и доменный состав модулей в гипотетическом ферментативном комплексе

Входные параметры программы Biogenerator I а) Тип стартового «строительного блока» (ацетат или пропионат)

б) Размер макролактонового кольца молекулы макролида (6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38 атомов), определяющий число модулей в гипотетической PKS Число модулей рассчитывается следующим образом М = NÍL-2, где М - число модулей, N-число атомов в кольце

II Место и тип пост-лоликетидных модификаций макролактонового кольца, задаются с помощью редактора параметров генерации. На основании своих представлений о наличии и специфичности действия соответствующих ферментов в данной биосинтетической системе, пользователь (специалист в области генной инженерии) может устанавливать различные типы пост-поликетидных модификаций в определенных позициях макролактонового кольца. Могут быть заданы следующие типы модификаций (рис. 1): Гликозилирование. Сайтами гликозилирования являются предполагаемые гидроксильные группы, которые появляются в результате функционирования дополнительного домена KR.

Гидроксилирование. Сайты пост-поликетидного гидроксилирования могут быть установлены в определенных позициях макролактонового кольца, которые не перекрываются с теми, где гидроксильная группа может появиться при восстановлении p-кетогруппы в результате работы домена KR. Окисление метильной группы. Для полиеновых макролидов, размер макролактонового кольца которых равен или больше 22 атомов. Наличие/отсутствие полукеталя. Полукеталь может появляться при взаимодействии гидроксильной группы и кетогруппы, расположенных через три атома углерода друг от друга в макролактоновом кольце. Задание полукеталя накладывает ограничения на доменный состав двух модулей.

Edit Parameters gun Нтг:

Г. Г" 1". Г *-/ Я С' Are, if Any Any '• Any {• *Г[ Any Any ri' ..1, rt An;

Рис. 1. Задание доменного состава отдельных модулей. В верхней части окна показаны модули и набор доменов в них, в нижней - соответствующее этому набору доменов макролактоновое кольцо. Показанные белым цветом связи в макролактоновом кольце изменяются в процессе генерации структур, черным - не изменяются.

6

После того, как выбраны параметры I и II, пользователь может также задать, какие домены не будут изменяться в процессе генерации При задании доменного состава отдельных модулей (III) можно выбрать субстратную специфичность домена AT и набор дополнительных доменов для каждого модуля (рис 1) Фиксированному доменному составу всех модулей PKS соответствует определенная химическая структура, которая будет синтезироваться данной ферментативной системой

После установления обязательных (I, II) и дополнительных (Ш) параметров начинается процесс генерации виртуальных библиотек макролидов

В качестве шаблонов при генерации используются 17 макролактоновых колец размером от 6-ти до 38-ми атомов (рис 2) Для генерации структурных формул макролидов эти макролактоновые кольца условно разбиваются на фрагменты, каждый фрагмент соответствует одному «строительному блоку» (рис 3)

О

8 атомов 10 атомов

(окталактин) (декарестриктин)

38 атомов (нистатин)

14 атомов (эритромицин)

36 атомов (дермостатин)

Рис 2 Примеры макролактоновых колец различного размера

2

Рис 3 Разбиение макролактонового кольца из 14-ти атомов на фрагменты

При построении структурных формул макролидов, исходя из доменного состава синтезирующих их ферментов, учитываются следующие данные о строении и функционировании модульных РКБ

1 В составе модуля обязательно присутствуют домены АТ, АСР и КЗ

2 Домен АТ может быть малонат- или метилмалонат-специфическим В зависимости от типа домена в молекулу макролида добавляется ацетат или пропионат (рис 4)

Тип домена АТ Присоединяемый строительный

блок

малонат-специфический ^^

О

метилмапонат-специфический

О

Рис. 4. Типы присоединяемых строительных блоков

3 Различные сочетания дополнительных доменов (КЛ, ЭН, ЕЫ) обуславливают разную степень восстановления строительного блока, который был добавлен предыдущим модулем в поликетидную цепь (рис 5) Строительный блок, добавленный последним модулем, не подвергается дальнейшему восстановлению

Комбинация дополнительных Модификация строительного

доменов блока

КН

КР + ОН + ЕЯ

Рис. 5. Типы модификаций строительных блоков

4 Первый модуль всегда содержит один дополнительный домен - КЛ, набор дополнительных доменов не может изменяться в процессе генерации Это связано с тем, что в результате работы КЯ домена первого модуля образуется гидроксильная группа, которая необходима для замыкания макролактонового кольца

Таким образом, для генерации виртуальных комбинаторных библиотек макролидов используется 8 типов фрагментов (рис 6), строение каждого фрагмента определяется доменным составом двух соседних модулей Генерация виртуальных библиотек производится путем перебора всех возможных комбинаций фрагментов Фрагмент в нулевой позиции (рис 3) не изменяется

тт

о

о

Рис 6 Фрагменты, используемые для генерации виртуальных библиотек макролидов

Перед началом процесса генерации в программе производится подсчет числа структур, которые могут быть сгенерированы при заданных параметрах, по формуле

N = кх-к2 кг ■ кп_{ • а

где п - число модулей в PKS, к, - число возможных фрагментов в /-Й позиции (в общем случае к, = 8, при наложении ограничений на структуру молекулы - пост-поликетидные модификации и тд - это число уменьшается), а - число возможных фрагментов в последней позиции (1 или 2)

В выходные SDF-файлы записываются структуры макролидов и описания PKS, необходимых для их синтеза Описание PKS записывается в поле "<modules>" в следующем виде

> <modules> [Loading Propionate]

[KS-ATmaI-**-**-KR-ACP][KS-ATmal-DH-ER-KR-ACP][KS-ATmal-DH-ER-KR-ACP| [KS-ATmaI-DH-ER-KR-ACP][KS-ATmal-DH-ER-KR-ACPl|KS-ATmal-DH-ER-KR-ACP|,

где доменный состав отдельных модулей заключен в квадратные скобки

База данных по структурным формулам макролидов и соответствующим им биологическим активностям

Для пополнения обучающей выборки программы PASS нами была создана база данных (БД) Macrohdes, содержащая структурные формулы макролидов и известные для них виды биологической активности БД Macrohdes имеет стандартную структуру, используемую для создания обучающей выборки программы PASS, и содержит следующие поля ID (идентификационный номер), chem паше (химическое название соединения), structure (структурная формула соединения), class (список видов биологической активности соединения), lit ref (ссылки на источник информации), и др

Созданная нами БД Macrolides содержит 1114 структур макролидов, проявляющих 247 видов биологической активности В базу входят макролиды с размером макролактонового кольца от 8 до 48 атомов Число включенных в БД соединений с различным размером макролактонового кольца варьирует от 1 (25, 42, 44, 48 атомов в кольце) до 259 структур (16 атомов в кольце) Количество включенных в БД структур с различными размерами макролактонового кольца коррелирует с данными S Omuia о числе известных макролидов соответствующего размера [Omura S , 2002]

Прогноз биологической активности макролидов

Оценка точности прогноза биологической активности макролидов для различных обучающих выборок В обучающей выборке программы PASS содержатся данные о биологической активности соединений, в то время как используемое в литературе понятие «макролид» характеризует структурные особенности вещества Наиболее близким к понятию «макролид» термином, используемым при описании биологической активности соединений в программе PASS, является «Антибиотик макролидного ряда» (Antibiotic Macrolide-Iike) Однако не все макролиды являются антибиотиками, и, следовательно, не каждому макролиду в обучающей выборке приписана эта активность В момент начала нашей работы в обучающей выборке PASS содержалось 216 структур с активностью «Антибиотик макролидного ряда» Это значительно меньше числа известных макролидов, которое в 2002 году составляло более 2000 структур [Omura S , 2002]

Для прогноза биологической активности макролидов нами была создана база данных Macrolides, состоящая только из макролидов Было проведено сравнение точности прогноза проявляемых макролидами видов биологической активности при использовании различных обучающих выборок

1) Исходная обучающая выборка программы PASS, содержит 216 соединений с активностью «Антибиотик макролидного ряда»

2) Обучающая выборка, состоящая только из макролидов (получена из базы данных Macrolides)

3) Объединенная обучающая выборка, состоящая из исходной обучающей выборки программы PASS и базы данных Macrolides

При обучении программы PASS на выборке, состоящей только из макролидов, возможно предсказание 106 видов активности (в соответствии с алгоритмом отбора прогнозируемых видов активности в программе PASS, см «Материалы и методы») В таблице 1 приведены сведения об инвариантной точности прогноза (IAP) для некоторых видов активности, а также среднее значение IAP по 106 видам активности

Точность прогноза различных видов биологической активности меняется при использовании различных обучающих выборок (см таблицу 1) Для 67 видов активности точность прогноза увеличивается при добавлении макролидов к исходной обучающей выборке по сравнению с исходной выборкой, однако в 27 случаях точность уменьшается Прогноз 12-ти видов активности невозможен при использовании только исходной обучающей выборки в соответствии с ограничениями по отбору прогнозируемых активностей, имеющимися в программе PASS Это такие виды активности как «Стимулятор деполимеризации актина» (Actin depolymerization stimulant), «Ингибитор полимеризации актина» (Actm polymerization inhibitor) и др

10

Таблица 1 Инвариантная точность прогноза (1АР) видов биологической активности, проявляемых макролидами, при использовании различных обучающих выборок

Название активности Исходная об выб Только макролиды Исходная об выб + макролиды

N 1АР,% N 1АР,% N 1АР,%

Actin depolymerization stimulant - 4 80,58 4 98,57

Actin polymerization inhibitoi - 4 99,18 4 99,99

Angiogenesis inhibitor 570 85,99 14 72,51 584 85,98

Antiacne 306 94,07 8 90,93 314 94,11

Antiarthritic 3015 82,77 20 83,29 3035 82,63

Antibacterial 4958 91,65 612 92,66 5570 91,90

Antibiotic 3333 95,53 587 91,83 3920 95,69

Antibiotic Macrolide-like 216 99,62 504 91,13 720 99,63

Tubulin antagonist 111 91,13 10 92,37 121 92,08

Tyrosine kinase inhibitor 1632 96,69 5 85,29 1637 96,65

Среднее значение 88,0 89,8 89,4

N - количество соединений с экспериментально подтвержденной активностью данного вида в обучающей выборке PASS,

IAP, % - инвариантная точность прогноза по скользящему контролю с исключением по одному для обучающей выборки,

« - » - данный вид активности не прогнозируется с помощью исходной обучающей выборки

В целом, средняя точность прогноза при добавлении макролидов к исходной обучающей выборке (89,4%) несколько увеличивается по сравнению с исходной обучающей выборкой (88%) Средняя IAP при обучении только на макролидах (89,8%) выше, чем при использовании исходной обучающей выборки (88%), однако незначительно уменьшается при добавлении макролидов к исходной обучающей выборке (89,4%)

Разница в средней точности прогноза при обучении только на макролидах и при использовании объединенной обучающей выборки незначительна, при этом объединенная выборка позволяет прогнозировать значительно большее число видов биологической активности (2806 видов активности) Поэтому при дальнейшем прогнозировании биологической активности мы использовали наиболее полную обучающую выборку, состоящую из исходной выборки PASS и добавленных к ней макролидов

Оценка точности прогноза биологической активности макролидов на тестовой выборке Для оценки результатов применения предложенного нами подхода для поиска новых биологически активных макролидов необходимо синтезировать и протестировать достаточно большое количество соединений В то же время, методами

11

генной инженерии можно получить лишь небольшое количество бактериальных штаммов, которые будут продуцировать отобранные соединения Это весьма длительный процесс, причем экспериментальных данных будет заведомо недостаточно для статистически значимого заключения о пригодности предложенного метода В связи с этим, валидация метода возможна только на известных из литературы экспериментальных данных

Нами была проведена оценка применимости программы PASS для предсказания биологической активности макролидов на независимой тестовой выборке из 242 природных макролидов Выборка была составлена на основе базы данных Dictionary of Natural Products (DNP) В тестовую выборку включены вещества, которые относятся к группе «Maciolide polyketides» и «Polyenes» по классификации этой базы данных

Результаты предсказания биологической активности для этой выборки представлены в таблице 2

Таблица 2 Результаты прогноза биологической активности соединений из тестовой выборки (242 природных макролида)

Название активности N IAP N (PASS) IAP (PASS)

Антибактериальная 62 0,7456 5570 0,9190

Антибиотик 61 0,6335 3920 0,9569

Антибиотик макролидного ряда 58 0,6963 720 0,9963

Токсическое действие 50 0,8492 1626 0,8182

Цитотоксическая 49 0,8636 293 0,9415

Противогрибковая 43 0,6427 1634 0,8839

Противопаразитарная 36 0,9981 548 0,8939

11ро1ииоонухолевая 36 0,9260 8886 0,8440

Противоглистная 15 0,9430 422 0,8966

Иммуносупрессорная 12 0,4844 1081 0,8116

Противовирусная 10 0,8043 3968 0,8767

Инсектицидная 6 0,8482 127 0,9232

Среднее значение 0,7553 0,8942

N - количество соединений с экспериментально подтвержденной активностью данного вида в тестовой выборке,

IAP - инвариантная точность прогноза для тестовой выборки,

N (PASS) - количество соединений с экспериментально подтвержденной активностью данного вида в обучающей выборке PASS,

IAP (PASS) - инвариантная точность прогноза по скользящему контролю с исключением по одному для обучающей выборки

Таблица 2 содержит данные о количестве соединений в тестовой выборке и обучающей выборке PASS, проявляющих тот или иной вид активности в эксперименте, а также оценку точности прогноза (IAP) для каждой активности Всего с помощью

программы PASS возможен прогноз 41 вида активности, известного для соединений из тестовой выборки В автореферате представлены только те виды активности, для которых в тестовой выборке содержится 6 и более соединений (полностью таблица приведена в диссертации) Вычисление IAP для обучающей выборки проводилось в режиме скользящего контроля с исключением по одному В обучающей выборке PASS содержится 33 структуры из тестовой выборки, однако при выполнении прогноза для каждого из этих соединений соответствующие данные исключались из обучающей выборки

Для обучающей выборки все виды активности прогнозируются с высокой точностью от 77,5% (антагонист интерлейкина 1) до 99,7% (стимулятор протеинкиназы С) Как видно из таблицы 2, для тестовой выборки виды активности, для которых имеется достаточно большое количество соединений, прогнозируются с приемлемой точностью от 63,4% (антибиотик) до 99,8% (противопаразитарная) Исключением является иммуносупрессорная активность (48,4%) Оценка точности прогноза для активностей, представленных небольшим количеством соединений (данные не приведены в таблице 2), не является статистически достоверной В этих случаях IAP может варьировать в широких пределах от 0,8% (ингибитор синтеза белка) до 100% (ингибитор синтеза холестерина)

Средняя точность прогноза по всем прогнозируемым видам активности для тестовой выборки, состоящей только из макролидов, составляет 75,5% Средняя точность прогноза для обучающей выборки, включающей соединения разных классов -89,4% Таким образом, даже для тестовой выборки, состоящей из близких по структуре соединений, PASS позволяет прогнозировать различия в спектре активности с приемлемой точностью

Оценка точности прогноза биологической активности полусинтетических аналогов эритромицина Макролиды природного происхождения часто модифицируют химически для улучшения их фармакодинамических и фармакокинетических характеристик На основе эритромицина было получено множество полусинтетических производных (рокситромицин, кларитромицин, азитромицин и др) Нами была проведена оценка применимости программы PASS для предсказания биологической активности полусинтетических аналогов эритромицина на независимой тестовой выборке, содержащей 612 соединений из базы данных MDDR

В таблице 3 представлены данные о количестве соединений в тестовой выборке, проявляющих тот или иной вид активности в эксперименте, а также оценки точности прогноза (IAP) для каждой активности Всего с помощью программы PASS возможен прогноз 27 видов активности, известных для соединений из тестовой выборки В

автореферате представлены виды активности, для которых в тестовой выборке содержится 5 и более соединений (полностью таблица приведена в диссертации)

Таблица 3. Результаты прогноза биологической активности соединений из тестовой выборки (612 полусинтетических аналогов эритромицина)

Название активности N IAP

Антибактериальная 518 0,6771

Антибиотик 504 0,6101

Антибиотик макролидного ряда 341 0,6539

Противопротозойная 55 0,8641

Проти воартритная 23 0,9738

Прокинетик 21 0,9895

Антагонист рилизинг-фактора лютеинизирующего гормона 19 1,0

Агонист рецепторов мотилина 16 0,9850

Противоопухолевая 15 0,9655

Антибиотик хинолонового ряда 13 0,9787

11 роти помикобактериальная 13 0,9935

I /ротивоастмагическая 13 0,5811

Вещество для лечения акне 11 0,9624

Ингибитор выработки цитокинов 6 0,4757

Вещество для лечения рака простаты 5 0,9898

Среднее значение 0,8288

N - количество соединений с экспериментально подтвержденной активностью данного вида в тестовой выборке,

IAP - инвариантная точность прогноза для тестовой выборки

Для тестовой выборки из полусинтетических аналогов эритромицина точность прогноза различных видов активности колеблется от 61% (антибиотик) до 100% (антагонист рилизинг-фактора лютеинизирующего гормона) В целом, для точности прогноза различных видов активности веществ из данной тестовой выборки наблюдается та же закономерность, что и для тестовой выборки из 242 природных макролидов (см выше) Не высокие значения IAP получены для видов активности, относящихся к воздействию соединений на иммунную систему «Ингибитор выработки цитокинов» и «Противоастматическая» (данная тестовая выборка), и «Иммуносупрессорная» (тестовая выборка из 242 природных макролидов) Оценки точности прогноза для активностей, представленных небольшим количеством соединений, не являются статистически достоверными, и значения IAP варьируют в широких пределах

Средняя точность прогноза по 27 прогнозируемым видам активности полусинтетических аналогов эритромицина - 82,9%, что позволяет использовать программу PASS для прогноза биологической активности аналогов эритромицина

Генерация и скрининг виртуальной библиотеки аналогов эритромицина

Для апробации разработанного подхода мы сгенерировали виртуальную библиотеку аналогов эритромицина с помощью программы Biogenerator и провели ее компьютерный скрининг

Генерация аналогов эритромицина была выполнена при следующем наборе параметров пропионат в качестве стартового блока, 6 модулей расширения, гликозилирование кладинозой по 3-му атому углерода, гликозилирование десозамином по 5-му атому углерода, гидроксилирование по 6-му и 12-му атомам углерода Выбор параметров генерации обусловлен строением и механизмом синтеза эритромицина Полученная виртуальная библиотека состоит из 3072 структур

Для сгенерированных структур был выполнен прогноз спектров биологической активности с помощью программы PASS Результаты прогноза были проанализированы с помощью программы PharmaExpert Были отобраны те виды активности, вероятность проявления которых выше 70% (Ра > 0,7) хотя бы для одной структуры

С вероятностью более 70% были предсказаны такие известные для эритромицина и его аналогов виды активности как «Антибактериальная», «Антибиотик», «Антибиотик макролидного ряда», «Ингибитор синтеза белка», «Ингибитор 50s субъединицы рибосомы» Помимо этого, был предсказан ряд видов активности, которые были экспериментально открыты в последние годы для эритромицина и его аналогов и не связаны с его антибактериальной активностью В частности, такие экспериментально подтвержденные виды активности как «Антагонист HERG каналов» [Stanat S J , 2003, Chen S Z , 2005] и «Удлинение интервала QT» [Abu-Gharbieh Е , 2004], «Субстрат CYP3A» и «Субстрат CYP3A4» [Rodrigues A D, 1997, Kenworthy К Е , 1999], «Противопротозойная» [Degerli К, 2003], «Гепатотоксическая» [Aronson J К, 2006], «Вещество для лечения дискинезии» и «Стимулятор моторики желудочно-кишечного тракта» [Peeters Т L , 1993, Doherty W L , 2003] и др

Для некоторых прогнозируемых видов активности в доступной литературе не было найдено экспериментального подтверждения, в частности для таких видов активности как «Противопаразитарная», «Ингибитор синтеза холестерина» и др Поскольку такие виды активности были предсказаны только для некоторых структур из сгенерированной комбинаторной библиотеки, возможно они специфичны для этих соединений и никогда не проверялись для известных аналогов эритромицина

Далее мы провели компьютерный скрининг библиотеки аналогов эритромицина Эритромицин сравнительно хорошо переносится пациентами, наиболее серьезным побочным эффектом, наблюдаемым при приеме всех форм эритромицина, является холестаз [Aronson J К, 2006] Прием эритромицина может приводить к повышению уровня сывороточных трансаминаз и развитию холестатического гепатита Механизм

15

развития повреждения печени в результате приема эритромицина не ясен показано, что эритромицин не ингибирует транспорт желчных кислот (таурохолевой кислоты) [КояЦиЬяку V Е, 2003] Был проведен поиск аналогов эритромицина, для которых вероятность проявления гепатотоксической активности наименьшая

Использовалась сгенерированная ранее библиотека из 3072 аналогов эритромицина Отбор соединений проводили при значениях Ра > 0,8 для активности «Антибактериальная» и Ра < 0,6 для активности «Гепатотоксическая» Инвариантная точность прогноза гепатотоксической активности составляет 75,9%, антибактериальной - 91,9%

В результате было отобрано 17 аналогов эритромицина, удовлетворяющих заданным критериям На рисунке 7 приведены значения Ра для антибактериальной и гепатотоксической активностей эритромицина и его аналогов, а также отношение значений Ра для этих видов активности .

16 , *

/

1 2 / /

08

06

04

Ра (Гп) —■— Ра (Аб)

Ра (Аб) / Ра (Гп)

V V

^ ^ ^ V» V V

Номер структуры в сгенерированной виртуальной библиотеке

Рис 7. Результаты прогноза антибактериальной и гепатотоксической активностей для эритромицина (эр ) и его 17-ти аналогов, отобранных при генерации и скрининге виртуальной библиотеки Ра (Гп) - вероятность наличия гепатотоксической активности, Ра (Аб) - вероятность наличия антибактериальной активности, Ра (Аб) /Ра (Гп) -отношение Ра (Аб) к Ра (Гп)

Из рисунка 7 видно, что наименьшее значение Ра для гепатотоксической активности при наибольшем значении Ра для антибактериальной активности прогнозируется для молекулы № 2456 В соответствии с результатами предсказания, вероятность проявления гепатотоксичности для молекулы №2456 составляет 56,5%, что существенно ниже, чем у эритромицина (94,1%) Таким образом, при наличии возможности выбора аналогов эритромицина, наиболее перспективным является аналог №2456 (рис 8) Необходимая для синтеза этой молекулы информация о доменном составе РК8 (рис 8) получена с помощью программы Bюgenerator и является основой для конструирования соответствующего микроорганизма-продуцента

16

Эритромицин А

PASS ACTIVITY SPECTRUM at Pa > 0 8

o^o

[Loading Propionate]

[KS-ATmet-**-**-KR-ACP]

[KS-ATmet-**-**-KR-ACP]

[KS-ATmet-* *-**-**-ACP]

[KS-ATmet-DH-ER-KR-ACP]

[KS-ATmet-**-**-KR-ACP]

[KS-ATmet-**-**-KR-ACP]

Ра Pi

0 991 0 001 Antibiotic Macrolide-like

0 990 0 003 Cytochrome P450 inhibitor

0 982 0 000 Antibacterial

0 975 0 000 Antibiotic

0 969 0 001 Mucolytic

0 968 0 002 Protein 50S ribosomal subunit

inhibitor

0 961 0 ООО Transcription factor NF kappa B

inhibitor

0 957 0 003 Antiprotozoal (Toxoplasma)

0 955 0 003 Protein synthesis inhibitor

0 951 0 003 HERG channel antagonist

0 943 0 005 QT interval prolongation

0 937 0 000 Antlrickettsial

0 941 0 004 Hepatotoxic

0 932 0 001 Expectorant

0 922 0 002 Transcription factor inhibitor

0 870 0 003 Gastrointestinal motility stimulant

0 853 0 002 Prokinetic

0 844 0 014 Toxic

0 819 0 005 Antidyskinetic

Аналог эритромицина № 2456

PASS ACTIVITY SPECTRUM at Pa > 0 8

0 904 0 007 Antiprotozoal (Toxoplasma)

0 888 0 001 Transcription factor NF kappa В

inhibitor

0 885 0 009 Toxic

0 869 0 001 Antibacterial

0 868 0 004 Transcription factor inhibitor

0 845 0 001 Antibiotic

0 839 0 006 HERG channel antagonist

0 565 0 109 Hepatotoxic

[Loading Propionate] [KS-/1Tma/-**-**-KR-/\CP] [KS-ATmet-Z№**-KR-ACP] [KS-ATmet-DH-EX-KR-ACP] [KS-ATmat-**-**-**-ACP] [KS-ATma/-**-**-KR-ACP] [KS-ATmal-**-**-KR-ACP]

Рис 8 Структурные формулы и прогнозируемые PASS виды биологической активности для эритромицина А и его аналога №2456 Состав модулей PKS типа I, необходимой для синтеза аналога №2456, получен с помощью программы Biogeneiatoi ATmal - малонил-специфический ацилтрансферазный домен, ATmet - метилмалонил-специфический ацилтрансферазный домен Остальные пояснения - см в тексте

На рисунке 8 курсивом выделены домены, которые отличаются в DEBS эритромицина и гипотетической поликетидсинтазе, необходимой для синтеза аналога №2456 Как видно из рисунка, доменный состав модулей в ферментативных системах, необходимых для биосинтеза двух структур, значительно отличается Сконструировать поликетидсинтазу, способную синтезировать аналог №2456, из DEBS можно путем изменения специфичности AT доменов или числа дополнительных доменов в каждом

17

из 6-ти модулей DEBS, или замены целых модулей на модули с другим доменным

составом В литературе описаны успешные эксперименты по внесению множественных

изменений в DEBS, показано что при внесении 3-х изменений фермент остается

функциональным [McDaniel, 1999], а также эксперименты по комбинированию в

единую ферментативную систему белков, составляющих PKS эритромицина,

пикромицина и олеандомицина [Tang, 2000]

Из 17-ти отобранных аналогов эритромицина, минимальное число изменений в

доменном составе DEBS необходимо для конструирования ферментативной системы,

способной синтезировать аналог №2310 Это изменение субстратной специфичности

AT домена в 1-м и 6-м модулях, введение дополнительного домена DH во втором

модуле, замена домена AT и удаление дополнительных доменов в 4-м модуле

DEBS зригромицинл Аналог№2310

[Loading l'iopionate] [Loading Propionate]

[KS-AI met-**-**-KR-ACP] [KS-/47me/-**-**-KR-ACP]

[KS-AI mu-**-**-KR-ACP] [KS-ATmet-»№**-KR-ACP]

[KS-ATmet-**-**-**-ACP] [KS-ATmet-**-**-**-ACP]

[KS-ATmet-DH-ER-KR-ACP] [KS-/47>;w/-**-**-**-ACP]

[KS-ATmet-**-**-KR-ACP] [KS-ATmet-**-**-KR-ACP]

[KS-ATmet-**-**-KR-ACP] [KS-ATmal-**-**-Kll-ACP]

ЗАКЛЮЧЕНИЕ

В диссертационной работе предложен метод конструирования in silico доменных последовательностей ферментативных систем, обеспечивающих синтез макролидов с заданным профилем биологической активности Разработана компьютерная программа Biogeneiatoi, которая позволяет генерировать виртуальные комбинаторные библиотеки структур макролидов и последовательности доменов PKS, необходимые для их биосинтеза Показано, что применение программы PASS для прогноза биологической активности и программы PharmaExpert для анализа результатов прогноза, позволяет отбирать среди сгенерированных структур макролиды с требуемым профилем биологической активности

С целью оптимизации расчетов в случаях, когда количество сгенерированных структур очень велико, нами была разработана компьютерная программа BioGenPharm Программа BioGenPharm интегрирует функции программ Biogenerator, PASS и PharmaExpert, и позволяет генерировать и отбирать виртуальные структуры поликетидов без записи промежуточных результатов

Предложенный подход может быть использован для поиска новых соединений, синтезируемых другими видами многомодульных ферментативных систем, например нерибосомальными пептидными синтазами

выводы

1 Созданная программа Biogenerator для генерации виртуальных библиотек структурных формул макролидов и описаний синтезирующих их ферментативных систем, достаточных для генно-инженерной разработки продуцентов соответствующих макролидов, обеспечивает исчерпывающий перебор потенциально возможных структур

2 Показано, что добавление к стандартной обучающей выборке программы PASS информации из созданной нами базы данных по макролидам позволяет прогнозировать биологическую активность макролидов со средней точностью 89,4%

3 Используемый метод прогноза биологической активности предсказывает биологическую активность макролидов со средней точностью 75,5% для тестовой выборки, состоящей из природных макролидов, а для тестовой выборки, состоящей из полусинтетических аналогов эритромицина, со средней точностью 82,9%

4 На примере генерации и скрининга виртуальной библиотеки аналогов эритромицина показано, что разработанный метод позволяет отбирать среди сгенерированных структур вещества с требуемым профилем биологической активности и определять доменный состав ферментативных систем, необходимый для их биосинтеза

СПИСОК РАБОТ, ОПУБЛИКОВАННЫХ ПО ТЕМЕ ДИССЕРТАЦИИ

1 Zotchev S В , Stepanchikova А V , Sergeyko А Р, Sobolev В N , Filimonov D А , Poroikov V V Rational design of macrolides by virtual screening of combinatonal libianes generated through in silico manipulation of polyketide synthases // J Med Chem - 2006 Vol 49 № 6 - P 2077-2087

2 Сергейко АП, Степанчикова AB, Соболев БН, Зотчев СБ, Лагунин А А, Филимонов Д А , Поройков В В Компьютерное конструирование поликетидов с заданными свойствами //Биомедицинская химия - 2007 -Т 53 №5 - С 522-531 (Sergeyko А Р , Stepanchikova А V , Sobolev В N , Zotchev S В , Lagunin А А , Filimonov D А, Poroikov V V Computer-aided design of polyketides with the required properties // Biochemistry (Moscow) Supplement Series В Biomedical Chemistry - 2008 - Vol 2 № 1 -P 55-62)

3 Зотчев С Б , Степанчикова А В , Сергейко А П , Соболев Б Н , Филимонов Д А, Поройков В В Генерация in silico и скрининг виртуальных библиотек макролидов // Московская международная конференция "Биотехнология и медицина" Материалы конференции -Москва -2006 -С 44

4 Сергейко А П , Степанчикова А В , Соболев Б Н , Зотчев С Б , Поройков В В Компьютерное проектирование ферментативных систем, обеспечивающих синтез макролидов с заданными свойствами // Материалы XIV международной конференции и дискуссионного научного клуба «Новые информационные технологии в медицине, биологии, фармакологии и экологии» Приложение научно-практического журнала «Открытое образование» - 2006 - №3 - С 78-79

5 Сергейко А П , Степанчикова А В , Соболев Б Н , Филимонов Д А , Зотчев С Б , Поройков В В Biogenpharm - программа для генерации виртуальных библиотек макролидов и отбора структур с заданными свойствами // Материалы IY Московского международного конгресса «Биотехнология состояние и перспективы развития» -Москва -2007 - С 409

6 Sergeyko А , Stepanchikova А , Sobolev В , Zotchev S , Fihmonov D , Lagunin A, Poioikov V Computer - aided design of polyketides with the required properties // Abstr 4rd Internat Symp «Computational Methods in Toxicology and Pharmacology Integiating Inleinet Resources (CMTPI-2007)» - Moscow (Russia) -2007 -P 144

7 Зотчев С Б, Соболев Б Н , Степанчикова А В, Сергейко А П, Поройков В В Свидетельство об официальной регистрации программы для ЭВМ Biogenerator № 2007610742 от 15 февраля 2007 г, Москва, Федеральная служба по интеллектуальной собственности, патентам и товарным знакам

8 Зотчев С Б , Соболев Б Н , Степанчикова А В , Сергейко А П, Филимонов Д А , Лагунин А А , Глориозова Т А, Поройков В В Свидетельство об официальной регистрации программы для ЭВМ Biogenpharm № 2007610741 от 15 февраля 2007 г, Москва, Федеральная служба по интеллектуальной собственности, патентам и товарным знакам

Благодарности Работа выполнена при финансовой поддержке Норвежского исследовательского фонда (грант № 165190/V40), фирм SINVENT AS и Biosergen AS (Норвегия)

СПИСОК ИСПОЛЬЗОВАННЫХ СОКРАЩЕНИЙ

БД - база данных

АСР - acyl carrier protein (ацилпереносящий белок) AT - acyltransferase (ацилтрансфераза) DH - dehydratase (дегидратаза) ER - enoyl reductase (енол-редуктаза)

IAP - Invariant Accuracy of Prediction (инвариантная точность прогноза)

KR - ketoreductase (кеторедуктаза)

KS - P-ketoacylsynthase ((3-кетосинтаза)

MDDR - MDL Drug Data Report

NCE - New Chemical Entity

PASS - Prediction of Activity Spectra for Substances

PKS - polyketide synthase ( поликетидсинтаза)

QSAR - Quantitative Structure-Activity Relationship (количественная взаимосвязь «структура - активность») SDF-файл -structure-data file ТЕ - thioesterase (тиоэстераза)

Заказ № 145/03/08 Подписано в печать 20 03 2008 Тираж 100 экз Уел п л 1,25

ООО "Цифровичок", тел (495) 797-75-76, (495) 778-22-20 \vw\v с/г ги , е-тсн1 т/о@с/г ги

Содержание диссертации, кандидата биологических наук, Сергейко, Анастасия Павловна

ВВЕДЕНИЕ.

ГЛАВА 1. ОБЗОР ЛИТЕРАТУРЫ.

1.1. Макролиды.

1.1.1. Биологическая активность и механизм действия макролидов.

1.1.2. Биосинтез макролидов.

1.1.3. Комбинаторный биосинтез.

1.2. Генерация и виртуальный скрининг библиотек химических структур.

1.2.1. Способы описания химической структуры.

1.2.2. Методы отбора структур.

1.2.3. Виртуальные библиотеки поликетидов и их скрининг.

ГЛАВА 2. МАТЕРИАЛЫ И МЕТОДЫ.

ГЛАВА 3. РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ.

3.1. Компьютерная программа В^епегакя для генерации виртуальных библиотек макролидов и описаний синтезирующих их ферментативных, систем.

3.2. База данных по структурным формулам макролидов и соответствующим им биологическим активностям.

3.3. Прогноз биологической активности макролидов.

3.3.1. Оценка точности прогноза биологической активности макролидов для различных обучающих выборок.

3.3.2. Оценка точности прогноза биологической активности макролидов на тестовой выборке.

3.3.3. Оценка точности прогноза биологической активности полусинтетических аналогов эритромицина.

3.4. Генерация и скрининг виртуальной библиотеки аналогов эритромицина.

Введение Диссертация по биологии, на тему "Компьютерное конструирование ферментативных систем, обеспечивающих синтез макролидов с заданными свойствами"

Среди применяемых в настоящее время лекарственных средств большую группу составляют природные соединения и их производные. Примерно 50% принципиально новых препаратов (New Chemical Entity), открытых с 2000 по 2006 годы, являются природными соединениями [1].

Макролиды - это одна из групп природных соединений, общей структурной особенностью которых является наличие макролактонового кольца. Число атомов в макролактоновом кольце варьирует от 8-ми до 62-х у различных соединений. К группе макролидов относятся антибиотики (например, эритромицин и кларитромицин), противогрибковые средства (нистатин, амфотерицин), противоопухолевые средства (эпотилон), иммуносупрессанты (FK506, рапамицин) противопаразитарные (авермектин) и др. [2]. Благодаря структурному разнообразию и многообразию проявляемых биологических эффектов, макролиды являются перспективной группой веществ для поиска среди них новых биологически активных соединений. Особенно актуален поиск новых антибиотиков в связи с развитием резистентности бактерий к уже существующим лекарствам.

В настоящее время поиск новых биологически активных макролидов осуществляется тремя путями: 1) скрининг биологических образцов; 2) химический синтез/модификация известных соединений; 3) модификация бактерий-продуцентов методами генной инженерии, приводящая к синтезу ими новых веществ. Последний подход активно развивается в последние годы и получил название «комбинаторный биосинтез» [3].

Разработка и применение методов комбинаторного биосинтеза стали возможны благодаря расшифровке механизма синтеза макролидов. Макролактоновое кольцо макролидов синтезируется из небольших углеродных фрагментов посредством повторяющихся реакций конденсации, подобно биосинтезу жирных кислот [4]. Этот процесс катализируется модульными поликетидсинтазами (поликетидсинтазами типа I). Модульные поликетидсинтазы (РКБ) являются ферментативными системами, состоящими из нескольких белков. Каждый белок имеет доменное строение, и соответственно, несколько центров, обладающих разными каталитическими активностями. Группа доменов, отвечающая за один цикл конденсации, образует «модуль» [5]. Количество модулей в РКБ и набор доменов в каждом модуле определяют химическую структуру синтезируемого данной ферментативной системой макролактонового кольца. Образовавшееся в результате работы РКБ макролактоновое кольцо обычно подвергается пост-поликетидным модификациям (гидроксилирование, гликозилирование, ацилирование и др.), в результате чего окончательно формируются структура и биологические функции синтезируемой молекулы.' Нуклеотидные последовательности 'генных кластеров многих модульных РКБ, в частности, отвечающих за синтез эритромицина, нистатина, пимарицина, амфотерицина, кандицидина, полностью определены. Разработаны также методы генетических манипуляций с продуцирующими их микроорганизмами [6]. Полностью охарактеризованы генные кластеры, отвечающие за синтез авермектина [7], спинозина [8, 9], мицинамицина [10], сорафена [11]. Методами комбинаторного биосинтеза можно изменять количество и набор доменов и модулей в РКБ, влиять на пост-поликетидные модификации макролактонового кольца, и, таким образом, изменять структуру синтезируемого РКБ макролида.

Теоретически методами комбинаторного биосинтеза можно получить огромное количество новых макролидов [12], однако провести генно-инженерные эксперименты по получению такого большого числа микроорганизмов-продуцентов невозможно. Также заранее неизвестно, будут ли синтезируемые ими вещества проявлять требуемую биологическую активность. Таким образом, является актуальной разработка компьютерного метода, позволяющего отбирать среди множества возможных вариантов макролидов структуры с требуемыми свойствами и определять состав необходимых для их биосинтеза ферментативных систем.

В настоящее время в литературе описано две попытки использования компьютерных методов для рационального поиска новых соединений из группы макролидов. 81аш М.А. и соавторы провели генерацию виртуальных библиотек макролидов с размером макролактонового кольца 12 и 14 атомов, для отбора агонистов рецепторов мотилина они использовали модель фармакофора [13]. АёаЫетззоп Н. и соавторы провели генерацию аналогов рапамицина и отобрали среди них методом докинга структуры, способные связываться с белком РКВР12 [14]: В этих работах генерация структур ограничивалась аналогами определенных макролидов, а в основе алгоритма отбора лежал механизм действия базового вещества. Оопгакг-Ье^ег I. и соавторы описывают метод генерации структур поликетидов и последовательностей ферментов в РК8 типа I, который позволяет получить все возможные молекулы. Однако генерируемые структуры не замкнуты в цикл, и поэтому значительно отличаются от поликетидов, продуцируемых бактериями в живой природе [12].

Предлагаемый нами подход состоит в генерации ш яШсо структур макролидов в соответствии с механизмом их биосинтеза и последующем анализе полученных виртуальных библиотек на основе компьютерного предсказания биологической активности. Такой анализ позволяет предварительно отобрать наиболее перспективные вещества, согласно прогнозу обладающие требуемыми фармакодинамическими свойствами. Для структур макролидов определяется количество модулей, их последовательность и набор доменов в каждом модуле РКБ типа I, которые обеспечивают синтез отобранных соединений, то есть конструируется ферментативная система, необходимая для биосинтеза определенной структуры. Предлагаемый метод может существенно сократить число экспериментов и повысить эффективность поиска новых биологически активных макролидов.

Цель исследования

Разработка метода конструирования т бШсо ферментативных систем синтеза макролидов, генерации соответствующих комбинаторных библиотек вторичных метаболитов и отбора тех вариантов ферментативных систем, которые обеспечивают получение веществ с заданным профилем биологической активности.

Задачи исследования

1. Создание компьютерной программы для генерации виртуальных библиотек структурных формул макролидов и описаний синтезирующих их ферментативных систем.

2. Создание базы данных, содержащей информацию о структуре и биологической активности макролидов.

3. Оценка применимости используемого метода прогноза биологической активности для предсказания биологической активности макролидов.

4. Апробация предложенного метода на примере генерации и скрининга виртуальной библиотеки аналогов эритромицина.

Предложен оригинальный подход к конструированию доменного состава ферментативных систем, обеспечивающих синтез новых макролидов с требуемым профилем биологический активности.

Впервые создана компьютерная программа Вю§епега1:ог, позволяющая генерировать виртуальные библиотеки структур макролидов и описания синтезирующих их ферментативных систем.

Впервые создана база данных, содержащая информацию о структуре и видах биологической активности более 1000 макролидов.

Практическая значимость

Предложенный метод обеспечивает возможность конструирования новых биологически активных структур макролидов и необходимых для их биосинтеза последовательностей доменов в модульных РКБ. Сконструированные ферментативные системы могут быть реализованы в бактериях-продуцентах с помощью методов генной инженерии. Описанный метод дает возможность рационального планирования генно-инженерных экспериментов по модификации бактерий-продуцентов макролидов. Применение описанного подхода позволит значительно сократить число экспериментов по получению структур макролидов и тестированию их биологической активности и, следовательно, существенно снизить временные и финансовые затраты при поиске новых лекарственных препаратов группы макролидов.

Основные положения диссертации были доложены на следующих конференциях:

• Московская международная конференция "Биотехнология и медицина", Москва, 2006.

• 14-я Международная конференция «Новые информационные технологии в медицине, биологии, фармакологии и экологии», Словакия, Низкие Татры, 2006.

• IV Московский международный конгресс «Биотехнология: состояние и перспективы развития», Москва, 2007.

• Научная конференция ГУ НИИ БМХ РАМН, Москва, 2007.

• 4-ый Международный симпозиум «Компьютерные методы в токсикологии и фармакологии, включающие Интернет-ресурсы (СМТР1-2007)», Москва, 2007.

Заключение Диссертация по теме "Биоинформатика", Сергейко, Анастасия Павловна

ВЫВОДЫ

1. Созданная программа Biogenerator для генерации виртуальных библиотек структурных формул макролидов и описаний синтезирующих их ферментативных систем, достаточных для генно-инженерной разработки продуцентов соответствующих макролидов, обеспечивает исчерпывающий перебор потенциально возможных структур.

2. Показано, что добавление к стандартной обучающей выборке программы PASS информации из созданной нами базы данных по макролидам позволяет прогнозировать биологическую активность макролидов со средней точностью 89,4%.

3. Используемый метод прогноза биологической активности предсказывает биологическую активность макролидов со средней точностью 75,5% для тестовой выборки, состоящей из природных макролидов, а для тестовой выборки, состоящей из полусинтетических аналогов эритромицина, со средней точностью 82,9%.

4. На примере генерации и скрининга виртуальной библиотеки аналогов эритромицина показано, что разработанный метод позволяет отбирать среди сгенерированных структур вещества с требуемым профилем биологической активности и определять доменный состав ферментативных систем, необходимый для их биосинтеза.

СПИСОК РАБОТ, ОПУБЛИКОВАННЫХ ПО ТЕМЕ

ДИССЕРТАЦИИ

1. Zotchev S.B., Stepanchikova A.V., Sergeyko А.Р., Sobolev B.N., Filimonov D.A., Poroikov V.V. Rational design of macrolides by virtual screening of combinatorial libraries generated through in silico manipulation of polyketide synthases. // J Med Chem. — 2006. Vol. 49. № 6. - P. 2077-2087.

2. Сергейко А.П., Степанчикова A.B., Соболев Б.Н., Зотчев С.Б., Лагунин А. А., Филимонов Д-А., Поройков В.В. Компьютерное конструирование поликетидов с заданными свойствами. // Биомедицинская химия. -2007. - Т. 53. № 5. - С. 522-531. (Sergeyko А.Р., Stepanchikova A.V., Sobolev B.N., Zotchev S.B., Lagunin A.A., Filimonov D.A., Poroikov V.V. Computer-aided design of polyketides with the required properties. // Biochemistry (Moscow) Supplement Series В: Biomedical Chemistry - 2008. - Vol. 2. №. 1. - P. 55-62).

3. Зотчев С.Б., Степанчикова A.B., Сергейко А.П., Соболев Б.Н., Филимонов Д.А, Поройков В.В. Генерация in silico и скрининг виртуальных библиотек макролидов. // Московская международная конференция "Биотехнология и медицина". Материалы конференции. - Москва. - 2006. - С. 44.

4. Сергейко А.П., Степанчикова А.В., Соболев Б.Н., Зотчев С.Б., Поройков В.В. Компьютерное проектирование ферментативных систем, обеспечивающих синтез макролидов с заданными свойствами. // Материалы XIV международной конференции и дискуссионного научного клуба «Новые информационные технологии в медицине, биологии, фармакологии и экологии». Приложение научно-практического журнала «Открытое образование» — 2006. - №3. — С. 78-79.

5. Сергейко А.П., Степанчикова А.В., Соболев Б.Н., Филимонов Д.А., Зотчев С.Б., Поройков В.В. Biogenpharm — программа для генерации виртуальных библиотек макролидов и отбора структур с заданными свойствами. // Материалы IV Московского международного конгресса «Биотехнология: состояние и перспективы развития». — Москва. — 2007. - С. 409.

6. Sergey ко A., Stepanchikova A., Sobolev В., Zotchev S., Filimonov D., Lagunin A., Poroikov V. Computer — aided design of polyketides with the required properties. // Abstr. 4rd Internat. Symp. «Computational Methods in Toxicology and Pharmacology Integrating Internet Resources (CMTPI-2007)». - Moscow (Russia). - 2007. - P. 144.

7. Зотчев С.Б., Соболев Б.Н., Степанчикова A.B., Сергейко А.П., Поройков В.В. Свидетельство об официальной регистрации программы для ЭВМ Biogenerator № 2007610742 от 15 февраля 2007 г., Москва, Федеральная служба по интеллектуальной собственности, патентам и товарным знакам.

8. Зотчев С.Б., Соболев Б.Н., Степанчикова А.В., Сергейко А.П., Филимонов Д.А., Лагунин А.А., Глориозова Т.А., Поройков В.В. Свидетельство об официальной регистрации программы для ЭВМ Biogenpharm № 2007610741 от 15 февраля 2007 г., Москва, Федеральная служба по интеллектуальной собственности, патентам и товарным знакам.

БЛАГОДАРНОСТИ

Автор выражает признательность всему коллективу Лаборатории структурно-функционального конструирования лекарств ГУ НИИ биомедицинской химии им. В.Н. Ореховича РАМН, лично A.B. Степанчиковой и Б.Н. Соболеву за совместную работу над программой Biogenerator, Д.А. Филимонову за консультирование по широкому кругу вопросов. А также профессору С.Б. Зотчеву (Норвежский университет науки и технологии, г. Тронхейм) как автору идеи, за предоставленные материалы и консультирование по вопросам строения и биосинтеза макролидов.

Работа выполнена при финансовой поддержке Норвежского исследовательского фонда (грант № 165190/V40), SINVENT AS и Biosergen AS (Норвегия).

ЗАКЛЮЧЕНИЕ

В диссертационной работе предложен метод конструирования in silico доменных последовательностей ферментативных систем, обеспечивающих синтез макролидов с заданным профилем биологической активности. Разработана компьютерная программа Biogenerator, которая позволяет генерировать виртуальные комбинаторные библиотеки структур макролидов и последовательности доменов PKS, необходимые для их биосинтеза. Показано, что применение программы PASS для прогноза биологической активности и программы PharmaExpert для анализа результатов прогноза, позволяет отбирать среди сгенерированных структур макролиды с требуемым профилем биологической активности.

В то же время возможны ситуации, когда количество сгенерированных структур очень велико. Например, для поликетидов с размером макролактонового кольца 22 атомов углерода, число возможных

0Q структур составляет 2 . Очевидно, что при работе с такими большими объемами информации возникают проблемы, связанные с необходимостью ее записи и хранения. С целью оптимизации расчетов в случаях, когда количество сгенерированных структур очень велико, нами была разработана компьютерная программа BioGenPharm. Программа BioGenPharm интегрирует функции программ Biogenerator, PASS и PharmaExpert, и позволяет генерировать и отбирать виртуальные структуры поликетидов без записи промежуточных результатов.

Предложенный подход может быть использован для поиска новых соединений, синтезируемых другими видами многомодульных ферментативных систем, например нерибосомальными пептидными синтазами.

Библиография Диссертация по биологии, кандидата биологических наук, Сергейко, Анастасия Павловна, Москва

1. Newman D.J., Cragg G.M. Natural Products as Sources of New Drugs over the Last 25 Years // J. Nat. Prod. 2007. - V. 70. - P. 461-477.

2. Macrolide antibiotics: chemistry, biology, and practice / ed. Omura S. — 2nd ed. Academic Press, 2002. - 635 p.

3. Khosla C., Zawada R.J. Generation of polyketide libraries via combinatorial biosynthesis. // Trends Biotechnol. — 1996. — V. 14. — P. 335-341.

4. Hopwood D.A., Sherman D.H. Molecular genetics of polyketides and its comparison to fatty acid biosynthesis // Annu. Rev. Genet. 1990. - V. 24. -P. 37-66.

5. Donadio S., Staver M.J., McAlpine J.B., Swanson S.J., Katz L. Modular organization of genes required for complex polyketide biosynthesis // Science. 1991. - V. 252. № 5006. - P. 675-679.

6. Aparicio J.F., Caffrey P., Gil J.A., Zotchev S.B. Polyene antibiotic biosynthesis gene clusters // Appl Microbiol Biotechnol. 2003. - V. 61. — P. 179-188.

7. Ikeda H., Nonomiya Т., Usami M., Ohta Т., Omura S. Organization of the biosynthetic gene cluster for the polyketide anthelmintic macrolide avermectin in Streptomyces avermitilis // Proc. Natl. Acad. Sci. USA — 1999.-V. 96. № 17.-P. 9509-9514.

8. Anzai Y., Saito N., Tanalca M., Kinoshita K., Koyama Y., Kato F. Organization of the biosynthetic gene cluster for the polylcetide macrolide mycinamicin in Micromonospora griseorubida // FEMS Microbiol Lett. — 2003.-V. 218. № l.-P. 135-41.

9. Gonzalez-Lergier J., Broadbelt L.J., Hatzimanikatis V. Theoretical Considerations and Computational Analysis of the Complexity in Polylcetide Synthesis Pathways // J. Am. Chem. Soc. 2005. - V. 127. - P. 9930-9938.

10. Siani M.A., Slcillman A.G., Carreras C.W., Ashley G., Kuntz I.D., Santi D.Y. Development and screening of a polyketide virtual library for drug leads against a motilide pharmacophore // J. Mol. Graph. Model. 2000. -V. 18.-P. 497-511.

11. Woodward R.B. Structur und Biogenese der Malcrolide. Eine neuen Klasse von Naturstoffen // Angew. Chem. 1957. - V. 69. - P. 50-58.

12. Masamune S., Bates G.S., Corcoran J.W. Macrolides. Recent progress in chemistry and biochemistry // Angew. Chem. Int. Edit. Engl. 1977. - V. 16.-P. 585-607.

13. US 2653899. Erythromycin, its salts, and method of preparation / Inventor: Bunch R.L; McGuire J.M. Applicant: LILLY CO ELI. Publication date: 1953-09-29.

14. Регистр лекарственных средств России PJIC Энциклопедия лекарств. — 15-й вып. / Гл.ред. Г. JI. Вышковский. М.: «РЛС-2007», 2006. — с. 1488.

15. Mazzei Т., Mini Е., Novelli A., Periti P. Chemistry and mode of action of Macrolides // J. Antimicrob. Chemother. 1993. Mar;31 Suppl C:l-9.

16. Vannuffel P., Cocito C. Mechanism of action of streptogramins and Macrolides//Drugs 1996.-V. 51. Suppl l.-P. 20-30.

17. Meyler's side effects of drugs 15-th ed. / Ed. Aronson J.K. - Elsevier, 2006.-3994 p.

18. Kostrubsky V.E., Strom S.C., Hanson J., Urda E., Rose K., Burliegh J., Zocharski P., Cai H., Sinclair J.F., Sahi J. Evaluation of Hepatotoxic Potential of Drugs by Inhibition of Bile-Acid Transport in Cultured Primary

19. Human Hepatocytes and Intact Rats // Toxicological Sciences 2003. — V. 76.-P. 220-228.

20. Zotchev S.B. Polyene macrolide antibiotics and their applications in human therapy // Curr. Med. Chem. 2003. - V. 10. № 3. - P. 211-223.

21. Hammond S.M. Biological activity of polyene antibiotics // Prog Med Chem. 1977.- V. 14.-P. 105-179.

22. Teerlink Т., de Kruijff В., Demel R.A. The action of pimaricin, etruscomycin and amphotericin В on liposomes with varying sterol content // Biochim. Biophys. Acta. 1980. -V. 599. - P. 484-492.

23. Milhaud J. Permeabilizing action of filipin III on model membranes through a filipin-phospholipid binding // Biochim. Biophys. Acta. 1992. — V. 1105. №2.-P. 307-318.

24. Kobayashi J. Pharmacologically active metabolites from symbiotic microalgae in okinawan marine invertebrates // Journal of Natural Products 1989. - V. 52. № 2. - P. 225-238.

25. Omura S. Splendid Gifts from Microorganisms // The achievements of S. Omura and collaboratots. 3d ed., Kitasato University, 2003.

26. Negwer M., Organic-Chemical Drugs and their synonyms / 8 ed. -Weinheim: Wiley-vch Verlag GmbH, 2001.

27. Oliynyk M., Brown M.J.B., Cortes J., Staunton J., Leadlay P.F. A hybrid modular polyketide synthase obtained by domain swapping // Chem. Biol. — 1996. — V. 3. -P. 833-839.

28. Schwarzer D., Marahiel M.A. Multimodular biocatalysts for natural product assembly //Naturwissenschaften-2001. V. 88. -P. 93-101.

29. Katz L., McDaniel R. Novel macrolides through genetic engineering // Med. Res. Rev. 1999. - V. 19. № 6. - P. 543-558.

30. Cortes J., Haydock S.F., Roberts G.A., Bevitt D.J., Leadlay P.F. An unusually large multifunctional polypeptide in the erythromycin-producing polyketide synthase of Saccharopolyspora erythraea // Nature. — 1990. — V. 348.-P. 176-178.

31. Caffrey P., Lynch S., Flood E., Finnan S., Oliynyk M. Amphotericin biosynthesis in Streptomyces nodosus: deductions from analysis of polyketide synthase and late genes // Chem Biol. 2001. - V. 8. № 7. - P. 713-723.

32. Campelo A.B., Gil J.A. The candicidin gene cluster from Streptomyces griseus IMRU 3570 //Microbiology.- 2002. -V. 148.-P. 51-59.

33. Rawlings B.J. Type I polyketide biosynthesis in bacteria (Part A — erythromycin biosynthesis) // Nat. Prod. Rep." 2001. - V. 18. - P. 190227.

34. Donadio S., McAlpine J.B., Sheldon P.J., Jackson M., Katz L. An erythromycin analog produced by reprogramming of polyketide synthesis // Proc Natl Acad Sci U S A. 1993. - V. 90. № 15. - P. 7119-7123.

35. Khosla C., Gokhale R.S., Jacobsen J.R., Cane D.E. Tolerance and specificity of polyketide synthases // Annu. Rev. Biochem. 1999. - V. 68. -P. 219-253.

36. Rodriguez E., McDaniel R. Combinatorial biosynthesis of antimicrobials and other natural products // Curr. Opin. Microbiol. 2001. - V. 4. - P. 526-534.

37. Thomas I., Martin C.J., Wilkinson C.J., Staunton J., Leadlay P.F. Skipping in a hybrid polyketide synthase. Evidence for ACP-to-ACP chain transfer // Chem. Biol. 2002. - V. 9. - P. 781-787.

38. Lai R., Kumari R., Kaur H., Khanna R., Dhingra N.3 Tuteja D. Regulation and manipulation of the gene clusters encoding type-I PKSs // Trends Biotechnol. 2000. - V. 18. № 6. - P. 264-274.

39. Tang Li, Fu H., McDaniel R. Formation of functional heterologous complexes using subunits from the picromycin, erythromycin and oleandomycin polyketide synthases. // Chemistry & Biology — 2000. — V. 7. № 2. P. 77-84.

40. McDaniel R., Welch M.} Hutchinson C.R. Genetic Approaches to Polyketide Antibiotics // Chem. Rev. 2005. - V. 105. - P. 543-558.

41. Mendes M.V., Recio E., Fouces R.} Luiten R., Martin J.F., Aparicio J.F. Engineered biosynthesis of novel polyenes: a pimaricin derivative produced by targeted gene disruption in Streptomyces natalensis // Chem. Biol. -2001. V. 8. № 7. - P. 635-644.

42. Bohacek R.S., McMartin C., Guida W.C. The Art and Practice of Structure-Based Drug Design: A Molecular Modeling Perspective // Medicinal Research Reviews. 1996. -V. 16. № 1. - P. 3-50.

43. Warr W.A. Combinatorial Chemistry and Molecular Diversity. An Overview // J. Chem. Inf. Comput. Sci. 1997. - V. 37. - P. 134-140.

44. Green D. Virtual screening of virtual libraries — an efficient strategy for lead generation // Drug Design Cutting Edge Approaches / Ed. Darren R. Flower. UK, Cambridge: The Royal Society of Chemistry, 2002. - P. 7288.

45. Molchanova M.S., Shcherbukhin V.V., Zefirov N.S. Computer generation of molecular structures by SMOG program // Journal of Chemical Information and Computer Science 1996. -V. 36. № 4. - P. 888-899.

46. Gugisch R., Kerber A., Laue R., Meringer M., Weidinger J. MOLGEN-COMB, a software package for combinatorial chemistry // MATCH — 2000. -V. 41.-P. 189-203.

47. Иванов A.C., Веселовский A.B., Дубанов A.B., Скворцов B.C., Арчаков А.И. Интегральная платформа «От гена до прототипа лекарства» in silico и in vitro // Рос. хим. ж. — 2006. — Т. L. № 2. — С. 18-35.

48. Xue L., Bajorath J. Molecular Descriptors in Chemoinformatics, Computational Combinatorial Chemistry, and Virtual Screening // Combinatorial Chemistry & High Throughput Screening 2000. - V. 3. — P. 363-372.

49. Lengauer T. et al. Novel technologies for virtual screening // Drug Discovery Today 2004. - V. 9. № 1. - P. 27-34.

50. Todeschini R., Consonni V. Handbook of Molecular Descriptors. -Weinheim: Wiley-VCH, 2000. 688 p.

51. Venkatarajan M.S., Braun W. New quantitative descriptors of amino acids based on multidimensional scaling of a large number of physical-chemical properties // J. Mol. Model. 2001. - V. 7. - P. 445-453.

52. Pozzan A. Molecular Descriptors and Methods for Ligand Based Virtual High Throughput Screening in Drug Discovery // Current Pharmaceutical Design-2006.-V. 12.-P. 2099-2110.

53. Lipinski C.A., Lombardo F., Dominy B.W., Feeney P.J. Experimental and computational approaches to estimate solubility and permeability in drug discovery and development settings // Adv. Drug. Deliv. Rev. 1997. - V. 23.-P. 3-25.

54. McGregor M.J., Muskal S.M. Pharmacophore fingerprinting. 1. Application to QSAR and focused library design // J. Chem. Inf. Comput. Sci. 1999. -V. 39.-P. 569-574.

55. Mason J.S., Cheney D.L. Library design and virtual screening using multiple point pharmacophore fingerprints // Pac. Symp. Biocomput. — 2000.-V. 5.-P. 576-587.

56. Bajorath J. Molecular similarity methods and QSAR models as tools for virtual screening // Drug Discovery Handbook / Ed. Gad S. C. John Wiley & Sons, Inc., 2005.-P. 87-123.

57. Pearlman R.S., Smith K.M. Metric validation and the receptor-relevant subspace concept // J. Chem. Inf. Comput. Sci. 1999. - V. 39. - P. 28-35.

58. Cruciani G., Crivori P., Carrupt P.A., Testa B. Molecular fields in quantitative structure-permeation relationships: the VolSurf approach // Theochem.-2000. — V. 53.-P. 17-30.

59. ROCS 2.3.1 // OpenEye Scientific Software, Inc. August 14, 2007. http://www.eyesopen.com/docs/pdf/rocs.pdf.

60. Leach A.R., Gillet V.J. An Introduction to chemoinformatics / Revised ed. by Leach A.R., Gillet VJ. 2nd printing. - Springer, 2007. - 255 p.

61. Willett P. Similarity-based virtual screening using 2D fingerprints // Drug Discovery Today 2006. - V. 11. № 23-24.-P. 1043-1056.

62. Concepts and Applications of Molecular Similarity / Eds. Johnson M.A., Maggiora G.M. Wiley-Interscience, 1990. - 393 p.

63. Grant J.A., Gallardo M.A., Pickup B.T. A Simple Application of a Gaussian Description of Molecular Shape // J. Comput. Chem. 1996. — V. 17.-P. 1653-1666.

64. Willet P. Similarity and clustering in Chemical Information Systems. -Letchworth: Research Studies Press, 1987. 266 p.

65. Ward J.H. Hierarchical grouping to optimize an objective function // J. Am. Stat. Assoc. 1963. - V. 58. - P. 263-244.

66. Jarvis R.A., Patrick E.A. Clustering using a similarity measure based on shared near neighbors // IEEE Trans. Comput. — 1973. — V. C-22. — P. 1025-1034.

67. Rose R.R. Machine learning techniques in chemistry // Handbook of chemoinformatics / ed. J. Gasteiger. Wiley-vch, 2003. - P. 1082.

68. Chemoinformatics in Drug Discovery / Edited by T.I. Oprea. WILEY-VCH Verlag GmbH & Co, 2005. 493 p.

69. Deshpande M., Kuramochi M., Wale N., Karypis G. Frequent Substructure-Based Approaches for Classifying Chemical Compounds // IEEE Transactions on Knowledge and Data Engineering. 2005. - V. 17. № 8. — P. 1036-1050.

70. Weber L. Current Status of Virtual Combinatorial Library Design // QSAR Comb. Sci. 2005. - V. 24. - P. 809-823.

71. Dudek A.Z., Arodz T., Galvez J. Computational Methods in Developing Quantitative Structure-Activity Relationships (QSAR): A Review //

72. Combinatorial Chemistry & High Throughput Screening. — 2006. — V. 9. — P. 213-228.

73. Филимонов Д.А., Поройков B.B. Прогноз спектра биологической активности органических соединений // Рос. хим. ж. — 2006. — Т. L. №2.-С. 66-75.

74. WO 01/92991 A2. Design of polyketide synthase genes / Inventors: Khosla C.; Reid R.; Santi D.; Siani M. Applicant: Kosan Biosciences, Inc. International Filing Date: 29.05.2001; Publication Date: 06.12.2001. -113 p.

75. Hatzimanikatis V., Li C., Ionita J.A., Henry C.S., Jankowslci M.D., Broadbelt L.J. Exploring the diversity of complex metabolic networks // Bioinformatics — 2004. V. 21. № 8. - P. 1603-1609.

76. Филимонов Д.А., Поройков B.B., Глориозова T.A., Лагунин А.А. Свидетельство об официальной регистрации программы для ЭВМ

77. PASS (Prediction of Activity Spectra for Substances) № 2006613275 от 17 сентября 2006 г. Москва, Федеральная служба по интеллектуальной собственности, патентам и товарным знакам.

78. Filimonov D.A., Poroikov V.V., Borodina Yu.V., Gloriozova T.A. Chemical Similarity Assessment through Multilevel Neighborhoods of Atoms: Definition and Comparison with the Other Descriptors // J. Chem. Inf. Сотр. Sci. 1999. - V. 39. № 4. - P. 666-670.

79. Abu-Gharbieh Е., Vasina V., Poluzzi Е., De Ponti F. Antibacterial macrolides: a drug class with a complex pharmacological profile // Pharmacological Research. 2004. - V. 50. - P. 211-222.

80. Dembitsky V. Astonishing diversity of natural surfactants: 2. Polyether glycosidic ionophores and macrocyclic glycosides // Lipids. — 2005. — V. 40.-P. 219-248.

81. Dembitsky V.M. Chemistry and Biodiversity of the Biologically Active Natural Glycosides // Chemistry & Biodiversity. 2004. - V. 1. - P. 673-781.

82. Kobayashi J., Tsuda M. Amphidinolides, bioactive macrolides from symbiotic marine dinoflagellates // Nat. Prod. Rep. — 2004. — V. 21. — P. 77-93.

83. Faulkner D.J. Marine natural products // Nat. Prod. Rep. 2001. - V. 18. -P. 1-49.

84. Degerli K., Kilimcioglu A.A., Kurt O., Tamay A.T., Ozbilgin A. Efficacy of azithromycin in a murine toxoplasmosis model, employing a Toxoplasma gondii strain from Turkey // Acta Trop. — 2003. — V. 88. № 1. -P. 45-50.

85. Stanat S.J., Carlton C.G., Crumb W.J.Jr., Agrawal K.C., Clarkson C.W. Characterization of the inhibitory effects of erythromycin and clarithromycin on the HERG potassium channel // Mol. Cell. Biochem. — 2003.-V. 254. P. 1-7.

86. Chen S.Z., Jiang M., Zhen Y.S. HERG K+ channel expression-related chemosensitivity in cancer cells and its modulation by erythromycin // Cancer Chemother. Pharmacol. 2005. -V. 56. № 2. - P. 212-220.

87. Rodrigues A.D., Roberts E.M., Mulford D.J., Yao Y., Ouellet D. Oxidative \ metabolism of clarithromycin in the presence of human liver microsomes.

88. Major role for the cytochrome P4503A (CYP3A) subfamily // Drug Metab. Dispos. 1997. - V. 25. № 5. - P. 623-630.

89. Kenworthy K.E., Bloomer J.C., Clarke S.E., Houston J.B. CYP3A4 drug interactions: correlation of 10 in vitro probe substrates // Br. J. Clin. Pharmacol. 1999. - V. 48. № 5. p. 716-727.

90. Schlunzen F., Zarivach R., Harms J., Bashan A., Tocilj A., Albrecht R., Yonath A., Franceschi F. Structural basis for the interaction of antibiotics with the peptidyl transferase centre in eubacteria // Nature 2001. - V. 413. -P. 814-821.

91. Peeters T.L. Erythromycin and other macrolides as prokinetic agents // Gastroenterology 1993.-V. 105. № 6.-P. 1886-1899.

92. Doherty W.L., Winter B. Prokinetic agents in critical care // Crit. Care. -2003. V. 7. № 3. -P. 206-208.

93. Schultz M.J., Speelman P., van der Poll T. Erythromycin inhibits Pseudomonas aeruginosa-induced tumour necrosis factor-alpha production in human whole blood // J. Antimicrob. Chemother. 2001. - V. 48. № 2. -P. 275-278.

94. Suzuki M., Asano K., Yu M., Hisamitsu T., Suzaki H. Inhibitory action of a macrolide antibiotic, roxithromycin, on co-stimulatory molecule expressions in vitro and in vivo // Mediators Inflamm. 2002. - V. 11. - P. 235-244.

95. Mitsuya Y., Kawai S., Kobayashi H. Influence of macrolides on guanosine diphospho-D-mannose dehydrogenase activity in Pseudomonas biofilm // J. Infect. Chemother. 2000. - V. 6. № 1. - P. 45-50.

96. US 2005/0014706 Al. Method of treating tuberculosis / Application Number: 10/889,346. Publication Date: 20/01/2005.

97. Yatsunami J., Tsuruta N., Fukuno Y., Kawashima M., Taniguchi S., Hayashi S. Inhibitory effects of roxithromycin on tumor angiogenesis, growth and metastasis of mouse B16 melanoma cells // Clin. Exp. Metastasis- 1999.-V. 17. №2.-P. 119-124.

98. Aoki D., Ueno S., Kubo F., Oyama T., Sakuta T., Matsushita K., Maruyama I., Aikou T. Roxithromycin inhibits angiogenesis of human hepatoma cells in vivo by suppressing VEGF production // Anticancer Res. -2005.-V. 25. № 1A.-P. 133-138.

99. Ohara T., Morishita T., Suzuki H., Masaoka T., Ishii H., Hibi T. Antibiotics directly induce apoptosis in B cell lymphoma cells derived from BALB/c mice // Anticancer Res. 2004. - V. 24. № 6. - P. 3723-3730.

100. Shimane T. et al. Influence of a macrolide antibiotic, roxithromycin, on mast cell growth and activation in vitro // Mediators Inflamm. — 2001. — V. 10. № 6.-P. 323-332.