Бесплатный автореферат и диссертация по биологии на тему
Корреляционные модели для расчета физико-химических свойств и биологической активности органических соединений
ВАК РФ 03.00.02, Биофизика

Автореферат диссертации по теме "Корреляционные модели для расчета физико-химических свойств и биологической активности органических соединений"

На правах рукописи

□ОЗОВ2ВВЗ

ЦЫГАНКОВА Ирина Глебовна

Корреляционные модели для расчета физико - химических свойств и биологической активности органических соединений

03 00 02 «биофизика»

АВТОРЕФЕРАТ

диссертации на соискание ученой степени доктора физико-математических наук

ПУЩИНО 2007

003062663

Работа выполнена в Институте теоретической и экспериментальной биофизики РАН

Научный консультант доктор физико-математических наук

¡Голованов Игорь Борисович! Официальные оппоненты доктор физико-математических наук

Комаров Владислав Михайлович доктор физико-математических наук Смолянинов Владимир Владимирович доктор химических наук, профессор Папулов Юрий Григорьевич Ведущая организация Кафедра биофизики биологического

факультета МГУ

Защита диссертации состоится _2007 г в " ^часов на

заседании диссертационного совета Д 002 093 01 при Институте теоретической и экспериментальной биофизики РАН, адрес 142290, г Пущино Московской обл , ул Институтская, 3, ИТЭБ РАН

С диссертацией можно ознакомиться в библиотеке ИТЭБ РАН Автореферат разостан " О-гг^/с/ 2007 г

Ученый секретарь диссертационного совета кандидат физ -мат наук

м

Ланина Н Ф

При решении многих задач в области биологии и биофизики, медицины или материаловедения необходимо знать физико-химические свойства или биологическую активность разнообразных органических соединений1 Непосредственное измерение свойства может быть связано со многими трудностями (сложный эксперимент, большие затраты ресурсов и времени, вредность для окружающей среды и т п ) Точный расчет свойства на базе строгих теорий не всегда возможен Зависимость физико-химических свойств или биологической активности от структуры, очевидная на интуитивном уровне и имеющая многочисленные экспериментальные подтверждения, очень трудно выражается в количественной форме Подчас неизвестен механизм проявления свойства, условия и системы наблюдения сложны, детали и особенности закономерностей спрятаны в огромном накопленном экспериментальном материале Таким образом, расчеты характеристик реальных систем, на основе структуры составляющих их молекул, отличаются сложностью, и не всегда большие вычислите тьные усилия вознаграждаются достаточной точностью и надежностью получаемых количественных оценок Однако для многих целей могут быть достаточны приближенные оценю! свойства, которые получаются на основе корреляционного соотношения структура - свойство Корреляционное соотношение структура-свойство (КССС) - это уравнение, связывающее значения свойства Р с количественными характеристиками молекулярной структуры X

р=т

В качестве набора величин Х=А'/, Х2, могут быть использованы разнообразные характеристики, которые определяются по молекулярной структуре и называются молекулярными дескрипторами, такие, как молекулярный вес, число атомов определенного типа, заряды, энергии молекулярных орбиталей и т и2 Вид функциональной зависимости / выбирается на основе знаний о механизме свойства или из правдоподобных предпочожений, исходя из здравого смысла и интуиции

'В дальнейшем рассмотрении физико-химические свойства или биологическая активность органических соединений будут обозначаться обидам словом "свойство" там, где не требуется учитывать их особенности

2Todeschini R Consonm V The Handbook of Molecular Descriptors In The Series of Methods and Principles in Medicinal Chemistry Mannhold R , Kubinyi H , Timmerman H Eds Wiley-VCH New York, 2000 Vol 11, p 680

исследоватетя Функция / включает ряд параметров 0 =6), 02, , подбираемых по известным значениям свойства для набора соединений, считающихся тренировочными

р=М,е)

В отсутствии строгих рецептов выбора функции /, в корреляционных соотношениях часто используется линейная зависимость, а параметры 0 выступают в роли весовых коэффициентов

Корреляционное моделирование связи свойства с молекулярной структурой включает следующие этапы 1) выбор количественных характеристик молекулярной структуры, 2) построение КССС и определение его параметров, 3) исследование возможностей применения данного КССС для оценок свойства Корреляционные подходы могут давать количественные оценки свойства с точностью, сопоставимой с точностью экспериментальных измерений Такие подходы не устанавливают зависимости свойства от молекулярной структуры в явном виде, но позволяют выявить роль отдельных структурных элементов и прогнозировать изменения свойства соединения при модификации его молекулярной структуры

Настоящее исследование посвящено развитию методов построения КССС и их использованию для расчетов количественных характеристик ряда физико-химических свойств и разных видов биологической активности Возможности разрабатываемого подхода были проверены в расчетах следующих свойств теплоты образования температуры кипения, теплоты испарения, теплоемкости, давления насыщенных паров, критических температуры, давления и объема, коэффициента распределения октанол-вода, поляризуемости, диамагнитной восприимчивости, свободной энергии комплексообразования, длительности действия и периода полувыведения лекарственных веществ, ингибирующей активности В число исследуемых были включены следующие соединения насыщенные и ненасыщенные углеводороды нормального, разветвленного и циклического строения, алифатические спирты, амины и галогенпроизводные с одной или несколькими функциональными группами, ароматические соединения, гетероциклы, перфторуглероды, амиды карбоновых кислот, аминокислоты и их Ы-ацетилпроизводные, пептиды, содержащие до пяти аминокислотных остатков, сс-циклодекстрин и производные бензола,

барбитуровой кистоты, производные циклогексена и циклопентана в качестве ингибиторов нейраминидазы

Цель и задачи исследования

Основная цель исследования - разработка методологии построения корреляционных моделей для расчета количественных оценок физико-химических свойств веществ или биологической активности соединении по их молекулярной структуре

В ходе исследования необходимо было решить следующие задачи

1) разработать приемы фрагментного представления молекулы для корректной количественной кодировки молекулярной структуры,

2) изучить применение различных методов отбора переменных и упрощения корреляционного соотношения,

3) провести интерпретацию полученных количественных корреляций структура-свойство, получить новую информацию о свойстве и его связи со структурой соединений,

4) продемонстрировать эффективность корреляционного метода вычисления свойств и биологической активности, т е на ряде примеров показать описательную и предсказательную силу корреляционных моделей

Актуальность.

Актуальность исследования обусловлена тем, что в настоящее время синтезируются многие тысячи новых веществ, физико-химические свойства или биологическая активность которых требуют изучения Для этого необходимы количественные оценки характеристик вновь синтезируемых соединений, которые трудно или невозможно определить экспериментально

Корреляционные подходы дают возможность направлять поиск новых веществ с заданными свойствами, в том чисчс с желаемым лекарственным действием, и сокращать стоимость, временные затраты и необходимые испытания на животных

Новизна.

Разрабатываемый подход основывается на фрагментном представлении молекулы Новизна предложенных моделей заключается в том, что выбор фрагментов разного типа и разной величины обусловлен внутри- и межмолекутярными взаимодействиями, существенными для рассматриваемого процесса, а не связан

3

жестко с атомами или группами атомов Степень детализации фрагментного представления молекулярной структуры определяется конкретной задачей Впервые взаимодействия между фрагментами включены в корреляционное соотношение в явном виде или в форме вклада, который как параметр определяется по молекулам тренировочного набора, или в форме функции от расстояния между фрагментами Это позволяет уменьшать число параметров корреляционного соотношения и решать задачи в условиях ограниченного набора экспериментальных данных Предложенный подход отличается общностью и гибкостью, и применим к разнообразным физико-химическим свойствам или биологической активности

Практическая значимость

Корреляционные подходы могут служить для предсказания физико-химических свойств 1Г7И биологической активности вновь синтезируемых соединений и направлять поиск новых соединений с более предпочтительными характеристиками Предложенные корреляционные модели могут оказаться полезными для формирования критериев поиска в базах данных, например, при конструировании новых лекарственных соединений

Разрабатываемые модели могут применяться в качестве простых и быстрых сггособов оценки биологической и экологической безопасности

Апробация работы

Результаты исследований были доложены на российских и международных конференциях, институтских и межлабораторных семинарах

1 ХШ Семинар по межмолекулярному взаимодействию и конформациям молекул, г Тверь 1997г

2 XIV Семинар по межмолекулярному взаимодействию и конформациям мотекул, г Плес, Ивановской обл 25-29 июня 2001г

3 10-ая международная конференция «Математика Компьютер Образование», г Пугцино 20-25 января 2003г

4 XII Симпозиум по межмолекулярному взаимодействию и конформациям молекул г Пущино 14-18 июня 2004г

5 4-я Всероссийская конференция "Молекулярное моделирование", г Москва 12 -15 апреля 2005 г.

6 Международная конференция «Биологические мишени для действия лекарственных препаратов нового поколения» Центр высоких технологий «Химрар», г Химки, Московская обл 28-30 марта 2006г

Работа выполнена в рамках плана НИР Института По теме диссертации опубликовано 27 статей в отечественных и зарубежных изданиях

Структура работы.

Диссертация представлена в стандартной форме и состоит из введения, обзора литературы, описания основного метода и подходов, результатов применения разрабатываемых моделей, выводов и списка цитируемой литературы Работа изложена на"/ страницах, содержит рисунков и таблиц, ^/Литературных ссылок

Краткое содержание работы.

1. Введение.

Во введении диссертации формулируются цели и задачи исследования, дается обоснование их актуальности

2. Развитие и современное состояние корреляционных подходов в изучении связи молекулярной структуры и физико-химических свойств или биологической активности органических соединений

Во втором разделе диссертации дается обзор публикаций других исследователей, касающихся общих вопросов установления корреляции молекулярная структура-свойство

Попытки установить связь свойств вещества и его структуры восходят исторически еще к трудам М В Ломоносова, когда представления о молекулярном строении только начинали зарождаться Дальнейшее развитие химии и физики послужило базой для новых подходов в исследовании зависимости свойства от молекулярной структуры Однако и в настоящий момент теоретический расчет количественных оценок свойства, исходя из молекулярной структуры, является сложной задачей Современная теория может описать зависимость свойства от структуры только для очень упрощенных молекулярных систем

В рамках простых методов квантовой механики 3 для энергии изолированной молекулы получается выражение

Я-.2Х+5Х (1)

Здесь Е„ - одноцентровый вклад, отвечающий i-тому ядру, Е„- двухцентровый вклад, отвечающий взаимному влиянию i-того и j -того ядер, составляющих молекулу Матричные элементы Е„ и Ev определяются в базисе занятых молекулярных орбиталей Они различны для разных конформаций одной молекулы Только приближенно некоторые из этих вкладов можно считать одинаковыми для разных молекул одного класса соединений В общем случае Еу убывает с расстоянием

Для молекулярных свойств, зависящих от энергии, в рамках теории возмущений получается аналогичное соотношению (1) выражение

Р»Т,Р.+Т,Р, (2)

Здесь Р„ и P,j соответственно одноцентровые и двухцентровые вклады

Так могут быть оценены, например, поляризуемости и диамагнитные

восприимчивости молекул

Многие физико-химические свойства требуют статистического рассмотрения макротела как ансамбля молекул В книге В М Татевского4 показано, что с испотьзованием приближенных вариантов статистической теории макротел термодинамические функции и их производные и для идеального газа, и для реальных систем, где существенную роль играют межмолекулярные взаимодействия, могут быть представлены в виде суммы парциальных величин, сопоставтяемых атомам или более крупным структурным элементам, составляющим молекулу, а также парам, тройкам и более крупным группам структурных элементов Таким образом, для физико-химических свойств можно записать

<г (а Я (а р г)

Здесь Ра -парциальная величина дчя свойства Р, приходящаяся на структурный элемент Sa, Р(а,р) - парциальная величина свойства Р, приходящаяся на пару

3 Pople J А , Santry D Р Segal G A Approximate Self-Consistent Molecular Orbital Theory I Invanant Procedures //J Chem Phys 1965 V 43 N10(11) P S129-S135

4 Татевский В M "Теория физико-химических свойств молекул и веществ" Изд-во МГУ 1987 г

структурных элементов (Яд, системы, и т д Соотношение (3) представляет собой корреляционное соотношение структура-свойство самого общего вида, которое опирается на разделение молекулы на некоторое количество структурных элементов, т е фрагментов Число разных фрагментов, входящих в молекулу, характеризует молекулярную структуру количественно и может выступать в роли молекулярного дескриптора Корреляционные модели структура-свойство, основанные на фрагментом представлении молекулярной структуры, назовем фрагментными В таких подходах фрагментом, как правило, считают атом, связь или группу атомов Фрагментные подходы привлекают тем, что корреляционные модели, полученные в таких подходах, наглядны, их параметры имеют ясный структурный смысл Простые фрагментные подходы представляют свойство в виде одной суммы фрагментных вкладов, несмотря на то, что многие свойства молекулярных систем можно считать аддитивными по элементам структуры только приблизительно Одной из первых количественных закономерностей в таких подходах было уравнение Гаммета, которое устанавливает корреляцию между строением производных бензола и их реакционной способностью В дальнейшем простейшие соотношения для свойства в виде суммы парциальных вкладов фрагментов были модифицированы Для получения удовлетворительных по точности оценок различных свойств потребовалось вводить в корреляционное соотношение очень большое число поправок, поскольку вклады фрагментов существенно зависят от их молекулярного окружения И для того, чтобы такие модели обладали предсказательной способностью и давали оценки свойств или активности удовлетворительной точности, необходимо определять значительное число параметров корреляционного уравнения, что требует наличия большой базы экспериментальных значений для тренировочного набора соединений

Таким образом, несмотря на довольно богатую историю использования корреляций структура - свойство для расчетов разнообразных свойств, остается актуальной работа по совершенствованию количественного представления молекулярной структуры и повышения точности оценок, полученных в корреляционных расчетах

3. Методы построения корреляционных моделей для оценок физико-химических свойств и биологической активности

В третьем разделе диссертации описаны приемы и методы разбиения молекул на фрагменты для представления структуры разнообразных соединений в численном виде и математические аспекты вычисления характеристик соединений при помощи корреляционных моделей

Фрагментное представление структуры молекулы в предлагаемом подходе отличает и общность, и гибкость Надо сказать, что многие исследователи разрабатывают фрагментные подходы, в которых определение фрагментов жестко связано с химической природой атомов и групп В таких подходах предсказание свойства нового соединения невозможно, если в состав этого соединения входят фрагменты, которые не встречаются ни в одном из соединений тренировочного набора В нашем методе тип фрагмента определяется теми межмолекулярными взаимодействиями, в которых участвует атом или группа атомов В некоторых случаях это позволяет относить к одному типу фрагменты, соответствующие например, разным атомам, но участвующие в образовании водородной связи Таким образом, новый фрагмент считается приближенно одинаковым с некоторым, уже имеющимся фрагментом, и это расширяет предсказательные возможности разрабатываемого нами фрагментного подхода

В насыщенных углеводородах для описания молекулярной структуры нами использовались фрагменты одного типа, связанные с атомом углерода, поскольку для многих свойств насыщенных углеводородов группы - СН3, - СН2 >СН- и >С< можно считать тождественными Вклад в свойство Р такого фрагмента обозначали Р„ = Рл - а Длины связей и валентные углы считали приблизительно одинаковыми в разных молекулах насыщенных углеводородов Тогда и соответствующие многофрагментные вклады в соотношении (3) также можно считать приблизительно одинаковыми Для вкладов пары фрагментов, разделенных разным числом связей, вводились следующие обозначения

Р, ,+/= Ри+1 - /3 - для пары фрагментов, разделенных одной связью, т е соседних фрагментов,

Р,: ,+2= Р^+2 - у- Для пары фрагментов, разделенных двумя связями, Р,= Ри-,з -514, ~ Для пары фрагментов, разделенных тремя связями,

Р, = Рн+4 =5ц и т д

Если ограничить рассмотрение тотько двухфрагментными вкладами, то с помощью введенных обозначений соотношение (3) для насыщенных углеводородов можно переписать в виде

Р = па + (п - \)Р + щгу + п14дн + + (4)

Здесь п- число атомов углерода или однофрагментных вкладов, Пц П14 Пц -число парных вкладов определенного типа Эти величины количественно характеризуют молекулярную структуру насыщенных углеводородов, другими словами, являются молекулярными дескрипторами Значения вкладов а , р, у, 314, Зц, представляют собой параметры корреляционного соотношения и определяются по экспериментально измеренным значениям свойства тренировочного набора соединений Появление в тренировочном наборе соединений молекул с гетероатомами X, например, спиртов или аминов, отражается в корреляционном соотношении дополнительными вкладами ах, Рсх, Усх> (дсх>14, (^сх>15 итд Если в рассматриваемом ряду соединений повторяется некоторая группа атомов, то мы предложили описывать ее целиком одним фрагментом соответствующего типа Этот

прием упрощает корреляционное соотношение, уменьшая число параметров Например, в ряду производных барбитуровой кислоты (схема 1) был выбран единый фрагмент А для пиримидинтрионового кольца барбитуровой кислоты Для того, чтобы учесть реальное расположение атомов в пространстве, мы вводили специальные параметры Например, вклад атомов, разделенных тремя связями, в зависимости от конфигурации атомной цепочки мы описывали

параметрами =^14(180°) или =<514(60°) Аналогично, вместо вклада 615

с транс, транс с^ транс, гош ггош,гош

следует рассматривать вклады , , °\5 Учитывая

введенные параметры, мы записывали корреляционное соотношение для линейных упеводородов в виде

о,

Схема 1 \ Фрагмент А

И. и - алкильные радикалы

P = na+(n-l)ß+(n-2)7+Kr 4Г +

транс,транс г транс,транс , транс,гош сггранс,гош , "15 15 + "U °15 + (5)

Здесь или и"™ - число вкладов пар фрагментов, разделенных тремя связями, в

транс или гош конфигурации четырехатомной цепочки, п™Ранс-тРанс ^ Пу?а"с гош,

Пц - число вкладов пар фрагментов, разделенных четырьмя связями, равное числу соответствующих конфигураций из пяти атомов в молекуле Для пар фрагментов, разделенных расстоянием ббчьшим, чем 4 связи, число параметров будет еще возрастать

Для определения значений большого количества параметров корреляционного соотношения часто не хватает экспериментальных значений свойства Приходится искать пути сокращения числа параметров корреляционного соотношения В некоторых случаях мы считали, например, что усх~7сс, Sex «<%:с > ил" использовали укрупненные фрагменты, или приближенно полагали, что 3™!'аис = =614

Многие свойства проявляют неаддитивность, т е зависят от числа фрагментов в молекулярной структуре нелинейно Это хорошо заметно на нормальных углеводородах Удлинение молекулярной цепочки углеводорода на группу СН2 вызывает увеличение, например, температуры кипения на величину AT сн2> которая зависит от длины уже имеющейся цепочки

ЛТСн2 = ТИ!„(С,Н6)- ТЬИП(СН4) ■= 72 8 К, а ДТсн2= Ттп(С2оН42) - ТкипСС^Над) = 13 9 К Это наблюдение позволило нам предположить, что на вклад в свойство определенного фрагмента оказывают влияние все остальные фрагменты, составляющие молекулу, другими словами, фрагменты взаимодействуют Таким образом, двухфрагментные вклады Д у, д14, 8ц соотношений (4) и (5) мы считали вкладами взаимодействия фрагментов, разделенных разным числом связей, те расположенных на разных расстояниях Несмотря на то, что допущение о взаимодействии фрагментов было сделано формально, оно оказалось полезным при построении корреляционных моделей, что подтверждается примерами, рассмотренными в четвертом разделе диссертации Предположение о том, что

фрагменты взаимодействуют, позволите нам 1) описать неаддитивность свойства при помощи линейного по параметрам корреляционного соотношения, 2) предложить функциональную зависимость взаимодействия фрагментов от расстояния между ними Необходимо подчеркнуть, что взаимодействие фрагментов не является физическим взаимодействием в общепринятом смысле, но оно эффективным образом отражает реальные внутри- и межмолекулярные взаимодействия

Таким образом, предлагаемый нами способ разбиения молекулы на фрагменты является компромиссом между стремлением подробно описать молекулярную структуру и необходимостью определять значения большого числа параметров Поскольку в предлагаемом подходе типы и величина фрагментов определяются при анализе изучаемой молекулярной системы, то для решения различных задач можно выбирать разную степень детализации молекулярной структуры Это позволило строить относительно простые корреляционные соотношения и справляться с определением их параметров при ограниченном наборе экспериментальных данных

Важнейшую часть корреляционного моделирования составляет применение математических методов Корреляционные соотношения типа соотношения (3) являются линейными по параметрам и позволяют применять методы линейной регрессии Известные значения свойства для N тренировочных соединений образуют М-мерньш вектор откликов Р (зависимых переменных) Аналогично значения молекулярных дескрипторов для структур тренировочного набора соединений образуют векторы-столбцы матрицы предикторов X (объясняющих или независимых переменных) модели Параметры корреляционного соотношения 0 выбираются, например, методом наименьших квадратов

?1 Хц Х21 Хр, а

Р2 Х,2 Х22 Хр2 Р

р= х= 0= 7

¿>14

Рк Хщ Х2,\ Хрх

Таким образом, корреляционное соотношение в матричной форме записывается в следующем виде

Ррасч — X ©

Точность потученных корреляционных моделей мы характеризовали коэффициентом корреляции (г) и стандартным отклонением (б) вычисленных оценок свойства Ррасч от эксперимента (т е известных значений свойства Р)

При использовании фрагментного представления молекулярной структуры, векторы предикторов, как правило, не ортогональны и имеют достаточно большую взаимную скоррелированность, т е коэффициенты парной корреляции между столбцами матрицы значений предикторов X не намного меньше 1 Это означает, что порции информации о молекулярной структуре, которые содержатся в разных дескрипторах, перекрываются Например, для насыщенных углеводородов, кодируемых фрагментом одного типа С, между дескриптором п (чисто фрагментов) и дескриптором п]г (число пар фрагментов, разделенных одной связью) существует однозначное соответствие пц = п-1 С математической точки зрения, гораздо удобнее иметь дело с независимыми предикторами Для матрицы дескрипторов можно найти преобразование, в результате которого дескрипторы, полученные как линейная комбинация исходных дескрипторов, будут взаимно ортогональными Следует отметить, что получаемые при использовании ортогональных молекулярных дескрипторов корреляционные модели отличает высокая точность при небольшом числе параметров соотношения Но структурный смысл таких дескрипторов теряется почти полностью, поскольку каждый из них является линейной комбинацией всего набора исходных, иногда довольно многочисленных дескрипторов Такие корреляционные модели трудно использовать для интерпретации и установления причинно-следственной связи свойства и молекулярной структуры Для создания содержательных моделей предпочтительно использовать дескрипторы с ясным смыслом В наших исследованиях при построении корреляционных моделей из каждой пары или группы дескрипторов, имеющих скоррелированность выше некоторого значения, в матрице предикторов оставлялся один Также отбрасывались дескрипторы, имеющие постоянные или слабо изменяющиеся значения для всего тренировочного набора соединений После этого для определения параметров корреляционного соотношения применялись регрессионные методы

Отбор переменных корреляционного соотношения - важный шаг в построении корреляционной модели Этот шаг может быть необходим по нескольким причинам 1) задача не доопределена, т е число столбцов матрицы предикторов больше, чем число экспериментальных значений, 2) уменьшая число дескрипторов, можно выделить дескрипторы, наиболее важные для проявления свойства, по структурному смыслу оставленных дескрипторов можно строить гипотезы относительно проявления свойства или механизма активности, 3) корреляционная модель с небольшим набором дескрипторов может быть использована для поиска в базе данных, когда необходимо исследовать очень большое число соединений

В случае, если переменные ортогональны, уменьшить их число можно, исключая дескрипторы, наименее скоррелированные со значениями свойства Отбор неортогональных дескрипторов - задача, более трудная из-за их взаимозависимости Надежно получить наилучшее корреляционное уравнение можно, если применять метод всех регрессий, но это - весьма долгий путь, на котором необходимо исследовать все возможные сочетания предикторов Процедура пошагового отбора существенно более быстрая, но она не дает наилучшей комбинации дескрипторов, поскольку при таком отборе не исследуются все комбинации дескрипторов

Для того, чтобы полнее исследовать все комбинации дескрипторов, мы разработали процедуру последовательного применения пошаговой регрессии Она начиналась от моделей с одной переменной, в качестве которой выступал поочередно каждый дескриптор из исходного набора, а также и от моделей, включающих все дескрипторы кроме одного, которым был поочередно каждый дескриптор Из полученных таким образом корреляционных моделей выбирались око то 10 лучших, с разным числом переменных Как правило, полученные модели имели близкие наборы дескрипторов Затем полученные модели "возмущались" добавлением или исключением 1-3 дескрипторов, выбранных случайным образом, и процедура пошаговой регрессии применялась вновь Для анализа и интерпретации оставлялись 1-2 лучших по точности модели с числом дескрипторов не более 20% от числа экспериментальных точек

Целью построения корреляционных моделей, по большому счету, является предсказание, т е вычисление характеристик свойств новых соединений

Для количественной меры предсказательной силы корреляционной модели нами были использованы метод внешнего контроля (вычистятось свойство соединений тестового набора, не участвовавших в параметризации корреляционного соотношения) и метод внутреннего контроля (метод скользящего исключения по одному - (еауе-опе-ош), как описано в литературе

Однако для задач конструирования веществ с заданными свойствами и новых лекарственных препаратов требуется ответить на вопрос как надо изменить структуру, чтобы свойство изменилось нужным образом Такое предсказание фактически является обратной задачей корреляции структура -свойство Развиваемый нами фрагментный подход весьма полезен для предсказаний такого рода Поскольку в корреляционное соотношение явно входят фрагментные вклады, то по знаку коэффициентов можно предположить как присутствие того или иного фрагмента влияет на свойство Анализ вкладов в корреляционное соотношение позволяет предлагать модификации молекулярной структуры, направленные на заданное изменение свойства

Таким образом, корреляционное исследование можно сжато представить в виде последовательности следующих шагов

1 Поиск и сбор систематических и однородных (полученных в близких условиях) экспериментальных значений исследуемого свойства для ряда соединений, составляющих тренировочный набор

2 Анализ физических условий проявления свойства и химического своеобразия набора соединений, для которых имеются экспериментальные значения, выбор фрагментного представтения молекулярной структуры

3 Расчет молекулярных дескрипторов, необходимых с точки зрения предполагаемого механизма проявления свойства Исключение из матрицы предикторов сильно скоррелированных дескрипторов молекулярной структуры и дескрипторов, которые для исследуемого набора соединений имеют постоянные или слабо изменяющиеся значения

4 Определение наилучших корреляционных моделей и вычисление их параметров Контроль статистических характеристик полученных моделей

Анализ связи структурных изменений и изменений свойства Предсказание и оценки свойств экспериментально неизученных соединений

Результаты исследований и обсуждение.

В четвертом и гитом разделах диссертации представлены примеры расчета разнообразных свойств и биологической активности органических соединений, демонстрирующие возможности корреляционного моделирования

4. Расчеты физико-химических свойств органических соединений разных классов

4 1. Энергетические характеристики отдельных молекул и их комплексов в вакууме и водном окружении.

Первоначально фрагментное представление молекулярной структуры применялось нами для расчета такого свойства, как энергия молекул и их комплексов, с использованием потенциальных функций межмолекулярного взаимодействия [1, 2]5 Полученные предпочтительные структуры молекул и их комплексов в вакууме совпадают с результатами расчетов ab initio Для оценки энергии гидрофобного взаимодействия, которая необходима при рассмотрении молекул в водном окружении, мы вычисляли логарифм коэффициента распределения между органической и водной фазами (log Р) Для этого использовали величину доступной растворителю поверхности различных групп, входящих в молекулу [2]

logP =K0+J]KS, (6)

Здесь 5, - доступная поверхность i-того фрагмента в составе молекулы, К, -эмпирические коэффициенты, подбираемые регрессионными методами при воспроизведении известных данных В таком приближении удалось передать экспериментальные значения log Р для органических соединений разных классов с хорошей точностью Для набора насыщенных углеводородов (число соединений в наборе N =7) были получены г=0 9720 и s=0 17, для ненасыщенных углеводородов (N

5 Здесь и далее дается ссылка на Список публикаций, относящихся к теме диссертации (см в конце автореферата)

=23) - r=0 9873, s=0 20, для соединений с полярными группами (N =25) - г=0 9453, s=0 30 С использованием такого подхода удалось показать, что в водном окружении компактные структуры комплексов и "свернутые" конформации молекул более предпочтительны На основании модельного рассмотрения сворачивания углеводородной цепочки в воде был сделан прогноз положения точек поворотов в молекулах бетков [3] Однако следует отметить, что использование такого подхода для массового расчета, например, биочогической активности ведет к значительным вычислительным затратам Поэтому в качестве возможных дальнейших упрощений мы перешли к корреляционным моделям, которые дают количественные оценки биотогической активности удовлетворительной точности без использования потенциальных функций межмолекулярных взаимодействий

Опыт применения модификации метода интегральных уравнений для многоатомных систем ( Reference Interaction Site Approximation, RISM, алгоритм и программа разработаны Д А Тихоновым) к вычислению свободной энергии переноса молекул углеводородов из газовой фазы в водную [9, 13] позволил получить оценки, качественно совпадающие с экспериментальными значениями свободной энергии переноса только для линейных молекул Для повышение точности оценок свободной энергии переггоса мы предложили к значению свободной энергии переноса AG, рассчитанного по методу RISM, добавить поправки на взаимодействие близких фрагментов в духе корреляционного соотношения (4) Таким образом, соотношение для расчета свободной энергии и других термодинамических характеристик (Р) переноса углеводородных молекул C„f Ijn+2 из газовой фазы в воду было приведено к виду

р» = Р*™ + "Д" + (" ~ + «>зЛ/ + (7)

Здесь п13 - число пар атомов углерода, расположенных через две связи Параметры Ла, Aft, Ау и поправка на разветвление Артв оцениваются методом наименьших квадратов по известным значениям свойства тренировочного набора соединений Результаты расчетов, приведенные в таблице 1, показывают, что введение корреляционных поправок существенно улучшило согласие расчетных и экспериментальных значений

Таблица 1

Свободная энергия переноса из газовой фазы в водную для некоторых линейных и разветвленных молекул

Молекула AG0, кДж/моль

Экспа) р 6) "rism Соотн (7)в)

СН4 8 40 5 02 8 40

С2н6 7 69 6 65 8 19

С3н8 8 19 7 94 7 98

С4Н10 8 73 9 82 8 32

С5Н12 9 78 12 67 9 66

СбН]4 10 45 15 05 10 49

С7Н16 10 99 17 18 11 12

С(СНз)4 10 49 -23 12 10 62

(СНз)зС-С2Н5 10 87 -25 87 10 74

Примечания а) экспериментальные значения взяты из работы Cabam S, Gianni Р,

МоЬса V , Ьероп Ь !П БоЫ Окот 1981 V 10 N 8 Р 56 3,

б) значение параметра мостикового функционала было 5=2,

в) значение параметров соотношения (7) были Ла=Ъ 39±0 20, Лр=-5 25+0 42,, Аг= 0 31±0 26 , 4,азв=35 95

Таким образом, на фоне более сложных подходов корреляционное моделирование выглядит простым и эффективным методом получения количественных оценок характеристик гидрофобных взаимодействий

4.2. Оценки физико-химических свойств органических соединений

Фрагментные корреляционные модети, принимающие во внимание особенности межмолекулярных взаимодействий, но не требующие аналитических выражений для описания этих взаимодействий по типу потенциальных функций, дают достаточно точные оценки многих физико-химических свойств соединений разных классов В рамках такого подхода соотношение (4) было модифицировано для алканов путем введения для парных взаимодействий фрагментов экспоненциальной зависимости от расстояния [5,10]

Р = па + Сп-1)Р+ппг+2>> ехрО-*,^ -3)) (8)

' 1

Здесь а, /3, у, к} к2 явтяются параметрами корреляционного уравнения, которые определяются по известным экспериментальными данным гч - топологическое расстояние между фрагментами, равное числу ребер на кратчайшем пути от вершины I до вершины ] на молекулярном графе В соотношении (8) суммирование проводится по всем возможным парам фрагментов Корреляционное соотношение (8) было применено для расчета ряда физико-химических свойств насыщенных углеводородов (нормальных и изомеров) с числом атомов С до 10 [5, 10,11] В таблице 2 приводятся свойства и критерии точности полученных корреляционных оценок

Таблица 2

Точность корреляционных оценок ряда свойств насыщенных углеводородов,

полученных по соотношению (8) [11]

Свойство г в

Энтальпия образования, ДН, кДж/моль 0 9945 79

Свободная энергия образования, АО, кДж/моль 0 9746 76

Энтропия образования, в, Дж/ (К моль) 0 9995 5 6

Теплота испарения, ДНИШ, кДж/моль 0 9914 0 17

Теплоемкость,ср, Дж/ (К моль) 0 9978 60

Температура кипения, Ткип, К 0 9969 39

Критическая температура Тс, К 0 9103 48 2

Критический объём Ус, м3 10"6 0 9974 13 1

Критическое давлениеРс, Па 106 0 9195 32 4

Поляризуемость, а, А3 0 9973 0 44

Диамагнитная восприимчивость, -% 106 0 9997 1 12

При анализе полученных значений свойств обращают на себя внимание большие абсолютные величины отклонения расчета от эксперимента для соединений, в которых много разветвлений в молекулярном скелете Уточнение оценок свойств можно получить, если для учета разветвлений в молекулярной структуре включить в корреляционное соотношение многофрагментные вклады [15]

Например, наличию в структуре молекул одиночного разветвления (одна боковая алкильная группа) можно сопоставить четырехфрагментный вклад (схема 2, А) Такой вклад был обозначен специальным параметром 8 2

Аналогично, при присоединении двух алкильных групп к одному атому углерода в корреляционное соотношение добавляется параметр на двойное разветвление 8 х, соответствующий пятифрагментному вкладу (схема 2, Б) Наличие боковых радикалов у соседних атомов углерода существенно затрудняет внутреннее вращение Это заметно сказывается на динамическом поведении и, следовательно, свойствах соединений, что хорошо заметно в экспериментальных значениях Для того, чтобы корреляционное соотношение отслеживало эти особенности, в него включается эффективный вклад "взаимодействия разветвлений", 8*, который также можно рассматривать как многофрагментный вклад Модифицированное выражение для расчета характеристик насыщенных углеводородов имеет вид

Р = па + п120+ п,3у+ ехр(~к2(ги -3)) + п^З1 + пх 8х + п*8* (9) ' ]

Здесь п1 - число одиночных разветвлений (четырехфрагментных вкладов), п^-число двойных разветвлений (пятифрагментных вкладов), и* — число пар разветвлений любого типа, разделенных одной связью Использование соотношения (9) позволило уменьшить стандартное отклонение до 3 9 К при расчете температуры кипения насыщенных углеводородов нормального и разветвленного строения, содержащих до 10 атомов углерода

Свойства соединений, имеющих циклическое строение, заметно отличаются от свойств ациклических углеводородов Например, температура кипения у них выше, чем у ациклических соединений с тем же числом С атомов Естественно предположить, что атомы С, образующие цикл, несколько отличаются от атомов С ациклических углеводородов, и им соответствуют фрагменты другого типа, которые дают другие вклады а* р*, у*, 8*14 8*ц, Было принято, что а*=а + Ла, р*= р +

Б

4Д У* - 7+ Ду и все поправки А были объединены в дополнительный параметр "на образование цикла" е Сложнее было учесть изменения во вкладах 8, те вкладах взаимодействий фрагментов, разделенных тремя и более связями, которые, как указывалось выше, зависят от кенформации Для определения параметров, детально описывающих распределение по конформациям в циклических соединениях, не хватает экспериментальных данных, и это является принципиальным ограничением рассматриваемого фрагментного подхода Для вычисления оценок свойств соединений с циклическими группами использовали модифицированное выражение для свойства

Р = па-1- (п-1)Р + пцу+ ^ехрС-М^-ЗЙ+п^ + пх 6х + 11

+ п*3* + втцюс, (10)

Здесь тща - число атомов в циклической группе, е - дополнительный параметр корреляционного соотношения определяемый по экспериментальным данным для тренировочного набора соединений В таблице 3 приведены оценки температуры кипения некоторых циклических углеводородов, полученные по соотношению (10)

Аналогичным образом соотношение (4) модифицировалось для расчета физико-химических свойств ненасыщенных углеводородов, алифатических спиртов, аминов и галогенпроизводных с одной или несколькими функциональными группами, ароматических соединений, перфторуглеродов [10,15,19]

Предложенное разбиение на фрагменты, соответствующие тяжелым атомам с присоединенными атомами водорода, и используемая экспоненциальная зависимость взаимовлияния фрагментов от расстояния не явтяются, естественно, единственно возможными Например, в качестве фрагмента можно использовать химическую связь Тогда молекулы можно представить в виде линеиного графа, вершины которого соответствуют химическим связям, а ребра графа соединяют связи, имеющие один общий атом На таком графе определяются соответствующие топологические расстояния между фрагментами, которые включаются в матрицу расстояний Мы предложили использовать среднегеометрическое значение набора расстояний от одного данного фрагмента до всех остальных как меру "рассредоточенности" фрагментов вокруг одного данного фрагмента, что должно косвенно отражать взаимовлияние фрагментов в молекуле [23] Фактически такой

дескриптор молекулярной структуры является разновидностью топологических индексов

Таблица 3

Температура кипения некоторых углеводородов

Молекулаа) Ткип > К Молекулаа) Тккп , К

эксп соотн (9)в) эксп б> соотн (10)г)

п5 309 2 308 5 с5 322 4 3192

п5-2т 333 5 336 1 с5-т 344 9 343 0

пб 341 9 341 7 сб 353 9 354 4

пб-2т 363 2 365 7 сб-т 374 0 375 0

пб-22т2 380 0 391 0 с6-1,1т2 392 6 397 0

пб-23т2 388 8 393 3 с6-1,2т2 399 6 401 1

пб-24т2 382 6 384 4 сб-1,4т2 394 7 392 7

пб-Зе 391 7 388 8 сб-е 404 9 402 2

п7 371 7 371 9 с7 391 6 386 5

п7-2т 390 8 392 8 с7-т 407 1 404 2

п8 398 9 399 4 с8 422 1 4156

г=09928 б=3 94 г =0 9946 Б =2 93

Примечания а) здесь и далее формула углеводородов приводится в упрощенном

виде т означает нормальный углеводород с г атомами С, возможные боковые радикалы обозначаются буквами т -метил, е- этил, р -пропил, цифра перед радикалами указывает номер атома С основной цепочки, к которому присоединен заместитель, сг - означает циклическую группу с г атомами С,

б) экспериментальные значения взяты из книга Д , Вэстрам Э , Зинке Г Химическая термодинамика органических соединений М , «Мир», 1971 809 с,

в) значения параметров были се= 111 7±1 8, /?=-43 09+2 17,

у=-\7 56+0 41, к! =-5 46±0 04, к2=0 12±0 48, д1 =18 76 ±1 05, <? = 66 75 ±1 49,5* = 9 59+1 94,

г) дтя параметров а, ¡3, у, к1 к2, д1, 8, ¿>* использованы значения, определенные для набора ациклических соединений, «=1 94+0 79

Типы фрагментов определялись природой атомов, образующих химическую связь, и числом присоединенных атомов водорода (те участием связи в разветвлении) Для насыщенных углеводородов было определено 10 типов фрагментов СН3 - СН3, СН3 -СН2, СН3 - СН, СН3 - С, СН2 - СН2, СН2 - СН, СН2 - С, СН - СН, СН - С, С- С Корреляционное соотношение для расчета свойства было записано в виде

Р = £ к,п,+ А£ Ь; + Const (11)

ы j-i

Здесь /7,— число связей i -того типа в молекуле, к, - параметр, соответствующий вкладу в свойство связи типа i, А- параметр, один на все типы связей, Ьу - среднегеометрическое значение по набору топологических расстояний от связи номера j до всех остальных, вычисленное по формуле

П*,

V '=1

Л /(V-1)

(12)

Лу - означает топологическое расстояние от связи у до любой другой связи /, определяемое числом ребер на кратчайшем пути от вершины у до вершины I на линейном графе N - общее число связей в молекуле, П означает произведение В соотношении (И) первое суммирование проводилось по типам фрагментов, число слагаемых второй суммы равнялось общему числу фрагментов

Значения Ьу для некоторых углеводородов (таблица 4) показывают, что этот дескриптор чувствителен к удлинению молекулы и к числу и положению разветвлений молекулярного скелета, те обладает хорошей дискриминирующей способностью

В таком приближении были рассчитаны некоторые свойства насыщенных углеводородов [23, 24], а также температуры кипения алифатических спиртов, диолов, аминов, диаминов и аминоспиртов с концевой ЫН2-группой [23] В набор углеводородов, кроме ациклических изомеров, включающих от 2 до 10 атомов С, входили также некоторые циклические и полициклические насыщенные углеводороды (полный список приведен в работе [23]) Метан исключен из набора рассматриваемых соединений, т к его рассмотрение в данном приближении невозможно

Таблица 4

Примеры значений дескриптора взаимовлияния связей

Молекула Структура Zbj соотн (12) Молекула Структура 16, соотн (12)

п2 - 0 п9-2т 23 568

пЗ /Ч 2 п9-3т х^^ч^ч^ч 22 846

п4 /V 3 828 п9-4т ✓-чА/ч^ч 22 495

п5 /Ч/Ч 6 154 п8-27тт Лч/Ч/Ч/ 22 106

пб /ч/v 8 971 п8-44тт ✓'\Х/Ч/ 19 61

п7 /4/V4 12 274 п7-255ттт 18 712

п8 /ч/ч/ч/ 16 06 п7-334ттт 17 576

п9 /Ч/Ч/Ч^ч 20 323 пб-2255т4 17 599

п10 /WW 25 064 пб-2334т4 -V- 16 073

п4-2т А/ 5 107 n5-22334ms >х< 14 607

пЗ-22тт X 4 n5-22344ms 15 049

В таблице 5 приведены статистические параметры для температуры кипения, теплоты испарения, давления паров насыщенных углеводородов

Таблица 5

Статистика оценок термодинамических свойств для углеводородов [24]

Свойство Число молекул г s

Температура кипения Ткип > К 198 0 9966 3 4

Теплота испарения ЛНИСП, ккал/моль 66 0 9939 0 942

Давление насыщенных паров log Pv 73 0 9961 0 0728

Коэффициент корреляции рассчитанных и экспериментальных значений температуры кипения для спиртов и аминов был г= 0 9971, среднеквадратичное отклонение з=3 9 К (число соединений N =139) [23]

Для сравнения с литературными данными в таблице 6 приведены результаты расчетов температуры кипения в разных моделях для совпадающей выборки соединений

Таблица 6

Оценки температуры кипения, полученные в работах разных авторов для совпадающей выборки соединений

Ссылка Классы соединений Число молекул Лит результаты Наш расчет

г s, К г s, К

Yuan Н, Cao Ch // J Chem Inf Comp Sci 2003 V 43 N2 P 501-512 Ациклические и циклические алканы 191 0 9913 7.6 0 9966 3.4

Needham D E , et al // J Am Chem Soc 1988, V 110,N 13 P 4186-4194 Ациклические алканы 74 0 9995 1.9 0 9982 29

Espinosa G , et al // J Chem Inf Comp Sci 2000 V 40 N 3 P 859-879 Ациклические алканы 135 0 9997 1.89 0 9970 3.4

Randic M, Pompe M // J Chem Inf Comp Sci 2001 V 41 N3 P 631-638 Спирты 45 0 9912 3.92 0 9964 2.57

Из таблицы 6 следует, что модели работ Needham DE et al и Espinosa G, et al, использующие только топологические индексы и рассматривающие только ациклические углеводороды, дают результаты, превосходящие те, что получены в нашем подходе Но если в набор рассматриваемых соединений включены я углеводороды с циклическими группами или спирты, то наша модель дает наилучшие по точности оценки температуры кипения

Таким образом, включение в корреляционное соотношение вместе с фрагментными вкладами также неаддитивного вклада в виде суммы средних геометрических значений набора расстояний позволило улучшить точность

получаемых оценок некоторых свойств насыщенных углеводородов разнообразного строения

4 3 Корреляционное соотношение структура-свойство для оцепок log Р органических соединений разных классов

Многие свойства молекул и их комплексов в водных растворах в существенной степени определяются их гидрофобностью В качестве количественной меры гидрофобности, как правило, используются данные о коэффициенте распределения молекул между органической и водной фазами (log Р) К настоящему моменту описано несколько вариантов методов расчета log Р в корреляционных моделях6, для расчета этой характеристики имеются интернет ресурсы (см например, http //en wikipedia org/wiki/Partitioncoeffïcient ) Однако остаются существенные ограничения в точности оценок, и в ряде сложных случаев это приводит к получению ошибочных результатов Применение разрабатываемого нами фрагментного подхода к расчету log Р насыщенных углеводородов потребовало модификации корреляционного соотношения [4-8, 12, 16-18] Расчет по соотношению (8) показал, что для нормальных алканов, содержащих 10 и более атомов С, вычисленные значения заметно отличаются от экспериментальных данных (Таблица 7)

Как говорилось выше, гидрофобные углеводороды в полярной фазе имеют более компактные, "свернутые" предпочтительные конформации Поэтому для повышения точности оценок в корреляционном соотношении необходимо учитывать особенное взаимодействие сближенных в пространстве, но удаленных по цепи фрагментов, вводя в корреляционное соотношение дополнительные поправки Будем считать, что значение логарифма коэффициента распределения для молекул в вытянутой конформации достаточно точно рассчитывается при помощи корреляционного соотношения (8) Эффект сворачивания в более компактную конформацию оценивали по изменению доступной поверхности молекулы При этом log Р молекулы в конформации а, отличной от вытянутой, будет определялось выражением (13)

6 см, например, книги Hansch С , Leo A "Substituent constants for Correlation Analysis m Chemistry and Biology" New York John Wiley and sons 1979, p 339 и RekkerRF "The Hydrophobic Fragmentai Constants " Amsterdam Elsevier 1977 p 378

25

Таблица 7

Значения log Р некоторых молекул насыщенных углеводородов [12]

Молекула logP

эксп а) расч б>

СН4 1 09 1 10

С2н6 1 81 1 79

СзН8 2 36 2 35

С4Н10 2 89 2 87

СН(СНз)з 2 76 2 79

С5Н12 3 39 3 37

(СНЗ)2СН-С2Н5 - 3.25

С(СН3)4 3 И 3 09

СбН]4 3 90 3 86

(СН3)2СН-С3Н7 - 3 77

(СНз)зС-С2Н5 3 82 3 51

(СНз)2СН-СН(СНз)-СНз 3 42 3 59

С7Н16 4 66 4 36

С8Н18 5 18 4 85

(СН3)зС-С(СНз)з - 3 96

С9Н20 - 5 35

(СНз)зС-СН2-С(СНз)з - 4 55

С,сН22 5 01 5 84

СпН24 - 6 34

С,2Н26 6 10 6 83

Ci3H28 - 7 33

С14Н30 7 20 7 82

г = 0 9853 s = 0 36

Примечания а) экспериментальные значения log Р взяты из книги Hansch С , Leo А, Hoekman D Exploring QSAR Washington, DC Amer Chem Soc, 1995,

б) для расчета было использовано соотношение (8) при значениях параметров а= 1 10±0 068, /?= - 0 41±0 11, у= - 0 128 ±0 028, к,= - 0 048±0 024 , к2 = - 1 26±2 3

log Pa = log Ртраис +k(Sa -S mpatc) Pтранс к AS и транс (13)

Для определения коэффициента к рассмотрим алкилпроизводные бензола (таблица 8) Алкильные группы, расположенные в орто-положениях, "сближены" Группы, находящиеся в мета - и пара - положениях, будем считать удаленными и невзаимодействующими Тогда, сравнивая экспериментальные значения соответствующих соединений, можно определить значение коэффициента к

Таблица 8

Значения log Р, доступные поверхности S и коэффициент к для метилэтильных и диэтильных производных бензола [16]

Молекула logP AlogP ,?Д2 к= AlogP/AS

1,4-метил

этилбензол 3 90 336 7

1,2-метилэтил

бензол 3 53 -0 37 326 7 -10 0 037

1,4-диэтил

бензол 4 45 362 4

1,2-диэтил

бензол 3 72 -0 73 347 6 -15 3 0 048

Рассмотрение другого примера дает несколько отличное значение коэффициента к При переходе от дифеншшетана к дибензилу и 1,3 -дифенилпропану последовательно увеличивается число групп СН2 в молекуле, и в предположении о невзаимодействующих фенильных кольцах мы бы должны ожидать увеличения значения log Р в этом ряду соединений Однако соответствующие экспериментальные значения log Р равны 4 14, 4 79 и 3 43 и log Р 1,3-дифенилпропана оказывается наименьшим Так проявляется взаимодействие фенильных групп, оказавшихся сближенными в компактной конформации молекулы Если в предпочтительной структуре дибензила (схема 3, А) фенильные кольца располагаются далеко друг от друга, и их можно считать невзаимодействующими, то в молекуле 1,3 -дифенилпропана в предпочтительной структуре фенильные кольца

оказываются сближенными (схема 3, Б) Доступная поверхность этой конформации по сравнению с полностью вытянутой уменьшается на 23 8 А2

А б Схема 3

Рассчитанное в предположении об отсутствии взаимодействия значение log Р равно 5 05 Из этих данных находим, что Alog Рф ¿г 3 45 - 5 05= -1 62, и значение к оказывается равным 1 62/23 8 = 0 068 Аналогичное рассмотрение диэтилового и дипропилового эфиров, где концевые группы оказываются сближенными из-за отталкивания неподеленных электронных пар эфирных атомов О, дает значение к =0 076 Возьмем к=0 06 (приблизительно среднее значение из полученных для разных примеров) и оценим поправки для нормальных алканов Сп и С^ Для того, чтобы вычислить изменение доступной поверхности при сворачивании этих углеводородов, мы провели конформационный и молекулярно-динамический расчеты молекул С12 и С14 с использованием программ, разработанных Н К Балабаевым в Институте математических проблем биологии7 Было установлено, что наиболее заселенными оказываются состояния, в которых один из участков цепи находится в гош-конфигурации (1 гош), два или три гош-участка, разделенные несколькими участками в транс-конфигурации (2 гош и 3 гош, соответственно) Другие состояния заметно отличаются по заселенности, и поэтому для приближенных оценок изменения доступных поверхностей Чшлекул С)2 и С)4 мы приняли, что они в равновесной смеси существуют в виде трех конформеров (1 гош, 2 гош и 3 гош) с одинаковыми весами При этом среднее значение изменения доступной поверхности при сворачивании молекулы углеводорода AS получается равным

49= -(5+9+16 2)/3 А2 = -10 А2 Такому уменьшению AS отвечает уменьшение величины log Р не менее, чем на 0 6 Ситуация в случае С14 будет аналогичной, и поэтому значение Alog Р для него будет

7 Балабаев Н К Методика моделирования динамики полимеров В кн Метод молекулярной динамики в физической химии М Наука, 1996 С 258-279

28

таким же, как и для Сп Это приводит к значениям log Р молекул С12 и С14 , равным соответственно 6 23 и 7 22, что лучше передает экспериментальные значения 6 10 и 7 20, чем оценки, полученные по соотношению (8) (см таблицу 7) Рассмотренные примеры демонстрируют направления модификации корреляционно1 о соотношения структура-свойство для оценок свойств гибких молекул Однако следует заметить, что точные оценки log Р гибких молекул не обходятся без того, чтобы хотя бы приблизительно оценить засетенности различных конформационных состояний При этом такие корреляционные модели теряют свою простоту и усложняются молекулярно-динамическими расчетами

В рамках нашего подхода оценки log Р других классов соединений можно получить при помощи модификаций основного корреляционного соотношения (8) аналогично тому, как это было сделано для оценок температуры кипения и других физико-химических свойств Если в соединение входит одна функциональная группа X и углеводородный радикал R, то приближенно можно считать, что ах-а + А а, (3 \ = J3 + AJ3, ух = у f Ду , а для вкладов более далеких взаимодействий считать ¿t¡4 =S¡4 Sx¡5 =S¡s , , где a, p, y S¡4 параметры, значения которых определены для насыщенных углеводородов Тогда соотношение (8) можно переписать в виде

Рюс=Рсп + Ах (I4)

Здесь РСп - рассчитанное значение свойства "изоморфного" алкана (содержащего одинаковое число атомов С и имеющего подобную топологическую структуру), Ах - поправка В таком приближении были рассчитаны значения log Р для многих классов органических соединений с удовлетворительной точностью (N= 86, г= 0 9958, s= 0 15) В таблице 9 приведены значения параметра 4а

Если в структуру молекулы входит несколько полярных групп X, Y, то необходимо учитывать специальные вклады, отвечающие взаимодействию этих групп Рхг Из анализа имеющихся экспериментальных значений для диолов и сложных эфиров и с учетом того, что на "больших" расстояниях (когда между атомами О может расположиться молекула воды, и их можно считать невзаимодействующими) Аоо должна быть равной 0, было предложено следующее выражение для вычисления поправки

Аоо *кi erp(-k2 R0o) (15)

Здесь kj и к2- параметры, опредетяемые из данных для тренировочных примеров, Rqo - расстояние между атомами О Если в тренировочный набор соединений одновременно включены спирты и диолы, то значения параметров получаются следующие kf=8 96±0 80, к2=0 84±0 04 С использованием такого подхода рассчитаны значения log Р с удовлетворительной точностью для ряда кислородсодержащих соединений разных классов

Таблица 9

Значения параметра Ах для различных классов органических соединений [12]

Молекула -Ах Молекула -Ах

этилен 0 49±0 07 альдегиды 2 45±0 11

ацетилен 1 35+0 09 кетоны 3 03а)

бензол 1 68±0 16 карб кислоты 2 84±0 08

спирты 2 44+0 13 амиды 4 09±0 14

простые эфиры 2 30±0 14 сл эфиры 3 00±0 05

амины 2 42±0 07 лактоны 3 90±0 14

вторич амины 2 73+0 07 тиолы 1 10+0 02

Примечание а) имеются экспериментальные значения только для одного

соединения такого типа Оценки log Р для пептидов.

Расчет оценок log Р для пептидов затруднен тем, что в небольшом наборе молекул присутствуют несколько типов полярных групп Для преодоления этой трудности можно выбрать молекулу амида N-ацетилглицина как один большой фрагмент и использовать экспериментальное значение его log Р как вклад а* в корреляционное соотношение [20, 21] Присоединение боковых радикалов отражается в корреляционном соотношении соответствующим количеством вкладов а, р, у, St4 6ц, (схема 4), поправок на появление полярных групп X - Ах и поправок на их взаимодействие - Ах у Например, соответствующие вклады для амида N-ацетилаланина (aNaA) показаны на схеме 4 Согласно схеме 4, корреляционное соотношение для оценок log Р амида N-ацетилаланина можно записать в виде

logPaNaA = logPaNaa+ « + Р+ 2у+ 3S,4 +26ц (16)

В приближенном рассмотрении, хотя вклады у сх, 8 сх ,4 8сх ¡¡, могут

отличаться по величине от Схема4 соответствующих вкладов

Л

' 615 /'5i4 \ в молекулах

g / / ___ ^

15' / углеводородов, этим

/ О / / 4 4

' м' '' Р / 14 1 различием пренебрегали

' III ' ' 1 \ '

i ^ ' С ) ¡La В таблице 10 в третьем

1 / \ / \ ¡ JfNHl

' / / 'i столбце приведены

СНз NH ,. ' в

II / 0|4 рассчитанные при таком

подходе значения /og Р

амидов N-ацетиламинокислот без учета взаимодействия полярных групп боковых радикалов с амидной или пептидной группой остова (расчет I) По разности между экспериментальными данными и расчетом в предположении невзаимодействующих полярных групп выбираются поправки на взаимодействие полярных групп боковых радикалов и амидной и пептидной групп остова для -CONH2 2 64 ( среднее значение для Asn, Gin), -ОН, -SH 1 85 (среднее значение для Ser, Thr, Cys), -S- 0 28 (Met) -Ph 1 86 (Туг) Оценки log P для амидов N-ацетиламинокислот, полученные с использованием поправок на взаимодействие полярных групп, показаны в последнем столбце таблицы 10 (расчет II) Можно отметить, что совпадение рассчитанных и измеренных экспериментально значений log Р очень хорошее Таким образом, в том случае, когда имеются данные для ограниченного числа молекул, позволяющие установить значения необходимых параметров, отвечающих взаимодействию полярных групп, в приближенных подходах можно делать довольно точные оценки [20]

В рамках такого подхода были сделаны оценки log Р ди-, три-, тетра- и пентапептидов, а также амидов ди- и три- N-ацетилпептидов, в боковые радикалы которых не входят ионизированные группы [21] В таких коротких пептидах равновесное состояние определяется набором конформеров, близких к структурам С5 и С7 Предполагая, что соотношение конформеров для разных пептидов одинаково, получаем, что поправки на взаимодействие пептидной и амидной групп будут также одинаковыми В таком приближении молекулы пептидов можно рассматривать как обычные линейные молекулы, в которых к

углеродам Са присоединены различные боковые радикалы Взаимодействиями боковых радикалов можно пренебречь, т к в коротких пептидах в любой конформации не происходит их сближения

Таблица 10

Значения log Р амидов N - ацетиламинокислот

Аминокислота logP

Эксп a) Расчет I4 ¿1=эксп -расч I Расчет IIв)

Gly -1 83+0 03 -1 83 0 00 -1 83

Ala -1 52±0 02 -1 58 0 06 -1 58

Val -0 61±0 02 -0 87 0 26 -0 87

Leu -0 13+0 02 -0 33 0 20 -0 33

lie -0 03±0 02 -0 44 041 -0 44

Phe -0 04+0 03 0 12 -0 16 0 12

Туг -0 87+0 09 -2 73 1 86 -0 87

Ser -1 87±0 07 -3 66 1 79 -1 81

Thr -1 57x0 07 -3 37 1 80 -1 52

Asn -2 41+0 07 -5 11 2 70 -2 47

Gin -2 05±0 07 -4 63 2 58 -1 99

Cys -0 29±0 10 -2 26 1 97 -0 41

Met -1 00±0 05 -1 28 r=0 8420 s=l 47 0 28 -1 00 r=0 9840 s=0 16

Примечания, а) экспериментальные значения log Р взяты из работы Fauchere, J -L , Pliska, V //Eur J Med Chem 1983 V 18 P 369-375,

б) расчет в предположении невзаимодействующих полярных групп, в соотношении (16) использованы параметры a,ß,y,8i4, , полученные для насыщенных углеводородов (приведены в примечании б, таблицы 7),

в) расчет с использованием поправок на взаимодействие полярных групп

Формально можно представить образование пептида так из амидов строится олигоглицин соответствующей длины, затем к нему присоединяются боковые радикалы Тогда выражение для свойства будет иметь следующий вид

log РамR.R, R =log Pm ЛаЧ0,С, С + T, ^ (17)

1 ¿ n 1 2 n j '

Здесь AR- поправка на введение /-того аминокисчотного остатка, которая вычисляется по экспериментальным значениям log Р соответствующих мономеров

ARr log Рам -A'azf R - log Рам Na„ С (18)

Значение log Р соответствующего олигоглидина определялось, как параметр корреляционного соотношения

Аналогично могут быть рассмотрены обычные пептиды Соответствующее выражение для определения свойства имеет вид

log Pr¡r2 g=log PG(J g+1LAR- (19)

Поправки Дй,на введение боковых радикалов определены по экспериментальным данным для свободных аминокислот В таблице 11 представлены данные расчетов в рамках такого приближения для олигопептидов длиной до 5-ти аминокислотных остатков

Таблица 11

Результаты расчета log Р пептидов

Число logP Число

боковых олигоглицина соединений г

радикалов

Амиды N- 2 -2 61+0 18 35 0 9745

ацетилпептидов соотн (19) 3 -3 17±0 29 25 0 9358

2 -4 25±0 26 31 0 9147

Олигопептиды 3 -4 98±0 26 38 0 9326

соотн (20) 4 -5 37±0 40 33 0 8975

5 -5 63±0 53 22 0 6381

Из таблицы 11 следует, что использование предлагаемого подхода позволяет получить удовлетворительные по точности оценки log Р ди-, три- и тетрапептидов, и довольно грубые оценки для пентапептидов Для дипептидов погрешности оказываются большими, чем для амидов N-ацетилпептидов Одной из причин этого является включение в рассмотрение пептидов с пролином в разных положениях Пептиды, содержащие пролин, могут иметь соотношение конформеров, отличное от прочих пептидов, и неучет этого обстоятельства делает оценки величин log Р приближенными При увеличении числа аминокислотных остатков до 4-х (и более) повышается вероятность образования спиральных структур, в которых возможны внутримолекулярные водородные связи между пептидными группами номер 1 и номер 4 Их неучет в данном варианте корреляционного соотношения также приводит к увеличению погрешности

Настоящий пример расчета log Р олигопептидов демонстрирует преодоление проблемы определения большого числа параметров путем выбора более крупных фрагментов и использование вкладов в корреляционное соотношение, рассчитанных при помощи экспериментальных значений свойства соответствующих соединений по соотношению (18) Чтобы не использовать в корреляционном соотношении экспериментальных значений log Р аминокислот или более мелких фрагментов, мы применили подход, в котором в качестве дескриптора молекулярной структуры используется объем молекулы [22] Термодинамическое рассмотрение факторов, влияющих на распределение молекул между фазами, выделяет молекулярный объем в качестве основной характеристики Кроме того, большой вклад в энергетику процесса вносит перестройка сетки водородных связей растворителя и возможность включения в нее молекул растворенного вещества Для отражения этого обстоятельства в корреляционное соотношение следует включить вклады, соответствующие числу групп, которые могут образовывать водородные связи Были рассмотрены амиды N-ацетилпептидов и олигопептиды с концевыми -NH2 и -СООН группами, свободно взаимодействующими с водным окружением (свободные пептиды) В пептидах рассмотренного набора присутствовали полярные фрагменты, соответствующие пептидным (амидным) группам, гидроксильным группам в боковых радикалах серина и треонина и атому азота в боковом радикале триптофана

Корреляционное соотношение для амидов N-ацетилпептидов имело следующий вид

log Р = к ¡Vol + k2Nao + k3NNar + k4N0H (20)

Для пептидов со свободными концевыми труппами корреляционное соотношение было записано в виде

log Р = k¡*Vol + kiNcNo+kfl^ + kjNoH+ks (21)

Здесь Vol - ван дер ваальсов объем молекулы, рассчитанный как сумма объемов атомов и групп атомов, из которых состоит молекула Nqno обозначало общее число пептидных групп в остове пептиднои молекулы и боковых радикалах, Nfiar -число триптофанов с атомом азота в ароматической группе, Noh ~ число боковых радикалов с гидроксильной группой, k¡ - поправка, учитывающая взаимодействие с водой концевых групп NH2 и СООН В рамках такого подхода удалось с хорошей точностью передать экспериментальные значения log Р moho-, ди-, три - и тетрапептидов тренировочного набора соединений Вычисления показали, что коэффициент вклада, соответствующего числу триптофановых боковых радикалов, получается малым и этот вклад был исключен из рассмотрения В таблице 12 приведены полученные значения коэффициентов корреляционных соотношений (20) и (21) и погрешность их определения, а также коэффициент корреляции и среднеквадратичные отклонения в тренировочных наборах соответствующих пептидов

Анализ наибольших отклонений вычисленных значений log Р от экспериментальных значений позволил заметить, что среди пептидов с такими отклонениями чаще всего встречаются пептиды, содержащие боковые радикалы с разветвлением уже на Ср атоме ( валин, изолейцин), а также фенилаланин Можно предположить, что в таких молекулах из-за тесного расположения атомов вычисление молекулярного объема простым суммированием групповых объемов дает большую ошибку и необходимо вычислять объем более точным способом Более низкий коэффициент корреляции для свободных пептидов по сравнению с амидами N-ацетилпеггтидов, по-видимому, может быть объяснен тем, что предположение о том, что в разных пептидах взаимодействие концевых групп с растворителем одинаково, является слишком грубым Требуется дальнейшее изучение того, как окружение, т е соседние боковые радикалы, влияет на это взаимодействие

Таблица 12

Значения параметров корреляционного соотношения и статистические характеристики расчетов Р для лвух типов пептидов

Параметр Для амидов N-ацетилпептидов Для свободных пептидов

к, 0 0204 ±0 0018 0 0157+0 0021

к2 -1 808+0 152 -1 217±0 245

к3 0 0

к4 -0 868+0 179 -0 599±0 159

к5 - -4 307+0 332

Na) 51 68

г 0 9528 0 9234

s 0 295 0 35

Примечание а) N - число молекул в тренировочном наборе

Из массива пептидов с экспериментально измеренными значениями logP произвольным образом были выбраны 15 амидов N-ацетилпептидов и 19 свободных пептидов, не использовавшиеся в качестве тренировочных при определении параметров корреляционного соотношения Для них были вычислены значения log Р по соотношениям (20) и (21) с заранее найденными значениями параметров Результаты расчетов приведены в таблице 13 Полученные оценки значений log Р по точности не хуже вычисленных для тренировочного набора

Таким образом, описанное корреляционное соотношение структура-свойство может быть использовано для оценок логарифма коэффициента распределения октанол-вода пептидов и пептидоподобных соединений

Таблица 13

"Предсказание" величины log Р для ряда пептидов

Амиды N-ацетилпептидов Свободные пептиды

Моле-кулаа) Эксп Расч соотн (20) Дв) Моле-кулаа> Эксп ^ Расч соотн (21) Дв)

TV -1 25 -1 26 0 01 FL -1 17 -1 25 0 08

TI -0 86 -0 92 0 06 FF -0 85 -0 93 0 08

NV -1 85 -2 05 0 20 LV -2 06 -1 84 -0 22

NI -1 43 -1 72 0 29 AI -2 60 -2 36 -0 24

NF -1 14 -1 29 0 15 LI -1 64 -1 58 -0 06

QV -1 85 -1 72 -0 13 W -2 82 -2 10 -0 72

QL -1 32 -1 38 0 06 WW -0 27 -0 11 -0 16

QF -1 14 -0 97 -0 17 WF -0 47 -0 52 0 05

MF 0 42 0 92 -0 50 WA -1 98 -1 62 -0 36

VQ -1 82 -1 72 -0 10 WL -0 73 -0 84 0 11

WAV 0 36 0 60 -0 24 FFF -0 02 0 04 -0 06

AMV -0 63 -0 33 -0 30 GFF -1 33 -1 33 0 00

IMF 1 28 111 0 17 FVG -2 33 -1 92 -0 41

LSF 0 23 -0 30 0 53 FVF -0 76 -0 55 -0 21

LTL 0 24 -0 39 0 63 FVA -2 19 -1 66 -0 53

r=0 9540 FGGF -1 5100 -1 7414 0 23

s =0 29 VAAF -1 9100 -1 8073 -0 10

AVLL -1 74 -1 35 -0 39

LLAF -1 00 -0 76 -0 24

г=0 9603

s=0 29

Примечания а) для обозначения молекул пептидов использован однобуквенный код аминокислотных остатков А — аланин, N-аспарагин, Q-глутамин, G -глицин, L- лейцин, М-метионин, F-фенилаланин, S-серин, Т-треонин, W-триптофан, V-валин,

б) экспериментальные значения log Р взяты из работы Тао Р , Wang R, Lai L //J Mol Modelling (1999) V 5 P 189-195

в) A= log P3KC„- log Ppac4

5 Оценки биологической активности

Корреляционное соотношение структура-активность, основывающееся на фрагментом представлении молекул, может быть использовано для оценок характеристик комплексообразования лиганд-рецептор, а также и в более сложных случаях, где в свойство включаются несколько стадий, например для описания

времени выведения перфторанов из организма Во всех случаях, считая, что любое свойство, так или иначе, зависит от межмолекулярных взаимодействий, можно построить приближенную корреляционную модель и получить соотношение для вычисления значений свойств

5.1. Модели взаимодействия рецептор - лиганд.

Комплексы с участием а- циклодекстрина

Примером "рецепторного" свойства, при рассмотрении которого важно учесть, наряду с основным взаимодействием двух молекул, и роль окружения, является процесс комплексообразования циклодекстринов с различными лигандами

(схема 5) Вся внутренняя полость циклодекстрина более гидрофобна, чем вода, поэтому в стабилизации таких комплексов, помимо ван-дер-ваальсовых и донорно-акцепторных взаимодействий, важную роль должны

Применение фрагментного подхода к комплексам производных бензола с а-циклодекстрином позволило получить простое корреляционное соотношение структура-свойство для расчета свободной энергии комплексообразования с хорошей точностью и прояснить роль различных взаимодействий между молекулами "гостя" и циклодекстрина [25] В набор рассматриваемых производных бензола были включены молекулы вида Х-РИ, ХгРН-\\ в которых заместитель У фиксирован, а X меняется, и симметричные молекулы Х,-Рк-Х, Заместители X, отличались по качественному составу атомов и топологии их расположения Из-за небольшого числа соединений в наборе и их разнообразия по составу пришлось применять разбиение на довольно крупные фрагменты Для характеристики межмолекулярных взаимодействий были использованы физико-химические свойства, т е полученное корреляционное соотношение является частично корреляционным соотношением свойство-свойство Дисперсионные взаимодействия характеризовали поляризуемостью ах молекулы "гостя", для отражения гидрофобных взаимодействий использовали коэффициент распределения октанол-вода 1о&Р молекулы "гостя", возможные водородные связи между молекулой "гостя" и полостью а-циклодекстрина описывали индикативным

38

играть гидрофобные взаимодействия

параметром пнш В таком приближении выражение для свободной энергии комплексообразования АС°гх может быть записано в следующем виде

Пнъпа + кзССх + к4^Р +/(пта, пт,) (22)

Экспериментальные значения АСг'Гх указывают на то, что АО0 возрастает с ростом общего числа тяжелых атомов пта или числа неводородных атомов в линейнои цепочке заместителя пяин, но медленнее, чем растут эти величины, и поэтому для / (Пта-, пяи») мы выбрали выражение

/("то пЯи„) = к}Пта + ~ + (23)

Параметры корреляционного соотношения к, (г=1, 2, ,7) определяли методом наименьших квадратов по известным экспериментальным значениям В набор рассматриваемых соединений было включено всего 35 молекул "гостей " Полученные оценки свободной энергии комплексообразования с помощью соотношений (22) и (23) хорошо согласуются с экспериментальными данными -стандартные отклонения для всех наборов разных типов молекул "гостей " не превышали 10% от соответствующего диапазона изменения ДС°гх , г>0 94 для всех наборов соединений

Корреляция структура-активность для ингибиторов нейраминидазы вируса гриппа.

В качестве одной из молекулярных мишеней при разработке новых лекарственных препаратов для профилактики и лечения инфекций, вызываемых вирусом гриппа, наиболее часто используют нейраминидазу Ингибирование энзиматической активности нейраминидазы блокирует репликацию вирусных частиц Возможности предлагаемого подхода были продемонстрированы в установлении

корреляции структура-ингибирующая активность [26] для производных циклогексена и циклопентана (схема 6) Эти соединения обладают наибольшей активностью среди различных классов ингибиторов нейраминидазы Для количественной характеристики

активности использовалась величина 1С50 - концентрация ингибитора, при которой

-х I* МНАс

X -Н, - С(=Ш)Ш2 к алкич, алкенил, циклоалкил

происходит ингибироваиие нейраминидазы на 50% Всего было рассмотрено 30 ингибиторов Для рассматриваемого набора соединений активность изменялась в диапазоне почти пяти порядков, поэтому значения этой величины были пересчитаны в логарифмические единицы

Для построения корреляционного соотношения молекулу соединения представили в виде системы фрагментов, связанных с тяжелыми атомами Рассмотрение было ограничено только парными взаимодействиями фрагментов и считалось, что вклад взаимодействия фрагментов определяется типом фрагментов (t,m, ) и расстоянием г между ними Для расчетов нами использованы две модели модель 1 - топологическая, в которой молекулы рассматриваются как графы и структура кодируется двумерными дескрипторами, модель 2 - геометрическая, учитывающая реальное расположение атомов в трехмерном пространстве В случае модели 1 расстояние г равно числу химических связей, разделяющих фрагменты по кратчайшему пути по молекулярному скелету Для модели 2 расстояние г измеряется непосредственно в единицах длины А, при этом парные вклады сгруппированы по расстояниям с шагом 1 А, т е, например, любая пара углеродных фрагментов, расположенных на расстоянии г от 3 5 А до45А друг от друга, дает вклад в активность РСс-4 Таким образом, соотношение (3) имело следующий вид

р » + SWW (24>

t t тт

Здесь фрагментные вклады Р„ P(!m).r являются параметрами корреляционного уравнения, которые определяются по экспериментально измеренным активностям Числа соответствующих вкладов п, и k(,m).r представляют собой количественные дескрипторы молекулярной структуры В зависимости от химической природы атомов и их способности вступать во взаимодействия определенного типа, было выбрано 6 типов фрагментов, соответствующих насыщенным и ненасыщенным атомам tum могут означать С, С*, N, N*, О или О* В топологической модели, согласно структурным формулам, топологическое расстояние изменялось в интервале 1< г <11, а в геометрической модели, после оптимизации всех структур методом молекулярной динамики в силовом поле ММ2, 1< г < 17 А Поскольку все вклады взаимодействия фрагментов включены в корреляционное соотношение в виде явных параметров, то их число значительно превышало число соединений в тренировочном наборе Был проведен отбор переменных для корреляционной модели с

использованием пошаговой регрессии по разработанному алгоритму, как описано в методической части В результате отсеивания в соотношении (24) были оставлены шесть дескрипторов молекулярной структуры в топологической модели и восемь молекулярных дескрипторов в геометрической модели Оценки активности ингибиторов нейраминидазы, полученные с помощью полученных корреляционных соотношений, хорошо согласуются с опубликованными данными (для топологической модели г=0 9753, 8=0 75, для геометрической модечи г=0 9737, э=0 75) Проверка методом скользящего исключения по одному подтвердила высокое качество выбранных моделей для топологической модели коэффициент корреляции контроля равен 0 9526 и среднеквадратичное отклонение контроля составляет 0 89 логарифмических единиц, а для геометрической модели соответствующие значения 0 9440 и 0 92 Таким образом, геометрическая модель не выявила заметного преимущества над топологической по точности получаемых оценок, за исключением случая стереоизомеров, для изучения которых топологическая модель не пригодна в принципе Анализ дескрипторов, оставшихся в корреляционных соотношениях, знака их коэффициента, частоты встречаемости в соединениях тренировочного набора позволил сделать полезные набтюдения относительно втияния элементов структуры на ингибирующую активность Например, наибольший по абсолютной величине, но отрицательный вклад в корреляционное соотношение топологической модели дает взаимодействие фрагментов, связанных с атомами N и С, раздеченных шестью связями, Р^с-б- -2 65+0 78 На рис 1 показаны пары фрагментов N и С, дающие этот вклад

Можно видеть, что дескриптор кЖ-в зависит от разветвления у первого

угтеродного атома алкильного радикала в 3-алкоксизаместителе При прочих равных условиях наибольшее число таких вкладов

имеют соединения с 1

этилалкильным радикалом, они и

Рис 1 Струк1ура4-(ацетиламино)-5-амино-3 - (1 -этилокгалокси)- 1 -циклогексен-1 -карбоновой кислоты Указаны пары фрагментов, дающие вклад Рпс-б

характеризуются

активностью

большей Таким образом,

можно предположить, что разветвление у С] -атома благоприятно для увеличения активности соединения

5 2 Корреляционное соотношение для оценок лекарственного действия Расчет длительности угнетающего действия барбитуратов.

Использование фрагментного представления для молекул алкильных и алкенильных производных барбитуровой кислоты (схема 1) позволяет построить наглядное корреляционное соотношение структура - биоактивность [27] В качестве меры активности барбитуратов использовалась длительность их угнетающего действия (ДЦ) В рассматриваемый набор соединений входили 107 производных, ДЦ которых изменялась в диапазоне от 0 до 7 логарифмических единиц К сожалению, экспериментальные данные собраны из различных источников, условия определения ДД были неодинаковыми Тем не менее, считая, что все процессы, определяющие лекарственное действие соединения, связаны с межмолекулярными взаимодействиями и в силу этого зависят от структуры соединения, мы попытались построить общее корреляционное соотношение структура-длительность действия для всего массива экспериментальных данных

Барбитуровую кислоту без заместителей Я и ^(пиримидинтрионовое кольцо) считали одним большим фрагментом А В боковых радикалах фрагменты соответствовали насыщенному атому углерода С, ненасыщенному атому углерода С* и концевому атому углерода Т (в СНз-группах) Отбор дескрипторов для корреляционного соотношения (24) проводили методом ПЛС (проекции на латентные структуры) и методом пошаговой регрессии по предложенному нами алгоритму, как описано в методической части В первом подходе матрица дескрипторов линейным преобразованием была превращена в ортогональную при учете требования минимальности остатков, и на полученных ортогональных компонентах построено корреляционное соотношение с 7 компонентами Оценки ДД, полученные с помощью такого соотношения, имеют 5=0 65 и г=0 8816 При проверке уравнения методом скользящего исключения по одному, были получены коэффициент корреляции контроля 0 7163 и среднеквадратичное отклонение контроля 0 99 логарифмических единиц Таким образом, используя полученное соотношение, можно рассчитывать Д Д

42

производных барбитуровой кислоты с удовтетворительной точностью Однако для того, чтобы уловить тенденцию изменения свойства и ответить на вопрос, как нужно изменить структуру, чтобы свойство изменялось в нужном направлении, необходимо выяснить роль определенных элементов структуры Для этого полученное корреляционное уравнение следует вернуть от ортогональных компонент к структурным дескрипторам, учитывая весовые коэффициенты При этом в уравнение будет вновь входить весь набор дескрипторов и их взаимодействий Коэффициенты оказываются довольно близкими по абсолютному значению, что не позволяет выделить небольшое число наиболее важных вкладов Таким образом, метод ПЛС, будучи весьма полезным для расчетов оценок активности, не позволяет провести физическую интерпретацию корреляционного уравнения и предложить содержательную модель корреляции структура-активность Во втором случае, при использовании процедуры пошаговой регрессии, одна из лучших корреляционных моделей давала оценки ДД с г=0 8846 и 5=0 65 при сохранении 15 параметров корреляционного соотношения Знаки коэффициентов в соотношении позволяют думать, что чем больше двойных связей в заместителях и чем больше коротких разветвлений у предпоследнего С-атома, тем скорее прекращается действие соединения Кроме того, расположение двойной связи через один атом от фрагмента А более предпочтитечьно для увеличения ДД, чем непосредственное соседство с этим фрагментом при прочих равных условиях В таблице 14 приведены некоторые соединения из рассматриваемого набора барбитуратов, сгруппированные так, чтобы подчеркнуть следующие особенности изменения активности барбитуратов с изменением молекулярной структуры 1) увеличение длины нормального заместителя от С2 до С6 уменьшает ДД. а от Сб до С? - увеличивает ДД, 2) увеличение заместителя при наличии ненасыщенной связи, может оставлять ДД без изменения, 3) появление разветвления у первого или второго атома С может и уменьшать ДД, и увеличивать

Из данных таблицы 14 следует, что рассчитанные значения хорошо отслеживают эти особенности и дают правильное соотношение величин, кроме двух случаев, выделенных тонированием

Таблица 14

Некоторые особенности в изменении ДЦ барбитуратов в _зависимости от изменения структуры_

R Ri 1п(ДД)

Эксп а> Расчет

СН3СН2 СН3СН2 7 24 7 36

СН3(СН2)2 7 04 6 11

СН3(СН2)3 6 11 5 17

СН3(СН2)4 5 39 4 79

СН3(СН2)5 3 81 3 86

СН3(СН2)6 4 79 4 50

СН3СН2 СН3СН(СН3) 7 33 6 54

СН3СН2Ш(СН3) 6 4Ö 5 97

СН3(СН2)3СН(СН3) 4 50 4 65

СН3(СН2)5СН(СН3) 5.01 4 36

Н2С=СН СН3СН2 5 66 5 65

СН3(СН2)3 5 66 5 12

СН3СН2 СН3(СН2)2 7 04 6 11

СН3СН(СН3) 7 33 6 54

СН3СН2 СН3(СН2)3 6 11 5 17

СН3СН2СН(СН3) 6 40 5 97

: СН3СН2 СН3(СН2)4 ,5 39 4 79

СН,(СН2):СН(СН3)- 5 19 ' 5 02 '

СН3СН2 СН3(СН2)4 5 39 4 79

СН3СН2СН(СН3)СН2 5 25 5 32

CHjCH2 СН3(СН2)4 5 39 4 79

СН3СН2СН(СН3СН2) 5 70 5 50

СН3СН2 СН3(СН2)5 3 81 3 86

СН3(СН2)2СН(СН3)СН2 5 35 4 95

Примечание а) экспериментальные значения взяты из книги Стьюпер Э , Брюгер У , Джуре П Машинный анализ связи химической структуры и биологической активности М Мир, 1982 С 165

Итак, с использованием фрагментных дескрипторов молекулярной структуры получена корреляционная модель структура-длительность действия производных барбитуровой кислоты, дающая оценки длительности действия барбитуратов с удовлетворительной точностью, несмотря на разнородность экспериментальных данных

Оценки периода полувыведения перфторуглеродов.

Перфторуглероды широко используются в биологии и медицине в составе газопереносящих сред К настоящему времени проведены экспериментальные исследования накопления и выведения некоторых перфторуглеродных эмульсий из организма Подобные данные могут быть использованы для построения корреляционного соотношения структура-свойство, в котором период полувыведения определялся бы структурой молекул перфторуглеродов [14] Эмульсии кровезаменителей в простом приближении могут рассматриваться как "капли" перфторуглеродов, на поверхности которых имеется оболочка из молекул эмульгатора и процесс их выведения может быть представлен как состоящий из двух стадий 1) разрушение оболочки и образование "капли" чистого перфторуглерода, 2) выведение молекул перфторуглерода из организма Имея очень ограниченные представления о процессе разрушения, тем не менее его можно учесть приближенно, введя в корреляционное соотношение специальный вклад К, отвечающий разрушению оболочки Его предполагали одинаковым для всех перфторуглеродов Молекулу представляли в виде системы фрагментов, связанных с атомами углерода, те считая атомы фтора "стертыми"Как и для углеводородов считали, что все центры С, связи СС и углы между связями одинаковы и тогда для корреляционной модели можно применять соотношение (4) Для аминопроизводных перфторуглеродов вводились соответствующие поправки, как это было сделано при расчете физико-химических свойств Поскольку перфторорганические соединения, используемые в качестве кровезаменителей, имеют в своем составе один третичный атом Ы, то в выражении (4) всегда будет входить один вклад Аа=ас - а« и три вклада Ар =Рсс- - Рек Эти вклады естественно включить в константу АК, описывающую отличие процессов разрушения эмульсии перфтораминов и перфторуглеродной эмульсии Корреляционное соотношение для перфтораминов, таким образом,

включало два новых, по сравнению с перфторуглеродами, параметра Ау = /се - Уа и АК Для периода полувыведения перфторсоединений, в которых число атомов С и N суммарно равно п, соотношение (4) будет иметь следующий вид

log ti/з = па +(п-1)Р+п,3 у+пц'Ау+п,4 614 + п1} SI5 + K + АКе (25)

Здесь были приняты дополнительные упрощения взаимодействия любых фрагментов, разделенных более чем 5, связями, считали пренебрежительно малыми, взаимодействия фрагментов, разделенных 4 и 5 связями, считали одинаковыми для фрагментов С и N Значение пц' равно числу пар фрагментов, соответствующих атомам С и N, разделенных двумя химическими связями Значение е равно 0 для перфторуглеродов или 1 для перфтораминов При определении параметров соотношения (25) оказалось, что параметр ¡3 - отрицательный, следовательно, уменьшение im будет тем бблышш, чем больше вкладов р входит в корреляционное соотношение Для насыщенных соединений C„Fm число таких вкладов будет (п-1), для одиночных циклов - п, для бициклов - (п+1) и т д Таким образом, перфторуглероды, имеющие в своем составе циклы, будут выводиться из организма более легко, чем нециклические Аналогично, параметр у оказался также отрицательным Следовательно, увеличение числа разветвлений в молекулярной структуре будет приводить к уменьшению значений log tm Это позволяет делать прогнозы модификации структуры для поиска кандидатов на использование в качестве кровезаменителей Заключение

Корреляционное моделирование направлено на получение количественных оценок физико-химических свойств и биологической активности Оно позволяет рассчитывать приближенные значения свойства с удовлетворительной точностью на основе структуры молекул, представленной в численной форме Корреляционные модели дают возможность предсказывать свойства вновь синтезируемых соединений, ускоряют конструирование новых лекарств, вносят вклад в изучение деталей механизма биологической активности разных видов Развитый в настоящем исследовании фрагментный подход для получения корреляционных моделей позволяет выявить роль отдельных структурных элементов, прогнозировать направление изменения свойства при модификации молекулярной структуры

соединений, что дает возможность направлять поиск новых веществ с заданными свойствами, в том числе с необходимым лекарственным действием

В отличие от описанных к настоящему времени фрагментных представлений молекулярной структуры в нашем методе выбор фрагментов разного типа основан на анализе внутри- и межмолекулярных взаимодействий, существенных для рассматриваемого свойства, а не определяется заранее химической природой атомов Это обстоятельство позволяет уменьшать число параметров корреляционного соотношения за счет отождествления типа фрагментов, связанных с атомами разной химической природы, использования фрагментов крупного размера, включения в модель функции от расстояния для парных фрагментных вкладов Предложенный подход отличается общностью и гибкостью Он применим для рассмотрения свойств больших наборов разнообразных соединений при наличии достаточной базы экспериментальных значений для параметризации моделей В то же время он может дать наглядные модели для изучения корреляции биологическая активность -молекулярная структура, хотя в таких системах, как правило, наборы экспериментально изученных соединений, значения свойства которых необходимы для определения параметров корреляционного соотношения, малы Разработанный в настоящей работе алгоритм отбора молекулярных дескрипторов с последовательным применением пошаговой регрессии быстро приводит к оптимальным моделям с небольшим числом параметров

Сформулированная методология построения корреляционных моделей опробована в расчетах многих физико-химических свойств, для которых собрана большая база экспериментально измеренных значений В работе приведены результаты расчетов для разных классов органических соединений Возможности разрабатываемого подхода были проверены в расчетах следующих физико-химических свойств теплоты образования, температуры кипения, теплоты испарения, теплоемкости, давления насыщенных паров, критических температуры, давления и объема, коэффициента распределения октанол-вода, поляризуемости, диамагнитной восприимчивости В число исследуемых были включены следующие соединения насыщенные и ненасыщенные углеводороды нормального, разветвленного и циклического строения, алифатические спирты, амины и галогенпроизводные с одной или несколькими функциональными группами, ароматические соединения,

гетероциклы, перфторуглероды, амиды карбоновых кислот, аминокислоты и их ]\т-ацетилироизводные, пептиды, содержащие до пяти аминокислотных остатков Точность получаемых оценок соответствовала результатам аналогичных исследований, опубликованных в литературе, а в ряде случаев и превосходила их

Большое внимание было уделено "трудным случаям", т е тем, для которых имеющиеся методы давали значения свойства, сильно отличающиеся от экспериментальных значений, и намечены пути повышения точности оценок Так, при расчете логарифма коэффициента распределения в системе октанол-вода удалось учесть эффект сворачивания гидрофобных молекул в более компактную конформацию в водной фазе

Применение предложенного фрагментного подхода к моделированию биологической активности продемонстрировало его высокую эффективность При моделировании биологической активности типа взаимодействия лиганд-рецептор были проведены расчеты свободной энергии образования комплексов а-цгослодекстрина с производными бензола, а также активности производных циклогексена и циклопентана в качестве ингибиторов нейраминидазы вируса гриппа Корреляционное соотношение, полученное для оценок активности ингибиторов нейраминидазы, позволило получить оценки показателей ингибирования близкие к экспериментальным значениям (среднеквадратичное отклонение рассчитанных значений от экспериментально измеренных составило 8 2% от диапазона изменения активности для исследуемого набора соединений) При этом рассчитанные значения ингибиторной активности правильно передавали немонотонность изменения свойства при удлинении алкильного заместителя На примерах расчетов периода полувыведения из организма перфторорганических соединений и длительности угнетающего действия производных барбитуровой кислоты была продемонстрирована способность разработанных корреляционных моделей описывать другой, комплексный тип биологической активности, включающей несколько молекулярных процессов На основе корреляционного соотношения, полученного для вычисления периода полувыведения перфторуглеродов, была выдвинута гипотеза о том, что при прочих равных условиях более разветвленные соединения будут легче выводиться из организма, чем соединения с меньшим числом разветвлений в молекулярном скелете

Таким образом, результаты исследований подтвердили перспективность применения предложенного подхода для массового расчета неизмеренных значений разнообразных физико-химических свойств и биологической активности органических соединений

6. Выводы.

1 Разработаны новые приемы фрагментного представчения структуры молекулы с различной степенью детализации Разделение молекулы на фрагменты проводилось на основе анализа внутри- и межмолекулярных взаимодействий Число типов фрагментов определялось структурным разнообразием рассматриваемого набора соединений, а также доступностью экспериментальных данных для параметризации корреляционного соотношения

2 Предложено корреляционное соотношение, в которое, наряду с однофрагментными, включались двух- и многофрагментные вклады Установлено, что корреляционные модели, в которых двухфрагменткые вклады, интерпретируемые как парные взаимодействия фрагментов, описывались явной функциональной, в частности экспоненциальной, зависимостью от расстояния, эффективны для расчета физико-химических свойств Доказано, что использование многофрагментных вкладов отражающих такие особенности в структуре молекул, как разнообразные разветвления молекулярного скелета и замыкание циклов, повышало наглядность моделей и точность получаемых оценок свойств

3 Показано, что при осознанном выборе корреляционного соотношения в виде суммы одно- и многофрагментных вкладов для получения статистически значимых моделей достаточно методов множественной регрессии Модели, полученные методом проекции на латентные структуры, давали лучшие по точности оценки свойств, однако ортогонализация дескрипторов затрудняла интерпретацию корреляционных соотношений Поэтому для прогнозирования физико-химических свойств и биологической активности следует оставлять в модели дескрипторы молекулярной структуры в натуральном виде, с ясным структурным смыслом

4 При интерпретации корреляционных моделей было установлено, что для понимания роли того или иного дескриптора молекулярной структуры важно учитывать знак и величину его вклада в корреляционное соотношение, а также его встречаемость в структуре молекул тренировочного набора

5 Эффективность предложенного подхода была проверена в расчетах различных физико-химических свойств и биологической активности органических соединений разных классов, включая важные для медицины перфторуглероды, а-циклодекстрин, производные барбитуровой кислоты и ингибиторы нейраминидазы В большинстве случаев полученные оценки с высокой точностью совпадали с экспериментальными данными Полученные корреляционные соотношения правильно передавали тенденции в изменении свойства в зависимости от структуры исследованных молекулярных систем, что позволяет сделать вывод о перспективности предложенной методологии для массового расчета неизмеренных значений физико-химических свойств и биологической активности органических соединений

Список публикаций, относящихся к теме диссертации.

1 Волькенштейн М В, Голованов И Б, Цыганкова И Г Простой метод

конформационного анализа биоорганических соединений и биополимеров Ня-комплексы в биологических системах // Мол биология 1992 Т 26 № 2 С 378-403

2 Голованов И Б, Цыганкова И Г Топологические структуры пептидов,

содержащих 4 цистеиновых остатка // Журнал структурной химии, 1998 Т 39 N3 С 529-534

3 Волькенштейн М В, Голованов И Б, Цыганкова И Г Имитационное

моделирование структуры молекул биополимеров // Мол Биология 1992 Т 26 №6 С 1209-1241

4 Голованов И Б, Цыганкова И Г Корреляционное соотношение структура-

свойство для оценок свободных энергий переноса молекул углеводородов из газовой фазы в воду и гидрофобных взаимодействий //Журнал физической химии 1998 Т72 №4 С 599-603

5 Голованов И Б, Иваницкий Г Р, Цыганкова И Г Простая форма

корреляционного соотношения и физико-химический смысл входящих в него параметров //Доклады РАН 1998 Т359 №2 С 258-262

6 Голованов И Б , Иваницкий Г Р , Цыганкова И Г Корреляция струюура-

евойство Коэффициент распределения молекул углеводородов в системе октанол-вода //ДокладыРАН 1998 Т359 №3 С 409-412

7 Голованов И Б , Иваницкий Г Р , Цыганкова И Г Корреляция структура-

свойство Коэффициент распределения молекул различных классов органических соединений в системе октанол-вода //Доклады РАН 1998 Т 359 №6 С 823-827

8 Голованов И Б , Иваницкий Г Р, Цыганкова И Г Влияние окружения на

гидрофобность разных групп молекул биополимеров //Доклады РАН 1998 Т 360 № 1 С 120-123

9 Голованов И Б , Иваницкий Г Р, Тихонов Д А , Цыганкова И Г Оценки

гидрофобных взаимодействий в комплексах молекул углеводородов //Доклады АН 1999 Т 365 N 2 С 210-214

10 Голованов И Б, Цыганкова И Г Корреляционное соотношение структура-

свойство I Описание подхода и оценки теплот испарения органических соединений различных классов //Журнал общей химии 1999 Т69 Вып 8 С 1275-1282

11 Голованов И Б, Цыганкова И Г Корреляционное соотношение структура-

свойство II Оценки некоторых физико-химических свойств молекул углеводородов //Журнал общей химии 1999 Т69 Вып 12 стр 2019-2024

12 Голованов И Б, Цыганкова И Г Корреляционное соотношение структура-

свойство III Коэффициент распределения молекул органических соединений различных классов в системе октанол-вода // Журнал общей химии 2000 Т 70 Вып 2 С 223-230

13 Голованов И Б , Цыганкова И Г Мегод RISM для оценок термодинамических

характеристик гидратации молекул насыщенных утлеводородов // Журнал физической химии 2000 Т 74 К° 5 С 863-866

14 Голованов И Б, Иваницкий Г Р, Цыганкова И Г, Хабарова М И

Корреляционное соотношение структура-свойство Оценки периода полувыведения для перфторорганических соединений //Доклады РАН 2000 Т 371 №6 С 823-828

15 Golovanov IВ , Tsygankova I G Estimation of Physicochemical Properties from The Structure-Property Relationship A New Approach //Quantative structure activity relationship (.QSAR) 2000 V 19 P 554-564

16 Голованов ИБ, Цыганкова ИГ Корреляционное соотношение структура-

свойство IV Оценка логарифма коэффициента распределения гибких молекул углеводородов в системе октанол-вода //Журнал общей химии 2001 Т 71 Вып 4 С 538-543

17 Голованов ИБ, Цыганкова ИГ Корреляционное соотношение структура-

свойство V Оценка логарифма коэффициента распределения молекул, содержащих полярные группы в системе октанол-вода //Журнал общей химии 2001 Т 71 Вып 5 С 759-764

18 Голованов ИБ, Цыганкова ИГ Корреляционное соотношение структура-

свойство VI Доступные поверхности молекул углеводородов и простые методы их приближенной оценки //Журнал общей химии. 2001 Т 71 Вып 6 С 889-894

19 Голованов ИБ, Цыганкова ИГ Корреляционное соотношение структура-

свойство VII Некоторые свойства перфторорганических соединений // Журнал общей химии 2001 Т 71 Вып 6 С 895-910

20 Голованов И Б, Цыганкова И Г Корреляционное соотношение структура-

свойство VIII Оценки lgP амидов карбоновых кислот и их N-ацетилпроизводных // Журнал общей химии 2001 Т 71 Вып 10 С 16721676

21 Голованов ИБ, Цыганкова ИГ Корреляционное соотношение структура-

свойство IX Оценки lgP некоторых пептидов // Журнал общей химии 2002 Т 72 Вып 1 С 146-152

22 Цыганкова И Г Оценка коэффициента распределения пептидов в системе

октанол-вода по корреляционному соотношению структура-свойство // Журнал физической химии 2002 Т76 №11 С 2012-2014

23 Tsygankova I G Combmation of Fragmentai and Topological Descnptors for QSPR

Estimations ofBoihng Temperature //QSAR & Combmatonal Science 2004 V 23 N8 P 629-636

24 Tsygankova I G Estimation of Thermodynamic Properties of Organic Compounds Using Fragment-Based and Topological Descnptors //Russian Journal of Physical Chemistry 2005 V 79, Suppl 1 P S14-S17

25 Голованов И Б, Женодарова С M, Цыганкова И Г Корреляционное

соотношение структура-свойство XXVII Оценки свободной энергии образования комплексов «гость-хозяин» а - циклодекстрина с производными бензола // Журнал общей химии 2006 Т 76 Вып 2 С 282-286

26 Цыганкова И Г , Женодарова С M Корреляционное соотношение структура-

свойство для оценки активности ингибиторов нейраминидазы вируса гриппа // Журнал общей химии 2006 Т 76 Вып 10 С 1688-1695

27 Цыганкова И Г , Женодарова С M Корреляционное соотношение структура-

свойство для производных барбитуровой кислоты возможности фрагментного подхода //Журнал общей химии 2007 Т 77 Вып 5

Подписано в печать 10 04 2007 г Испо;шено 12 04 2007 г Печать трафаретная

Заказ № 270 Тираж 75 экз

Типография «11-й ФОРМАТ» ИНН 7726330900 Н5230, Москва, Варшавское ш , 36 (495) 975-78-56 \v\vw аи!огеГега1 ги

Содержание диссертации, доктора физико-математических наук, Цыганкова, Ирина Глебовна

1. Введение.

2. Развитие и современное состояние корреляционных подходов в изучении связи физико-химических свойств и биологической активности с молекулярной структурой органических соединений.

2.1. Теоретическое обоснование корреляционных подходов.

2.1.1. Энергия системы в простых квантовых подходах.

2.1.2. Линейные соотношения для свободной энергии в молекулярных процессах.

2.1.3. Термодинамические свойства.

2.1.4. Вид корреляционного соотношения.

2.2. Численное представление молекулярной структуры

2.2.1. Топологические индексы.

2.2.2. Трехмерные дескрипторы молекулярной структуры.

2.2.3. Фрагментные и подструктурные дескрипторы молекулярной структуры.

2.2.4. Дескрипторы, описывающие структуру молекулы через другие свойства. Роль межмолекулярных взаимодействий.

3. Методы построения корреляционных моделей для оценок физико-химических свойств и биологической активности.

3.1. Фрагментное представление структуры молекул.

3.1.1. Разбиение молекулы на фрагменты.

3.1.2. Использование "реакции образования" для построения корреляционного соотношения.

3.1.3. Взаимодействие фрагментов.

3.1.4. Особенности корреляционного соотношения структура-свойство для гибких молекул.

3.2. Математические аспекты построения корреляционных моделей.

3.2.1. Использование ортогональных дескрипторов молекулярной структуры.

3.2.2. Отбор дескрипторов для корреляционных моделей.

3.2.3. Описательная и предсказательная сила моделей.

4. Расчет физико-химических свойств органических соединений разных классов.

4.1. Потенциальные функции и "прямые" методы расчета молекулярных свойств.

4.1.1. Расчет энергетических характеристик отдельных молекул и их комплексов в вакууме и водном окружении.

4.1.2. Использование метода RISM для расчета термодинамических характеристик гидратации молекул насыщенных углеводородов.

4.2. Оценки физико-химических свойств органических соединений в корреляционных подходах.

4.2.1. Нормальные углеводороды.

4.2.2. Разветвленные насыщенные углеводороды. Роль многофрагментных вкладов.

4.2.3. Циклические, ненасыщенные и ароматические углеводороды и алифатические соединения, содержащие гетероатомы.

4.2.4. Насыщенные углеводороды, спирты и амины с разветвленными углеводородными радикалами. Альтернативное фрагментное представление молекулярной структуры.

4.2.5. Перфторуглероды.

4.3. Корреляционное соотношение структура-свойство для оценок log Р органических соединений разных классов.

4.3.1. Насыщенные углеводороды.

4.3.2. Гибкие молекулы углеводородов.

4.3.3. Циклические, ненасыщенные и ароматические углеводороды и алифатические соединения, содержащие гетероатомы.

4.3.4. Соединения с несколькими полярными группами.

4.3.5. Пептиды.

5. Оценки биологической активности в корреляционных подходах.

5.1. Модели взаимодействия рецептор - лиганд.

5.1.1. Комплексы "гость - хозяин" с участием а-циклодекстрина.

5.1.2. Корреляция структура - активность для некоторых ингибиторов нейраминидазы вируса гриппа.

5.2. Корреляционное соотношение для оценок лекарственного действия.

5.2.1. Расчет длительности действия барбитуратов.

5.2.2. Оценки периода полувыведения перфторуглеродов.

Введение Диссертация по биологии, на тему "Корреляционные модели для расчета физико-химических свойств и биологической активности органических соединений"

При решении многих задач в области биологии и биофизики, медицины или материаловедения необходимо знать физико-химические свойства или биологическую активность разнообразных органических соединений.1 Непосредственное измерение свойства может быть связано со многими трудностями (сложный эксперимент, большие затраты ресурсов и времени, вредность для окружающей среды и т.п.). Точный расчет свойства на базе строгих теорий не всегда возможен. Зависимость физико-химических свойств или биологической активности от структуры, очевидная на интуитивном уровне и имеющая многочисленные экспериментальные подтверждения, очень трудно выражается в количественной форме. Подчас неизвестен механизм проявления свойства, условия и системы наблюдения сложны, детали и особенности закономерностей спрятаны в огромном накопленном экспериментальном материале. Таким образом, расчеты характеристик реальных систем, на основе структуры составляющих их молекул, отличаются сложностью, и не всегда большие вычислительные усилия вознаграждаются достаточной точностью и надежностью получаемых количественных оценок. Однако для многих целей могут быть достаточны приближенные оценки свойства, которые получаются на основе корреляционного соотношения структура - свойство. Корреляционное соотношение структура - свойство (КССС) - это уравнение, связывающее значения свойства Р с количественными характеристиками молекулярной структуры X:

P=f(X).

В дальнейшем рассмотрении физико-химические свойства или биологическая активность органических соединений будут обозначаться общим словом "свойство" там, где не требуется учитывать их особенности.

В качестве набора величин Х=Х], Х2,. могут быть использованы разнообразные характеристики, которые определяются по молекулярной структуре и называются молекулярными дескрипторами, такие, как молекулярный вес, число атомов определённого типа, заряды, энергии молекулярных орбиталей и т.п. Вид функциональной зависимости/ выбирается на основе знаний о механизме свойства или из правдоподобных предположений, исходя из здравого смысла и интуиции исследователя. Функция/ включает ряд параметров 0 =в], 02,., подбираемых по известным значениям свойства для набора соединений, считающихся тренировочными:

Р=/(Х, &) •

В отсутствии строгих рецептов выбора функции/, в корреляционных соотношениях часто используется линейная зависимость, а параметры 0 выступают в роли весовых коэффициентов.

Корреляционное моделирование связи свойства с молекулярной структурой включает следующие этапы: 1) выбор количественных характеристик молекулярной структуры; 2) построение КССС и определение его параметров; 3) исследование возможностей применения данного КССС для оценок свойства. Корреляционные подходы могут давать количественные оценки свойства с точностью, сопоставимой с точностью экспериментальных измерений. Такие подходы не устанавливают зависимости свойства от молекулярной структуры в явном виде, но позволяют выявить роль отдельных структурных элементов и прогнозировать изменения свойства соединения при модификации его молекулярной структуры.

Настоящее исследование посвящено развитию методов построения КССС и их использованию для расчетов количественных характеристик ряда физико-химических свойств и разных видов биологической активности. Возможности разрабатываемого подхода были проверены в расчетах следующих свойств: теплоты образования, температуры кипения, теплоты испарения, теплоёмкости, давления насыщенных паров,-критических температуры, давления и объёма, коэффициента распределения в системе октанол-вода, поляризуемости, диамагнитной восприимчивости, свободной энергии комплексообразования, длительности действия и периода полувыведения лекарственных веществ, ингибирующей активности. В число исследуемых были включены следующие соединения: насыщенные и ненасыщенные углеводороды нормального, разветвленного и циклического строения; алифатические спирты, амины и галогенпроизводные с одной или несколькими функциональными группами; ароматические соединения; гетероциклы;-перфторуглероды; амиды карбоновых кислот и их N-ацетилпроизводные; пептиды, содержащие до пяти аминокислотных остатков; а-циклодекстрин и производные бензола; производные барбитуровой кислоты; производные циклогексена и циклопентана в качестве ингибиторов нейраминидазы.

Цель и задачи исследования.

Основная цель работы - разработка методологии построения корреляционных моделей для расчета количественных оценок физико-химических свойств веществ или биологической активности соединений по их молекулярной структуре.

В ходе исследования необходимо было решить следующие задачи:

1) разработать приемы фрагментного представления молекулы для корректной количественной кодировки молекулярной структуры;

2) изучить применение различных методов отбора переменных и упрощения корреляционного соотношения;

3) провести интерпретацию полученных количественных корреляций структура-свойство, получить новую информацию о свойстве и его связи со структурой соединений;

4) продемонстрировать эффективность корреляционного метода вычисления свойств и биологической активности, т.е. на ряде примеров показать описательную и предсказательную силу корреляционных моделей.

Актуальность.

Актуальность исследования обусловлена тем, что в настоящее время синтезируются многие тысячи новых веществ, физико-химические свойства или биологическая активность которых требуют изучения. Для этого необходимы количественные оценки свойств вновь синтезируемых соединений, которые трудно или невозможно определить экспериментально.

Корреляционные подходы дают возможность направлять поиск новых веществ с заданными свойствами, в том числе с желаемым лекарственным действием, и сокращать стоимость, временные затраты и необходимые испытания на животных.

Новизна.

Разрабатываемый подход основывается на фрагментном представлении молекулы. Новизна предложенных моделей заключается в том, что выбор фрагментов разного типа и разной величины обусловлен внутри- и межмолекулярными взаимодействиями, существенными для рассматриваемого процесса, а не связан жестко с атомами или группами атомов. Степень детализации фрагментного представления молекулярной структуры определяется конкретной задачей. Впервые взаимодействия между фрагментами включены в корреляционное соотношение в явном виде: или в форме вклада, который как параметр определяется по значениям свойств молекул тренировочного набора соединений, или в форме функции от расстояния между фрагментами. Это позволяет уменьшать число параметров корреляционного соотношения и решать задачи в условиях ограниченного набора экспериментальных данных.

Предложенный подход отличается общностью и гибкостью, применим к разнообразным свойствам.

Практическая значимость.

Корреляционные подходы могут служить для предсказания физико-химических свойств или биологической активности вновь синтезируемых соединений и направлять поиск новых соединений с более предпочтительными характеристиками.

Предложенные корреляционные модели могут оказаться полезными для формирования критериев поиска в базах данных, например, при конструировании новых лекарственных соединений. Разрабатываемые модели могут применяться в качестве простых и быстрых способов оценки биологической и экологической безопасности.

Заключение Диссертация по теме "Биофизика", Цыганкова, Ирина Глебовна

Выводы.

1. Разработаны приемы фрагментного представления структуры молекулы с различной степенью детализации. Разделение молекулы на фрагменты проводилось на основе анализа внутри- и межмолекулярных взаимодействий. Число типов и количество фрагментов определялось структурой и разнообразием рассматриваемого набора соединений, а также доступностью экспериментальных данных для параметризации корреляционного соотношения.

2. Предложено корреляционное соотношение, в которое, наряду с однофрагментными, включались двух- и многофрагментные вклады. Установлено, что корреляционные модели, в которых двухфрагментные вклады, интерпретируемые как парные взаимодействия фрагментов, описывались явной функциональной, в частности экспоненциальной, зависимостью от расстояния, эффективны для расчета физико-химических свойств. Доказано, что использование многофрагментных вкладов, отражающих такие особенности в структуре молекул, как разнообразные разветвления молекулярного скелета и замыкание циклов, повышало наглядность моделей и точность получаемых оценок свойств.

3. Показано, что при осознанном выборе корреляционного соотношения в виде суммы одно- и многофрагментных вкладов для получения статистически значимых моделей достаточно методов множественной регрессии. Сложные подходы с использованием ортогонализации дескрипторов (например, метод проекции на латентные структуры), хотя и давали лучшие по точности оценки, однако серьезно затрудняли интерпретацию полученных корреляционных моделей. Поэтому для прогнозирования свойств и активности следует оставлять в модели дескрипторы молекулярной структуры в натуральном виде, с ясным структурным смыслом.

4. При интерпретации корреляционных моделей было установлено, что для понимания роли того или иного дескриптора молекулярной структуры важно учитывать знак и величину его вклада в корреляционное соотношение, а также его встречаемость в структуре молекул тренировочного набора.

5. Предложенный подход был использован для оценки различных физико-химических свойств и биологической активности органических соединений разных классов, включая важные для медицины перфторуглероды, а-циклодекстрин, производные барбитуровой кислоты и ингибиторы нейраминидазы. Во всех случаях полученные оценки с высокой точностью совпадали с экспериментальными данными. Результаты исследований подтвердили перспективность применения предложенного подхода для массового расчета неизмеренных значений физико-химических свойств и биологической активности органических соединений.

6. Заключение.

Корреляционное моделирование направлено на получение количественных оценок физико-химических свойств и биологической активности. Оно позволяет рассчитывать приближенные значения свойства с удовлетворительной точностью на основе структуры молекул, представленной в численной форме. Корреляционные модели дают возможность предсказывать свойства вновь синтезируемых соединений, ускоряют конструирование новых лекарств, вносят вклад в изучение деталей механизма биологической активности разных видов. Развитый в настоящем исследовании фрагментный подход для получения корреляционных моделей позволяет выявить роль отдельных структурных элементов, прогнозировать направление изменения свойства при модификации молекулярной структуры соединений, что дает возможность направлять поиск новых веществ с заданными свойствами, в том числе с необходимым лекарственным действием.

В отличие от описанных к настоящему времени фрагментных представлений молекулярной структуры в нашем методе выбор фрагментов разного типа основан на анализе внутри- и межмолекулярных взаимодействий, существенных для рассматриваемого свойства, а не определяется заранее химической природой атомов. Это обстоятельство позволяет уменьшать число параметров корреляционного соотношения за счет отождествления типа фрагментов, связанных с атомами разной химической природы, использования фрагментов крупного размера, включения в модель функции от расстояния для парных фрагментных вкладов. Предложенный подход отличается общностью и гибкостью. Он применим для рассмотрения свойств больших наборов разнообразных соединений при наличии достаточной базы экспериментальных значений для параметризации моделей. В то же время он может дать наглядные модели для изучения корреляции биологическая активность - молекулярная структура, хотя в таких системах, как правило, наборы экспериментально изученных соединений, значения свойства которых необходимы для определения параметров корреляционного соотношения, малы. Разработанный в настоящей работе алгоритм отбора молекулярных дескрипторов с последовательным применением пошаговой регрессии быстро приводит к оптимальным моделям с небольшим числом параметров.

Сформулированная методология построения корреляционных моделей опробована в расчетах многих физико-химических свойств, для которых собрана большая база экспериментально измеренных значений. В работе приведены результаты расчетов для разных классов органических соединений. Возможности разрабатываемого подхода были проверены в расчетах следующих физико-химических свойств: теплоты образования, температуры кипения, теплоты испарения, теплоёмкости, давления насыщенных паров,-критических температуры, давления и объёма, коэффициента распределения октанол-вода, поляризуемости, диамагнитной восприимчивости. В число исследуемых были включены следующие соединения: насыщенные и ненасыщенные углеводороды нормального, разветвленного и циклического строения; алифатические спирты, амины и галогенпроизводные с одной или несколькими функциональными группами; ароматические соединения; гетероциклы;-перфторуглероды; амиды карбоновых кислот, аминокислоты и их N-ацетилпроизводные; пептиды, содержащие до пяти аминокислотных остатков. Точность получаемых оценок соответствовала результатам аналогичных исследований, опубликованных в литературе, а в ряде случаев и превосходила их.

Большое внимание было уделено "трудным случаям", т.е. тем, для которых имеющиеся методы давали значения свойства, сильно отличающиеся от экспериментальных значений, и намечены пути повышения точности оценок. Так, при расчете логарифма коэффициента распределения в системе октанол-вода удалось учесть эффект сворачивания гидрофобных молекул в более компактную конформацию в водной фазе.

Применение предложенного фрагментного подхода к моделированию биологической активности продемонстрировало его высокую эффективность. При моделировании биологической активности типа взаимодействия лиганд-рецептор были проведены расчеты свободной энергии образования комплексов а-циклодекстрина с производными бензола, а также активности производных циклогексена и циклопентана в качестве ингибиторов нейраминидазы вируса гриппа. Корреляционное соотношение, полученное для оценок активности ингибиторов нейраминидазы, позволило получить оценки показателей ингибирования близкие к экспериментальным значениям (среднеквадратичное отклонение рассчитанных значений от экспериментально измеренных составило 8.2% от диапазона изменения активности для исследуемого набора соединений). При этом рассчитанные значения ингибиторной активности правильно передавали немонотонность изменения свойства при удлинении алкильного заместителя. На примерах расчетов периода полувыведения из организма перфторорганических соединений и длительности угнетающего действия производных барбитуровой кислоты была продемонстрирована способность разработанных корреляционных моделей описывать другой, комплексный тип биологической активности, включающей несколько молекулярных процессов. На основе корреляционного соотношения, полученного для вычисления периода полувыведения перфторуглеродов, была выдвинута гипотеза о том, что при прочих равных условиях более разветвленные соединения будут легче выводиться из организма, чем соединения с меньшим числом разветвлений в молекулярном скелете.

Таким образом, результаты исследований подтвердили перспективность применения предложенного подхода для массового расчета неизмеренных значений разнообразных физико-химических свойств и биологической активности органических соединений.

Библиография Диссертация по биологии, доктора физико-математических наук, Цыганкова, Ирина Глебовна, Пущино

1. Ломоносов М.В. Полное собрание сочинений, т.1, стр. 81, М.-Л., Изд-во АН СССР, 1950. Цитируется по книге: Быков Г.В. История стереохимии органических соединений. Изд-во Наука. 1966. С.9.

2. Корр Н.// Lieb. Ann., 1842. V. 41. P. 169; Berthelot M.// Ann. De Chim. at de Phys.1856. V. XIVIII. P.322. Цитируется no 8.: Татевский B.M. Теория физико-химических свойств молекул и веществ. Изд-во Московского университета. 1987.

3. Crum Brown A., Frazer Т. /Ягапэ. R. Soc. Edinburgh, 1868-9, V. 25. P. 151-203. Цитируется по 67.: Livingstone D.J. //The Characterization of Chemical Structures Using Molecular Properties. // J.Chem.Inf. Comput. Sci. 2000. V. 40. N 2. P. 195-209.

4. Pople J.A., Santry D.P. Segal G.A. Approximate Self-Consistent Molecular Orbital Theory. I. Invariant Procedures. //J. Chem. Phys. 1965. V. 43. N 10(11). P. S129-S135.

5. Голованов И.Б., Цыганкова И.Г. Корреляционное соотношение структура-свойство для оценок свободных энергий переноса молекул углеводородов из газовой фазы в воду и гидрофобных взаимодействий. //Журнал физической химии. 1998. Т.72. № 4. С. 599-603.

6. Van-Vleck J.H. The Theory of Electric and Magnetic Susceptibilities. London, 1932, 300 p.

7. Татевский B.M. Теория физико-химических свойств молекул и веществ. Изд-во МГУ. 1987г. 239 с.

8. Жданов Ю.А., Минкин В.И. Корреляционный анализ в органической химии Изд-во Ростовского университета. 1966.470 с.

9. Free М. S., Wilson J.W. A Mathematical contribution to Structure-Activity Studies. //J. Med. Chem. 1964. V. 7. N 4. P. 395-399.

10. Unger S. H., Hansch C. On Model Building in Structure-Activity Relationships. A Reexamination of Adrenergic Blocking Activity of P-Halo P-arylalkylamines. //J. Med. Chem. 1973. V. 16. N 7. P. 745-749.

11. Ханч К. Об использовании количественных соотношений структура активность (КССА) при конструировании лекарств. // Хим. -фарм. Ж. 1980. № 10. С. 15-30.

12. SelassieC.D., Mekapati S.B., Verma R.P. QSAR: Then and Now. //Curr. Top. Med.Chem. 2002.V. 2. N 12. P. 1357-1379.

13. Cammarata A. Interrrelation of the Regression Models Used for Structure-Activity Analyses. // J. Med. Chem. V. 15. N 6. P. 573-577.

14. Саркисов Г.Н. Приближенное уравнение теории жидкостей в статистической термодинамике классических жидких систем. // Успехи физических наук. 1999. Т. 169. № 6. С. 625-642.

15. Bias F.J., Vega L.F. Thermodynamic properties and phase equilibia of branched chain fluids using first- and second-order Wertheim's thermodynamic perturbation theory.// J. Chem. Phys. 2001. V. 115. N8. P. 3906-3915.

16. Русанов А.И. Уравнение состояния молекулярного флюида.// Ж. Физ. Химии. 2003. Т. 77. №10. С. 1764-1771.

17. Голованов И.Б., Женодарова С.М. Корреляционное соотношение структура-свойство. XVI. Свойства линейных молекул. // Журнал общей химии. 2004. Т. 74. Вып. 5. С. 765-769.

18. Varnek A., Fourches D., Hoonakker F., Solov'ev V.P. Substructural fragments: an universal language to encode reactions, molecular and supramolecular structures. //J. of Comp.-Aided. Mol. Design. 2005. V. 19. N 9-10. P. 693-703.

19. Yuan H., Cao Ch. Topological Indices Based on Vertex, Edge, Ring, and Distance: Application to Various Physicochemical Properties of Diverse Hydrocarbons.// J. Chem. Inf. Сотр. Sci. 2003.V. 43. N2. P.501-512.

20. Espinosa G., Yaffe D., Cohen Y., Arenas A., Gilralt F. Neural Network Based Quantative Structural Property Relations (QSPRs) for Predicting Boiling Points of Aliphatic Hydrocarbons. //J.Chem.Inf. Comput., Sci. 2000. V. 40. N 3. P. 859-879.

21. Todeschini R. Consonni V. The Handbook of Molecular Descriptors In The Series of Methods and Principles in Medicinal Chemistry. Mannhold R., Kubinyi H., Timmerman H. Eds. Wiley-VCH: New York, 2000 Vol 11, p.680.

22. Раевский О.А, Дескрипторы молекулярной структуры в компьютерном дизайне биологически активных соединений. // Успехи химии. 1999. Т. 68. № 6. С. 555-576.

23. LucicB., Trinajstic N. A New Efficient Approach for Variable Selection Based on Multiregression: Prediction of Gas Chromatographic Retention Times and Response Factors. // J.Chem.Inf. Comput., Sci. 1999. V. 39. N 3. P. 610-621.

24. Ponec R., Amat L., Carbo-Dorca R. Molecular Basis of Quantitative Structure-Properties Relationships (QSPR): A Quantum Similarity Approach/ // J. Comp.-Aided Mol. Design. 1999. V. 13. N3. P. 259-270.

25. Amat L., Besalu E., Carbo-Dorca R. Identification of Acvtive Molecular Sites Using Quantum-Self-Similarity Measures.// J. Chem. Inf. Comp.Sci. 2001. V. 41. N 4. P. 978-991.

26. Ruelle P. The n-octanol and n-hexane/water partition coefficient of environmentally relevant chemicals predicted from the mobile order and disorder (MOD) thermodynamics. //Chemosphere. 2000. V. 40. N 5. P. 457-512.

27. Bodor N., Buchwald B. Molecular Size Based Approach to Estimate Partition Properties for Organic Solutes. //J. Phys. Chem. B. 1997. V. 101. N 17. P. 3404-3412.

28. Bodor N., Buchwald B. Simple Model for Nonassociative Organic Liquids and Water. // JACS. 2000. V. 122. N 43. P. 10671-10679.

29. Cho S. J., Hermsmeier M. A. Genetic Algorythm Guided Selection: Variable Selection and Subset Selection. //J. Chem. Inf. Comput. Sci. 2002. V. 42. N 4. P. 927-936.

30. Marini F., Roncaglioni A., Novic M. Variable Selection and Interpretation in Structure-Affinity Correlation Modeling of Estrogen Receptor Binders. //J.Chem. Inf. Model. 2005. V. 45. N6. P. 1507-1519.

31. Szantai-Kis C., Kovesdi I., Eros D., Banhegyi P., Ullrich A., Keri G., Orfi L. Prediction Oriented QSAR Modelling of EGFR Inhibition. // Curr. Med. Chem. 2006. V. 13. N3. P. 277287

32. Shi W.-M., Shen Q., Kong, W., Ye B.-X. QSAR analysis of tyrosine kinase inhibitor using modified ant colony optimization and multiple linear regression. //Eur. J. Med. Chem. 2007. V. 42. N1. P. 81-86.

33. Харари Ф. Теория графов. M. Мир. 1973.

34. Рувре Д. Следует ли заниматься разработкой топологических индексов? В кн. Химические приложения топологии и теории графов. Ред. Р. Кинг. М. Мир. 1987. С. 183205.

35. Wiener Н. Structural determination of paraffin boiling points. //JACS. 1947. V. 69. N 1. P. 17-20.

36. Жданов Ю.А. Теория строения органических соединений. М. Высшая школа. 1971. 288 с.

37. Bonchev D. Information Theoretic Indices for Characterization of Chemical Structures. Research Studies Press. N.Y. 1983.

38. Randic M. On Characterization of Molecular Branching. //JACS. 1975. N 23. V. 97. N 23. P.6609-6615.

39. Kier L.H. Hall L.B. Molecular Connectivity in Chemistry and Drug Research. In Medical Chemistry V. 14. Ed. by G. De Stevens. Acad.Press 1976. 257 p.

40. Kier L.H. Hall L.B. Molecular Structure Description. The electrotopological state. Academic Press, New York. 1999.

41. Maw H.H., Hall L.H. E-State Modelling of Corticosteroids Binding Affinity Validation of Model for Small Data. //J.Chem. Inf. Comput. Sci. 2001. V. 41. N 5. P.1248-1254.

42. Tetko I.V., Tanchuk V.Y., Villa A.E. Prediction of n-octanol-water partition coefficients from PHYSPROP database using artificial neural networks and E state indices. // J. Chem. Inf. Сотр. Sci. 2001. V. 41. N5. P. 1407-1421.

43. Смоленский E.A. Применение теории графов к расчетам структурно-аддитивных свойств углеводородов. //Ж. Физ. химии. 1964. Т. XXXVIII. № 5. С. 1288-1291.

44. Смоленский Е.А. Матрица химических структур и формализация задачи нахождения зависимостей структура-свойство.// Известия АН. Серия химическая. 2006. № 9. С. 14471453.

45. Смоленский Е.А., Власова Г.В., Платунов Д.Ю, Рыжов А.Н. Построение оптимальных топологических индексов для нахождения зависимостей структура-свойство. // Известия АН. Серия химическая. 2006. № 9. С. 1454-1461.

46. Randic М., Pompe М. The Variable Molecular Descriptors Based on Distance Related Matrices//J.Chem. Inf. Comput. Sci. 2001, V. 41. N 3. P. 575-581.

47. Gutman I. Remark on the moment expansion of total pi-electron energy. //Theor. Chim. Acta. 1992. V. 83. N5-6. P. 313-318.

48. Stankevich I.V., Skvortsova M.I., Zefirov N.S. On a quantum chemical interpretation of molecular connectivity indices for conjugated hydrocarbons. // J. Mol. Struct. (Theochem). 1995. V. 342. P. 173-179.

49. Hosoya H. From How to Why. Graph-Theoretical Verification of Quantum Mechanical Aspects of pi-Electron Behaviors in Conjugated Systems. // Bull. Chem. Soc. Jpn. 2003. V. 76. N 12. P.2233-2252.

50. Raos N. Mean Molecular Radius and Wiener Number: A Quest for Meaning. // Croat. Chem. Acta. 2003. V. 76. N 1. P. 81-85.

51. Randic M., Pompe M. On Interpretation of Well-Known Topological Indices. // J.Chem. Inf. Comput. Sci. 2001. V. 41. N 3. P. 550-560.

52. Randic M., Balaban A.T., Basak S.C. On Structural Interpretation of Several Distance Related Topological Indices. J. Chem. Inf. Comput. Sci. 2001. V. 41. N 3. P. 593-601.

53. Estrada E. Spectral Moments of the Edge Adjacency Matrix in Molecular Graphs. 1. Definition and applications to the Prediction of Physical Properties of Alkanes. // J. Chem. Inf. Comput. Sci. 1996. V.36. N 4. P. 844-849.

54. Stanton D. Т., Jurs P. C. Development and Use of Charged Partial Surface Area Structural Descriptors in Computer Assisted Quantitative Structure Property Relationship Studies. //Anal. Chem. 1990. V. 62.2323-2329.

55. Cramer R.D., Patterson D.E., Bunce J.D. Comparative Molecular Field Analysis (CoMFA). 1. Effect of Shape on Binding of Steroids to Carrier Proteins. //JACS. 1988. V. 110. N 18. P. 5959-5967.

56. Pastor M., Cruciani G., McLay I., Picket S., Clementi S. Grid-Independent Descriptors (GRIND): A Novel Class of Alignment -Independent Three-Dimensional Molecular Descriptors. // J. Med. Chem. 2000. V. 43. N 17. P. 3233-3243.

57. Stiefl N., Baumann K. Mapping Property Distributions of Molecular Surfaces: Algorithm and Evaluation of a Novel 3D Quantative Structure-Activity Relationship Technique // J. Med. Chem. 2003 V. 46. N 8. P. 1390-1407.

58. Baskin I.I., Skvortsova M.I., Stankevich I.V., Zefirov N.S. On the Basis of Invariants of Labeled Molecular Graphs. // J. Chem. Inf. Comput. Sci. 1995. V. 35. N 3. P.527-531.

59. Голованов И.Б., Женодарова C.M. Корреляционное соотношение структура-свойство. X. Общий вид корреляционного соотношения структура-свойство и его использование для оценки температур кипения насыщенных углеводородов. // ЖОХ. 2003. Т. 73. Вып. 1. С. 90-98

60. Zefirov N.S., Palyulin V.A. Fragmental Approach in QSPR. III. Chem/.Inf. Comput. Sci. 2002. V.42.N5.P. 1112-1122.

61. Japertas P., Didziapetris R., Petrauskas A. Fragmental Methods in the Design of New Compounds. Applications of The Advanced Algorythm Builder. //QSAR and Comb.Sci. 2002. V.21.N1.P. 23-27.

62. Japertas P., Didziapetris R., Petrauskas A. Fragmental Methods inanalysis of Biological Activities of Diverse Compound Sets. // Mini Rev. Med. Chem. 2003. V.3. N 8. P. 797-808.

63. Clark M. Generalized Fragment-Substructure Based Property Prediction Method. //J.Chem. Inf. Model. 2005. V. 45. N 1. P. 30-38.

64. Huibers P.D., Katritzky A.R. Correlation of the Aqueous Solubility of Hydrocarbons and Halogenated Hydrocarbons with Molecular Structure. //J.Chem. Inf. Сотр. Sci. 1998. V. 38. N2. P. 283-292.

65. Cherkasov A., Shi Zh., Fallahi M., Hammond G.L. Successful in Silico Discovery of Novel Nonsteroidal Ligands for Human Sex Hormone Binding Globulin. // J. Med. Chem. 2005. V. 48. N9. P. 3203-3213.

66. Livingstone D.J. The Characterization of Chemical Structures Using Molecular Properties. A Survey. // J.Chem.Inf. Сотр. Sci. 2000. V. 40. N 2. P. 195-209.

67. Kamlet M.J., Doherty R.M., Abraham M.H., Taft R.W. Solubility Properties in Biological Media. 12. Regarding the mechanism of Nonspecific Toxicity or Narcosis by Organic Nonelectrolytes. //QSAR. 1988. V.7. N 2. P. 71-78.

68. Hansch С., Leo A. Exploring QSAR. Am. Chem. Soc. Washington DC 1995. V. 1.

69. Hansch C., Leo A. Exploring QSAR. Am. Chem. Soc. Washington DC 1995. V. 2.

70. Riicker G., Rticker Ch. On Topological Indices, Boiling Points, and Cycloalkanes. // J. Chem. Inf. Comput. Sci. 1999. V. 39. N 5. P. 788-802.

71. Bartell L.S., Kohl D.A. Structure and Rotational Isomerization of Free Hydrocarbon Chains. //J. Chem. Phys. 1963. V. 39. № 11. P.3097-3105.

72. Hoskuldsson A. PLS Regression Methods. //J. Chemometrics. 1988. V. 2. N 2. P. 211-228.

73. Hoskuldsson A. A Combined Theory for PCA and PLS. //J. Chemometrics. 1995. V. 9. N 1. P. 91-123.

74. Родионова O.E. Хемометрический подход к исследованию больших массивов химических данных. // ЖВХО. 2006. Т.50. № 2. С. 128-144.

75. Gustafsson M.G. Indepenedent Component Analysis Yields Chemically Interpretable Latent Variables in Multivariate Regression. // J.Chem. Inf. Model. 2005. V. 45. N 5. P. 1244-1255.

76. Айвазян C.A., Мхитарян B.C. Прикладная статистика и основы эконометрики. М.:Юнити. 1998. 1022с.

77. Randic М. Resolution of Ambiguities in Structure-Property Studies by Use of Orthogonal Descriptors//!. Chem. Inf. Comput. Sci. 1991. V. 31. N 2. P. 311-320

78. Ghafourian Т., Cronin M.T.D. The impact of variable selection on the modeling of oestrogenicity. // SAR and QSAR Env. Res. 2005. V. 16. N 1-2. P. 171-190.

79. Kubinyi H. Evolutionary Variable Selection in Regression and PLS Analyses.//J. Chemometrics. 1996. V.10. N2. P. 119-133.

80. Baumann K. Chance Correlation in Variable Subset Regression: Influence of the Objective Function, The Selection Mechanism, and Ensemble Averaging. //QSAR Comb. Sci. 2005. V. 24. N9. P. 1033-1046.

81. Mannhold R., van de Waterbeemd H. Substructure and whole molecule approaches for calculating log P. II J. Сотр. Aided Mol. Design. 2001. V. 15. N 4. P. 337-354.

82. Burman P.A. Comparative study of Ordinary Cross-Validation, v-fold Cross-Validation and the Repeated Learning- Testing Methods. // Biometrica. 1989. V. 76. P. 503-514.

83. Shao J. Linear Model Selection by Cross-Validation. //J. Amer. Statist. Assoc. 1993. V. 88. p. 486-494.

84. Zhang P. Model Selection via Multifold Cross Validation. // Ann. Statist. 1993. V. 21. P. 299-313.

85. Baumann K. Distance Profiles (DiP): A Translationally and Rotationally invariant 3D Structure Descriptor Capturing Steric Properties of Molecules. // QSAR. 2002. V. 21. P. 507519.

86. Skvortsova M.I., Baskin I.I., Slovokhotova O.Z., Palyulin V.A., Zefirov N.S. Inverse Problem in QSAR/QSPR Studies for the Case of Topological Indices Characterizing Molecular Shape (Kier Indices). // J.Chem. Inf. Сотр. Sci. 1993. V.33. N 4. P. 630-634.

87. Голованов И.Б., Цыганкова И.Г., Волькенштейн M.B. Простой метод конформационного анализа биоорганических соединений и биополимеров. Ня-комплексы в биологических системах.// Мол. биология. 1992. Т.26. Вып. 2. С. 378-403.

88. Волькенштейн М.В., Голованов И.Б., Цыганкова И.Г. Имитационное моделирование структуры молекул биополимеров. // Мол. Биология. 1992. Т. 26. № 6. С. 1209-1241.

89. Alinger N.L., Rahman М., Lii J.-H. A Molecular Mechanics Force Field (MM3) for Alcogols and Ethers. // JACS. 1990. V. 112. N 23. P. 8293-8307.

90. Wiberg R.B., Murcko M.A. Rotational Barriers. 4. Dimethoxymethane. The Anameric Effect Revisited. //JACS. 1989. V.ll 1. N 13. P. 4821-4828.

91. Costa Corbal B.J., Albuquerque L.M.P.C., Silva Fernandes F.M.S. Ab Initio Study of the Conformational Equilibrium of Ethylene Glycol. //Theoret. Chim. Acta. 1991. V.78.N 4. P.271-280.

92. Penn R.E., Curl R.F. Microwave Spectrum of 2-Aminoethanol: Structural Effects of the Hydrogen Bond. //J.Chem. Phys. 1971. V.55. N2. P. 651-658.

93. Ben-Naim A. Hydrophobic Interactions N.Y.: Plenum Press. 1980. 312 p.

94. Hansch C., Leo A. Substituent constants for Correlation Analysis in Chemistry and Biology. New York: John Wiley and sons. 1979, p. 339.

95. Eisenberg D., McLachlan A.D. Solvatation Energy in Protein Folding and Binding. //Nature. 1986. V. 319. N 6050. P. 199-203.

96. Rekker R.F. The Hydrofobic Fragmental Constants. Amsterdam.: Elsevier. 1977.389 p.

97. Reynolds J.A., Gilbert D.B., Tanford C. Empirical Correlation between Hydrophobic Free Energy and Aqueous Cavity Surface Area. //Proc. Nat. Acad. Sci. USA. 1974. V. 71. N 8. P. 2925-2927.

98. Hermann R.B. Theory of Hydrophobic Bonding. II. The Correlation of Hydrocarbon Solubility in Water with a Solvent Cavity Surface Area. // J. Phys. Chem. 1972. V. 76. N 14. P. 2754-2759.

99. Fukunishi Y., Suzuki M. Reproduction of the Potential of Mean Force by a Modified Solvent Accessible Surface Method. // J. Phys. Chem. 1996. V. 100. N 14. P. 5634-5636.

100. Pitarch J., Moliner V., Pascual-Ahnir J.-L., Silla E., Tunon I. Can Hydrophobic Interactions Be Correctly Reproduced by the Continuum Models? //J.Phys. Chem. 1996. V. 100. N 23. P. 9955-9959.

101. Rick S.W., Berne B.J. Free Energy of the Hydrophobic Interaction from Molecular Dynamics Simulation: The Effects of Solute and Solvent Polarizability. // J. Phys. Chem. B. 1997. V 101. N 49. P 10488-10493.

102. Chandler D., Andersen H.C. Optimized Cluster Expansions for Classical Fluids. II. Theory of Molecular Liquids. //J. Chem. Phys. 1972. V. 57. N5. P. 1930-1945.

103. Lue L., Blankschtein D. Liquid-State Theory of Hydrocarbon-Water Systems: Application to Methane, Ethane, and Propane.// J. Phys. Chem. 1992. V. 96. N 21. P. 8582.

104. Тихонов Д.А. Метод интегральных уравнений теории жидкости в исследовании сольватации сложных молекул: Дисс. .канд. физ.-мат. наук. Пущино: ИТЭБ РАН 1997.

105. Тихонов Д.А., Саркисов Г.Н. Метод атом-атомных корреляционных функций для исследования влияния неполярных цепочек на свойства воды как растворителя. // Журн. Физ. Химии. 1997. Т. 71. № 3. С. 480-484.

106. Тихонов Д.А., Цыганкова И.Г., Голованов И.Г. Метод RISM для оценок термодинамических характеристик гидратации молекул. //Журн. Физ. Химии 1999. Т.73. №10. С. 1824-1830.

107. Голованов И.Б., чл.- корр. Иваницкий Г.Р., Тихонов Д.А., Цыганкова И.Г. Оценки гидрофобных взаимодействий в комплексах молекул углеводородов в методе интегральных уравнений. // Доклады АН. 1999. Т. 365. № 2. С. 210-214.

108. Голованов И.Б., Тихонов Д.А., Цыганкова И.Г. Оценки гидрофобных взаимодействий в олигомерах углеводородов методом RISM // Журн. Физ. Химии. 2000. Т. 74. № 4. С. 675679.

109. Голованов И. Б. Тихонов Д.А., Цыганкова И.Г. Метод RISM для оценок гидрофобных внутримолекулярных взаимодействий удаленных групп. // Журн. Физ. Химии. 2000. Т. 74. № 5. С. 867-870.

110. Голованов И.Б., Цыганкова И.Г. Метод RISM для оценок термодинамических характеристик гидратации молекул насыщенных углеводородов. //Журн. Физ. Химии. 2000. Т. 74. № 5. С.863-866.

111. Cabani S., Gianni P., Molica V., Lepori L. Group Contributions to the Thermodynamic Properties of Non-ionic Organic Solutes in Dilute Aqueous Solution // J. Solut. Chem. 1981. V. 10. N8. P. 563-595.

112. Рид P., Праусниц Д.Ж., Шервуд Т. Свойства газов и жидкостей. Д., «Химия», 1982. 592 с.

113. Сталл Д., Вэстрам Э., Зинке Г. Химическая термодинамика органических соединений. М., «Мир», 1971.945 с.

114. Hilal S.H., Karickhoff S.W., Carreira L.A. Prediction of the Vapor Pressure, Boiling Point, Heat of Vaporization and Diffusion Coefficient of Organic Compounds.//QSAR & Comb. Sci. 2003. N 6. P. 565-574.

115. Татевский B.M. Химическое строение углеводородов и закономерности в их физико-химических свойствах. Москва. МГУ. 1953 г.

116. Антонов А.А., Маслов П.Г., Термодинамические свойства некоторых альдегидов, кетонов и карбоновых кислот. // Ж. Физ. Химии. 1964. Т.38. № 3. С. 600-605.1. R2 Wiener (1947)

117. Папулов Ю.Г., Виноградова М.Г. Исследование связи свойств веществ со строением молекул на основе феноменологической модели молекулы как системы взаимодействующих атомов.//Ж. Физ. Химии. 1996. Т. 70. № 6. С. 1059-1065.

118. Виноградова М.Г., Папулов Ю.Г., Смоляков В.М., Салтыкова М.Н. Корреляции структура-свойство с использованием теории графов. // Ж. Физ. Химии. 1996. Т. 70. № 4. С. 675-680.

119. Малышева Ю.А., Папулов Ю.Г., Виноградова М.Г., Ботов А.Б., Смоляков В.М. Свойство и строение органических молекул. I. Трехмерные топологические индексы алканов. // Ж. Структ. Химии. 1998. Т. 39. № 3. С. 484-492.

120. Малышева Ю.А., Папулов Ю.Г., Виноградова М.Г., Давыдова И.Г. Свойство и строение органических молекул. 2. Теоретико-графовое изучение алкенов и спиртов. // Ж. Структ. Химии. 1998. Т. 39. № 3. С. 493-499.

121. Гальбештрам Н.М., Баскин И.И., Палюлин В. А., Зефиров Н.С. Построение нейросетевых зависимостей структура-условие-свойство. Моделирование физико-химических свойств углеводородов. // Доклады АН. 2002. Т. 384. № 2. С. 202-205.

122. Жохова Н.И., Баскин И.И., Палюлин В.А., Зефиров А.Н., Зефиров Н.С. Расчет энтальпии сублимации методом QSPR с применением фрагментного подхода. // Ж. Прикладн. Химии. 2003. Т. 76. Вып. 12. С. 1966-1970.

123. Жохова Н.И., Палюлин В.А., Баскин И.И., Зефиров А.Н., Зефиров Н.С. Фрагментные дескрипторы в методе QSPR: применение для расчета энтальпии испарения органических соединений. // Ж. физ. Химии. 2007. Т. 81. № 1. С. 15-18.

124. Артеменко Н.В., Баскин И.И., Палюлин В.А., Зефиров Н.С. Прогнозирование физических свойств органических соединений при помощи искусственных нейронных сетей в рамках подструктурного подхода. // Доклады АН. 2001. Т.381. № 2. С. 203-206.

125. Ivanova А.А., Ivanov А.А., Oliferenko А.А., Palyulin V.A., Zefirov N.S. Highly diverse, massive organic data as explored by a composite QSPR strategy: an advanced study of boiling point. //SAR and QSAR Environ.Res. 2005. V. 16. N 3. P. 231-246.

126. Egolf M. L., Wessel M.D., Jurs P.C. Prediction of Boiling Points and Critical Temperatures of Industrially Important Organic Compounds from Molecular Structure. //J. Chem. Inf. Сотр. Sci. 1994. V. 34. N4. P. 947-956.

127. Stanton D.T. Development of a quantitative structure-property relationship model for estimating normal boiling points of small multifunctional organic molecules.// J. Chem. Inf. Сотр. Sci. 2000. V. 40. N1. P. 81-90.

128. Basak S.C., Gute B.D., Grunwald G.D. A Comparative Study of Topological and Geometrical Parameters in Estimating Normal Boiling Point and Octanol/Water Partition Coefficient. // J. Chem. Inf. Сотр. Sci. 1996. V. 36. N 6. P. 1054-1060.

129. Gakh A.A., Gakh E.G., Sumpter B.G., Noid D. W. Neyral Network Graph Theory Approach to the Prediction of the Physical Properties of Organic Compounds. // J. Chem. Inf. Сотр. Sci. 1994. V. 34. N4. P. 832-839.

130. Ericksen D., Wilding W.V., Oscarson J.L., Rowley R.L. Use of the DIPPR Database for Development of QSPR Correlations: Normal Boiling Point. // J. Chem. Eng. Data. 2002. V. 47. N 5. P. 1293-1302.

131. Cao Ch., Liu Sh., Li Zh. On Molecular Polarizability: 2. Relationship to the Boiling Point of Alkanes and Alcohols. // J. Chem. Inf. Сотр. Sci. 1999. V. 39. N 6. P. 1105-1 111.

132. Cao Ch., Yuan H. Topological Indices on Vertex, Distance, and Ring: On the Boiling Points of Paraffins and Cycloalkanes. // J. Chem. Inf. Сотр. Sci. 2001. V. 41. N 4. P. 867-877.

133. Katrtzky A.R., Lobanov V.S. Karelson M. Normal Boiling Points for Organic Compounds: Correlation and Prediction by a Quantative Structure-Property Relationship. // J. Chem. Inf. Сотр. Sci. 1998. V. 38. N1. P. 28-41.

134. Katrtzky A.R., Maran U., Lobanov V.S. Karelson M. Structurally Diverse Quantitative Structure -Property Relationship Correlations of Technologically Relevant Physical Properties. //J.Chem. Inf. Comput. Sci. 2000. V 40. N 1. P. 1-18.

135. Estrada E. Spectral Moments of the Edge Adjacency Matrix in Molecular Graphs. 2. Molecules Containing Heteroatoms and QSAR Applications. // J.Chem. Inf. Comput. Sci. 1997. V 37. N 2. P. 320-328.

136. Estrada E. Spectral Moments of the Edge Adjacency Matrix in Molecular Graphs. 3. Molecules Containing Cycles. // J.Chem. Inf. Comput. Sci. 1998. V 38. N 1. P. 23-27.

137. Estrada E., Guevara N., Gutman I.Extension of Edge Connectivity Index. Relationships to Line Grapf Indices and QSPR Applications.// J.Chem. Inf. Comput. Sci. 1998. V 38. N 3. P. 428-431.

138. Голованов И.Б., Иваницкий Г.Р., Цыганкова И.Г. Простая форма корреляционного соотношения и физико-химический смысл входящих в него параметров. // Доклады АН.1998. Т. 359. №2. С. 258-262.

139. Голованов И.Б., Цыганкова И.Г. Корреляционное соотношение структура-свойство. I. Описание подхода и оценки теплот испарения органических соединений различных классов. //Ж. Общ.Химии. 1999. Т. 69. Вып. 8. С. 1275-1282.

140. Golovanov I.B., Tsygankova I.G. Estimation of Physicochemical Properties from the Structure-Property Relationship: A New Approach. // QSAR & Comb. Sci. 2000. V. 19. N 6. P. 554-564.

141. Голованов И.Б., Цыганкова И.Г. Корреляционное соотношение структура-свойство. 11. Оценки некоторых физико-химических свойств молекул углеводородов. // Ж. Общ. Химии.1999. Т. 69. Вып. 12. С. 2019-2023.

142. Miller J.K. Calculation of the Molecular Polarizability Tensor. // J. Am. Chem. Soc. 1990. V. 112. N. 23. P. 8533-8551.

143. Дорфман Я.Г. Диамагнетизм и химическая связь М.: ГИФМЛ. 1961. 231 с. 13.

144. D.E. Needham, I-Ch. Wei, P.G. Seybold. Molecular Modeling of the Physical Properties of the Alkanes. // J. Am. Chem. Soc. 1988. V. 110. N 13. P. 4186-4194.

145. NIST Chemistry Webbook http://webbook.nist.gov/

146. CRC Handbook of Chemistry and Physics-, 74th ed. Special Student's Edition. CRC Press; 1993-1994; p3-12—3-523.

147. Tsygankova I.G. Combination of fragmental and Topological descriptors for QSPR Estimations of Boiling Temperatures//QSAR &Comb.Sci. 2004. V. 23. N 8. P. 629-636.

148. Tsygankova I.G. Estimation of Thermodynamic Properties of Organic Compounds Using Fragment-Based and Topological Descriptors. // Russ. J. Phys. Chem. 2005. V. 79. Suppl.l. P. S14-S17.

149. M.Randic, M. Pompe. The Variable Connectivity Index '%f versus the Traditional Molecular1 f

150. Descriptors: A Comparative Study of % Against Descriptors of CODESSA //J. Chem. Inf. Сотр. Sci. 2001 V. 41. N 3. P. 631-638.

151. K. Yamanouchi, M. Tanaka, Y. Tsuda, K. Yakogama, S. Awazu, Y. Kobayashi. Quantitative Structure in vivo Half-Life Relationships of Perfluorochemicals for Use as Oxygen Transporters. // Chem. Pharm. Bull. 1985. V. 33. N 3. P. 1221-1231 .

152. A. A. Woolf. Relative Boiling Points of Fluoro-ethers, Fluoroamines and Other Fluorocarbon Derivatives to Fluorocarbons. // J. of Fluorine Chemistry. 1999. V. 94 N 1. P. 4750.

153. T.M. Reed in Fluorine chemistry. V. 5.1964. Acad. Press. NY. London.Ed. by J.H. Simens. P. 133-136.

154. Т.Дж. Брик в кн. Фтор и его соединения, т.1 под ред. Дж. Саймонса. ИЛ. М. 1953 С. 355-383.

155. Leo, A. Calculating log Poct from Structures. // Chem. Rev. 1993. V. 93 N 4. P.1281-1306.

156. Mannhold, R.; Dross, K., Calculation Procedures for Molecular Lipophilicity: a Comparative Study. //Quant. Struct.-Act. Relat. 1996. V. 15. N P. 403-409

157. Meylan W.M., Howard P.H. Atom/Fragment Contribution Method for Estimating Octanol-Water Partition Coefficients.// J. Pharmaceut. Sci. 1995. V. 84. N 1. P.83-92.

158. Klopman G., Li J.-Y., Wang Sh., Dimayaga M. Computer Automated log P Calculations Based on an Extended Group Contribution Approach. // J. Chem. Inf. Comput. Sci. 1994. V.34. N4. P. 752-781.

159. Sedykh A.Y., Klopman G. A Structural Analogue Approach to the Prediction of the Octanol-Water Partition Coefficient. // J. Chem. Inf. Model. 2006. V. 46. N 4. P. 1598-1603

160. Eros D., Kovesdi I., Orfi, L, Takacs-Novak K. Acsady G., Keri G. Reliability of log P Predictions based on Calculated Molecular Descriptor: A Critical Review. //Curr. Med. Chem. 2002. V. 9. N20.1819-1829.

161. Makino M. Novel Classification to Predict Relative Gas Chromatographic Retention Times and n-Octanol/Water Partition Coefficients of Polychlorinated Biphenyls. // Chemosphere. 1999. V. 39. N6. P. 893-903.

162. Suzuki T. Development of an Automatic System for Both the Partition Coefficient and Aqueous Solubility. // J. Comp.-Aided Mol. Design. 1991. V. 5 N 1. P. 149-166.

163. Raevsky O.A., Schaper K.-J., Seydel J.K. H-bond Contribution to Octanol-Water Partition Coefficients of Polar Compounds. // Quant. Struct-Act. Relat. 1995. V 14. N 5 P. 433- 436.

164. Raevsky O.A. Molecular lipophilicity calculations of chemically heterogeneous chemicals and drugs on the basis of structural similarity and physicochemical parameters. //SAR QSAR Environ Res. 2001. V.12 N 4. P. 367-381.

165. Раевский О.А., Трепалина Е.П., Трепалин C.B. SLIPPER -новая программа для расчета растворимости, липофильности и липосомной проницаемости. Хим.-Фарм. Журнал. 2000. Т. 34. № 1. С. 34-37.

166. Wang R., Fu Y., Lai, L. A New Atom-Additive Method for Calculating Partition Coefficients. //J. Chem. Inf. Сотр. Sci. 1997. V. 37. N 3. P. 615-621.

167. Голованов И.Б., Иваницкий Г.Р., Цыганкова И.Г. Корреляция структура свойство. Коэффициент распределения молекул углеводородов в системе октанол - вода. //Доклады РАН. 1998. Т.359. № 3. С. 409-412.

168. Голованов И.Б., Иваницкий Г.Р., Цыганкова И.Г. Корреляция структура-свойство. Коэффициент распределения молекул различных классов органических соединений в системе октанол-вода. //Доклады РАН. 1998. Т.359. № 6. С. 823-827.

169. Голованов И.Б., Иваницкий Г.Р., Цыганкова И.Г. Влияние окружения на гидрофобность разных групп молекул биополимеров //Доклады РАН. 1998. Т. 360. № 1. С. 120-123.

170. Голованов И.Б., Цыганкова И.Г. Корреляционное соотношение структура-свойство.

171. I. Коэффициент распределения молекул органических соединений различных классов в системе октанол-вода. // ЖОХ. 2000. Т. 70. № 2. С. 223-229.

172. Голованов И.Б., Цыганкова И.Г. Корреляционное соотношение структура-свойство.1.. Коэффициент распределения гибких молекул углеводородов в системе октанол-вода. // ЖОХ. 2001. Т. 71. №4. С.538-544.

173. Голованов И.Б., Цыганкова И.Г. Корреляционное соотношение структура-свойство. V. Коэффициент распределения молекул, содержащих несколько полярных групп, в системе октанол-вода. // ЖОХ. 2001. Т. 71. № 5. С. 759-764.

174. Голованов И.Б., Цыганкова И.Г. Корреляционное соотношение структура свойство. VI. Доступные поверхности молекул углеводородов и простые методы их приближенной оценки. //Журнал общей химии. 2001. Т. 71. Вып. 6. С. 889-894.

175. Hermann R.B. Theory of Hydrophobic Bonding. III. A Method for the Calculation of the Hydrophobic Interaction Based on Liquid State Pertubation Theory and a Simple Liquid Model. // J. Phys. Chem. 1975, V. 79. N 2. P.163-169.

176. Chotia C. Hydrophobic Bonding and Accessible Surface Area in Proteins. // Nature. 1974. V. 248. N5446. P.338-339.

177. Lee В., Richards F.M. The Interpretation of Protein Structure: Estimation of Static Accessibility. //J. Mol. Biol. 1971. V. 55. N 3 P. 379-400.

178. Балабаев H.K. Методика моделирования динамики полимеров, в кн. Метод молекулярной динамики в физической химии. М.: Наука,1996. С.258-279.

179. Nagy P.J., Dunn W.J., Alagona G., Ghio С. Theoretical Calculations on 1,2-Ethanediol. Gauche-Trans Equilibrium in Gas-Phase and Aqueous Solution. //JACS. 1991. V. 113. N 18. P.6719-6729.

180. Oie Т., Topol J.A., Burt S.K. Burt S.K. Ab Initio and Density Functional Calculations on Ethylene Glycol.// J. Phys.Chem. 1994. V.98. N 4. P. 1121-1128.

181. Traetteberg M., Hedberg K. Structure and Conformations of 1,4-Butanediol: Electron-Diffraction Evidence for Internal Hydrogen Bonding. // JACS. 1994. V.l 16, N 4. P.1382-1387.

182. Fauchere, J.-L., Pliska, V. Hydrophobic Parameters к of Amino-acid Side Chains from Partitioning of N-Acetyl-Amino-acid Amides. // Eur. J. Med. Chem. 1983. V.18. N 4. P.369-375.

183. Голованов И.Б., Цыганкова И.Г. Корреляционное соотношение структура-свойство.

184. VIII. Оценки lg Р амидов карбоновых кислот и их N-ацетилпроизводных. // ЖОХ. 2001. Т. 71. №10. С. 1672-1676.

185. Голованов И.Б., Цыганкова И.Г. Корреляционное соотношение структура-свойство.1.. Оценки lg Р некоторых пептидов. // ЖОХ. 2002. Т. 72. № 1. С. 146-152.

186. Tao P., Wang R., Lai L. Calculating Partition Coefficients of Peptides by the Addition Method. // J.Mol. Modeling. 1999. V. 5. N 10. P. 189-195.

187. Цыганкова И.Г. Оценка коэффициента распределения пептидов в системе октанол-вода по корреляционному соотношению структура-свойство. // Ж. Физ. Химии. 2002. Т 76. №11. С. 2012-2014.

188. Edward J.T. Calculation of octanol-water partition coefficients of organic solutes from their molecular volumes. // Can. J. Chem. 1998. V.76. N 9. P. 1294-1303.

189. Циклодекстрины. Итоги науки и техники. Сер. Микробиология. Т. 20 ч. I. М.: ВИНИТИ, 180 с.

190. Connors К.A. Stability of Cyclodextrin Complexes in Solution. // Chem. Rev. 1997. V. 97. N5. P. 1325-1357.

191. Rekharsky M.V., Inoue Y.Complexation Thermodynamics of Cyclodextrins. // Chem. Rev.1998. V. 98. N5. P. 1875-1917.

192. Lipkowitz K.B. Application of Computational Chemistry to the Study of Cyclodextrins. // Chem. Rev. 1998. V. 98. N 5. P. 1829-1873.

193. Циклодекстрины. Итоги науки и техники. Сер. Микробиология. Т. 21. ч. И. М.: ВИНИТИ, 159 с.

194. Liu L., Guo Q.-X. Novel Prediction for the Driving Force and Guest Orientation in the Complexation of a- and p-Cyclodextrin with Benzene Derivatives. // J. Phys. Chem. (B).1999. V. 103. N 17. P. 3461-3467.

195. Cai W., Xia В., Shao X., Guo Q.-X., Maigret В., Pan Z. Molecular docking of a-cyclodextrin inclusion complexes by genetic algorithm and empirical binding free energy function. // Chem. Phys. Lett. 2001. V. 342. N 2. P. 387-396.

196. Caipignano, R.; Marzona, M.; Cattaneo, E.; Quaranta, S. QSAR Study of Inclusion Complexes of Heterocyclic Compounds with уб-Cyclodextrin. //Anal. Chim. Acta. 1997. V. 348, N1-3. P. 489-493.

197. Suzuki, T. A Nonlinear Group Contribution Method for Predicting the Free Energies of Inclusion Complexation of Organic Molecules with a- and /^-Cyclodextrins. //J. Chem. Inf. Comput. Sci. 2001. V. 41N 5. P. 1266-1273.

198. Katritzky A.R., Fara D.C., Yang Y., Karelson M., Suzuki Т., Solov'ev V.P., Varnek A. Quantitative Structure-Property Relationship Modeling of /2-Cyclodextrin Complexation Free Energies. //J. Chem. Inf. Comput. Sci. 2004. V. 44. N 2. P. 529-541

199. Жохова Н.И., Баскин И.И., Палюлин В.А., Зефиров А.Н., Зефиров Н.С. Фрагментные дескрипторы в QSPR: применение для расчета поляризуемости молекул.// Изв. РАН. Сер. Хим. 2003. № 5. С. 1005-1009.

200. Тулуб А.В. Физическая адсорбция. Принцип расчета энергии адсорбции органических молекул. // ЖСХ. 1983. Т. 24. № 4. С. 33.

201. Abraham М.Н. Scales of Solute Hydrogen-bonding: Their Construction and Application to Physicochemical and Biochemical Processes.// Chem. Soc. Rev. 1993. V. 22. № 2. P. 73-83.

202. Varghese J.N., McKimm-Breschkin J.L., Caldwell J.B., Korrt A. A., Collman P.M. The Structure of the Complex between Influenza Virus Neuraminidase and Sialic Acid, the Viral Receptor. // Proteins. 1992. V. 14. N 3. P. 327- 332.

203. Masuda Т., Shikuya S., Arai M., Yoshida S., Tomazawa Т., Ohno A., Yamashita M., Honda T. Synthesis and Anti-Influenza Evaluation of Orally Active Bicyclic Ether Derivatives Related to Zanamivir. // Bioorg. Med. Chem. Lett. 2003. V. 13. N 4. P.669-673.

204. Chand P., Kotian P.L., Morris P.E., Bantia S., Walsh D.A., Babu Y.S.Synthesis and Inhibitory Activity of Benzoic Acid and Pyridine Derivatives on Influenza Neuraminidase. // Bioorg. Med. Chem. 2005. V. 13. N 7. P.2665-2678.

205. Maring C.J., Stoll V.S., Zhao C., Sun M., Krueger A.C., Stewart K.D., Madigan D.L., Kati W., Xu Y., Carrick R.J., Montgomery D.A., Kempf-Grote A., Marsh K.C., Molla A., Steffy

206. Цыганкова И.Г., Женодарова C.M. Корреляционное соотношение структура-свойство для оценки активности ингибиторов нейраминидазы вируса гриппа. // Журнал общей химии. 2006. Т. 76. Вып. 10. С. 1688-1695.

207. Chem3D Ultra 9.0. CambridgeSoft, 2004.

208. Hansch С., Anderson S.M. The Structure-Activity Relationship in Barbiturates and Its Similarity to That in Other Narcotics. // J. Med. Chem. 1967. V. 10. N 5. P. 745-753.

209. Hsieh M.-M., Dorsey J.G. Bioavailability Estimation by Reversed-Phase Liquid Chromatography: High Bonding Density C-18 Phases for Madelling Biopartitioning Processes. // Analyt. Chem. 1995. V. 67. N 1. P. 48-57.

210. Cuenca-Benito M., Sargado S., Villanueva-Camanas R.M., Medina-Hernandez M.J. Quantitative Retention-Structure and Retention-Activity Relationships of Barbiturates by Micellar Liquid Chromatography. // J. Chromatogr. A. 1998. V. 814. N 1-2. P. 121-132.

211. Рука A., Kepczynska E., Bojarski J. Application of Celected Traditional Structural Descriptors to QSPR and QSAR analysis of Barbiturates. // Ind. J. Chem. Sect. A. 2003. V. 42A. N6. P. 1405-1413.

212. Wells M.J.M., Clark C.R., Patterson R. M.Correlation of Reversed-Phase Capacity Factors for Barbiturates with Biological Activities, Partition Coefficients, and Molecular Connectivity Indices/ // J. Chromatogr. Science. 1981. V. 19. N 11. P. 573-582.

213. Roca R.M.S., March F.G., Alvarez J.G., Domenech R.G. Prediction and Interpretation of Some Physico-Chemical and Biological Properties of a Group of Barbituric by the Molecular Connectivity Method/ // Anales de Quimica. 1992. V. 88. N 3. P. 382-389.

214. Стьюпер Э., Брюгер У., Джуре П. Машинный анализ связи химической структуры и биологической активности. М.: Мир, 1982. С.165.

215. Цыганкова И.Г., Женодарова С.М. Корреляционное соотношение структура -свойство для производных барбитуровой кислоты: возможности фрагментного подхода. //Журнал общей химии. 2007. Т. 77. № 5.

216. Балабаев Н.К., Голованов И.Б., Женодарова С.М., Иваницкий Г.Р., Цыганкова И.Г., Шноль Э.Э. // Горизонты биофизики. Пущино, 2003. С.206.

217. Голованов И.Б., Женодарова С.М. Эффект «горячих концов» и свойства органических соединений. качественное рассмотрение. //ЖОХ. 2005. Т. 75. Вып. 1. С. 82-88.

218. Дрейпер Н., Смит Г. Прикладной регрессионный анализ. М.: Финансы и статистика, 1986. Т.1Д.2. 366с., 351с.

219. Использован алгоритм Abdi, Н. 2003 http://www.utdallas.edu/~herve/

220. Иваницкий Г.Р., Воробьев С.И. Кровезаменитель перфторан. // Вестник РАН. 1997. Т. 67. № 11. С. 998-1013.

221. Иваницкий Г.Р., Воробьев С.И., Деев А.А. "Жизнь " перфторуглеродной эмульсии. В сб. "Физиологическая активность фторсодержащих соединений (эксперимент и клиника). Ред. С.И. Воробьев и Г.Р. Иваницкий. Пущино. 1995. С. 5-32.

222. R.E. Moore, U.C. Clark,Jr. Oxygen Carrying Colloidal Blood Substitutes. Eds. Beisbarth H., Stosseck K. Munchen. 1981. P.50-60.

223. Riess J.G. Highly Fluorinated Systems for Oxygen Transport, Diagnosis and Drug Delivery. // Colloids and Surfaces A: Physicochem. and Engineering aspects. 1994. V. 84, N 1, P. 33-48.

224. Голованов И.Б., Иваницкий Г.Р., Цыганкова И.Г., Хабарова М.И. Корреляционное соотношение структура-свойство. Оценки периода полувыведения для перфторорганических соединений. //Доклады РАН. 2000. Т. 371. № 6. С.823-828.1. Благодарности

225. Автор выражает особую признательность Софии Мустафиничне Женодаровой за постоянное внимание и неоценимую помощь при проведении исследований и написании диссертации.

226. На разных этапах работы очень полезными и вдохновляющими были обсуждения с Эммануилом Эльевичем Шнолем, Людмилой Владимировной

227. Якушевич, Гарри Николаевичем Саркисовым. Всем им автор приносит искреннюю благодарность. Автор благодарит за дружескую поддержку иучастие сотрудников лаборатории: Ольгу Алексеевну Смолянинову, Манефу

228. Ивановну Хабарову!, Веру Павловну Клягину, Эльвиру Андреевну Седельникову. Немалое значение для завершения работы имела помощь многих друзей и членов семьи, за что им огромное спасибо.