Бесплатный автореферат и диссертация по биологии на тему
Компьютерный анализ взаимосвязи структура-активность/ свойство в семействах родственных и мутантных белков
ВАК РФ 03.00.03, Молекулярная биология

Автореферат диссертации по теме "Компьютерный анализ взаимосвязи структура-активность/ свойство в семействах родственных и мутантных белков"

На нравах рукописи

Иванисенко Владимир Александрович

КОМПЬЮТЕРНЫЙ АНАЛИЗ ВЗАИМОСВЯЗИ СТРУКТУРА-АКТИВНОСТЬ/СВОЙСТВО В СЕМЕЙСТВАХ РОДСТВЕННЫХ И МУТАНТНЫХ БЕЛКОВ

03.00.03 - молекулярная биология

Автореферат

Диссертации на соискание ученой степени кандидата биологических наук

Кольцове, 1998

Работа выполнена в Научно-исследовательском институте молекулярной биологии Государственного научного центра вирусологии и биотехнологии «Вектор»

Научный руководитель:

кандидат биологических наук А. М. Ерошкин, ГНЦВБ «Вектор»

Официальные оппоненты: доктор биологических наук, профессор

С. Н. Щелкунов

кандидат технических наук В. А. Жуков

Ведущая организация: Институт цитологии и генетики СО

РАН, г. Новосибирск

Защита диссертации состоится «¿¿1» луУгУг.^'!/ ■? 1998 г. в и часов на заседании диссертационного совета Д 074.20.01 Государственного научного центра вирусологии и биотехнологии «Вектор». 633159 Новосибирская обл. п.г.т. Кольцове

С диссертацией можно ознакомиться в библиотеке Государственного научного центра вирусологии и биотехнологии «Вектор».

Автореферат разослан

«20»

'е^СС- 1998 г.

Ученый секретарь диссертационного совета

/Т. Н. Шубина/

Актуальность проблемы. Проблема взаимосвязи структуры и функции биологических молекул всегда была центральной в молекулярной биологии. Для белков эта взаимосвязь наиболее интересна и, по-видимому, наиболее сложна. Исследование такой взаимосвязи не может быть ограничено каким-либо одним методом или подходом. Наряду с классическими задачами: классификация последовательностей, построение филогенетических деревьев, предсказание вторичных и третичных структур и т. д., - все более актуальной становится задача поиска закономерностей, связывающих структуру белка с его биологической активностью или свойствами. Наличие информации о структуре и расположении функционально важных районов в белках не дает полного понимания причин, определяющих варьирование значений активности у различных белков со сходными структурой и функцией. Актуальность проблемы взаимосвязи структура-активность в первую очередь связана с тем, что данный анализ позволяет получить такую информации.

Развитие методов генной инженерии привело к быстрому накоплению информации о структуре и биологической активности многих белков. Ведутся интенсивные работы по созданию модифицированных форм белков, обладающих улучшенными медико-биологическими характеристиками. Такие работы, как правило, требуют больших затрат и часто осуществляются методом проб и ошибок. Создание теоретических методов анализа взаимосвязи структура-активность позволит выявлять районы, важные для активности белков и рационально планировать белково-инженерные эксперименты.

Пель настоящего исследования заключалась в разработке методов, позволяющих а) устанавливать взаимосвязь структура-активность в семействах гомологичных белков; б) исследовать структурно-функциональную организацию важных для медицины и биотехнологии белковых семейств и в) планировать белково-инженерные эксперименты по направленному изменению их свойств.

При этом решались следующие задачи:

1. Разработка алгоритмов автоматической генерации и проверки гипотез о связи между биологическими свойствами белков н физико-химическими характеристиками сайтов в выровненных последовательностях или третичной структуре белков с использованием множественного линейного регрессионного и канонического дискриминантного анализа.

2. Разработка метода оценки корреляций между активностью гомологичных белков и аминокислотными заменами в непрерывных и пространственных сайтах.

3. Разработка алгоритма поиска мотивов в комбинаторных библиотеках пептидов, связанных со способностью данных пептидов имишровагь антигенные эшпопы белков

4. Создание компьютерных программ, реализующих разработанные методы и алгоритмы

5 Поиск модулирующих активность районов и их сопоставление с известными функциональными участками в белках на примере пяти семейств (дезинтегрнны. интерфероны-а человека, люциферазы жуков, белки М2 вируса гриппа А, ингибиторы протеиназ).

6 Анализ взаимосвязи между структурой и активностью фактора некроза опухолей человека. Планирование мутаций, целенаправленно меняющих биологические свойства этого белка.

7. Анализ взаимосвязи между структурой и свойством пептидных фрагментов, встроенных в основной белок оболочки бактериофагов М)3, fl и fd.

8. Локализация группоспецифнческого, гемагглютинирующего эпнтопа гликопротеина Е2 альфавирусов по данным анализа фаговой комбинаторной библиотеки пептидов.

Теоретическая и практическая ценность. Разработанные в настоящей работе методы и полученные результаты могут быть использованы в дальнейшем для теоретического и экспериментального исследования структурно-функциональной организации глобулярных белков, при планировании экспериментов по белковой инженерии. Предложенные мутации, снижающие цитотоксическую активность п обеспечивающие пролонгированное действие фактора некроза опухолей человека, могут быть использованы при создании новых эффективных противоопухолевых лекарственных препаратов, а данные по локализации группоспецифического, гемагглютинирующего эпитопа гликопротеина Е2 альфавирусов - при создании средств профилактики и диагностики вызываемых этими вирусами заболеваний.

Методы исследования. Для множественного выравнивания белковых семейств использовался метод и программа CLUSTALV (Higgins & Sharp, 1989). Предсказание вторичной структуры белка Е2 VEE проводилось методом PHD (Rost & Sander, 1994). Все результаты анализа взаимосвязи структура-активность в семействах гомологичных белков и планирования экспериментов по белковой инженерии получены с использованием методов и алгоритмов программы ProAnalyst (Иванисенко и Ерошкин, 1997).

Научная новизна. Впервые предложен метод оценки максимально достижимого значения корреляции между совокупностью всевозможных характеристик анализируемого сайта во множественном выравнивании гомологичных белков и биологическими свойствами данных белков.

Разработаны методы количественного анализа взаимосвязи структура-активность/свойство в семействах родственных или мутантных белков с использованием множественного линейного регрессионного и канонического дискриминантного анализа. Впервые на основе данных методов разработана программа, позволяющая проводить комплексные исследования по взаимосвязи структура-активность белков и планированию замен, направленно меняющих биологические свойства белков. В отличие от существующих программ данная программа реализует многостадийную компьютерную технологию анализа взаимосвязи структура-активность

Впервые проведено исследование распределения во множественном выравнивании гомологичных белков корреляций структура-активность, обладающих максимально достижимыми значениями для анализируемого семейства На примере пяти белковых семейств показано, что сайты и отдельные позиции, замены в которых, коррелируют с активностью белкой (или фенотнпическими признаками организмов), располагаются в функционально или структурно важных районах данных белков либо рядом с ними

Впервые обнаружено, что цитотоксическая активность фактора некроза опухолей линейно коррелирует с изменениями индексов ß-поворота и изоэлектрической точки аминокислот в функционально важной петле, а растворимость мутантных форм белка в клетках К. coli коррелирует с изменениями физико-химических и структурных характеристик аминокислот

Впервые обнаружена связь между способностью к сборке вирусных часшц бактериофагов M13, fl и fd и наличием положительно зарчженнык аминокислот во встроенных участках оболочечных белков

В результате анализа данных по фаговой комбинаторной библиотеки пептидов найдены участки возможной локализации группоспецифического, гемагглютинируюшего эпитопа гликопротеина Е2 альфавирусов. Предложена модель пространственной упаковки участка гликопротеина Н2. Полученные результаты являются новыми

Публикации По теме диссертации опубликовано 6 ст ».тем в рецензируемых и маниях и 4 тезисов докладов на Международных и Российских конференциях

Структура работы. Работа состоит из Введения, пяти Г лаз, Выводов и Примечаний. В конце каждой главы приводится заключение с кратким анализом результатов и основными выводами данной части исследования Работа изложена на N4 страницах машинописного текста, содержит 22 рисунка и 21 таблицу Список цитируемой литературы состоит из 15S ссылок-

Апробация работы. Материалы исследования докладывались на II Конгрессе «Человек и лекарство» (Москва, 1995), на 24-й Конференции «ВюМЬгпиигсз - виисште» (Иерусалим, Израиль, 1996), на Втором Сибирском Конгрессе по Прикладной и Индустриальной Математике (Новосибирск, 1996).

Содержание работы

Во введении обосновывается актуальность диссертационного исследования, формулируются его цели и задачи.

Глава 1 содержит обзор литературы по существующим в настоящее время методам и подходам к проблеме анализа взаимосвязи между структурой и биологическими свойствами белков. Приводится классификация существующих методов и анализ их достоинств и недостатков, как они представляются автору. В заключении формулируются задачи, решение которых, по мнению автора необходимо для развития эффективных компьютерных средств анализа взаимосвязи структура-активность белков.

Глава 2 посвящена описанию и обсуждению предложенных методов и компьютерной системы РгоАпа1уй (%:/ЛиЫо.Ыо.шШапа.е4и/пю1ЫаЛЬтрс/рапа1у$1.ехе), предназначенной для анализа взаимосвязи структура-активность в семействах родственных белков и планирования аминокислотных замен, направленно меняющих активность белков. Разработанная нами технология анализа взаимосвязи структура-активность включает в себя последовательную реализацию двух этапов: 1) поиск сайтов, содержащих важные для активности замены во множественном выравнивании гомологичных белков; 2) установление статистической связи между физико-химическими характеристиками этих сайтов и активностью анализируемых белков. Для установления вида зависимости между структурой и численными значениями активностей белков в программе используется линейный множественный регрессионный анализ, а в том случае, когда белки сгруппированы по свойствам, то используется канонический днскриминантный анализ. Программа позволяет анализировать три типа сайтов: линейные, дискретные и пространственные. Линейные сайты в последовательностях строятся с использованием подвижного окна фиксированной длины. Дискретные сайты, состоящие из нескольких удаленных позиций, строятся путем объединения остатков некоего, заданного пользователем, "фиксированного" сайта и остатков подвижного окна. Пространственные сайты могут задаваться двумя способами: используется подвижная сфера фиксированного радиуса с центром либо в С0, либо Са атомах. В сайт включаются все аминокислотные остатки, чьи СР или Са атомы (соответственно способу построения) попадают в данную сферу. По

первичной структуре белков рассчитываются пять типов характеристик сайта, зависящих от свойств аминокислот: 1) усредненное значение свойств всех остатков, входящих в соответствующий участок полипептидной цепи, 2) наименьшее значение среди свойств остатков, 3) наибольшее значение среди свойств остатков, 4) разницу между наибольшим и наименьшим значением и 5) моменты физико-химических свойств аминокислот. Для расчета моментов используется формула, предложенная Эйзебергом (Eisenberg et al., 1984). Характеристики пространственных сайтов рассчитываются двух типов. Первый тип - это характеристики аналогичные линейным сайтам, рассчитываемые исключительно на базе свойств аминокислот сайта. Для расчета момента свойств аминокислот пространственного сайта разработан показатель (SM - spatial moment): v

SM =

■if у г*

ЪРМ АЪпу,

./=1 J

+

IL PA

0)

гдеPu i - 1, 2,... J*f значение некоего свойства /-го остатка пространственного сайта, включающего N аминокислот, х,, у,, z, - координаты Ca атома /'-го остатка, взятые относительно геометрического центра масс пространственного сайта.

Другой, совершенно иного типа характеристикой пространственного сайта, взята потенциальная энергия дальних взаимодействий аминокислот в пространственной структуре белка (Crippen & Viswanadhan, 1984).

Для поиска позиций, содержащих функционально важные замены во множественном выравнивании гомологичных белков, разработан новый коэффициент корреляции структура-активность. Пусть п белков делятся на m групп по совпадению используемых в регрессионной модели физико-химических характеристик заданного сайга, тогда максимум R2, достижимый при этих данных, есть (Дрейпер и Смит, 1986)

£±(У,~У,)г Мах R* --(2)

¿<П -Г Г '

где Уц - активностьJ-го белка из /-й группы, у , - среднее значение активности белков в /-й группе, П/ - число белков в i-й группе, i* - активность к-го белка.

Рассмотрим теперь линейный сайт, как "слово" в некоем алфавите. Если определить порядок расположения аминокислот для дискретных и пространственных сайтов по возрастанию номера позиции, то такие сайты также могут быть описаны словами. Группируя белки таким образом, чтобы в каждой группе слова были одинаковы, получим набор по-

игорных опытов. Повторными опытами для сайта будут все белки, принадлежащие одной группе. Таким образом, если в расчетах Max R3 воспользоваться группировкой белков по совпадению слов, то будет получена оценка максимально достижимой корреляции между активностью набора белков и совокупностью всевозможных характеристик аминокислот заданного сайта. Данная корреляция нами была названа SADC (Structure-Activity Determination Coefficient). SADC решает проблему оценки корреляции структура-активность в случаях, когда зависимость между физико-химическими характеристиками сайта и активностью белков имеет сложный нелинейный вид; 'а также когда важные для активности характеристики сайта не могут быть в явном виде выражены через свойства аминокислот.

SADC является корреляцией между активностью белков и совокупностью всевозможных характеристик заданного сайга только при использовании невырожденного или базового аминокислотного алфавита. В случае алфавита, построенного на некой группировке аминокислот, SADC выражает степень связи между активностью белков и совокупностью только тех характеристик сайта, в которых заложены свойства аминокислот, коррелирующие с этой группировкой. Следует отметить, что при увеличении размера сайта значение корреляции будет возрастать или оставаться неизменным, что связано с увеличением числа анализируемых групп белков.

Результаты анализа взаимосвязи структура-активность используются в программа-дня моделирования модификаций заданного белка из числа анализируемых. Идея предложенного подхода к моделированию модификаций состоит в том, чтобы предсказывать замены, которые с одной стороны не нарушали бы правильной упаковки белка, а с другой стороны обеспечивали изменение активности в заданном направлении. Для оценки эффектов замен на структуру необходима обучающая выборка, состоящая из двух групп белков, имеющих замены в анализируемом сайте - это белки с сохраненной и нарушенной структурой. По обучающей выборке производится поиск ключевых для структуры физико-химических характеристик аминокислот. Схема моделирования аминокислотных замен состоит из трех последовательных этапов. На первом этапе программа генерирует в заданных позициях аминокислотные замены и насчитывает соответствующие физико-химические характеристики анализируемых сайтов. На следующих этапах для каждого смоделированного мутанта с использованием полученных статистических моделей рассчитываются показатель структурной допустимости замены и величена активности. В качестве показателя структурной допустимости замены используется расстояние Махалано-

биса, по значениям которого пользователь может отнести мутант к одной из двух групп обучающей выборки.

Важным этапом анализа комбинаторных пептидных библиотек, полуденных в результате аффинной селекции фагов на моноклональных или поликлональных антителах, является идентификация мотивов при сравнении пептидов между собой и с белком-антигеном, к которому получены антитела. С этой целью был разработан алгоритм поиска мотивов в комбинаторных пептидных библиотеках и соответствующий ему компьютерный блок в программе РгоАпа^. Разработанный алгоритм позволяет находить мотивы (с использованием различных алфавитов аминокислот) и систематизировать их по частоте встречаемости, длине и числу совпадающих букв. Для этой цели задаются симметричная матрица сходства аминокислот с элементами 1 или 0 (1 для близких аминокислот), минимальная и максимальная длина паттернов, а также максимально допустимое число несовпадающих букв.

Глава 3 посвящена исследованию распределения в множественном выравнивании

Таблица 1.

Результаты корреляционного анализа структура-активность пяти белковых семейств.

Семейство Сайт Корреляция SADC (%) Функциональная значимость

Тип Позиции

Люциферазы жуков-щелкунов Дискретный 223,224,247,351, 352 99,5 Wood et al., 1989

Дезинтегрины Линейный, дл. 1 68 22 73 59 Dennis, 1993 Не известна

Гибриды 1РК-а Линейный, дл 1 22,26, 27 87 Weber et al., 1987

Гибриды ИТ^-а" Линейный, дл. 1 121, 125, 132 84 Weber et al., 1987

Природные а*" Линейный, дл. 5 22-26 75-79 85-99 150-154 77 1 67 60 60 Uze et al., 1995 « « «

Пространствен- \ 14, 15, 17-22, 152, нын 155, 156. 150 96 Seto et al., 1995, DiMarcoetal., 1994

Ингибиторы про-теиназ ! о.Ю.11,16,17 Линеинын, дл. 11 36 ! " 25 88 so 80 Chen, 1983 « Не известна

Белки М2 вируса гриппа А Линейный, дл. 7 25-31 50-60 100 75 Duff et al., 1994 Не известна

Примечания: значения v^ биолюминесценции лоцифераз жухов-щелхунов Pyrophorus plagiophlkalamus взяты из работы (Wood et al., 1989);. данные по инптбирующе'З активности 16-ти белков семейства дезшггегринов быта любезно предоставлены А С. ТЧргисвыч и А В. Татарикцсвым (Московский Университет); данные по противовирусной активности гибридных <|юрм IFN-al, IFN-a2 человека (Weber et al., 1987); данные по природным IFN-a (Fish et al., 1989); ланные по ниги0нр>юшей зктивчости белков семейства ингибиторов протекназ Kunitz (Dufton, 1985); погледсвтгльности белков М2 «¡rpvea гритша А из штаммов, резистентных (21 белок) и чувствительных (30 белков) к ремантадину и амантаднну бы in .иобезио предоставлены О.И. Киселевым (Институт Гриппа. Санкт-Пстсрсчрг) Прсэто ччф^скач tLN-4 измерялась in vitro it - клетки

•[стозека W!S4 - вирус MEVGO '4 - клетки "s mi L9:> - MENGO. tttOt- клетки человекаT98G - вирус ! MCV

гомологичных белков корреляций структура-активность, обладающих максимально достижимыми значениями для анализируемого семейства. Анализ пяти белковых семейств проводился с использованием профилей вАБС. Профили строились по линейным дискретным и пространственным сайтам. В табл. 1 представлены районы во множественном выравнивании белков, соответствующие пикам на профилях корреляций.

В результате анализа было показано, что сайты и отдельные позиции, замены в которых коррелируют с активностью белков, располагаются в функционально или структурно важных районах данных белков либо рядом с ними. Полученный результат хорошо согласуется с известным утверждением о функциональной роли локального окружения активных центров и свидетельствует об адекватности предложенных методов.

Для семейства люцифераз жуков-щелкунов был проведен дополнительный анализ по поиску линейной зависимости между активностью белков (величиной биолюминесценции) и физико-химическими характеристиками участков 223-224, 247, 351-352 (табл. 1). В табл. 1 показано, что только на данных участках вариация аминокислот наилучшим образом объясняет изменения активностей в семействе этих белков. А также максимально достижимое

значение квадрата

множественного коэффициента корреляции не может превышать 99,5%. С использованием множественного линейного регрессионного анализа была обнаружена корреляция между активностью белков и молекулярной поляризуемостью аминокислот данных участков (рис. 1). Зависимость имеет следующие статистические параметры: ^-статистика = 1047, Я = 99.57%, Я2 = 99.14%, Ущ,, = 1,92л + 2,14Рг + 0,28Рз + 158,8, где Р\, Гг. Рг - величины поляризуемости на участках 223-224, 247, 351-352, соответственно. Значение Я2 практически достигает предельного,

1С2 Уав, «^'(экспериментальная)

Рве. 1. Зависимость бволюшшесценцжя дюцвфераз жугммпниуво« от «едчены моаекудцмой поаирюуе-шхггя на учаспах 223-224,247,331-352. Рисунок выполнен программой РгоАга1у«.

что подтверждает применимость данной модели к объяснению зависимости Vmax от величины поляризуемости.

Глава 4 посвящена изучению взаимосвязи между структурой и биологическими свойствами фактора некроза опухолей человека (ФНО-а) и планированию аминокислотных замен, направленно меняющих активность этого белка. В исследовании ФНО-а нами решались следующие задачи: а) поиск функционально важных районов по литературным данным об эффектах мутаций на цитотоксическую активность белка в культуре клеток L929, б) поиск взаимосвязи между физико-химическими характеристиками аминокислот таких участков и растворимостью белка в цитоплазме клеток Kcoli (определение структурно допустимых замен), в) поиск взаимосвязи между физико-химическими характеристиками аминокислот выбранных участков и цитотоксической активностью белка (построение модели структура-активность) и .г) предсказание на основе моделей структура-активность замен в ФНО-а человека, снижающих цитотоксическую активность в культуре клеток L929 или обеспечивающих пролонгированное действие препарата.

Анализ литературных данных показал, что наиболее сильный эффект на цитотоксическую активность имели мутации в трех разных участках (31-34, 143-148 и 117-119, соответственно). Первые два района являются поверхностными участками в третичной структуре белка, их можно рассматривать как относительно лабильные петли, находящиеся на границе раздела субъединиц тримера (рис. 2). Аминокислоты, входящие в последний район находятся во внутреннем гидрофобном ядре и участвуют в гидрофобных связях между субъединицами. Функциональная важность этих участков предполагается и другими авторами (Ostade et al., 1994).

Известно, что действию протеолитических ферментов подвержены в первую очередь сайты, содержащие аминокислотные остатки Lys и Arg, расположенные в гибких петлевых и нерегулярных участках поверхности белка. В качестве кандидатов для замен были выбраны Arg31 и Arg" находящиеся вне ß-тяжен и попадающие в функционально важный район, тем более, что замены в этих позициях могут обеспечить двойной эффект - снижение токсичности белка и его защиту от действия протеолитических ферментов. В этом vxe районе (позиции 31-34) мы выбрали еще одну аминокислоту для мутагенеза Ala33. В участке 143-148 была выбрана мутация Phe в положении 144. Эта позиция вариабельна в родственных белках ФНО-а и, поэтому, мутация имеет меньшую вероятность нарушить третичную структуру белка по сравнению с заменами в консервативных позициях этого района.

Субъединица 1

I

Субъединица 3

Рис 2. Схематичное изображение третичной структуры фактора некроза опухолей человека в двух проекциях: а-вид сверху, б-вид сбоку. Шариками показаны атомы, входящие в состав изменяемых аминокислот белка R31, R32, А33, I118, F1", лентами изображены (5-тяжи. Рисунок выполнен программой WebLab Viewer.

По этой же причине для мутаций в районе 117-119 был выбран Не1". Эта позиция интересна еще тем, что ранее в ней не делались мутации.

Данные, которыми мы располагали, показывали, что в выбранных районах (31-34, 143-148 и 117-119) часть мутаций приводила к потере растворимости белков в цитоплазме клеток Е coli. Одной из причин нерастворимости мутантов, на наш взгляд, могло быть изменение гидрофобности белков, связанное с нарушениями упаковки белковой молекулы. Поскольку, потеря растворимости этих мутантов могла быть связана с нарушением структуры, то ставилась цель исключать такие варианты при моделировании замен. Для оценки структурно допустимых замен определялись характеристики сайтов, по значениям которых можно наилучшим образом разделить группу нерастворимых мутантов от растворимых белков (для этих целей использовался канонический дискриминантный анализ). К сожалению, мы не располагали данными по мутациям в районе 143-148, которые приводили бы к получению белков, с нарушенной третичной структурой или же, нерастворимых в клетках бактерий. Поэтому анализ свойств аминокислот данного района не проводился. Поиск канонической дискриминантной функции проводился для одно- и двух-факторной модели. Результаты расчетов ранжировались по возрастанию Л-статистики Уилкса. Наилучшим считался результат с наименьшим значением Л-сгатистики. Статистическая значимость оценивалась с помощью распределения-);2 Л-статистики.

Таблица 2

Показатели качества дискриминации растворимых белков от нерастворимых Статистический показатель | а [ б | в | г

Коэффициент канонической

корреляции ("'о) 47 54 56 63

Л-статистика Уилкса 0.78 0.71 0.68 0.6

X*-статистика 5.0" 6.8' 7.1* 9.2*

Степени свободы 1 2 1 2

Примечания.

а) — участок 31-35. частота встречаемости аминокислот а р-сгруктурзх; б) — статистическая значимость дм участка 31-35 совокупности дву* свойств аминокислот: частоты встречаемости в р-структурах и окружающей гидрофобности в р-поворотах; в) — статистическая значимость для участка 117-119 объема аминокислот, г)статистическая значимость для участка 117-119 совокупности объема с окружающей пцрофобно-стью в Р-структурах; # —соответствует более чем 95% уровню доверия; * —соответствует более чем 99% урозию доверия.

Для сзйта 31-35 было найдено, что в случае однофакторной модели наибольшей дискриминирующей способностью обладает группа свойств аминокислот, связанная со структурными характеристиками данного участка. Это индексы а-спирали, р-структуры и 3-поворота, характеризующие гибкость петли. Наилучшей среди них была частота встречаемости амииокмелот в р-структурах. Коэффициент корреляции данной характеристики с

делением белков на две группы (группа растворимых и нерастворимых) был статистически значим и составил 47% (см. табл. 2). Оказалось, что з нерастворимых белках многие замены были на аминокислоты часто встречающиеся в Р-структурах, которые могли нарушать структуру петли в данном районе. При поиске дискриминантной функции с одновременным учетом двух характеристик сайта обнаружилось, что вторым фактором, за исключением струетурных параметров, является гидрофобность (табл. 2). В группе нерастворимых белков гидрофобность аминокислот сайта оказалась выше по сравнению с растворимыми белками. Возможно, что в связи с нарушением вторичной структуры в данном участке нерастворимые белки имеют измененную упаковку.

Анализ замен во внутренней части белковой молекулы (позиции 117-119) показал, что растворимость мутантов главным образом связана с объемом аминокислот этого участка. Корреляция с объемом была статистически значимой и имела наибольшее значение по сравнению с другими свойствами аминокислот (см. табл. 2). Второй характеристикой, улучшающей качество дискриминации двух групп, оказалась окружающая гидрофобность в р-складках. Корреляция растворимости мугакгоз с совокупностью этих двух свойств достигла 63%. Значения структурных коэффициентов для объема и гидрофобности были равны 0.89, и -0.46, соответственно. Из различий значений данного коэффициента следует,

что изменение объема аминокислот имело более существенное влияние на растворимость мутантов. Действительно, остатки сайта находятся на месте наибольшего сближения двух Р-тяжей (рис. 2). Весьма вероятно, что боковые цепи этих аминокислотных остатков участвуют в стабилизации такого расположения Р-структур, и изменения объема (а также гидрофобности) боковых радикалов при заменах приводит к частичному нарушению пространственной структуры белка и образованию нерастворимых агрегатов.

Теоретическая

Экспериментальная Рис. 3. График корреляции (11=0.83) между экспериментально измеренной и теоретически предсказанной цитотоксичсской активностью мутантов ФНО-а (взят логарифм отношения активности мутанта к активности белка дикого типа).

1.1

Для мутантных белков с заменами в районе 31-34 были определены численные значения щгтотоксической активности (Оз1а(1ее1 а1., 1994). К сожаление, мы не располагали достаточным для проведения анализа количеством данных по другим выбранным районам. Поэтому, анализ свойств аминокислот, влияющих на цитотоксическую активность ФНО-а, проводился только для района 31-34. Поиск взаимосвязи между структурой и активностью мутантных белков осуществлялся с использованием линейного регрессионный анализа. При анализе различных свойств была обнаружена статистически значимая корреляция (11=0.83) с комбинацией трех параметров аминокислот (см. рис. 3). Уравнение регрессии имеет следующий вид: У=-10,9 Х1-0.3 Хг+18,7 Хз+19, (3) 'где У расчетные значения активности, а Х1 - Р-поворот Чоу-Фасмана, Х2 - изоэлектриче-ская точка Богарда, Хэ - положительный заряд аминокислот района 31-34. Значение Р-статистики для проверки нулевой гипотезы равно 7,67, что соответствует уровню доверия более чем 99%. 95% доверительные интервалы для свободного члена уравнения регрессии равны (9,7, 28), а для коэффициентов (-16,6, -5,1), (-0,4, -0,1), (9,7, 28), соответственно. Как следует из уравнения (3) цитотоксическая активность белка возрастает с увеличением положительного заряда аминокислот, а убывает с увеличением р-поворота Чоу-Фасмана и изоэлектрической точки Богарда.

Следующей задачей, связанной с планированием мутаций был выбор аминокислот, удовлетворяющих найденным закономерностям. Смоделированные мутации классифицировались по растворимости и цитотоксической активности белков. Замены, не нарушающие целостность структуры ФНО-а, выбирались с использованием обобщенного расстояния Махаланобиса, позволяющего по значениям характеристик сайта отнести каждую модификацию к группе растворимых либо нерастворимых белков. Для оценки цитотоксической активности мутантных белков с заменами в участке 31-34 использовалось полученное выше уравнение регрессии (3). Исходя из результатов классификации мутаций в позициях 31 и 32, были выбраны замены и ^'-0. Расстояние Махаланобиса до группы растворимых белков'составило 0,03 и 0,09, а цитотоксическая активность -1,75 и 0,34. соответственно. Аналогичные расчеты были проведены и для позиции 33. Замены А13-Я и А^'-Я оказались очень близкими к группе растворимых белков (с точностью до округления расстояние Махаланобиса равно нулю). Однако, цитотоксическая активность первого варианта ниже (-1,55), поэтому для экспериментальной реализации была выбрана замена При анализе свойств участка 117-119, влияющих на растворимость белков было обнаружено, что ключевым из них является объемом аминокислот. С целью проверки такой зависимо-

сти по результатам классификации мутаций в позиции 118 были выбраны два варианта. Один из них (11|8-М) взят как вариант, в котором замещающая аминокислота Met близка по объему к Не, другой (111!-А), как отрицательный контроль, в котором замещающая аминокислота Ala сильно отличается по объему от Не. Таким образом, для экспериментальной реализации рекомендованы были следующие замены: Arg11 на Gin, Arg12 на His, Ala33 на Ser, Не"8 на Met, Не"8 на Ala и Phe144 на Leu.

Часть предложенных нами мутаций ФНО-а была экспериментально реализована в московском институте биоорганической химии (мутанты RJ2-H, A33-S, l"8-M, Ill8-A, F,44-L, а также двойной мутант R32-H-F144-L, Шингарова и др., 1996), а мутант R31-Q во ВНИИ МБ "Вектор" (Корепанова и др., 1994). Там же были протестированы свойства, полученных мутантных белков. Полученные этими авторами результаты экспериментального исследования биологических свойств мутантных белков позволяют провести их сравнение с данными компьютерного прогноза.

Все полученные мутанты, за исключением двух, синтезировались в клетках Е. coli как растворимые белки. Мутант F144-L по утверждению авторов оказался лишь частично растворимым в цитоплазме бактерий. По всей видимости, замена ароматического фениль-ного остатка на изопропильный нарушает гидрофобные взаимодействия в С-концевой части мономера ФНО-а, что затрудняет сворачивание белка в нативную конформацию. В связи с недостаточным количеством данных для анализа, рекомендация по мутанту основывалась лишь на наличии в этой позиции Leu у ФНО-а кролика. Следует отметить, что введение второй мутации в положение 32 (мутант R3J-H-F144-L) делает белок полностью растворимым. В третичной структуре эти две позиции сближены, что, в частности, свидетельствует о важной роли компенсаторных эффектов, обеспечиваемых заменами сразу в нескольких пространственно сближенных позициях. По-видимому, в близко родственных белках структурно эквивалентными следует рассматривать замены не в одной, отдельно взятой позиции, а совокупность замен в пространственно сближенных позициях. Вторым, среди нерастворимых белков, оказался мутант 1118-А, который был нами запланирован как негативный контроль для проверки гипотезы о структурной роли объема аминокислот в окрестности позиции 118. Замена большого аминокислотного остатка Не в положении 118 на малый по объему Ala приводила к накоплению мутанта в виде нерастворимых частиц. В тоже время, замена того же остатка на Met, имеющий приблизительно равный с Не объём, никак не влияла на растворимость белка в цитоплазме бактерий. Тем самым, полученный результат полностью соответствовал ожидаемому.

Измерение спектров кругового дихроизма (КД), проведенное для Я31-Н, А33-5, I118-М, 1|18-А, И'^-Ь и 11и-Н-Р|44-Ь показало сохранение вторичной структуры у всех мутантов за исключением Р144-Ь (Шингарова и др., 1996). Спектр КД только этого белка отличался от спектра интактного ФНО-а. Методом кросс-сшивки была проверена способность этих же мутантов образовывать тримеры (Шингарова и др., 1996). Оказалось, что все мутант-ные белки сшиваются с преимущественным образованием тримеров.

Авторы (Шингарова и др, 1996) исследовали биологическую активность очищенных белков в стандартном цитотоксическом тесте на линии Ь929 фибробластов мыши (табл. 3). Оказалось, что замена лишь незначительно снижает биологическую активность (в

отличие от замен в позициях 32, 33, выбор замен в данной позиции проводился лишь с учетом структурной допустимости мутаций, без анализа степени их влияния на активность). Замены Я.32-Н и А31-8 привели к значительному уменьшению цитотоксической активности. Еще большее падение активности наблюдалось у мутантов И -Ь и

Корепановой и соавторами (1994) была проверена стабильность мутантного белка Я31-0 к действию протеолитических ферментов. В результате его обработки трипсином было обнаружено, что Я3|-0 по сравнению с природным белком более устойчив к протео-лизу. Так, в течение 60 мин исходный рекомбинантный белок гидролизовался на 50%, тогда как мутантный сохранялся практически полностью (87%).

Таблица 3.

Цитотоксическая активность мутантных ФНО-а.

ФНО-мутанты Цитотоксическая активность, ед./мг Относительная активность

ФНО-а (дикий тип) З.ЗхЮ6 1

Я32Н 3,3x104 1х102

АЗЗЭ 4,3х104 1,3х10~2

1118А - -

1118М 0,6x1 о6 2x10"'

Р144Ь 2Х103 1,65x10"3

Ю2Н-Р144Ь 2х103 1,65х10'3

Примечания:

* - активность измеряли в стандартном цитотоксическом тесте на линии ¿929 фибробластов мьппи (Шингарова и лр, 1996).

Глава 5 посвящена анализу данных фагового дисплея. В первой части данной главы содержится анализ взаимосвязи между структурой пептидов-встроек в основной белок оболочки бактериофагов М13, П (в районе 4-5 аминокислот зрелой формы белка рУШ фагаМ 13) и способностью мутантных фагов к самосборке. В настоящее время существует два типа конструкций формирования фаговых частиц, несущих пептиды-встройки: «моза-

ичная» и «ландшафтная». При «мозаичной» конструкции фаговые частицы содержат белки-носители дикого типа и со встройками. В этом случае даже наличие протяженных встроек не мешает формированию гибридных фаговых частиц (Felici et ail., 1991). В «ландшафтной» конструкции каждая копия белка-носителя содержит встройку. Это позволяет увеличить плотность экспонированных на поверхности фага эшггопов, однако, не все варианты фагов оказываются жизнеспособны.

В исследовании взаимосвязи между физико-химическими характеристиками пептидов-встроек и жизнеспособностью мутантных фагов использовали данные по встройкам, полученным во ВНИИ МБ "Вектор" (Ерошкин и др., 1993), данные (Felici et al., 1991, Greenwood et al., 1991). Вставки имели размеры от четырех до десяти аминокислот. Исследование проводилось с использованием регрессионного анализа. За активность мутантных белков мы приняли жизнеспособность соответствующих мутантных фагов и задали эту активность равной 1 для жизнеспособных и 0 для нежизнеспособных мутантов. Закономерности, обнаруженные на мутантных фагах, проверялись, также, на фагах, родственных фагу М13 - IKE, IF1,12-2. В результате анализа было обнаружено, что наиболее важными для жизнеспособности мутантных фагов являются низкие значения <х-спиральности. Жизнеспособность нарушается с ростом средних индексов а-спиральности, объемов и полярности участка. Напротив, высокий индекс Р-поворота коррелирует с жизнеспособностью фагов. Кроме указанных средних свойств участка, для жизнеспособности оказались важны а-спиральные моменты заряда и Р-структурные моменты объема аминокислотных остатков. Так, жизнеспособность нарушается с ростом а-спирального момента заряда. С другой стороны, высокий Р-структурный момент объема аминокислотных остатков коррелирует с жизнеспособностью фагов. Для поиска меньших участков, изменения в которых связаны с жизнеспособностью, перебирались все подфрагметы длиной от 1 до 15 остатков. В табл. 4 приведены два лучших из найденных вариантов. Видно, что жизнеспособность нарушается с ростом момента (Р-тяж и а-спираль) заряда участков 1115 и 10-15. Судя по величинам коэффициентов корреляции, связь моментов свойств в N-концевой части белков с жизнеспособностью фагов в целом сильнее по сравнению со средними свойствами пептидов-встроек. Из табл. 4 видно, что природные фаги М13, IKE, IF1 и 12-2 имеют низкие p-структурные и а-спиральные моменты заряда на участках 11-15 и 10-15 белка pVIII, соответственно.

Кроме того, оказалось, что жизнеспособность мутантов коррелирует с отсутствие положительно заряженных аминокислотных остатков на участке 11-15 белка pVIII (табл.

4). Проверка этой закономерности на четырех природных вариантах белка рУШ показывает, что во всех случаях соответствующие участки не содержат положительно заряженных аминокислотных остатков (нижняя часть таблицы). Более того, жизнеспособные мутанты с короткими встройками - РМ34 и РМ34.Г тоже не содержат тахих аминокислотных остатков. В целом указанное правило выполняется в 17 случаях из 18.

Таблица 4.

Свойства фрагментов К-концевых участков мутантных белков рУГО и их связь с жизне-

способностью мутантных фагов

Белок Жизне- Последова- Момент юоэлектрической Ьуз или

способ- тельность точки Ацва

ность участка Р-стрега изо- а-спирвлц участке

10-15 гнутый. сайт 10-15 11-14

сайг 11-и

Мутангный М13р17 0 ттскго 16,96 27,42 +

мпвои 1 16,18 13,44 +

мпвоис 0 оитего 14,82 18,43 +

М13ВОи-5Ь 0 16,18 13,44 +

М13В01,У 0 20,42 23,25 +

мпвои 0 ЕОЮТЕК 20,42 22,72 +

М13ВОМ1 1 ЕХДОСО 5,61 2,60 -

М13ВОМ2 1 (ХгАЖО 5,61 7,53 -

М13В01Л 1 гашго 8,81 6.68 -

Рае 18 0 ЕЭЛЖО 19,42 14,42 +

ран^АМ») 1 ЫАМРМЭ 6,04 6,89 -

РДКУОТОвМ) 1 FWGMND 4,96 6,66 -

Коррелят* -0,85 •0,83 -0,85

Значимость,0/«. 0,1 0,1 0,1

Природный М13 1 АЕСБО 13,61 2,06

Псе 1 РЫААТЫ 0,% 7,27 -

1Л 1 АООАТЗ 4,45 11,58 -

12-2 1 ТЭТАТБ 0,58 7,33 -

* Коэффициент линейной корреляция связи между свойствами участка я жизнеспособностью соответствующего иупштяого фага.

** Статистическая значимость коэффициента линейной корреляции.

На основе проведенного анализа можно сформулировать ряд правил для конструирования жизнеспособных вариантов мутантных фагов со встройкой коротких пептидных фрагментов в >4-концевом участке белка оболочки. Во-первых, встраиваемый пептид не должен иметь высокий индекс а-спиральности, большие объемы и полярность. Предпочтительны для встроек фрагменты с высоким потенциалом Р-поворота. Во-вторых, встраиваемый пептид не должен иметь (в С-концевой части) высоких се-спиральных и 0-структурных моментов заряда. В-третьих, встраиваемый пептид не должен иметь положительно заряженных аминокислотных остатков в своей С-концевой части.

Следует отметить, что большинство найденных корреляций отрицательны, т.е. коэффициент линейной корреляции меньше нуля (за исключением среднего индекса 0-

t,

поворота и момента объема). Это говорит о том, что допустимыми являются встройки нерегулярных пептидов без каких-либо периодичносгей (особенно a-спиральных) в расположении аминокислот.

Приведенные выше правила позволяют предложить способ получения жизнеспособных мутантов при встройках в рассмотренную зону белка pVIII путем использования специального спейсера (длиной в четыре-шесть аминокислот и состоящего из остатков Gly, Ser, Thr, Asn) между С-концом встраиваемого пептида и остальной частью белка. Наличие такого гибкого неспирального спейсера может существенно облегчить задачу получения жизнеспособных мутантов. Результаты компьютерного расчета по предсказанию жизнеспособности фагов, содержащих встройки с полиглициновым спейсером, длиной 6

ДО,33 §

о

а".

е

х<

ё •о

Рис. 4. Свойства фрагментов И-концевых участков (10-15) мутантньгх белков рУШ и их связь с жизнеспособностью мутантных фагов. Нежизнеспособные фаги обозначены кружками, жизнеспособные обозначены треугольниками. Черным треугольником обозначена расчетная область, в которую попадают все фаги (в том числе нежизнеспособные) после добавки полиглицинового спейсера, длиной 6 аминокислот. Цифрами обозначена теоретически рассчитанная жизнеспособность.

-0,1 -0,15

О О о

0,45 0,4

ДОО О

1 0,95 0,9

- ДА AWWA Д

н-ь

10 20

Альфа-спиральный момент изоэлектрической точки

аминокислот приведены на рис. 4. Для предсказаний использовали уравнение регрессии: У=-2,605 Х]-0,012 Хг+1,037, где У - предсказанная жизнеспособность, Х| - положительный заряд, Хг - а-спиральный момент изоэлектрической точки аминокислот участка 1015. Значение Р-статистики равно 20,28, что соответствует уровню доверия более чем 99%. На рисунке можно видеть, что спейсерная добавка «переводит» нежизнеспособные варианты в группу жизнеспособных. Жизнеспособность таких фагов, предсказывается равной 0,95, что соответствует жизнеспособным вариантам.

Во второй части главы приведен анализ данных фагового дисплея по локализации группоспецифического, гемагглютинирующего эпитопа гликопротеина Е2 альфавирусов (Кузьиичева и др., 1997). Для аффинной селекции фагов были использованы крысиные моноклональные антитела 4Н5 против вируса ВЭЛ, взаимодействующие с группоспеци-фичным гемагглютинирующим доменом гликопротеина Е2 альфавирусов (Яагитоу е! а1., 1994) Задача, которая решалась с использованием компьютерной системы РгоАпа1у$1 состояла в теоретическом анализе отобранных пептидных последовательностей и нх сравнении с аминокислотной последовательностью вирусного белка. Полученные данные представлены на рис. 5

а) б

Ф13,Ф2б,Ф31 КЛТЗКТРОЫПГЛ.'ЗР 85 69

Ф17 Онзтиззрчоьзкту вэл ндуз1лтзкрсн1у

иг урксьнр1умрргаз Всэл пмштатзАрезьу

«19 ЬЗЕБМСИКАРЬРРЗР Синдбис 001К15ТЗСРСКЯЬ

Ф36 СНМ Р 30 РК1 Р.ТМ Р Р зэл окхмзтасрср.яь

Леса Семлики аЗГ-КУАТЭСССГУН

Росс-Ривер ВЗЬКУУТЗААС31Н 01 Ньюонг-ньюонг БСЬГтатЗАРСПТ Ф13,Ф26,Ф31 НТЗК Ф17 НЗТК

в)

1'*г 112

ВЭЛ НаУГЫАВСРАСП31ТМЕ?КК03'УТ

йсЗЛ НСУЧ'Т :.АССР£"ЗРТ\Т\'СГНС5РКК

гмиявис КС** ^¡АХСР.-ЗЭвУТУЗХУЗвМЗА'

—.'Л К5 УП.1АССР ^ЭЗ УТУ31Т8СМВ

.'^са Спи ;ки У^.-.--11АКСРРОЕГ1,0У310ОТИ1А

Ро-1 : Р-.15ер Ч^лПЧ-АНСРРСОУ^КУЗсЕПАг^Н О'Нтонг-ныоонг >.*■:?: 1АКСРКСЕТЬТУЗГЛ55ЯГ>,1

Ф36 СНИРЗСНИКШИРР

">19 Г.ЗЕь'МОШЛРЬРг'СР

Ф36 сн'л'рвогаивтмрр

»1? 13ЕЕМС'Я;хрьргср

Рис. 5. Сравнение аминокислотных последовательностей белков Е2 различных альфавирусов н пептидов ю фагов, взаимодейстнмоших с МКА 4115. а) - Посжаоазгельиссгп пептидов ю полученной коллекции фагов; б) и в) - Результаты поиска общих аминокислотных нопшо,) а последовательностях пептидов и белках Е2 вирусов: ВЭЛ, Синдбис, Леса Семлики, Росс Ривер, ОНьюоиг-иыоои-, ВсЭЛ - еосгочного энцефаломиелита лошадей, ЗЭЛ - западного энцефаломиелита логогдей.

Поскольку МКА 4Н5 взаимодействует со многими представителями альфавирусов (А§ароу « а!.. 1994, Яагитоу е1 а1., 1994), то критерием дли гмбора мотивов было наличие сходства не только с последовательностью белка Е2 ВЭЛ но и с белками других альфавирусов (рис. 56). Всего было найдена два общих мотива. Последовательности встроек в клонах Ф13, Ф26, Ф31 были идентичными и -¡»-.елд учзсгох, вклю чающий 4 аминокислоты (НТвИ), совпадающий с участком аминокислотной послезочатель '('¿-¡и Сч?лха Е2 в районе 85-88-ой аминокислот вирулентного штамма Тоинигц: Дошш г и.«уса ВЭЛ (Ктпеу е* а1.,

1989). Клон Ф17 имел сходный мотив HSTR. Поскольку аминокислоты Ser и Thr отличаются только наличием метальной группы у треонина и часто могут заменяться друг на друга в антигенных детерминантах без нарушения связывания антител (близки в антигенном смысле, Ерошкин, 1988), можно сделать заключение о сходстве выявленных мотивов. Две позиции в данном участке -остатки Т*6, S*1 полностью консервативны в рассмотренных вирусах (рис. 56). Замены Н85 у вирусов ВсЭЛ и ОНькюнг-ньюонг на Arg, а в ЗЭЛ и Синдбис - на Ser, способны, как и гистидин, к формированию водородной связи. Участок 85-88 попадает в область вероятной локализации сайта геммаглютинации белка Е2 (Святченко и др., 1993., Agapov et al., 1994., Razumov et al., 1994).

Для пептидов Ф36 и Ф19 был обнаружен мотив SXXMXXXAXXP, который в последовательности белка Е2 вируса ВЭЛ имел циклическую перестановку двух аминокислот (AXXPXXXSXXM) (рис. 5в). Хотя в пептидах Ф19 и Ф36 порядок двух частей мотива иной, чем в вирусе ВЭЛ, они способны имитировать структуру

соответствующего эпитопа из вируса ВЭЛ (рис. 6). Анализ имеющихся данных позволяет предположить, что аминокислотные остатки 102, 105, 109, и 112 •оставляют другую часть конформационного эпитопа,

узнаваемого МКА 4Н5. Остатки 102 и 105 - абсолютно консервативны у рассмотренных вирусов. Остаток S109 лишь у вирусов Леса Семлики и Росс-Ривер меняется на Phe и Тут. Замена Ser на Туг

Рас. б. Структурные модели фрагмента 102112 белка Е2 в пептждов ю фаго> Ф19 и Ф36.

Рис. 7. Схематичное представление возможной укладки цепи белка Е2 вируса ВЭЛ в районе аминокислот 81-116. Аминокислотные остатки предполагаемой конформационной детерминанты обозначены кружками с названием в однобуквенной кодировке соответствующей аминокислоты. Стрелками обозначены Р-тяжи.

может не нарушать связывания, поскольку обе аминокислоты являются донорами в образовании водородной связи. Гидрофобный остаток М112 меняется на гидрофобный Val, консервативный у остальных вирусов. Предсказание вторичной структуры белка Е2 VEE, выполненное методом нейронных сетей (Rost & Sander, 1994) показало, что данный участок (80-115) является чисто ß-структурным. Возможный способ пространственной организации подобных участков в белке - ß-баррель (как, например, в Vl- районе иммуноглобулинов). При такой организации участки 85-88 и 102-112,оказываются сближенными в пространстве и действительно могут составлять один прерывистый эпитоп (см. рис. 7). Близость района 102-112 с участком 85-89 может служить дополнительным аргументом в пользу того, что они являются двумя частями одного конформационного эпитопа. Совокупность полученных данных позволяет сделать предположение, что найденные районы являются частью группоспецифического гемагтлютинирующего домена альфавирусов. Этот домен формируется не менее чем восемью аминокислотными остатками двух районов аминокислотной последовательности белка Е2 (85-88 и 102, 105, 109, 112). Таким образом, в результате анализа пептидов мы идентифицировали в белке Е2 две области, которые могут составлять существенную часть группоспецифического гемагтлютинирующего домена семейства альфавирусов. Отсутствие данных о третичной структуре белков Е2 альфавирусов и трудность получения таких данных ставит наше предположение в ранг рабочей гипотезы, давая, однако, существенное направление дальнейшим исследованиям этого домена Например, получение мутантных вирусов, содержащих деления в найденных районах.

ВЫВОДЫ

I. Разработан комплекс методов анализа взаимосвязи иручура-акпшвость в сшейывах родственных и/или мутантных белков. Методы, реализованные в многофункциональной программе ProAnalyst, позволяют выявлять в последовательности и трещиной структуре белков сайты, физико-химические характеристики которых коррелируют с активностью белков или их свойствами; «клишировать особенности третичной структуры белков; проводить поиск мотивов в комбинаторных библиотеках. На основе предложенных методов разработана и апробирована схема тонирования мутаций, улучшающих медико-биологические свойства рекоыбшштткых белков, перспективных лекарственных препаратов. Программа ProAnalyst доступна для пользователей по Internet

2. Впервые предложен показатель взаимосвязи структура-активность, характеризующий максимально достижимое значение корреляции совокупности всех возможных характеристик сайта с активностью исследуемого набора белков. Проведенный анализ пяти белковых семейств показал, что наибольшие значения корреляции структура-активность наблюдаются в функционально важных районах белков либо в прилегающих к ним участках, что свидетельствует об адекватности предложенных в работе методов.

3. Проведен анализ структурно-функциональной организации фактора некроза опухолей человека. Впервые обнаружено, что цитотоксическая активность ФНО-а линейно коррелирует с изменениями индексов ß-поворота и изоэлектрической точки аминокислот в функционально важной петле. Впервые найдены закономерности, связывающие растворимость мутантных форм этого белка в цитоплазме клеток К. coli с изменением физико-химических и структурных свойств замещающих аминокислот. Предложены замены снижающие цитотоксическую активность или обеспечивающие пролонгированное действие препарата.

4. Проведен анализ пептидных фрагментов, встроенных между 4 и 5 аминокислотами основного белка оболочки бактериофагов N113, fl и fd. Впервые обнаружена связь между способностью к сборке вирусных частиц и наличием положительно заряженных аминокислот во встроенных участках. Рекомендована к экспериментальной реализации спейсерная конструкция, по компьютерным расчетам обеспечивающая жизнеспособность фагов при любом аминокислотном составе пептидов-встроек.

5 Проведен анализ последовательностей пептидов, отобранных при аффинной селекции фагов на моноклональных антителах крысы, взаимодействующих с группоспецифич-ным гемагглютинирующим доменом гликопротеина Е2 альфавирусов. Найдены участки возможной локализации группоспецифического, гемагглютинирующего эпитопа гликопротеина Е2 альфавирусов. Впервые предложена модель пространственной укладки полипептидной цепи, при которой найденные участки формируют конформаци-онный эпитоп.

Публикации. По теме диссертации опубликованы следующие работы:

1. Иванисенко В.А., Ерошкин A.M. Поиск сайтов, содержащих функционально важные замены в наборах родственных или мутантных белков. // Молекуляр биология 1997. Т.31. С.880-887.

2 Кузьмнчева Г А., Кувшинов В Н., Разумов И.А., Иванисенко В.А., Ерошкин A.M., Мишин В.П., Ушакова Т А., Локтев В Б., Ильичев А.А. Использование фаговой библиотеки пептидов в картировании группоспецифического гемагглютинирующего домена глнкопротеина Е2 альфавирусов.// Молекул, генетика, микробиол. и вирусол. 1997. №4.

3. Морозов В.М , Иванисенко В.А., Ерошкин A.M., Угарова Н.Н. Компьютерный анализ зависимостей между максимумом цвета биолюминесценции и первичной структурой люцифераз жуков: идентификация сайтов, ответственных за изменения цвета. // Моле-куляр. биология. 1996. Т.ЗО. С.1167-1172.

4 Eroshkin A.M., Fomin V.I., Zhilkin P.A.,Ivanisenko V.A., Kondrakhin Y.V. Pro Anal version 2: multifunctional program for analysis of multiple protein sequence alignments and studying structure-activity relationships in protein families. // CABIOS. 1995. V. 11. P.39-44.

5. Корепанова A.B., Ерошкин A.M., Иванисенко B.A., Лебедев Л.Р., Микрюков Н.Н., Пус-тошилова Н.М., Петренко В.А., Ильичев А.А. Получение мутантного фактора некроза опухолей человека с повышенной устойчивостью к протеазам. // Молекуляр. биология. 1994. Т28. С.143-149.

6. Ерошкин А.М., Миненкова О.О., Фомин В.А., Иванисенко В.А., Ильичев А.А. Анализ встроек пептидных фрагментов в основной белок оболочки бактериофагов М13, П и fd. Взаимосвязь структурных характеристик белка оболочки и жизнеспособности мутант-ных фагов. // Молекуляр. биология. 1993. Т.27. С. 1345-1355.

7 Ерошкин A.M., Иванисенко В.А., Пинин С.В., Коробко Б.Г. Компьютерное конструирование мутантов фактора некроза опухолей человека с улучшенными биологическими свойствами. //11 Конгрессе «Человек и лекарство», Москва, Апрель 10-15, 1995. / Тезисы докладов С. 59.

8. Ivanisenko V.A., Pika I.S., Pinin S.I., Fomina Т.1., Eroshkin A.M. Studying structure-activity and phenotype-genotype relationships m protein families. Methods, algorithms and applications. // Folding and Design. 1996. V.l, P.84.

9. Ivanisenko V.A., Eroshkin A.M. Searching protein sites with functionally important amino acid changes in the sets of natural and mutant proteins. // Folding and Design. 1996. V.l. P. 85.

10. Иванисенко В.А. Дисперсионный анализ в задаче поиска функционально и структурно важных аминокислотных остатков, модулирующих активность белков. // Второй Сибирский Конгресс по Прикладной и Индустриальной Математике (ИНПРИМ-96), Новосибирск, 25-30 июня 1996/ Тезисы докладов T.l. С.21.

С.25-29.