Бесплатный автореферат и диссертация по биологии на тему
Разработка теоретических методов анализа функциональных элементов в белках по инвариантным структурным характеристикам
ВАК РФ 03.00.03, Молекулярная биология

Автореферат диссертации по теме "Разработка теоретических методов анализа функциональных элементов в белках по инвариантным структурным характеристикам"

и ^ ^ \Ш1№ ьш йз.валвр ]

всесоюзный научно-исследовательскии

институт молекулярной биологии - - нпо вектор "

На правах рукописи

ЛУКАШЕВ Виталий -Алексеевич

разработка теоретических методов анализа функциональных элементов в белках по инвариантным структурным характеристикам

03.00.03 - молекулярная биология

Автореферат Диссертации на соискание ученой степени кандидата биологических наук

Кольцово 1992

Работа выполнена во Всесоюзном научно-исследовательском институте молекулярной биологии НПО "Вектор".

Научные руководители: чл.-корр. РАН,

доктор биологических наук Сандахчиев Л.С.

кандидат биологических наук Куличков В.А.

Официальные оппоненты:

доктор биологических наук Мертвецов К.П.

доктор биологических наук Петров Н.А.

Ведущая организация: Институт молекулярной генетики РАЯ

Защита состоится «/» сг^утлл 1992 Г- в час_ на заседании специализированного совета К.098.08.01 во ВНИИ молекулярной биологии по адресу: ' 633159, п.г.т. Кольцово, Новосибирская область.

С диссертацией можно ознакомиться в библиотеке Института молекулярной биологии НПО "Вектор".

12 г-**- «/?/<?

Автореферат разослан "сУ " февраля 1992

Ученый секретарь специализированного совета кандидат химических наук л) / Шубина Т.Н.

1Ли^

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ.

Актуальность проблемы Эффективное определение нуклеотидкых последовательностей и кодируемых ими белков, использование методов спектроскопии и рентгеноструктурного анализа приводят к возрастанию информации о первичных - третичных структурах белковых молекул и их биологических свойств. В настоящее время известно более 25000 аминокислотных последовательностей и около 500 пространственных структур ферментов, иммуноглобулинов, структурных и иных белков. Привлечение этой информации наряду' с разработкой и использованием теоретических методов стимулировали исследования в молекулярной* биологии, вирусологии, биохимии, биофизике.

Практические задачи белковой инженерии находятся на стыке этих дисциплин. Одной из ключевых в этих областях является проблема белка. Несмотря на большое количество работ по моделированию пространственной структуры белка, эта проблема не решена. Однако, имеющуюся информацию о структурных и функциональных особенностях бвлкоЕых молекул можно эффективно использовать, если исходить из следующей концепции: перестройки, которые мы направлено индуцируем не должны противоречить природным структурным изменениям в белках в ходе эволюции. В этом случае соответствующий организм (клетка, бактерия, вирус) остается жизнеспособным и наоборот. Для этого необходимо описать инвариантные характеристики молекул белков, создать их параметрические образы на основе изучения первичных - третичных структур. Использование этих характеристик позволит контролировать структурную и функциональную консервативность (неконсервативность) молекулы при внесении в нее изменений. Такой подход является такзке этапом в решении фундаментальной проблемы белка - установлении его прострзнстЕенной структуры по аминокислотной последовательности. 0 другой стороны, перспективная программа "Геном человека" требует создания универсальных банков первичных - третичных структур белков для функциональной идентификации вновь определяемых аминокислотных последовательностей. Одним из способов сокращения времени обработки этих данных является создание банка

образов белков и нуклеотидных последовательностей - груш параметров, по которым мокно определять и классифицировать родственные последовательности или их фрагменты. Отметим, что идея сопоставления характеристических признаков при изучении и классификации генотаческих видов была заложена Н.И. Вавиловым в теорию о гомологических рядах в наследственной изменчивости. В настоящее время ее.необходимо воплотить на молекулярном-уровне.

Целью настоящей работы является определение объективных параметров, характеризующих структурные и, отчасти, функциональные' особенности белковых молекул. Эти параметры предполагаются инвариантными для белков с различными биологическими' свойствами в самых разных организмах. Главное внимание уделяется следующим задачам:

'I. Статистический анализ пространственно сближенных аминокислотных остатков (АО) 20 канонических типов в третичных структурах, изучение вариабельности АО в зависимости от их пространственного окружения в ходе эволюции белков.

2. Исследование распределений соседних аминокислот в первичных структурах, их связей с пространственным расположением остатков. Изучение влияния распределений соседних аминокислот в коротких пептидных сегментвх на допустимость мутационных замен в белках.

3. Разработка теоретических методов редактирования пептидных сегментов без • изменения - их структурных и функциональных свойств в конкретных белках.

'4/ Поисковые алгоритмы для интерпретации неизвестных структур, прогноза активных центров, областей связывания с лигандом, антигенных детерминант в эукариотических и вирусных белках - цель наших исследований в прикладной области.

Научная новизна,,работы. На основании, изучения пространственно сближенных аминокислотных остатков показано, что существуют статистически значимые тенденции во взаимном расположении АО, по сравнению с их случайным расположением в третичных структурах. Имеется связь мезду функционально допустимыми -мутационными заменами и пространственным окружением остатков. Распределения остатков в коротких пептидных сегментах ($10 АО) также влияют на возможные аминокислотные ■ замены. ' Существуют ■.статистически

значимые, взаимосвязанные тенденции в расположении.АО в. первичных и третичных структурах. Иг можно описать в' терминах'линейной и пространственной "сопряженности" остатков. ОдношагоЕые мутации в соответствующее кодонах соседних аминокислот в среднем не выводят их из множества сопряженных пар в первичных и одновременно в пространственных структурах белков. Этим обеспечивается своего рода "конфирмационная защита" белка, которая, в конечном счете, детерминирована структурой генетического кода. Построена мера сходства АО, зависящая только от их расположения в кластерах (совокупностях) пространственно сближенных остатков, что позволяет оценить плотность упаковки остатков - их координационные числа вдоль полипептидной цепи. Высказано аргументированное предположение, что возможный код взаимного пространственного узнавания аминокислот не является синглетным ("остаток - остаток"), но групповым ("остаток - группа АО" или "группа - группа"). Эти результаты дает возможность

1) редактировать пептидные сегменты в белках без изменения их структурных и функциональных свойств;

2) осуществлять поиск структурных аналогов первичных структур и включать их в семейства гомологов;

3) изучать взаимодействие внутрибелковых- доменов" и' 'субъединиц белковых молекул;

4) в перспективе осуществить создание банка образов белков. Это не только консенсусные пептидные сегменты,но и мотивы высших структурных уровней, включая третичную структуру белка.

Научно-практическая ценность работы.

1) Разработан метод прогноза возможных мутационных замен аминокислотных остатков в белках. В качестве математического алгоритма этот метод реализован в виде программы и был адаптирован на панкреатических рибонуклеазах. Таким образом можно прогнозировать потенциальную вариабельность аминокислотных последовательностей, тестировать активные центры ферментов, возможные антигенные детерминанты.

2) Реализован метод сопоставления отдаленно гомологичных пептидных сегментов по профилям их плотности упаковки - приближения координационных чисел. Метод позволяет проводить сравнение неизвестной структуры с банком первичных структур для ее .интер-

претации("Profile"). Он опробован при изучении белков из chiro-nomus thummi и для множественного выравнивания слабо гомологичных белков ( на примере цигохромов Р-450).

3) Математической модификацией этого алгоритма является метод "Motiv" для выявления консенсусвнх областей в первичной структуре одного или множества белков,-Это еще один-способ .: идентификации белков. Пример - определение ламининсвязывавдего белка человека.

4) На основе полученных данных по пространственной сопряженности (сближенности) аминокислотных остатков создана методика - прогнозирования областей антигенных детерминант, комплементарных иммуноглобулинподобным . доменам (на примере гликопротеина Ebola-вируса).

Апробация работы. Результата работы докладывались на 1-м и 3-м Всесоюзных совещаниях "Теоретические исследования и банки данных по молекулярной биологии и генетике" (Новосибирск, 1986; 1988), на 5-ы Бюхеровском симпозиуме "Оксиредуктазы и перспективы их применения" (Берлин, 1988), на 5-й Всесоюзной конференции "Цитохромы Р-450 и модификация макромолекул" (Ялта,

1989), на международной конференции "Моделирование и вычислительные методы в молекулярной биологии и генетике" (Новосибирск,

1990), на Всесоюзной школе "Молекулярно-клеточные механизмы иммунной регуляции гомеостаза и проблемы математического моделирования" (Красноярск, 1990).

Обген и структура работы. Диссертация состоит из Введения, пяти глав, Заключения, Выводов и Приложения. Общий объем работы 192 страницы. Из них 132 стр. машинописного текста (исключая список литературы и оглавление), 30 рисунков, 12 таблиц. Количество цитируемых работ 163.

СОДЕРЖАНИЕ РАБОТЫ

Во Введении формулируются предпосылки и основные задачи исследования.

Первая глава - обзорная. В ней критически рассматриваются результаты экспериментальных и теоретических исследований структурно-функциональной организации белков. Анализируются некоторые перспективные по мнению автора направления дальнейших

исследований для создания прогностических моделей в области белковой инженерии.

Глава 2. Инвариантные структурно-функциональные характеристики белков.

В основу разрабатываемой методологии положен принцип поиска устойчивых или консервативных структурных параметров, по которым можно классифицировать родственные белки или их элементы и, таким ообразом, решать задачу об их структурной гомологии и функциональном сходстве. Эти параметры предполагаются общими для различных белков, и должны коррелировать с их аминокислотным составом, пространственной структурой и соответствующими кодирующими сайтами. Рассматривая вариации этих ' прараметров, мокно пргнозировать изменение функциональных свойств или стабилизировать эти свойства в белковых молекулах. В общем случае данную стратегию можно охарактеризовать, как создание множества структурных и функциональных образов белка. Этот подход обусловлен практическими задачами по определению (изменению, сохранению) активных центров, областей контактов субъеданиц, антигенных детерминант и т.д.

Были проанализированы совокупности аминокислотных остатков (АО), пространственно сближенных в третичных структурах белков. По критерию X2 выделены остатки, достаточно часто (редко) сближенные с АО данного типа по сравнению с их случайным распределением в третичных структурах белков.. Критерием1 пространственного контакта АО являлось расстояние между их С^-атомами, которое сравнивалось с суммой усредненных радиусов этих остатков. Число остатков, сближенных с исследуемым, использовано для дифференцировки их плотности упаковки. Рассматривались АО во внутренних, внеиних, поверхностных областях, а также в зависимости от вторичной структуры, в которую они включены. Эти результаты для 5210 кластеров в 32 негомологичных белках с известной пространственной структурой и для 6447 кластеров, образованных только вариабельными АО в 12 других белках и соответсвукщкх гомологах ( "мутационно сопряженные АО" ) приведены в таблице I.

Таблица I

Пространственная сопряженность аминокислотных остатков

Простанствённо I "йутацйонно I "Пространственно

сопряженные . * сопряженные » антисопряженные

аминокислотные * аминокислотные! аминокислотные

остатки , остатки 1 остатки

01у(0) боа Ка Еорх ьа Уох У/оар бо То Ко Ео Во 1о Роа

Рго(Р) - - -

Аэр(Б) Сох Оа Ка Нор во Тор коа Ьох Роа

б1и(Е) Еоа Ах Коарх шр n0 То Коа Рх Со Уо ТСо

А1а(А) эр Рх Ох Коа Уоа 1оа Ух ир коа Рх м на Сх «о

Абп(Л) С-о <2о Уор То Ио 1о Ьо

с1п(0) Иоа ?Уор - Уо Ъо Ро

Бег(Б) Торх Коа Ра Ур Иох Бх Ко Ьо

тхг(ф) бр Ро Ао Зох Ех - Ьо

Ьув(К) Ооа йоах Еоарх ор Кох на ур Боа Ео Аоа Оа То Ка Уоах Коа Уох

АГ£(Ю Сор Еоар Бх Но Уо Уа Аоар Кох Ьо

Н1в(Н) 1)о кр Со Ъох Роа Но бо

Уе1(У) Аоар Бор Уор 1ор Мор 1ор Рх Мх 1ор По Ер Зох Тоа Ко Со Тор

11е(1) Аоар Ка Иох Уоа Аоа Ыо Хор Ро бо Иор Коа

Ме1,(М) Рох 1а Га Роа Ка

СуБ(С.) Сосфх Но " . - . Ах Коа Уо

Ьеи(Ь) ах ср Нох Роах «оа Ао Ко Ьох Ро N0 1о

Р1ге(Р) Корх Ьоах Рох Ьо бо Бх ка Уоа

Туг(У) РоБо Ноар Оорна 1оНо ва со 1х Ко Уорьо Ро

тгр(я) боар ох та кр Ьор Со Уо Яо

Тип I'" остат- 1

ки 1

Примечание. Обозначение "О" - (любая вторичная структура), "а"~ (а-спиралъ), "Р"- (^-структура), "х" - неопределенная вторичная струтура относится к аяшокислотолу остатку б первом столбце. Мутщилнно атисопряхенные ■ остатки, отлечеш нспергюл сверху.

Построена обобщенная матрица пространственной-сонряжееннос-ти Б. .= N.. / К-+ н N. . , где N.. - фактически -наблюдаемое число контактов между остатками типов 1 и з; г^ - число контактов 1-х остатков с любым другим (1 - внутренний остаток кластера); и число контактов внутренних остатков любого типа с д-ми АО. Сравнение параметров для функционально близких остатков (рис.1) показывает, что эти остатка имеют сходное пространственное окружение.

Параметры В^. в качестве коэффициентов корреляции строк матрицы [Б] иллюстрируют градацию сходства 10 в зависимости от их функциональной близости в ходе эволюции ФБА

здесь М^. - число позиций в изофункциональных

аминокисло-

=м.. /ОС^-Му

белках, где может присутствовать как 1-я, так и э-я

та; М. - число позиций.для 1.-й аданокислоты.

Рис.2 изображает-корреляцию ■ параметров - 15

функционально близкие (большие и сходные по пространственному окружению (большие В1д.) остатки сгруппированы в верхнем правом углу рис.2. Эти результаты аргументируют влияние пространственного окружения на заменимость АО в эволюционном процессе, то есть: мутационная замена 1—» 3 предпочтительна, если остатки, сближенные с 1-м и д-м АО являются одновременно сопряженными-для обоих.

Изучались также распределения соседних по полипептидной цепи аминокислотных остатков 20 типов в 320 белках (80830 аминокислот) с гомоло-

Рис.1 Сравнение параметров пространственной сопряхенност для ажсно-иислотшс остатков Уа1, Ъеи, Не (а) и Агё, Хуз (0).

тией меньше 302. из разных суперсемейств. По аналогии с

[s] введена матрица линейной сопряженности L(k)i;j. = к» 00i;j.

матрицей /

кг + и* (к) К' Изменения параметров ь(к)^ для функ-

ционально заменяемых остатков в зависимости от к - синхронны для области к "10 АО (рис.3).

В пространстве упорядоченных частотных характеристик (к3=±1,...,±к) определим "расстояние" (в векторном смысле):

го

о

го

60

чо

40

\_i i i г I

sa

■ Л...

120 F¡¡ -¡О

I Ч -I I I I I

иг

® ® - - ©©' ® / • ■ •

- ® ф® ® ©® ® ; % . ® . 1 .. I.. I 1 1 1

40 SO 120 160 21ОГЛ10г Рис.2 Корреляция параметров фунщиональ-

ной близости аминокислот Ftj и близости

аминокислотных остатков по просшранст-

веннолу окружения B^j для вариабельных

остатков Val (а) и Азр (б).

Примеры корреляции параметров Fi;j. и представлены на рис.4. Функционально заменяемые с Tal остатки Leu, Ile, Ala, Thr (а) и с Asn остатки Asp, Gin, lys, Uhr, ser (б) можно одновременно сгруппировать по элементам матриц [Р] и [В(к)-1]. При 2< к <10 существует связь между функционально заменяемыми АО и распределением соответствующих пар соседних остатков в первичных структурах белков. По X2 критерию проверялась гипотеза случайного расположения соседних остатков в парах на рвсстоянии к = ±1, ±2, ±3 АО.

L(K)¡jlo'

Рис. 3. Изменение napa-летров линейной сопряженности 6 зависилост от расстояния А мезкду сосеЬниш ажинокиолот-шш осжтншш в первичных сщшщрах для пар остатков Leu-Leu (1), 11 e-Leu (2), Asp-Leu (3), Glu-Leu (4).

¡00-

'VH

Достаточно часто (редко) мости 5%) определим как

. 10 пары АО

а

(уровень

■ гок значл-

всгречаемые

линейно сопряженные (антисопряженные) (табл. 2). Практически все линейно сопряженные остатки входят в множество пространственно сопряженных АО (табл.1)

О другой стороны, пространственные контакты могут быть реализованы взаимодействием АО с дублетами линейно сопряженных остатков. Из этого следует, что если пространственный кластер включает ковалентные пары аминокислот, то линейная сопряженность АО в этих парах обеспечивает пространственную сопряженность остатков в кластере. Следовательно, функционально допустимые точечные мутационные замены, по крайней мере, не ухудшают линейную сопряженность АО в первичной структуре белка. Показано, что одношаговые мутации в соответствующих кодонах соседних аминокислот в среднем не выводят эти аминокислоты из множества сопряженных пар. Таким образом обеспечивается своего рода "конформацион-ная защита" ("помехоустойчивость") пространственных кластеров,

чо so по ко

Рис.4. Корреляция параметров

12 О близости

функциональной ашюкислот Ftj и обратных расстояний D(3J^j для валина (а) и D(7)1j для астгарагина (б)

Таблица 2

Линейно сопряженные и антисопряженные по критерию х2 (5Ж, I) аминокислотные остатки, расположенные на расстоянии +1 (графы 1-2); +2 (гра$н 3-4); +3 (графи 5-6) остатка от данного (графа О) в зго первичных структурах глобулярных белков

Сопря- Антисо- Сопряженные Антисо- Сопря- Антисопря-

женные пряжен. +2 AO пряженные женные женные

+1 AO +1 AO +2 AO +3 АО +3 АО

0 1 2 3 4 5 ь

Gl у G GPP L GPS E Q К L G V P D E A Q К 1

Pro P G P E S QTKI G P R P G

Asp D L P Q- T X G P R H А К G

Glu E E К К P S E L P T БЕКЕ G S ID L Y M

Ala A G A PHY G 1 К N S Ы А L СНУЙ

Asn N P W -- If Q M Y ' ' A Tf —

Gin Q -- J M G D D p

Ser S G Q S P S F E К S К L

Thr T V A Б T GA T А

bys к А К I G S P I L Y P S E К I G Y

Arg R Q R Y А Г R W P D KCl --

His H ?QHi D К -- н --

Val Y D a? G W h G L R

He I РИ Y M E N L L E

Met M E А К G S L К S KIP G К

Cys С H С V I С -- P С R L

leu L К R L G M D E А К R С G S У I V ALP G T R V

Phe P S К L -- --

Туг Y QIC E А К L G D Y L T I

Trp w W A S A V N W - -

которая связана со структурой генетического кода.

Проведена еще одна независимая классификация аминокислотных остатков в виде матрицы условных расстояний [Б0] между ними. В качестве координат выбраны частоты встречаемости кластеров с различной степенью упаковки (1-9 АО). Эта классификация отражает не конкретные физико-химические свойства АО, а их сходство или различия, обусловленные распределением соответствующих координационных чисел в белках. Наиболее характерные числа остатков, пространственно сближенных с АО каждого типа использованы для приближенного определения координационных чисел - плотности упаковки остатков вдоль аминокислотной цепи. И в этом случае можно одновременно сгруппировать аминокислоты по параметрам матрицы расстояний Ш0] и по шкале их взаимозаменяемости в ходе эволюции белков [Р]. На это указывает также, корреляция полученных параметров с элементами матрицы минимальных мутационных расстояний.

Множества характеристических параметров пространственной сопряженности, линейной сопряженности, распределений координационных чисел в различных по плотности упаковки кластерах удовлетворяют определению "инвариантности".

Эти параметры применены для разработки прогностических методов, которые адаптировались на различных белках. Полученные результаты излагаются в главах 3-5.

' I

Глава 3. Принцип инвариантности параметров сопряженности аминокислот при изучении панкреатических рибонуклеаз

На примере панкреатических РНКаз отработана методика прогноза функционально допустимых мутационных замен аминокислотных остатков. Мы исходили из положения, доказанного выше: аминокислотные замены в ходе эволюции не нарушают линейную сопряженность соседних АО вдоль полипептидной цепи. С учетом средних взаимодействий это выглядит так:

Для каждого аминокислотного остатка в белке учитывались ближние (+1....+4 остатка по цепи) и средние (±5,...±15 остатков) взаимодействия. Ближние взаимодействия мы охарактеризовали параметрами линейной сопряженности Мк)^, средние - параметрами пространственной сопряженности Б. .Каждой позиции первичной

структуры п с остатком типа i сопоставим два вектора: L(i)=(L(n-

4)ij(n-4)

и S(i)=(Sl;f(ll_15)f....Slí(ml5)).

При аминокислотной замене 1(п)->з(п) потребуем сходства векторов и Б(а)~Б(1). Эти векторы сравнивались по значениям сь

= cos(L(i), X(j)) исследуемых структур СТ»С*, На рис.5

и Cs = cos(s(i),

в каждой позиции Замена ±->з предполагалась допустимой, если показано применение этой методики к сегментам 16-35 и 46-65 интегрально для 42 РНКаз. Пороговые значения с*=о,993 и с*=о,978 . выбраны--постоянными-и .равны средним косинусам по всем позициям в 10 (первых) гомологах

HG

Г G А

FF А

Е § I?! D I G PA Ь

V D DSGG Q V L DYI SI VI ■ Y G

LAGGIGFVTGG*R* * *Y**I S7*SYL**PV*IV*II**QS

D

RS

YK С

PH D т

GG S V R T H

DYTPG L V SE D P R

YTAHLVP T К Q AQS R II

I PMPAAITNA D А К FT KVV KT G E

У SSTSTAiroS-N E M AL I ASTAAINNV QSK

(а)

(б)

ÍCMEGPSKSSPRIYCNQMMI PVIWFYHEPLKDVQAICSQG

16 35 46 65

Рис 5. Сравнение расчетных вариатов аминокислот (а) с pea-ibuo зафиксированным алшнокислотныли эаяепаш в 42 панкреатических РНКазах млекопитающих (0). На ■ гистпоградле (а) изображены j-e аминокислотные остатки 6 случае залепи i-*J. Например, в позиции 47 остатки. Val ( Leu - Val ) и Пе ( Val -Leu). В позициях, обозначенных звездочкой, расчет допускает только исходные остатки в состдшствукщах белках.

(оь=0,001, о3=0,003). Символьная гистограмма (б) относится к реально зафиксированным заменам аминокислот в каждой позиции, (а) - прогнозируемые варианты замен (хотя бы в одном из белков). 40% предполагаемых замен (а) реализуются в природе (б), другие в основном находятся в пределах сходных типов аминокислот. Наложение дополнительных требований сохранения исходной вторич ной структуры (по Чоу и Фасману) практически не изменяет результат: "запрещены" лишь аминокислоты Не и Тгр в 19-ой, и РЬе - в 61-ой позициях (выделены на рис.5); исходные варианты ■ АО на гистограмме (а) не отмечены).

С учетом исходных вариантов замен эффективность прогноза т| = Нправ/Нсум= 0,76; здесь "прав ~ ксш^ествао прогнозируемых аминокислотных остатков, совпадавдих с природными вариантами, нсум ~ °°Щее количество возможных (из расчета) остатков в данной области первичной структуры. Это число (0,76) близко к аналогичной оценке (0,72) в случае использования только принципа сохранения линейной сопряженности при анализе 23 первичных структур РНКаз. Остатки каталитического центра прогнозируются неизменными, а области антигенных детерминант - высоко вариабельными.

Следовательно, приближенное сохранение частотных характеристик в распределениях пар соседних остатков в первичных и третичных структурах может быть использовано для создания методики редактирования первичной структуры пептидных сегментов в белках без изменения их функциональных свойств.

Глава 4 Сопоставление гомологичных пептидных сегментов и структурно идентичных доменов в изофункциональных белках.

Для функциональной интерпретации неизвестных (гипотетических) белков был создан практический алгоритм сравнения профилей упаковки (координационных чисел) этого белка и белков из банка первичных структур. Эта методология применялась■ для поиска сходных структурно-функциональных доменов в белках Рб.г и С1.2 из тканеспецифического пуфа КБа смгопогшэ тЬжп1 и в белках из банка ("Рта",версия 1989).Максимальные числа аминокислотных остатков, пространственно сближенных с остатками каждого типа Р(1) (1=1,...,20) использованы для оценки степени плотности

упаковки Р(п) аминокислотного остатка в позиции п первичной структуры. Значение параметра ?(п) вычислялось усреднением в рамке из 5 аминокислотных остатков. Был осуществлен поиск локального сходства аминокислотных сегментов * исследуемого х-белка и белков из банка первичных структур.' Для этого рассчитывалась профильная кривая Pz(n) для данного белка и каждого белка из банка ?с(п). Сравнивались сегменты первичных структур длиной не мене 50-70 аминокислот. Такая длина выбрана из модельных расчетов. Критерием сходства двух сегментов являлось значение

гДк °2 ~ хг

Ыр = ralnl > (р <п) - PfnJ) / > Рт(п) |, где

1 Ol

Kx1 kq1 - начало; к^, kq2 - конец сравниваемых сегментов. Значение Мр $ мпорог служило для отсечки структурно сходных сегментов. При мпорог = о,16 * о.20 гомология двух сравниваемых сегментов длиной 50-7Q аминокислот составляла не менее 15-25% прямых совпадений аминокислот. Далее осуществлялось выравнивание таких выделенных сегментов с помощью стандартной - продцедуры. Впоследствии сделано усовершенствование метода. Помимо профилей плотности упаковки, по которым проводился собственно поиск сходных сегментов, рассчитывались кривые вероятной вторичной структуры для уже выделенных сегментов. Проводилась дополнительная фильтрация (отсечка) пар сегментов с использованием пороговых значений Мвтор.порог, как это описано выше для'Мпорог.

Из 11000 белков банка первичных структур мы выделили грушу лактатдегидрогеназ (LDH). Профили плотности упаковки LDH в области остатков 101-200 и белков F6.2 и С1.2 в области 31 - 160 хорошо коррелируют (М^р^ = 0.16) (Рис.6) Независимый расчет вероятных вторичных структур по Финкельштейну-Птицыну указывает на их сходство в этих сегментах. Первичные -структуры CI.2 и F6.2 сравнивались с тремя аминокислотными последовательностями лактатдегидрогеназ. Семантическое сходство ( в ед. а -стандартного отклонения от случайной последовательности с тем же (%) аминокислотным составом) CI.2 и i6.2 с этими белками колеблется от 7,4 до 6,1 в различных доменах, а интегрально для

Рис.6. Профили гиогтост упаковки белков 16.2, С1.2 и WH свиньи (U-chaln)

полных последовательностей ~4,3. Анализ гомологичных сегментов белков CI.2, F6.2 и iiDH позволил сделать вывод о вероятных функциональных свойствах этих белков. Их начало совпадает с никотинамид связывающими районами LDH. Консервативные остатки Arg, Asn, Ser, Asp, Arg, His (рис.7) формируют инвариантную вторичную и, возможно, третичную структуры в 1DH, Gl.2 и F6.2 белках (рис.6). Эти остатки образуют нуклеотид связывавдий домен. Поэтому белки CI.2 и Г6.2, вероятно, относятся к нуклеотид связывающим ферментам.

T6.2 RL UPON SGMKCSTEYKIFGAKFRD HL(QL)

C1.2 Kb 7QQN SSLKCSSEDAAFRFYTDE HL

LDH1 KL TVSN SG—CNLDSARPRYLMGE HG

LDG2 EL VAAÍI 4 SG—TSLDTARPROSIAE HG

LBH3 RL VATÍI SO—TIIiDTARTKFLIGE HG

R N S D R H

Рис. 7. Блоки атшокислот сравниваемых ЛДГ, содержащих ажнокислотие осжтш нажишического центра: F6.2, С1.2 - Gh.. ttwml, LDH1 - М cbaln - Pig, LDH2 - Lactobacillus easel, LDH3 - Bacillus stearotkermophllta.

Методика сопоставления параметрических характеристик вторичной и третичной структур белков применялась в задаче множественного выравнивания 80 аминокислотных последовательностей цитохромов Р-450. Гак выравнивание последовательности Р-450 cam и заметно отличающейся го длине структуры Р-450 1ш2 осуществлялось сканированием профильных кривых плотности упаковки (или вторичной структуры) друг относительно друга. Таким образом, семантическое сходство нескольких первичных структур рассматривалось как следствие аналогичности их конформаций. Из расчетов следует, что структурные особенности двух белков Р-450 cam и Р-450 1т2 сохраняются за исключением трех участков в Р-450 1ш2: {1-20}, {205-228}, {320-334} (рИС.8). С ЭВОЛЮЦИОННОЙ ТОЧКИ зрения именно эти сегменты могут связываться с клеточной мембраной или выполнять иные функции: они отсутствуют в бактериальной, но присутствуют в клеточных формах Р-450. Пови-димому, первый сегмент - гидрофобный якорь, второй - также трансмембранный сегмент, третий, содержащий заряженные аминокислоты, при "введении" его в трехмерную структуру cam '(она известна) будет расположен рядом с концом гидрофобного кармана, в котором расположен гем. Этот сегмент, вероятно, участвует в межмолекулярных взаимодействиях. Такая модель организации клеточной формы цитохрома Р-450 1ш2 (и иных форм) и представленный в Приложении элаймент 80 первичных структур из этого суперсемейства с гомологией некоторых лишь "20% - это аргументы в пользу продуктивности сопоставления параметрических образов высших структурных уровней при изучении эволюции белков.

Глава 5 Пептидные сегменты как мотивы. Изучение белков с локальной гомологией, -антигенных детерминант -и • взаимодействий структурных доменов.

В этой главе рассматривались принципы выявления инвариантных областей в белках, которые можно определить как "мотивы". В таком качестве выступают пептидные сегменты, участки вторичной структуры, пространственные кластеры. Алгоритм, использующий контекстные мотивы,применялся для поиска и интерпретации в банке аминокислотных последовательностей неизвестных (гипотетических) первичных структур, изучения структурных и функцио-

..................................55

1т2 МЕГЗЫ.ЫДАРЫСШЬЫ.РЕСНРКАНаКЬРРСРЗРЬРУЬаМйТОМС-----ИЛЖЗР

* * * * *

..................................55

113

1ш2 ЬРЛНЕ-КУСО-ТРРУУ1ЛЗКРТУУЬОСТБАГИиХУ1ХШ;АРЗСНСК1АУУБР1РаСУаА * * * * * **** * ** *

сага АУЪаЕ8Ы-№1)ГтКСКаСН-Уг1АТКС-0Ь1КЕАУЕВУБН-Р35ЕСРРГРРЕА0-ЕАУПР

99 168

1т2 1Р-----АКСЖУ1ШтаР5МТШШР0М0КНЗУШ^10ЕЕАЕСЪУт1НК5КСА1ДДЮ'

*. *** * * * **** ***** * *

сат 1РТЗ!£СРРЕШОРЕАЬАИ-07УСМ—РТТОК—Ы2®10ЕЬАСЗЫЕ31Л-Р0С-0СНЕХ

152

228

1ш2 ЬМН31Т51П1С31УРСКНРБУКВРТР1КЬЫ)1РР(^РЗЪ155РЗЗа7РЕ1РР0Р1И1РР

* * * * *

сат Е0УАЕ-РРР1НГРШ^-С1РЕЕВШ1ЬИХТС0!Л,Р======================Р

188

288

1т2 СТгай1УРтОЕ1КТР1СШ,тННАГ1Я)РЗОТКРР1БГЛЛР^Ша)КЗСРЗЗЕРННдаП1

***** *

сат Ш8МТРАЕАКЕАЬУВУ11Р11гСШа--КРаТ--ВА131-УАН-СаУН0КР1ТЗ-ВЕАК-

240

348

1т2 11ТУ1БЬРРАСТЕТАБТТЬРУаРШ*1КУРЕУТЕ^

***** ** ****

сат РЛСаЬ-1ЛУС0Ьга^ГГРКРЗШУ1АК8РЕ===============ННа-ЕЬ10НРЕ-Н1

282

407

1ш2 ТБАУ1НЕГ(тСБЬГРРСУРНТ7ТК1>ТОТНаТУ1РЮ1Тт,-РУ1£ЗАЬНРРКУРЕТРОТ * *** **** * ** **

сат РМСЕЕЫШФЗ-Ь7^--ЮЫ,8ПУВРНС7(ЛМ:0Ва1Ы1Р(Ш5С1г-ВЕК--ЖАС-

335

464

1гп2 РМРтГРЬБАМаАХКШЕОРМРРЗХСКЮ:СЬСЕЙIАРТЕЬРЫ1---РТТТШге31АЗРУР

* * * * * * *** ** * * ****

сат --Р1Ш-УБР0Р-СЖУЗ--НТТРСМааН1СЬС05ЪАШЕ11УТЬКЕ«ЪТК1РСРЗГАРСАа

389

491

1т2 РЫОТЬТРКЕЗаУСИТРРЗУСЦЮ'ЬАК *** *

сат Х-ОНК-ЗИУЗаУОАЬРЬУТОРАТТКАУ

415

Рис. 8. Алшнокислотние последовательности Р-450 1т2 и Р-450 сат, выравненные по профиля* платности, упаковки, и вторичной структуры.

нальных аналогов белков или отдельных сайтов, в прогностических задачах молекулярного взаимодействия белковых молекул.

Проведена идентификация первичной последовательности ламининсвязывавщего белка :из карциномы легкого человека, клонирование кДНК-овой копии которого было впервые осуществлено во Всесоюзном онкологическом научном центре АМН СССР. Эта последовательность отсутствовала в банке, за исключением короткого С-ковцевого сегмента аналогичного мышиного гена ("Р1К", 11-я версия ). В этой последовательности выделено несколько доменов, которые образуют трансмембранные субдоыены и ламинин-связыващий сайт. Его можно представить как 13 полиморфных повторов. Их функциональная нагруженность - связывание с ламинином и другими белками, мишени для фосфорилирования или О-гликозюшровашя (рис.9).

1. 2.

3.

4.

5.

6. 78. 9.

(216-218) (219-223) (224-230) (231) (232-240) (241,242) (243-247) (248-250) (251-259) 10. (260-268)

11. (269-272)

12. (273-277)

13. (278-285)

1 2 3 4 5

_ Рго А1а Рго

- - - ' Тйг -

б1п Рго бШ Уа1 А1а

- - - в!у Уа1

б1п Уа1 Рго Бег Уа1

- - Рго Не

01п РЬе Рго Т1гг б1и

б1п Рго А 1а Игг й1и

- А1а Рго Игг А1а

б1п - А1а ТЬг б!и

6 7 8 9 01и РИе б1п б1у

б1и Тгр ТЫ А1а

Й1и РЬе Т1гг А1а

_

Азр Тгр Бег Ии

Азр Тгр Бег А1а

Аэр Тгр Бег А1а

Ткг

Уа1 А1а №г ТЪг |Агр Т11Г Бег

Рис. 9. Вероятная С-концевая ашнокислотая последовательность лаюшинсвязиващего белка, начиная с 216-го остатка. Последовательность разбита на 13 полилорфпых подтрод.

lii

Результаты по изучению пространственной сопряженности ами-

¿áfi

•.•!_►_,..„....._(„,:

ной структуры: а-(3), р-(4), изгибы атнокислстюй цепи-ÇS) Жирной линией выделены участии потенциальных антигенных детер-шнат ÏÏPE.

i

¡нокислотных остатков (табл.1) 4(применялись при изучении возможных антигенных областей в 3 нуклеопротеине Ebola-вируса.

Введено понятие "антимотива" 2 ¡("знтиконсенсуса") - в данном случае пептидного сегмента, состоящего из АО, пространственно сопряженных остаткам выделенного "мотива". Наряду с оцекка-Рис.10.Профили тиогтосш упаков- ш кошартментализации, вторич-ш (1),гидрофоаносгт (2),вторич- ной структуры, степени экспони-

рованности, аминокислотного состава для прогнозируемых зпито-лов белка го>Е (рис.10), определены участки аминокислотных последовательностей, которые претендуют на роль регепторов для этих впитопов. После их идентификации в банке первичных структур оказалось, что некоторые из них принадлежат к рецепторннм областям иммуноглобулинов и Т-клеточных рецепторов. Для первого сегмента NPE (327-340) -"HGSTIAGVïïvgeqy" пространственно сопряженный (*) антиконсенсус выглядит так: 333

—> GÏNVGEQÏ---> NPE

* # * * * *

<---W А . . N К N D <---IG

54

Сегмент "Dnxn..aw" лежит в гипервариаоельной области IG (легкая цепь - IG Kappa chain precursor Y-IV region human).Возможно, аналогичный IG домен способен связываться с остатками сегмента I в NPE. Этими результатами мы аргументируем антигенную значимость сегмента 327-340 (I) в белке ИРЕ.

Для второго сегмента (544-563) "LTDKDRRNEPSGSTSPraíLT" выделены:

I) Т-клеточный рецептор ( T-cell receptor alpha chain pre-

cursor V region (НРВ-МЪТ)- human (fragment)) Б направлении C<- H по отношению к направлению сегмента II:

554

---> SGS.TSPE--> NPE

зфс ^ з^с ^ ^

<---ÏLYYIÏÎ <---T-cell receptor

48

2) iG-домен в гипервариабельной области легкой цепи иммуноглобулина ( легкая цеггь Ю epsilon chain С region - human) ( 4855) в направлении С <- и:

555

---> OSTSPRII---> NPE

<---1 Т И ï ï G H I <---IG

48

Таким образом, для первого и второго сегментов, существуют иммуноглобулинподобные домены из остатков, пространственно сопряженных АО сегментов.Эти домены образуют рецепторные области в иммуноглобулинах либо формируют Т-клеточные рецепторы.

Полученные результаты подтверждают возможность существования антигенных сайтов в области сегментов I и II белка NPE.

Все описанные шше метода анализа структурно-функциональных элементов в белках были реализованы в виде программ на алгоритмическом языке Fortran IY и адаптированы на ЭВМ EC-IQ60. Некоторые из них ("Motiv", "Profile") подготовлены для эксплуатации на ПЭВМ типа IBM РС/АГ.

В Заключении кратко рассмотрены предпосылки для развития и совершенствования методов в изучении белковых молекул: экспериментальных , теоретиче ских, информационных.

выводы

1.Показано, что существует связь между функционально допустимыми аминокислотными заменами в ходе эволюции белков и пространственным окружением аминокислотных остатков. Конформация и биологическая функция белка определяются степенью сопряженности соседних аминокислотных остатков в его первичной и третичной структурах.

2. На этом основания разработан метод прогноза функционально допустимых мутационных замен. В панкреатических РНКазах млекопитающих правильно определены более 70% замен аминокислотных остатков. Остатки нуклеазного сайта прогнозируются неизменными. Области антигенных детерминант локализованы, как наиболее вариабельные.

3. Установлено, что короткие пептидные сегменты, участки вторичной структуры, параметры плотности упзковки (координационные числа) аминокислотных остатков в третичных структурах - это структурные инварианты (мотивы) белков, определящие их функциональную адекватность в ходе эволюции. Разработаны методы сопоставления этих инвариантов для:

а) итерпретации произвольных аминокислотных последовательностей по банку первичных структур;

б) множественного выравнивания слабо гомологичных структур;

в) определения функциональных областей в белках.

4 Проведена идентификация ламининсвязывающего белка человека из карциномы легкого человека. Белки С1.2 и F5.2 из ткане-специфического пуфа КВа Chironomus Thummi отнесены к нуклеотид связывающим ферментам.

5. Осуществлено множественное выравнивание 80 первичных структур цитохромов Р-450. Построена структурнзя модель цитохро-ма irte, и других форм. Модель позволяет описать взаимодействие этого белка с мембраной эукариотической клетки.

6. Локализованы антигенные детерминанты в нуклеопротеине Ebola вируса методом сопоставления пространственно комплементарных пептидов - аналогов иммуноглобулинподобных доменов.

Материалы диссертации изложены в следующих работах:

I. Лукашев В.А., Бакинский А.Г., Куличков В.А. Влияние пространственной сопряженности аминокислотных остатков на допустимость мутационных замен в глобулярных белках// Молекулярная биология. - 1986. - т.20, N.5. - C.II92-I2Q2.

2 Лукашев В.А., Куличков В.А. Влияние распределений соседних аминокислот в первичных структурах на допустимость мутационных замен в глобулярных белках// Тезисы докладов 3-го Всесоюзного совещания "Теоретические исследования и банки данных по молекулярной биологии и генетике". - Новосибирск, 1988. - G.I36.

3. Лукашев В.А., Блинов В.М., Богачев С.С., Власкин Н.В. Поиск гомологичных пептидных сегментов по профилям их экслониро-ванности и вторичной структуры// Там же. - С.55.

4. Каргинов В.А., Лукашев В.А., Блинов В.М., Модель структурной организации множественных форм цигохрома Р-450 // Тезисы докладов 5-й Всесоюзной конференции "Цитохромы Р-450 и модификация макромолекул". - Ялта, 1989. - C.I87.

5. Karginov V.А., Lukashev Y.A., Blinov V.M. Model of structural organisation of cytochrome P-450 multiple iorms// Abstraots oî the International Conférence "Modelling and computer methods in molecular biology and genetios". - IJovosibirsk, 1990,- P.81.

6. Блинов В.М., Лукашев В.A., Сиянова Е.Ю., Трояновский С.M., Самуков В.В. Адгезия между различными типами клеток и роль лиганд-рецепторных взаимодействий между ламинином и рецептором ламинина в клетках// Тезисы Всесоюзной школы "Молекулярно-клеточные механизмы иммунной регуляции гомеостаза и проблемы математического моделирования". - Красноярск, 1990. - С.8-9.

7. Лукашев В.А., Куличков В.А. Влияние распределений соседних аминокислот в первичных структурах на допустимость мутационных замен в глобулярных белках.// Биофизика. - 1990. - Т.35, N.2. - С.236-241.

8. Сиянова Е.Ю., Лукашев. В.А., Блинов В.М., Трояновский С.М. Определение и анализ первичной последовательности ламинин-связывавдего белка человека// ДАН СССР. - 1990. - T.3I3, N.I. -

С.227-231.