Бесплатный автореферат и диссертация по биологии на тему
Межмолекулярное узнавание в глобулярных белках Брукхейвенского банка данных
ВАК РФ 03.00.04, Биохимия

Текст научной работыДиссертация по биологии, кандидата биологических наук, Линде, Дмитрий Михайлович, Москва

/ \

РОССИЙСКАЯ АКАДЕМИЯ МЕДИЦИНСКИХ НАУК НАУЧНО-ИССЛЕДОВАТЕЛЬСКИЙ ИНСТИТУТ БИОМЕДИЦИНСКОЙ химии

На правах рукописи УДК 577.15

Линде Дмитрия Михайловича

"Межмолекулярное узнавание в глобулярных белках Брукхейвенского банка данных"

(специальность 03.00.04 - биологическая химия)

Научные руководители: доктор биологических наук, профессор В.В.Поройков; кандидат физико-математических наук Л.Н.Дроздов-Тихомиров

Диссертация на соискание ученой степени кандидата биологических наук

Москва/ 1999

ВВЕДЕНИЕ 4

ГЛАВА 1. ОБЗОР ЛИТЕРАТУРЫ 7

1. Межмолекулярное узнавание. Определение, 7 роль в функции и структурообразовании.

2. Норма и патология. 9

3. Типы межмолекулярного узнавания, силы его 10 стабилизирующие, аффинность и специфичность узнавания.

4. Данные рентгеноструктурного анализа 2 4 белковых молекул. Внутри- и межмолекулярное узнавание.

5. Концепция о существовании общего 34 стереохимического генетического кода Меклера

и гипотеза о комплементарности пептидов.

6. Ресурсы компьютерной сети Интернет по 4 6 молекулярному узнаванию.

ГЛАВА 2. МАТЕРИАЛЫ И МЕТОДЫ 52

1. Описание выборки контактов для 317 52

негомологичных белковых комплексов из Брукхейвенского банка данных

2. Создание реляционной базы данных для 61 изучения контактных участков в белках.

3. Тестирование работы программного 7 0 обеспечения на примере молекулы лизоцима.

ГЛАВА 3. РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ 75

1. Анализ аминокислотного состава контактных 75 областей белков исследуемой выборки.

2. Распределение пар аминокислотных остатков 83 в контактах белковых комплексов. Анализ физико-химических свойств аминокислотных остатков в межбелковом взаимодействии.

3. Сравнительный анализ пар аминокислот, 86 встречающихся в межмолекулярных и внутримолекулярных контактах.

4. Сравнение наблюдаемых частот 92 встречаемости пар аминокислотных остатков в контактах с ожидаемыми на основе гипотез о

кодах комплементарности.

5. Анализ наблюдаемого в белках минимального 92 числа контактов, определяющего

стереоспецифичность межмолекулярного узнавания.

6. Поиск универсального кода 96 комплементарности аминокислотных остатков.

ВЫВОДЫ 101

ЗАКЛЮЧЕНИЕ 103

ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ 10 6

ЛИТЕРАТУРА 108

ВВЕДЕНИЕ

Установление принципов межмолекулярного узнавания в белках необходимо для понимания механизмов структурообразования и

функционирования белковых систем, отвечающих за клеточный метаболизм, морфогенез, самосборку субклеточных структур, иммунный ответ и ряд других физиологически важных функций организма.

До недавнего времени изучение белок-белкового взаимодействия проводилось преимущественно

экспериментальными био- и иммунохимическими методами, с использованием которых можно получить данные о наличии или отсутствии аффинитета двух молекул белковой природы по отношению друг к другу и оценить соответствующие константы связывания |^ап:1п, 1996] . Эти методы, однако, позволяют лишь косвенным образом судить о роли конкретных аминокислотных остатков в

межмолекулярном узнавании, что существенно снижает возможности использования получаемой с их помощью информации в прогностических целях.

В условиях когда возможности

экспериментальных методов в предсказании контактных областей в белках и пептидах ограничены, было выдвинуто несколько

умозрительных феноменологических гипотез о кодах, описывающих предпочтительные взаимодействия между отдельными парами аминокислотных остатков [Меклер, 1982; В1а1оск, 1986; ТгорБИа, 1992]. Эти гипотезы подвергались экспериментальной проверке

путем оценки констант связывания сенс- и антисенс пептидов, однако, имеющиеся к настоящему времени результаты этих экспериментов неоднозначны [СГиггак, 1993] .

Достигнутые за три последних десятилетия успехи в расшифровке пространственной структуры белков предоставили обширную информацию о структуре как мономерных белков, так и белков, состоящих из нескольких субъединиц, а также белковых комплексов [Е1зеп11аЬег, 1995] . Наличие данных о декартовых координатах атомов, принадлежащих к двум различным взаимодействующим белковым субъединицам, дает возможность прямого анализа межмолекулярных контактов, исследования роли различных аминокислотных остатков, входящих в контакты, проверки некоторых высказанных ранее феноменологических гипотез о кодах

комплементарности, предсказывающих пары

аминокислотных остатков, обеспечивающие

взаимодействия между субъединицами в белковых комплексах.

Очевидно, что при проведении такого рода анализа необходимо использовать данные о пространственной структуре молекул, отличающихся аминокислотной последовательностью, поскольку речь идет о поиске общих закономерностей, присущих самым разнообразным белкам [Поройков, 1975].

Возможность получения статистически

достоверных оценок состава и структуры контактных областей возникла сравнительно недавно, когда

число негомологичных белковых комплексов, содержащихся в Брукхейвенском банке данных [Bernstein, 1977; Hobohm, 1994] составило более трехсот.

Целью диссертационной работы является анализ закономерностей организации контактных участков в негомологичных белках, состоящих из нескольких субъединиц, и белковых комплексов из

Брукхейвенского банка данных, и оценка на этой основе состоятельности гипотез о кодах комплементарности, предсказывающих пары

аминокислотных остатков образующих контакты между субъединицами белок-белковых комплексов.

ЗАДАЧИ ИССЛЕДОВАНИЯ

1.Анализ аминокислотного состава контактных областей в белковых комплексах и его сопоставление с общим аминокислотным составом белков.

2.Изучение распределения пар аминокислотных остатков в контактных областях по сравнению с наблюдаемой общей статистикой контактирующих пар аминокислотных остатков в белках.

3. Сравнительное изучение распределения пар контактирующих аминокислотных остатков в меж- и внутримолекулярных контактах.

4. Сравнение наблюдаемого распределения пар контактирующих аминокислотных остатков с ожидаемым на основании предложенных в литературе кодов комплементарности,

предполагающих особую роль контактов между отдельными аминокислотными остатками. 5.Определение минимального числа контактов, соответствующих различным кодам

комплементарности в рассматриваемой выборке белок-белковых комплексов. 6.Поиск универсальной матрицы комплементарности, объясняющей структуру наблюдаемых контактов в белках из Брукхейвенского банка данных.

ГЛАВА 1. ОБЗОР ЛИТЕРАТУРЫ.

Межмолекулярное узнавание: определение, роль в функции и структурообразовании

Термины лмежмолекулярное узнавание',

^молекулярное узнавание' и лмежмолекулярное

взаимодействие' применяются для описания физико-химических процессов, протекающих в биологических системах с участием высокомолекулярных

соединений: белков, липидов, нуклеиновых кислот. Изучение молекулярного взаимодействия в различных системах является важной задачей биохимии и фармакологии.

П.В.Сергеев описывает молекулярное

взаимодействие следующим образом [Сергеев, 1996]: "Взаимодействие биомолекул основано на принципах молекулярной сигнализации и молекулярного узнавания. При этом одна молекула служит сигналом, а другая этот сигнал узнает, т.е.

отличает одну молекулу от другой." "Узнающие системы" определяются как сложные биологические структуры, которые не только отличаются высоким сродством к тем или иным лигандам, но и состоят из нескольких частей, отвечающих за ориентацию, притяжение и связывание лиганда, а также за последующую трансформацию сигнала, который "несет" лиганд.

Примерами "узнавания" биомолекул могут быть взаимодействия фермент-субстрат, лиганд-рецептор, антиген-антитело. Молекулярное узнавание

биомолекул является определяющим в процессах биосинтеза белка, репликации нуклеиновых кислот, метаболизма и энергетических превращений веществ в клетке, клеточного цикла, взаимодействия клеток [Попов, 1989].

Процессы межмолекулярного взаимодействия в биосистемах необычайно сложны, включают

последовательное или одновременное вовлечение нескольких различных молекул и протекают чаще не в растворе, а с участием поверхности, как правило - биомембраны. Взаимодействия белок-лиганд в мембранах определяются не только структурой этих молекул, но и прослойкой связанных, или аннулярных, липидов, которые обеспечивают правильную стереохимическую

ориентацию компонентов будущего комплекса [Сергеев, 1996].

Для осуществления специфической биологической функции всегда необходимо сохранение нативной конформации белка [Дашевский, 1974]. В то же

время, конформационная лабильность отдельных участков макромолекул обеспечивает специальные возможности передачи информации в регуляторных процессах [Волькенштейн, 1965; Дашевский, 1987]. В формировании пространственной структуры белка участвуют различные факторы - стремление каждого аминокислотного остатка сохранить свою

конформацию и, с другой стороны, взаимодействия отдельных участков в аминокислотной

последовательности, которые приводят к наиболее энергетически выгодным состояниям и формированию белковой глобулы. Это обстоятельство привело к тому, что в данной области создалась "такая редкая для науки ситуация, когда имеется эксперимент, но нет ни одной конструктивной теории, которая могла бы его объяснить и предсказать" [Дашевский, 1974].

Норма, и патология.

Число различных белков в организме человека оценивают в 100000. Они составляют около 45% сухого веса организма, т.е. значительно больше веществ любого другого класса [Мушкамбаров, 199 6] . Иногда даже небольшого изменения молекулярной структуры белка достаточно для того, чтобы вызвать необратимые структурные изменения и привести к патологии. Классическим примером такого "молекулярного" заболевания [цит. по Фогель, 1989] является серповидноклеточная анемия. Гемоглобин серповидных

эритроцитов(гемоглобин Б) отличается от

нормального заменой только одной аминокислоты, глутаминовая кислота в б-м положении (3-структуры замещена валином. Эта замена влияет на растворимость и способствует кристаллизации гемоглобина в условиях гипоксии, молекулы гемоглобина полимеризуются с образованием пучков и волокон. Аномальные кристаллы гемоглобина нарушают структуру мембраны эритроцитов и обуславливают их серповидную форму. Серповидные клетки увеличивают вязкость крови и мешают ее нормальной циркуляции, особенно при

микроциркуляции в тканях.

Типы межмолекулярного образования, силы его стабилизирующие, аффинность и специфичность

узнавания

Как известно [Шульц, 1982], невалентные взаимодействия обеспечивают формирование и стабилизацию белок-белкового комплекса.

Существует несколько типов таких взаимодействий: дисперсионные силы, электростатические

взаимодействия, водородные связи и гидрофобные взаимодействия. Роль различных невалентных взаимодействий в образовании нескольких белковых комплексов отражена в таблице, приведенной ниже:

Вклад различных видов взаимодействий, обеспечивающих контакты между белками в шести белковых комплексах [цит. по Шульц, 1982]

Белок Название Число контактов:

комплекса вандер- водородных солевых

ваальса связей мостиков

Оксигемоглобин А1В1 10 5 0

лошади А1В2 80 1 0

Дезокси- А1В1 98 5 0

гемоглобин

лошади А1В2 69 1 1

КонканавалинА 1-2 250 14 0

1-3 156 4 2

1-4 16 2 0

Инсулин ОР 111 4 0

OQ 99 2 1

а-Химотрипсин А 143 8 1

В 57 6 0

Таким образом, данные этой таблицы свидетельствуют о наличии большого набора контактов, стабилизирующих комплекс. Понятно, что наличие комплементарных поверхностей, т.е. геометрической комплементарности контактирующих участков белковых глобул является важным условием для реализации максимально возможного количества контактов [Germain, 1993]. При этом, важным параметром взаимодействия является размер контактной поверхности. Было исследовано [Janin, 1990] 15 комплексов протеаза-ингибитор и антиген-антитело. Найдено, что поверхность среднего контакта составляет 1500 А2 и, как показано в таблице ниже, может включать в среднем около 10 водородных связей.

Структура 11 комплексов протеаза-ингибитор и 4-х комплексов антиген-антитело [Janin, 1990]

Комплекс Число Поверхность Число

аминокислот контакта (А2) водо-

--------------- -------------- родных

молекулы: молекулы: связей

1 2 всего: 1 2 всего:

Комплекс протеаза-ингибитор: Карбоксипептидаза А-

ингибитор к.п. картофеля 17 + 11 = 28 650 + 700 = 1350 6

Химотрипсин-овомукоид 21 + 11 = 32 650 + 800 = 1450 10

Эластаза-овомукоид 19 + 13 = 32 600 + 700 = 1300 10

Протеаза В-овомукоид 18 + 13 = 31 600 + 650 = 1250 8

Калликреин-РТ1(*) 21 + 13 = 34 650 + 750 = 1400 10

Трипсин-РТ1 19 + 11 = 30 650 + 750 = 1400 13

Трипсиноген-РТ1 17 + 13 = 30 650 + 750 = 1400 11

Трипсиноген-поджелудочный

секреторный ингибитор 25 + 15 = 40 800 + 950 = 1750 13

Трипсин-соевый ингибитор 24 + 12 = 36 650 + 800 = 1450 14

Субтилизин-химотрипсин

ингибитор 2 29 + 10 = 39 700 + 900 = 1600 10

Субтилизин-эглин С

пиявки 24 + 11 = 35 650 + 850 = 1950 12

Комплекс антиген-антитело:

РаЬ 01.3-лизоцим 13 + 14 = 27 600 + 650 = 1250 12

РаЬ НуНЕЬ-лизоцим 18 + 12 = 30 800 + 800 = 1600 11

РаЬ НуНЕЬ-лизоцим 19 + 15 = 34 850 + 750 = 1600 13

ЕаЬ ЫС41-нейраминидаза 20 + 19 = 39 950 + 1000 1 = 1950 10

* - РТ1, панкреатический ингибитор трипсина

В комплексах "протеаза-ингибитор" 10-15 аминокислот ингибитора формируют контакт с 17-2 9 аминокислотами протеазы. Такая асимметрия объясняется геометрическими особенностями

контакта: петля, формирующая выступ в молекуле ингибитора, взаимодействует с полостью,

формирующей центр связывания фермента. В комплексах "антиген-антитело" взаимодействующие поверхности формируются схожим количеством аминокислот. Среднее количество аминокислот, входящих в контакты в разных комплексах: 34+7 [Janin, 1990]. Поверхность отдельных

контактирующих областей в белках составляет от 600 до 1000 А , это примерно 5% общей поверхности крупных белков, таких как карбоксипептидаза, и примерно 2 0% общей поверхности небольших. Средняя площадь контактов для разных комплексов: 1600+350 А2. Химический состав контактирующей поверхности для среднего белка: 55% неполярных, 25% полярных и 2 0% заряженных групп. В контактах антител примерно половину составляют ароматические аминокислотные остатки. Количество водородных связей примерно одинаково (8-13) для всех рассматриваемых комплексов [Janin, 1990] .

Большинство антител распознают

топографические структуры на поверхности белка -эпитопы, обладающие конформацией нативной молекулы [Hodges, 1988]. Антитела, образующиеся в ответ на введение нативного глобулярного белка слабо взаимодействуют с денатурированными препаратами данного белка, а антитела к нативным белкам обычно гораздо слабее взаимодействуют с пептидами, имеющими ту же первичную структуру [Lawrence, 1993]. При картировании индивидуальных эпитопов с помощью гомогенных моноклональных антител обнаружено, что эти эпитопы часто включают аминокислотные остатки, которые

расположены далеко друг от друга в аминокислотной последовательности, но собраны в один эпитоп в результате упаковки полипептидной цепи в нативном белке [Dyson, 1988] . При изучении взаимодействия антител с небольшими органическими соединениями -бензолсульфонатамии и бензоларсонатами было выявлено, что для эффективного взаимодействия более существенна общая конфигурация гаптена, а не его химическая природа. Гаптен распознается по трехмерной форме наружного электронного облака, а не по его способности к участию в химических реакциях[цит. по Ройт, 1991].

На определении конгруэнтности двух

поверхностей основан геометрический подход для предсказания мест связывания белков [Sandak, 1998]. Для белков с известной пространственной структурой перебирают обширный набор

относительных расположений двух контактирующих молекул в пространстве. Время вычисления зависит от количества атомов в молекуле. Алгоритм [Katchalski-Katzir, 1992; Vakser, 1994]

представляет молекулу белка как дискретную функцию в многомерном пространстве которая определяет внутреннюю часть молекулы и ее поверхность. Используя анализ Фурье, оценивается степень совпадения поверхности двух молекул и производится сканирование по всей молекуле. В результате получается набор параметров, характеризующих степень геометрического

совпадения поверхностей. Данным методом было предсказано строение пяти комплексов: Гемоглобина

человека (код PDB - 2ННВ); Метгемоглобина лошади (2МНВ); тРНК-синтетазы и тирозинил аденилата (1TS1); Аспарагиновой протеиназы с ингибитором (3 APR) ; Трипсина с ингибитором (2РТС) . Однако, для комплекса 2PTC/4PTI не было найдено предпочтительного расположения двух молекул друг к другу. Авторы объясняют этот результат наличием существенных конформационных изменений в активном центре трипсинового ингибитора. Данный метод может быть использован также для предсказания структуры неизвестных комплексов по двум известным компонентам, когда конформационные изменения при взаимодействии малы. К недостаткам геометрическо