Бесплатный автореферат и диссертация по биологии на тему
Статистические свойства гетерополимерных глобул и предсказание белковых структур
ВАК РФ 03.00.02, Биофизика
Автореферат диссертации по теме "Статистические свойства гетерополимерных глобул и предсказание белковых структур"
• 1 •.' ' (■ М
МОСКОВСКИ* ОРДЕН* ТРУДОВОГО КРАСНОГО ЗНАМЕНИ •ИЭИКО-ТЕХНИЧЕСКИЯ ИНСТИТУТ
На правах рукописи
БАДРЕТДИНОВ Азат Явятовяч
УДК 577.32
СТАТИСТИЧЕСКИЕ СВОЙСТВА ГЕТЕРОПОЛИНЕРНЫХ ГЛОБУЛ И
ПРЕДСКАЗАНИЕ БЕЛКОВЫХ СТРУКТУР
03.00.02 - Бяофязяка
Автореферат дяссертацяя на соискание ученой стелена кандидат» фязяхо-математячэскях нгук
Москва - 1992
Работа выполнена в Институт» Белка РАН Научный руководитель - ' доктор фаэако-иатекатвчвсках наук.
А. В. «анкельштейн.
Официальные оппоненты
член-корреспондент РАН. профессор А.('.Хохлов
доктор физико-математических наук, профессор В.И.Иванов
Ведущая организация
Институт высокомолекулярных соединена! РАН
г.
часов на
Защвта состоатся ' ^ ^ О^ 19ъС __
заседании Специализированного Ученого Совета К. 063.91.10 пра МФТИ по адресу: 141700. г. Долгопрудный Московской обл.. Инстатутски! пер. , 9, Московская фаэако-техническа! институт.
С диссертацией можно ознакомиться в библиотеке Московского физико-технического института.
Автореферат разослан >с«у 199,^^
Учены! секретарь совета кандидат физико-математических н*ук
/В. Б. Кареев/
ОБШЛЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность томи. Развитие белковой инженерии открывает возможность получения полипептид.чых цепей с совершенно попой первичной и пространственной структурой. Эта возможность заставляет по-нопому взглянуть на залачу предсказания .¿ехмерной структуры белка по его аминокислотной последовательности. Прогресс п нетодах предсказания не только облегчит расшифровку структуры белков в кристалле и в растворе, но и поможет в создания болков с наперед заданными свойствами. Развитие теоретических подходов к предсказанию белковых структур не только удовлетворило бы научное любопытство, но и способствовало бы эффективному решению конкретных задач белковой и1гженерип.
Целые работы является исследование пределов точности предсказания структуры глобулярных белков при неполной или неточном
знании энергетических параметров, определяющих стабильность их
»
пространственных структур и. в частности, выяснение пределов точности предсказания а-спиральной структуры глобулярных болков на основе физической теории вторичной структуры развернутых полипептидных цепей.
Научная новизна я практическая значимость. В настоящей работе впервые установлено существование универсальной тенпературы, присущей стабильным пространственным структуран гегерополкмеров со случайным» и "квазяслучайными" (как в глобулярных белках) последовательностями. Эта конфорнационная температура определяет жесткость отбора нязкоэнергетических элементов структуры - как микроскопических деталей, так и целых мотивов укладки цепи в глобулярных белках - и, тем самый, она определяет наблюдаемую частоту встречаемости различных элементов в архитектурах нативных белков. Эта же температура оказывается наилучшей я для предсказания структуры глобулярных белков. и для их самоорганизации in vitro
Полученные результаты, а также утотение энергетических параметров вторичной структуры полипептидов, позволяли завершить построение количественной физической теори-.. вторичной структуры а-спиральных глобулярных белков.
Апробация работы. Натериагы диссертации докладывались на Международной школе - семинаре "Современные проблемы физической
химии макронолекул" (Пущино. СССР. 1991 г. I, на Носковском семинаре по теории полимеров (Москва, СССР, 1991 г.), на I Иэраильско-советском семинаре по белкам и пептидам (Реховот, 1990 г.), на ежегодно* научной конференции (Пущино, 1992), 1 Японской конференции по белковой инженерии (Цукуба. 1992), VIII Международном иммунологическом конгрессе (Будапешт, 1992).
Публикации. По теме диссертации имеется 6 публикаций.
Структура и объем работы. Диссертационная работа изложена на 120 страницах машинописного текста, содержит 21 рисунков, 11 таблиц в список цитируемой литературы. включающий 216 наименований. В составе диссертации - следующие разделы: Введение-, Глава 1, содержащая литературный обзор теоретических и практических подходов к проблеме предсказания пространственной структуры белков; Глава 2. в которой исследуются физические причины существования квазибольцмановской статистики в архитектуре белковых глобул; Глава 3, в которой излагается новый подход к предсказанию трехмерной структуры глобулярных белков при неполном знании энергетических параметров; Глава 4, посвященная уточнению энергетических параметров а-структуры в развернутых полипептидных цепях и применению полученных результатов для предсказания вторичной структуры белковых глобул; Заключение-, Выводы: Список цитируемой литературы.
содержание: основной части работы
1. Физические причины существования квазибольимановской статистики
белковых структур.
Любой расчет, любое предсказание белковой структуры базируется на каких-то энергетических параметрах, причем оценка самих этих параметров никогда не может быть абсолютно точной и полной.
Исследование возможности предсказания структуры белка при неполном знании энергетических параметров ны начинаем с вопроса: что можно сказать о состоянии какого-то элененга белковой структур»! на основе одних только его внутренних взаимодействий? С первого взгляда - ничего: ведь при этом нам неизвестна львиная доля взаимодействий, определяющих точку минимума термодинамического
потенциала и. тен саиын, - нативную пространственную структуру белковов цеп*. Ситуация, однако, не столь безнадежна: хотя однозначно предсказать состояние интересующего нас элемента (например, угла х данноИ боково! группы или глубину ее погружения в глобулу) невозможно, мы все же можем сказать, какие состояния этого элемента практически невероятны, какие - возможны, к какие -наиболее вероятны (рис. 1). Лело в том, что в белках, как известно.
■г -i э
¿»G,, ь со t' ^oi
с
V кг W
Рис. 1. А) Корреляция между свободными энергиями переноса боковых групп аминокислот (обозначенные однобукввнным кодом). ДО«-КТ1п(:
"свободная энергия переноса" с поверхности белка в его внутреннюю часть. Т=ЭООК. Статистический вес С - ( N /£Н )/(N /ГМ ), где И и
М
количества остатков данного типа, находящихся на поверхности
ьнутрн глобулы, соответственно.
АС.
экспериментально полученные
значения свободных энергий переноса из воды в органический растворитель 1 Fauchere i PlisV.a, 1983). S) Корреляция между торсионными энергиями. üG^-RTlnfm^) "потенциал" из белковой
статистики (пунктир); п_ - число боковых групп с одним С атомом и
i' 7
торсионным углон x^-.fís" ( KcGrorjor, Islán, Sternb-эгт, 1987); AG -энергия боковой группы -С Н^ при различных углах * . рассчитанная по потинциалам Ликпори (Do Santis, Liquori, 1071). ñ<5(180°) и 180°) приняты за ноль. В обоих рисунках - Л и Б - наблюдается четкая корреляция, хотя и не идеальная.
наблюдается статистическая зависимость встречаемости различных состояний элементов от их внутренней энергии. Эта зависимость по форме похожа на распределение Больцнана:
ВСТРЕЧАЕМОСТЬ - ехр[-Э11ЕРГИ Я/Т. ].
причем входящая в белковую статистику "конформационная температура" Та оказывается порядка комнатной (Pohl, 1972).
Выяснении физической причины существования такой "квазибольцмановской" зависимости и посвящена глава 2.
Ясно, что наблюдаеная в белках статистика не сводится - при всем внешнем сходстве - к термодинамической статистике Польцмана. Более того, между ними существует кардинальное отличие.
Статистика Больцмана следует из равновесия переходов между различными состояниями погруженной в термостат системы; она показывает, какую долю времени каждая такая система проводит в .ом или инон состоянии.
В белковой глобуло нет никаких переходов из одного состояние элемента в другое (если отвлечься от редких, ненаблюдаемых ренгиноструктурным анализом флуктуаций - которые, действительно, должны подчиняться статистике Больцмана - но при этом зависеть не столько от внутренних, сколько от значительно более мощных "внешних" взаимодействий каждого элемента с остальной глобулой), В белке каждый элемент фиксирован глобулой - причем в одном белке (скажем, ниоглобине) - так, а в другом (скажем, трипсине) - иначе, белковая "квазибольцмановская" статистика не относится (в отличив ог настоящей статистики Больцмана) к состоянию каждого отдельного элемента - она возникает только, если рассматривать совокупность однотипных элементов в различных белках.
Почему, тем не менее. распределении типа больцмановского является справедливым в бедках? П чем смысл "температуры", управляющей дто8 квазибольцмановской статистикой?
Для ответа на эти вопросы оценим долю тех первичных структур, ч го стабилизируют конформацию с данным элементом р, имеющим фиксированную внутреннюю энергию с . Поскольку энергия конфорнаци и складывается из множества различных взаимодействий с( (контактов, изгибов и т.д.), доля первичных структур. для которых энергия дпнной пространственной структуры неньше пороговой величины F ,
согласно центрально! предельной теорене, равна:
Гс (Го)-- ехр
(И -Е-(е -с )'
» р Р
2 <т
здесь Е я с - средняя по всем первичным структурам энергия
* г
конформацни я структурного элемента р, соответственно, а с дисперсия энергия коиформации Предполагая. что каждое взаимодействие мало по сравнению с суммой других взаимодействий,
можно разложить показатель стэпени в ряд по степеням с . Это дает
р
выражение, ядентячков формуле Больцнана:
Гс <Р.» " Гс-.о<г.>-е*Р'- Г>< р р •
( 2)
прячем Г,.^) -
зависят от величины с , а эффективная
р
конфорчациакная температура определяется формулой
Т. =» -[агпГ/ЭЕ]"1 « £Г2/<Е-Г0) (3)
В случае конкуренции М компактных структур только между собой (денатурация типа "нативноо состояние - расплавленная глобула") пороговая энергия Т равна самоусредняющейся (согласно ЗЬак1тоу1сЬ 4 Gutin. 1990) энергяя нижнего края спектра энергий компактных конфорнаций готерополямвра:
^=Ё-(2(г21пН>1/г (4)
Нря этом хонформациснная температура Т^ спппадает с г.ригпическод гемпературоЯ Т в теории Шахнорича-Гутина. описывающей формирование уникальной пространственной структуры гетерополимеров (рис.2). Ниже критической температуры Т^-сг/(21пМ)1/_ число термодинамически релевантных состояний цепи станопится, по порядку величины, равнин еляниге. Это качественно проясняет загадку величины нонфоркапионной
температуры квазибольцмановской статистики в белках - при температурах выше критической реализуется множество состоянии, и внутри одной последовательности (а значит я во всем множестве первичных структур) наблюдается "обычная" Больцмановская статистика
In m.
<E-ty/8
Рис. 2. Гистограмна спектра энергий типичной случайной последовательности. В соответствии с теорией Шахновича-Гутина. гистограмма аппроксимирована параболой, касательная к которой в точке пересечения с осью абсцисс определяет критяческую температуру "вымораживания" структуры с минимальной энергией. Е^ - средняя по
в сем конпакткьж конформациям энергия цепи. П1с - число конфорнаций цепи с
энергией ЕЮ, 5. Все энергии, на этом я последующем рисунках даны в
единицах В, где В2 - дисперсия энергия элементарного взаимодействия (контакта) в случайной последовательности.
1о-
П-П,
чв
Рис. 3. Л) Одна из 103346 возможных укладок цепи из 27 звеньев (жирная линия) на кубической решетке размером 3х3»3. Звенья
"контактируют", если они, не соседствуя по цепи, находятся на расстоянии ребра ( например, 4 и 19). Звено образует "изгиб", если о
ход цепи на этой звене меняется на 90 (например, 11). Б) Число п контактов и изгибов с энергией с в "нативных" структурах По=100
случайных готерополимеров - для контакта 9-18 (+) и изгиба 11 (■>
с "обычно!" больцмановской "текущей" температурой; при температурах ниже критической статистика (уже конформационная, а не термодинамическая) оказывается как бы "замороженной", поэтону ее температура не может быть равна ничему другому, как критической температуре.
Этот результат был получен в приближении "модели случайных энергий", где игнорируются энергетические корреляции между разнима конформациями цепи Правомочность использования этого приближения (БЬак)1поу1сЬ & Си^п, 1990) подтверждает компьютерный эксперимент, в котором рассматривались конкуренция компактных структур (рис. 3) случайных гетерополиморов между собой. Исследовались два типа структурных элементов: контакты и изгибы Зависимость встречаемости контактов и изгибов в нативных (наиболее низкоэныргетических) структурах случайных гвтерополимеров точно совпадает с теоретически предсказанной. Видно, что "конформационная температура" является универсальной величиной. не зависящей от типа структурного элемента. Численный эксперимент подтвердил также, что конформационная температура близка к критической температуре "вымораживания" нативной структуры. Таким образон. несмотря на то. что поле, действующие со стороны жесткого каркаса трехмерной структуры белка на определенный элемент структуры. значительно больше его собственной энергии, тем не менее, он, как правило, оказывается фиксированным в наиболее выгодном для себя положении!
Те же статистические закономерности должны наблюдаться и для более крупных элементов белковой структуры. а именно мотивов
1. сравнивая вероятности различных энергии структурного элемента с в
Рис.4. Распространенные н редко встречающиеся в белках мотивы укладки белковой цепи. (Л) Два параллельных /3-участка, соединенных петлей образуют Правую суперспираль значительно чаше, чем левую. (Б) "Пересеченно" двух петель
запрещено. (З-участоки показаны стрелками, а-спирали - цилиндрами, петли - тонкими линиями.
- в -
формуле (2) подставить "эффективную свободную энергии: мотива
укладки цепи", Г'"-£ - (2аЧпМ )1/2 (ск. (4)). Величина т'"
р р р р Р
определяется средней (по всем первичным структурам и по всем
конформацням, входящим в данный мотив "р") энергией дисперсна!
этой энергии ст^ и числом различных конформаци! в мотиве Н^.
Поскольку теоретически* результат был получен в приближении "модели случайных энергий", мы провели компьалерный эксперимент со случайными последовательностями, в котором мотиву укладки "р" соответствовал набор всех компактных (Рис.34) конформаци! цепи, содержащих ровно р изгибов. Этот эксперимент полностью подтвердил теоретически предсказываемую зазхсимость встречаемости - среди "нативных" структур - различных мотивов укладки от их средне! энергии и числа возможных конформаций.
В применении к белкам, полученный результат означает, что решающее, для частоты встречаемости того или иного мотива, значегие играет даже очень небольшая (по сравнению с полно! энергией) разница в средних энергиях. - например, поторя одно!-единственно! водородной связи при пересечении петель (Рис 4Б>. Становится также попятным, лочену, несмотря на полную фиксированного нативно! конформации, укладка, допускающая большое число конформаиий петель, должна встречаться чаще других - как, например, укладка с маноо изогнутой петлей на рис. 4А. Это пезволяет понять пенинирование в белках одних нотивоы укладки цепи, в то время как множество других, имеющих небольшие "дефекты", не встречаются вовсе (ПпКе1БЪе1п & Р^&уп, 1987).
2. Предсказание трехмерно! структуры глобулярных белков при неполном знании энергетических параметров.
Выше мы рассмотрели "предсказание" структуры белка в одном частном случае: когда нам известен лишь один энергетически! параметр. В общей случае. нам известна какая-то часть энергетических параметров, управляющих формированием нативно! структуры. Именно в такой ситуации находятся исследователи, занимающиеся, например, предсказанием вторично! структуры. Как правило, при этом в качестве "предсказанной нативно! структуры1" выбирается о дна структура с нинимнльний расчетнсО энергией. Является ли она наилучшим приближением к наткьнои?
Полную энергию каждой конформации белковой цеп* можно разбить на две част«: "известную" и "неизвестную". Предположим, что величины "неизвестной" части энергии для разных конформаций не коррелируют, а их распределение по всем последовательностям ие зависит ни от конформации. ни от ее энергии. Возникает вопрос: в какой части "расчетного" (учитывающего только "известную" часть взаимодействий) энергетического спектра находится, с наибольшей вероятностью, истинно нативиая конформация?
Пусть - число укладок с полной энергией Е ( 1Д/2, где
А*Т ) и (Е') - количество укладок, "известная" часть энергии
которых равна Е'. Мы не в силах найти Н (Е), но можем оценить (Е), его среднее значение по всем последовательностям, имеющим расчетный энергетический спектр с плотностью ^ (Е*) :
Nact<E>- Kalc<E'>P<E-E'>dE' <5>
Здесь Р(Е-Е') - вероятность того, что ошибка в определении полной энергии укладки равна Е-Е'. Интеграл может быть оценен методой перевала. Точка перевала. Е((Е). максимум по динтегрального выражения - имеет простой физический смысл наиболее вероятного значения "известной" части энергии укладки, энергия которой на самом деле равна Е. Оценивая Е^Е), мы можем, после ряда преобразований, исключить неизвестную функцию Р я получить соотношение:
3ÍlnM.ct<E>--¿lnMc»Ic<V|P _ |р. <б>
l (с.)
Полученное соотношение справедливо не только для усредненной величины Nact. но и для конкретных плотностей. N ■ спектров подавляющего числа последовательностей, если ТГ »1 и N »1. При
• ct cal с
этом в соответствии с термодинамическим определением, энергии Е соответствует температура Т(Е) = (InN (Е)/dE)где N(E) - чмсло состояний с энергией Е.
Таким образом, выражение (6) означает следующее: укладки, находящиеся в тоЗ части истинного энер! етнчоского спектра, что
'■ответствует каков-то температуре Т ( т. е. Е-Е(Т)), находятся в то! 'астм расчетного энергетического спектра, которая соответствует той "в температуре Т (т.е. Е-Е(Т)).
Нативная укладка находится на саном "дне" истинного энергетического спектра; этой части спектра отвечает критическая температура Т^ (см. предыдущий раздел). Следовательно, натавная укладка локализована не на самом "дне" "расчетного" энергетического спектра, а в том его участке, который соответствует температуре т. е. она находится среди тех укладок, что доминируют в расчетном статсуинв при температуре Т*Тс (рис.5).
Усредняя различные структурные характеристики белковой цепи (например, среднюю по времени спиральность в том или иномучастке цепи) по всем таким конформациям, можно выделить те черты, что присутствуют в большинстве из этих конформаций и. следовательно, с высокой вероятностью присущие и нативной структуре. В то же вр'мя та структура, что имеет минимальную - согласно учитываемым нами параметрам - энергию, может быть далека от нативной (см. следующий раздел). _______
Мое, (£1
»0.000
юо
---—-_--,1-1----
А I ! Е Б I I Е.
I I
«даю
-Ш1Н?1ЙМ111.
I I Е,
\
Рис. 5 (А) Энергетический спектр компактных укладок цепи (рис. ЗА) ш гистограмма его плотности. " ,|исл0 укладок с
энергиями в диапазоне Е10. 25. Е - "истинная" энергия укладки; она включает в себя энергии все контактов. Касательная к аппроксимирующей параболе, проведена в точке N -1. (Б)
Энергетический спектр той же цепи, рассчитанный на основе а-34% контактов, энергии которых "известны". Касательная с тен же наклоном 1/т (см. А) указывает точкоП касания место наиболее
вероятного положения нативной укладки в этом спектре. Показаны положения нативной (сплошная стрелка! и "наилучшей рассчитанной" (пунктирная стрелка) укладок в обоих спектрах
Рис. 6. Положение нативной уклалки в энергетическом спектре, рассчитанном на основе знания части взаимодействий в модели цепи, изображенной на рис.3* (•). Для каждой из 10 "случайных" последовательностей была вычислена как "полная", так и "известная" энергия каждой из 103346 компактных конфорнаиий (Рис. ЗА). В последнем случае, • энергии части межзвонных контактов (а
•ф именно, а-ая часть) считались "известными" и
принимались во внимание, а энергии прочих • контактов не учитывались. Для каждой
последовательности была найдена ее "нативная" структура с наименьшей "полной" энергией Е и, далее, место этой структуры, К. в спектре "известных" энергий Е( (см.
Рис. 5). Прямой линией изображена аналитическая зависимость 1пГ!а(1-а) (1пМ-1).
Часто при предсказании пространственной структуры белка возникает вопрос: сколько низкоэнергетических расчетных структур нужно взять, чтобы среди них обязательно оказалась нативная? Очевидно, эта величина зависит от доли (а) взаимодейстгий, реально учитываемых при предсказании.
Для того. чтобы определить эту зависимость был проведен вычислительный эксперимент. Согласно рис. 6, знание 50% энергетических параметров сужает с -10* до -102 список структур, среди которых находится нативная, а знание 75% параметров сужает этот список до -10 структур, но однозначны* предсказание становится только тогда, когда все параметры известны точно.
Важным следствием полученного результата является то, что оптимальная температура самоорганизации белка должна быть близка к критической температуре Т . Действительно, на ранних стадиях сворачивания, когда существует флуктуирующая вторичная структура, но нет еще нативной компактности, в энергию цепи вносят вклад практически только локальные вдоль цепи взаимодействия. Таким образом, вторичную структуру, формирующуюся на предварительных стадиях самоорганизации, можно рассматривать как результат "предсказания" нативной вторичной структуры при "неполном знании" параметров. Для того. чтобы первая стадия самоорганизации инициировала бы, а не замедляла бы последующие (те для того, чтобы на последующих стадиях не происходило бы полной перестройки "ранней" вторичной структуры). необходимо, чтобы такое "предсказание" (сворачивание белка) проводилось вблизи критической
температуры: ниже этой температуры. нативоподобная вторичная структура, скорее всего, не окажется среди доминирующих; выше ТЧ натявная пространственная структура белка нестабяльна, а натявоподобная вторячная структура "теряется" среди прочнх.
3. Предсказания а-структуры глобулярных белков на основе теоряя g-структуры развернутых белковых цепей.
Изложенная в предыдущем разделе теория подчеркивает важность методов, основанных на расчете статсуммы цгпи. К ник относится теоряя формирования вторичной структуры развернутых полипептидов ( Finkelstein & Ptitsyn, 1976). Теперь мы понимаем, как и почему результаты такой теории могут использоваться для предсказания вторичной структуры белков, я ножен попробовать улучшить результаты такях предсказаний.
Сравнение расчетного и_экспериментального_содержания
а-структуры в коротких пептидах в растворе - тестирование и уточнение системы энергетических параметров. Теория а-структуры поляпептидов и базирующася на ней компьютерная программа ALB основаны на одномерной моделя Изинга. Система параметров включает в себя параметры элонгации спирали для различных остатков, параметры ее инициации - для разных остатков, находящихся в разных положениях на N- и С-концах спирали, и параметры парных взаимодействий между сближенными в а-спирали боковыми группами. Все эти параметры зависят от температуры, pH и ионной силы среды.
Прежде, чен приступить к оптимизации предсказания, необходимо оттестировать и уточнить (если потребуется) эту сястему энергетических параметров на полипепткдах. в которых "дальние" по цепи взаимодействия несущественны, а локальные - достаточно разнообразны. Такая возможность появилась лишь недавно, когда были выделены короткне фрагменты рибонуклеазы и других белков, синтезированы их "мутанты", а также многочисленные олигопептиды на основе полиаланина.
Отметим, что сама заметная а-спиралышсть таких пептидов была неожиданна для многих, т.к. долго считалось, что короткие пептида, даже из наиболее спиралеобразуюших остатков, не могут, не слипаясь, дать хоть какую-то вторичную структуру.
При тестировании сказалось. однако. что общкй уровоиь
Р*с. 7. Температурная завнсикосгь спиральности для пептида ас-ААААКААААКААААКА-amide при 1М NaCl и рН7. --•- - эксперимент. -•••о-" - компьютер-кий расчет с уточненными значениями параметров; ДН-1ккал/моль
О / 4 0 И Ю
1"
Рис. 8. рН-завксимость степени спиральности для пептида
ас-АЕТАААК Г 1.КЕ|1М1)3-ami.de при
0,1М МаС1 и Т=з"К. -в---
эксперимент. ....(}••■ - компьютерный расчет с уточненными значениями параметров, - компьютерный расчет со старым набором параметров.
расчитанной по теории Финкельштей на-Птииьша спиральности исследованных пептидов совпадает с экспериментальный, рассчитанным из данных дальнего КД. Однако зависимость от аминокислотных замен и условий среды описывалась недостаточно хорошо. Тогда мы внесли следующие изменения в стандартный набор параметров программы "ALB":
1. Значении энтальпии перехода спираль-клубок ÄH-1 ккал/ноль лучше описывает имеющийся эксперимент, чем ее первоначальное значение, 0,6 ккал/моль (рис. 7).
2. Была введена новая оценка для электростатических взаимодействий, в которая учитывается подвижность боковых групп в спиральном и клубкообразном состояниях к, таким образом, воз мои нос гь образования ионных пар.
3. Наконец, были учтены слабые взаимодействия у-атомов вспх toMci'ux групп, находящихся в спирали в позициях 1-5. Наилучшее согласно р-ючотоп с от.пои лост и гн «т с ч. если каждое такое пз а и модо Ист si и е полагается рлпннч о,1 ккал/моль.
Сведение этих уточнений .ппчителыю улучшило согласие теории с опытом (см , для примера, ркс.8!.
Л •0 / У?
»o'i Р*
'¿s/M "о
UOOm и* .
Рис. 9. Сравнение рас- 4о считанных (0^) к экспериментальных (вэ)
степеней спиральности С-, S- и аланин- богатых пептидов и фрагментов белков для различных температур: 25-27°С (А), к 0-5°С (В). Условия среды:
о - 27°С, рН 5.2 в
• - 25°С, рН 5.4 в
+ - 3°С, рН 5.2 в 0.1М NaCl;
X - 3°С, рН 6.0 в 0.1М NaCl;
рН 7.0 в 0.01М HadI
1°с.
о ю 20 эо
0.1М НаС1; 0.01М NaCl;
и и • j О С, pH 2 (и) и pH 5.1 (•)
при ионной сила 0.14М; 0 - 5°С, pH 5.1 в воде.
е„%
На рис. 9 представлено окончательное сравнение рассчитанных и •экспериментальных степеней спиральности для 40 различных коротких водорастворимых олигопептидсв, - всех исследованных
экспериментально к 1991 г.
Эти же расчеты показывают, что высокая степень спиральности, присущая некоторый из исследованных пептидов, является типичной для цепей, составленных из спнралеобразуюших остатков.
а-Спирали в развернутых'белковых цепях и белковых глобулах Основной - для теории предсказания белковых структур - результат главы 2 и 3 заключается в том. что оптимальное предсказание должно базироваться не на поиске структуры с минимальной энергией, а на расчете термодинамическом, учитывающем всевозможные флуктуации структуры при тенпиратуре порядка температуры тепловой денатурации белка.
Описанная выше теория спиральной структуры полкпаитидов позволяет расчитывать флуктуирующую вторичную структуру цепи при разных температурах. Расчеты показывают (Рис.10), что член с минимальной энергией - сплошная а-спкраль во всю цепь, соответствующая расчету при 0°К - никак не соответствует не г изной
вторично* структуре белков, я только расчет при температуре около 300°К дает более ил* менее "нативоподобную картину". Довольно успешное предсказание а-структуры глобулярных белков, основанное на теории ФинкельттеЯна и Птицына, проводилось раньше (наше уточнение параметров расчета только слегка - на 1% - улучшило его качество) именно при этой температуре. Она была выбрана тогда из интуитивных соображен** о том, что если самоорганизация белка происходит при определенно* тенпературе, то при ней и надо рассчитывать его вторичную структуру, формирующуюся на перво* стадии самоорганизации. Оставалось неясным только, почему для успешного предсказания следует рассчитывать флуктуации вторично* структуры, а не минимизировать ее энергию.
.ИИЁВШВШСЕ
.0 0 В0ВВ
Рис. 10. Вероятность а-спирального состояния остатков развернутых белковых цепей нкоглобина кашалота и лизоцина куриного яйца, рассчитанная при разных температурах. Прямоугольники показывают положения а-спиралей в нативных белках. По оси X отложен номер остатка по цепи, по оси У -его средняя равновесная спираль-ность.
РЕЗУЛЬТАТЫ И ВЫВОДЫ
1) Частоты встречаемости различных эленентов структуры в глобулярных белках - от конформаций отдельна: остатков до нотивов унладки цеп* - определяются их собственной энергией. Зависимость имеет форму распределения Больцмгна, но не зависит от темпвратури
среди. "Конформационная температура" в белковой статистике порождается гетерогенностью звеньев иепи. Эта температура близка к тенпературе плавления белка.
2) Показано. что, вследствие неизбежной погрешности энергетических параметров, наилучшее предсказание структуры белка по его аминокислотной последовательности достигается методом минимизации но энергии, а свободной энергии - при температуре, близкоЕ к температуре плавления белка.
3) Олнгопептнды, составленные из спиралеобраэующих и спиралекндкффереитных остатков, обладают значительной спирольностыо и тем самым могут являться зародышами формирования нативной пространственной структуры в глобулярных белках.
Результаты диссертации изложены в следующих работах:
1 Финкельштейн А. В. , Баяретдинов А. П. , Птицын О. Б. - Физические причины стабильности альфа-спиралей в коротких пептидах. - В: "Структура и биосинтез белков", вып. 3. Научный Центр Биологических Исследований: Пушино. 1988, стр. «6-51.
2. Finkelstein A.V., Badretdinov A.Ya., Ptitsyn О,В. - Short alpha-helix stability. - Nature, 1990, v. 345, p.300-300.
3. Gutin A.M., Badretdinov A.Ya., Finkelstein A.V. - Why statistics of protein structures is Boltzmann-1ike? Abstracts of International School-Seminar "Modern Problems of Phisical Chemistry of Macromolecules" (Pushchino), 1991, p. 109-109.
4. Finkelstein A.V., Badretdinov A.Ya., Ptitsyn O.B. - Physical reasons for secondary structure stability. Alpha-helices in short peptides. - Proteins, 1991, v.10, No 4,-p. 287-299.
Б. Гутин A.M., Бадретдинов А. Я. . Финкельытейн А. В. Почему статистика структурных элементов глобулярных белков похожа на статистику Больцмана? - Молекулярная биология. 1992, т. 26. вып. 1, стр. 118-127.
6. Finkelstein A.V., Gutln A.M., Badretdinov A.Ya. - A good temperature for protein structure prediction and folding - Abstracts of a Meeting on Prediction and Recognition of Antigenic Determinants, Budapest, 1992, p. 1/7.
Ротапринт H<PTU Зок тир. ЮО
- Бадретдинов, Азат Явитович
- кандидата физико-математических наук
- Москва, 1992
- ВАК 03.00.02
- Разнообразие компактных форм денатурированных белков
- Короткие олигопептиды с преобладающей конформацией
- Теоретическое моделирование самооорганизации гетерополимерных глобул: белок и РНК
- Теоретическое моделирование самоорганизации гетерополимерных глобул: белок и РНК
- Статистический подход к задаче распознаванияпространственной укладки белковой глобулы поаминокислотной последовательности