Бесплатный автореферат и диссертация по биологии на тему
Связь компактности и других свойств глобулярных белков со скоростью их сворачивания
ВАК РФ 03.00.02, Биофизика

Автореферат диссертации по теме "Связь компактности и других свойств глобулярных белков со скоростью их сворачивания"

а

На правах рукописи <У

БОГАТЫРЁВА НАТАЛЬЯ СЕРГЕЕВНА

СВЯЗЬ КОМПАКТНОСТИ И ДРУГИХ свойств ГЛОБУЛЯРНЫХ БЕЛКОВ СО СКОРОСТЬЮ ИХ СВОРАЧИВАНИЯ

03.00.02 - биофизика

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук

ПУЩИНО - 2008

003450708

Работа выполнена в Институте белка РАН

Научный руководитель: член-корр. РАН, доктор физико-математических наук, профессор Финкельштейн Алексей Витальевич

Научный консультант: доктор физико-математических наук Галзитская Оксана Валериаиовна

Официальные оппоненты: доктор физико-математических наук Харакоз Дмитрий Петрович кандидат физико-математических наук Филимонов Владимир Васильевич

Ведущая организация: Институт молекулярной биологии

им. В.А. Экгельгардта РАН, Москва

Защита диссертации состоится ^ /И в час. мин. на заседании совета

Д002.093.01 по защите докторских и кандидатских диссертаций при Институте теоретической и экспериментальной биофизики РАН по адресу: 142290, г. Пущино Московской области, Институтская ул., 3, Институт теоретической и экспериментальной биофизики РАН.

С диссертацией можно ознакомиться в Центральной библиотеке Путинского НЦБИ РАН

Автореферат разослан « » ¿^¿^уЛ^Р-Р 2008 г.

Ученый секретарь

диссертационного совета А

кандидат физико-математических наук ^//¿¿¿¿(^¡^ Н.Ф. Ланина

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ Актуальность проблемы. Проблема самоорганизации белка является одной из важнейших проблем биофизики. Актуальность ее связана с тем, что способность белковой цепи самостоятельно, в подходящих условиях, находить свою нативную, то есть биологически-активную пространственную структуру, является наименее понятным на данный момент этапом на пути от закодированной в ДНК информации к функционирующему белку. Один из первых вопросов, возникших после открытия явления самоорганизации, известен как парадокс Левинталя: каким образом белок за секунды может найти свою самую стабильную структуру среди астрономического числа возможных? И хотя обнаружение нуклеационного механизма спонтанного сворачивания белковой цепи привело к решению парадокса Левинталя, в науке весьма популярно ошибочное (как мы покажем) мнение, что модели энергетических воронок сворачивания полностью решают этот парадокс. Данная работа помогает покончить с этим заблуждением.

Кроме этого, данная работа продолжает поиск факторов, влияющих на скорость сворачивания белков. Важность умения рассчитывать скорость сворачивания белков по его структуре связана с тем, что некоторые заболевания обусловлены агрегацией или неправильным сворачиванием белков — процессами, эффективность которых напрямую зависит от скорости «правильной» самоорганизации белка. В связи с этим изучение кинетических аспектов самоорганизации белков остается актуальной проблемой биофизики.

Цель и задачи исследования. Целью данной работы является исследование связи кинетики сворачивания однодоменных глобулярных белков (далее — просто «белков») с особенностями их структуры. Были поставлены следующие задачи: 1) проверить гипотезу о том, что любой «воронкообразный» энергетический ландшафт гарантирует успешное сворачивание белковой цепи; 2) исследовать взаимную связь двух структурных параметров порядка, используемых при теоретическом изучении сворачивания белковых цепей: числа контактов в цепи и размера ее скрытой от воды поверхности; 3) исследовать связь ряда феноменологических параметров пространственной структуры однодоменных глобулярных белков со скоростью их сворачивания.

Научная новизна работы. На конкретной теоретической модели впервые показана ошибочность распространенного заблуждения, что энергетические воронки сами по себе объясняют механизм сворачивания белковой цепи. Впервые показано, что параметры порядка, число контактов в белковой структуре и размер скрытой от воды поверхности в ней, однозначно связаны друг с другом. Впервые исследовано влияние формы белковой глобулы на скорость ее сворачивания и разворачивания.

Практическая значимость работы. Понимание закономерностей процесса самоорганизации белка необходимо как при предсказании трехмерной структуры белка по его аминокислотной последовательности — этой давней, чрезвычайно важной и все еще не решенной проблемы современной биофизики, так и при конструировании de novo белков с заданными свойствами. Выявление факторов, влияющих на кинетику сворачивания белка, необходимо для управления скоростью сворачивания белка и в клетке, и вне ее. Результаты работы найдут свое применение в белковой инженерии, биотехнологии, а, в перспективе, и в фундаментальной медицине.

Апробация работы. Материалы диссертации были представлены на российских и международных конференциях: Fifth Meeting on the Critical Assessment of Techniques for Protein Structure Prediction (Asilomar, California, 2002); EMBO/Lincei Workshop on protein folding and misfolding (Roma, Italy, 2003); International Conference on "Protein Biosynthesis, Structure and Function" (Pushchino, Russia, 2007); The Third Moscow Conference on Computational Molecular Biology (Moscow, Russia, 2007); Protein Assembly, Dynamics and Function (Bures-sur-Yvette, France, 2007); Meeting on the INTAS project "Theoretical and Experimental Study of Molecular Mechanisms of Protein Folding, Misfolding and Aggregation and their Possible Connection with Diseases" (Pushchino, Russia, 2007); XXI Sitges Conference Statistical Mechanics of Molecular Biophysics (Sitges, Spain, 2008); Ежегодная научная конференция Института белка РАН (Пущино, Россия, 2008); Международная конференция «Математическая биология и биоинформатика» (Пущино, Россия, 2008); EMBO Course "Docking Predictions of Protein-Protein Interaction" (Barcelona, Spain, 2008).

Публикации. Основные результаты диссертации опубликованы в 12 печатных работах, в том числе в 6 статьях.

Структура диссертации. Диссертация состоит из "Введения", "Методов", "Обзора литературы", трех глав, посвященных описанию проделанной работы и обсуждению результатов, "Заключения", "Благодарностей", "Выводов" и "Списка цитируемой литературы". Работу иллюстрируют 29 рисунков и 13 таблиц.

Критический анализ моделей «энергетических воронок», применяемых в теории сворачивания. Уже около пятнадцати лет при описании механизма самоорганизации белковой цепи довольно часто употребляется термин «энергетическая воронка сворачивания». Обычно «воронки сворачивания» используются в иллюстративных целях, они действительно очень наглядны. Воронки сворачивания изображаются либо как графики, где по вертикали откладывается энергия, а по горизонтали - координата сворачивания [Bryngelson et al, 1995, Proteins, 21, 167], либо как наглядные рисунки (Рисунок 1). Такие изображения подчеркивают, что чем дальше от нативного состояния по координате расположена конформация белковой цепи, тем больше возможное число состояний и, что нативное состояние - самое низкое по энергии. К сожалению, в последнее время широкое распространение получило ошибочное мнение, что энергетические воронки сами по себе объясняют механизм сворачивания белковой цепи.

N

Привлекательность идеи воронкообразного энергетического ландшафта белкового сворачивания базируется на том, что в этом случае и энергия, и энтропия

ОСНОВНЫЕ РЕЗУЛЬТАТЫ

Рисунок 1. Пример трехмерной воронки в двумерном пространстве конформаций — зависимость энергии цепи (вертикальная координата) от ее конформации, N— нативния конформация. Рисунок взят из [Dill, 1997, Nat. Struct. Biol., 4, 10].

уменьшаются по ходу сворачивания белка к своему наименьшему по энергии (натовному) состоянию.

Может возникнуть впечатление, что любой гладкий воронковидный энергетический ландшафт всегда (при соответствующих сворачиванию условиях) помогает избежать перебора белком невозможно большого числа конформаций при достижении белком своего глобального энергетического минимума (так называемого парадокса Левинталя). Этот заманчивый по простоте качественный вывод, вкупе с красочными картинками энергетических воронок, стимулировал возникновение строго сформулированных и, следовательно, пригодных для анализа моделей сворачивания белка, например [Bicout, Szabo, 2000, Protein Sei., 9, 452]. Такой анализ позволит показать, что сами по себе воронки не обеспечивают адекватного описания сворачивания белка, поскольку они не могут обеспечить одновременного выполнения обоих основных свойств, наблюдаемых [Fersht, 1997, Curr. Opin. Struct. Biol., 7, 3] при сворачивании: 1) сворачивание за неастрономическое время и 2) сосуществование нативной и развернутой форм белков в процессе сворачивания.

Модель «энергетической воронки» и сворачивание белков. Авторы модели [Bicout, Szabo, 2000, Protein Sei., 9, 452] упрощенно моделируют сворачивание белка диффузией внутри ¿/-мерной сферы радиуса R = 1. Конфигурация цепи определяется как точка г внутри этой сферы. Нативное состояние представляется областью

0 < г < а, (1)

где Г = |'Г[, а а«1, что соответствует сильному ограничению подвижности по каждой из d степеней свободы в нативном состоянии белка. Денатурированное состояние представляется областью

a<r< 1, (2)

причем область с г ~ 1 соответствует полностью развернутой белковой цепи.

Таким образом, энтропийная разница между свернутой (г < а) и полностью развернутой (г ~ 1) конформацией составляет

AS - (d-1) х х In a, (3)

где кв — константа Больцмана. Поскольку Бико и Шабо полагают а = 0.1, и поскольку экспериментально наблюдаемая [Privalov, 1979, Adv. Protein Chem., 33, 167] разница в энтропии между свернутым и полностью развернутым состояниями в белке равна

AS-23 кв х L, (4)

где L — число остатков белковой цепи, размерность d должна быть близка к числу остатков в цепи.

Энергетический сферически-симметричный потенциал U(r) в модели Бико-Шабо зависит только от расстояния г от начала координат и его график имеет форму воронки

' \и0<А(а-\), при 0<г<а (5)

где А>0 — параметр.

Сворачивание соответствует энергетически обусловленному дрейфу точки г от поверхности сферы (г ~ а) по направлению к центру сферы. Эта энергетически обусловленная диффузия затруднена (при г > а) энтропийной составляющей свободной энергии

-TS(r)=-NkBT\nr, (6)

где число степеней свободы N = d - 1 (причем N близко по значению к числу остатков в белковой цепи L) и Т— абсолютная температура.

На первый взгляд кажется, что такая модель может правдоподобно моделировать сворачивание белка. Однако при более подробном рассмотрении мы сталкиваемся с неразрешимым противоречием. Рассмотрим все три диапазона возможных значений параметра модели А.

1) Высокотемпературный случай, когда величина А относительно мала (или температура велика), то есть,

A<NkBT. (7)

В этом случае «развернутое» состояние системы устойчиво, и диффузия от г ~ 1 к

г<а встречает (при г = а) свободно-энергетический барьер высотой A~NkBT по

порядку величины (Рисунок 2А(1)) (в рассматриваемом случае этот барьер самый

низкий при А = N кв Т\ при этом A = N кв Т(а - 1 - In а) > N кв Т при а « 1). Это

5

значит, что мы сталкиваемся с парадоксом Левинталя: время перехода из развернутой конформации белка в нативную, которое, как известно [Moore, Pearson, 1981, Kinetics and mechanism, N.Y.: Wiley], порядка exy(A/kjsT) x (время перестройки мономера), где А — высота барьера свободной энергии, составляет ~ехр(N) не. Если N>50 сворачивание происходит астрономически медленно.

2) Низкотемпературный случай, когда величина А велика по сравнению с NkBT.

А > NkBT/a (8)

В этом случае диффузия от г ~ 1 к г ~ а происходит быстро, с постоянным падением свободной энергии, но экспериментально наблюдаемое [Fersht, 1997, Curr. Opin. Struct. Biol., 7, 3] сосуществование нативной и развернутой фаз невозможно: устойчивого денатурированного {г> а) состояния вообще не существует, так как оно нестабильно (см. Рис. 2А(2)).

3) В оставшемся промежуточном случае, когда

NkBT<A<NkBT/a, (9)

барьер может быть мал, а сворачивание может быть достаточно быстрым, если А ~ NkBT/a, но денатурированное состояние очень сжато, его свободно-энергетический минимум приходится на гцешл ~ а. Таким образом, этот случай, как и случай (2) также исключает сосуществование нативного и развернутого состояний (см. Рис. 2А(3)).

Анализ, проведенный выше, показывает, что строгая модель Бико и Шабо не может ни при каком значении параметра модели А, при одних и тех же условиях, объяснить одновременно обе главные черты, наблюдаемые для белкового сворачивания: сосуществование нативной и развернутой форм цепи в течение всего процесса сворачивания, и сворачивание за неастрономическое время.

В чем причина такого поведения модели? Нетрудно видеть, что описанная выше энтропия белка

S(r) =NkB In г, (10)

которая следует из модели Бико-Шабо, определяется таким же, в сущности, уравнением, как обычное уравнение для энтропии N одинаковых молекул однородного идеального газа, заключенного в объеме V

б

развернутое состояние ; J

А. Гладкая /V-мерная энергетическая воронка

Шг=а нативное (1) состояние

(2)

, о-

5 5

ДJT-N

а

: ил\

I / ^

; S-Nm(r) ! g

L'

! С- О

-1

0 а

с ^

1 I

5 с

а "

j

F/T=LJ/T-S MT~N

~\S~Nln(r),'7

(3) О

-J О

о =

; / /

!/

» / < /

' / V i

•и/т

]

/ / / /

I / /

U/T

i ly

i P Й

I =

) z. -

Cl. С

S G

I я О

I 5 о

/-УГ -U/T-S a

F/T=U/T-S

w.Jtf

нативное состояние

развернутое „ состояние

I t

7 r &/T~N j

; неустойчивого

^Денатурированного

состояния нативное

состояние

а К

-v г

I v ^^

J 4.....

j плотное J денатурированное j состояние

нативное состояние

Б. Нуклеационная модель у < св°Рачиваиие n-Q

развернутая ^

... часть

Г ,-л

ф\ST-N-

разворачивание

Рисунок 2. А. Двумерное представление ûi-мерной энергетической воронки, использованной в модели [Bicout, Szabo, 2000], и три диапазона возможных значений параметра модели А,

описанные в тексте. Соответствующие энергетические U/T (-) и энтропийные S (—) члены

зависят от расстояния г от центра нативного состояния. F/T — зависимость свободной энергии от г. Л/Т=и(а)/Т- S(a) представляет собой высоту барьера свободной энергии на пути к нему, а N — число степеней свободы. Б. (слева) Ядро сворачивания белковой структуры (развернутые остатки показаны пунктирными линиями, а остатки в свернутой структуре ядра сворачивания показаны сплошной линией); (справа) энергетический и энтропийный члены для нуклеационного механизма сворачивания, п — число остатков в сформировавшейся структуре, N— число остатков в белке. Отклонения U и TS от прямой линии возникают в результате поверхностного натяжения. Коэффициенты X и ц не зависят от п и, следовательно, всегда относительно малы; энтропийное поверхностное натяжение -\т2'3 происходит из потери энтропии [Flory, 1969, Statistical Mechanics of Chain Molecules, Interscience, New York] для замкнутых петель, торчащих из компактного ядра [Финкельштейн, Бадретдинов, 1997, Мол. Биол., 31, 469; Finkelstein, Badretdinov, 1997, Fold. Des., 2, 115].

S(V) = N kB In V, (11)

а форма потенциала U в этой модели соответствует постоянному давлению dU/dV = A, сжимающему этот газ. Однако сжимающийся идеальный газ не претерпевает фазового перехода, в то время как белковая цепь- претерпевает [Privalov, 1979, Adv. Protein Chem., 33, 167]. Фазовый переход свойственен реальному газу. Реальный газ может быть переведен (при низких температурах) в плотную фазу (жидкую или твердую) путем компрессии, но реальный газ не остается однородным в процессе такого перехода, подобно идеальному газу. Он разделяется на газовую и сконденсированную фазы, и фазовый переход происходит путем нуклеации [Ландау, Лифшиц, 1959, Теоретическая физика, М.: Физматгиз]. Когда «новая» фаза растет внутри «старой» фазы, и ее энергия, и ее энтропия уменьшаются практически линейно с увеличением размера новой фазы. Отклонения от линейности связаны только со свободной энергией на поверхности раздела двух фаз (см. Рис. 2Б).

Также процесс нуклеации наблюдается при сворачивании белков как в экспериментальных исследованиях [Fersht, 1997, Curr. Opin. Struct. Biol., 7, 3], так и в компьютерных моделях [Abkevich et al, 1994, Biochem., 33, 10026]: полусвернутая белковая молекула содержит кусок «нативной фазы» и кусок «развернутой фазы».

Таким образом, энергетическому ландшафту, совместимому с главными чертами белкового сворачивания, обязана соответствовать очень специфическая воронка, в которой в результате разделения фаз уменьшение энтропии и энергии происходит практически параллельно, то есть их максимальная разница на пути сворачивания соответствует неравенству

U-TS«NkBT0 (12)

Представленные в этой главе рассуждения дают важный критерий корректности любой модели сворачивания белка, в особенности, модели «воронки». Каждая модель должна демонстрировать быстрое сворачивание белка вблизи точки термодинамического равновесия между свернутой и развернутой фазами. Явления разделения фаз и нуклеации представляют собой феномены ключевой важности для понимания механизма самоорганизации белковых молекул.

Связь площади доступной растворителю поверхности белковой цепи с числом контактов в ней. Во второй части данной работы исследуется зависимость между двумя параметрами порядка, часто использующимися для расчета энергии взаимодействий в белковых цепях, например, при моделировании сворачивания — числом контактов в белковой структуре Ncon, и площадью ее поверхности, доступной растворителю SASA.

Было сделано предположение, что Sasa должна быть тесно связана с Nconl, поскольку обе эти величины выражают компактность белковой цепи. При изменении конформации белковой цепи изменение в Sasa должно сопровождаться соответствующим изменением в Ncon¡. Действительно, каждый участок ван-дер-ваальсовой поверхности белковой цепи может внести вклад либо в площадь поверхности, доступной растворителю Sasa (если он экспонирован в воду), либо в число контактов Ncon, (если он спрятан от воды и, следовательно, контактирует с другими частями той же цепи). Поэтому для любой конформации белковой цепи, в которой ее целостность не нарушена, справедливо следующее соотношение

Sasa + a *Ncom ~ const, (13)

где а — некий коэффициент. Возьмем две любые конформации белковой цепи, разницу между Sasa этах конформаций обозначим ASasa, а разницу между Ncont обозначим ANcont. Тогда из уравнения (13)

ASasa+a*ÁNcont~ 0, (14)

следовательно,

ÁNcont—ASASA (15)

Таким образом, можно предполагать, что увеличение числа контактов Ncont вследствие изменения конформации цепи должно сопровождаться примерно пропорциональным ему уменьшением площади поверхности, доступной растворителю Sasa- Ниже будет оценен уровень корреляции между ANcon¡ и ASasa-Если он окажется высоким, то оба эти параметра можно применять для оценки энергии взаимодействий в белковых цепях с равным правом. Если нет — придется решать вопрос о том, какой из этих двух параметров более адекватен такому расчету.

Для проверки изложенной выше гипотезы был взят набор белковых цепей и для него были рассчитаны оба параметра порядка, ANcont и ASasa, описывающие различия двух конформаций каждой цепи. В качестве этих конформаций брали нативную и полностью вытянутую структуры цепи. Максимально вытянутую структуру генерировали с помощью программы YASARA [Krieger et al., 2002, Proteins, 47, 393], при этом главная цепь образовывала углы ф = 180°, у/= 180°.

Для расчетов мы использовали набор белковых доменов из базы данных SCOP версии 1.65 с парной идентичностью аминокислотных последовательностей не выше 25%. Таким образом, в общей сложности, в данной работе было проанализировано 3290 структур белковых доменов.

Расчет площади поверхности белковой цепи, доступной для растворителя, проводился с помощью программы YASARA. Расчет количества контактов в белковой цепи проводился различными широко используемыми методами определения контактов:

1) атом-атомные контакты— два атома образуют контакт, если расстояние между их центрами не превышает некоторого порогового значения 1СШ\

2) остаток-остаточные контакты — два остатка образуют контакт, если хотя бы какой-то атом первого остатка образует атом-атомный контакт с любым атомом второго остатка;

3) контакты Ca атомов— при подсчете числа контактов игнорируются все атомы, кроме Ca атомов.

В качестве параметров для определения контактов выступали (а) пороговое значение 1си, существования контакта (исследовались значения от 4Ä до 15Ä), (б) учет или не учет водородных атомов и (в) учет или не учет разницы ван-дер-ваальсовых радиусов тяжелых атомов. При учете водородных атомов, если их не было в нативной структуре белка, их добавляли с помощью программы YASARA.

Оказалось, что число контактов в белковой структуре и размер скрытой от воды поверхности в ней практически однозначно связаны друг с другом независимо от способа подсчета числа контактов в белковой глобуле. Коэффициент корреляции чрезвычайно высок, он превышает 98.6% для всех методов расчета контактов (Рисунок 3), причем результат очень слабо зависит от параметров lcut в области их

ю

физически разумных значений. Это означает, что наблюдаемая взаимосвязь обеспечивает достаточно точный переход от ¿^аба к ЛМсШ и обратно. Последнее является важным моментом — это значит, что можно достаточно быстро и точно оценить площадь поверхности всего белка по числу контактов в нем.

атом-атомные, без учета Н атом-атомные. с учетом Н -О-остатои-остатданыв 6в» учета Н -•-осшок-остаточиые с учетом н -о- контакты Са-Са атомов

7 9 11

Пороговое значение

Рисунок 3. Зависимость коэффициента корреляции от используемого порогового значения 1М для разных способов подсчета числа нативных контактов для целых белковых доменов. По оси абсцисс отложено пороговое значение для расстояния между атомными центрами /„,. Ван-дер-ваальсовы радиусы атомов не принимаются во внимание. Погрешности коэффициента корреляции

были вычислены по обычной формуле дг

\-г1

" Гп

где и=3290, число исследованных белков.

Погрешности видны только там, где превышают размер соответствующего коэффициенту корреляции значка на рисунке.

Стоит отметить, что даже способ вычисления контактов, использующий только Са атомы, приводит к очень высокой корреляции. Это является важным результатом, поскольку при моделировании сворачивания белков не всегда может быть использована полноатомная модель (а именно она нужна для вычисления /1Яш), и было непонятно, насколько велики ошибки, связанные с использованием Са-атомной модели.

Таким образом, мы обнаружили, что изменение числа контактов между двумя конформациями белковой цепи однозначно связано с соответствующим изменением площади доступной поверхности.

и

Связь ряда феноменологических параметров глобулярных белков со скоростью их сворачивания. В третьей части данной работы было исследовано, различаются ли геометрические формы у белковых глобул разных структурных классов, и влияют ли выявленные особенности формы глобул на кинетику их сворачивания. Это исследование дополнит исследования ряда авторов о влиянии топологии и локальных/нелокальных контактов на скорость сворачивания белков и о влиянии вторичной структуры белков на кинетику их сворачивания.

Белки класса "а/р" имеют более округлую форму, чем белки других структурных классов. Ранее было показано, что число контактов в расчете на один аминокислотный остаток для белков класса "а/Р" статистически выше, чем для белков других классов [Galzitskaya, Garbuzinsky, 2006, Proteins, 63, 144]. Однако, возможные причины этого не были исследованы, в частности роль того, что белки класса "а/(3" в среднем крупнее белков других классов [Финкелыптейн и Птицын, 2005, Физика белка. М.: КДУ].

В данной работе было показано, что молекулярный объем, приходящийся на один атом белка и отношение молекулярного объема белка к молекулярному весу белка в среднем, в пределах погрешности, не различаются для белков всех четырех структурных классов. Это означает, что независимо от структурного класса глобулярных белков, плотность их упаковки одинакова и, следовательно, не является причиной более высокого значения плотности контактов для белков класса "а/(3".

Для оценки формы белковой глобулы был исследован ряд параметров. Один из

них — отношение объема, заключенного внутри доступной растворителю

поверхности белка к площади этой поверхности Vasa/Sasa■ Эта величина, имеющая

размерность длины, безусловно, зависит от размера белка, но она должна

характеризовать также степень округлости белковой глобулы. Для трехмерного тела

величина VAs/SASA = 1/3 rasa, где rASA — некий характерный радиус доступной

поверхности (ASA). Этот радиус близок по смыслу к радиусу поперечного сечения

ASA. Результат сравнения величин Vasa/Sasa для белков разных структурных классов

приведен в Таблице 1А. Видно, что белки структурного класса "а/р" имеют

12

достоверно более высокое значение VASa/Sasa, чем белки других структурных классов. Vasa и SAsa рассчитывали с помощью программы YASARA [Krieger et al., 2002, Proteins, 47, 393] на наборе белков, описанных в предыдущей главе. Поскольку величина VAsa/Sasa зависит и от размера белка, то более высокое значение Vasa/Sjsa может объясняться и тем, что, белки структурного класса "a/ß", в среднем, крупнее, и тем, что они более округлые, чем белки других структурных классов. Чтобы избавиться от влияния размера белков на результаты, все исследуемые нами белки были разделены на 6 групп, каждая из которых включает белки примерно одинакового размера: от 51 до 100, от 101 до 150, от 151 до 200, от 201 до 250, от 251 до 300 и от 301 до 350 аминокислотных остатков. В Таблице 1А приведены величины Vasa/Sasa при таком разбиении. Из нее видно, что внутри каждой группы белков примерно одинакового размера параметр Vasa/Sasa имеет, в среднем, наибольшее значение для белков структурного класса "a/ß", откуда следует, что эти белки являются наиболее округлыми.

Кроме Vjsa/Sasa, был исследован ряд других величин, характеризующих геометрическую форму белков:

Теоретически рассчитанный вакуумный «радиус инерции» белка— Rg, вычислялся согласно формуле

т,{г,-гс)г/м, (16)

(«i

где гс — центр масс молекулы, г, — радиус-вектор атома, т, — масса атома, Natom -число атомов в молекуле, М— общая масса молекулы. Rg имеет размерность длины белковой цепи, следовательно, растет как корень кубический из размера белка, и зависит от его формы (точнее, он растет как наибольший радиус глобулы — в отличие от г asa = i Vasa/Sasa, который растет, как ее наименьший радиус).

«Нормированный радиус инерции» — Rg/Rg, то есть отношение радиуса инерции белка к радиусу инерции Rg шара того же объема: этот параметр зависит не от размера белка, а только от его формы.

«Компактность» [Tsai, Nussinov, 1997, Prot. Sei., 6, 1426]— отношение площади SAsa поверхности белка, доступной растворителю к площади S'asa

идеального шара того же объема, что и исследуемый белок— Sasj/S asa", этот параметр тоже не зависит от размера белка.

Таблица 1. Средине величины разных показателей компактности структуры для белков четырех основных структурных классов, распределенные на группы по длине аминокислотной цепи.

все 51-100 101-150 151-200 201-250 251-300 301-350

А Средние значения Vasa/Sasa, Á

а 3.80+0.02 3.44+0.02 3.76+0.02 4.00+0.03 4.27+0.05 4.45+0.06 4.67+0.07

Р 3.97+0.02 3.58+0.02 3.85+0.02 4.15+0.02 4.26+0.05 4.48+0.06 4.64+0.09

а/р 4.50+0.01 3.67+0.04 3.97+0.02 4.25+0.01 4.43+0.02 4.68+0.02 4.85+0.03

а+р 3.96+0.02 3.53+0.02 3.81+0.01 4.10+0.02 4.37+0.03 4.55+0.05 4.72+0.04

Б Средние величины радиуса инерции (Rg, Á)

а 16.3+0.2 13.3+0.2 16.3+0.2 18.2+0.3 19.9+0.5 21.0+0.7 22.0+0.8

Р 15.8+0.1 12.8+0.1 14.8+0.1 16.7+0.1 18.5+0.4 20.0+0.5 21.2+0.7

а/р 18.1+0.1 12.1+0.4 14.5+0.2 16.1+0.1 17.9+0.1 19.0+0.1 20.2+0.2

а+р . 15.9+0.1 13.1+0.1 15.2+0.1 16.9+0.1 18.0+0.2 19.5+0.3 20.6+0.2

В Средние величины нормированного радиуса инерции (Rg/Rg')

а 1.27+0.01 1.23+0.01 1.28+0.02 1.29+0.02 1.29+0.03 1.27+0.04 1.26+0.05

Р 1.19+0.01 1.17+0.01 1.19+0.01 1.19+0.01 1.22+0.02 1.23+0.03 1.22+0.04

а/р 1.16+0.01 1.08+0.04 1.14+0.01 1.14+0.01 1.17+0.01 1.16+0.01 1.17+0.01

а+р 1.20+0.01 1.19+0.01 1.21+0.01 1.20+0.01 1.18+0.01 1.19+0.02 1.18+0.01

Г Средние значения «компактности» (Sasa/S asa)

а 1.68+0.01 1.59+0.01 1.69+0.01 1.74+0.02 1.76+0.03 1.80+0.03 1.80+0.03

Р 1.64+0.01 1.53+0.01 1.60+0.01 1.66+0.01 1.76+0.03 1.78+0.03 1.82+0.05

а/р 1.68+0.01 1.51+0.02 1.57+0.01 1.62+0.01 1.69+0.01 1.69+0.01 1.72+0.01

а+р 1.65+0.01 1.55+0.01 1.64+0.01 1.69+0.01 1.71+0.01 1.75+0.02 1.78+0.02

Результаты приведены в Таблице 1 (Б, В, Г). Видно, что среди белков различных структурных классов белки класса "а/|3", безусловно, имеют наиболее округлую форму (хотя в редких случаях различия не являются статистически достоверными): для них, при равной величине, значения Rg (и и -

обычно наименьшие, а радиусы поперечного сечения глы = ЗУ^а/$л5а - наибольшие.

Таким образом, вдобавок к тому, что белки класса "а/р" являются более крупными, они оказались еще и более округлыми. По-видимому, это связано с тем, что "а/р" домены состоят из трех и более слоев структурных элементов, а белки остальных структурных классов- из двух-трех слоев. Отметим, что согласно [Galzitskaya, Garbuzynskiy, 2006, Proteins, 63, 144], белки структурного класса "а/р" в среднем сворачиваются медленнее, чем белки других структурных классов того же размера.

Связь формы белка со скоростью его сворачивания и разворачивания. В

начале необходимо сказать несколько слов об используемой терминологии. Согласно сложившейся традиции, под "скоростью" будет подразумеваться константа скорости. Нас будут интересовать следующие величины: In kF — логарифм константы скорости сворачивания белковой цепи в воде, измеряемый в сек'1; In ¿у—логарифм константы скорости разворачивания белковой цепи в воде, измеряемый в сек'1; In кт,— логарифм константы скорости сворачивания и разворачивания белковой цепи, измеряемый в сек'1, в точке термодинамического равновесия нативного и денатурированного состояний белка, которое достигается добавлением денатуранта или увеличением температуры.

Одной из первых аналитических теорий сворачивания однодоменных

глобулярных белков была теория Финкельштейна-Бадретдинова [Финкелыптейн,

Бадретдинов, 1997, Мол. Виол., 31, 469]. В рамках этой теории, разработанной на

основе нуклеационного механизма, было получено, что скорость сворачивания

белка в точке перехода зависит от величины границы раздела двух фаз в переходном

состоянии, а петли, "торчащие" из свернутой части белка, создают дополнительное

поверхностное натяжение, еще больше замедляющее скорость сворачивания белка.

Отсюда следовало, что поскольку граница раздела двух фаз зависит для округлой

глобулы от длины цепи белка как L2/3, то и скорость сворачивания белка должна

зависеть от длины цепи белка L таким же образом:

Ъ.ктк-Ь2в (17)

Таким образом, был решен парадокс Левинталя, а также получена одна из первых

формул по оценке скорости сворачивания глобулярных белков. Однако, эта связь

15

довольно грубая, и коэффициент корреляции между In kmt и Ь2/3 далеко не достигает единицы. Поэтому необходимо найти другие, помимо длины цепи, факторы, которые могут дополнительно влиять на скорость сворачивания белка.

В предыдущем разделе, в качестве меры округлости, использовалась величина Vasa/Sasa = гasa/З. Однако, поскольку скорость сворачивания должна зависеть от площади поверхности раздела фаз в переходном состоянии, то вместо Vasa/Sasa физичнее использовать величину (Vasa/Sasa)2> которая примерно пропорциональна площади наименьшего поперечного сечения белковой глобулы в ее середине; эта величина пропорциональна Lm для сферических глобул (см. Таблицу 2А). Кроме этой величины, в данной работе также исследовались еще две величины, примерно пропорциональные поперечному сечению глобулы — L2'3 и VASA/Rg.

Из таблицы 2А видно, что коэффициент корреляции параметров, имеющих размерность поперечного сечения белковой глобулы, с логарифмами скорости сворачивания/разворачивания белков немного увеличился, по сравнению с

' т 2/3

простеишим параметром L .

Также в данной работе исследовалось, как коррелируют со скоростями сворачивания не связанные с размером белка параметры, описывающие его форму, а именно, «компактность» S/S'asa', нормированный радиус инерции Rg/Rg"; и величина VASA/SASA/Rg. Еще был рассчитан, введенный [Plaxco et al, 1998, J. Mol. Biol., 277,

1 "

985] «порядок контактов» CO = — ^AI^. Здесь сумма берется по всем парам

LN (,<„

контактирующих (на расстоянии до бА) тяжелых атомов, N—число таких контактов, ALtJ- число остатков, разделяющих контактирующую пару атомов i, j в цепи (например, ALu+i= 1, если контактируют атомы остатков i и г+1), a L- число аминокислотных остатков в белке. Когда параметр СО был впервые предложен [Plaxco et al., 1998], он хорошо коррелировал с логарифмами скорости сворачивания в воде белков, сворачивающихся в одну стадию. Но по мере исследования все новых и новых белков оказалось, что первоначально «работавшая» заметно хуже, чем СО, величина AbsCO=CO*L [Plaxco et al, 1998, J. Mol. Biol., 277, 985], на самом деле работает много лучше, причем и для белков, сворачивающихся в несколько стадий

[Ivankov étal, 2003, Prot. Sei., 12, 2057]. Отметим, что AbsCO имеет смысл среднего расстояния по цепи между контактирующими атомами.

Видно, что не связанные с размером белка параметры, описывающие его форму, плохо предсказывают скорости сворачивания белков. Это мы объясняем тем, что они не учитывают длину цепи белка — самый важный параметр, определяющий скорость сворачивания белка (Таблица 2Б).

Таблица 2. Коэффициенты корреляций различных параметров формы белковой глобулы с логарифмами скоростей сворачивания и разворачивания в воде и в точке перехода.

1п кр 1п ки 1п км

А Параметры, связанные с размером поперечного сечения белковой глобулы

L3» (Vasa/Sasa)2 Vasa/RS -0.69±0.06 -0.73±0.05 -0.69±0.06 -0.73±0.05 -0.77±0.05 -0.73±0.05 -0.72+0.05 -0.7б±0.05 -0.73±0.05

Б Не связанные с размером белка параметры, описывающие форму белковой глобулы

Sasa/S*asa Rg/Rg* Vasa/Sasa/RS CO -0.33±0.10 -0.43±0.09 -0.39±0.09 0.23±0.10 0.16±0.П 0.18+0.11 0.17±0.11 0.29±0.10 0.24±0.10 -0.01±0.11 0.07±0.11 0.01±0.11

В Параметры типа поперечного сечения белковой глобулы, умноженного на логарифм средней длины петли

L2ßx\n AbsCO (Vasa/Sasa)2^ AbsCO VASA/Rg*In AbsCO -0.71±0.05 -0.75±0.05 -0.71±0.05 -0.76±0.05 -0.79±0.04 -0.7б±0.05 -0.74±0.05 -0.78±0.04 -0.75±0.05

Г Параметры, зависящие от размера и от средней длины цепи белковой глобулы

In L AbsCO In AbsCO -0.71±0.05 -0.80±0.04 -0.77±0.04 -0.77i0.04 -0.78±0.04 -0.77±0.04 -0.80±0.04 -0.84±0.03 -0.8б±0.03

Далее, было исследовано, улучшится ли предсказание скоростей сворачивания и разворачивания с помощью параметров размерности поперечного сечения, если еще добавить учет Флориевской энтропии торчащих из ядра сворачивания петель посредством умножения поперечного сечения на \riAbsCO, имеющий смысл логарифма средней длины петли (Таблица 2В). Видно, что коэффициент корреляции в подавляющем большинстве случаев несколько улучшился (Рисунок 4), что находится в пределах погрешностей, по сравнению с результатами Таблицы 2А.

i -10

15

0 50 100 150 200;

5

6

7

(VASA/SASJ\n AbsCO

In AbsCO

Рисунок 4. Зависимость скорости сворачивания/разворачивания белков от двух из исследованных нами параметров.

В заключение, на всем современном наборе белков с экспериментально исследованной кинетикой сворачивания и разворачивания, была проведена проверка того, насколько логарифмы скорости сворачивания и разворачивания коррелируют с зависящими от размера петель в белке параметрами In L, AbsCO и In AbsCO. Стоит заметить, что эти параметры не следуют из какой-либо существующей на данный момент физической теории, хотя величина In L хорошо коррелировала с логарифмом скорости сворачивания в компьютерных экспериментах [Gutin et al., 1996, Phys. Rev. Lett., 77, 5433]. Из Таблицы 2Г видно, что все три параметра довольно хорошо коррелируют с логарифмами скоростей сворачивания и разворачивания, причем, неожиданно для нас, In AbsCO показал достоверно наилучшую корреляцию (Рисунок 4).

Таким образом, из сделанного анализа видно, что не связанные с размером белка параметры, описывающие только форму белка, плохи для предсказания скоростей сворачивания и разворачивания белков. Видно, что учет размера поперечного сечения и размера петель улучшает качество предсказания скоростей сворачивания белков, а наилучший результат для предсказания скоростей сворачивания белков дает учет логарифма средней длины петель AbsCO. Поскольку данная величина не следует ни из одной, предложенной на данный момент теории,

ее успех в предсказании скоростей сворачивания и разворачивания белка еще предстоит осмыслить.

База данных белков с экспериментально изученной кинетикой сворачивания и разворачивания. На основе накопленных в нашей лаборатории литературных данных по экспериментальному исследованию кинетики сворачивания глобулярных белков была создана база данных по кинетике сворачивания белков. На данный момент наша база является наиболее полной из существующих. Она содержит экспериментальные данные о кинетике сворачивания 87 уникальных белков и множеств их мутантных форм. Веб адрес базы данных: http://kineticdb.protres.ru/db/index.pl.

ВЫВОДЫ

1. Показано, что не дающие фазового перехода «энергетические воронки», ведущие к нативному состоянию на энергетическом ландшафте белковой молекулы, не соответствуют правильной модели сворачивания белка.

2. Показано, что традиционно используемые параметры порядка— число контактов в белковой цепи и размер погруженной в глобулу поверхности этой цепи эквивалентны.

3. Показано, что белки структурного класса "а/р", которые в среднем сворачиваются медленнее других, имеют больший, в среднем, радиус поперечного сечения, чем белки с другими типами укладки вторичной структуры.

4. Показано, что безразмерные параметры, описывающие форму белка, плохо коррелируют со скоростями сворачивания белков, в то время как параметры, учитывающие и форму и размер белка, удовлетворительно предсказывают скорость его сворачивания.

5. Создана полная веб-база экспериментальных данных о кинетике сворачивания и разворачивания глобулярных белков (http://kineticdb.protres.ru/db/index.pl1.

Материалы диссертации изложены в следующих работах:

1. Bogatyreva N.S., Finkelstein A.V. (2001). Cunning simplicity of protein folding landscapes. Protein Engineering. 14(8), 521-523.

2. Galzitskaya O.V., Reifsnyder D.C., Bogatyreva N.S., Ivankov D.N., Garbuzynskiy S.O. (2008). More compact protein globules exhibit slower folding rates. Proteins. 70(2), 329-332.

3. Galzitskaya O.V., Bogatyreva N.S., Ivankov D.N. (2008). Compactness determines protein folding type. JBCB. 6(4), 667-680.

4. Лобанов М.Ю., Богатырева H.C., Галзитская O.B. (2008). Радиус инерции - индикатор компактности белковых структур. Молекулярная биология. 42(4), 701-706.

5. Богатырева Н.С., Иванков Д.Н. (2008). Взаимосвязь между площадью доступной растворителю поверхности белка и числом нативных контактов в его структуре. Молекулярная биология. 42(6), 1048-1055.

6. Bogatyreva N.S., Osypov А.А., Ivankov D.N. (2008). KineticDB: a database of protein folding kinetics. Nucleic Acids Res. doi:gkn696, PMID: 18842631.

7. Finkelstein A.V., Galzitskaya O.V., Ivankov D.N., Bogatyreva N.S., Garbuzinskii S.O., Lobanov M.Yu., Dolgikh D.A., Oliveberg M. (2002). Protein folding: Theoretical and experimental study. Proceedings of the Fifth Meeting on the Critical Assessment of Techniques for Protein Structure Prediction, Asilomar Conference Center, Pacific Grove, California, p. A202.

8. Garbuzynskiy S.O., Ivankov D.N., Reifsnyder D.C., Bogatyreva N.S., Finkelstein A.V., Galzitskaya O.V. (2007). Prediction of protein folding rates. Proceedings of the International Conference on "Protein Biosynthesis, Structure and Function", Pushchino, Russia, p. 77.

9. Bogatyreva N.S., Ivankov D.N. (2007). Optimal way of considering intra-protein contacts. Proceedings of the Third Moscow Conference on Computational Molecular Biology, Moscow, Russia, pp. 51-52.

10. Garbuzynskiy S.O., Ivankov D.N., Reifsnyder D.C., Bogatyreva N.S., Finkelstein A.V., Galzitskaya O.V. (2007). Prediction of folding rates of proteins. Proceedings of the Third Moscow Conference on Computational Molecular Biology, Moscow, Russia, pp. 102-103.

11. Galzitskaya O.V., Lobanov M.Yu., Bogatyreva N.S., Ivankov D.N. (2008). Proteins with multistate kinetics arc more compact than proteins with two-state kinetics: Compactness determines protein folding type. XXI Sitges Conference Statistical Mechanics of Molecular Biophysics, Sitges (Barcelona), Spain, p. 30.

12. Галзитская O.B., Богатырева H.C., Лобанов М.Ю., Иванков Д.Н. (2008). Белки, сворачивающиеся по многостадийному механизму, более компактны, чем белки, сворачивающиеся по многостадийному механизму. Доклады II международной конференции «Математическая биология и биоинформатика», Пущино, Россия, с. 154-155.

Подписано в печать 18.10.2008 г.

Печать трафаретная

Заказ № 990 Тираж: 100 экз.

Типография «11-й ФОРМАТ» ИНН 7726330900 115230, Москва, Варшавское ш., 36 (499) 788-78-56 vww.autoreferat.ru

Содержание диссертации, кандидата физико-математических наук, Богатырева, Наталья Сергеевна

ВВЕДЕНИЕ

СПИСОК СОКРАЩЕНИЙ

ГЛАВА 1. ОБЗОР ЛИТЕРАТУРЫ

1.1. Экспериментальные исследования сворачивания белков

1.2. Парадокс Левинталя и открытие механизма нуклеации (в эксперименте и компьютерном моделировании)

1.3. Аналитические теории по изучению сворачивания белков и решение парадокса Левинталя

1.4. Компьютерное моделирование сворачивания белков, построенное с учетом нуклеационного механизма

1.5. Модели «энергетических воронок», применяемые при изучении сворачивания белков

1.6. Влияние устройства нативной структуры белковой цепи на скорость ее сворачивания

1.7. Эмпирические и биоинформатические методы предсказания скоростей сворачивания белков

1.8. Использование площади доступной растворителю поверхности белковой цепи и числа нативных контактов в ней при оценке интенсивности взаимодействий в этой цепи

1.9. Различные меры компактности структуры, используемые при изучении сворачивания белка

МЕТОДЫ

ГЛАВА 2. Критический анализ моделей «энергетических воронок», применяемых в теории сворачивания белка

2.1. Введение

2.2. Модель «энергетической воронки» и сворачивание белков

2.3. «Воронки и «Ландшафты»

ГЛАВА 3. Связь площади доступной растворителю поверхности белковой цепи с числом контактов в ней

3.1. Предварительное рассмотрение

3.2. Площадь поверхности цепи, погруженной в нативный белок, и число контактов, сформированных в таком белке

3.3. Обсуждение результатов

ГЛАВА 4. Связь ряда феноменологических параметров глобулярных белков со скоростью их сворачивания

4.1. Белки структурного класса "а/Р" имеют более округлую форму, чем белки других структурных классов

4.2. Связь параметров компактности белковой глобулы со скоростью ее сворачивания и разворачивания

Введение Диссертация по биологии, на тему "Связь компактности и других свойств глобулярных белков со скоростью их сворачивания"

Рис.1. (а) Первичная структура (то есть аминокислотная последовательность) белка — N-коидевого домена виллина. Каждая буква соответствует одной аминокислоте, (б) - (г) Трехмерная нативная структура того же белка: (б) показан только ход главной цепи, а боковые группы не изображены для упрощения рисунка; (в) скелетная модель нативной структуры (боковые группы — тонкие линии, главная цепь — толстая); (г) атомная модель нативной структуры.

Природные белки состоят из аминокислотных остатков 20 типов1, соединенных друг с другом ковалентными связями в неразветвленную

Белки (наряду с ДНК и РНК) являются важнейшими для жизни биополимерами. При участии белков в живой природе происходит подавляющее большинство химических процессов, которые без участия белков либо идут с ничтожной скоростью, либо не идут вообще. а) б)

VELSKKVTGKLDKTTPGIQI WRIENMEMVPVPTKSYGNFY EGDCYVLLSTRKTGSGFSYN IHYWLGKNSSQDEQGAAAIY TTQMDEYLGSVAVQHREVQG HESETFRAYFKQGLIYKQGG VASGMK

1 На данный момент известно, что на рибосоме в растущую полипептидную цепь способны включаться аминокислоты 22 типов. То есть, вдобавок к общеизвестным 20 аминокислотам, еще и селеноцистеин и пирролнзнн [Zhang, Gladyshev, 2007]. линейную структуру, в которой последовательность аминокислотных остатков (называемая первичной структурой, РисЛа) для каждого белка строго определена его геном [Sanger et al., 1951]. Обычно белок функционален в свернутом состоянии (мы говорим «обычно» потому, что никакие правила не работают одновременно для всех белков), в котором он имеет уникальную пространственную структуру (эта биологически активная структура называется «нативной», РисЛб-г). Это впервые было показано Перутцем и Кендрью в 1950-х годах [Kendrew et al., 1958; Perutz et al., 1960]. Специфичность функции белка связана с тем, что в клетке, при биологических условиях (обычно: 25-37°С, нейтральный рН, отсутствие денатуранта), нативная структура намного стабильнее всех других структур, от которых она отделена барьером свободной энергии, а разрушение нативной структуры белка (вследствие изменения условий) происходит кооперативно по типу «все-или-ничего» [Privalov, 1979; Privalov, 1982].

В клетке обретение белком нативной структуры происходит в процессе или сразу после биосинтеза полипептидной цепи на рибосоме. Изначально было непонятно, необходима ли рибосома для формирования пространственной структуры белка. Однако в 1961 году Анфинсен показал, что трехмерная структура бычьей рибонуклеазы определяется только ее первичной структурой — при восстановлении физиологических условий развернутый in vitro белок опять приобретал свою нативную структуру [Anfinsen et al., 1961; Anfinsen, 1973]. Позже было показано, что химически синтезированный белок также способен сворачиваться в свою нативную структуру [Gutte, Merrifield, 1969; Merrifield, 1969], несмотря на то, что он ни разу в жизни не «видел» рибосомы. С тех пор способность к ренатурации была продемонстрирована для очень большого числа белков [Jackson, 1998].

Со времен опытов Анфинсена проблема сворачивания белка стала физической (ее также называют проблемой самоорганизации белка) и до сих пор является одной из самых важных и актуальных проблем биофизики. В ходе экспериментальных и теоретических исследований самоорганизации белка возникло множество вопросов: «Как белок может найти свою нативную структуру из астрономического числа возможных?» (т.н. парадокс Левинталя [Levinthal, 1968]), «Каков механизм сворачивания белка?», «Чем о k определяется скорость и путь сворачивания белка?» и др. На некоторые вопросы ответы уже получены, на другие — едва намечены.

Помимо своей фундаментальной значимости, понимание механизма сворачивания белка имеет огромное значение для решения многих практических задач, таких как разработка лекарств и создание искусственных белков с заданными свойствами. Нарушение правильного сворачивания белков in vivo, а также часто сопутствующий этому процесс агрегации во многих случаях приводят к заболеваниям [Chiti, Dobson, 2006].

Теория скоростей сворачивания однодоменных глобулярных белков к настоящему времени разработана довольно полно [Finkelstein, Badretdinov, 1997; Финкельштейн, Птицын, 2005]. Эта теория связывает скорость сворачивания белка с его размером, она дает вполне разумные, но довольно грубые результаты. Поэтому необходимо найти другие, помимо длины цепи, факторы, которые могут дополнительно влиять на скорость сворачивания белка.

Для тех случаев, когда размеры белковых цепей существенно не различаются, разработана феноменологическая теория, которая связывает структуру белков, сворачивающихся без интермедиатов, и скорость их сворачивания [Plaxco et al., 1998]. Суть ее в том, что чем дальше по аминокислотной цепи белка завязаны пространственные контакты в нативной структуре, тем медленнее белок сворачивается.

Феноменологическая теория скоростей сворачивания глобулярных белков коррелирует с общей теорией, но она не учитывает зависимость скорости сворачивания от размера белка. Поэтому был разработан подход, 2

Согласно сложившейся традиции, в этой работе под словом «скорость» подразумевается константа скорости. обобщающий эти две теории и дающий более точные и, главное, более общие результаты [Ivankov et al, 2003].

Итак, экспериментальное и теоретическое изучение механизма самоорганизации белков привело к пониманию процесса самоорганизации и созданию грубых теоретических моделей сворачивания глобулярных белков, но мы до сих пор не знаем детальной картины сворачивания белка. Поэтому все еще продолжается поиск факторов, играющих роль в сворачивании белка и влияющих на скорость его сворачивания.

Целью данной работы являлось теоретическое исследование связи кинетики сворачивания глобулярных белков с особенностями их структуры.

В рамках этого исследования были поставлены следующие задачи.

1. Проверить гипотезу, что любой «воронкообразный» энергетический ландшафт гарантирует успешное сворачивание белковой цепи.

2. Исследовать взаимную связь двух структурных параметров порядка, используемых при теоретическом изучении сворачивания белковых цепей: числа контактов в цепи и размера ее скрытой от воды поверхности.

3. Исследовать связь ряда феноменологических параметров пространственной структуры однодоменных глобулярных белков со скоростью их сворачивания.

В первой части работы был проведен критический анализ модели сворачивания белка, которая исходит не из экспериментально открытого нуклеационного механизма образования нативного состояния белка, а из предположения, что успешную модель белкового сворачивания может обеспечить любой воронкообразный вид зависимости энтропии белковой цепи от ее энтальпии. Оказалось, что такая модель не соответствует действительности, поскольку в ней сворачивание белка занимает

3 Для краткости мы будем в этой работе называть «белками» однодоменные водорастворимые глобулярные белки, а также отдельные глобулярные домены многодоменных белков, и, кроме того, не глобулярные, но имеющие определенную пространственную структуру маленькие пептиды. Строго говоря, в данной работе рассматриваются только белки, не имеющие в своей нативной структуре ни S-S связей, ни ковалентных связей с лигандами. астрономическое время в экспериментально наблюдаемых условиях, обеспечивающих одновременное сосуществование нативного и денатурированного состояния белковой цепи.

Во второй части работы был проведен анализ величин, часто используемых в качестве координаты реакции при теоретическом изучении сворачивания белка, а именно, числа нативных контактов и погруженной поверхности белка. Оказалось, что на уровне целых белковых доменов обе эти величины практически однозначно связаны друг с другом для всех способов расчета площади поверхности белка и числа нативных контактов.

Последняя часть посвящена исследованию формы однодоменных глобулярных белков и отдельных белковых доменов и их связи с кинетикой сворачивания белка. Было показано, что белки структурного класса "а/Р", в среднем, более «округлые», чем белки с другим типом укладки вторичной структуры. Было дано объяснение того факта, что в среднем "а/Р" белки сворачиваются медленнее белков той же длины других структурных классов:, для более округлых белков, каковыми являются "а/Р" белки, минимальная* преодолеваемая поверхность раздела фаз в переходном состоянии больше, и, следовательно, сворачивание идет медленнее, чем у менее округлых белков. Также был предложен ряд новых параметров, характеризующих компактность белковой глобулы, позволяющих хорошо предсказывать скорости сворачивания белковых цепей. Одним из результатов последней части данной работы являлось создание базы данных с веб-интерфейсом, содержащей большинство опубликованных на- данный момент экспериментальных данных о кинетике сворачивания и разворачивания глобулярных белков. Кинетические данные для этой базы собирались в течение последних десяти лет и были использованы в теоретических и эмпирических работах нашей лаборатории и в ряде работ других лабораторий и групп. Создание этой базы данных являлось необходимой частью данной работы и, несомненно, будет полезным для многих исследователей. Веб адрес базы данных: http-.//kineticdb.protres.ru/db/index.pl.

СПИСОК СОКРАЩЕНИЙ

ДНК — дезоксирибонуклеиновая кислота РНК — рибонуклеиновая кислота

PDB — Protein Data Bank - Банк Данных решенных белковых структур

ПС — переходное состояние

СО — contact order - порядок контактов

Заключение Диссертация по теме "Биофизика", Богатырева, Наталья Сергеевна

выводы

1. Показано, что не дающие фазового перехода «энергетические воронки», ведущие к нативному состоянию на энергетическом ландшафте белковой молекулы, не соответствуют правильной модели сворачивания белка.

2. Показано, что традиционно используемые параметры порядка— число контактов в белковой цепи и размер погруженной в глобулу поверхности этой цепи эквивалентны.

3. Показано, что белки структурного класса "а/р", которые в среднем сворачиваются медленнее других, имеют больший, в среднем, радиус поперечного сечения, чем белки с другими типами укладки вторичной структуры.

4. Показано, что безразмерные параметры, описывающие форму белка, плохо коррелируют со скоростями сворачивания белков, в то время как параметры, учитывающие и форму и размер белка, удовлетворительно предсказывают скорость его сворачивания.

5. Создана полная веб-база экспериментальных данных о кинетике сворачивания и разворачивания глобулярных белков (http://kineticdb.protres.ru/db/index.pl).

СПИСОК ПУБЛИКАЦИЙ ПО ТЕМЕ ДИССЕРТАЦИИ

1. Bogatyreva N.S., Finkelstein A.V. (2001). Cunning simplicity of protein folding landscapes. Protein Engineering. 14(8), 521-523.

2. Galzitskaya O.V., Reifsnyder D.C., Bogatyreva N.S., Ivankov D.N., Garbuzynskiy S.O. (2008). More compact protein globules exhibit slower folding rates. Proteins. 70(2), 329-332.

3. Galzitskaya O.V., Bogatyreva N.S., Ivankov D.N. (2008). Compactness determines protein folding type. JBCB. 6(4), 667-680.

4. Лобанов М.Ю., Богатырева H.C., Галзитская O.B. (2008). Радиус инерции — индикатор компактности белковых структур. Молекулярная биология. 42(4), 701-706.

5. Богатырева Н.С., Иванков Д.Н. (2008). Взаимосвязь между площадью доступной растворителю поверхности белка и числом нативных контактов в его структуре. Молекулярная биология. 42(6), 1048-1055.

6. Bogatyreva N.S., Osypov А.А., Ivankov D.N. (2008). KineticDB: a database of protein folding kinetics. Nucleic Acids Res. doi:gkn696, PMID: 18842631.

7. Finkelstein A.V., Galzitskaya O.V., Ivankov D.N., Bogatyreva N.S., Garbuzinskii S.O., Lobanov M.Yu., Dolgikh D.A., Oliveberg M. (2002). Protein folding: Theoretical and experimental study. Proceedings of the Fifth Meeting on the Critical Assessment of Techniques for Protein Structure Prediction, Asilomar Conference Center, Pacific Grove, California, p. A202.

8. Garbuzynskiy S.O., Ivankov D.N., Reifsnyder D.C., Bogatyreva N.S., Finkelstein A.V., Galzitskaya O.V. (2007). Prediction of protein folding rates. Proceedings of the International Conference on "Protein Biosynthesis, Structure and Function", Pushchino, Russia, p. 77.

9. Bogatyreva N.S., Ivankov D.N. (2007). Optimal way of considering intra-protein contacts. Proceedings of the Third Moscow Conference on

Computational Molecular Biology, Moscow, Russia, pp. 51-52.

10. Garbuzynskiy S.O., Ivankov D.N., Reifsnyder D.C., Bogatyreva N.S., Finkelstein A.V., Galzitskaya O.V. (2007). Prediction of folding rates of proteins. Proceedings of the Third Moscow Conference on Computational Molecular Biology, Moscow, Russia, pp. 102-103.

11. Galzitskaya O.V., Lobanov M.Yu., Bogatyreva N.S., Ivankov D.N. (2008). Proteins with multistate kinetics are more compact than proteins with two-state kinetics: Compactness determines protein folding type. XXI Sitges Conference Statistical Mechanics of Molecular Biophysics, Sitges (Barcelona), Spain, p. 30.

12. Галзитская O.B., Богатырева H.C., Лобанов М.Ю., Иванков Д.Н. (2008). Белки, сворачивающиеся по многостадийному механизму, более компактны, чем белки, сворачивающиеся по одностадийному механизму. Доклады II международной конференции «Математическая биология и биоинформатика», Пущино, Россия, с. 154-155.

ЗАКЛЮЧЕНИЕ

Одним из важных этапов на пути к пониманию проблемы самоорганизации белка является выяснение факторов, определяющих скорость его сворачивания. Возможность успешного предсказания скоростей сворачивания является одним из свидетельств правильного понимания механизмов самоорганизации белка.

Данная работа посвящена теоретическому исследованию некоторых принципиальных деталей процесса сворачивания белка.

В первой части работы был проведен критический анализ простой модели сворачивания белка, которая, в отличие от некоторых других успешных теоретических методов моделирования, исходит не из экспериментально открытого нуклеационного механизма, а из предположения, что модель белкового сворачивания может обеспечить любой воронкообразный энергетический ландшафт. Оказалось, что такая модель не соответствует действительности, поскольку в ней либо сворачивание белка занимает астрономическое время, либо наблюдаемое в эксперименте одновременное сосуществование нативного и денатурированного состояния невозможно. Представленные в этой части рассуждения дают важный критерий корректности любой модели сворачивания белка, в особенности, модели «воронки». Каждая такая модель должна демонстрировать быстрое сворачивание белка вблизи точки термодинамического равновесия между свернутой и развернутой фазами. Явления разделения фаз и нуклеации представляют собой феномены ключевой важности для понимания механизма самоорганизации белковых молекул.

Во второй части данной работы исследуется зависимость между двумя параметрами порядка, часто использующимися для расчета энергии взаимодействий в белковых цепях, — числом контактов в белковой структуре и площадью ее поверхности, доступной растворителю. Оказалось, что на уровне целых белковых доменов обе эти величины практически однозначно связаны друг с другом (коэффициент корреляции составляет более 99%) для всех способов расчета площади поверхности белка и числа нативных контактов. На уровне отдельных аминокислотных остатков эта зависимость выражена хотя и сильно, но несколько слабее, чем для белков в целом — коэффициент корреляции, в лучшем случае, составляет 94%. При этом оказалось, что для наилучшего согласия между числом нативных контактов и площадью погруженной поверхности лучше всего использовать атом-атомные контакты с учетом атомов водорода. Таким образом, изменение числа контактов между двумя конформациями белковой цепи однозначно связано с соответствующим изменением площади доступной растворителю поверхности, при любом физически разумном способе подсчета контактов.

Последняя часть посвящена исследованию формы однодоменных глобулярных белков и отдельных белковых доменов и их связи с кинетикой сворачивания белка. Показано, что "а/р" белки, в среднем, более «округлые», чем белки с другим типом укладки вторичной структуры. Было дано объяснение того факта, что в среднем "а/р" белки сворачиваются медленнее белков той же длины других структурных классов: для более округлых белков, каковыми являются "а/Р" белки, минимальная преодолеваемая поверхность раздела фаз в переходном состоянии больше, и, следовательно, сворачивание идет медленнее, чем у менее округлых белков. Также был предложен ряд параметров, следующих из нуклеационной теории сворачивания белковой цепи, которые характеризуют компактность белковой глобулы. Эти параметры позволяют хорошо предсказывать скорости сворачивания белковых цепей. Одним из результатов последней части данной работы являлось создание базы данных с веб-интерфейсом, содержащей большинство опубликованных на данный момент экспериментальных данных о кинетике сворачивания и разворачивания глобулярных белков. Кинетические данные для этой базы собирались в течение последних десяти лет и были использованы в теоретических и эмпирических работах нашей лаборатории и в ряде работ других лабораторий и групп. Создание этой базы данных являлось необходимой частью данной работы и, несомненно, будет полезным для многих исследователей. Веб адрес базы данных: http://kineticdb.protres.ru/db/index.pl.

БЛАГОДАРНОСТИ

Данная работа выполнена в Лаборатории физики белка Института белка РАН. Благодарю своего научного руководителя Алексея Витальевича Финкелыптейна за научное руководство, за неоценимый опыт, который я получила в процессе работы под его руководством, за познавательные и ценные дискуссии, и за возможность чрезвычайно интересного общения. Благодарю Оксану Валериановну Галзитскую за научное сотрудничество, за плодотворное обсуждение моей работы и ценные советы.

Спасибо Ройтбергу Михаилу Абрамовичу за интересные и полезные дискуссии и просто за счастливую возможность общения с замечательным человеком.

Благодарю всю теоретическую группу Лаборатории физики белка: Дмитрия Иванкова, Михаила Лобанова, Сергея Гарбузинского, Никиту Довидченко, Анну Глякину за создание плодотворной и творческой рабочей обстановки и постоянную поддержку и сотрудничество. Благодарю Игоря Соколовского за своевременную компьютерную помощь, Фаину Арсентьевну Киреечеву, Нину Владимировну Котову, Александра Федоровича Грипася и весь коллектив Лаборатории физики белка ИБ РАН за доброжелательность, теплоту, участие и взаимопомощь.

Огромное спасибо мужу, дочери и родителям, без поддержки и неоценимой помощи которых эта работа никогда не была бы выполнена.

Благодарю Дмитрия Петровича Харакоза за ценные замечания и обсуждение данной работы.

Спасибо всем друзьям и коллегам за то, что вы есть и за то, что без вас моя жизнь была бы совсем другой.

Библиография Диссертация по биологии, кандидата физико-математических наук, Богатырева, Наталья Сергеевна, Пущино

1. Богатырева Н.С. и Иванков Д.Н. (2008) Взаимосвязь между площадью доступной растворителю поверхности белка и числом нативных контактов в его структуре. Мол. Биология. 6, 1048-1055.

2. Галзитская О.В., Иванков Д.Н. и Финкелынтейн А.В. (2001). Нуклеация и скорость сворачивания в белках. Мол. Биология. 35, 708-717.

3. Ландау Л.Д. и Лифшиц Е.М. (1964). Теоретическая физика. М.: Наука.

4. Павлов М.Ю. и Федоров Б.А. (1982). Метод расчета поверхности и объема белка в растворителе. Биофизика. 27, 609-613.

5. Финкелыптейн А.В. и Бадретдинов А.Я. (1997). Физические причины быстрой самоорганизации стабильной пространственной структуры белков: решение парадокса Левинталя. Мол. биология. 31, 469-477.

6. Финкелынтейн А.В., Иванков Д.Н. и Галзитская О.В. (2005). Предсказание скоростей и ядер сворачивания глобулярных белков на основе теории их самоорганизации. Усп. биол. химии. 45, 3-36.

7. Финкелыптейн А.В. и Птицын О.Б. (2005). Физика белка. М.: КДУ.

8. Флори П. (1971) Статистическая механика цепных молекул. Изд. «Мир», Москва.

9. Худсон. (1967) Статистика для физиков. Изд. «Мир», Москва.

10. Шульц Г., Ширмер Р. (1982). Принципы структурной организации белков. Изд. «Мир», Москва.

11. Abkevich V.I., Gutin A.M. and Shakhnovich E.I. (1994). Specific nucleus as a transition state for protein folding: an evidence from lattice model. Biochemistry. 33, 10026-10036.

12. Aim E. and Baker D. (1999). Prediction of protein-folding mechanisms from free-energy landscapes derived from native structures. Proc. Natl. Acad. Sci. USA. 96, 11305-11310.

13. Aim E., Morozov A.V., Kortemme Т. and Baker D. (2002). Simple physical models connect theory and experiment in protein folding kinetics. J. Mol. Biol 322, 463-476.

14. Alsallaq R. and Zhou H.X. (2007). Energy landscape and transition state of protein-protein association. Biophys. J., 92, 1486-1502.

15. Anfinsen C.B., Haber E., Sela M. and White F.H. (1961). The kinetics of formation of native ribonuclease during oxidation of the reduced polypeptide chain. Proc. Natl Acad. Sci. USA. 47, 1309-1314.

16. Anfinsen C.B. (1973). Principles that govern the folding of protein chains. Science. 181, 223-230.

17. Baker D. (2000). A surprising simplicity to protein folding. Nature. 405, 3942.

18. Baryshnikova E.N., Melnik B.S., Finkelstein A.V., Semisotnov G.V. and Bychkova V.E. (2005). Three-state protein folding: experimental determination of free-energy profile. Protein Sci., 14, 2658-2667.

19. Bicout D.J. and Szabo A. (2000). Entropic barriers, transition states, funnels, and exponential protein folding kinetics: a simple model. Protein Sci., 9, 452465.

20. Bogatyreva N.S. and Finkelstein A.V. (2001). Cunning simplicity of protein folding landscapes. Protein Eng., 14, 521-523.

21. Bogatyreva N.S., Osypov A.A., Ivankov D.N. (2008). KineticDB: a database of protein folding kinetics. Nucl. Acids Res. doi:gkn696, PMID: 18842631.

22. Bryngelson J.D. and Wolynes P.G. (1990). A simple statistical field theory of heteropolymer collapse with application to protein folding. Biopolymers. 30, 177-188.

23. Bryngelson J.D., Onuchic J.N., Socci N.D. and Wolynes P.G. (1995). Funnels, pathways, and the energy landscape of protein folding: a synthesis. Proteins, 21, 167-195.

24. Cavallo L. Kleinjung J. and Fraternalli F. (2003). POPS: a fast algorithm for solvent accessible surface areas at atomic and residue level. Nucl. Acids Res. 31, 3364-3366.

25. Chan H.S. and Dill K.A. (1998). Protein folding in the landscape perspective: chevron plots and non-Arrhenius kinetics. Proteins. 30, 2-33.

26. Chikenji G., Fujitsuka Y. and Takada S. (2006). Shaping up the protein folding funnel by local interaction: lesson from a structure prediction study. Proc. Natl. Acad. Sci USA. 103, 3141-3146.

27. Chiti F., Dobson C.M. (2006). Protein misfolding, functional amyloid, and human disease. Annu. Rev. Biochem. 75, 333-366.

28. Choe S.E., Matsudaira P.T., Osterhout J., Wagner G. and Shakhnovich E.I. (1998). Folding kinetics of villin 14T, a protein domain with a central beta-sheet and two hydrophobic cores. Biochemistry. 37, 14508-14518.

29. Chothia C. (1974). Hydrophobic bonding and accessible surface area in proteins. Nature. 248, 338-339.

30. Clementi C., Jennings P.A. and Onuchic J.N. (2000). How native-state topology affects the folding of dihydrofolate reductase and interleukin-l(3. Proc. Natl Acad. Sci USA. 97, 5871-5876.

31. Creighton Т.Е. (1991). Proteins. W.H. Freeman, New York.

32. Dill K.A. and Chan H.S. (1997) From Levinthal to pathways to funnels. Nat. Struct. Biol. 4, 10-19.

33. Dinner A.R. and Karplus M. (2001) The roles of stability and contact order in determining protein folding rates. Nat. Struct. Biol. 8, 21-22.

34. Dobson C.M. and Karplus M. (1999). The fundamentals of protein folding: bringing together theory and experiment. Curr. Opin. Struct. Biol. 9, 92-101.

35. Dolgikh D.A., Gilmanshin R.I., Brazhnikov E.V., Bychkova V.E., Semisotnov G.V., Venyaminov S.Yu. and Ptitsyn O.B. (1981). Alphalactalbumin: compact state with fluctuating tertiary structure? FEBS Lett. 136, 311-315.

36. Dyson H.J. and Wright P.E. (1996). Insights into protein folding from NMR. Ann. Rev. Phys. Chem. 47, 369-395.

37. Fersht A.R. (1997). Nucleation mechanisms in protein folding. Curr. Opin. Struct. Biol. 7, 3-9.

38. Fersht A.R. (2000). Structure and Mechanism in Protein Science: A Guide to Enzyme Catalysis and Protein Folding, W.H. Freeman, New York.

39. Fersht A.R. (2000). Transition-state structure as a unifying basis in protein-folding mechanisms: contact order, chain topology, stability, and the extended nucleus mechanism. Proc. Natl. Acad. Sci USA. 97, 1525-1529.

40. Fersht A.R. (2004). Relationship of Leffler (Bronsted) a values and protein folding Ф values to position of transition-state structures on reaction coordinates. Proc. Natl. Acad. Sci USA. 101, 14338-14342.

41. Finkelstein A.V. (1997). Can protein unfolding simulate protein folding? Protein Eng. 10, 843-845.

42. Finkelstein A.V. and Badretdinov A.Ya. (1997). Rate of protein folding near the point of thermodynamic equilibrium between the coil and the most stable chain fold. Fold. Des. 2, 115-121.

43. Finkelstein A.V and Badretdinov A.Ya. (1998). Influence of chain knotting on the rate of folding. Fold. Des. 3, 67-68.

44. Finkelstein A.V. and Galzitskaya O.V. (2004). Physics of protein folding. Physics of life reviews. 1, 23-56.

45. Fung A., Li P., Godoy-Ruiz R., Sanchez-Ruiz J.M. and Munoz V. (2008). Expanding the realm of ultrafast protein folding: gpW, a midsize natural single-domain with alpha+beta topology that folds downhill. J. Am. Chem. Soc. 130, 7489-7495.

46. Galzitskaya O.V. and Finkelstein A.V. (1995). Folding of chains with random and edited sequences: similarities and differences. Protein Eng. 8, 883-892.

47. Galzitskaya O.V. and Finkelstein A.V. (1999). A theoretical search for folding/unfolding nuclei in three-dimensional protein structures. Proc. Natl. Acad. Sci. USA. 96, 11299-11304.

48. Galzitskaya O.V., Ivankov D.N. and Finkelstein A.V. (2001). Folding nuclei in proteins. FEBS Lett. 489, 113-118.

49. Galzitskaya O.V., Garbuzynskiy S.O., Ivankov D.N. and Finkelstein A.V. (2003). Chain length is the main determinant of the folding rate for proteins with three-state folding kinetics. Proteins. 51, 162-166.

50. Galzitskaya O.V., Garbuzynskiy S.O. and Finkelstein A.V. (2005). Theoretical study of protein folding: outlining folding nuclei and estimation of protein folding rates. Journal of Physics: Condensed Matter. 17, SI 539-S1551.

51. Galzitskaya O.V. and Garbuzynskiy S.O. (2006). Entropy capacity determines protein folding. Proteins. 63, 144-154.

52. Galzitskaya O.V., Reifsnyder D.C., Bogatyreva N.S., Ivankov D.N. and Garbuzynskiy S.O. (2008). More compact protein globules exhibit slower folding rates. Proteins. 70, 329-332.

53. Garbuzynskiy S.O., Finkelstein A.V. and Galzitskaya O.V. (2004). Outlining folding nuclei in globular proteins. J. Mol. Biol. 336, 509-525.

54. Garcia-Mira M.M., Sadqi M., Fischer N., Sanchez-Ruiz J.M. and Munoz V. (2002). Experimental identification of downhill protein folding. Science. 298, 2191-2195.

55. Gianni S., Guydosh N.R., Khan F., Caldas T.D., Mayor U., White G.W.N., DeMarco M.L., Daggett V. and Fersht A.R. (2003). Unifying features in protein-folding mechanism. Proc. Natl. Acad. Sci. USA. 100, 13286-13291.

56. Go N. (1975). Theory of reversible denaturation of globular proteins. Int. J. Pept. Prot. Res. 7, 313-323.

57. Goldbeck R.A., Thomas Y.G., Chen E., Esquerra R.M. and Kliger D.S. (1999). Multiple pathways on a protein-folding energy landscape: kinetic evidence. Proc. Natl. Acad. Sci. USA. 96, 2782-2787.

58. Gong H., Isom D.G., Srinivasan R. and Rose G.D. (2003). Local secondary structure content predicts folding rates for simple, two-state proteins. J. Mol. Biol. 327, 1149-1154.

59. Grantcharova V.P., Aim E.J., Baker D. and Horwich A.L. (2001). Mechanisms of protein folding. Curr. Opin. Struct. Biol. 11, 70-82.

60. Gromiha M.M. and Selvaraj S. (2001). Comparison between long-range interactions and contact order in determining the folding rate of two-state proteins: application of long-range order to folding rate prediction. J. Mol. Biol. 310, 27-32.

61. Gromiha M.M. (2005). A statistical model for predicting protein folding rates from amino acid sequence with structural class information. J. Chem. Inf. Model. 45, 494-501.

62. Gromiha M.M., Thangakani A.M. and Selvaraj S. (2006). FOLD-RATE: prediction of protein folding rates from amino acid sequence. Nucl. Acids Res., 34, W70-W74.

63. Gutin A.M., Abkevich V.I. and Shakhnovich E.I. (1995). Is burst hydrophobic collapse necessary for protein folding? Biochemistry. 34, 3066-3076.

64. Gutin A.M., Abkevich V.I. and Shakhnovich E.I. (1996). Chain length scaling of protein folding time. Phys. Rev. Lett. 77, 5433-5436.

65. Gutte B. and Merrifield R.B. (1969). The total synthesis of an enzyme with ribonuclease A activity. J. Amer. Chem. Soc. 91, 501-502.

66. Hammond G.S. (1955). A correlation of reaction rates. J. Amer. Chem. Soc. 77, 334-338.

67. Holm L., Kaariainen S., Rosenstrom P. and Schenkel A. (2008). Searching protein structure databases with DaliLite. Bioinformatics. 3, PMID: 18818215.

68. Ivankov D.N. and Finkelstein A.V. (2001). Theoretical study of a landscape of protein folding-unfolding pathways. Folding rates at midtransition. Biochemistry. 40, 9957-9961.

69. Ivankov D.N., Garbuzynskiy S.O., Aim E., Plaxco K.W., Baker D. and Finkelstein A.V. (2003). Contact order revisited: influence of protein size on the folding rate. Protein Sci. 12, 2057-2062.

70. Ivankov D.N. and Finkelstein A.V. (2004). Prediction of protein folding rates from the amino acid sequence-predicted secondary structure. Proc. Natl. Acad. Sci. USA. 101, 8942-8944.

71. Jackson S.E. and Fersht A.R. (1991). Folding of chymotrypsin inhibitor 2. 1.

72. Evidence for a two-state transition. Biochemistry. 30, 10428-10435.

73. Jackson S.E. (1998). How do small single-domain proteins fold? Fold. Des. 3, 81-91.

74. Kendrew J.C., Bodo G., Dintzis H.M., Parrish H., Wyckoff H. and Phillips D.C. (1958). A three-dimensional model of the myoglobin molecule obtained by X-ray analysis. Nature. 181, 662-666.

75. Khorasanizadeh S., Peters I.D. and Roder H. (1996). Evidence for a three-state model of protein folding from kinetic analysis of ubiquitin variants with altered core residues. Nat. Struct. Biol. 3, 193-205.

76. Klimov D.K. and Thirumalai D. (2001). Multiple protein folding nuclei and the transition state ensemble in two-state proteins. Proteins. 43, 465- 475.

77. Koga N. and Takada S. (2001). Roles of native topology and chain-length scaling in protein folding: a simulation study with a Go-like model. J. Mol. Biol. 313, 171-180.

78. Krieger E., Koraimann G. and Vriend G. (2002). Increasing the precision of comparative models with YASARA NOVA — a self-parameterizing force field. Proteins. 47, 393-402.

79. Kuznetsov I.B. and Rackovsky S. (2004). Class-specific correlations between protein folding rate, structure-derived, and sequence-derived descriptors. Proteins. 54, 333-341.

80. Lee В. and Richards F.M. (1971). The interpretation of protein structures: estimation of static accessibility. J. Mol. Biol 55, 379^400.

81. Leninger A.L., Nelson D.L. and Cox M.M. (1993). Principles of Biochemistry. Worth Publ., Inc., New York.

82. Leopold P.E., Montal M. and Onuchic J.N. (1992). Protein folding funnels: a kinetic approach to the sequence-structure relationship. Proc. Natl. Acad. Sci. USA. 89, 8721-8725.

83. Lesk A. and Chotia C. (1980). Solvent accessibility, protein surface, and protein folding. Biophys. J. 32, 35-47.

84. Levinthal C. (1968). Are there pathways for protein folding? J. Chim. Phys. Chim. Biol. 65, 44-45.

85. Li M.S., Klimov D.K. and Thirumalai D. (2004). Thermal denaturation and folding rates of single domain proteins: size matters. Polymer. 45, 573-579.

86. MacCallum J.L.^ Moghaddam M.S., Chan H.S. and Tieleman D.P. (2007) Hydrophobic association of alpha-helices, steric dewetting, and enthalpic barriers to protein folding. Proc. Natl Acad. Sci. USA. 104, 6206-6210.

87. Matouschek J.T., Kellis J., Serrano L. and Fersht A.R. (1989). Mapping the transition state and pathway of protein folding by protein engineering. Nature. 340, 122-126.

88. Merrifield R.B. (1969). The synthesis of biologically active peptides and proteins. JAMA. 210, 1247-1254.

89. Micheletti C. (2003). Prediction of folding rates and transition-state placement from native-state geometry. Proteins. 51, 74-84.

90. Mirny L.A., Abkevich V. and Shakhnovich E.I. (1996). Universlity and diversity of the protein folding scenarios: a comprehensive analysis with the aid of a lattice model. Fold. Des. 1, 103-116.

91. Mirny L. and Shakhnovich E. (2001). Annu. Rev. Biophys. Biomol. Struct. 30, 361-396.

92. Moore, Pearson. (1981). Kinetics and mechanism. John Wiley, New York.

93. Munoz V., Thompson P.A., Hofrichter J. and Eaton W.A. (1997) Folding dynamics and mechanism of beta-hairpin formation. Nature. 390, 196-199.

94. Munoz V. and Eaton W.A. (1999). A simple model for calculating the kinetics of protein folding from three-dimensional structures. Proc. Natl Acad. Sci. USA. 96, 11311-11316.

95. Murzin A.G., Brenner S.E., Hubbard T. and Chothia C. (1995). SCOP: a structural classification of proteins database for the investigation of sequences and structures. J. Mol. Biol. 247, 536-540.

96. Myers J.K. and Oas T.G. (2001). Pre-organized secondary structure as an important determinant of fast protein folding. Nat. Struct. Biol. 8, 552-558.

97. Naganathan A.N. and Munoz V. (2005). Scaling of folding times with protein size. J. Am. Chem. Soc. 127, 480-481.

98. Nymeyer H., Garcia A.E. and Onuchic J.N. (1998). Folding funnels and frustration in off-lattice minimalist protein landscapes. Proc. Natl. Acad. Sci. USA. 95, 5921-5928.

99. Oliva F.Y. and Munoz V.A simple thermodynamic test to discriminate between two-state and downhill folding. (2004). J. Am. Chem. Soc. 126, 85968597.

100. Onuchic J.N., Wolynes P.G., Luthey-Schulten Z. and Socci N.D. (1995). Toward an outline of the topography of a realistic protein-folding funnel. Proc. Natl Acad. Sci. USA. 92, 3626-3630.

101. Onuchic J.N., Socci N.D., Luthey-Schulten Z. and Wolynes P.G. (1996). Protein funnels: The nature of the transition state ensemble. Fold. Des. 1, 441450.

102. Onuchic J.N., Luthey-Schulten Z. and Wolynes P.G. (1997). Theory of protein folding: the energy landscape perspective. Annu. Rev. Phys. Chem. 48, 545-600.

103. Perutz M.F., Rossmann M.G., Cullis A.F., Muirhead G., Will G. and North T. (1960). Structure of haemoglobin: a three-dimensional fourier synthesis at 5.5A. Resolution, obtained by X-ray analysis. Nature. 185, 416-422.

104. Plaxco K.W., Simons K.T. and Baker D. (1998). Contact order, transition state placement and the refolding rates of single domain proteins. J. Mol. Biol. Ill, 985-994.

105. Plaxco K.W., Simons K.T., Ruczinski I. and Baker D. (1999). Topology, stability, sequence, and length: defining the determinants of two-state protein folding kinetics. Biochemistry. 39, 11177-11183.

106. Prabhu N.P. and Bhuyan A.K. (2006). Prediction of folding rates of small proteins: empirical relations based on length, secondary structure content, residue type, and stability. Biochemistry. 45, 3805-3812.

107. Privalov P.L. (1979). Stability of proteins: small globular proteins. Adv. Protein Chem. 33, 167-241.

108. Privalov P.L. (1982). Stability of proteins. Proteins which do not present a single cooperative system. Adv. Protein Chem. 35, 1-104.

109. Ptitsyn O.B. (1995). Molten globule and protein folding. Adv. Protein Chem. 47, 83-229.

110. Punta M. and Rost B. (2005). Protein folding rates estimated from contact predictions. J. Mol. Biol. 348, 507-512.

111. Richards F.M. (1977). Лии. Rev. Biophys.Bioeng. 6, 151-176.1. V

112. Sali A., Shakhnovich E.I. and Karplus M. (1994). Kinetics of protein folding a lattice model study of the requirements for folding to the native state. J. Mol.Biol. 235, 1614-1636.

113. Samanta U., Bahadur R.P. and Chakrabarti P. (2002). Quantifying the accessible surface area of protein residues in their local environment. Protein Eng. 15, 659-667.

114. Sanger F. and Tuppy H. (1951). The amino-acid sequence in the phenylalanyl chain of insulin. 2. The investigation of peptides from enzymic hydrolysates. Biochem. J. 49, 481-490.

115. Shao H., Peng Y. and Zeng Z.-H. (2003). A simple parameter relating sequences with folding rates of small alpha helical proteins. Prot. Pept. Lett. 10, 277-280.

116. Shao H. and Zeng Z.-H. (2003). A sequence function reveals new features in |3-protein folding. Prot. Pept. Lett. 10, 435-439.

117. Takada S. (1999). Go-ing for the prediction of protein folding mechanisms. Proc. Natl Acad. Sci. USA. 96, 11698-11700.

118. Tanford C. (1968). Protein denaturation. Adv. Protein Chem. 23, 121-282.

119. Thirumalai D. (1995). From minimal models to real proteins: time scales for protein folding kinetics. J. Phys. {Orsay, Fr.) 5, 1457-1469.

120. Thompson P.A., Eaton W.A. and Hofrichter J. (1997). Laser temperature jump study of the helix-coil kinetics of an alanine peptide interpreted with a 'kinetic zipper' model. Biochemistry. 36, 9200-9210.

121. Tsai С J. and Nussinov R. (1997a). Hydrophobic folding units at protein-protein interfaces: implications to protein folding and to protein-protein association. Protein. Sci. 6, 1426-1437.

122. Tsai C.J. and Nussinov R. (19976). Hydrophobic folding units derived from dissimilar monomer structures and their interactions. Protein. Sci. 6, 24-42.

123. Tsai J., Levitt M. and Baker D. (1999). Hierarchy of structure loss in MD simulations of src SH3 domain unfolding. J. Mol. Biol. 291, 215-225.

124. Udgaonkar J.B. and Baldwin R.L. (1988). NMR evidence for an early framework intermediate on the folding pathway of ribonuclease A. Nature. 335, 694-699.

125. Weinkam P., Zong C. and Wolynes P.G. (2005). A fimneled energy landscape for cytochrome с directly predicts the sequential folding route inferred from hydrogen exchange experiments. Proc. Natl. Acad. Sci. USA. 102, 1240112406.

126. Wetlaufer D.B. (1973). Nucleation, rapid folding, and globular intrachain regions in proteins. Proc. Natl. Acad. Sci. USA. 70, 697-701.

127. Wodak S.J. and Janin J. (1981). Location of structural domains in proteins. Biochemistry. 20, 6544-6552.

128. Wolynes P.G. (1997). Folding funnels and energy landscapes of larger proteins within the capillarity approximation. Proc. Nat. Acad. Sci. USA. 94, 6170-6175.

129. Wolynes P.G. (2005). Energy landscapes and solved protein-folding problems. Philos. Transact. A Math. Phys. Eng. Sci. 363, 453-467.

130. Zana R. (1975). On the rate-determining step for helix-propagation in the helix-coil transition of polypeptides in solution. Biopolymers. 14, 2425-2428.

131. Zehfus M.H. and Rose G.D. (1986). Compact units in proteins. Biochemistry. 25, 5759-5765.

132. Zhang L., Li J., Jiang Z and Xia A. (2003). Folding rate prediction based on neural network model. Polymer. 44, 1751-1756.

133. Zhang Y. and Gladyshev V.N. (2007). High content of proteins containing 21st and 22nd amino acids, selenocysteine and pyrrolysine, in a symbiotic deltaproteobacterium of gutless worm Olavius algarvensis. Nucl. Acids Res. 35, 4952-4963.

134. Zhou H. and Zhou Y. (2002). Folding rate prediction using total contact distance. Biophys. J. 82, 458-463.

135. Zwanzig R., Szabo A. and Bagchi B. (1992). Levinthal's paradox. Proc. Natl. Acad. Sci. USA. 89, 20-22.

136. Zwanzig R. (1995). Simple model of protein folding kinetics. Proc. Natl. Acad. Sci. USA. 92, 9801-9804.