Бесплатный автореферат и диссертация по биологии на тему
Теория скоростей сворачивания глобулярных белков
ВАК РФ 03.00.02, Биофизика

Автореферат диссертации по теме "Теория скоростей сворачивания глобулярных белков"

УДК 577.322 на правах рукописи

ИВАШОВ ДМИТРИЙ НИКОЛАЕВИЧ ТЕОРИЯ СКОРОСТЕЙ СВОРАЧИВАНИЯ ГЛОБУЛЯРНЫХ БЕЛКОВ

03.00.02.-биофизика

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук

Москва 2006

Работа выполнена в Институте белка РАН

Научные руководители:

доктор физико-математических наук, профессор Финкелыптейн Алексей Витальевич

Официальные оппоненты:

доктор физико-математических наук Потехин Сергей Александрович доктор физико-математических наук, профессор Шайтан Константин Вольдемарович

Ведущая организация:

Институт биофизики клетки РАН

Защита диссертации состоится 22 марта 2006 года в на заседании

диссертационного совета К212.156.03 в Московском физико-техническом институте по адресу: 141700, г. Долгопрудный Московской области, Институтский пер., 9.

С диссертацией можно ознакомиться в библиотеке МФТИ. Автореферат разослан « (3 » ЬемллА, 2006 г.

Ученый секретарь

диссертационного совета

кандидат физико-математических наук

В.Е. Бра1 ин

УО/г

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность проблемы. С тех пор, как в 1961 году было показано, что белок способен сам — в подходящих условиях — находить свою нативную, т.е биологически-активную пространственную структуру, проблема самоорганизации белка является одной из важнейших проблем биофизики. Актуальность ее связана с тем, что процесс самоорганизации является наименее понятным на данный момент этапом на пути от закодированной в ДНК информации к функционирующему белку. Один из первых вопросов, возникших после открытия явления самоорганизации, известен как парадокс Левинталя: каким образом белок за секунды находит свою самую стабильную структуру среди астрономического числа возможных? И хотя обнаружение нуклеационного механизма самоорганизации («сворачивания») белка привело к решению парадокса Левинталя, вопрос о том, какие факторы обусловливают скорость сворачивания белков, остается открытым. Важность ответа на этот вопрос связана с тем, что некоторые заболевания обусловлены агрегацией или неправильным сворачиванием белков — процессами, эффективность которых напрямую зависит от скорости «правильной» самоорганизации белка. В связи с этим изучение кинетических аспектов самоорганизации белков остается актуальнейшей проблемой физики белка.

Цель и задачи исследования. Целью данного исследования является выявление факторов, определяющих скорость самоорганизации однодоменных глобулярных белков (далее, для краткости, — просто «белки»), и степени их влияния на скорость сворачивания белков. Задачами исследования были: 1) разработка метода анализа совокупности путей сворачивания-разворачивания белка с известной трехмерной структурой; 2) расчет скорости сворачивания и разворачивания белка и локализации ядра его сворачивания; 3) разработка быстрых, не требующих анализа сети путей сворачивания-разворачивания, методов оценки скорости самоорганизации белка по его известной третичной (пространственной), вторичной (локальной) или первичной структуре (т.е. по аминокислотной последовательности белка).

Научная новизна работы. Впервые разработан метод анализа сети путей сворачивания-разворачивания белков с известной ос-

нованный на решении системы кинетических уравнений, написанных для всех «полусвернутых» структур, возникающих в процессе сворачивания белка. Предложенный метод был успешно применен для расчета скоростей сворачивания и разворачивания всех более чем 80 белков с экспериментально исследованной на сегодняшний день кинетикой сворачивания. Этот метод также позволяет более или менее удовлетворительно предсказывать локализацию ядер сворачивания белков. Также впервые предложен метод, позволяющий успешно предсказывать скорости сворачивания белков на основании одной лишь аминокислотной последовательности белка. Во всех разработанных в работе методах предсказанные скорости сворачивания коррелируют с экспериментально измеренными на уровне 0.8.

Практическая значимость работы. Понимание закономерностей процесса самоорганизации белка совершенно необходимо как при предсказании трехмерной структуры белка по его аминокислотной последовательности — этой давней, чрезвычайно важной и все еще не решенной проблемы современной биофизики, так и при конструировании de novo белков с заданными свойствами. Кроме того, из накопленных на сегодняшний день знаний следует, что медленно сворачивающиеся белки для правильного сворачивания в клетке нуждаются в помощи шаперонов, в отсутствии которых резко увеличивается вероятность агрегации или расщепления таких белков. Таким образом, выявление разработанными нами методами медленно сворачивающихся белков может оказаться полезным для установления возможности управления процессом их сворачивания и в клетке, и вне нее. Результаты нашей работы найдут свое применение в белковой инженерии, биотехнологии, а, в перспективе, и в фундаментальной медицине.

Апробация работы. Материалы работы представлены на следующих Российских и международных школах и конференциях: ежегодные научные конференции Института белка РАН (Пущино, Московская область, 1999, 2001, 2002, 2003, 2004, 2005), Pacific Symposium on Biocomputing (Hawaii, USA, 2000), школа-конференция «Горизонты физико-химической биологии» (Пущино, Москов-

екая область, 2000), Annual Meeting of International Research Scholars of the Howard Hughes Medical Institute (Washington DC, USA, 2000; Vancouver, Canada, 2001; Palm Cove, Australia, 2002; Tallinn, Estonia, 2004; Merida, Mexico, 2005), Fourth European Symposium of The Protein Society (Paris, France, 2001), «Protein Structure, Dynamics, Genomics and Function» (Erice, Italy, 2001), «Critical Assessment of Techniques for Protein Structure Prediction» (Pacific Grove, USA, 2002; Ga-eta, Italy, 2004), Les Houches summer school «Slow relaxations and nonequilibrium dynamics in condensed matter» (Les Houches, France, 2002), EMBO lecture course on Protein Folding and Misfolding (Rome, Italy, 2003), CSB summer school «Understanding protein stability» (Stockholm, Sweden, 2004), III Съезд Биофизиков России (Воронеж, 2004), First European school in Bioinformatics (Verona, Italy, 2004), Московский семинар по биоинформатике (Москва, 2004), отчетные конференции по программе РАН «Молекулярная и клеточная биология» (Москва, 2004, 2005), семинар Institut des Hautes Etudes Scientifiques (Paris, France, 2005), Moscow conference on computational molecular biology (Moscow, 2005), «Exploring Protein Structure» (Haifa, Israel, 2005), Spetsai summer school «Protein Folding, Misfolding and Age-Related Diseases» (Spetses, Greece, 2005).

Публикации. Основные результаты диссертации представлены в 18 печатных работах, в том числе в 8 статьях в реферируемых научных изданиях.

Структура диссертации. Диссертация изложена на 105 страницах машинописного текста и состоит из введения, трех глав (обзор литературы, описание метода анализа сети путей сворачивания-разворачивания белка, обсуждение результатов), заключения, благодарностей, выводов, и списка цитируемой литературы, включающего 157 ссылок. Кроме того, работа содержит два приложения: в первом рассматривается задача из области электродинамики, математически эквивалентная задаче, рассмотренной в нашей работе; второе состоит из 6 таблиц, содержащих использованные в работе экспериментальные данные по кинетике сворачивания-разворачивания исследованных белков, а также результаты проделанных нами для них расчетов. Работу иллюстрируют 20 рисунков.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ.

Модель последовательного разворачивания белка. Сначала мы проводим моделирование сворачивания-разворачивания белка, используя «модель последовательного сворачивания», разработанную ранее в нашей лаборатории. Эта модель, суть которой изложена ниже, построена в соответствии с механизмом нуклеации, открытым при исследовании белков, у которых нет стабильных интермедиатов сворачивания во всем диапазоне концентраций денатуранта.

к м

г

а.

ф

х «

к

га

X

ю о аз о

о"

Р, координата реакции

Рис.1. Схема зависимости свободной энергии в от координаты реакции по ходу сворачивания белка, и — денатурированное (развернутое) состояние, N — нативное (свернутое) состояние, 75 — переходное состояние.

Согласно механизму нуклеации, для попадания белка в переходное состояние (га) — на вершину барьера свободной энергии (Рис.1) — белку нужно сформировать специфический для

max min

Площадь гидрофобной поверхности, доступной растворителю

данного белка набор нативных контактов (т.н. «ядро сворачивания»). Как только они завязаны, белок может быстро свернуться в нативную структуру. Измеряемые в эксперименте скорости сворачивания и разворачивания как функции концентрации денатуранта принято изображать в виде так называемого «шевронного» графика (Рис.2). Ядро сворачивания белка формируют остатки, мутация которых влияет на скорость сворачивания в той же степени, что и на константу равновесия (Рис.За). Вовлеченность в ядро сворачивания выражается величиной

Sla kj 5\пК

0)

где К = ~ — константа равновесия, kf и ки — скорости сворачивания и разво-

рачивания, соответственно, а 8 означает вызванный мутацией сдвиг соответ-

ствующего значения (Рис.3). Доказательством нуклеационного механизма сворачивания белка является то, что значения ф < 0 и ф > 1, не имеющие структурной интерпретации в рамках модели нативоподобного ядра сворачивания, встречаются очень редко и всегда относятся к остаткам с недостаточно точно измеренными значениями 5\пК.

Кяв, = 1п(/с,+/д

Рис.2. Шевронный график — график зависимости логарифма наблюдаемой скорости релаксации соотношения нативной и развернутой форм белка Оп/^). Величины 1п к^, полученные в опытах по сворачиванию белка, отмечены темными кружками, а полученные в опытах по разворачиванию — светлыми. Для белка с одностадийной кинетикой сворачивания, \пк№Л=\п{к1 +ки), где к1 и к„ — скорости сворачивания и разворачивания. Сплошной линией изображена наилучшая аппроксимирующая кривая, пунктиром — экстраполяции к, и кп за пределы области сворачивания и разворачивания, соответственно.

Согласно «модели последовательного сворачивания», разворачивание свернутой структуры представляет собой процесс, каждый шаг которого состоит в «отплавлении» одного звена цепи (состоящего из одного или нескольких идущих подряд по цепи остатков) от нативной пространственной структуры (Рис.4а). Отплавленные звенья образуют неупорядоченный клубок. Они теряют

все невалентные взаимодействия, но приобретают энтропию клубка (за выче-

7

том энтропии замыкания развернутых петель, торчащих из нативоподобной глобулярной части). Самое главное упрощение состоит в том, что мы сосредотачиваем наше внимание на переходных состояниях, т.е. на стабильности (точнее, нестабильности) частично развернутых структур, а не на подробном описании движений цепи. Процесс отплавления происходит до тех пор, пока не будет получена полностью развернутая структура. Так получается один путь разворачивания. (Рис.4а). Путь сворачивания — в этих же условиях — будет таким же, только пройденным в обратную сторону (согласно принципу детального равновесия). В результате рассмотрения всевозможных путей разворачивания, получается полная сеть путей сворачивания-разворачивания (Рис.4б).

Рис.3. Экспериментальное получение значений ф: (а) Мутация остатка, входящего в ядро сворачивания, изменяет скорость сворачивания мутантною белка (по отношению к белку без мутации, т.е. белку «дикого типа»), не меняя скорости его разворачивания, (б) Мутация остатка, не входящего в ядро сворачивания, наоборот, скорости сворачивания не меняет.

Свободная энергия «полусвернутой» структуры. Оценка свободной энергии каждой из полусвернутых структур, изображенных на Рис.4б, была предложена ранее в нашей лаборатории. Цепь белка, состоящего из I остатков, разбивается на N звеньев (по «I/ N остатков в каждом), чтобы смочь рассмотреть все 2" интермедиатов сворачивания-разворачивания. Поэтому величина N в наших расчетах составляет около 20.

а) те б)

и

о;

и.

а. ф

I

о к со X

ю о

8 О

ъ

гг с

и

О 10 1

р, координата реакции Р, координата реакции

Рис.4. Модель последовательного сворачивания-разворачивания согласно нук-леационному механизму, и — полностью развернутая цепь; 7$ — переходное состояние, лежащее на вершине барьера свободной энергии (точнее, в седловой точке ландшафта свободных энергий); N — нативное состояние. Свободная энергия рассчитывается согласно формуле (2). Рисунок соответствует точке, где свободные энергии нативного и развернутого состояний одинаковы. (а) Один гипотетический путь разворачивания, (б) Множество гипотетических путей сворачивания-разворачивания, образующих сеть пересекающихся путей, подобных тому, что изображен в левой части рисунка (этот путь выделен жирным).

Свободная энергия структуры , в которой только какие-то п из N звеньев цепи фиксированы, а Ы-п звеньев — еще (или уже) нет, представляется в виде:

в(1.) = Е1*.)-Щ*,), (2)

где £(*„) — энергия, — энтропия структуры Т — абсолютная температура.

Энергия структуры рассматривается как величина, пропорциональная числу ван-дер-ваальсовых контактов между фиксированными в этой структуре $„ неводородными атомами: Е(5„) = ву^п) (считается, что все контакты обладают одинаковой энергии). Атомы контактируют, если расстояние между ними не превышает определенного порогового значения (нами использовалось значение 5А, если не оговорено отдельно). Сумма берется по всем парам остатков в структуре , кроме соседей по цепи (между ними контакты есть и в клубке).

Мы считаем, что энтропия структуры зависит от числа т„ фиксированных в структуре л„ остатков цепи и от суммарной энтропии замыкания выходящих

9

из этой структуры петель: £(.?„) = сг ■ (I - т„) + » где а = 2.3Я — констан-

та, равная известной из опыта средней потере энтропии остатка при переходе из клубка в глобулу, Я1опр — энтропия замыкания петли, выходящей из глобулярной части и затем входящей в нее. В соответствии с теорией Флори, 81оср для

такой петли берется в виде: Я, = —где гаВ — расстоя-

2 2 2аАух - р\

ние между Са атомами остатков а и р, а = 3.8 А — расстояние между соседними по цепи Са атомами, Я — газовая постоянная, и А = 20 А — известная из опыта характерная персистентная длина для полипептидной цепи.

Все приводимые в этой работе расчеты свободной энергии относятся к окрестности точки термодинамического равновесия между нативной структурой и клубком. Так как нативная структура белка отделена от развернутой фазовым переходом типа «все или ничего», то в этой точке — а значит, и в ее окрестности — нет метастабильных интермедиатов сворачивания-разворачивания, которые затруднили бы анализ процесса. Это справедливо для всех однодоменных глобулярных белков, независимо от того, наблюдается или нет интермедиат сворачивания в чистой воде (вдали от точки термодинамического равновесия) или нет.

Рассмотрим сначала саму точку, где свободные энергии нативной структуры зн и развернутого (клубкового) состояния я0 совпадают, то есть )=<?(«0)> или Таким образом, температура перехода Т и энер-

гия атом-атомного контакта е„ в точке перехода связаны соотношением ЕьЛ5и ) = -2.3ЯП (поскольку ет = 2.3Д ).

Величина е изменяется при изменении растворителя, поэтому, рассматривая величины е = (1 + л)с0, мы автоматически попадаем в условия, в которых разность свободной энергии нативной и развернутой структур составляет у) - ) = -2.3ЙП.А. Малым величинам Я (|л|«1) соответствуют малые отклонения от равновесия. Так как полная энергия денатурации белка, равная 2.3Л7Х, составляет 100-150 ккал/моль для белка из -100 остатков, а

в условиях эксперимента составляв! около 5-10 ккал/'моль, то исследуемые отклонения от равновесия действительно малы, а интересующий диапазон Л простирается от-0.05 до +0.05.

Скорость элементарного шага. Пусть индекс клубкового (начального) состояния будет равен нулю, индекс конечного (нативного) — М +1, а / = 1Д? — индексы промежуточных микросостояний. Определим константу скорости кч элементарного перехода из состояния ; в состояние / согласно критерию Мет-рополиса:

*„ тш(1,ехр(ДС, -Д6',)), (;./ = 0,М + 1), (3)

где к0 =10® с"1 — некая константа (она имеет смысл скорости элементарного перехода из одной конформации в другую одного остатка при понижении свободной энергии, и равна экспериментально измеренной скорости включения одного остатка в растущую альфа-спираль); I — число остатков в белке; N — число звеньев, на которое мы делим белок; Д<5, =О,-О0 и АС, = о, -в« — свободные энергии г-го и ] -го состояний, отсчитанные от свободной энергии развернутого («0-го») состояния, выраженные в единицах ЕТ.

Множитель — отражает влияние размера звена на скорость его перехода из

одной конформации в другую. Мы считаем, что при преодолении элементарного барьера при элементарном переходе остатки меняют свою конформацию последовательно, один за другим. Следовательно, для звена из — остатков ожидала

емая скорость элементарного шага должна быть в — раз меньше, чем для одно-

N

го остатка.

Алгоритм расчета скорости сворачивания и разворачивания белка.

Населенности микросостояний, л,, будут изменяться со временем в соответствии с обычными кинетическими уравнениями:

А/+1 _

+ (4)

1-0

(мы полагаем, что п) =1, а также что, если между состояниями / и у элементарно

ного перехода нет, то к^ =0). Поскольку мы считаем, что в окрестности точки термодинамического равновесия имеются в наблюдаемом количестве только два состояния — нативное и развернутое, то для всех остальных микросостояний мы можем использовать квазистационарное приближение: = 0, (/ = 1 ,'М). С его учетом система (4) в векторном виде будет выглядеть как:

= -Ап + Вл0 + Спм+| = 0 ^ = "4 +В'п , (5)

где п — вектор с компонентами п,, А — матрица с элементами '/» 1 3 з — вектор с компонентами 5, = В" — вектор с компонентами В' = кл, С — вектор с компонентами С, =ки.и, С* — вектор с компо-

__и* 1 М* 1

нентами С'=к1М(здесь везде ¿,у = 1,А/), 6 = с = Отсюда

п(0 = А~'Вл0(0 + АчСим+1(0, ^- = -^1-=-(&-в'А-,В)я0+В,А-'С«м„. То есть

ш си

скорости сворачивания и разворачивания будут равны, соответственно,

кг=Ь- В'А-'В, (6)

£„ = В'А 'С. (7)

Вектор п(/) = А"'В найдется решением уравнения А~'п(Л = В, а вектор п"0 = А~'С — уравнения А-'п"" = С. Вектор п(Л описывает населенность промежуточных микросостояний в том случае, если населенность состояния о поддерживается равной единице, а населенность состояния М +1 — равной нулю. Вектор п'*' описывает населенность промежуточных микросостояний в противном случае, т.е. если населенность состояния 0 поддерживается равной нулю, а населенность состояния М +1 — равной единице. Оба уравнения мы решаем численно, с помощью компьютера, методом итераций Зейделя.

Алгоритм расчета ядра сворачивания белка. Пусть вовлеченность в ядро сворачивания, как и в эксперименте, определяется величиной ф (для удобства мы считаем, что все свободные энергии выражены в единицах ЯТ):

ЗЫк,

то есть ф = -

<51п к{

поскольку в стационарном режиме рассмат-

риваемого процесса 1 п(к/! к и) = . Заметим, что задача нахождения скоро-

сти сворачивания белка и вовлеченности аминокислотных остатков в ядро сворачивания аналогична поиску тока, текущего по сети сопротивлений, а также изменению этого тока вследствие изменения некоторых сопротивлений (эта задача подробно рассмотрена в приложении к диссертации). В результате, вели-

М+1

чину ф для остатка а можно найти через параметры сети как фа = ^Ф,\а * Р,,

1-е

где ф^а — доля нативных контактов, сформированных остатком а в состоянии IV., 1 + 5!еи(ЛО -ДО,)

г, а Р, = —----—, где = (£/, - и 1) — аналог тепловой МОЩНОГО № 2

М+Ш + 1

сти, выделяемой на сопротивлении у, Ш = — аналог тепловой мощно-

го )>1

сти, выделяемой во всей сети сопротивлений, = кцп)п - к^р — поток молекул на переходе у (аналог тока, текущего по сопротивлению у), и, =«,(Лехр(дО;) — аналог потенциала узла г.

н |10

х а

о с о

о О

с

-10

. г

V *

• А ••

-20

-10

теория

10

Рис.5. Сравнение предсказанных с помощью развитой нами теорией (горизонтальная ось) и экспериментально измеренных (вертикальная ось) скоростей сворачивания белка в точке равновесия (пи, где ДОм+1 =0). Все скорости измеряются в с"1. Корреляция составляет 0.79.

Предсказание скорости сворачивания белка в точке термодинамического равновесия между свернутой и денатурированной структу-

рами. В соответствии с уравнением (6) мы рассчитывали скорости сворачивания белков с экспериментально исследованной кинетикой сворачивания в точке термодинамического равновесия. Результаты вычислений представлены на Рис.5. Коэффициент корреляции между предсказанными и экспериментально исследованными скоростями сворачивания составляет 0.79. Видно, однако, что для части белков с низкой скоростью сворачивания предсказываемое значение скорости существенно ниже экспериментально измеренной. Мы считаем, что это происходит из-за того, что используемая нами модель не вполне корректна для медленно сворачивающихся белков, длина цепи I у которых обычно столь велика, что длина их звеньев, включающих ~ 1/20 аминокислотных остатков, превосходит диаметр белковой глобулы, так что эти звенья уже нельзя рассматривать как бесструктурные «бусинки».

Рис.6. Шевронный график для белка в, полученный в результате теоретического моделирования сворачивания-разворачивания белка вблизи точки термодинамического равновесия. Эксперимент — серая сплошная линия, теория — черная сплошная линия, пунктиры - их экстраполяции. Пустыми кружками обозначены результаты измерений; черными треуголь-5 никами — результаты расчетов.

12 3 4

Концентрация денатуранта, М

Предсказание скорости сворачивания и разворачивания белка при нулевой концентрации денатуранта. Обычно исследователей интересует скорость сворачивания при «биологических» условиях, то есть при отсутствии денатуранта, а не в точке равновесия. Нас тоже интересует возможность предсказания скоростей сворачивания в окрестности точки равновесия. С этой целью мы провели моделирование сворачивания и разворачивания белков при разных значениях стабильности свернутого состояния относительно денатурированно-

14

го. Результаты моделирования для одного из белков (белка в) приведены вместе с экспериментальными данными на шевронном трафике (Рис.6). Для их совместного изображения мы совместили абсциссу (концентрацию денатуранта) точки термодинамического равновесия в теоретическом графике с ее экспериментальным значением, и наложили условие равенства, при любой концентрации денатуранта, константы равновесия нативной структуры и развернутого состояния белка для теоретической кривой и для экспериментальной. а) Сворачивание б)^ Разворачивание

а>

* £

¡ю I

о. 0) с

■ . . .<* ' £ 10 * * о.

I . • 8 о «

* -¡С , . »

£ =10 . * ' .

10

-20

-20 -30

-20 -10 П Ю -30 -20 -10 0 10 20

1пк™ теория 1п/Сц, теория

Рис.7. Сравнение предсказанных с помощью развитой нами теорией (горизонтальная ось) и экспериментально измеренных (вертикальная ось) скоростей сворачивания белка в воде (о) и экстраполированных скоростей разворачивания белка в воде (б). Корреляция в первом случае составляет 0.73, а во втором — 0.88.

Теперь мы можем посмотреть, как соотносятся рассчитанные скорости сворачивания и разворачивания в воде с экспериментом. Результаты сравнения приведены на Рис.7. Коэффициент корреляции между теоретически предсказанными и экспериментально измеренными (точнее — экстраполированными к нулевой концентрации денатуранта) скоростями составляет 0.73 при предсказании скоростей сворачивания, и 0.88 — скоростей разворачивания. Заметим, что при предсказании скоростей сворачивания и разворачивания в воде (как и скоростей сворачивания в точке перехода) для белков с низкой скоростью сворачивания предсказываемые значения скоростей часто заметно ниже экспериментально измеренных. Кроме того, видно, что коэффициент корреляции возраста-

15

ет при переходе от скоростей сворачивания в воде (0.73) к скоростям сворачивания (равным скоростям разворачивания) в точке термодинамического равновесия (0.79) и затем к скоростям разворачивания в воде (0.88). Заметим, что скорости сворачивания в воде определяются измерениями в области низких значений концентраций денатуранта, в точке термодинамического равновесия — всей совокупностью измерений, а скорости разворачивания в воде (где развернутое состояние белка нестабильно) — экстраполяцией измерений, сделанных в области высоких концентраций денатуранта. Получается, что, чем выше концентрация денатуранта, использованная в эксперименте, тем выше согласие теории и эксперимента (ср. Рис.5 и Рис.7).

Предсказание вовлеченности аминокислотных остатков белка в ядро сворачивания в точке термодинамического равновесия. Для проведения расчетов вовлеченности аминокислотных остатков в ядро сворачивания мы взяли 17 белков с экспериментально исследованными ядрами сворачивания. Мы сравнили предсказанные нами величины ф с экспериментально полученными. Результат вычислений представлен на Рис.8.

ным — атомы водорода учитывались (при этом, как и в работе [ОагЬигупэклу е! а1., 2004], сделанной по тем же структурам методами Монте Карло и динамического программирования, контактный радиус атома водорода принимался равным 2А, остальных атомов — ЗА). Коэффициент корреляции теории и эксперимента в среднем по всем 17 белкам составляет 0.37 без учета атомов водорода и 0.51 —с учетом.

-08

Рис.8. Коэффициент корреляции при предсказании ^-значений 17 белков с экспериментально исследованным ядром сворачивания. Серым цветом показаны результаты в случае, когда при вычислении не учитывались атомы водорода, чер-

Хочу отметить, что все наши попытки (как и попытки других исследователей) разработать феноменологический, то есть не требующий анализа сети путей сворачивания-разворачивания белка, метод предсказания ядра его сворачивания успеха не имели: коэффициент корреляции всех таких методов с опытом не превышал 0.2.

Феноменологическое предсказание скорости сворачивания белка по его третичной структуре. В этой части работы мы разработали феноменологический, не требующий анализа сети путей сворачивания-разворачивания метод предсказания скоростей сворачивания белков в воде по их известной трехмерной структуре. За основу мы взяли аналитическую теорию Финкельштейна-Бадретдинова, построенную на основе нуклеационного механизма, и существующий эмпирический метод, разработанный в группе Вакег'а.

Начнем с последнего. Его идея заключается в том, что скорость сворачивания в воде белков, сворачивающихся (и разворачивающихся) без интермедиа-тов во всем диапазоне концентраций денатуранта («одностадийные» белки), определяется параметром ПК («порядок контактов»):

ПК=—!—УМ„, (8)

где N - число нековалентных контактов (в пределах 6А) между неводородными атомами в белке, I - число аминокислотных остатков в цепи белка, и Д19 — это число остатков, разделяющих взаимодействующую пару атомов (предполагается, что атомы соседних по цепи остатков разделены одним остатком, и т.д.). Этот параметр принимает маленькое значение для белков, чья нативная структура стабилизирована преимущественно локальными контактами (то есть, для альфа-спиральных белков) и большое значение для белков, в чьей нативной структуре много дальних по цепи контактов (в первую очередь, для бета-структурных белков). «Порядок контактов» был специально придуман для сравнения топологии (а не размера) различных белков и зависит от содержания вторичной структуры в белке и от взаимного расположения альфа-спиралей и бета-структурных элементов в нативной структуре белка. Коэффициент корреляции между ПК и

скоростями сворачивания одностадийных белков, экспериментально исследованных к 1998 году, составил -0.85.

Предпосылкой для нашей работы стало то, что ПК слабо (и к тому же с обратным знаком!) коррелировал со скоростями сворачивания остальных («многостадийных», образующих метастабильные интермедиаты сворачивания) белков — коэффициент корреляции составлял 0.34 для совокупности экспериментально исследованных на 2003 год многостадийных белков (это было установлено нами совместно с О.В. Галзитской и С.А. Гарбузинским). Поэтому мы выдвинули предположение о том, что успех ПК в предсказании скоростей сворачивания одностадийных белков определяется тем, что экспериментально исследованные к 1998 году одностадийные белки были примерно одной длины цепи, поэтому на первое место в определении скоростей сворачивания вышел топологический параметр ПК . Это предположение согласуется с тем фактом, что скорости сворачивания многостадийных белков коррелируют с длиной цепи и никак не коррелируют с ПК (это было также установлено нами совместно с О.В. Галзитской и С.А. Гарбузинским). Кроме того, наше предположение подтверждается тем, что коэффициент корреляции между ПК и скоростями сворачивания одностадийных белков, изученных на сегодня, составляет всего -0.52. В соответствии с гипотезой, мы исследовали следующую зависимость для всей совокупности белков и пептидов:

In*;—ПК*1/ (9)

К этой же формуле мы пришли, критически рассматривая теорию Финкель-штейна-Бадретдинова, согласно которой скорость сворачивания белка в точке термодинамического равновесия определяется формулой In*"' — -(1 ±0 5)Х2/3. Здесь независимый от длины цепи коэффициент, стоящий в скобках, зависит от топологии переходного состояния — он близок к 0.5, если белок стабилизируется преимущественно локальными взаимодействиями, и к 1.5, если белок имеет много дальних по цепи контактов, так что много замкнутых петель торчит из любого ядра сворачивания. Хотя Финкелынтейн и Бадретдинов не дали алгоритма вычисления этого коэффициента из белковой структуры, ясно, что по физическому смыслу этот коэффициент схож с ПК : они оба малы для белков с

18

локальными контактами (в первую очередь, альфа-спиральных), и оба велики для белков с преимущественно дальними по цепи контактами, когда белок по ходу сворачивания не может избежать формирования замкнутых петель, торчащих из уже свернутой части глобулы. Таким образом, мы опять приходим к формуле (9).

На Рис.9 изображен случай наилучшего согласия формулы (9) с экспериментально измеренными скоростями сворачивания (при Р = 0.9). Во время исследования оказалось, что ПК пропорционален для совокупности всех белков и пептидов. Это значит, что параметр имеющий на данный момент

максимальную корреляцию с экспериментом для всех белков и пептидов в совокупности, зависит от длины цепи белка как ¿оь®. Это более чем хорошо совпадает с показателем степени в формуле Финкельштейна и Бадретдинова, а также с оценкой ", вытекающей из работы Ко£а & Такаёа (2001) сворачивания упрощенных моделей белковых цепей на решетке.

Рис.9. Сравнение скорости сворачивания в воде, 1пк" (к" измеряется в с"') и ПКх£0' для различных белков и пептидов. Пустые кружки: белки с одностадийной кинетикой сворачивания при всех внешних условиях. Черные кружки: белки, сворачивающиеся с ин-термедиатами при низкой концентрации денатуран-та. Плюсики — короткие пептиды. Пунктирная линия представляет собой линейную экстраполяцию только для одностадийных белков (корреляция составляет -0 77); точечная линия представляет собой линейную экстраполяцию только для многостадийных белков (корреляция составляет -0.68); сплошная линия представляет собой линейную экстраполяцию для всех белков и пептидов (корреляция составляет -0.77).

Предсказание скорости сворачивания белка по его аминокислотной последовательности. Согласно вышесказанному, логарифм скорости сворачивания падает пропорционально некой степени длины белковой цепи. При этом

19

20

ПК*Ь

длину цепи обычно определяют просто как число аминокислотных остатков в ней. Однако если сворачивающаяся цепь заранее содержит сформированные блоки (или эти блоки цепи могут свернуться быстро и независимо от других частей белковой цепи), эффективная длина цепи должна быть меньше, чем полная длина цепи.

Рис.10. Предсказание скорости сворачивания в воде, In(к* измеряется в с'1), с помощью эффективной длины цепи для всей совокупности белков и пептидов с экспериментально измеренными скоростями сворачивания (по оси абсцисс отложен натуральный логарифм эффективной длины). Пустые 7 кружки: белки с одностадийной кинетикой сворачивания при всех внешних условиях. Черные кружки: белки, сворачивающиеся с интермедиатами при низкой концентрации денатуранта. Плюсики — короткие пептиды. Сплошная линия представляет собой линейную экстраполяцию для всех белков (корреляция составляет -0.79). Эффективная длина цепи, ЛЭФ,„, вычислена по вторичной структуре, предсказанной по аминокислотной последовательности с помощью программы PsiPred.

Поскольку альфа-спирали — самый естественный кандидат на роль внутренне стабильного и/или быстро и независимо сворачивающегося блока, эффективная длина сворачивающейся цепи может быть взята в виде L3lN, = L-LH + l,*NH, где LH — число остатков в спиральной конформации, N„ — число спиралей, а /, означает, что мы рассматриваем целый блок (т.е., спираль) как /, остатков (с физической точки зрения I, не должно превышать длину одного спирального витка (4 остатка); это значение должно быть оптимизировано из сравнения теории с экспериментом). Зависимость, которую мы исследовали, выглядит так: In к" - const - Ь'МФ, где значение степени Р должно быть подобрано из сравнения с экспериментом (надо заметить, что случай Р = 0 соот-

25

ЭФФ

ветствует корреляции In к* с In 1. „,,„,, поскольку comt-L'' - ют/-txp(PxlnL) = (const +1)- PxlnZ. ~ const' - In L при ?->0). Кроме того, важно, что вторичная структура, необходимая для предсказания скорости сворачивания, может быть успешно предсказана по аминокислотной последовательности белка (для этого мы использовали программу PsiPred), т.е ее знание не требует знания трехмерной структуры белка, необходимой для всех описанных выше методов. Результаты сравнения параметра In ЬЭФФ и экспериментально измеренных скоростей сворачивания представлены на Рис.10.

Примерно такие же результаты получаются, если предсказывать вторичную структуру с помощью программы ALB (в этом случае коэффициент корреляции составляет -0.76) или брать действительную вторичную структуру белка, вычисленную из третичной согласно программе DSSP (в этом случае коэффициент корреляции также составляет -0.79). Таким образом, предсказание скорости сворачивания белков по аминокислотной последовательности (с помощью программы предсказания вторичной структуры PsiPred) по крайней мере не хуже, чем предсказание скоростей сворачивания по известной трехмерной структуре.

Из наших результатов следует, что альфа-спирали уменьшают эффективную длину белковой цепи. Мы считаем, что это происходит из-за того, что спирали быстро и независимо сворачиваются по ходу сворачивания (хотя не исключена возможность того, что некоторые альфа-спирали уже сформированы в развернутом состоянии цепи, что, конечно же, может быть правдой для «биологических» условий).

ВЫВОДЫ

1. Разработан метод расчета скоростей сворачивания и разворачивания однодо-менных глобулярных белков с известной трехмерной структурой с помощью моделирования процесса их сворачивания-разворачивания вблизи точки термодинамического равновесия между нативным и развернутым состоянием белковой цепи.

2. Предложенный метод позволяет успешно предсказывать скорости сворачивания и разворачивания белков вблизи точки термодинамического равнове-

21

сия, а для белков, стабильность нативной структуры которых в воде известна, — также и скорости их сворачивания и разворачивания в воде.

3. Разработанный метод позволяет также удовлетворительно предсказывать вовлеченность аминокислотного остатка в ядро сворачивания белка. В среднем корреляция с экспериментом составляет 0.51.

4. Предложен метод оценки скоростей сворачивания о дно доме иных глобулярных белков по известной трехмерной структуре без моделирования процессов их сворачивания-разворачивания, — а именно, по среднему расстоянию по цепи между атомами, контактирующими в нативной структуре белка.

5. Показано, что скорость сворачивания белка в первом приближении определяется длиной цепи белка, а во втором — вторичной структурой белка, которую можно либо взять из известной трехмерной структуры, либо предсказать по аминокислотной последовательности белка.

6. Предложен феноменологический метод оценки скорости сворачивания по числу неспиральных остатков в белке; этот метод не требует знания пространственной структуры белка, так как число неспиральных остатков в нем может быть предсказано по первичной струкгуре белка.

СПИСОК ПУБЛИКАЦИЙ ПО ТЕМЕ ДИССЕРТАЦИИ

1. Галзитская О.В., Иванков Д.Н., Финкелыптейн A.B. (2001). Нуклеация и скорость сворачивания в белках. Мол. Биология. 35,708-717.

2. Финкелыптейн A.B., Иванков Д.Н., Галзитская О.В. (2005). Предсказание скоростей и ядер сворачивания глобулярных белков на основе теории их самоорганизации. Успехи биологической химии, 45, 3-36.

3. Galzitskaya O.V., Skoogarev A.V., Ivankov D.N., Finkelstein A.V. (1999) Folding nuclei in 3D protein structures. Proceedings of the Pacific Symposium on Biocomputing'2000 (Altman R.B., Dunker A.K., Hunter L., Lauderdale, K., Klein Т.Е., eds.). World Scientific, Singapore - New Jersey - London - Hong Kong, pp. 131-142.

4. Galzitskaya O.V., Ivankov D.N., Finkelstein A.V. (2001). Folding nuclei in proteins. FEBSLetters. 489: 113-118.

5. Ivankov D.N., Finkelstein A.V. (2001). Theoretical Study of a Landscape of Protein Folding-Unfolding Pathways. Folding Rates at Mid-Transition. Biochemistry. 40, 9957-9961.

6. Galzitskaya O.V., Garbuzynskiy, S.O., Ivankov D.N., Finkelstein A.V. (2003). Chain length is the main determinant of the folding rate for proteins with three-state folding kinetics. Proteins. 51,162-166.

7. Ivankov D.N., Garbuzynskiy S.O., Aim E., Plaxco K.W., Baker D., Finkelstein A.V. (2003). Contact order revisited: influence of protein size on the folding rate. Protein Science, 12,2057-2062.

8. Ivankov D.N., Finkelstein A.V. (2004). Prediction of protein folding rates from the amino acid sequence-predicted secondary structure. Proc. Natl. Acad. Sci. USA. 101, 8942-8944.

9. Д.Н. Иванков, O.B. Галзитская, A.B. Скугарев, A.B. Финкельштейн. (2000). Теоретический поиск ядер сворачивания в белках с известной трехмерной структурой. Школа-конференция «Горизонты физико-химической биологии», Пущино. стр. 29.

Ю.Иванков Д.Н., Финкельштейн А.В. Предсказание скорости сворачивания белков по аминокислотной последовательности. (2004). III Съезд биофизиков России, Воронеж, т. I, стр. 43.

11.А.V. Finkelstein, O.V. Galzitskaya, D.N. Ivankov. (2001). Protein folding nucleus and protein folding rate: a theoretical study. Fourth European Symposium of The Protein Society. Institut Pasteur, Paris, France, 2001. Protein Sci. 10 (Suppl.l), 47.

12.Galzitskaya O.V., Ivankov D.N., Finkelstein A.V. (2001). The State of Art in Steps of Protein Folding. Summer School "The prediction and mechanism of protein folding: from topology to intermediate states". (Chomilier, J., Labesse, G, and Sadoc, J.-F., eds.) Institute d'etudes scientifiques de Cargese, pp. 8-19.

13.Finkelstein A.V., Galzitskaya O.V., Ivankov D.N., Bogatyreva N.S.. Garbuzinskii S.O., Lobanov M.Yu., Dolgikh D.A., Oliveberg M. (2002). Protein folding: Theoretical and experimental study. Proceedings of the Fifth Meeting on

the Critical Assessment of Techniques for Protein Structure Prediction, Asilomar Conference Center, Pacific Grove, California, p. A202.

14.Lobanov M.Yu., Litvinov I., Bogatyreva N.S., Galzitskaya O.V., Kondratova M.S., Garbuzinskii S.O., Ivankov D.N., Roytberg M.A., Finkelstein A.V. (2002). Threading using multiple homology and secondary structure prediction information. Proceedings of the Fifth Meeting on the Critical Assessment of Techniques for Protein Structure Prediction, Asilomar Conference Center, Pacific Grove, California, pp. A130-A131.

15.Krieger E., Ivankov D.N., Finkelstein A., Vriend G. (2002). WHAT IF YASARA folds a protein. Proceedings of the Fifth Meeting on the Critical Assessment of Techniques for Protein Structure Prediction, Asilomar Conference Center, Pacific Grove, California, pp. A169-A170.

16.M.Yu. Lobanov, D.N. Ivankov, S.O. Garbuzynskiy, N.S. Bogatyreva, O.V. Galzitskaya, I.I. Litvinov, M.A. Roytberg, A.V. Finkelstein. (2004). Threading the use of multiple homology and secondary structure prediction information. Proceedings of the Sixth Meeting on the Critical Assessment of Techniques for Protein Structure Prediction, Gaeta, Italy, 2004, p. 120-121.

17.S.O. Garbuzynskiy, M.Yu. Lobanov, D.N. Ivankov, N.S. Bogatyreva, A.V. Finkelstein, O.V. Galzitskaya. (2004). Prediction of domain boundaries and disordered regions in proteins with unknown tertiary structure. Proceedings of the Sixth Meeting on the Critical Assessment of Techniques for Protein Structure Prediction, Gaeta, Italy, 2004, p. 109-110.

18.A.V. Finkelstein, D.N. Ivankov, S.O. Garbuzynskiy, O.V. Galzitskaya. (2005) Prediction of protein folding rates. Proceedings of the international Moscow conference on computational molecular biology, Moscow, Russia, 2005, pp. 101-103.

к исполнению 16/02/2006 Исполнено 16/02/2006

Заказ № 84 Тираж: 100 экз.

ООО «11-й ФОРМАТ» ИНН 7726330900 Москва, Варшавское щ., 36 (495) 975-78-56 (495) 747-64-70 www.autoreferat.ru

Yo ff

40 t®

Содержание диссертации, кандидата физико-математических наук, Иванков, Дмитрий Николаевич

снисок СОКРАЩЕН™

ГЛАВА 1. ОБЗОР ЛИТЕРАТУРЫ

1.1. Экспериментальные исследования кинетики самоорганизации белков

1.1.1. Процедура экспериментального исследования кинетики итермодинамики сворачивания белков

1.1.2. Открытие механизма нуклеации

1.2. Аналитические теории и теоретические работы по изучениюсворачивания белков

1.3. Эмпирические методы предсказания скоростей сворачивания белков

ГЛАВА 2. ТЕОРИЯ МОДЕЛИРОВАНИЯ РАЗВОРАЧИВАНИЯ БЕЛКА

2.1. Модель последовательного разворачивания белка

2.2. Свободная энергия «полусвернутой» белковой цепи

2.3. Скорость элементарного шага

2.3.1. Экспериментальная оценка скорости конформационной перестройкиаминокислотного остатка

2.4. Алгоритм расчета скорости сворачивания-разворачивания белка

2.5. Алгоритм расчета ядра сворачивания белка

ГЛАВА 3. РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ

3.1. Моделирование процесса сворачивания-разворачивания белка

3.1.1. Предсказание скорости сворачивания-разворачивания белка вокрестности точки термодинамического равновесия

3.1.2. Предсказание вовлеченности аминокислотных остатков белка в ядросворачивания в точке термодинамического равновесия

3.2. Эмпирические зависимости: что можно сказать о скорости сворачиваниябез моделирования процесса сворачивания белка?

3.2.1. Предсказание скорости сворачивания белка по его трехмернойструктуре

3.2.2. Предсказание скорости сворачивания белка по его аминокислотнойпоследовательности

Введение Диссертация по биологии, на тему "Теория скоростей сворачивания глобулярных белков"

СПИСОК СОКРАЩЕН!®. 7

ГЛАВА 1. ОБЗОР ЛИТЕРАТУРЫ. 8

1.1. Экспериментальные исследования кинетики самоорганизации белков. 8

1.1.1. Процедура экспериментального исследования кинетики и термодинамики сворачивания белков. 8

1.1.2. Открытие механизма нуклеации. 18

1.2. Аналитические теории и теоретические работы по изучению сворачивания белков. 22

1.3. Эмпирические методы предсказания скоростей сворачивания белков. 29 ГЛАВА 2. ТЕОРИЯ МОДЕЛИРОВАНИЯ РАЗВОРАЧИВАНИЯ БЕЛКА. 32

2.1. Модель последовательного разворачивания белка. 32

2.2. Свободная энергия «полусвернутой» белковой цепи. 33

2.3. Скорость элементарного шага. 35 2.3.1. Экспериментальная оценка скорости конформационной перестройки аминокислотного остатка. 36

2.4. Алгоритм расчета скорости сворачивания-разворачивания белка. 36

2.5. Алгоритм расчета ядра сворачивания белка. 40 ГЛАВА 3. РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ. 45

3.1. Моделирование процесса сворачивания-разворачивания белка. 45

3.1.1. Предсказание скорости сворачивания-разворачивания белка в окрестности точки термодинамического равновесия. 45

3.1.2. Предсказание вовлеченности аминокислотных остатков белка в ядро сворачивания в точке термодинамического равновесия. 51

3.2. Эмпирические зависимости: что можно сказать о скорости сворачивания без моделирования процесса сворачивания белка? 54 3.2.1. Предсказание скорости сворачивания белка по его трехмерной структуре. 57

3.2.2. Предсказание скорости сворачивания белка по его аминокислотной последовательности. 61

ЗАКЛЮЧЕНИЕ. 65

БЛАГОДАРНОСТИ. 67

ВЫВОДЫ. 68

СПИСОК ПУБЛИКАЦИЙ ПО ТЕМЕ ДИССЕРТАЦИИ. 69

СПИСОК ЛИТЕРАТУРЫ. 72

ПРИЛОЖЕНИЕ А. Расчет тока, текущего по сети сопротивлений. 88 ПРИЛОЖЕНИЕ Б. Таблицы с экспериментальными и теоретическими данными для исследованных в работе белков. 90

ВВЕДЕНИЕ

Рис.1. (а) Первичная структура (то есть аминокислотная последовательность) белка — N-концевого домена виллина. Каждая буква соответствует одной аминокислоте. (б) Трехмерная нативная структура того же белка; показан только ход главной цепи: боковые группы не изображены для упрощения рисунка, (в) Скелетная модель нативной структуры (боковые группы — тонкие линии, главная цепь — толстая), (г) Атомная модель нативной структуры.

Белки состоят из аминокислотных остатков 20 типов, соединенных друг с другом ковалентными связями в неразветвленную линейную структуру, в которой последовательность аминокислотных остатков (называемая

Белки (наряду с ДНК и РНК) являются важнейшими для жизни биополимерами. При участии белков происходит подавляющее большинство процессов в живой природе, которые без участия белков либо идут с ничтожной скоростью, либо не идут вообще. а) б) ^ ^

VELSKKVTGKLDKTTPGIQI WRIENMEMVPVPTKSYGNFY EGDCYVLLSTRKTGSGFSYN IHYWLGKNSSQDEQGAAAIY TTQMDEYLGSVAVQHREVQG HESETFRAYFKQGLIYKQGG VASGMK первичной структурой, Рис.la) для каждого белка строго определена [Sanger, Tuppy, 1951]. Белок функционален только в свернутом состоянии, в котором имеет уникальную пространственную структуру (эта биологически активная структура называется «нативной», Рис.1б), что впервые было показано Перутцем и Кендрью в 1950-х годах [Kendrew et al., 1958; Perutz et al., 1960]. Специфичность функции белка связана с тем, что в клетке, при биологических условиях (обычно: 25-37°С, нейтральный рН, отсутствие денатуранта), нативная структура намного стабильнее всех других структур, от которых отделена барьером свободной энергии, а разрушение структуры (вследствие изменения условий) происходит кооперативно по типу «все-или-ничего» [Privalov, 1979; Privalov, 1982].

В клетке обретение белком нативной структуры происходит сразу после биосинтеза полипептидной цепи на рибосоме. Изначально было непонятно, необходима ли рибосома для формирования пространственной структуры белка. Однако в 1961 году Анфинсен показал, что трехмерная структура бычьей рибонуклеазы определяется только ее первичной структурой — при медленном восстановлении физиологических условий развернутый белок in vitro опять приобретал свою нативную структуру [Anfinsen et al., 1961; Anfinsen, 1973]. Позже было показано, что химически синтезированный белок также способен сворачиваться в нативную структуру [Gutte, Merrifield, 1969; Merrifield, 1969], несмотря на то, что он ни разу в жизни не «видел» рибосомы. С тех пор способность к ренатурации была продемонстрирована для очень большого числа белков (см. обзор [Jackson, 1998]).

Со времен опытов Анфинсена проблема сворачивания белка стала физической (ее также называют проблемой самоорганизации белка) и до сих пор является одной из самых важных и актуальных проблем биофизики. В ходе экспериментальных и теоретических исследований самоорганизации белка возникло множество вопросов: «Как белок находит нативную структуру из астрономического числа возможных?» (т.н. парадокс Левинталя [Levinthal,

1968]), «Каков механизм сворачивания белка?», «Чем определяется скорость1 и путь сворачивания белка?» и др. На некоторые вопросы ответы уже получены, на другие — едва намечены.

Целью данной диссертационной работы является выявление факторов, л определяющих скорость самоорганизации белков , и степени их влияния на скорость сворачивания белков.

Для этого нами, во-первых, разработан метод анализа сети путей сворачивания-разворачивания белков с известной трехмерной структурой, основанный на решении системы кинетических уравнений, написанных для всех «полусвернутых» структур, возникающих в процессе сворачивания белка. Предложенный метод был успешно применен для расчета скоростей сворачивания и разворачивания более чем 80 белков с экспериментально исследованной на сегодняшний день кинетикой сворачивания. Этот метод также позволяет более или менее удовлетворительно предсказывать локализацию ядер сворачивания белков.

Во-вторых, нами предложены два феноменологических метода, которые позволяют проще и быстрее — при той же эффективности — предсказывать скорость сворачивания белка в «биологических» условиях, когда нативная структура намного стабильнее развернутой. Для использования первого метода необходимо знать трехмерную структуру белка — скорость сворачивания предсказывается по среднему числу остатков, разделяющих атомы, контактирующие в нативной структуре. Для второго метода нужно знать только число неспиральных остатков в нативной структуре белка, которое может быть успешно определено по одной лишь первичной структуре белка.

1 Согласно сложившейся традиции, в этой работе под словом «скорость» мы подразумеваем константу скорости.

2 Для краткости мы будем называть «белками» однодоменные водорастворимые глобулярные белки, а также отдельные глобулярные домены многодоменных белков, и, кроме того, не глобулярные, но имеющие определенную пространственную структуру маленькие пептиды. Строго говоря, в данной работе рассматриваются только белки, не имеющие в своей нативной структуре ни S-S связей, ни ковалентных связей с лигандами.

СПИСОК СОКРАЩЕНИЙ. КД — круговой дихроизм; УФ — ультрафиолетовый; ЯМР — ядерный магнитный резонанс; U — денатурированное (развернутое) состояние белка; N — нативное (свернутое) состояние белка; TS — переходное состояние белка;

WT: «белок дикого типа» — белок, не подвергшийся искусственным мутациям;

ПК — относительный порядок контактов;

Сокращенные названия белков, исследованных в работе, и соответствующие им полные названия приведены в Таблице 1 Приложения Б.

Заключение Диссертация по теме "Биофизика", Иванков, Дмитрий Николаевич

выводы

Разработан метод расчета скоростей сворачивания и разворачивания однодоменных глобулярных белков с известной трехмерной структурой с помощью моделирования процесса их сворачивания-разворачивания вблизи точки термодинамического равновесия между нативным и развернутым состоянием белковой цепи.

Предложенный метод позволяет успешно предсказывать скорости сворачивания и разворачивания белков вблизи точки термодинамического равновесия, а для белков, стабильность нативной структуры которых в воде известна, — также и скорости их сворачивания и разворачивания в воде. Разработанный метод позволяет также удовлетворительно предсказывать вовлеченность аминокислотного остатка в ядро сворачивания белка. В среднем корреляция с экспериментом составляет 0.51.

Предложен метод оценки скоростей сворачивания однодоменных глобулярных белков по известной трехмерной структуре без моделирования процессов их сворачивания-разворачивания, — а именно, по среднему расстоянию по цепи между атомами, контактирующими в нативной структуре белка.

Показано, что скорость сворачивания белка в первом приближении определяется длиной цепи белка, а во втором — вторичной структурой белка, которую можно либо взять из известной трехмерной структуры, либо предсказать по аминокислотной последовательности белка. Предложен феноменологический метод оценки скорости сворачивания по числу неспиральных остатков в белке; этот метод не требует знания пространственной структуры белка, так как число неспиральных остатков в нем может быть предсказано по первичной структуре белка.

СПИСОК ПУБЛИКАЦИЙ ПО ТЕМЕ ДИССЕРТАЦИИ Результаты диссертационной работы изложены в следующих публикациях:

СТАТЬИ В РЕФЕРИРУЕМЫХ ИЗДАНИЯХ.

1. Галзитская О.В., Иванков Д.Н., Финкельштейн А.В. (2001). Нуклеация и скорость сворачивания в белках. Мол. Биология. 35, 708-717.

2. Финкельштейн А.В., Иванков Д.Н., Галзитская О.В. (2005). Предсказание скоростей и ядер сворачивания глобулярных белков на основе теории их самоорганизации. Успехи биологической химии, 45, 3-36.

3. Galzitskaya O.V., Skoogarev A.V., Ivankov D.N., Finkelstein A.V. (1999) Folding nuclei in 3D protein structures. Proceedings of the Pacific Symposium on Biocomputing'2000 (Altman R.B., Dunker A.K., Hunter L., Lauderdale, K., Klein Т.Е., eds.). World Scientific, Singapore - New Jersey - London - Hong Kong, pp. 131-142.

4. Galzitskaya O.V., Ivankov D.N., Finkelstein A.V. (2001). Folding nuclei in proteins. FEBSLetters. 489: 113-118.

5. Ivankov D.N., Finkelstein A.V. (2001). Theoretical Study of a Landscape of Protein Folding-Unfolding Pathways. Folding Rates at Mid-Transition. Biochemistry. 40, 9957-9961.

6. Galzitskaya O.V., Garbuzynskiy, S.O., Ivankov D.N., Finkelstein A.V. (2003). Chain length is the main determinant of the folding rate for proteins with three-state folding kinetics. Proteins. 51, 162-166.

7. Ivankov D.N., Garbuzynskiy S.O., Aim E., Plaxco K.W., Baker D., Finkelstein A.V. (2003). Contact order revisited: influence of protein size on the folding rate. Protein Science, 12, 2057-2062.

8. Ivankov D.N., Finkelstein A.V. (2004). Prediction of protein folding rates from the amino acid sequence-predicted secondary structure. Proc. Natl. Acad. Sci. USA. 101, 8942-8944.

ОСТАЛЬНЫЕ ПУБЛИКАЦИИ.

9. Д.Н. Иванков, О.В. Галзитская, А.В. Скугарев, А.В. Финкелыптейн. (2000). Теоретический поиск ядер сворачивания в белках с известной трехмерной структурой. Школа-конференция «Горизонты физико-химической биологии», Пущино. стр. 29.

10.Иванков Д.Н., Финкелыптейн А.В. Предсказание скорости сворачивания белков по аминокислотной последовательности. (2004). III Съезд биофизиков России, Воронеж, т. I, стр. 43.

1 l.A.V. Finkelstein, O.V. Galzitskaya, D.N. Ivankov. (2001). Protein folding nucleus and protein folding rate: a theoretical study. Fourth European Symposium of The Protein Society. Institut Pasteur, Paris, France, 2001. Protein Sci. 10 (Suppl.l), 47.

12.Galzitskaya O.V., Ivankov D.N., Finkelstein A.V. (2001). The State of Art in Steps of Protein Folding. Summer School "The prediction and mechanism of protein folding: from topology to intermediate states". (Chomilier, J., Labesse, G, and Sadoc, J.-F., eds.) Institute d'etudes scientifiques de Cargese, pp. 8-19.

13.Finkelstein A.V., Galzitskaya O.V., Ivankov D.N., Bogatyreva N.S., Garbuzinskii S.O., Lobanov M.Yu., Dolgikh D.A., Oliveberg M. (2002). Protein folding: Theoretical and experimental study. Proceedings of the Fifth Meeting on the Critical Assessment of Techniques for Protein Structure Prediction, Asilomar Conference Center, Pacific Grove, California, p. A202.

14.Lobanov M.Yu., Litvinov I., Bogatyreva N.S., Galzitskaya O.V., Kondratova M.S., Garbuzinskii S.O., Ivankov D.N., Roytberg M.A., Finkelstein A.V. (2002). Threading using multiple homology and secondary structure prediction information. Proceedings of the Fifth Meeting on the Critical Assessment of Techniques for Protein Structure Prediction, Asilomar Conference Center, Pacific Grove, California, pp. A130-A131.

15.Krieger E., Ivankov D.N., Finkelstein A., Vriend G. (2002). WHAT IF YASARA folds a protein. Proceedings of the Fifth Meeting on the Critical

Assessment of Techniques for Protein Structure Prediction, Asilomar Conference Center, Pacific Grove, California, pp. A169-A170. 16.M.Yu. Lobanov, D.N. Ivankov, S.O. Garbuzynskiy, N.S. Bogatyreva, O.V. Galzitskaya, I.I. Litvinov, M.A. Roytberg, A.V. Finkelstein. (2004). Threading the use of multiple homology and secondary structure prediction information. Proceedings of the Sixth Meeting on the Critical Assessment of Techniques for Protein Structure Prediction, Gaeta, Italy, 2004, p. 120-121. 17.S.O. Garbuzynskiy, M.Yu. Lobanov, D.N. Ivankov, N.S. Bogatyreva, A.V. Finkelstein, O.V. Galzitskaya. (2004). Prediction of domain boundaries and disordered regions in proteins with unknown tertiary structure. Proceedings of the Sixth Meeting on the Critical Assessment of Techniques for Protein Structure Prediction, Gaeta, Italy, 2004, p. 109-110. 18.A.V. Finkelstein, D.N. Ivankov, S.O. Garbuzynskiy, O.V. Galzitskaya. (2005) Prediction of protein folding rates. Proceedings of the international Moscow conference on computational molecular biology, Moscow, Russia, 2005, pp. 101-103.

ЗАКЛЮЧЕНИЕ

Одним из важных этапов на пути к пониманию проблемы самоорганизации белка является выяснение факторов, определяющих скорость его сворачивания. Возможность успешного предсказания скоростей сворачивания является свидетельством правильного понимания механизмов самоорганизации белка.

Данная диссертационная работа посвящена теоретическому исследованию процесса сворачивания-разворачивания белка.

В первой части работы мы исследовали сворачивание-разворачивание белка с помощью его теоретического моделирования вблизи точки равновесия между нативным и денатурированным состоянием. Это моделирование основано на анализе сети путей сворачивания-разворачивания белка с помощью решения полной системы кинетических уравнений. Вычисленные скорости сворачивания-разворачивания хорошо согласуются с экспериментальными данными (коэффициент корреляции составляет около 0.8). Тот же метод также позволяет грубо предсказывать локализацию ядра сворачивания белка.

Во второй части мы выяснили, от каких факторов зависит скорость сворачивания белка. Согласно нашим результатам, длина цепи белка является самым важным фактором, определяющим скорость сворачивания белка. Другие используемые в литературе факторы, такие, как «контактный порядок» объясняют различия в скоростях сворачивания лишь для белков примерно одинакового размера. Поэтому, используя только их невозможно правильно оценить скорость сворачивания белка в общем случае. Если же принять во внимание и длину цепи белка, и его вторичную структуру (или его нативную пространственную структуру), можно добиться хорошего качества предсказания скоростей сворачивания. Мы это продемонстрировали, предложив два эмпирических метода, позволяющие быстро, без тщательного моделирования, предсказывать скорости сворачивания белка. Замечательно то, что при использовании одного из них можно обойтись одной только первичной структурой белка! Рассчитанные при этом скорости сворачивания коррелируют с экспериментальными данными на уровне ~0.8, то есть, так же, как при детальном моделировании кинетики сворачивания-разворачивания белка.

БЛАГОДАРНОСТИ.

Я благодарен Алексею Витальевичу Финкельштейну за научное руководство, Наталье Богатыревой — за помощь в работе и поддержку, Оксане Галзитской и Сергею Гарбузинскому — за плодотворные дискуссии, Михаилу Абрамовичу Ройтбергу — за сотрудничество, а также всем членам Лаборатории физики белка Института белка РАН, которые создавали теплую и дружественную обстановку во время работы.

Эта работа проведена при финансовой поддержке следующих программ и организаций: программы «Физико-Химическая биология РАН» (№10002-251/П//145-161/140503-089); гранта Президента РФ «Изучение самоорганизации белков» (№ НШ-1968.2003.4); гранта Российского Фонда Фундаментальных Исследований (№ 01-04-48329), гранта Гражданского Фонда Исследования и Развития США (№ RB2-2022) и грантов Медицинского Института Ховарда Хьюза (№ 55000305 и № 75195-544702).

Библиография Диссертация по биологии, кандидата физико-математических наук, Иванков, Дмитрий Николаевич, Пущино

1. Галзитская О.В., Иванков Д.Н., Финкелынтейн А.В. (2001). Нуклеация и скорость сворачивания в белках. Мол. Биология. 35, 708-717.

2. Финкелынтейн А.В., Бадретдинов А.Я. (1997). Физические причины быстрой самоорганизации стабильной пространственной структуры белков: решение парадокса Левинталя. Молекулярная биология. 31, 469477.

3. Финкелынтейн А.В., Птицын О.Б. (2005). Физика белка. М.: КДУ.

4. Финкелынтейн А.В., Иванков Д.Н., Галзитская О.В. (2005). Предсказание скоростей и ядер сворачивания глобулярных белков на основе теории их самоорганизации. Успехи биологической химии, 45, 336.

5. Флори П. (1971). Статистическая механика цепных молекул. М.: Мир, 440 с.

6. Эмануэль Н.М., Кнорре Д.Г. (1984). Курс химической кинетики. М.: Высш. шк.

7. Abkevich V.I., Gutin A.M., Shakhnovich E.I. (1994b). Specific nucleus as a transition state for protein folding: an evidence from lattice model. Biochemistry. 33, 10026-10036.

8. Aim E., Baker D. (1999). Prediction of protein-folding mechanisms from free-energy landscapes derived from native structures. Proc. Natl. Acad. Sci. USA. 96, 11305-11310.

9. Aim E., Morozov A.V., Kortemme Т., Baker D. (2002). Simple physical models connect theory and experiment in protein folding kinetics. J. Mol. Biol. 322, 463-476.

10. Anfinsen C.B., Haber E., Sela M., White F.H. (1961). The kinetics of formation of native ribonuclease during oxidation of the reduced polypeptide chain. Proc. Natl. Acad. Sci. USA. 47, 1309-1314.

11. Anfinsen C.B. (1973). Principles that govern the folding of protein chains. Science. 181, 223-230.

12. Baker D. (2000). A surprising simplicity to protein folding. Nature. 405, 3942.

13. Berman H.M., Westbrook J., Feng Z., Gilliland G., Bhat T.N., Weissig H., Shindyalov I.N., Bourne P.E. (2000). The Protein Data Bank. Nucleic Acids1. Research. 28, 235-242.

14. Bernstein F.C., Koetzle T.F., Williams G.J.B., Meyer E.F., Brice M.D., # Rogers J.R., Kennard O., Shimanouchi Т., Tasumi M. (1977). The Protein

15. Bank. A computer-based archival file for macromolecular structures. Eur. J. Biochem. 80, 319-324.

16. Brandts J.F., Halvorson H.R., Brennan M. (1975). Consideration of the possibility that the slow step in protein denaturation reactions is due to cis-trans isomerism of proline residues. Biochemistry. 14, 4953-4963.

17. Brooks C.L. Ill, Gruebele M., Onuchic J.N., Wolynes P.G. (1998). Chemical physics of protein folding. Proc. Natl. Acad. Sci. USA. 95, 11037-11038.

18. Biyson K., McGuffin L.J., Marsden R.L., Ward J.J., Sodhi J.S., Jones D.T. Ф • (2005). Protein structure prediction servers at University College London.

19. Nucl. Acids Res. 33, W36-38.

20. Bulaj G., Goldenberg D.P. (1999). Early events in the disulfide-coupled folding of BPTI. Prot. Sci. 8, 1825-1842.

21. Burton R.E., Huang G.S., Daugherty M.A., Calderoni T.L., Oas T.G. (1997). The energy landscape of a fast-folding protein mapped by Ala—>Gly substitutions. Nat. Struct. Biol. 4, 305-310.

22. Burns L.L., Dalessio P.M., Ropson I.J. (1998) Folding mechanism of three structurally similar beta-sheet proteins. Proteins 33, 107-118.

23. Caflisch A., Karplus M. (1995). Acid and thermal denaturation of barnase investigated by molecular dynamics simulations. J. Mol. Biol. 252, 672-708.

24. Calloni G., Taddei N., Plaxco K.W., Ramponi G., Stefani M., Chiti F. (2003). Comparison of the folding processes of distantly related proteins. Importance of hydrophobic content in folding. J. Mol. Biol 330, 577-591.

25. Cavagnero S., Dyson H.J., Wright P.E. (1999). Effect of H helix destabilizing mutations on the kinetic and equilibrium folding of apomyoglobin. J. Mol. Biol. 285, 269-282.

26. Choe S.E., Matsudaira P.T., Osterhout J., Wagner G., Shakhnovich E.I. (1998). Folding kinetics of villin 14T, a protein domain with a central beta-sheet and two hydrophobic cores. Biochemistry, 31, 14508-14518.

27. Choe S.E., Li L., Matsudaira P.T., Wagner G., Shakhnovich E.I. (2000). Differential stabilization of two hydrophobic cores in the transition state of the villin 14T folding reaction. J. Mol. Biol. 304, 99-115.

28. Clarke J., Hamill S.J., Johnson C.M. (1997). Folding and stability of a fibronectin type III domain of human tenascin. J. Mol. Biol. 270, 771-778.

29. Clarke J., Cota E., Fowler S.B., Hamill S.J. (1999). Folding studies of immunoglobulin-like beta-sandwich proteins suggest that they share a common folding pathway. Structure Fold. Des. 7, 1145-1153.

30. Clementi C., Jennings P.A., Onuchic J.N. (2000). How native-state topology affects the folding of dihydrofolate reductase and interleukin-ip. Proc. Natl. Acad. Sci. USA. 97, 5871-5876.

31. Cobos E.S., Filimonov V.V., Galvez A., Valdivia E., Maqueda M., Martinez J.C., Mateo P.L. (2002). The denaturation of circular enterocin AS-48 by urea and guanidinium hydrochloride. Bioch. Bioph. Acta. 1598, 98-107.

32. Cota E., Clarke J. (2000). Folding of beta-sandwich proteins: three-state transition of a fibronectin type III module. Protein Sci. 9, 112-120.

33. Cota E., Steward A., Fowler S., Clarke J. (2001). The folding nucleus of a fibronectin type III domain is composed of core residues of the immunoglobulin-like fold. J. Mol. Biol 305, 1185-1194.

34. Daggett V., Li A., Itzhaki L.S., Otzen D.E., Fersht A.R. (1996). Structure of the transition state for folding of a protein derived from experiment and simulation. J. Mol Biol 257, 430-440.

35. Dalessio P.M., Ropson I.J. (2000). Beta-sheet proteins with nearly identical structures have different folding intermediates. Biochemistry. 39, 860-871.

36. Dill K.A., Chan H.S. (1997). From Levinthal to pathways to funnels. Nat. Struct. Biol 4, 10-19.

37. Dobson C.M., Karplus M. (1999). The fundamentals of protein folding: bringing together theory and experiment. Curr. Opin. Struct. Biol 9, 92-101.

38. Ferguson N., Johnson C.M., Macias M., Oschkinat H., Fersht A. (2001). Ultrafast folding of WW domains without structured aromatic clusters in the denatured state. Proc. Natl Acad. Sci. USA. 98, 13002-13007.

39. Fersht A. R., Matouschek A., Serrano L. (1992). The folding of an enzyme. I. Theory of protein engineering analysis of stability and pathway of protein folding. J. Mol Biol 224, 771-782.

40. Fersht A.R. (1995). Characterizing transition states in protein folding: an essential step in the puzzle. Curr. Opin. Struct. Biol 5, 79-84.

41. Fersht A.R. (1997). Nucleation mechanisms in protein folding. Curr. Opin. Struct. Biol 7, 3-9.

42. Fersht A.R. (1999). Structure and Mechanism in Protein Science: A Guide to Enzyme Catalysis and Protein Folding, W.H. Freeman, New York.

43. Finkelstein A.V. (1997). Can protein unfolding simulate protein folding? Protein Eng. 10, 843-845.

44. Finkelstein A.V., Badretdinov A.Ya. (1997). Rate of protein folding near the point of thermodynamic equilibrium between the coil and the most stable chain fold. Fold. Des. 2, 115-121.

45. Fowler S.B., Clarke J. (2001). Mapping the folding pathway of an immunoglobulin domain: structural detail from phi value analysis and movement of the transition state. Structure (Camb), 9, 355-366.

46. Fulton K.F., Main E.R.G., Dagett V., Jackson S.E. (1999). Mapping the interactions present in the transition state for unfolding/folding of FKBP12. J. Mol. Biol. 291, 445-461.

47. Galzitskaya O.V., Finkelstein A.V. (1995). Folding of chains with random and edited sequences: similarities and differences. Protein Eng. 8, 883-892.

48. Galzitskaya O.V., Finkelstein A.V. (1999). A theoretical search for folding/unfolding nuclei in three-dimensional protein structures. Proc. Natl. Acad. Sci. USA. 96, 11299-11304.

49. Galzitskaya O.V., Ivankov D.N., Finkelstein A.V. (2001). Folding nuclei in proteins. FEBS Letters. 489: 113-118.

50. Galzitskaya O.V., Garbuzynskiy, S.O., Ivankov D.N., Finkelstein A.V. (2003). Chain length is the main determinant of the folding rate for proteins with three-state folding kinetics. Proteins. 51, 162-166.

51. Garbuzynskiy S.O., Finkelstein A.V., Galzitskaya O.V. (2004). Outlining folding nuclei in globular proteins. J. Mol. Biol. 336, 509-525.

52. Gianni S., Guydosh N.R., Khan F., Caldas T.D., Mayor U., White G.W.N., DeMarco M.L., Daggett V., Fersht A.R. (2003). Unifying features in protein-folding mechanism. Proc. Natl. Acad. Sci. USA. 100, 13286-13291.

53. Golbik R., Zahn R., Harding S.E., Fersht A.R. (1998). Thermodynamic stability and folding of GroEL minichaperones. J. Mol. Biol 276, 505-515.

54. Goldberg M.E., Semisotnov G.V., Friguet В., Kuwajima K., Ptitsyn O.B., Sugai S. (1990) An early immunoreactive folding intermediate of the tryptophan synthease beta 2 subunit is a 'molten globule'. FEBS Lett. 263, 5156.

55. Gong H., Isom D.G., Srinivasan R., Rose G.D. (2003). Local secondary structure content predicts folding rates for simple, two-state proteins. J. Mol. Biol. 327,1149-1154.

56. Grantcharova V.P., Riddle D.S., Santiago J.V., Baker D. (1998). Important role of hydrogen bonds in the structurally polarized transition state for folding of the src SH3 domain. Nature Struct. Biol. 5, 714-720.

57. Grantcharova V., Aim E.J., Baker D., Horwich A.L. (2001). Mechanisms of protein folding. Curr. Opin. Struct. Biol. 11, 70-82.

58. Gromiha M.M., Selvaraj S. (2001). Comparison between long-range interactions and contact order in determining the folding rate of two-state proteins: application of long-range order to folding rate prediction. J. Mol. Biol. 310, 27-32.

59. Guerois R., Serrano L. (2000). The SH3-fold family: experimental evidence and prediction of variations in the folding pathways. J. Mol. Biol. 304, 967982.

60. Guijarro J.I., Morton C.J., Plaxco K.W., Campbell I.D., Dobson C.M. (1998). Folding kinetics of the SH3 domain of PI3 kinase by real-time NMR combined with optical spectroscopy. J. Mol. Biol. 276, 657-667.

61. Gunasekaran K., Eyles S.J., Hagler A.T., Gierasch L.M. (2001). Keeping it in the family: folding studies of related proteins. Curr. Opin. Struct. Biol 11, 8393.

62. Gutin A.M., Abkevich V.I., Shakhnovich E.I. (1995). Is burst hydrophobic collapse necessary for protein folding? Biochemistry. 34, 3066-3076.

63. Gutin A.M., Abkevich V.I., Shakhnovich E.I. (1996). Chain length scaling of protein folding time. Phys. Rev. Lett. 77, 5433-5436.

64. Gutte В., Merrifield R.B. (1969). The total synthesis of an enzyme with ribonuclease A activity. J. Amer. Chem. Soc. 91, 501-502.

65. Hamill S., Steward A., Clarke J. (2000). The folding of an immunoglobulin-like greek key protein is defined by a common-core nucleus and regions constrained by topology. J. Mol. Biol. 297, 165-178.

66. Ikura Т., Hayano Т., Takahashi N., Kuwajima K. (2000). Fast folding of Escherichia coli cyclophilin A: a hypothesis of a unique hydrophobic core with a phenylalanine cluster. J. Mol. Biol. 297, 791-802.

67. Ivankov D.N., Finkelstein A.V. (2001). Theoretical study of a landscape of protein folding-unfolding pathways. Folding rates at midtransition. Biochemistry, 40, 9957-9961.

68. Ivankov D.N., Garbuzynskiy S.O., Aim E., Plaxco K.W., Baker D., Finkelstein A.V. (2003). Contact order revisited: influence of protein size on the folding rate. Protein Science, 12, 2057-2062.

69. Ivankov D.N., Finkelstein A.V. (2004). Prediction of protein folding rates from the amino acid sequence-predicted secondary structure. Proc. Natl Acad. Sci. USA. 101, 8942-8944.

70. Jackson S. E. (1998). How do small single-domain proteins fold? Folding and Design. 3,81-91.

71. Jackson S.E., Fersht A.R. (1991). Folding of chymotrypsin inhibitor 2. 1. Evidence for a two-state transition. Biochemistry, 30, 10428-10435.

72. Jager M., Nguyen H., Crane J.C., Kelly J.W., Gruebele M. (2001). The folding mechanism of a beta-sheet: the WW domain. J. Mol Biol 311, 373393.

73. Jennings P.A., Finn B.E., Jones B.E., Matthews C.R. (1993). A reexamination of the folding mechanism of dihydrofolate reductase from Escherichia coli: verification and refinement of a four-channel model. Biochemistry. 32, 37833789.

74. Johnson C.M., Fersht A.R. (1995). Protein stability as a function of denaturant concentration: the thermal stability of barnase in the presence of urea. Biochemistry. 34, 6795-6804.

75. Jones D. (1999). Protein secondary structure prediction based on position-specific scoring matrices. J. Mol Biol 292, 195-202.

76. Jones K., Wittung-Stafshede P. (2003). The largest protein observed to fold by two-state kinetic mechanism does not obey contact-order correlation. J. Am. Chem. Soc. 125, 9606-9607.

77. Kabsch W., Sander C. (1983). Dictionary of protein secondary structure: pattern recognition of hydrogen-bonded and geometrical features. Biopolymers. 22, 2577-2637.

78. Kendrew J.C., Bodo G., Dintzis H.M., Parrish H., Wyckoff H., Phillips D.C. (1958). A three-dimensional model of the myoglobin molecule obtained by X-ray analysis. Nature. 181, 662-666.

79. Khorasanizadeh S., Peters I.D., Roder H. (1996). Evidence for a three-state model of protein folding from kinetic analysis of ubiquitin variants with altered core residues. Nat. Struct. Biol. 3, 193-205.

80. Kim D.E., Fisher C., Baker D. (2000). A breakdown of symmetry in the folding transition state of protein L. J. Mol. Biol. 298, 971-984.

81. Klimov D.K., Thirumalai D. (2001). Multiple protein folding nuclei and the transition state ensemble in two-state proteins. Proteins. 43, 465-475.

82. Koga N., Takada S. (2001). Roles of native topology and chain-length scaling in protein folding: a simulation study with a Go-like model. J. Mol. Biol. 313, 171-180.

83. Kubelka J., Hofrichter J., Eaton W.A. (2004) The protein folding 'speed limit'. Curr. Opin. Struct. Biol. 14, 76-88.

84. Laurents D.V., Corrales S., Elias-Arnanz M., Sevilla P., Rico M., Padmanabhan S. (2000) Folding kinetics of phage 434 Cro protein. Biochemistry. 39, 13963-13973.

85. Lazaridis Т., Karplus M. (1997). «New view» of protein folding reconciled with the old through multiple unfolding simulations. Science. 278, 1928-1931.

86. Leninger A.L., Nelson D.L., Cox M.M. (1993). Principles of Biochemistry. Worth Publ., Inc., New York.

87. Levinthal C. (1968). Are there pathways for protein folding? J. Chim. Phys., Chim. Biol. 65, 44-45.

88. Li A., Daggett V. (1996). Identification and characterization of the unfolding transition state of chymotrypsin inhibitor 2 by molecular dynamics simulations. J. Mol. Biol. 257, 412-429.

89. Lindberg M., Tangrot J., Oliveberg M. (2002). Complete change of the protein folding transition state upon circular permutation. Nature Struct. Biol. 9, 818-822.

90. Lopez-Hernandez E., Serrano L. (1996). Structure of the transition state for folding of the 129 aa protein CheY resembles that of a smaller protein, CI-2. Fold. Des. 1, 43.

91. Martinez J.C., Serrano L. (1999). The folding transition state between SH3 domains is conformationally restricted and evolutionarily conserved. Nature Struct. Biol. 6, 1010-1016.

92. Matouschek J.T., Kellis Jr., Serrano L., Fersht A. R. (1989). Mapping the transition state and pathway of protein folding by protein engineering, Nature. 340, 122-126.

93. Matouschek A., Kellis J.T.Jr., Serrano L., Bycroft M., Fersht A.R. (1990). Transient folding intermediates characterized by protein engineering. Nature. 346, 440-445.

94. McCallister E.L., Aim E., Baker, D. (2000). Critical role of beta-hairpin formation in protein G folding. Nat. Struct. Biol. 7, 669-673.

95. Merrifield R.B. (1969). The synthesis of biologically active peptides and proteins. JAMA. 210, 1247-54.

96. Metropolis N., Rosenbluth A., Rosenbluth M., Teller A., Teller E. (1953). J. Chem. Phys. 96, 768-780.

97. Mirny L.A., Shakhnovich E.I. (1999). Universally concerved positions in protein folds: Reading evolutionary signals about stability, folding kinetics and function. J. Mol. Biol. 291, 177-196.

98. Mirny L., Shakhnovich E. (2001). Annu. Rev. Biophys. Biomol. Struct. 30,361.396.

99. Munoz V., Lopez E.M., Jager M., Serrano L. (1994). Kinetic characterization of the chemotactic protein from Escherichia coli, CheY. Kinetic analysis of the inverse hydrophobic effect. Biochemistry. 33, 5858-5866.

100. Munoz V., Thompson P.A., Hofrichter J., Eaton W.A. (1997) Folding dynamics and mechanism of beta-hairpin formation. Nature. 390, 196-199.

101. Munoz V., Eaton W. A. (1999). A simple model for calculating the kinetics of protein folding from three-dimensional structures. Proc. Natl Acad. Sci. USA. 96, 11311-11316.

102. Murzin A.G., Brenner S.E., Hubbard Т., Chothia C. (1995). SCOP: a structural classification of proteins database for the investigation of sequences and structures. J. Mol. Biol. 247, 536-540.

103. Myers J.K., Oas T.G. (2001). Pre-organized secondary structure as an important determinant of fast protein folding. Nat. Struct. Biol. 8, 552-558.

104. Nolting В., Andert K. (2000). Mechanism of protein folding. Proteins: Struct. Funct. Genet. 41, 288-298.

105. Ogasahara K., Yutani K. (1994). Unfolding-refolding kinetics of the tryptophan synthase alpha subunit by CD and fluorescence measurements. J. Mol. Biol 236, 1227-1240.

106. Oliveberg M. (2001). Characterisation of the transition states for protein folding: towards a new level of mechanistic detail in protein engineering analysis. Curr. Opin. Struct. Biol. 11, 94-100.

107. Onuchic J.N., Socci N.D., Luthey-Schulten Z., Wolynes P.G. (1996). Protein funnels: The nature of the transition state ensemble. Fold. Des. (London). 1, 441-450.

108. Otzen D.E., Kristensen O., Proctor M., Oliveberg M. (1999). Structural changes in the transition state of protein folding: Alternative interpretations of curved chevron plots. Biochemistry. 38, 6499-6511.

109. Pande V.S., Rocksar D.S. (1999). Folding pathway for a lattice model proteins. Proc. Natl. Acad. Sci USA. 96, 1273-1278.

110. Parker M.J., Spencer J., Clarke A.R. (1995). An integrated kinetic analysis of intermediates and transition states in protein folding reactions. J. Mol. Biol. 253, 771-786.

111. Parker M.J., Sessions R.B., Badcoe I.G., Clarke A.R. (1996). The development of tertiary interactions during the folding of a large protein. Fold. Des. 1, 145-156.

112. Parker M.J., Dempsey C.E., Lorch M., Clarke A.R. (1997). Acquisition of native beta-strand topology during the rapid collapse phase of protein folding. Biochemistry. 36, 13396-13405.

113. Parker M.J., Marqusee S. (1999). The cooperativity of burst phase reactions explored. J. Mol. Biol. 293, 1195-1210.

114. Perl D., Welker Ch., Schindler Т., Schroder K., Marahiel M.A., Jaenicke R., Schmid F.X. (1998). Conservation of rapid two-state folding in mesophilic, thermophilic and hyperthermophilic cold shock proteins. Nature Struct. Biol. 5, 229-235.

115. Perutz M.F., Rossmann M.G., Cullis A.F., Muirhead G., Will G., North T. (1960). Structure of haemoglobin: a three-dimensional fourier synthesis at 5.5-A. Resolution, obtained by X-ray analysis. Nature. 185, 416-422.

116. Plaxco K.W., Spitzfaden C., Campbell I.D., Dobson C.M. (1997). A comparison of the folding kinetics and thermodynamics of two homologous fibronectin type III modules. J. Mol. Biol. 270, 763-770.

117. Plaxco K.W., Simons K.T., Baker D. (1998). Contact order, transition state placement and the refolding rates of single domain proteins. J. Mol. Biol. 277, 985-994.

118. Plaxco K.W., Simons K.T., Ruczinski I., Baker D. (1999). Topology, stability, sequence, and length: defining the determinants of two-state protein folding kinetics. Biochemistry. 39, 11177-11183.

119. Plaxco K.W., Larson S., Ruczinski I., Riddle D.S., Thayer E.C., Buchwitz В., Davidson A.R., Baker D. (2000). Evolutionary conservation in protein folding kinetics. J. Mol. Biol 298, 303-312.

120. Plotkin S.S., Onuchic J.N. (2000). Investigation of routes and funnels in protein folding by free energy functional methods. Proc. Natl. Acad. Sci USA. 97, 6509-6514.

121. Privalov P. L. (1979). Stability of proteins: small globular proteins. Adv. Protein Chem. 33, 167-241.

122. Privalov P. L. (1982). Stability of proteins. Proteins which do not present a single cooperative system. Adv. Protein Chem. 35, 1-104.

123. Ptitsyn O.B., Finkelstein A.V. (1983). Theory of protein secondary structure and algorithm of its prediction. Biopolymers. 22, 15-25.

124. Ptitsyn O.B. (1998). Protein folding and protein evolution: common folding nucleus in different subfamilies of c-type cytochromes? J. Mol. Biol. 278, 655-666.

125. Ptitsyn O.B., Ting K.-L. (1999). Non-functional residues in globins and their possible role as a folding nucleus. J. Mol. Biol. 291, 671-682.

126. Qiu L., Pabit S.A., Roitberg A.E., Hagen S.J. (2002). Smaller and faster: the 20-residue Trp-cage protein folds in 4 micros. JACS. 124, 12952-12953.

127. Reid K.L., Rodriguez H.M., Hillier B.J., Gregoret L.M. (1998). Stability and folding properties of a model beta-sheet protein, Escherichia coli CspA. Protein Sci. 7, 470-479.

128. Sali A., Shakhnovich E.I., Karplus M. (1994). Kinetics of protein folding — a lattice model study of the requirements for folding to the native state. J. Mol. Biol. 235, 1614-1636.

129. Sanger F., Tuppy H. (1951). The amino-acid sequence in the phenylalanyl chain of insulin. 2. The investigation of peptides from enzymic hydrolysates. BiochemJ. 49, 481-490.

130. Schonbrunner N., Koller K.-P., Kiefhaber T. (1997) Folding of the disulfide-bonded P-sheet protein tendamistat: rapid two-state folding without hydrophobic collapse./. Mol Biol 268, 526-538.

131. Schreiber G., Fersht A.R. (1993). The refolding of cis- and trans-peptidylprolyl isomers of barstar. Biochemistry, 32, 11195-11203.

132. Schymkowitz J., Rousseau F., Irvine L., Itzhaki L. (2000). The foldingpathway of the cell-cycle regulatory protein pl3sucl: clues for the mechanism of domain swapping. Structure Fold. Des. 8, 89-100.

133. Scott K.A., Batey S., Hooton K.A., Clarke J. (2004). The folding of spectrin domains I: wild-type domains have the same stability but very different kinetic properties. / Mol Biol 344, 195-205.

134. Serrano L., Matouschek A., Fersht A.R. (1992). The folding of an enzyme. III. Structure of the transition state for unfolding of barnase analyzed by a protein engineering procedure. J. Mol Biol 224, 805-818.

135. Shakhnovich E., Abkevich V., Ptitsyn O. (1996). Conserved residues and the mechanism of protein folding. Nature. 379, 96-98.

136. Shao H., Peng Y., Zeng Z.-H. (2003). A simple parameter relating sequences * with folding rates of small alpha helical proteins. Int. Prot. Pept. Lett. 10, 277280.

137. Shoemaker B.A., Wang J., Wolynes P.G. (1999). Exploring structures in protein folding funnels with free energy functionals: the transition state ensemble. J. Mol Biol 287, 675-694.

138. Shoemaker B.A., Wolynes P.G. (1999). Exploring structures in protein folding funnels with free energy functionals: the denatured ensemble. J. Mol Biol. 287, 657-674.1. Щ, 85

139. Snow C.D., Nguyen H., Pande V.S., Gruebele M. (2002). Absolute comparison of simulated and experimental protein-folding dynamics. Nature. 420, 102-106.

140. Spector S., Raleigh D.P. (1999). Submillisecond folding of the peripheral subunit-binding domain. J. Mol. Biol. 293, 763-768.

141. Takada S. (1999). Go-ing for the prediction of protein folding mechanisms. Proc. Natl Acad. Sci. USA, 96, 11698-11700.

142. Tang K.S., Guralnick B.J., Wang W.K., Fersht A.R., Itzhaki L.S. (1999). Stability and folding of the tumour suppressor protein pi 6. J. Mol. Biol. 285, 1869-1886.

143. Ternstrom Т., Mayor U., Akke M., Oliveberg M. (1999). From snapshot to movie: phi analysis of protein folding transition states taken one step further. Proc. Natl Acad. Sci. USA, 96, 14854-14859.

144. Thompson P.A., Eaton W.A., Hofrichter J. (1997). Laser temperature jump study of the helix-coil kinetics of an alanine peptide interpreted with a 'kinetic zipper' model. Biochemistry. 36, 9200-9210.

145. Thirumalai D. (1995). From minimal models to real proteins: time scales for protein folding kinetics. J. Phys. (Orsay, Fr.) 5, 1457-1469.

146. Tsai J., Levitt M., Baker D. (1999). Hierarchy of structure loss in MD simulations of src SH3 domain unfolding. J. Mol. Biol. 291, 215-225.

147. Ueda Y., Taketomi H., Go N. (1975). Studies on protein folding, unfolding and fluctuations by computer simulation. I. The effect of specific amino acid sequence represented by specific inter-unit interactions. Int. J. Pept. Protein Res. 7, 445-459.

148. Van Nuland N.A., Meijberg W., Warner J., Forge V., Scheek R.M., Robillard G.T., Dobson C.M. (1998). Slow cooperative folding of a small globular protein HPr. Biochemistry. 37, 622-637.

149. Wang M., Tang Y., Sato S., Vugmeyster L., McKnight C.J., Raleigh D.P. (2003). Dynamic NMR line-shape analysis demonstrates that the villin headpiece subdomain folds on the microsecond time scale. JACS. 125, 60326033.

150. Wang Т., Zhu Y., Gai F. (2004). Folding of a three-helix bundle at the folding speed limit. J. Phys. Chem. B. 108, 3694-3697.

151. Щ 155. Wittung-Stafshede P., Lee J.C., Winkler J.R., Gray H.B. (1999). Cytochrome b562 folding triggered by electron transfer: approaching the speed limit for formation of a four-helix-bundle protein. Proc. Natl. Acad. Sci. USA. 96, 6587-6590.

152. Zhu Y., Alonso D.O., Maki K., Huang C.Y., Lahr S.J., Daggett V., Roder H., DeGrado W.F., Gai F. (2003).' Ultrafast folding of alpha-3-D: a de novo designed three-helix bundle protein. Proc. Natl. Acad. Sci. USA. 100, 1548615491.

153. Zana R. (1975). On the rate-determining step for helix-propagation in the helix-coil transition of polypeptides in solution. Biopolymers. 14, 2425-2428.