Бесплатный автореферат и диссертация по биологии на тему
Расчёт ядер сворачивания в глобулярных белках
ВАК РФ 03.00.02, Биофизика

Автореферат диссертации по теме "Расчёт ядер сворачивания в глобулярных белках"

на правах рукописи

ГАРБУЗИНСКИЙ СЕРГЕЙ АЛЕКСАНДРОВИЧ РАСЧЁТ ЯДЕР СВОРАЧИВАНИЯ В ГЛОБУЛЯРНЫХ БЕЛКАХ

03.00.02 - биофизика

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук

ПУЩИНО - 2006 г.

Работа выполнена в Институте белка РАН

Научный руководитель:

Официальные оппоненты:

кандидат физико-математических наук Галзитская Оксана Валериавовна

доктор химических наук Ефимов Александр Васильевич

кандидат физико-математических наук Ройтберг Михаил Абрамович

Ведущая организация:

Институт биофизики клетки РАН

Защита состоится 01 февраля 2006 г. в 13 часов 30 минут на заседании диссертационного совета Д 002.093.01 в Институте теоретической и экспериментальной биофизики РАН по адресу: 142290, г. Пущино Московской обл.. ул. Институтская, д 3, Институт теоретической и экспериментальной биофизики РАН.

С диссертацией можно ознакомиться в библиотеке Института теоретической и экспериментальной биофизики РАН.

Автореферат разослан 29 декабря 2005 г.

Учёный секретарь диссертационного совета кандидат физико-математических наук

Гй

Н. Ф. Ланина

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы.

Выяснение механизма самоорганизации белковых молекул - одна из важных и по сей день не решенных проблем биофизики. Помимо своей фундаментальной значимости, понимание механизма сворачивания белка имеет огромное значение для решения многих практических задач, таких как разработка лекарств и создание искусственных белков с заданными свойствами. Нарушение правильного сворачивания белков in vivo, а также часто сопутствующий этому процесс агрегации во многих случаях приводят к заболеваниям.

Ключевым этапом процесса сворачивания белка является формирование ядра сворачивания. В процессе сворачивания (или разворачивания) белковая молекула преодолевает свободноэнергетический барьер. Максимально нестабильное состояние белковой цепи на пути ее сворачивания называют переходным состоянием (иными словами, переходное состояние соответствует перевалу через свободноэнергетический барьер). Ядро сворачивания представляет собой сгруктурированную часть молекулы в переходном состоянии. Так как ядро сворачивания соответствует максимуму свободной энергии на пути сворачивания белка, скорость образования ядра сворачивания определяет скорость всего процесса сворачивания белковой молекулы. Таким образом, знание ядер сворачивания позволяет определить скорость сворачивания белка; найти пути его сворачивания; выяснить, образование каких структурных элементов лимитирует скорость сворачивания белковой молекулы.

Из-за того, что ядро сворачивания белковой молекулы отвечает максимуму свободной энергии и потому крайне нестабильно, исследовать его в эксперименте непросто. В настоящее время существует единственный экспериментальный подход к поиску ядер сворачивания - Ф-анализ Фёршта [Matouschek et al, 1990, Nature, 346, 440-445] и производные от него методы, суть которых сводится к введению в изучаемый белок множества точечных

мутаций и выявлению тех аминокислотных ых меняет

стабильность переходного состояния белка столь же сильно, как и стабильность нативного состояния.

Поскольку этот экспериментальный подход к определению ядер сворачивания очень трудоемок, полезно уметь предсказывать ядра сворачивания теоретически. В данной работе для расчета ядер сворачивания используется «ландшафтная» теоретическая модель (рис. 1), созданная в нашей лаборатории [вакШкауа & РткеШет, 1999, РИАБ, 96, 11299-11304]. В рамках этой модели процессы сворачивания и разворачивания белка преде твляются в виде движения по сети путей сворачивания/разворачивания на свободноэнергетическом ландшафте. Основываясь на этой модели, в данной работе мы определили ядра сворачивания в белках, для которых в настоящее время уже есть экспериментальные данные по ядрам сворачивания, чтобы сравнить теорию и эксперимент и таким образом выяснить возможности расчетов, основанных на «ландшафтной» модели. Кроме того, были сделаны предсказания локализации ядер сворачивания в нескольких белках, для которых экспериментальных данных по ядрам сворачивания пока еще нет, но они будут получены в ближайшее время.

Цель исследования:

Развитие методов предсказания ядер и скоростей сворачивания белков.

Научная новизна диссертационной работы. Впервые применен метод Монте-Карло для определения локализации ядер сворачивания в белках с известной пространственной структурой, а также для определения скоростей сворачивания белков в точке термодинамического равновесия. Оптимизирован основанный на методе динамического программирования подход к локализации ядер сворачивания в белках с известной пространственной структурой, а также к оценке эффективной величины свободноэнергетического барьера на пути сворачивания белка. В результате сравнения результатов расчета с экспериментальными данными показано, что оба метода (метод динамического программирования и метод Монте-Карло) позволяют удовлетворительно предсказывать ядра и скорости сворачивания глобулярных белков. Впервые проведено систематическое сравнение структур одних и тех

2

же белков, расшифрованных методами рентгеноструктурного анализа, с одной стороны, и ядерного магнитного резонанса, с другой, и найдены тонкие различия между такими структурами.

Практическая значимость диссертационной работы. Неплохая корреляция теории с экспериментом, полученная в данной работе, позволяет сделать вывод о том, что «ландшафтная» модель может быть использована для предсказания ядер и скоростей сворачивания белков с известной пространственной структурой. Данный метод поиска ядер сворачивания белка может найти применение в белковой инженерии, биоинформатике и биотехнологии.

Апробация работы. Материалы диссертации были представлены на международных конференциях: 12th International Conference on Intelligent Systems for Molecular Biology & 3rd European Conference on Computational Biology ISMB/ECCB 2004 (Glasgow, Great Britain, 2004), ESF Training Course on Molecular Interactions: New Frontiers for Computational Methods (Verona, Italy, 2002), "Exploring Protein Structure" conference (Haifa, Israel, 2005), International Moscow Conference on Computational Molecular Biology MCCMB'05 (Москва, Россия, 2005), the Workshop on the Structure and Function of Biomolecules (Bedlewo, Poland, 2004), Fifth Meeting on the Critical Assessment of Techniques for Protein Structure Prediction CASP5 (Asilomar, USA, 2002), Annual Meetings of International Research Scholars of the Howard Hughes Medical Institute (Vancouver, Canada, 2001; Palm Cove, Queensland, Australia, 2002; Tallinn, Estonia, 2004; Merida, Mexico, 2005); на российских конференциях: III Съезд биофизиков России (Воронеж, 2004), ежегодные научные конференции Института белка РАН (Пущино, 2001; 2002; 2003; 2004; 2005), а также на семинарах Европейской молекулярно-биологической лаборатории EMBL (Heidelberg, Germany, 2001), Института биохимии и биофизики Польской Академии наук (Warsaw, Poland, 2001), Гарвардского университета (Harvard, USA, 2005) и Университета Род-Айленд (Kingston, USA, 2005). Работа прошла апробацию на научных семинарах Института белка РАН (Пущино) и в Институте теоретической и экспериментальной биофизики РАН (Пущино).

3

Публикации. Основные результаты диссертационной работы опубликованы в 12 печатных работах, в том числе в 5 статьях в рецензируемых отечественных и международных научных журналах.

Структура диссертации. Диссертационная работа состоит из "Введения", пяти глав, "Заключения", "Выводов" и "Списка цитируемой литературы". Работу иллюстрируют 20 рисунков и 9 таблиц.

СОДЕРЖАНИЕ РАБОТЫ Введение

В данной работе для расчета ядер сворачивания используется созданная в нашей лаборатории «ландшафтная» модель \Galzitskaya & РткеЫет, 1999, РЫАБ, 96, 11299-11304], которая основывается на моделировании разворачивания белка с известной пространственной структурой. В рамках этой модели процессы сворачивания и разворачивания белка представляются в виде сети путей сворачивания/разворачивания на свободноэнсргетическом ландшафте. Поиск переходных состояний и ядер сворачивания в такой сети осуществляется либо методом динамического программирования, либо методом Монте-Карло. В данной диссертационной работе мы предсказали ядра сворачивания в 17 белках, для которых в настоящее время уже есть экспериментальные данные по ядрам сворачивания, чтобы сравнить теорию и эксперимент и выяснить возможности «ландшафтной» модели.

Описание модели

В рамках «ландшафтной» модели процесс сворачивания/разворачивания белка описывается как сеть путей сворачивания/разворачивания на свободноэнергетическом ландшафте (рис. 1). В данной работе мы рассматриваем поведение белка в точке термодинамического равновесия, то есть в условиях, когда свободные энергии нативного и полиостью развернутого состояний одинаковы. Пути сворачивания и разворачивания в этой точке совпадают.

Описываемый подход основан на моделировании разворачивания белка с известной пространственной структурой. Мы рассматриваем сеть путей

разворачивания, в которой каждый путь представляет собой упрощенное последовательное разворачивание белка (рис. 1). Каждый шаг на пути разворачивания состоит в исключении одного звена белковой цепи из нативной пространственной структуры белка (звено может состоять как из одного аминокислотного остатка, так и из нескольких, подряд идущих в цепи). Считается, что исключенные звенья образуют неупорядоченный клубок, т.е они теряют все невалентные взаимодейовия, но приобретают энтропию клубка, кроме той относительно небольшой ее доли, что затрачивается на замыкание образующихся неупорядоченных петель, выступающих из оставшейся глобулы (см. частично развернутые структуры на рис. 1) Следующим упрощением является предположение о том, что все оставшиеся в глобуле звенья сохраняют свое исходное расположение, а развернутые участки не сворачиваются в другую, ненативную структуру.

Рис. 1. Схема сети путей сворачивания/разворачивания белка на свободно энергетическом ландшафте. На схеме изображены нативная структура /(). полностью развернутое состояние // и несколько частично развернутых структур Л Развернутые участки цепи показаны штриховой линией: свернутые нативоподобные участки изображены сплошной линией в облаке точек, изображающем глобулу Вертикальные штриховые линии разделяют микрососгояния с разным числом V развернутых звеньев цепи Структуры с высокой свободной энергией изображены на темном фоне, структуры с низкой свободной энергией - на светлом фоне (чем ниже свободная энергия, тем светлее фон)

Еще одно (самое главное) упрощение состоит в том, что мы сосредотачиваем

наше внимание на переходных состояниях, т.е. на стабильности (точнее,

нестабильности) частично развернутых состояний, а не на подробном описании

движений цепи.

Свободная энергия каждой из структур вычисляется следующим образом.

Рассмотрим последовательное разворачивание нативной структуры цепи.

5

состоящей из L звеньев. У этой цепи есть нативная структура 1п, полностью развернутое состояние и множество промежуточных, частично развернутых структур /v, включающих v неупорядоченных звеньев и нативоподобную глобулярную часть из L-v звеньев (v = О для I0,v = L для IL, v = 1, ..., L- 1 для частично развернутых структур). Структуры с ненативоподобными глобулярными частями, согласно сказанному выше, не рассматриваются.

Свободная энергия структуры I представляется в виде

F(I) = n,xs-T[u,xa+ 2Х-Л, (1)

петлне!

где п/ - число атом-атомных контактов в нативоподобной части структуры I (контакты между ближайшими соседними по цепи аминокислотными остатками не учитываются, так как соседние остатки контактируют и в развернутом состоянии); е - энергия одного атом-атомного контакта (все контакты полагаются равными по энергии, а взаимодействие с растворителем -неявным образом учтенным в величине г); Т - температура; V/ - число аминокислотных остатков в развернутой части структуры /; а - разница энтропии между развернутым и свернутым состояниями аминокислотного остатка (для любого остатка мы принимаем а = 2.37?, согласно экспериментальной оценке [Privalov, 1979, Adv. Protein Chem., 33, 167-241], где R - газовая постоянная); S„emu - энтропия Флори [Flory, 1969, Statistical Mechanics of Chain Molecules, Interscience, New York], затраченная на замыкание неупорядоченной петли, выходящей из нативоподобной части структуры 1 (сумма берется по всем замкнутым неупорядоченным петлям, существующим в структуре Г). Таким образом, в расчет свободной энергии входит энергия контактов структурированной части молекулы, энтропия развернутой части молекулы и штраф за замыкание петель, выходящих из глобулы.

Как уже было отмечено, все расчеты свободных энергий в данной работе относятся к точке термодинамического равновесия между нативной структурой Iо и клубком /¿. В этой точке F(In) - F(It), т.е. энергия одного атом-атомного контакта ги температура Г подчиняются соотношению

g _ N

RT~ noa> &

где щ - число контактов в структуре нативного белка, а N - число аминокислотных остатков в белке. Следовательно, мы можем вычислить все

Щ) „ „ .

величины , пользуясь нативнои структурой белка и единственным RT

экспериментально определенным параметром - разницей энтропии между развернутым и свернутым состояниями аминокислотного остатка (а).

Таким образом, процессы сворачивания и разворачивания представлены в виде сети путей сворачивания/разворачивания (рис. 1). Поиск переходных состояний и ядер сворачивания на такой сети в данной работе осуществлялся двумя способами: 1) анализировалась полная, хотя и представленная в довольно грубом разрешении (см. ниже), сеть путей [Galzitskaya & Finkelstein, 1999, PNAS, 96, 11299-11304] с помощью метода динамического программирования и 2) анализировалась ограниченная выборка детально рассматриваемых путей сворачивания отдельной молекулы белка [Galzitskaya et al., 2000, Protein Science, 9, 580-586] с помощью метода Монте-Карло. У каждого из этих способов есть достоинства и недостатки. Метод динамического программирования позволяет исследовать всю сеть путей сворачивания/разворачивания, однако, чтобы завершить расчет за разумное время, приходится вводить некоторые ограничения: разбивать аминокислотную последовательность на звенья из нескольких аминокислотных остатков и ограничивать число петель в частично развернутых состояниях. Метод Монте-Карло не требует этих ограничений, но моделирует лишь отдельные пути (в данной работе для каждого белка проводилось 50 запусков по 108 Монте-Карловских шагов).

Чтобы понять, насколько хорошо «ландшафтная» модель описывает процесс сворачивания/разворачивания белка, и оценить возможности «ландшафтной» модели с точки зрения предсказания ядер сворачивания, результаты расчетов сравнивались с экспериментальными данными (с так

называемыми величинами Ф, показывающими вовлеченность аминокислотных остатков в ядро сворачивания, а также со скоростями сворачивания).

Расчет величин Ф и сравнение с экспериментом

Величина Ф, предложенная Фёрштом [Matouschek et al, 1990, Nature, 346, 440-445], для аминокислотного остатка г определяется как

_ Аг[ [''переходное — FpmGepHvmoe\

--— (3)

Аг^Рнативное — Fpaietynvmoe]

где ib[FmmMHoe — Рразвёрнутое] - изменение в разности свободных энергий между нативным и развернутым состояниями, индуцированное мутацией в аминокислотном остатке г, a iS,r\Fпереходное - Ррамрнутое) - индуцированное этой же мутацией изменение в разности свободных энергий между переходным и развернутым состояниями.

Считается, что величины Ф, полученные из эксперимента, показывают, насколько "нативно" окружение данного аминокислотного остатка в переходном состоянии. Обычно экспериментальные величины Ф интерпретируются в терминах нативных взаимодействий: Ф = 1 означает, что данный остаток уже в переходном состоянии образует все свои нативные взаимодействия (иными словами, этот остаток входит в ядро сворачивания); Ф = 0 означает, что этот остаток в переходном состоянии не имеет нативных взаимодействий вовсе (то есть, не входит в ядро сворачивания); дробные величины Ф (остаток в переходном состоянии образует лишь часть нативных взаимодействий) интерпретируются неоднозначно: либо этот остаток находится на краю ядра сворачивания, либо существует несколько альтернативных ядер сворачивания, и исследуемый остаток входит лишь в некоторые из них.

Величины Ф можно вычислить также теоретически. Согласно уравнению (1), величина Ar[F,mmMHoe - Рразвериутое] равна £хДг(Ио)> ГДе £ - ЭНерГИЯ ОДНОГО контакта, а АХпо) - изменение в числе контактов в нативном состоянии Lh вызванное мутацией остатка г (так как все нативные контакты предполагаются

равными, а полностью развернутое состояние 7/ считается не имеющим контактов).

Аналогично, hr\Fпереходное - Fразвёрнутое] = £Х < ДДи;) >П<~ ; ГДе <ЛЛ(Я/)>/7Г -

вызванное мутацией остатка г изменение в числе нативных контактов в переходном состоянии, усредненное по ансамблю переходных состояний. Это изменение вычисляется следующим образом:

<Лг(И/)>яс=5>(/#) Дг(„д (4)

/6/7Г

exp (-F(I)fRT) _ где /•(/ ) = ----больцмановская вероятность состояния Г

ыпс

в ансамбле переходных состояний, а Аг(и/#) - вызванное мутацией остатка г изменение числа нативных контактов в состоянии f.

Возникающие вследствие мутации величины Дг(л/) можно вычислить для каждого члена ансамбля переходных состояний мутантного белка. В этих расчетах используются координаты атомов немутированного белка. При этом предполагается, что мутация не изменяет структуру нативного состояния. Поэтому теория может рассматривать лишь те мутации, которые не добавляют новых, «расталкивающих» белок атомов. Именно такие мутации - и по тем же причинам - применяют обычно при экспериментальном исследовании ядер сворачивания [Matouschek et al, 1990, Nature, 346, 440-445]. Вычисленные величины

ф _ < Ar(ni)>nc

А,("о) (5)

можно сравнить с экспериментальными величинами Ф и оценить корреляцию теории с экспериментом.

На рисунке 2 представлены экспериментальные и теоретические величины Ф для двух исследованных белков (в диссертации эти данные представлены для всех исследованных белков): для В1 домена белка G (рис.2а) и для В1 домена белка L (рис. 26). Два представленных белка очень похожи по

Номер аминокислотного остатка Номер амин0кислотного остатка

Рис. 2. Теоретические (светлые кружки) и экспериментальные (черные кружки) величины Ф для В1 домена белка в (а) и для В1 домена белка I. (б).

пространственной структуре; несмотря на это, экспериментально найденное

ядро сворачивания в одном из них сдвинуто к С- (рис.2а), а в другом - к Ы-

концу цепи (рис. 26). Теория улавливает этот эффект, хотя для одного белка

коэффициент корреляции теории с экспериментом довольно высок (0.76; рис.

2а), а для другого - существенно ниже (коэффициент корреляции составляет

всего лишь 0.3; рис. 26). Следует отметить, что пространственная структура

первого белка решена методом рентгеноструктурного анализа (далее - РСА

структура), а пространственная структура второго - методом ядерного

магнитного резонанса (далее - ЯМР структура)

Коэффициент корреляции теоретических (полученных с помощью метода

динамического программирования) и экспериментальных величин Ф,

усредненный по всем исследованным 17 белкам, приведен в таблице 1 Он

невысок (0.38), когда при расчете величин Ф во внимание принимаются только

переходные состояния с минимальной свободной энергией [СаЬ^кауа &

РткеЫет, 1999, РЫАБ, 96, 11299-11304]. В ходе работы мы попытались

оптимизировать методику расчета, чтобы улучшить качество предсказаний. Во-

первых, мы проверили, как зависит качество предсказаний от тою,

принимаются ли во внимание лишь ядра сворачивания с минимальной

свободной энергией, или рассматривается весь ансамбль ядер сворачивания. В

последнем случае результат несколько улучшается. Во-вторых, мы добавили в

расчет атомы водорода: прежние расчеты были сделаны лишь по неводородным

атомам. Результат практически не улучшился. В-третьих, мы определили

10

оптимальный (для поиска ядер сворачивания) размер звена Он практически совпал со средним размером персистентного участка в полипептидах - 5 аминокислотных остатков [Flory, 1969, Statistical Mechanics of Chain Molecules, Interscience, New York], Результат еще немного улучшился: коэффициент корреляции достиг 0.54.

Разделив белки по методу определения их пространственной структуры, мы обнаружили, что корреляция теории с экспериментом намного лучше для рентгеновских структур, чем для структур, решенных методом ЯМР (см. таблицу 1).

Таблица 1. Усредненные коэффициенты корреляции экспериментальных и теоретических величин Ф при исследовании сети путей сворачивания/разворачивания методом динамического программирования- для всех 17 исследованных белков; для 11 белков, структуры которых решены методом РСА; для 6 белков, структуры которых решены методом ЯМР.

Все белки РСА ЯМР

Ядра сворачивания с минимальной свободной энергией 0.38±0.07 0.45 0.28

Полный ансамбль ядер сворачивания 0.45±0.08 0.57 0.22

Структура без атомов водорода 0.45±0.08 0.57 0.22

Структура с атомами водорода 0.46±0.08 0.64 0.15

Минимальный размер звена 0.46±0.08 0.64 0.15

Размер звена 5 аминокислотных остатков 0.54±0.07 0.65 0.34 j

Таким образом, метод динамического программирования в рамках «ландшафтной» модели действительно позволяет локализовать ядра сворачивания в белковых структурах. Было сделано предсказание ядер сворачивания в нескольких белках, кинетика самоорганизации которых изучается в настоящее время, но локализация ядер сворачивания в которых пока неизвестна. На рисунке 3 представлены теоретически вычисленные величины Ф для апомиоглобина кашалота, ядро сворачивания которого экспериментально исследуется в нашей лаборатории в настоящее время. Наибольшие величины Ф предсказываются для аминокислотных остатков в В, С, О и Е спиралях апомиоглобина.

Номер аминокислотного остатка

Рис. 3. Предсказанные с помощью «ландшафтной» модели величины Ф для апомиоглобина (анализ сети путей сворачивания/разворачивания проводился методом динамического программирования). Для всех аминокислотных остатков моделировалась му тация на остаток глицина. Если остаток является глицином в белке дикого типа, то в качестве величины Ф для него представлена вероятность Р(/) того, что этот остаток является структурированным в ансамбле переходных состояний. Прямоугольники над профилем показывают расположение а-спиралей в нативной структуре, а буквы в них - стандартные обозначения этих спиралей.

На рисунке 4 показан фрагмент кинетики сворачивания молекулы белка (в данном случае В1 домена белка G), промоделированной с помощью метода Монте-Карло Фрагмент иллюстрирует переход через свободноэнергетический барьер (переходное состояние отмечено стрелкой) и достижение нативного состояния. По оси абсцисс отложено число Монте-Карловских шагов. Каждый шаг моделируется следующим образом. Случайным образом выбирается один из аминокислотных остатков. При этом если остаток был нативным, он может «развернуться», если развернутым - «свернуться». Вычисляется изменение свободной энергии в случае такого элементарного шага. Если свободная энергия падает, то такой элементарный шаг всегда принимается; если же свободная энергия растет, то такой элементарный шаг принимается с вероятностью exp[-AF/RT] (стандартный критерий Метрополиса [.Metropolis et al., 1953, J. Chem. Phys., 96, 768-780]). Для каждого белка проводилось 50 запусков по 108 шагов, соответственно было найдено 50 ядер сворачивания и для каждого были вычислены величины Ф, которые затем усреднялись по 50 запускам и сравнивались с экспериментальными величинами Ф. Следует

отметить, что из 17 белков только 10 свернулись методом Монте-Карло за 108 шагов.

нативное

Рис. 4. Фрагмент кинетики сворачивания отдельной молекулы белка (В1 домена белка б), промоделированной с помощью метода Монте-Карло Показанный фрагмент соответствует моменту формирования переходного состояния (отмечено стрелкой) на пути сворачивания и переходу через свободноэнергетический барьер, а затем образованию нативного состояния. Тонкая кривая - изменение свободной энергии в процессе сворачивании белка; толстая кривая - число структурированных остатков (В1 домен белка в состоит из 56 аминокислотных остатков).

В таблице 2 приведены коэффициенты корреляции экспериментальных величин Ф с теоретическими, вычисленными с помощью метода Монте-Карло и метода динамического программирования (для 10 белков, которые методом Монте-Карло свернулись за 108 шагов). Корреляция теории с экспериментом выше в случае метода динамического программирования. Однако для обоих методов предсказания, основанные на рентгеновских структурах, являются более успешными по сравнению с предсказаниями, основанными на ЯМР структурах.

Таблица 2. Коэффициенты корреляции экспериментальных и теоретических величин Ф при исследовании путей сворачивания/разворачивания методом динамического программирования и методом Монте-Карло (10 белков).

Все белки РСА ЯМР

Метод динамического программирования 0.52±0.10 0.68 0.28

Метод Монте-Карло 0.31±0.11 0.52 | 0.00

Из двух приведенных выше таблиц видно, что ядра сворачивания предсказываются лучше для белков, структуры которых получены методом РСА, чем для тех белков, структуры которых решены методом ЯМР. Мы проверили этот результат на тех белках из нашей базы данных, для которых есть структуры, решенные обоими методами (таких белков 7). Результаты приведены в таблице 3. В этом случае мы снова видим, что теоретические

Таблица 3. Коэффициенты корреляции экспериментальных и теоретических величин Ф для 7 белков, структуры которых решены обоими методами (как РСА, так и ЯМР) Так как авторы ЯМР структуры обычно указывают не одну, а несколько ЯМР моделей, расчеты делались либо по первой модели, либо по всем моделям (а затем величины Ф усреднялись по всем моделям).

РСА ЯМР

Первая ЯМР модель Все ЯМР модели

0.73±0.05 0.43±0.14 0.49±0.13

величины Ф, полученные с помощью рентгеновских структур, коррелируют с экспериментальными Ф лучше (здесь коэффициент корреляции составляет 0.73), чем при использовании ЯМР структур (где коэффициент корреляции равен 0.43, если использовать первую приведенную в РЭВ файле ЯМР модель, и 0.49, если вычислить Ф, исходя из каждой ЯМР модели, а затем усреднить величины Ф по всему ансамблю ЯМР моделей).

Сравнение структур, решенных методом рентгеноструктурного анализа и методом ЯМР

Существуют ли различия между РСА и ЯМР структурами, которые могут повлиять на расчет величин Ф9 Поскольку при вычислении свободной энергии

мы рассчитываем число контактов каждого аминокислотного остатка на заданном расстоянии, возможные различия в плотности контактов могут повлиять на подсчет свободной энергии.

Чтобы сравнить РСА и ЯМР структуры одних и тех же белков (и, таким образом, избежать всех проблем, которые возникают при сравнении РСА и ЯМР структур различных белков), на основе базы данных РБВ была создана база данных пространственных структур белков, решенных обоими методами. Таких белков оказалось 60 (база данных находится по адресу. http://megrez.protres.ra/~mlobanov/prot-base/base-pair.zip): таким образом, база данных состоит из 60 РСА и 60 ЯМР структур этих белков.

Для каждого аминокислотного остатка в РСА и в ЯМР структурах было вычислено число контактов на заданном контактном расстоянии. На рисунке 5а приведена разница в среднем числе контактов на остаток (ЯМР минус РСА) в зависимости от контактного расстояния. Видно, что на некоторых контактных расстояниях между ЯМР и РСА структурами существуют достоверные 1 о

-1 о

2 3 4 5 6 7 8 Контактное расстояние, А

-3 -2 -1

Энергия водородной связи, жал/моль

Рис. 5. (а) Разница в числе контактов на остаток (между ЯМР и РСА структурами) в зависимости от контактного расстояния: для всех аминокислотных остатков (сплошная линяя), для внутренних (доступная поверхность равна О А2) аминокислотных остатков (штриховая линия) и для поверхностных (доступная поверхность составляет более 60 А2) аминокислотных остатков (штрихпунктирная линия), (б) Распределения водородных связей основной цепи в РСА (светлые квадраты) и в ЯМР (черные кружки) структурах Доступная поверхность аминокислотных остатков, а также водородные связи и их энергия найдены с помощью стандартной программы DSSP [Kabsch & Sander, 1983, Biopolymers, 22, 2577-2637\.

различия в числе контактов на остаток. Особенно велики эти различия д 1Я скрытых от воды аминокислотных остатков белковой глоб> ш. хотя сходные различия наблюдаются и для поверхностных остатков.

Отдельно были проанализированы водородные связи в РСА и ЯМР структурах. Распределения водородныч связей по энергиям в РСА и ЯМР структурах показаны на рис. 56. Видно, что РСА структуры (светлые кружки) имеют больше более «сильных» водородных связей (с энергиями -2 - -2 5 ккал/моль, согласно оценке, полученной из пространственной структуры с помощью стандартной программы П^Р). а в ЯМР структ\ра\ (темные кр\жки) больше более «слабых» водородныч связей (-0.8 - -1.3 ккал/моль) Быт оценена также доля водородных связей, которые в РСА и ЯМР стр\кт\ра\ совпадают (то есть, один и тот же донор образует водородную связь с одним и тем же акцептором и в РСА, и в ЯМР структуре). Доля совпадающих водородных связей варьирует от 0.3 до 0.7 в зависимости от порогового значения энергии водородной связи.

Таким образом, между РСА и ЯМР структурами существуют различия в плотности контактов, а также в энергии водородных связей. Кроме того, доля водородных связей, совпадающих в РСА и в ЯМР структурах. составляет не более 70%.

Расчет скоростей сворачивания и сравнение с экспериментом

В случае, когда анализ сети путей сворачивания/разворачивания проводился с помощью метода динамического программирования, мы вычисляли эффективную величину свободной энергии барьера:

где // - полностью развернутое состояние белковой цепи Эта теоретически вычисленная величина свободной энергии барьера должна коррелировать с логарифмом экспериментально измеренного времени сворачивания (рис 6а)

Метод Монте-Карло позволяет получать время сворачивания отдельной молекулы, измеренное в числе Монте-Карловских шагов (см рис 4) В

(6)

качестве теоретически рассчитанного времени сворачивания белка мы использовали время, за которое свернулась половина молекул (то есть, 25 из 50 проведенных запусков привели к образованию нативной структуры [Galzitskaya & Finkelstein, 1995, Protein Eng., 8, 883-892]).

Теоретически вычисленные величины (величина

свободноэнергетического барьера, вычисленная с помощью метода динамического программирования, и время сворачивания, вычисленное с помощью метода Монте-Карло), а также экспериментально измеренное время сворачивания для исследованных белков приведены в таблице 4.

Таблица 4. Теоретически вычисленные и экспериментально измеренные времена сворачивания для 17 исследованных белков

Название белка Величина свободно-энергетического барьера P(ITC)/RT, вычисленная с помощью метода динамического программирован« я 1^1/2), десятичный логарифм числа шагов, за которое в компьютерном эксперименте сворачивается половина молекул Десятичный логарифм экспериментально измеренного времени сворачивания в точке термодинамического равновесия

СИеУ 12.2 7.6 0.7

Шй)! 0 домен фибронектина 13.0 6.8 0.2

8*>7с1 14.5 6.8 -0.2

вгс БНЗ домен 15.1 5.9 0.1

ЭНЗ домен а-спектрина 15.8 7.3 1.3

В1 домен белка Л 16.6 7.8 0.8

В1 домен белка О 17.4 7.4 0.3

домен 1 виллина 17.8 7.0 0.1

вис1 18.0 >8.0 0.3

ингибитор химотрипсина С1-2 18.4 7.6 1.6

барназа 18.6 8.0 1.9

1ЛА 19.9 >8.0 1.2

барстар 20.6 >8.0 0.6

РКВР12 22.7 >8.0 2.3

86 23.2 >8.0 1.6

Т1127 домен титана 24.5 >8.0 3.1

П\1&13 домен тенасцина 25.6 >8.0 1.8

Корреляция теории с экспериментом показана на рис. 6 Рис. 6а демонстрирует корреляцию экспериментально измеренного времени сворачивания и величины свободноэнергетического барьера (вычисленной по всему ансамблю переходных состояний с помощью метода динамического программирования); на рис. 66 показана корреляция экспериментально измеренного и теоретически (сворачиванием 50 молекул белка методом Монте-Карло) полученного времени сворачивания. На графике, который относится к методу динамического программирования, темными точками показаны белки, не свернувшиеся методом Монте-Карло за 108 шагов. Не свернулись, в основном, белки с высоким свободноэнергетическим барьером. Коэффициенты корреляции примерно одинаковы для обоих методов, составляя 0.73 при использовании метода динамического программирования и 0.70 при использовании метода Монте-Карло. Однако для совокупности только тех белков, что сворачиваются методом Монте-Карло быстрее, чем за 108 шагов, корреляция для метода динамического программирования заметно хуже (коэффициент корреляции равен 0.48), чем для метода Монте-Карло (коэффициент корреляции 0.70).

Рис. 6. (а) Корреляция между вычисленной (метод динамического программирования) свободной энергией переходных состояний и экспериментально измеренным временем сворачивания. Черные кружки соответствуют белкам, которые методом Монте-Карло не свернулись за 108 МК шагов, белые - свернувшимся методом Монте-Карло (б) Корреляция между вычисленным (с помощью метода Монте-Карло) и экспериментально измеренным временами сворачивания.

выводы

1. Показано, что ядро сворачивания белка можно локализовать в известной пространственной структуре этого белка, моделируя ее сворачивание как методом динамического программирования, так и методом Монте-Карло.

2. Показано, что такое моделирование позволяет также предсказывать скорость сворачивания белка.

3. Показано, что развитые нами методы позволяют существенно более точно предсказать локализацию ядер сворачивания для белковых структур, решенных методом рентгеноструктурного анализа, чем для структур, решенных методом ЯМР.

4. Выявлены статистически достоверные различия в числе контактов на остаток и в энергии водородных связей между структурами одних и тех же белков, полученными методом рентгеноструктурного анализа и методом ЯМР.

Основные результаты диссертации опубликованы в работах:

1. Гарбузинский С. А., Финкелыптейн А. В, Галзитская О В. (2005). К вопросу о предсказании ядер сворачивания в глобулярных белках. Молекучярная биология 39. 1032-1041.

2. Мельник Б. С , Гарбузинский С. А., Лобанов M Ю., Галзитская О В (2005). Различия между белковыми структурами, определенными с помощью рентгеноструктурного анализа и ядерного магнитного резонанса Мочекучярная биочогия 39,129-138

3. Galzitskaya О. V., Garbuzynskiy S. О and Finkelstein А V. (2005) Theoretical study of protein folding: outlining folding nuclei and estimation of protein folding rates Journal of Physics. Condensed Matter 17, S1539-S1551

4. Garbuzynskiy S О., Finkelstein A. V and Galzitskaya О. V. (2004). Outlining folding nuclei in globular proteins. J Mol Biol 336, 509-525.

5. Garbuzynskiy S О., Melnik В S , Lobanov M. Yu , Finkelstein A V. and Galzitskaya О V. (2005). Comparison of X-ray and NMR structures- is there a systematic difference in residue contacts between X-ray- and NMR-resolved protein structures'5 Proteins 60, 139147.

6. Гарбузинский С. А., Финкелыптейн А. В, Галзитская О В. (2004) Расчет ядер сворачивания в глобулярных белках III съезд биофизиков России Тезисы докладов, I. 19-20.

7 Мельник, Б С., Гарбузинский С А., Лобанов, М. Ю, Финкелынтейн А В., Галзитская О В. (2004). В чем различие между структурами белков, полученными при помощи рентгеноструктурного анализа и ядерного магнитного резонанса9 III съезд биофизиков России. Тезисы докладов, 1,72-73

8. Baryshnikova Е. N, Melnik В. S., Ivankov D N , Garbuzynskiy S О., Galzitskaya О. V., Semisotnov G V, Bychkova V E. and Finkelstein A V. (2005) Simultaneous outlining of the folding nucleus and folding intermediate in three-state protein folding. 2005 Meeting of International Research Scholars 41

9. Finkelstein A V , Galzitskaya О V , Ivankov, D N., Bogatyreva N S , Garbuzynskiy S О . Lobanov, M. Yu., Dolgikh D A and Oliveberg M. (2002) Protein folding: theoretical and experimental study. Fifth Meeting on the Critical Assessment of Techniques for Protein Structure Prediction CASP5. Poster abstracts, A, 202.

10 Finkelstein A. V., Ivankov D. N.. Garbuzynskiy S. O. and Galzitskaya О. V. (2005) Prediction of protein folding rates. Proceedings of the International Moscow Conference on Computational Molecular Biology 101-103

11. Finkelstein A V., Ivankov D N., Garbuzynskiy S О and Galzitskaya О V (2004) Prediction of protein-folding rates from tertiary, secondary, and primary protein structure 2004 Meeting of International Research Scholars. 24.

12. Galzitskaya О. V., Garbuzynskiy S. О , Melnik В S . Lobanov M. Yu. and Finkelstein A V. (2004). Comparison of X-ray and NMR protein structures. The 1st Structural Biomformatics Meeting at ISMB/ECCB2004 15-16

Заказ № 1404 Тираж: 100 экз.

ООО «11-й ФОРМАТ» ИНН 7726330900 Москва, Варшавское ш., 36 (095)975-78-56 (095) 747-64-70 www.autoreferat.ru

Принято к исполнению 28/12/2005 Исполнено 28/12/2005

Содержание диссертации, кандидата физико-математических наук, Гарбузинский, Сергей Александрович

Введение.

Глава 1. Обзор литературы.

1.1. Открытие явления самоорганизации белка.

1.2. Открытие одностадийного перехода («все или ничего») в кинетике.

1.3. Экспериментальное изучение ядер сворачивания.

1.4. Теоретические подходы к изучению самоорганизации белка.

Глава 2. Описание модели.

2.1. Условия моделирования: точка термодинамического равновесия.

2.2. Сеть путей сворачивания/разворачивания.

2.3. Оценка свободной энергии.

2.4. Поиск переходных состояний на путях разворачивания белка.

2.5. Анализ сети путей сворачивания/разворачивания белка при помощи метода динамического программирования: поиск оптимального переходного состояния.

2.6. Анализ сети путей сворачивания/разворачивания белка при помощи метода динамического программирования: полный набор возможных переходных состояний

2.7. Ограничения, присущие поиску переходных состояний методом динамического программирования.

2.8. Поиск переходных состояний методом Монте-Карло.

Глава 3. Предсказание локализации ядер сворачивания и сравнение результатов расчёта с экспериментальными данными.

3.1. Вычисление величин Ф.

3.2. Создание базы данных белков с экспериментально исследованной локализацией ядер сворачивания.

3.3. Сравнение экспериментально полученных величин Ф с вычисленными при помощи метода динамического программирования.

3.4. Предсказание ядер сворачивания в белках, для которых экспериментальных данных по ядрам сворачивания пока нет.

3.5. Сравнение качества предсказаний ядер сворачивания при использовании метода динамического программирования и метода Монте-Карло.

Глава 4. Сравнение контактов в структурах белков, расшифрованных методами рентгеноструктурного анализа и ЯМР.

4.1. Создание базы данных.

4.2. Контакты аминокислотных остатков в ЯМР и РСА структурах.

4.3. Анализ водородных связей в РСА и ЯМР структурах.

Глава 5. Расчёт скоростей сворачивания и сравнение результатов расчёта с экспериментальными данными.

5.1. Оценка скорости сворачивания белка по вычисленной свободной энергии переходного состояния.

5.2. Вычисление скоростей сворачивания методом Монте-Карло.

Введение Диссертация по биологии, на тему "Расчёт ядер сворачивания в глобулярных белках"

Выяснение механизма самоорганизации белковых молекул - одна из важных и по сей день не решенных проблем биофизики. Помимо своей фундаментальной значимости, понимание механизма сворачивания белка имеет огромное значение для решения многих практических задач, таких как разработка лекарств и создание искусственных белков с заданными свойствами. Нарушение правильного сворачивания белков in vivo, а также часто сопутствующий этому процесс агрегации во многих случаях приводят к заболеваниям.

Ключевым этапом процесса сворачивания белка является формирование ядра сворачивания. В процессе сворачивания (или разворачивания) белковая молекула преодолевает свободноэнергетический барьер. Максимально нестабильное состояние белковой цепи на пути ее сворачивания называют переходным состоянием. Ядро сворачивания представляет собой структурированную часть молекулы в переходном состоянии. Так как ядро сворачивания соответствует максимуму свободной энергии на пути сворачивания белка, то скорость образования ядра сворачивания определяет скорость всего процесса сворачивания белковой молекулы. Таким образом, знание ядер сворачивания позволяет:

1) определить скорость сворачивания белка;

2) найти пути его сворачивания;

3) выяснить, образование каких структурных элементов лимитирует скорость сворачивания белковой молекулы.

Из-за того, что ядро сворачивания белковой молекулы отвечает максимуму свободной энергии и потому крайне нестабильно, исследовать его в эксперименте непросто. В настоящее время существует единственный экспериментальный подход к поиску ядер сворачивания -Ф-анализ Фёршта [.Matouschek et al., 1990]. Суть Ф анализа - введение в изучаемый белок точечных мутаций и выявлению тех аминокислотных остатков, замена которых меняет стабильность переходного состояния белка столь же сильно, как и стабильность нативного состояния.

Поскольку этот экспериментальный подход к определению ядер сворачивания очень трудоемок, полезно уметь предсказывать ядра сворачивания теоретически. В данной работе для расчета ядер сворачивания используется «ландшафтная» теоретическая модель, созданная в нашей лаборатории [Galzitskaya and Finkelstein, 1999]. В рамках этой модели процессы сворачивания и разворачивания белка представляются в виде движения по сети путей сворачивания/разворачивания на свободноэнергетическом ландшафте. Поиск переходных состояний в такой сети в данной работе осуществляется методами динамического программирования и Монте-Карло.

Целью работы является развитие методов предсказания ядер и скоростей сворачивания белков. Задачи данной работы следующие:

1) определение потенциальных возможностей «ландшафтной» модели с точки зрения предсказания ядер и скоростей сворачивания;

2) сравнение результатов использования методов динамического программирования и Монте-Карло в рамках «ландшафтной» модели для предсказания ядер сворачивания и скоростей сворачивания белка.

Основываясь на «ландшафтной» модели, в данной работе мы определили ядра сворачивания в белках, для которых в настоящее время уже есть экспериментальные данные по ядрам сворачивания, чтобы сравнить теорию и эксперимент и таким образом выяснить возможности расчетов, основанных на «ландшафтной» модели. Кроме того, были сделаны предсказания локализации ядер сворачивания в нескольких белках, для которых экспериментальных данных по ядрам сворачивания пока еще нет, но они будут получены в ближайшее время.

Заключение Диссертация по теме "Биофизика", Гарбузинский, Сергей Александрович

ВЫВОДЫ

1. Показано, что ядро сворачивания белка можно локализовать в известной пространственной структуре этого белка, моделируя ее сворачивание как методом динамического программирования, так и методом Монте-Карло.

2. Показано, что такое моделирование позволяет также предсказывать скорость сворачивания белка.

3. Показано, что развитые нами методы позволяют существенно более точно предсказать локализацию ядер сворачивания для белковых структур, решенных методом рентгеноструктурного анализа, чем для структур, решенных методом ЯМР.

4. Выявлены статистически достоверные различия в числе контактов на остаток и в энергии водородных связей между структурами одних и тех же белков, полученными методом рентгеноструктурного анализа и методом ЯМР.

Данная работа выполнена в лаборатории физики белка Института белка РАН.

Выражаю глубокую благодарность моему научному руководителю, Оксане Валериановне Галзитской, за неоценимые знания и умения, которые она мне передала, неизменное внимание и поддержку, а также неоднократные и неустанные обсуждения моей работы.

Искренне благодарю Алексея Витальевича Финкельштейна за плодотворное обсуждение моей работы, ценные советы и огромные знания, которые я приобрёл в результате общения с ним.

Я очень признателен всем сотрудникам лаборатории физики белка ИБ РАН за доброжелательность, теплоту, участие и помощь.

Материалы диссертации изложены в следующих работах:

Гарбузинский С. А., Финкельштейн А. В., Галзитская О. В. (2005). К вопросу о предсказании ядер сворачивания в глобулярных белках. Молекулярная биология. 39, 1032-1041.

Мельник Б. С., Гарбузинский С. А., Лобанов М. Ю., Галзитская О. В. (2005). Различия между белковыми структурами, определенными с помощью рентгеноструктурного анализа и ядерного магнитного резонанса. Молекулярная биология. 39, 129-138. Galzitskaya О. V., Garbuzynskiy S. О. and Finkelstein А. V. (2005). Theoretical study of protein folding: outlining folding nuclei and estimation of protein folding rates. Journal of Physics: Condensed Matter. 17, S1539-S1551.

Garbuzynskiy S. O., Finkelstein A. V. and Galzitskaya О. V. (2004). Outlining folding nuclei in globular proteins. J. Mol. Biol. 336, 509-525. Garbuzynskiy S. O., Melnik B. S., Lobanov M. Yu., Finkelstein A. V. and Galzitskaya О. V. (2005). Comparison of X-ray and NMR structures: is there a systematic difference in residue contacts between X-ray- and NMR-resolved protein structures? Proteins. 60, 139-147.

Гарбузинский С. А., Финкельштейн А. В., Галзитская О. В. (2004). Расчет ядер сворачивания в глобулярных белках. III съезд биофизиков России. Тезисы докладов, I, 19-20.

Мельник, Б. С., Гарбузинский С. А., Лобанов, М. Ю., Финкельштейн А. В., Галзитская О. В. (2004). В чем различие между структурами белков, полученными при помощи рентгеноструктурного анализа и ядерного магнитного резонанса? III съезд биофизиков России. Тезисы докладов, I, 72-73.

Baryshnikova Е. N., Melnik В. S., Ivankov D. N., Garbuzynskiy S. О., Galzitskaya О. V., Semisotnov G. V., Bychkova V. E. and Finkelstein A. V. (2005). Simultaneous outlining of the folding nucleus and folding intermediate in three-state protein folding. 2005 Meeting of International Research Scholars, 41.

9. Finkelstein A. V., Galzitskaya O.V., Ivankov, D. N., Bogatyreva N. S., Garbuzynskiy S. O., Lobanov, M. Yu., Dolgikh D. A. and Oliveberg M. (2002). Protein folding: theoretical and experimental study. Fifth Meeting on the Critical Assessment of Techniques for Protein Structure Prediction CASP5. Poster abstracts, A, 202.

10. Finkelstein A. V., Ivankov D. N., Garbuzynskiy S. O. and Galzitskaya O. V. (2005). Prediction of protein folding rates. Proceedings of the International Moscow Conference on Computational Molecular Biology. 101-103.

11. Finkelstein A. V., Ivankov D. N., Garbuzynskiy S. O. and Galzitskaya O. V. (2004). Prediction of protein-folding rates from tertiary, secondary, and primary protein structure. 2004 Meeting of International Research Scholars, 24.

12. Galzitskaya O. V., Garbuzynskiy S. O., Melnik B. S., Lobanov M. Yu. and Finkelstein A. V. (2004). Comparison of X-ray and NMR protein structures. The 1st Structural Bioinformatics Meeting at ISMB/ECCB2004. 15-16.

ЗАКЛЮЧЕНИЕ

В представленной диссертационной работе путём сравнения результатов расчёта с экспериментальными данными продемонстрированы возможности «ландшафтной» модели для предсказания ядер и скоростей сворачивания глобулярных белков с известной пространственной структурой.

Оптимизирован основанный на методе динамического программирования (в рамках «ландшафтной» модели) подход к поиску ядер сворачивания; этот же подход впервые применён для оценки эффективной величины свободноэнергетического барьера на пути сворачивания белка. Впервые применен метод Монте-Карло в рамках «ландшафтной» модели для поиска ядер сворачивания. Сравнение результатов расчета с экспериментальными данными показало, что оба метода (метод динамического программирования и метод Монте-Карло) в рамках «ландшафтной» модели позволяют удовлетворительно предсказывать ядра и скорости сворачивания глобулярных белков. Развитые в данной работе методы позволяют существенно более точно предсказать локализацию ядер сворачивания для белковых структур, решенных методом рентгеноструктурного анализа, чем для структур, решенных методом ядерного магнитного резонанса. Описанный в данной работе подход к поиску ядер сворачивания белка может найти применение в белковой инженерии, биоинформатике и биотехнологии.

Кроме того, впервые проведено систематическое сравнение структур одних и тех же белков, расшифрованных методами рентгеноструктурного анализа, с одной стороны, и ядерного магнитного резонанса, с другой, и найдены тонкие, но достоверные различия между такими структурами.

Библиография Диссертация по биологии, кандидата физико-математических наук, Гарбузинский, Сергей Александрович, Пущино

1. Ахо А., Хопкрофт Дж. и Ульман Дж. (1979). Построение и анализ вычислительных алгоритмов. М.: Мир, 536 с.

2. Галзитская О. В. (2002). Чувствительность пути сворачивания к деталям аминокислотной последовательности. Молекулярная биология. 36, 386-390.

3. Галзитская О. В., Иванков Д. Н. и Финкелыитейн А. В. (2001). Нуклеация и скорость сворачивания в белках. Молекулярная биология. 35,708-717.

4. Ландсберг П. (1971). Задачи по термодинамике и статистической физике. М.: Мир, 503 с.

5. Финкелыитейн А. В. и Бадретдинов А. Я. (1997). Физические причины быстрой самоорганизации стабильной пространственной структуры белков: решение парадокса Левинталя. Молекулярная биология. 31, 469-477.

6. Флори П. (1971). Статистическая механика цепных молекул. М.: Мир, 440 с.

7. Abkevich V. I., Gutin А. М. and Shakhnovich Е. I. (1994). Specific nucleus as a transition state for protein folding: an evidence from lattice model. Biochemistry. 33, 10026-10036.

8. Aim E. and Baker D. (1999). Prediction of protein-folding mechanisms from free-energy landscapes derived from native structures. Proc. Natl. Acad. Sci. USA. 96, 11305-11310.

9. Aim E., Morozov A. V., Kortemme T. and Baker D. (2002). Simple physical models connect theory and experiment in protein folding kinetics. J. Mol. Biol. 322, 463-476.

10. Altschul S. F., Gish W., Miller W., Myers E. W. and Lipman D. J. (1990). Basic local alignment search tool. J. Mol. Biol. 215, 403-410.

11. Anfinsen C. B. (1973). Principles that govern the folding of protein chains. Science. 181, 223-230.

12. Anfinsen C. B., Haber E., Sela M. and White F. H. (1961). The kinetics of formation of native ribonuclease during oxidation of the reduced polypeptide chain. Proc. Natl. Acad. Sci. USA. 47, 1309-1314.

13. Baker D. (2000). A surprising simplicity to protein folding. Nature. 405, 39-42.

14. Brooks C. L. Ill, Gruebele M., Onuchic J. N. and Wolynes P. G. (1998). Chemical physics of protein folding. Proc. Natl. Acad. Sci. USA. 95, 11037-11038.

15. Bulaj G. and Goldenberg D. P. (2001). Phi-values for BPTI folding intermediates and implications for transition state analysis. Nature Struct. Biol. 8, 326-330.

16. Burton R. E., Huang G. S., Daugherty M. A., Calderoni T. L. and Oas T. G. (1997). The energy landscape of a fast-folding protein mapped by Ala—»Gly substitutions. Nat. Struct. Biol. 4, 305-310.

17. Caflisch A. and Karplus M. (1995). Acid and thermal denaturation of barnase investigated by molecular dynamics simulations. J. Mol. Biol. 252, 672-708.

18. Capaldi A. P., Kleanthous C. and Radford S. E. (2002). Im7 folding mechanism: misfolding on a path to the native state. Nature Struct. Biol. 9, 209-216.

19. Carter P. J., Winter G., Wilkinson A. J. and Fersht A. R. (1984). The use of double mutants to detect structural changes in the active site ofthe tyrosyl-tRNA synthetase (Bacillus stearothermophilus). Cell. 38, 835-840.

20. Choe S. E., Li L., Matsudaira P. T., Wagner G. and Shakhnovich E. I. (2000). Differential stabilization of two hydrophobic cores in the transition state of the villin 14T folding reaction. J. Mol. Biol. 304, 99115.

21. Choe S. E., Matsudaira P. T., Osterhout J., Wagner G. and Shakhnovich E. I. (1998). Folding kinetics of villin 14T, a protein domain with a central beta- sheet and two hydrophobic cores. Biochemistry, 37, 1450814518.

22. Clarke J., Hamill S. J. and Johnson C. M. (1997). Folding and stability of a fibronectin type III domain of human tenascin. J. Mol. Biol. 270, 771-778.

23. Clementi C., Jennings P. A. and Onuchic J. N. (2000). How native-state topology affects the folding of dihydrofolate reductase and interleukin-ip. Proc. Natl. Acad. Sci USA. 97, 5871-5876.

24. Cota E. and Clarke J. (2000). Folding of beta-sandwich proteins: three-state transition of a fibronectin type III module. Protein Sci. 9, 112-120.

25. Cota E., Steward A., Fowler S. and Clarke J. (2001). The folding nucleus of a fibronectin type III domain is composed of core residues of the immunoglobulin-like fold. J. Mol. Biol. 305, 1185-1194.

26. Daggett V., Li A., Itzhaki L. S., Otzen D. E. and Fersht A. R. (1996). Structure of the transition state for folding of a protein derived from experiment and simulation. J. Mol. Biol. 257, 430-440.

27. Davis R., Dobson C. M. and Vendruscolo M. (2002). Determination of the structures of distinct transition state ensembles for a beta-sheet peptide with parallel folding pathways. J. Chem. Phys. 117, 9510-9517.

28. Dill K. A. and Chan H. S. (1997) From Levinthal to pathways to funnels. Nat. Struct. Biol 4, 10-19.

29. Dobson C. M. and Karplus M. (1999). The fundamentals of protein folding: bringing together theory and experiment. Curr. Opin. Struct. Biol 9,92-101.

30. Du R., Pande V. S., Grosberg A. Y., Tanaka T. and Shakhnovich E. I. (1998). On the transition coordinate for protein folding. J. Chem. Phys. 108, 334-350.

31. Fersht A. R. (1995). Characterizing transition states in protein folding: an essential step in the puzzle. Curr. Opin. Struct. Biol 5, 79-84.

32. Fersht A. R. (1997). Nucleation mechanisms in protein folding. Curr. Opin. Struct. Biol 7, 3-9.

33. Fersht A. R. (1999). Structure and Mechanism in Protein Science: A Guide to Enzyme Catalysis and Protein Folding, W.H. Freeman, New York.

34. Fersht A. R. (2000). Structure and Mechanism in Protein Science: A Guide to Enzyme Catalysis and Protein Folding, W.H. Freeman, New York.

35. Fersht A. R., Matouschek A. and Serrano L. (1992). The folding of an enzyme. I. Theory of protein engineering analysis of stability and pathway of protein folding. J. Mol. Biol 224, 771-782.

36. Fersht A. R., Itzhaki L. S., elMasry N. F., Matthews J. M. and Otzen D. E. (1994). Single versus parallel pathways of protein folding and fractionalformation of structure in the transition state. Proc. Natl Acad. Sci. USA. 91, 10426-10429.

37. Fersht A. R. and Sato S. (2004). Phi-value analysis and the nature of protein-folding transition states. Proc. Natl. Acad. Sci. USA. 101, 79767981.

38. Finkelstein A. V. (1997). Can protein unfolding simulate protein folding? Protein Eng. 10, 843-845.

39. Finkelstein A. V. and Badretdinov A. Ya. (1997). Rate of protein folding near the point of thermodynamic equilibrium between the coil and the most stable chain fold. Fold. Des. 2, 115-121.

40. Finkelstein A. V. and Roytberg M. A. (1993). Computation of biopolymers: a general approach to different problems. Biosystems, 30, 1-19.

41. Flory P. J. (1969). Statistical Mechanics of Chain Molecules, Interscience, New York.

42. Fowler S. B. and Clarke J. (2001). Mapping the folding pathway of an immunoglobulin domain: structural detail from phi value analysis and movement of the transition state. Structure (Camb), 9, 355-366.

43. Friel C. T., Capaldi A. P. and Radford S. E. (2003). Structural analysis of the rate-limiting transition states in the folding of Im7 and Im9:

44. V similarities and differences in the folding of homologous proteins. J. Mol.1. Biol. 326, 293-305.

45. Fulton K. F., Main E. R. G., Dagett V. and Jackson S. E. (1999). Mapping the interactions present in the transition state for unfolding/folding of FKBP12. J. Mol. Biol. 291, 445-461.

46. Galzitskaya O. V. and Finkelstein A. V. (1995). Folding of chains with random and edited sequences: similarities and differences. Protein Eng. 8, 883-892.

47. Galzitskaya O. V. and Finkelstein A. V. (1998). Folding rate dependence on the chain length of RNA-like heteropolymers. Fold. Des. 3, 69-78.

48. Galzitskaya O. V. and Finkelstein A. V. (1999). A theoretical search for folding/unfolding nuclei in three-dimensional protein structures. Proc. Nad. Acad. Sci. USA. 96, 11299-11304.

49. Galzitskaya O. V., Garbuzynskiy S. O. and Finkelstein A. V. (2005). Theoretical study of protein folding: outlining folding nuclei and estimation of protein folding rates. Journal of Physics: Condensed Matter. 17, S1539-S1551.

50. Galzitskaya O. V., Garbuzynskiy S. O., Ivankov D. N. and Finkelstein A. V. (2003). Chain length is the main determinant of the folding rate for proteins with three-state folding kinetics. Proteins. 51, 162-166.

51. Galzitskaya O. V., Ivankov D. N. and Finkelstein A. V. (2001). Folding nuclei in proteins. FEBS Lett. 489, 113-118.

52. Galzitskaya O. V., Surin A. K. and Nakamura H. (2000). Optimal region of average side-chain entropy for fast protein folding. Protein Sci. 9, 580586.

53. Grantcharova V. P. and Baker D. (1997). Folding dynamics of the src SH3 domain. Biochemistry, 36, 15685-15692.

54. Grantcharova V. P., Aim E. J., Baker D. and Horwich A. L. (2001). Mechanisms of protein folding. Curr. Opin. Struct. Biol. 11, 70-82.

55. Grantcharova V. P., Riddle D. S., Santiago J. V. and Baker D. (1998). Important role of hydrogen bonds in the structurally polarized transition state for folding of the src SH3 domain. Nature Struct. Biol. 5, 714-720.

56. Gsponer J. and Caflisch A. (2002). Molecular dynamics simulations of protein folding from the transition state. Proc. Natl. Acad. Sci. USA. 99, 6719-6724.

57. Guerois R. and Serrano L. (2001). Protein design based on folding models. Curr. Opin. Struct. Biol. 11, 101-106.

58. Guerois R. and Serrano L. (2000). The SH3-fold family: experimental evidence and prediction of variations in the folding pathways. J. Mol. Biol. 304, 967-982.

59. Gunasekaran K., Eyles S. J., Hagler A. T. and Gierasch L. M. (2001). Review. Keeping it in the family: folding studies of related proteins. Curr. Opin. Struct. Biol. 11, 83-93.

60. Gutin A. M., Abkevich V. I. and Shakhnovich E. I. (1995). Is burst hydrophobic collapse necessary for protein folding? Biochemistry. 34, 3066-3076.

61. Gutin A. M., Abkevich V. I. and Shakhnovich E. I. (1996). Chain length scaling of protein folding time. Phys. Rev. Lett. 77, 5433-5436.

62. Hamill S., Steward A. and Clarke J. (2000). The folding of an immunoglobulin-like greek key protein is defined by a common-core nucleus and regions constrained by topology. J. Mol. Biol. 297, 165— 178.

63. Horovitz A. (1996). Double-mutant cycles: a powerful tool for analyzing protein structure and function. Fold. Des. 1, R121-R126.

64. Hubner I. A., Oliveberg M. and Shakhnovich E. I. (2004b). Simulation, experiment, and evolution: understanding nucleation in protein S6 folding. Proc. Natl Acad. Sci. USA. 101, 8354-8359.

65. Hubner I. A., Shimada J. and Shakhnovich E. I. (2004a). Commitment and nucleation in the protein G transition state. J. Mol. Biol. 336, 745-761.

66. Ivankov D. N. and Finkelstein A. V. (2001). Theoretical study of a landscape of protein folding-unfolding pathways. Folding rates at midtransition. Biochemistry, 40, 9957-9961.

67. Jackson S. E. (1998). How do small single-domain proteins fold? Folding and Design. 3,81-91.

68. Jackson S. E. and Fersht A. R. (1991). Folding of chymotrypsin inhibitor 2. 1. Evidence for a two-state transition. Biochemistry, 30, 10428-10435.

69. Jacobs D. J., Rader A. J., Kuhn L. A. and Thorpe M. F. (2001). Protein flexibility predictions using graph theory. Proteins. 44, 150-165.

70. Jones K. and Wittung-Stafshede, P. (2003). The largest protein observed to fold by two-state kinetic mechanism does not obey contact-order correlation. J. Am. Chem. Soc. 125, 9606-9607.

71. Kabsch W. and Sander C. (1983). Dictionary of protein secondary structure: pattern recognition of hydrogen-bonded and geometrical features. Biopolymers. 22, 2577-2637.

72. Khorasanizadeh S., Peters I. D., Butt T. R. and Roder H. (1993). Folding and stability of a tryptophan-containing mutant of ubiquitin. Nat. Struct. Biol. 3, 193-205.

73. Khorasanizadeh S., Peters I. D. and Roder H. (1996). Evidence for a three-state model of protein folding from kinetic analysis of ubiquitin variants with altered core residues. Nat. Struct. Biol. 3, 193-205.

74. Kim D. E., Fisher C. and Baker D. (2000). A breakdown of symmetry in the folding transition state of protein L. J. Mol. Biol. 298, 971-984.

75. Kim D. E., Yi Q., Gladwin S. T., Goldberg J. M. and Baker, D. (1998). The single helix in protein L is largely disrupted at the rate-limiting step in folding. J. Mol. Biol. 284, 807-815.

76. Klimov D. K. and Thirumalai D. (2001). Multiple protein folding nuclei and the transition state ensemble in two-state proteins. Proteins. 43, 465475.

77. Kragelund B. B., Robinson C. V., Knudsen J., Dobson C. M. and Poulsen F. M. (1995). Folding of a four-helix bundle: studies of acyl-coenzyme A binding protein. Biochemistry. 34, 7217-7224.

78. Krantz B. A., Dothager, R. S. and Sosnick T. R. (2004). Discerning the structure and energy of multiple transition states in protein folding using psi-analysis. J. Mol. Biol. 337, 463-475.

79. V 83. Krantz B. A. and Sosnick T. R. (2001). Engineered metal binding sites map the heterogeneous folding landscape of a coiled coil. Nature Struct. Biol. 8, 1042-1047.

80. Krieger E., Koraimann G. and Vriend G. (2002). Increasing the precision of comparative models with YASARA NOVA a self-parameterizing force field. Proteins. 47, 393-402.

81. Kuwajima K and Sugai S. (1978). Equilibrium and kinetics of the thermal unfolding of alpha-lactalbumin. The relation to its folding mechanism. Biophys. Chem. 8, 247-254.

82. Laurents D. V., Corrales S., Elias-Arnanz M., Sevilla P., Rico M. and Padmanabhan S. (2000). Folding kinetics of phage 434 Cro protein. Biochemistry. 39, 13963-13973.

83. Lazaridis T. and Karplus M. (1997). "New view" of protein folding reconciled with the old through multiple unfolding simulations. Science. 278, 1928-1931.

84. Leninger A. L., Nelson D. L. and Cox M. M. (1993). Principles of ^ Biochemistry. Worth Publ., Inc., New York.

85. Levinthal C. (1968). Are there pathways for protein folding? J. Chim. Phys. Chim. Biol. 65, 44-45.

86. Li A. and Daggett V. (1996). Identification and characterization of the unfolding transition state of chymotrypsin inhibitor 2 by molecular dynamics simulations. J. Mol. Biol. 257, 412-429.

87. Li L., Mirny L. A. and Shakhnovich E. I. (2000). Kinetics, thermodynamics and evolution of non-native interactions in a protein folding nucleus. Nat. Struct. Biol. 7, 336-342.

88. Li L. and Shakhnovich E. I. (2001). Constructing, verifying, and V dissecting the folding transition state of chymotrypsin inhibitor 2 withall-atom simulations. Proc. Natl Acad. Sci. USA. 98, 13014-13018.

89. Lindberg M., Tangrot J. and Oliveberg M. (2002). Complete change of the protein folding transition state upon circular permutation. Nature Struct. Biol. 9, 818-822.

90. Lopez-Hernandez E. and Serrano L. (1996). Structure of the transition state for folding of the 129 aa protein CheY resembles that of a smaller protein, CI-2. Fold. Des. 1, 43.

91. Main E. R., Fulton K. F. and Jackson S. E. (1999). Folding pathway of FKBP12 and characterisation of the transition state. J. Mol. Biol. 291, 429-444.

92. Martinez J. C., Pisabarro M. T. and Serrano L. (1998). Obligatory steps in protein folding and the conformational diversity of the transition state. Nature Struct. Biol. 5, 721-729.

93. Martinez J. C. and Serrano L. (1999). The folding transition state between SH3 domains is conformational^ restricted and evolutionarily conserved. Nature Struct. Biol. 6, 1010-1016.

94. Matouscheck A., Kellis J. T., Jr., Serrano L., Bycroft M. and Fersht A. R. • (1990). Transient folding intermediates characterized by proteinengineering. Nature. 346, 440-445.

95. Matouscheck A., Otzen D. E., Itzhaki L. S., Jackson S. E. and Fersht A. R. (1995). Movement of the position of the transition state in protein folding. Biochemistry. 34, 13656-13662.

96. Matouschek J. T., Kellis J., Serrano L. and Fersht A. R. (1989). Mapping the transition state and pathway of protein folding by protein engineering. Nature. 340, 122-126.

97. Matthews J. M., Fersht, A. R. (1995). Biochemistry, 34, 6805-????.

98. Mayor U., Guydosh N. R., Johnson C. M., Grossman J. G., Sato S., Jas G. \ S., Freund S. M. V., Alonso D. O. V., Daggett V. and Fersht A. R. (2003).

99. The complete folding pathway of a protein from nanoseconds to microseconds. Nature. 421, 863-867.

100. Mayor U., Johnson C. M., Daggett V. and Fersht A. R. (2000). Protein folding and unfolding in microseconds to nanoseconds by experiment • and simulation. Proc. Natl Acad. Sci. USA, 97, 13518-13522.

101. McCallister E. L., Aim E. and Baker D. (2000). Critical role of beta-hairpin formation in protein G folding. Nature Struct. Biol. 7, 669-673.

102. Merrifield R. B. (1965). Automated synthesis of peptides. Science. 150, 178-185.

103. Metropolis N., Rosenbluth A., Rosenbluth M., Teller A. and Teller E. (1953). J. Chem. Phys. 96 768-780.

104. Michnick S. W. and Shakhnovich E. (1998). A strategy for detecting the conservation of folding-nucleus residues in protein superfamilies. Fold. Des. 3, 239-251.

105. Mirny L. A. and Shakhnovich E. I. (1999). Universally concerved positions in protein folds: Reading evolutionary signals about stability, folding kinetics and function. J. Mol. Biol. 291, 177-196.

106. Mirny L. A., Abkevich V. I. and Shakhnovich E. I. (1998). How evolution makes proteins fold quickly. Proc. Natl Acad. Sci. USA, 95, 4976-4981.

107. Moore J. W. and Pearson R. G. (1981). Kinetics and Mechanism, Wiley, New York.

108. Moran L. B., Schneider J. P., Kentsis A., Reddy G. A. and Sosnick T. R. (1999). Transition state heterogeneity in GCN4 coiled coil folding studied by using multisite mutations and crosslinking. Proc. Natl Acad. Sci. USA. 96, 10699-10704.

109. Muñoz V. and Eaton W. A. (1999). A simple model for calculating the kinetics of protein folding from three-dimensional structures. Proc. Natl Acad. Sci. USA. 96, 11311 -11316.

110. Muñoz V., Lopez E. M., Jager M. and Serrano L. (1994). Kinetic characterization of the chemotactic protein from Escherichia coli, CheY. Kinetic analysis of the inverse hydrophobic effect. Biochemistry, 33, 5858-5866.

111. Murzin A. G., Brenner S. E., Hubbard T. and Chothia C. (1995). SCOP: a structural classification of proteins database for the investigation of sequences and structures. J. Mol. Biol. 247, 536-540.

112. Northey J. G., Maxwell K. L. and Davidson A. R. (2002). Protein folding kinetics beyond the phi value: using multiple amino acid substitutions to investigate the structure of the SH3 domain folding transition state. J. Mol. Biol. 320, 389-402.

113. Nôlting B. and Andert K. (2000). Mechanism of protein folding. Proteins: Struct. Fund. Genet. 41, 288-298.

114. Onuchic J. N., Socci N. D., Luthey-Schulten Z. and Wolynes P. G. (1996). Protein funnels: The nature of the transition state ensemble. Fold. Des. (London). 1,441-450.

115. Otzen D. E. and Fersht A. R. (1998). Folding of circular and permuted chymotrypsin inhibitor 2: retention of the folding nucleus. Biochemistry. 37,8139-8146.

116. Otzen D. E. and Oliveberg M. (1999). Salt-induced detour through compact regions of the protein folding landscape. Proc. Natl Acad. Sci. USA, 96, 11746-11751.

117. Otzen D. E., Kristensen O., Proctor M. and Oliveberg M. (1999). Structural changes in the transition state of protein folding: Alternative interpretations of curved chevron plots. Biochemistry. 38, 6499-6511.

118. Ozkan S. B., Bahar I. and Dill K. A. (2001). Transition states and the meaning of Phi-values in protein folding kinetics. Nature Struct. Biol. 8, 765-769.

119. Paci E., Clarke J., Steward A., Vendruscolo M. and Karplus M. (2003). Self-consistent determination of the transition state for protein folding: application to a fibronectin type III domain. Proc. Natl Acad. Sci. USA. 100, 394-399.

120. Paci E., Vendruscolo M., Dobson C. M. and Karplus M. (2002). Determination of a transition state at atomic resolution from protein engineering data. J. Mol. Biol. 324, 151-163.

121. Pande V. S. and Rocksar D. S. (1999). Folding pathway for a lattice model proteins. Proc. Natl. Acad. Sci USA. 96, 1273-1278.

122. Perl D., Welker Ch., Schindler T., Schroder K., Marahiel M. A., Jaenicke R. and Schmid F. X. (1998). Conservation of rapid two-state folding in mesophilic, thermophilic and hyperthermophilic cold shock proteins. Nature Struct. Biol. 5, 229-235.

123. Plaxco K. W., Larson S., Ruczinski I., Riddle D. S., Thayer E. C., Buchwitz B., Davidson A. R. and Baker D. (2000). Evolutionary conservation in protein folding kinetics. J. Mol. Biol. 298, 303-312.

124. Plaxco K. W., Simons K. T. and Baker D. (1998). Contact order, transition state placement and the refolding rates of single domain proteins. J. Mol. Biol. 277, 985-994.

125. Plotkin S. S. and Onuchic J. N. (2000). Investigation of routes and funnels in protein folding by free energy functional methods. Proc. Natl. Acad. Sci USA. 97, 6509-6514.

126. Privalov P. L. (1979). Stability of proteins: small globular proteins. Adv. Protein Chem. 33, 167-241.

127. Privalov P. L. (1982). Stability of proteins. Proteins which do not present a single cooperative system. Adv. Protein Chem. 35, 1-104.

128. Privalov P. L. and Khechinashvili N. N. (1974). A thermodynamic approach to the problem of stabilization of globular protein structure: a calorimetric study. J. Mol Biol. 86, 665-684.

129. Ptitsyn О. B. (1998). Protein folding and protein evolution: common folding nucleus in different subfamilies of c-type cytochromes? J. Mol. Biol. 278, 655-666.

130. Ptitsyn О. B. and Ting K.-L. (1999). Non-functional residues in globins and their possible role as a folding nucleus. J. Mol. Biol. 291, 671-682.

131. Riddle D. S., Grantcharova V. P., Santiago J. V., Aim E., Ruczinski I. and Baker D. (1999). Experiment and theory highlight role of native state topology in SH3 folding. Nature Struct. Biol. 6, 1016-1024.

132. Sali A., Shakhnovich E. I. and Karplus M. (1994). Kinetics of protein folding a lattice model study of the requirements for folding to the native state. J. Mol. Biol. 235, 1614-1636.

133. Sanchez I. E. and Kiefhaber T. (2003). Origin of unusual phi-values in protein folding: evidence against specific nucleation sites. J. Mol. Biol. 334, 1077-85.

134. Sato S., Religa T. L., Daggett V. and Fersht A. R. (2004). Testing protein-folding simulations by experiment: В domain of protein A. Proc. Natl. Acad. Sci. USA. 101, 6952-6956.

135. Schreiber G. and Fersht A. R. (1993). The refolding of cis- and trans-peptidylprolyl isomers of barstar. Biochemistry, 32, 11195-11203.

136. Schulz G. E. and Schirmer R. H. (1979). Principles of protein structure. New York-Heidelberg-Berlin: Springer-Verlag.

137. Schymkowitz J., Rousseau F., Irvine L. and Itzhaki L. (2000). The folding pathway of the cell-cycle regulatory protein pl3sucl: clues for the mechanism of domain swapping. Structure Fold. Des. 8, 89-100.

138. Segawa S. and Sugihara M. (1984). Characterization of the transition state of lysozyme unfolding. I. Effect of protein-solvent interactions on the transition state. Biopolymers. 23, 2473-2488.

139. Serrano L., Matouschek A. and Fersht A. R. (1992). The folding of an enzyme. III. Structure of the transition state for unfolding of barnase analyzed by a protein engineering procedure. J. Mol. Biol. 224, SOS-SIS.

140. Shakhnovich E., Abkevich V. and Ptitsyn O. (1996). Conserved residues and the mechanism of protein folding. Nature, 379, 96-98.

141. Shoemaker B. A., Wang J. and Wolynes P. G. (1999). Exploring structures in protein folding funnels with free energy functionals: the transition state ensemble. J. Mol. Biol. 287, 675-694.

142. Shoemaker B. A. and Wolynes P. G. (1999). Exploring structures in protein folding funnels with free energy functionals: the denatured ensemble. J. Mol. Biol. 287, 657-674.

143. Siew N., Elofsson A., Rychlewski L. and Fischer D. (2000). MaxSub: an automated measure for the assessment of protein structure prediction quality. Bioinformatics. 16, 776-785.

144. Silow M. and Oliveberg M. (1997). High-energy channeling in protein folding. Biochemistry, 36, 7633-7637.

145. Steensma E. and van Mierlo C. P. (1998). Structural characterisation of apoflavodoxin shows that the location of the stable nucleus differs among proteins with a flavodoxin-like topology. J. Mol. Biol. 282, 653666.

146. Tanford C. (1968). Protein denaturation. Adv. Protein Chem. 23, 121-282.

147. Ternstrom T., Mayor U., Akke M. and Oliveberg M. (1999). From snapshot to movie: phi analysis of protein folding transition states taken one step further. Proc. Natl Acad. Sci. USA, 96, 14854-14859.

148. Tsai J., Levitt M. and Baker D. (1999). Hierarchy of structure loss in MD simulations of src SH3 domain unfolding. J. Mol. Biol. 291, 215-225.

149. Ueda Y., Taketomi H. and Go N. (1975). Studies on protein folding, unfolding and fluctuations by computer simulation. I. The effect of specific amino acid sequence represented by specific inter-unit interactions. Int. J. Pept. Protein Res. 7, 445-459.

150. Vendruscolo M., Paci E., Dobson C. M. and Karplus, M. (2001). Three ^ key residues form a critical contact network in a protein foldingtransition state. Nature, 409, 641-645.

151. Viguera A. R, Serrano L. and Wilmanns M. (1996). Different folding transition states may result in the same native structure. Nature Struct. Biol. 3, 874-880.