Бесплатный автореферат и диссертация по биологии на тему
Использование спектроскопии кругового дихроизма для анализа супервторичной структуры нативных и денатурированных белков
ВАК РФ 03.00.02, Биофизика

Автореферат диссертации по теме "Использование спектроскопии кругового дихроизма для анализа супервторичной структуры нативных и денатурированных белков"

На правах рукописи

ВАСИЛЕНКО КОНСТАНТИН СТАНИСЛАВОВИЧ

ИСПОЛЬЗОВАНИЕ СПЕКТРОСКОПИИ КРУГОВОГО ДИХРОИЗМА ДЛЯ АНАЛИЗА СУПЕРВТОРИЧНОЙ СТРУКТУРЫ НАТИВНЫХ И ДЕНАТУРИРОВАННЫХ БЕЛКОВ.

03.00.02.-биофизика

автореферат диссертации на соискание ученой степени кандидата физико-математических наук

Пущино 2004

Работа выполнена в Институте белка РАН

Научные руководители:

доктор физико-математических наук, профессор

|Олег Борисович Птицын|

доктор физико-математических наук Геннадий Васильевич Семисотнов

Официальные оппоненты:

доктор физико-математических наук Сергей Александрович Потехин доктор биологических наук Андрей Александрович Миронов

Ведущая организация:

Институт биоорганической химии имени М.М.Шемякина и ЮА.Овчинникова РАН

Защита состоится 17 ноября 2004 г. в 15 час. 30 мин. на заседании диссертационного совета Д002.093.01 при Институте теоретической и экспериментальной биофизики (142290, Московская обл., г. Пущино, ИТЭБ РАН).

С диссертацией можно ознакомиться в Центральной библиотеке Путинского НЦБИ РАН.

Автореферат разослан

Ученый секретарь

диссертационного совета

кандидат физико-математических наук

Н.Ф. Ланина

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность проблемы. Спектроскопия кругового дихроизма (КД) широко применяется для анализа интегральных параметров вторичной структуры глобулярных белков. Такое использование метода основано на предположении, что вид спектра в дальней ультрафиолетовой (УФ) области в наибольшей степени зависит от локальной конформации полипептидной цепи, которая как раз и описывается в терминах вторичной структуры. Однако, в последнее время становится все более очевидно, что подобная простая интерпретация спектральных данных является слишком грубой моделью, возможности которой ограничены. Имеется ряд свидетельств, как экспериментальных, так и теоретических, указывающих на то, что более высокие уровни организации белков также могут оказывать существенное влияние на форму и амплитуду спектров. Прежде всего, речь идет об особенностях укладки элементов вторичной структуры в белковую глобулу. С другой стороны, за последние годы, накоплен большой экспериментальных материал по белкам в частично денатурированном состоянии, так называемых "расплавленных глобулах". Считается, что в таких белках третичные взаимодействия ослаблены, но основная часть вторичной структуры остается неизменной. Систематическое сравнение спектров белков в нативном и частично денатурированном состоянии позволит исследовать влияние плотной упаковки на спектры КД. Представленная работа посвящена исследованию чувствительности спектров кругового дихроизма к супервторичной структуре глобулярных белков. Рассмотрена возможность определения класса третичной структуры белка по его спектру. Также проанализированы спектры КД белков в состоянии расплавленной глобулы и исследована возможность оценки их структурных параметров.

Цель и задачи исследования. Основной целью работы является исследование возможности анализа супервторичной структуры глобулярных белков с помощью спектроскопии кругового дихроизма. 6 задачи исследования входило:

1. Систематический анализ большого набора спектров КД белков различных структурных классов. Проверка наличия корреляции между формой спектра белка и его классом третичной структуры.

2. Создание алгоритма определения класса третичной структуры глобулярного белка по его спектру КД. Определение достоверности метода.

3. Сравнение информационного содержания набора спектров белков в нативном и в "расплавленном" состоянии. Проверка предположения и нативоподобности вторичной структуры расплавленных глобул.

Научная новизна работы. Впервые статистически достоверно показано наличие корреляции между формой спектров КД глобулярных белков и принадлежностью их к определенному классу третичной структуры. Показано, что спектральные образы в многомерном пространстве амплитуд образуют выраженные кластеры, соответствующие тому или иному классу третичной структуры. Впервые предложен численный метод определения класса третичной структуры белка по его спектру КД. Достоверность определения составляет 75100% в зависимости от класса. Впервые исследовано информационное содержание набора спектров КД белков в "кислой" денатурированной форме и показано, что оно заметно ниже, чем в случае нативных белков. Продемонстрировано наличие корреляции между формой спектра и содержанием вторичной структуры в денатурированном белке. Предложен метод анализа вторичной структуры ненативных белков по их спектрам КД.

Практическое значение работы. Практическое применение полученных результатов возможно в двух областях:

- оперативное определение параметров третичной структуры глобулярных белков в растворе. Метод активно используется на практике - на него ссылаются в двух учебниках и в 15ти научных статьях.

- анализ параметров вторичной структуры частично денатурированных белков, для которых неприменимы стандартные методы, основанные на спектроскопии КД.

Апробация работы. Материалы диссертации были представлены на международных конференциях: 5th International conference on circular dichroism (Pingree Park, USA, 1993), International seminar: Molten globule: its physical picture and biological meaning (Tokyo, Japan, 1994), Russian-German summer school on structure and folding (Jena, Germany, 1995), International symposium on protein structure stability and folding, fundamental and medical aspects (Москва, 1998); на всесоюзной конференции: VII Всесоюзная конференция по спектроскопии биополимеров (Харьков, 1991); на ежегодных научных конференциях Института белка РАН (Пущино, 1993,1995).

Публикации. Основные результаты диссертации опубликованы в 7ми печатных работах, в том числе в 4х статьях.

Структура диссертации. Диссертация состоит из «Введения», четырех глав, «Заключения», «Выводов» и «Списка литературы». Работа содержит 7 рисунков и 5 таблиц.

РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ

1. Анализ чувствительности спектра КД к классу третичной структуры глобулярных белков.

Была рассмотрена выборка из спектров 46 нативных глобулярных белков и 7 спектров белков и полипептидов, охарактеризованных в качестве модели клубкообразного состояния. Использовались опубликованные данные только из работ, в которых спектры КД применялись для количественного анализа структуры белков, т.е. особое внимание уделялось качеству спектров и точности определения концентрации образца. Спектры КД дегидрофолат редуктазы из Escherichia coli, а-лактальбумина коровы, лизоцима бактериофага Т4 и Сго-репрессора бактериофага X были измерены на дихрогрофе J-600 (Jasco, Япония) в условиях, обеспечивающих нативность белка. Концентрация образцов контролировалась точным микрометодом определения суммарного азота. Все спектры были оцифрованы в значениях молярной эллиптичности на остаток в диапазоне 236-190 нм с шагом 2 нм. Класс третичной структуры каждого белка (рис.2) определялся в соответствии со Структурной Классификацией Белков (SCOP).

Визуализация распределения спектральныхобразов.

Представление спектра в виде набора амплитуд позволяет интерпретировать его как точку или вектор в N-мерном пространстве, где N число фиксированных длин волн, на которых производится оцифровка спектра. Такое рассмотрение спектра делает возможным для его математического анализа применять аппарат векторной и матричной алгебры.

Описывая спектры как точки с заданными координатами, мы получаем возможность, путем вращения и сдвига системы координат, выделить несколько направлений в пространстве, распределение точек вдоль которых наиболее информативно, и таким образом - путем уменьшения размерности задачи ослабить влияние экспериментальной ошибки и получить наглядную информацию об относительном расположении точек в пространстве. Такие подходы, позволяющие также оценить количество независимой информации, которое можно получить из рассмотрения данного набора спектров, лежат в основе факторного анализа.

В целях визуализации распределения точек (образов) спектров в гиперпространстве необходимо свести размерность системы максимум к трем измерениям, чтобы сделать локализацию образов наглядной и доступной для восприятия. С этой целью была найдена новая ортогональная система координат:

На основе матрицы спектров F=fij. (где ij - номера спектров и длин волн, соответственно) строилась симметричная матрица С помощью алгоритма Якоби

определялось унитарное преобразование Ти диагональная матрица А такая, ЧТО А = T'UT. Ненулевые элементы матрицы А являются собственными значениями U. Для трех наибольших собственных значений (120.3, 21.7 и 5.4) определялись собственные вектора У,

Рис. 1. Распределение образов спектров 51 белка и 2 полипептвдов в системе координат, определяемой тремя наиболее значащими компонентами

матрицы и. На основе каждого из собственных векторов строился вектор .X, = Т"1 °У, затем этот вектор нормировался на единицу Полученные вектора являлись

новой, ортогональной 3-х мерной системой координат, оси которой расположены вдоль наиболее информативных относительно данного набора образов спектров направлений в полном, 24-мерном пространстве.

Распределение образов спектров 51 белка и двух пептидов в полученной системе координат изображено в виде трех проекций на рис. 1. Точки, соответствующие спектрам белков разных структурных классов, обозначены соответствующими символами. Пунктиром очерчены минимальные выпуклые области, содержащие образы спектров белков одного класса третичной структуры.

Из рассмотрения проекции по двум наиболее существенным координатам видно, что наборы образов спектров денатурированных и белков группируются в хорошо определенных областях пространства без пересечения с другими классами. Образы спектров белков классов занимают на этой проекции пересекающиеся области.

Добавление третьей координаты улучшает разделение. Точка может считаться попавшей не в свой класс, если она находится внутри фигуры, определяющей границы этого класса, на всех проекциях. Таких точек на трех проекциях всего три, это £Х/р белки - роданеза, субтилизин ВР№ и глицеральдегид 3-фосфат дегидрогеназа. Они попадают в область, определяемую образами спектров белков а+(5 - Класса, однако лежат вблизи ее границы. Таким образом, можно принять, что если белок попадает в область, образованную фигурой, определяемой образами одного из классов, его со значительной степенью достоверности можно отнести к этому классу. Это показывает, что дальнейшее исследование соответствия между распределением образов спектров в пространстве и классом третичной структуры соответствующих белков является оправданным.

Исследованиераспределения образов с помощью иерархическойклассификации. Для описания распределения образов спектров в пространстве по критерию взаимного расстояния между ними к рассматриваемому набору была применена процедура иерархической классификации. Целью такой классификации является разбиение множества образов по критерию попарного расстояния между ними. Основное преимущество иерархической классификации перед другими методами распознавания образов состоит в том, что она не требует априорного разделения множества на определенные классы, то есть позволяет получить некое объективное разбиение множества на группы и сравнить это разбиение с существующей классификацией. Иерархию можно изобразить в виде дерева (рис.2). Такое изображение иерархической классификации называют дендрограммой . На практике чаще всего используется иерархия, определяемая вещественной функцией (расстоянием, сходством), обозначаемой положением точек ветвления. Выбор определения расстояния, или сходства, обусловливает построение иерархии. Из анализа дендрограмм можно сделать вывод о распределении образов в пространстве, о том, какие образы группируются в компактные кластеры и насколько эти кластеры отделены друг от друга.

Спектральные данные были подвергнуты компьютерной обработке. Классификация строилась с помощью алгоритма Ланца-Вильямса с построением матрицы попарных расстояний между образами спектров на основе евклидовой метрики. Для построения дендрограмм применялись несколько методов определения расстояния между кластерами -методы ближних соседей, дальних соседей, медианный, центроид, группового усреднения,

Миоглобин аа

Леггемогпобнн аа

Гемоглобин аа

Гемеритрин аа

Лизоцим Т4 од

аа

E-K-K.-L-E-E-A, 10®С den Рубредоксин Нуклеаза, 70°С Эластаза

Аро-цнтохром с, 90"С E-lC-K-L-E-E-А, 80*С Аро-цитохром с, 5*С Нуклеаза, 6°С Ох-рибокуклеаза

Триозофосфат изомераза Аден плат киназа Парвалбумнн Инсулин

Л актах дегндрогеназа Термолизин Карбоксипептидаза А Флаводоксин (Clostr.) Субтилизин novo Раданеза Х-Сго репрессор

Конканавалин А Пластоциаяин Преальоумин Карбангмдраза Ерабутоксии Иммуноглобулин, FAB Кобратоксин Белок Бенса-Джонса

Хнмотрипсин Супероксид дисмутаза Папаин

Ингибитор трипсина

Цитохром с (лошадь)

Йитохром с (тунец) — нгиоктор субтилнзнна a+ß Рибонуклеаза S Рибонуклеаза А Фосфолипаза А2 Лнзоцнм Авиан Нуклеаза а-Лактальбумин

Субтклизин BPN* о/'В

Глицер-ЗР дегндрогеназа aJ i Цитохром bS a+ \

Алкоголь дегидрогеназа <х/ \ Флаводоксин (Desulf) <*/ Днгидрофолат редуктаза о/

Мера сходства

О

Рис. 2. Дендрограмма распределения спектральных образов, полученная по алгоритму Ланца-Вильямса с применением медианного метода.

Уорда. Методы медианный, центроид и группового усреднения дали наилучшие результаты, позволив добиться четкой кластеризации. Разбиение на кластеры для всех трех методов практически одинаково.

Вместе с тем чувствительность получаемого разбиения к добавлению и исключению спектров белков из обучающей выборки довольно высока. Это, вероятно, объясняется недостаточным количеством рассматриваемых белков для статистически адекватной классификации. Количество классифицируемых объектов в нашем случае приблизительно в десять раз превышает число вероятных классов, что находится на грани статистически корректного анализа.

Дендрограмма, полученная с помощью медианного метода приведена на рис. 2. По оси абсцисс в дендрограмме откладывалась величина сходства, где сходство S,j .между кластерами i И j определялось следующим как (4им " ^ij) f dmm >гДе dv расстояние между кластерами, а максимальное расстояние между двумя кластерами в данном

рассмотрении. Эта величина нормирована на единицу и отражает меру близости двух кластеров.

На полученной дендрограммы можно видеть хорошее объединение в отдельный кластер d-СПИральных белков с высокой степенью спирализации. Отделение денатурированных белков также очень хорошее, однако в один кластер с ними попали спектры Р-СтруктурНЫХ белков - рубредоксина и эластазы, что возможно объясняется высокой неупорядоченностью их [^-структуры. Имеется также хорошо определенный кластер, содержащий спектры белков, принадлежащих Можно выделить два

кластера, содержащих спектры Разделение между этими двумя классами

не совсем четкое, однако один из кластеров преимущественно состоит из и может

быть принят как соответствующий этому классу; другой состоит из двух подкластеров, один из которых практически полностью состоит из а/Р белков, а второй включает как а+Р белки? так и (Ш-белки низкой спиральности. Такое с м е ш е шф Л |0/(5а с с о в вероятно указывает на то, что области пространства, содержащие образы спектров белков этих классов, лежат очень близко друг к другу либо слабо перекрываются.

Нечеткость соответствия между разделением белков на кластеры и их классом третичной структуры может объясняться как недостаточностью статистической выборки, так и экспериментальными погрешностями, либо неоднозначностью принятой классификации белков. Однако, в целом, из рассмотрения результатов иерархической классификации спектров белков и визуализации расположения их образов в пространстве можно сделать вывод о наличии корреляции между классом третичной структуры белка и разбиением на

пространственные кластеры образов его спектров и о целесообразности создания алгоритма классификации, основанного на управляемом обучении.

Построение алгоритма определения класса третичной структуры белка по его спектру КД.

Если образы, принадлежащие различным классам, группируются в непересекающиеся кластеры, то с помощью гиперплоскостей можно разделить пространство таким образом, что области, определенные этими гиперплоскостями, будут представлять эти классы. Математические уравнения плоскостей разбиения называются решающими функциями. Прямые или гиперплоскости в общем случае выражаются линейными решающими функциями и могут правильно классифицировать только линейно разделимые кластеры. В таком случае решающие функции представляются гиперплоскостями в форме

Подобные решающие функции служат для разделения двух различных кластеров. Принадлежность исследуемого образа к тому или иному из двух разделяемых кластеров определяется по знаку функции Если требуется построить

классификацию для нескольких кластеров, строится несколько решающих функций, разделяющих отдельные пары кластеров, либо группы кластеров, и по положению образа в областях пространства, найденному с помощью этих функций, определяется его принадлежность к конкретному кластеру.

Для нахождения уравнений решающих функций используются несколько алгоритмов. Наиболее гибкими и удобными являются алгоритмы, использующие управляемое обучение. Одним из самых распространенных является алгоритм восприятия. В результате обучения по такому алгоритму создается вектор точных весов для классификации линейно разделимых кластеров. После обучения на образах известной классификации (обучающем наборе) этот алгоритм может осуществлять классификацию произвольных образов.

Для создания процедуры определения класса белка, исходя из спектра КД, была написана программа, в которой использовался следующий алгоритм: множество М всех белков разбивалось на т подмножеств А, (ш - ЧИСЛО классов), в каждое из которых входили все белки, принадлежащие одному классу третичной структуры. Образовывались новые подмножества вида Л^ = А, и ^ ; VI, у, 1 ф ]. Каждое подмножество Ыь использовалось в качестве обучающей выборки для алгоритма восприятия, призванного найти решающую функцию для разделения точек, соответствующих классам

Таким образом, мы получаем П = С2т решающих ф у н к ц £>р с помощью которых можно отнести произвольный спектр к классу Отнесение любого спектра к

определенному классу третичной структуры выполняется путем принятия его в качестве аргумента последовательно всех п решающих функций. Тот класс, к которому белок будет

Таблица 1. Результат тестирования метода решающих функций

Класс третичной Число белков Число правильных % правильных

структуры данного класса предсказаний предсказаний

оих 9 8 89 %

ЭД 12 9 75 %

а+Р 13 13 100%

а/р 12 10 83%

денатурированные 7 7 100 %

отнесен наибольшее число раз, и может быть принят в качестве его класса третичной структуры. Иными словами, мы разбиваем пространство гиперплоскостями вида на

области, содержащие белки только одного класса третичной структуры, и принадлежность произвольного белка к определенному классу определяем по тому, с какой стороны от каждой из этих плоскостей находится, или в какую из этих областей попадет точка, соответствующая его спектру.

Для тестирования полученного метода была применена следующая процедура:

Один белок исключался израссмотрения.

Путем применения вышеописанной процедуры классификации определялись решающие функциОу дляуменьшенной обучающей выборки.

На основе вновь полученных решающих функций определялся класс третичной структуры исключенного белка и сравнивался с его классом, известным из рентгеноструктурного анализа.

Подобная процедура повторялась для всех 53 белков.

Результаты тестирования приведены в Табл.1. Качество определения существенно превышает статистическую достоверность случайного правильного определения класса белков, которая составляет -20%. Таким образом, предложенный метод позволяет с достаточно высокой, в рамках данного статистического набора, точностью определить класс третичной структуры белка по его спектру КД.

Данный метод определения класса третичной структуры белков по спектру КД имеет ряд очевидных достоинств:

Во-первых: метод получен и выверен на большом наборе белков с известной из рентгеноструктурного анализа структурой.

Во-вторых: при отсутствии субъективных критериев оценки метод не требует сложных вычислений и предварительной обработки данных.

В-третьих: для анализа применяются спектры белков в наиболее широко используемом и доступном диапазоне длин волн.

Все это делает данный метод удобным орудием для оперативного определения класса третичной структуры белков.

2. Анализ спектров КД белков в состоянии расплавленной глобулы

Необходимо отметить, что из всех известных из литературы расплавленных глобул мы вынуждены были ограничиться только рН-индуцированными, поскольку даже малые концентрации денатурантов делают невозможным измерение спектров КД в наиболее информативной коротковолновой области. Были получены спектры 10ги белков, состояние расплавленной глобулы для которых было тщательно охарактеризовано. Измерения проводились как в нвтивных условиях, так и в условиях формирования расплавленной глобулы (Таблица 2). На рисунке 3 представлены спектры КД в дальней ультрафиолетовой области для Юти белков в состоянии расплавленной глобулы в сравнении со спектрами

Таблица 2. Список белков, исследованных в состоянии кислой расплавленной глобулы

Белок

Условия стабилизации состояния расплавленной глобулы

сс-лактальбумин (корова)

а-лактальбумин (человек)

ß-лактамаза (Bacillus cereus)

Рибонуклеаза А (корова)

Ретинолсвязывающий белок, апо-форма (человек)

Карбангидраза В (корова) Фосфоглицераткиназа (дрожжи) Цитохром с (лошадь) Миоглобин, апо-форма (кашалот) Лептин,(человек)

0.05МКС1,НС1рН2.0

0.05МКС1,НС1рН2.0

0.45М KCl, HCl pH 2.0

HCl pH 1.2

HCl pH 2.0

HCl pH 3.6

lOmMGlypH 3.6

0.5M NaCl, HCl pH 2.2

lOmM ацетат натрия pH 4.3, T=27°C*

20mM ацетат натрия,

20mM фосфат натрия,

20mM пирофосфат натрия,

pH 3.0_

Во всех остальных случаях температура была равна 22°С

соответствующих нативных белков.

Только для трех белков - рибонуклеазы А, коровьего а-лактальбумина и лептина -спектры нативных и денатурированных белков близки. Во всех остальных случаях разностные спектры сравнимы по амплитуде со спектрами расплавленных глобул и/или нативных белков. В некоторых случаях форма разностного спектра не позволяет интерпретировать его как изменение во вторичной структуре. Оба из исследуемых [З-белков -карбангидраза и апо-ретинолсвязывающий белок - имеют необычную форму спектра в нативном состоянии, заметно отличающуюся от типичных спектров нативных белков. Вместе с тем, спектры КД этих двух белков в состоянии расплавленной глобулы существенно ближе к типичным спектрам (3-белК0В. Вероятнее всего такое поведение объясняется вкладом ароматических боковых групп в спектр КД нативного белка в дальней ультрафиолетовой области, который уменьшается в состоянии расплавленной глобулы.

Оценка информационного содержания спектровКДрасплавленныхглобул

На рисунке 3 изображены спектры всех 10га нативных белков и тех же белков в состоянии расплавленной глобулы. Даже простой визуальный анализ этих спектров позволяет прийти к заключению, что спектры расплавленных глобул в дальней ультрафиолетовой области не представляют такого многообразия форм как спектры нативных белков. Так, например, значения молярной эллиптичности [0] на длинах волн 208 и 222 нм (т.е. в точках минимума КД спектров спиральных белков) варьирует в случае нативных белков от -3500 до -20000 и от -300 до -22000 град см2/дмоль, соответственно, тогда как в случае расплавленных глобул [6]го8 принимает значения только от -7,500 до -

- 0 -

о

I 30-

-20-

190 200 210 220 230 240 Длина волны (нм)

190 200 210 220 230 240 Длина волны (нм)

Рис. 3. Спектры Ют нативных белков (а) и тех же белков в состоянии расплавленной глобулы (б).

которое, возможно,

зависит от укладки элементов вторичной структуры, принимает значения от 0,8 до 5,0 для нативных белков, тогда как для расплавленных глобул оно лежит в диапазоне от 1,1 до 1,4.

Таким образом, спектры расплавленных глобул существенно проще спектров нативных белков. Это качественное заключение подтверждается процедурой разложения по существенным значениям Эта процедура позволяет определить

число независимых (ортогональных) спектров, на которые могут быть разложены спектры данного экспериментального набора с данной точностью. Другими словами, подобный метод позволяет оценить число независимых параметров, которые можно получить из анализа имеющегося набора данных, принимая во внимание экспериментальную ошибку. В случае анализа спектров КД белков это значение обычно интерпретируется как число элементов вторичной структуры, вносящих вклад в спектр КД.

Применение процедуры разложения по существенным значениям к нашему набору спектров нативных белков дает значение в 4 независимых компоненты. Наличие более чем Зх независимых компонент типично для наборов спектров нативных белков. С другой стороны, анализ спектров расплавленных глобул дает лишь 3 независимых компоненты. Это подтверждает наблюдение, что спектры расплавленных глобул проще спектров нативных белков. Количественный анализ спектров КД белков в дальней ультрафиолетовой области обычно строится на том предположении, что эти спектры являются суперпозицией вклада трех основных элементов вторичной структуры - и

неупорядоченных петель. Кажется вероятным, что это предположение работает лучше в случае расплавленных глобул, чем в случае нативных белков, поскольку спектры нативных белков могут быть усложнены вкладом ароматических боковых групп и Из

вышесказанного следует, что спектры расплавленных глобул могут лучше описываться простой суперпозицией спектров трех основных элементов вторичной структуры, чем спектры нативных белков.

Оценка содержания вторичной структуры в расплавленных клобулах по спектрам КД: сравнение срентгеноструктурными данными.

Центральным вопрос, на который можно попытаться ответить исследуя спектры КД расплавленных глобул является наличие соответствия между их вторичной структурой и структурой соответствующих нативных белков. С этой целью мы сравнили параметры вторичной структуры расплавленных глобул, оцененные на основании их спектров КД, с рентгеноструктурными данными о вторичной структуруре соответствующих нативных белков.

Структура восьми из десяти исследуемых белков - человеческий и бычий И-лактальбумины, (З-лакгамаза, рибонуклеазаА, аро-РСБ, фосфоглицерат киназа, лептин и цитохром с - была определена с высоким разрешением с помощью рентгеноструктурного анализа. Один из оставшихся белков, карбанкидраза коровы, имеет очень высокую степень гомологии с аналогичным человеческим белком, для которого известна пространственная структура. Для оценочных целей мы приняли, что структуры этих блоков можно считать близкими. Хотя пространственная структура апомиоглобина до сих пор не определена, анализ с помощью ЯМР показал, что его нативная структура схожа со структурой холо-белка, за исключением отсутствия спирали Б. Таким образом, в наших вычислениях мы принимали, что пространственная структура апомиоглобина идентична структуре холо-миоглобина без спирали Б. В наборе белков с исвестной пространственной структурой человеческий и коровий имеют высокую степень гомологии и очень

похожую структуру. На основании опубликованных данных по структуре их расплавленных глобул для дальнейшего анализа был коровий белок.

Отнесение в исследуемых белках базировалось на двух

различных подходах. Мы использовали стандартную программу Э88Р, основанную на популярном алгоритме Кабша-Сандсра для распознавания вторичной структуры. Кроме того, была написана оригинальная программа, реализующая метод Левитта-Грира. Эти методы используют два различных подхода для распознавания вторичной структуры: первый основан на определении водородных связей главной цепи белка, в то время как второй анализирует в основном локальную конформацию полипептидной цепи.

Содержания определенное методами Кабша-Сандера и

Левитта-Грира представлены в Таблице 3. Как можно было предположить, фракции и структур, полученные «жестким» методом Кабша-Сандера меньше, чем значения, полученные методом Левитта-Грира. Значения отличаются, в среднем, на 12% для а-спиралей и на 13% для [5-СТруктурЫ. Однако эти два набора данных хорошо коррелируют друг с другом.

Чтобы оценить взаимосвязь между содержанием вторичной структуры в нативном белке и формой спектра КД белка в состоянии расплавленной глобулы, мы использовали метод определения интегральных параметров вторичной структуры данного белка по его спектру КД и спектрам некоторого набора белков с известной вторичной структурой. Использовалась следующая самосогласованная процедура: выбирался один из 8ми белков и его спектр КД служил входными данными алгоритма Провенчера-Глёкнера, тогда как оставшиеся 7 белков использовались в качестве базового набора, и считалось, что параметры их вторичной структуры совпадают с определенными из рентгеноструктурных

данных. Определялись фракции классов вторичной структуры для выбранного белка, и аналогичная процедура повторялась для остальных белков из списка. В результате, мы получили два набора данных: исходные параметры вторичной структуры, определенные независимо из данных рентгеноструктурного анализа, и аналогичные параметры «пропущенные» через разложение спектров. Поскольку спектры КД белков в дальней ультрафиолетовой области очень чувствительны ко вторичной структуре, корреляция между этими двумя наборами данных должна означать, что содержание классов вторичной структуры в перечисленных расплавленных глобулах близко к параметрам нативных белков,

Таблица 3 Статистический тест содержания элементов вторичной структуры, определенного по спектрам КД

Белок Рентгеноструктурные Оценка из анализа спектров КД

данные

Штивные белки Расплавленные глобулы

««(%) Р(%> «(%) Р(*) «(%) Р(%)

KS ь LG KS LG KS LG KS LG KS LG KS LG

а-лактальбумин (чел) 31 47 8 25 36 47 9 21 47 56 11 14

Р-лактамаза 35 48 18 31 42 46 12 20 32 45 10 25

Рибонуклеаза А IS 29 33 46 33 31 25 39 23 34 23 35

Ретинолсвяз. белок 10 15 45 55 0 11 47 59 0 6 36 54

Карбангидраза 7 19 31 45 16 23 29 44 11 22 36 52

Фосфоглиц. киназа 35 46 11 26 28 45 15 28 32 43 22 32

Цитохром с 41 51 0 13 36 45 6 21 44 58 0 3

Апомиоглобин 60 69 0 0 58 72 0 1 49 58 6 10

Лептин 56 68 0 0 63 68 0 1 65 54 0 0

Гс 0.99 0.96 0.90 0.99 0.96 0.95 0.89 0.90 0.90 0.92

RMSd 12 13 9 3 4 6 9 9 7 8

а а, Р - содержание сс-спиралск и Р-структуры, соответственно;

® КБ, 1_0 - содержание вторичной структуры, определенное по методам Кабша-Сандера и Левита-Грира, соответственно;

сПирсоновскийхоэффициэнткорреляции г = ¿у

^Среднеквадратичное отклонение Ш8 = [^(х1 -у,)2 /(А'-1)]"2

Здесь х, и у, - реперные (Х-гау) и вычисленные (КД) значения, соответственно, и N - число использованных белков.

Нативные белки

Рис. 4. Содержание элементов вторичной структуры, определенное из рентгеноструктурных данных по методу Кабша-Савдера ( о) и Левитга-Грира ( • ) для 8ми белков против содержания тех же элементов вторичной структуры, определенного через самосогласованную процедуру разложения спектров К Д.

определенным на основании данных рентгеноструктурного анализа.

На графиках, приведенных на рис. 4, отложены значения содержания а- И (5-структуры в восьми белках, определенные из рентгеноструктурного анализа, против аналогичных параметров, полученных с помощью описанной выше процедуры. Чем ближе лежат точки к диагонали, тем лучше корреляция между ренттеноструктурными и спектральными данными. Эта корреляция описывается количественно Пирсоновским коэффициентом корреляции (г) (Таблица 3).

В случае спектров нативных белков значения г и среднеквадратичного отклонения (RMS) близки к опубликованным для других базовых наборов белков. Это означает, что размер нашего набора белков достаточен для статистического анализа. Необходимо отметить, что хотя метод Левитта-Грира дает лучшие результаты для (Х-СПиралей (большие значения г и меньший RMS) , применение метода Кабша-Сандера приводит к лучшему определению содержания (3-ируК1уры. Это противоречит опубликованному ранее наблюдению, что метод метод Левитта-Грира дает лучшие результаты при спектральном анализе как

Значения г и RMS, полученные для набора спектров расплавленных глобул во всех случаях хуже по сравнению с нативными белками, но не существенно. Значение Т для содержания СС-СПИралеЙ близко к 0,7 для метода Кабша-Сандера и к 0,9 для метода Левитта-Грира, что практически повторяет ситуацию с нативными белками. Значение Г ДЛЯ р-структуры близки к 0,8 для обоих методов. Такие высокие значения корреляции позволяют говорить о наличии соответствия между вторичной структурой нативных белков и формой спектра КД соответствующих расплавленных глобул. Это, в свою очередь, приводит нас к заключению, что вторичная структура расплавленных глобул может быть близка к структуре соответствующих нативных белков. Эти структуры могут быть более подвижными, некоторые их элементы могут быть полностью или частично разрушены, но основная часть остается неповрежденной, что отражается в их спектре КД.

На первый взгляд, кажется, что полученные данные не согласуются с результатами, полученными при исследовании водород-дейтериевого обмена, которые говорят о том, что в расплавленных глобулах сохраняется только часть нативной вторичной структуры. Однако, это противоречие может быть объяснено тем фактом, что на КД спектры в дальней ультрафиолетовой области оказывает влияние любой существенно населенный структурный элемент, в то время как защита амидных протонов от дейтерообмена возможна лишь для относительно стабильных структур с ограниченными флуктуациями. Ярким подтверждением этого предположения является тот факт, что амплитуда спектра КД человеческого а-лактальбумина в состоянии расплавленной глобулы заметно увеличивается, хотя лишь половина СС-СПИральных участков защищена от дейтерообмена, н т ы не

защищены совсем.

Главным результатом проведенного нами анализа можно считать тот факт, что содержание в состоянии расплавленной глобулы близко к значениям,

полученным для соответствующих белков из ренттеноструктурных данных. Это свидетельствет в пользу того, что вторичная структура в состоянии расплавленной глобулы обычно близка к структуре нативного белка. Вместе с близкой компактностью это означает

сходство общих характеристик расплавленной глобулы и нативного состояния белковых молекул.

Наличие корреляции между спектральными характеристиками и параметрами вторичной структуры позволяет использовать полученный набор спектров для предсказания содержания вторичной структуры в расплавленных глобулах по их спектрам КД. Точность метода может быть оценена из значений корреляции и RMS приведенных в таблице 3. Метод был применен для анализа вторичной структуры нескольких белков в частично денатурированном состоянии.

ВЫВОДЫ

1. Исследована корреляция между спектрами КД глобулярных белков и принадлежностью их к определенному классу третичной структуры.

2. Впервые предложен численный метод определения класса третичной структуры белка по его спектру КД. Достоверность определения составляет 75-100% в зависимости от класса.

3. Исследовано информационное содержание спектров КД белков в "кислой" денатурированной форме. Показано, что оно заметно ниже, чем в случае нативных белков.

4. Показано наличие корреляция между спектрами КД белков в состоянии расплавленной глобулы и содержанием вторичной структуры в нативных белках. Впервые показано наличие соответствия между содержанием в нативном белке и в промежуточном состоянии.

5. Продемонстрирована возможность анализа вторичной структуры ненативных белков по их спектрам КД.

Списокработ, опубликованныхпотеме диссертации:

1. Василенко К.С., Веньяминов СЮ. Чувствительность кругового дихроизма к классу третичной структуры исследуемых белков. Тезисы VII всесоюзной конференции по спектроскопии биополимеров, Харьков, СССР, 1991.

2. Vassilenko K.S., Venyaminov S.Yu. Assignment of protein tertiary structure class from circular dichroism spectra. Abstracts of 5th International conference on circular dichroism, p.68, Pingree Park, Colorado, USA, August 18-22,1993.

3. Venyaminov S.Yu., Vassilenko K.S. Determination of protein tertiary structure class from circular dichroism spectra. Anal. Biochem. 1994, V.222, p.176-184.

4. Uversky V.N., Kutyshenko V.P., Protasova N.Yu., Rogov V.V., Vassilenko K.S., Gudkov A.T. Circularly permuted dihydrofolate reductase possesses all the properties of the molten globule state, but can resume functional tertiary structure by interaction with its ligands. Protein Sci. 1996,V.5,p.l844-1851.

5. Vassilenko K.S., Uversky V.N., Ptitsyn O.B. Native-like secondary structure of molten globules. Abstracts of International symposium on protein structure stability and folding. Fundamental and medical aspects. Moscow, 1998.

6. Kuznetsova I.M., Vassilenko K.S., Biktashev A.G., Khaitlina S.Y., Turoverov KK, Uversky V.N. Effect of self-association on the structural organization of partially folded proteins. Biophys J. 1999, V.77, p.2788-2800.

7. Vassilenko K.S., Uversky V.N. Native-like secondary structure of molten globules. Biochim Biophys Acta. 2002, V.1594, p.168-177.

Принято к исполнению 13/10/2004 Исполнено 13/10/2004

Заказ № 367 Тираж: 100 экз.

ООО «11-й ФОРМАТ» ИНН 7726330900 Москва, Балаклавский пр-т, 20-2-93 (095)747-64-70 (095)318-40-68 www autoreferalru

№19 4 81

Содержание диссертации, кандидата физико-математических наук, Василенко, Константин Станиславович

Список использованных сокращений и обозначений.

ВВЕДЕНИЕ.

ГЛАВА 1. ЛИТЕРАТУРНЫЙ ОБЗОР.

1.1. Основные методы анализа структуры белков по их спектрам кругового дихроизма.

1.1.1. Анализ с помощью спектров «идеальных» элементов вторичной структуры.

1.1.1.1. Использование спектров модельных пептидов.

1.1.1.2. Получение базовых спектров из спектров белков с известной структурой.

1.1.1.3. Метод выпуклого граничного анализа спектров КД.

1.1.2. Непосредственное использование в разложении спектров белков с известной вторичной структурой.

1.1.2.1. Метод гребневой регрессии.

1.1.2.2. Разложение по существенным значениям.

1.1.2.3. Метод гибкого выбора решения.

1.1.2.4. Метод нейронных сетей.

1.1.3. Чувствительность спектров КД к супер вторичной структуре глобулярных белков.

1.2. Белки в состоянии «расплавленной глобулы».

1.2.1. Равновесное состояние расплавленной глобулы.

1.2.2. Расплавленная глобула как кинетический интермедиат.

ГЛАВА 2. МАТЕРИАЛЫ И МЕТОДЫ.

2.1. Получение набора спектров белков с известным классом третичной структуры.

2.2. Методы факторного анализа и теории распознавания образов.

2.2.7. Поиск значащих компонент.

2.2.2. Метод решающих функций.

2.2.3. Метод иерархической классификации, или кластерного анализа.

2.3. Получение и анализ спектров КД белков в состоянии расплавленной глобулы.

РЕЗУЛЬТАТЫ И ИХ ОБСУЖДЕНИЕ.

ГЛАВА 3. АНАЛИЗ ЧУВСТВИТЕЛЬНОСТИ СПЕКТРОВ КД

ГЛОБУЛЯРНЫХ БЕЛКОВ К КЛАССУ ТРЕТИЧНОЙ СТРУКТУРЫ.

3.1. Представление спектра в виде точки в пространстве амплитуд.

3.2. Получение набора спектров белков с известным классом третичной структуры.

3.3. Визуализация распределения образов в пространстве.

3.4. Исследование распределения образов с помощью иерархической классификации.

3.5. Построение алгоритма определения класса третичной структуры белка по его спектру КД.

ГЛАВА 4. АНАЛИЗ СПЕКТРОВ КД БЕЛКОВ В СОСТОЯНИИ

РАСПЛАВЛЕННОЙ ГЛОБУЛЫ.

4.1. Спектры КД нативных белков и белков в состоянии расплавленной глобулы.

4.2. Информационное содержание спектров КД расплавленных глобул.

4.3. Оценка содержания вторичной структуры в расплавленных глобулах по спектрам КД: сравнение срентгеноструктурными данными.

ВЫВОДЫ.

Благодарности.

Введение Диссертация по биологии, на тему "Использование спектроскопии кругового дихроизма для анализа супервторичной структуры нативных и денатурированных белков"

Актуальность проблемы. Спектроскопия кругового дихроизма (КД) широко применяется для анализа интегральных параметров вторичной структуры глобулярных белков. Такое использование метода основано на предположении, что вид спектра в дальней ультрафиолетовой (УФ) области в наибольшей степени зависит от локальной конформации полипептидной цепи, которая как раз и описывается в терминах вторичной структуры. Однако, в последнее время становится все более очевидно, что подобная простая интерпретация спектральных данных является слишком грубой моделью, возможности которой ограничены. Имеется ряд свидетельств, как экспериментальных, так и теоретических, указывающих на то, что более высокие уровни организации белков также могут оказывать существенное влияние на форму и амплитуду спектров. Прежде всего, речь идет об особенностях укладки элементов вторичной структуры в белковую глобулу. С другой стороны, за последние годы накоплен большой экспериментальный материал по белкам в частично денатурированном состоянии, так называемых "расплавленных глобулах". Считается, что в таких белках третичные взаимодействия ослаблены, но основная часть вторичной структуры остается неизменной. Систематическое сравнение спектров белков в нативном и частично денатурированном состоянии позволит исследовать влияние плотной упаковки на спектры КД. Представленная работа посвящена исследованию чувствительности спектров кругового дихроизма к супервторичной структуре глобулярных белков. Рассмотрена возможность определения класса третичной структуры белка по его спектру. Также проанализированы спектры КД белков в состоянии расплавленной глобулы и исследована возможность оценки их структурных параметров. Цель и задачи исследования. Основной целью работы является исследование возможности анализа супервторичной структуры глобулярных белков с помощью спектроскопии кругового дихроизма. В задачи исследования входило:

1. Систематический анализ большого набора спектров КД белков различных структурных классов. Проверка наличия корреляции между формой спектра белка и его классом третичной структуры.

2. Создание алгоритма определения класса третичной структуры глобулярного белка по его спектру КД. Определение достоверности метода.

3. Сравнение информационного содержания набора спектров белков в нативном и в "расплавленном" состоянии. Проверка предположения о нативоподобности вторичной структуры расплавленных глобул.

Научная новизна работы. Впервые статистически достоверно показано наличие корреляции между формой спектров КД глобулярных белков и принадлежностью их к определенному классу третичной структуры. Показано, что спектральные образы в многомерном пространстве амплитуд образуют выраженные кластеры, соответствующие тому или иному классу третичной структуры. Впервые предложен численный метод определения класса третичной структуры белка по его спектру КД. Достоверность определения составляет 75-100% в зависимости от класса. Впервые исследовано информационное содержание набора спектров КД белков в "кислой" денатурированной форме и показано, что оно заметно ниже, чем в случае нативных белков. Продемонстрировано наличие корреляции между формой спектра и содержанием вторичной структуры в денатурированном белке. Предложен метод анализа вторичной структуры ненативных белков по их спектрам КД.

Практическое значение работы. Практическое применение полученных результатов возможно в двух областях:

- оперативное определение параметров третичной структуры глобулярных белков в растворе. Метод активно используется на практике - на него ссылаются в двух учебниках и в 15ти научных статьях.

- анализ параметров вторичной структуры частично денатурированных белков, для которых неприменимы стандартные методы, основанные на спектроскопии КД.

Структура диссертации. Диссертационная работа состоит из «Введения», четырех глав, «Выводов» и «Списка литературы». Во «Введении» освещены актуальность изучаемой проблемы и цели исследования, а также отражена научная новизна работы. Глава 1 посвящена описанию и анализу литературных данных, отражающих современное состояние проблемы анализа структуры глобулярных белков по спектрам КД, а также освещены основные аспекты исследования белков в состоянии расплавленной глобулы. В главе 2 описаны материалы и методы, использованные в данной работе. В главе 3 представлено исследование чувствительности спектров кругового дихроизма к классу третичной структуры глобулярных белков. Глава 4 посвящена анализу спектров КД белков в состоянии расплавленной глобулы. В конце диссертации приведены основные выводы данной работы и список цитируемой литературы в алфавитном порядке.

Основные результаты диссертации опубликованы в 7ми печатных работах, в том числе в 4х статьях в рецензируемых журналах.

Заключение Диссертация по теме "Биофизика", Василенко, Константин Станиславович

выводы

1. Показано наличие корреляции между спектрами КД глобулярных белков и принадлежностью их к определенному классу третичной структуры.

2. Впервые предложен численный метод определения класса третичной структуры белка по его спектру КД. Достоверность определения составляет 75-100% в зависимости от класса.

3. Исследовано информационное содержание спектров КД белков в "кислой" денатурированной форме. Показано, что оно заметно ниже, чем в случае нативных белков.

4. Показано наличие корреляции между спектрами КД белков в состоянии расплавленной глобулы и содержанием вторичной структуры в нативных белках. Впервые показано наличие соответствия между содержанием (3-структуры в нативном белке и в промежуточном состоянии.

5. Продемонстрирована возможность анализа вторичной структуры ненативных белков по их спектрам КД. th,

Благодарности.

Большая часть данной работы выполнена в лаборатории физики белка Института белка РАН.

Я хочу выразить признательность и благодарность моему руководителю и учителю Олегу Борисовичу Птицыну, к сожалению, ныне покойному, прежде всего за трезвый взгляд на науку, который он старался мне привить и за постоянную поддержку. Я благодарен Геннадию Васильевичу Семисотнову за внимание к моей работе, а также Владимиру Николаевичу Уверскому за его неуемную энергию и неоценимую помощь. Спасибо Алексею Витальевичу Финкельштейну и всему коллективу лаборатории физики белка за бесценные советы, постоянную помощь и создание изумительной рабочей атмосферы. Особая благодарность Сергею Юрьевичу Веньяминову, который инициировал эту работу.

Отдельно мне хочется поблагодарить мою жену Олю и всех моих родных и друзей за моральную поддержку и помощь.

Библиография Диссертация по биологии, кандидата физико-математических наук, Василенко, Константин Станиславович, Пущино

1. Болотина И. А. Определение вторичной структуры белков из спектров кругового дихроизма. V. Вторичная структура белков в состоянии "расплавленной глобулы". // Мол. Биол. 1985. Т.21. С.1625-1635.

2. Болотина И. А., Чехов М. О., Лугаускас В. Ю., Финкельштейн А. В., Птицын О.Б. Определение вторичной структуры белков из спектров кругового дихроизма. I. Спектры а-, (3- и неупорядоченной структур. // Мол. Биол. 1980a. Т.14. С.701-709.

3. Болотина И. А., Чехов М. О., Лугаускас В. Ю., Птицын О.Б. Определение вторичной структуры белков из спектров кругового дихроизма. И. Расчет вклада p-поворотов. // Мол. Биол. 1980b. Т.14. С.709-715.

4. Болотина И. А., Чехов М. О., Лугаускас В. Юм Птицын О.Б. Определение вторичной структуры белков из спектров кругового дихроизма. III. Получение реперных спектров для паралледьной и антипараллельной Р-структуры. // Мол. Биол. 1981. Т.15. С.130-137.

5. Долгих Д: А., Абатуров Л. В., Бражников Е. В., Лебедев Ю.О., Чиргадзе Ю.Н. Кислая форма карбангидразы В; "расплавленная глобула" со вторичной структурой. // Докл. АН СССР 1983. Т.272. С. 1481-1484.

6. Птицын О.Б. Многостадийный механизм самоорганизации белковых молекул.//Докл. АН СССР 1973. Т.212. С.1213-1215.

7. Родионова Н.А., Семисотнов Г.В., Кутышенко В.П., Уверский В.Н., Болотина И.А., Бычкова В.Е., Птицын О.Б. Двустадийное равновесное разворачивание карбангидразы В. // Мол. Биол. 1989. Т.23. С.683-692.

8. Тихонов А.Н., Арсенин В.Ю. Методы решения некорректно поставленых задач. М. Р. Наука 1974.

9. Уверский В.Н., Птицын О.Б. Трехстадийное равновесное разворачивание малых глобулярных белков сильными денатуратами: Карбангидраза В // Мол. Биол. 1996. Т.ЗО. С. 1124-1134.

10. Шубин В.В., Хазин М.Л., Ефимовская Т.В. Определение вторичной структуры глобулярных белков по их спектрам кругового дихроизма. // Мол. Биол. 1990. Т.24. С. 165-1-76.

11. Adler A. J., Greenfield N. J., Fasman G. D. Circular dichroism and optical rotatory dispersion of proteins and polypeptides. // Methods Enzymol. 1973. V.27. P.675-735.

12. Adzhubei A. A., Sternberg M. J. E. Left-handed polyproline II helices commonly occur in globular proteins // J. Mol. Biol. 1993. V.229. P.472-493.

13. Andrade M. A., Chacon. P., Merelo J. J., Moran. F. Evaluation of secondary structure of protein from UV circular dichroism spectra using an unsupervised learning neural network. // Protein Eng. 1993. V.6. P.383-390.

14. Aune K.C., Salahuddin A., Zarlengo M.H., Tanford C. Evidence for residual structure in acid- and heat-denatured proteins. // J. Biol. Chem. 1967. V.242. P.4486-4489.

15. Baldwin R.L., Roder H. Characterizing protein folding intermediates. // Current Biol. 1991. V.l. P.218-220.

16. Baldwin R.L. Experimental studies of pathways of protein folding. // Curr. Opin. Struct. Biol. 1993. V.3. P.84-91.

17. Baum J., Dobson C.M., Evans P.A., Hanly C., // Characterization of a partly folded protein by NMR methods. P. jstudies on the molten globule state of guinea pig oc-jlactalbumin. Biochemistry 1989. V.28. P.7-13.

18. Bernstein F.C., Koetzle T.F., Williams G.J.B., Meyer E.F., Brice M.D., Rodgers J.R., Kennaro O., Shimanouchi Т., Tasumi M. The Protein Data Bank. P. a computer-based archival file for macromolecular structures. // J.Mol.Biol. 1977. V.l 12. P.535-542.

19. Bohm G., Muhr R., Jaenicke. R. Quantitative analysis of protein for UVcircular dichroism spectra by neural network. // Protein Eng. 1992. V.5. P.191-195.

20. Brahms S., Brahms J. Determination of protein secondary structure in solution by vacuum ultraviolet circular dichroism. // Mol. Biol. 1980. V.138. P.149-178.

21. Brandts J.F., Hunt L. The thermodynamics of protein denaturation. 3. The denaturation of ribonuclease in water and in aqueous urea and aqueous ethanol mixtures. // J. Am. Chem. Soc. 1967. V.89. P.4826-4838.

22. Bychkova V.E., Berni R., Rossi G.L., Kutyshenko V.P. Ptitsyn O.B. Retinol-binding protein is in the molten globule state at low pH. Biochemistry 1992. V.31. P.7566-7571.

23. Chang. С. Т. Wu C.-S. C., Yang. J. T. Circular dichroic analysis of protein conformation. II. Inclusion of (3-turns. // Anal. Biochem. 1978. V.91. P. 13-31.

24. Chen Y.-H., Yang. J. T. A new approach to the calculation of secondary structures of globular proteins by optical rotatory dispersion and circular dichroism. // Biochem. Biophys. Res. Commun. 1971. V.44. P.1285-1291.

25. Chen Y.-H., Yang. J. Т. and Chau К. H. Determination of the helix and (3-form of proteins in aqueous solution by circular dichroism. // Biochemistry 1974. V.13. P.3350-3359.

26. Chen Y.-H., Yang J. Т., Martinez H. M. Determinaton of the secondary structures of proteins by circular dichroism and optical rotatory dispersion. // Biochemistry 1972. V.ll. P.4120-4131.

27. Chen. G. C., Yang. J. T. Two-point calibration of circular dichrometer with d- 10-camphor-sulfonic acid. // Anal. Lett. 1977. V.10. P.l 195-1207.

28. Chou P. Y., Fasman G. D. (3-Turns in proteins // J. Mol. Biol. 1977. V.l 15. P.135-175.

29. Christensen H., Pain R.H. Molten globule intermediates and protein folding. // Eur. Biophys. J. 1991. V.19. P.221-229.

30. Ghyan C.-L., Wormald C., Dobson C.M., Evans P.A. Baum J. Structure and stability of the molten globule state of guinea-pig a-lactalbumin: a hydrogen exchange study. // Biochemistry 1993. V.32. P.5681-5691.

31. Colon W., Elove G.A., Wakem P., Sherman F. Roder H. Side chain packing of the N- and C-terminal helices plays a critical role in the kinetics of cytochrome с folding. // Biochemistry 1996. V.35. P.5538-5549.

32. Compton. L. A., Johnson. W. C. Jr. Analysis of protein circular dichroism spectra for secondary structure using a simple matrix multiplication. // Anal. Biochem. 1986. V.155. P.155-167.

33. Cooper T.M., Woody R.W. The effect of conformation on the CD of interacting helices. P. a theoretical study of tropomyosin. // Biopolymers 1990. V.30. P.657-676.

34. Dalmas. В., Hunter. G. J., Bannister W. H. Prediction of protein secondary structure from circular dichroism spectra using artificial neural network techniques. // Biochem. Mol. Biol. Int. 1994. V.34. P.17-26.

35. Damaschun G., Gernat C., Damaschun H., Вychkova V.E. Ptitsyn O.B. Comparison of intramolecular packing of a protein in native and "molten globule" states. // Int. J. Biol. Macromol 1986. V.8. P.226-230.

36. Denton J.В., Konishi Y. Sheraga Н.А. Folding of ribonuclease A from a partially disordered conformation. Kinetic study under folding conditions. // Biochemistry 1983. V.21. P.5155-5163.

37. Dobson C.M. Resting places on folding pathways. // Curr.Opin. Struct. Biol. 1992. V.2.P.6-12.

38. Dolgikh D.A., et al., Ptitsyn O.B. Compact state of a protein molecule with pronounced small-scale mobility: bovine a-lactalbumin. // Eur. Biophys. J. 1985. V.13. P. 109-121.

39. Dolgikh D.A., Gilmanshin R.I. Brazhnikov E.V., Bychkova V.E., Semisotnov G.V., Venyaminov S.Yu., Ptitsyn O.B. a-Lactalbumin: compact state with fluctuating tertiary structure? // FEBS Lett. 1981. V.136. P.311-315.

40. Dolgikh D.A., Kolomiets A.P., Bolotina I.A., Ptitsyn O.B. 'Moltenglobule' state accumulates in carbonic anhydrase folding. // FEBS Lett. 1984. V.165. P.88-92.

41. Eliezer D., Wright P.E. Is Apomyoglobin a Molten Globule? Structural Characterization by NMR. //J. Mol. Biol. 1984. V.263. P.531-538.

42. Eliezer D., Yao J., Dyson H.J. Wright P.E. Structural and dynamic characterization of partially folded states of apomyoglobin and implications for protein folding. // Nature Struct. Biol. 1998. V.5. P. 148-155.

43. Elove G.A., Chaffotte A.F., Roder H. Goldberg M.E. Early steps in cytochrome с folding probed by time-resolved circular dichroism and fluorescence spectroscopy. // Biochemistry 1992. V.31. P.6876-6883.

44. Elove G.A., Chaffotte A.F., Roder H., Goldberg M.E. Early steps in cytochrome с folding probed by time-resolved circular dichroism and fluorescence spectroscopy. // Biochemistry 1992. V.31. P.6876-6883.

45. Fersht A.R. The sixth Datta Lecture. Protein folding and stability. P. the pathway of folding of barnase. // FEBS Lett. 1993. V.325. P.5-16.

46. Fink A.L. Compact intermediate states in protein folding. // Annu. Rev. Biophys. Biomol. Struct. 1995. V.24. P.495-522.

47. Finkeistein. A. V. Ptitsyn. О. В.,and Kozilsyn. A. A. Theory of protein molecule self-organization. II. A comparison of calculated thermodynamic parameters of local secondary structure with experiments. // Biopolymers 1977. V.16. P.497-524.

48. Gast K., Zirver D„ Welfle H., Bychkova V.E. Ptitsyn O.B. Quasielastic light scattering of human a-lactalbumin. P. comparison of molecular dimensions in native and "molten globule" states. // Int. J. Biol. Macromol. 1986. V.8. P.231-236.

49. Goto Y. Fink A.L. Conformational states of (3-lactamase. P. molten globule states at acidic and alkaline pH with high salt. // Biochemistry 1989. V.28. P.945-952.

50. Goto Y., Calciano L.J. Fink A.L. Acid-induced folding of proteins. // Proc. Natl. Acad. Sci. U.S.A. 1990. V.87. P.573-577.

51. Greenfield N. J., and Fasman G. D. Computed circular dichroism spectra for the evaluation of protein conformation. // Biochemistry 1969. V.8. P.4108-4116.

52. Griko Yu.V., Privalov P.L., Venyaminov S.Yu. Kutyshenko V.P. Thermodynamic study of the apomyoglobin structure. // J.Mol.Biol. 1988. V.202. P.127-138.

53. Harding M.M., Williams D.H., Woolfson D.N. Characterization of a partially denatured state of a protein by two-dimensional NMR. P. reduction of the hydrophobic interactions in ubiquitin. // Biochemistry 1991. V.30. P.3120-3128.

54. Hennessey J. P., Jr., Johnson W. C., Jr. Experimental errors and their effect on analyzing circular dichroism spectra of proteins. // Anal. Biochem. 1982. V.125. P.177-188.

55. Hennessey J. P., Jr. and Johnson W. C., Jr. Information content in the circular dichroism of proteins. // Biochemistry 1981. V.20. P. 1085-1094.

56. Hughson F.M., Wright P.E. Baldwin R.L. Structural characterization of a partly folded apomyoglobin intermediate. // Science 1990. V.249. P.1544-1548.

57. Jaenicke L. A rapid micromethod for the determination of nitrogen and phosphate in biological material. // Anal. Biochem. 1974. V.61. P.623-627.

58. James T. L. Jr. Assessment of quality of derived macromolecular structure. // Methods Enzymol. 1994. V.239. P.416-439.

59. Jeng M.-F., Englander S.W., Elove G.A., Wand A.J. Roder H. Structural description of acid-denatured cytochrome с by hydrogen exchange and 2D NMR. // Biochemistry 1990. V.29. P.10433-10437.

60. Johnson W. C. Jr. Secondary structure of proteins through circular dichroism spectroscopy. // Anna. Rev. Biophys. Chem. 1988. V.17. P.145-166.

61. Johnson W. C., Jr. Circular dichroism and its empirical application to biopolymers. II Methods Biochem. Anal. 1985. V.31. P.61-163.

62. Johnson. W. C., Jr. Protein secondary structure and circular dichroism: A % practical guide. // Proteins 1990. V.7. P.205-214.

63. Kabsch W., Sander C. Dictionary of protein secondary structure: Pattern recognition of hydrogen-bonded and geometrical features. // Biopolvmers 1983. V.22. P.2577-2637.

64. Kay M.S., Baldwin R.L. Packing interactions in the apomyglobin folding intermediate. // Nature Struct. Biol. 1996. V.3. P.439-445.

65. Kim P.S., Baldwin R.L. Intermediates in the folding reactions of small proteins. // Annu Rev Biochem. 1990. V.59. P.631-660.

66. Kuwajima K. A folding model of a-lactalbumin deduced from the three-state denaturation mechanism. // J. Mol. Biol. 1977. V.l 14. P.241-258.

67. Kuwajima K. The molten globule state as a clue for understanding the folding and cooperativity of globular-protein structure. // Proteins: Structure Function and Genetics 1989. V.6. P.87-103.

68. Kuwajima K., Hiraoka Y., Ikeguchi M., Sugai S. Comparison of the transient folding intermediates in lysozyme and a-lactalbumin. // Biochemistry 1985. V.24. P.874-881.

69. Kuwajima K., Nitta K., Yoneyama M., Sugai S. Three-state denaturation of a-lactalbumin by guanidine hydrochloride. // J. Mol. Biol. 1976. V.106. P.359-373.

70. Magar M. E. On the analysis of the optical rotatory dispersion of proteins. // Biochemistry 1968. V.7. P.617-620.

71. Manavalan P., Johnson W. C., Jr. Variable selection method improves the prediction of protein secondary structure from circular dichroism // Anal. Biochem. 1987. V. 167. P.76-85.

72. Manavalan P., Johnson W. С Jr. Sensitivity of circular dichroism to protein tertiary structure class // Nature 1983. V.305. P.831-832.

73. Manning M. C. Underlying assumptions in the estimation of secondary structure content in proteins by circular dichroism spectroscopy A critical review//J. Pharm. Biomed. Anal. 1989. V.7. P.l 103-1119.

74. Manning M.C., Woody R.W. Theoretical determination of the CD of proteins containing closely packed antiparallel (3-sheets. // Biopolymers 1987. V.26. P. 1731-1752.

75. Marmorino J.L., Pielak С J. A native tertiary interaction stabilizes the A state of cytochrome с. II Biochemistry 1995. V.34. P.3140-3143.

76. Morozova L.A., Haynie D.T., Arico-Muendel C., Van Dael H. Dobson C.M. Structural basis of the stability of a lysozyme molten globule. // Nature Struct. Biol. 1995. V.2. P.871-875.

77. Murzin A. G., Brenner S. E., Hubbard T„ Chothia C. SCOP: a structural classification of proteins database for the investigation of sequences and structures. //J. Mol. Biol. 1995. V.247. P.536-540.

78. Nozaka M., Kuwajima K., Nitta K„ Sugai S. Detection and characterization of the intermediate on the folding pathway of human a-lactalbumin. // Biochemistry 1978. V.17. P.3753-3758.

79. Oberg K.A., V.N. Uversky Secondary structure of homologous proteins a-fetoprotein and serum albumin from their circular dichroism and infrared spectra. // Prot. Pept. Lett. 2001. V.8. P.297-302.

80. Ohgushi M., Wada A. 'Molten-globule state'. P. a compact form of globular proteins with mobile side-chains. // FEBS Lett. 1983. V.164. P.21-24.

81. Pancoska P., Blazek M., Keiderling T. A. Relationships between secondary structure fractions for globular proteins. Neural network analyses of crystallographic data sets. // Biochemistry 1992. V.31. P. 10250-10257.

82. Pancoska P., Keiderling T. A. Systematic comparison of statistical analyses of electronic and vibrational circular dichroism for secondary structure prediction of selected proteins. // Biochemistry 1991. V.30. P.6885-6895.

83. Pancoska P., Yasui S. C., Keiderling T. A. Statistical analysis of the vibrational circular dichroism of selected proteins and relationship to secondary structure // Biochemistry 1991. V.30. P.5089-5103.

84. Park K., Perczel A., Fasman G. D. Differentiation between transmembrane helices and peripheral helices by the deconvolution of circular dichroism spectra of membrane proteins. // Protein Sci. 1992. V.l. P.1032-1049.

85. Pauling L., Corey R. B. Configurations of polypeptide chains with favored orientations around single bonds. P. Two new pleated sheets. // Proc. Nat. Acad. Sci. USA 1951. V.37. P.729-740.

86. Pauling L., Corey R. В., Branson. H. R. The structure of proteins. P. Two hydrogen-bonded helical configurations of the polypeptide chain. // Proc. Nat. Acad. Sci. USA 1951. V.37. P.205-211.

87. Perczel A., Fasman G. D. Effect of spectral window size on circular dichroism spectra deconvolution of protein. // Biophys. J. 1993. V.48. P.19-29.

88. Perczel A., Park K., Fasman G. D. Deconvolution of the circular dichroism spectra of proteins. P. The circular dichroism spectra of the antiparallel (3-sheet in proteins. // Proteins Struct.Funct. Genet. 1992a. V.3. P.57-69.

89. Perczel A., Park K., Fasman G. D. Analysis of the circular dichroism spectrum of proteins using the convex constraint algorithm. P. A practical guide. // Anal. Biochem. 1992b. V.203. P.38-93.

90. Perczel A., Hollosi M., Tusnady G., Fasman G. D. Convex constraint analysis. P. A natural deconvolution of circular dichroism curves of proteins // Protein Eng. 1991 V.4. P.669-679.

91. Pribic R. Principal component analysis of Fourier transform infrared and/or circular dichroism spectra of proteins applied in a calibration of protein secondary structure. // Anal. Biochem. 1994. V.223. P.26-34.

92. Privalov P. L., Tiktopulo E. I., Venyaminov S. Y. Griko Y. V., Makhatadze G. I., Khechinashvili N. N. Heat capacity and conformation of proteins in the denatured state. // J. Mol. Biol. 1989. V.205. P.737-750.

93. Privalov P.L. Stability of proteins: small globular proteins. // Adv. Protein

94. Chem. 1979. V.33. P. 167-241.

95. Provencher S. W. A constrained regularization method for inverting data represented by linear algebraic or integral equations // Comput. Phys. Commun. 1982a. V.27. P.213-227.

96. Provencher S. W. CONTIN: A general purpose constrained regularization program for inverting noisy linear algebraic and integral equations // Comput. Phys. Commun. 1982b. V.27. P.229-242.

97. Provencher S. W. CONTIN user manual // EMBL technical report DA05 1982c.

98. Provencher S. W., Glockner. J. Estimation of globular protein secondary structure from circular dichroism // Biochemistry 1981. V.20. P.33-37.

99. Ptitsyn O.B. How does protein synthesis give rise to the 3D-structure? // FEBS Lett. 1991. V.285. P.176-181.

100. Ptitsyn O.B. // J. Protein Chem. 19. V.6. P.273-279.

101. Ptitsyn O.B. The molten globule state. // In: Protein folding. (Creighton Т.Е., ed.), W.H. Freeman Co., New York, 1992. pp. 245-302.0

102. Ptitsyn O.B. Molten globule and protein folding. // Adv. Prot. Chem. 1995a. V.47. P.83-229.

103. Ptitsyn O.B. Structures of folding intermediates. // Curr. Opin. Struct. Biol. 1995b. V.5. P.74-78.

104. Ptitsyn O.B. How molten is the molten globule? // Nature Struct. Biol. 1996. V.3. P.488-490.

105. Ptitsyn O.B., Uversky V.N. The molten globule is a third thermodynamical state of protein molecules. // FEBS Lett. 1994. V.341. P. 15-18.

106. Radford S.E., Dobson C.M., Evans P.A. The folding of hen lysozyme involves partially structured intermediates and multiple pathways. // Nature 1992. V.358. P.302-307.

107. Radford S.E., Dobson C.M. Evans P.A. The folding of hen lysozyme involves partially structured intermediates and multiple pathways. // Nature 1992. V.358. P.302-307.

108. Richardson J.S. The anatomy and taxonomy of protein structure. 11 Adv. Protein. Chem. 1981. V.34. P. 167-339.

109. Rosenkranz H., Scholten W. An improved method for the evaluation of helical protein conformation by means of circular dichroism. // Hoppe-Seyler's Z. Physoil. Chem. 1971. V.352. P.896-904.

110. Saxena V. P., Wetlaufer D. B. A new basis for interpreting the circular dichroism spectra of proteins. // Proc. Nail. Acad. Sci. USA 1971. V.68. P.969-972.

111. Schulz G. E. and Schirmer. R. H. // In: P. Principles of Protein Structure (C. R. Cantor ed.), Springer-Verlag. Berlin, 1990. PP.66-107.

112. Seigel J. В. Steinmetz W. E., Long G. L. A computer-assisted model for estimating protein secondary structure from circular dichroic spectra. P. Comparison of animal lactate dehydrogenases // Anal. Biochem. 1980. V.104. P.160-167.

113. Shakhnovich E.I., Finkelstein A.V. Theory of cooperative transitions in protein molecules. I. why denaturation of globular protein is a first-order phase transition. // Biopolymers 1989. V.28. P.1667-1680

114. Sreerama N., Woody R. W. A self-consistent method for the analysis of protein secondary structure from circular dichroism. // Anal. Biochem. 1993. V.209. P.32-44.

115. Sreerama. N., Woody R. W. Poly(Pro) II helices in globular proteins. P. Identification and circular dichroic analysis // Biochemistry 1994b V.33. P. 10022-10025.

116. Tanford C. Protein denaturation. // Adv. Protein. Chem. 1968. V.23. P. 121282.

117. Toumadje A., Alcorn S. W., Johnson W. C., Jr. Extending CD spectra ofproteins to 168 nm improves the analysis of secondary structure. I I Anal. Biochem. 1992. V.200. P.321-331.

118. Uversky V. N. Use of fast protein size-exclusion chromatography to study the unfolding of proteins which denature through the molten globule. // Biochemistry 1993. V.32. P.13288-13298.

119. Uversky V. N., Ptitsyn О. B. All-or-none solvent-induced transitions ^ between native molten globule and unfolded states in globular proteins. // Fold.

120. Des. 1996. V.l. P.l 17-122.

121. Varley P., Gronenborn A. M., Christencen H., Wingfield P. Т., Pain R. H. Clore G. M. Kinetics of folding of the all-|3 sheet protein interleukin-1 (3. // * Science 1993. V.260. P.l 110-1113.

122. Vassilenko K.S., Uversky V.N. Native-like secondary structure of molten globules. // Biochim Biophys Acta. 2002. V.1594. P. 168-177.

123. Venyaminov S. Y., Baikalov I. A., Shen Z. M., Wu C.-S. C., Yang J. T. Circular dichroic analysis of denatured proteins: Inclusion of denatured protein in the reference set. // Anal. Biochem. 1993. V.214. P. 17-24.

124. Venyaminov S. Yu., Yang J. T. Determination of protein secondary structure. // In: Circular dichroism and the conformational analysis of biomolecules. (Fasman G.D., ed.), Plenum Press New York, 1996. PP. 69-108.

125. Venyaminov S. Y., Vassilenko K. S. Determination of protein tertiary structure class from circular dichroism spectra. Anal. Biochem 1994. V.222. P. 176-184.

126. Venyaminov S. Y., Baikalov I. A., Wu. C.-S. C., Yang J. T. Some problems of CD analysis of protein conformation. Anal. Biochem. 1991. V.198. P.250-255.

127. Wagner U. G., Miiller N., Schmitzberger W., Falk H., Kratky C. Structure determination of the biliverdin apomyoglobin complex: crystal structure analysis of two crystal forms at 1.4 and 1.5 A resolution. // J. Mol. Biol. 1995. V.247. P.326-337.

128. Wong K.-P., Hamlin L. M. Acid denaturation of bovine carbonic anhydrase B. // Biochemistry 1974. V.13. P.2678-2682.

129. Woody R. W. Circular dichroism and conformation of unordered polypeptides. // Adv. Biophys. Chem. 1992. V.2. P.37-79.

130. Woody R. W., Dunker A. K. Aromatic and cystine side-chain circular dichroism in proteins. // In: Circular dichroism and the conformational analysis of biomolecules. (Fasman G.D., ed.) Plenum Press New York, 1996. PP. 69-108.

131. Woody R. W. Circular dichroism of peptides. // In: The Peplides Vol. 7 (V. J. Hruby ed.), Academic Press New York, 1985. PP. 15-114.

132. Wu J., Yang J. Т., Wu C.-S. C. (3-II conformation of all-(3 proteins can be distinguished from unordered form by circular dichroism. // Anal. Biochem. 1992. V.200. P.359-364.

133. Yang J. T. Optical rotatory dispersion and circular dichroism in. P. A Laboratory Manual of Analytical Methods // In: Protein Chemistry (P. Alexander and H. P. Lundgren, eds.), Pergamon Press. Elmsford. NY, 1969. PP. 23-92.

134. Yang J. Т., Wu C.-S. C., Martinez H. M. Calculation of protein conformation from circular dichroism. // Methods Enzymol. 1986. V.30. P.208-269.