Бесплатный автореферат и диссертация по биологии на тему
Разложение составных спектров триптофановой флуоресценции белков
ВАК РФ 03.00.02, Биофизика

Автореферат диссертации по теме "Разложение составных спектров триптофановой флуоресценции белков"

РГ6 ОА

, \ПР <ООдРОССИЙСКАЯ АКАДЕМИЯ НАУК 2 Ь ЛИ» ИНСТИТУТ ТЕОРЕТИЧЕСКОЙ

И ЭКСПЕРИМЕНТАЛЬНОЙ БИОФИЗИКИ

На правах рукописи УДК 577.336+577.34

АБОРНЕВ Сергеи Михайлович

РАЗЛОЖЕНИЕ СОСТАВНЫХ СПЕКТРОВ ТРИПТОФАНОВОЙ ФЛУОРЕСЦЕНЦИИ БЕЛКОВ

03.00.02 — биофизика

Автореферат

диссертации на соискание ученой степени кандидата физико-математических наук

ПУЩИНО - 1993

Работа выполнена в лаборатории функциональной биофизики белка Института теоретической и экспериментальной биофизики РАН, Пущино.

Научный руководитель — доктор биологических наук Э. А. Бурштейн

Официальные оппоненты:

доктор физико-математических наук Котельников А. И.,

кандидат биологических наук Карнаухов В. Н.

Ведущая организация: Институт молекулярной биологи» РАН.

Защита состоится «_» _ 1993 г. в _ часов

на заседании специализированного совета Д 200.22.01 при Институте теоретической и экспериментальной биофизики РАН (142292, г. Пущино Московской области, ПТЭБ РАН).

С диссертацией можно ознакомиться в библиотеке ПТЭБ РАН.

Автореферат разослан «_» _ 1993 г.

Ученый секретарь специализированного совета кандидат биологических наук

П. А. НЕЛ ИПОВИЧ

Актуальность__проблемы. Параметры флуоресценции остатков

триптофана,чувствительны к микроокруженшо хромофора в белковой, глобуле. Поэтому триптофановая флуоресценция в настоящее время широко используется для изучения как физических , и динамических свойств микроокружения остатков'триптофана, так и структурного поведения белковой молекулы В целом. Еще в. 60-х годах было установлено, что триптофанил внутри белковой глобулы в низкодалярном микроокругении в большинстве случаев имеет ■коротковолновое положение максимума спектра флуоресценции (329-331 нм) к относительно низкий квантовый выход (0,07-0,10). В то же время триптофанил на поверхности белковой глобулы в высокополярнсм' водном микроокрузкении характеризуется (как и свободный триптофан в воде.) положением максимума. 350-353 гол- и квантовым выходом 0,20-0,25 (Teale, Weber, -1960). Уже эти выводы позволяли на основе спектров флуоресценции судить' о характере микроокружения остатка триптофана в. белках, и о характере изменений микроокружения в ходе- структурных, перестроек. Однако положения максимумов спектров триптофзновой' флуоресценции большинства белков часто имеют'промежуточное (между 330 и 345 нм) значение, поскольку, имея в своем составе, как правило, более одного триптофанового остатка, эти белки . обладают составными ' спектрами флуоресценции, часто содержащими более одной элементарной компоненты. Это затрудняет однозначную интерпретацию этих спектров с точки зрения описания" состояния отдельных флуорофоров или конформеров бежа и ставит задачу создания методов разложения спектров -на элементарные компоненты.

Одной из первых попыток решения этой задада явилась предложенная в 1968 г. Коневым и Волотовским модель двух дискретных состояний,, согласно которой все спектры флуоресценции белков являются суммой элементарных спектров- флуоресценции триптофанилов двух дискретных классов.. Позже Бурштейн, Веденкяна и Ивкова (1972-1973), используя . дополнительную информацию о ширине спектров флуоресценции, усовершенствовали- эту модель, предположив существование в 'белках трех дискретных структурно-физических состояний остатков триптофана. 3 их модели, помимо числа возможных классов спектров триптофановой (Флуоресценции, сделаны жесткие предположения, и о положении максимума и ширине спектров каждого из классов. Е настоящее время появились ноЕые данное о форме спектров триптофзновой флуоресценции и ноше технические возможности (мощные ЭВМ), что позволяет создать методы разложения составных спектров белков

Оез столь жестких априорных постулатов.

Задача создания методов точного и однозначного разложения . спектров сильно затрудняется относительно небольшими (по сравнении с полушириной) расстояниями между максимумами соседних компонент: при полуширине большинства гладких спектров флуоресценции элементарных компонент :з белках от 40 до. 60 нм, расстояния между соседними максимумами может варьировать, судя по однокомпонентным спектрам некоторых белкоз, лишь от 1.0 до 30435 нм. Это приводит к тому, что большинство . белков имеет также гладкие, бесструктурные . спектр! триптофановой флуоресценции, и делает практически невозможным однозначное разложение этих спектров на компонента без привлечения сильных дополнительна факторов. Наиболее существенным (в, как показала практика,' плодотворным) фактором для успешного разложения спектров триптофановой флуоресценции белков на компоненты явились возможность аналитического задания формы элементарного спектра в виде лог-нормальной функции.

Цели и задачи исследования. Главная цель данной работы -анализ компонентного состава спектроз флуоресценции остатков триптофана в белках. Эта цель, достигалась в решении следующих более' частных задач: . ■

1. Создание новых методов разложения спектров триптофановой грлуоросценция белков, основанных на однопараметрическом лог-аорыалыюм описании формы спектров отдельных компонент.

2. Статистический анализ частоты встречаемости отдельных элементарных - компонент спектров флуоресценции остатков триптофана в белках путем применения разработанных методов для раз.южения на компоненты спектров флуоресценции достаточно большого числа реальных белков в анализа кривых плотности верэятности встречаемости отдельных компонент.

Научная новизна полученных результатов.. Впервые созданы компьютерные методы разложения, позволяющие достаточно точно и однозначно определять число и параметры компонент в составном eneктре^триптофановой флуоресценции белка без большого числа априорных предположений о существовании тех или иных элементарных компонент.

Статистический анализ результатов разложения на компоненты спектров триптофановой флуоресценции вескс^ьких десятков белков, нередко в различных структурных состояниях, в целом подтвердил гипотезу о дискретности структурно-физических и спектро-

■ СК0ПИЧ9СКИХ:состояний триптофана в белке.

Практическая ценность.

1. Созданы простые, эффективные и удобные для широкого использования алгоритмы и программы разложения спектров триптофановой флуоресценции белков на компоненты, которые можно рекомендовать для широкого использования.

2. Результаты статистического анализа встречаемости отдельных компонент нэ могут не учитываться при построении обеих концепций взаимосвязи между параметрами флуоресценции и структурно-физическими свойствами белков.

Аппробация_работы. Основные результаты работы были доложены на научном семинаре Лаборатории функциональной биофизики белка №ститута теоретической и экспериментальной биофизики РАК, Пуцино, 1591, на VII Всесоюзной конференции по спектроскопии биополимеров (Харьков, 1991), а также опубликованы в статье "Разложение спектров флуоресценции остатков триптофана нз лог-нормалыше компоненты методом наименьших квадратов" ("Молекулярная биология", т.26, N5, 1992).

Публикации. Основные результаты диссертации опубликованы з трех работах.

Структура_и_объем_Еабдты. Диссертация состоит из пЕедекия, четырех глаз, заключения, еыводов, списка цитируемой литературы л приложения, включающего компьютерные программы. Работа изложена на ' 125 страницах, содэрзетт 13 рисунков и 7 таблиц. В список цитируемой литературы входит юз наименования.

ОБЩИЗ ТРЕБОВАНИЯ К АЛГОРИТМАМ .РАЗЛОЖЕНИЯ . СПЕЯТРОЗ ТЕИПТООАНОВОЯ ФЛУОРЕСЦЕНЦИИ БЕЛКОВ.

Проблема разложения многокомпонентных спектров относится к классу типичных обратных задач, так как интересующие исследователя характеристики' долены быть определены по . результатам измерений их косвенных проявлений в суммарном спектре. Решение таких задач, как правило, неустойчиво к малкм изменениям исходных данных (шумам). А поскольку исходные дашшо известны приближенно, т.е. с больней или меньшей экспериментальной ошибкой, то эта неустойчивость приводит к заведомой неоднозначности решения в рамках датой точности. По этому признаку задача относится, согласно Тихонову и Арсонину, к классу некорректных задач. Для получения достаточно устойчивого решения необходимо сформулировать некий принцип выбора оцгюго возможных решений, основанный на иеггаль.'ев^к^ догголнк'Гчльной

.информации о системе и о самом решении. Дополнительная информация лежит в основе регуляризации решения. Регуляризующче факторы (функции, алгоритмы или логические предпосылки) позволяют создать практические способы решения некорректных задач.

Для_ создания алгоритмов разложения многокомпонентных спектров флуоресценции остатков триптофана в белке . нами использованы следующие основные , ре1-уляризущие и повышающие точность разложения факторы:

1) Спектр эломантаргой компоненты в шкале • частот (волновых чисел) описывается четырехпараметрической (максимальная амплитуда, положение максимума и два положения полтмаксималышх амплитуд, см.рис.1) лог-нормальной фушцией в зеркально-симметричной форме по отношению к функции Сиано и Метцлера (формула (1)).

.(V )--!_• е2р{-1п2/(1пр)<"

где Р=(Ут-7>_)/^+^т)

11п((а-г>)/(а-т>т))] } при г<а

1(У)=0 ЩШ

асимметрия спектра.

(1)

V» -

а=г>т + (г+-г_).р/(р-1), - макммальнвя интенсивность, положение максимума спектра, v+, т>_ - положение точек, в которых интенсивность флуоресценции равна половине максимальной.

Рис.1. Основные параметры лог-нормального представления спектра флуоресценции в шкале частот (волновых чисел) V: 1П-максимальная интенсивность; г>_- положение

ш

- положения

максимума; и полумаксималь-шх интеЕсивностей; а - предельный параметр функции.

Однозначная линейная связь кэжду положением максимума и положением полумаксимальных амплитуд (г+ и формула (2)), установленная Веденкиной и Огельяненко для большой серии однокомпонентных спектров различных , низкомолакулярных производных триптофане в разных растворителях, позволяет уменьшить число неизвестных параметров для каждой компоненты с 4

«V

' до 2 (максимальная амплитуда и положение максимума).

• У+=0,8308-^+7071 (СМ-1). г>_=1,1768-^-7681 (см-1) (2)

Снижение же числа искомых параметров, как известно, значительно повышает однозначность разложения.

2) При тушении флуоресценции триптофана и его .производных водорастворимыми тушителями положение и форма спектров не изменяются. Серия спектров, измеренных при разных концентрациях тушителей, вследствие этого, представляет собой массив, в котором параметры положение и форма компонент постоянны, а переменны лишь их. относительные вклады. . Такое расширение 'статистического массива также служит увеличению однозначности разложения.

3) Изменение амплитуд отдельных -компонент при тушении подчиняется известному закону Штерна-Фольмера.

4) Наконец, важным фактором является использование, избыточной информации. Для разложения используются практически все экспериментально измеренные точки в наборе спектров, в результате чего число экспериментальных точек намного превышает число искомых параметров, что понижает влияние отделыгых шумовых флуктуаций и положительно сказывается ка точности и однозначности разложения.

Использование этих факторов позволило нам создать два ноеых метода достаточно устойчивого разложения спектров триптофановой флуоресценции белков, погрешность которых не превышает. экспериментальную.-

Первый из этих методов основан на простой минимизации средней квадратичной погрешности в результате прямого перебора всех возможных сочетаний положений максимумов спектров лог-пормальных компонент (последовательно задается искомое число компонент от 1 до 3). Второй же алгоритм основан на графическом анализе следов спектров в фазовом пространстве, свойства которого таковы,- что вариация вкладов постоянных по форме компонент приводит к легко экстраполируемым линейным трекам, а пересечение таких Треков с кривой, соответствующей совокупности чистых однокомпонентных элементарных спектров позволяет оценить главные параметры компонент - положения их максимумов в спектре.

Тот факт, что эти методы основаны на существенно различных логико-математических принципах, дает багу для допечжтелькоЯ: оценки "истинности" найденных решений п-> глотав сорпг..1-у!:\~

результатов, полученных этими двумя методами.

МЕТОД НАИМЕНЬШИХ КВАДРАТОВ.

Основы_метоаа. Математической базой этого метода является подгонка экспериментальных спектров суммой теоретических компонент путем перебора всех возможных параметров элементарных спектров. Критерием достижения решения служит минимизация средне-квадратичных разностей (невязок) меаду этими двумя типами' спектров.

Если вклада компонент в общий спектр изменять, сохраняя постоянными положение и форму их спектров (например, путем изменения концентрации тушителя), то, в общем случае, экспериментальные спектры описываются следующей системой уравнений:

1

Р(1,3) = 2 1(к,1)-фС:,3) к=1

где 1=1.....N - номер спектра, -соответствующий концентрации

тушителя С(1); ¿=1м - номер текущей частоты (волнового числа) ) в - спектре, измеренном по точкам; к - номер компоненты; определяемый голокением максимума (к) (к=1,...,1); ?(1,- экспериментальная интенсивность флуоресценции в шкале волновых чисел в 1-том спектре при З-той текущей частоте; <р(к,;|) - нормированное по максимальной амплитуде' к еданкце значеше лог-нормальной функции с положением максимума ^ш(к) при текущей частоте г>(3) (это значение при данных к и 3 неизменно для всех и спектров); 1(к,1) - интенсивность в максимуме к-той компоненты ¿-того спектра (в масштабе заданных экспериментальных спектров Г<1.3)>. ■ '

Задача заключается в том, чтобы по -известным экспериментальным спектрам Р(1,отыскать такие положения ^(к) и максимальные интенсивности 1(к,1) составляющих их спектров компонент, которые обеспечивают суммарные теоретические спектры, минимально отличающиеся от экспериментальных. Решение этих уравнений аналитически, к сожалению, невозможно, ввиду того, что лог-нормальная функция <р(к,3) (см. уравнение (1)) существенно трансцендентна относительно искомых неизвестных (Уш(к)). Следовательно, поиск решения возможен только с помощью приближенных методов. Одним из таких способов в нашем случае является подгонка'теоретических спектров к экспериментальным, то есть поиск такого сочетания задаваемых г>Е(1),....^т(Ь), которое

соответствует минимуму невязки. При атом на каждом шаге поиска все трансцендентные члены фОс.З) вычисляются, а неизвестные 1(к,1) затем легко определяются аналитически.

Из всех методов поиска минимума мы остановились на методе полного перебора. Такой способ, во-первых,' позволяет избежать "застревания" в локальных минимумах . функционала (среднеквадратичной невязки) и найти минимум глобальный, что очень важно в случае 'наличия, значительных "шумов" минимизируемой средней невязки. Этот фактор очень существенен, т.к. предварительные исследования, проведенные В.И.Емельяненко (личное сообщение), показали, что при использовании реальных спектров флуоресценции такие шумы функционала разложения весьма значительны. Во-вторых, такой подход не требует задания произвольных начальных условий, от которых нередко зависит результат решения обратной некорректной задачи.

Набор компонент, то есть совокупность значений положения их максимумов г>п и максимальных амплитуд I, ■ соответствующий глобальному минимуму невязки, и принимается за решение. Экспериментальная точность измерения спектров (0,5-1%) позволяет получать достаточно достоверные результаты при разложении не более, чем нэ три компоненты.

Практически, полная процедура поиска достаточного числа компонент л их параметров выглядит следукпкм. образом. Экспериментальный набор спектроз последовательно разлагается на 1, 2 и 3 компоненты. При этом', поскольку экспериментальные спектры Измерены с постоянным шагом в шкале длин волн, каждое задаваемое значение в шкале частот (^т(см~1 )=Ю7/Лт(н?.0) определяется с помощью полного перебора в интервале длин волн от 305 до 365 нм с шагом 0.5 нм всех возможных значений А. (1) з

171

первом случае, ) и ^(2) во втором и ^(2) и \,(3) -

в третьем случае. Причем для сокращения времени счета перебор ведется сначала с шагом 2,5 нм, затем (в окрестности шага полученных приближенных решений) с шагом 0,5 нм и наконец (для 1- и 2-ксмпонентного разложения) - с шагом 0,1 нм. Интенсивности в шкалах частот Р1) и длин волн связаны соотношением • ^, сохраняющим постошшой интегральную интенсивность (площадь под спектром). Поэтому, используя указанное соотношение, для окончательных значений Ут(к) .определяли положение 'Максимума Яи(к) и спектр представляли в более привычной шкале дд^н волн.

Для окончательной оценки качества ^Ьаг^ожеьия0 з ;саж*с .*

случае определяется средняя квадратичная относительная нзвязка мзвду теоретическими и экспериментальными спектрами,. выраженная е процентах к максимальной амплитуде первого спектра, измеренного в отсутствие тушителя:

(3) где

(4)

(5)

(6)

Б - параметр, характеризующий соответствие описания процесса тушения компонент закону Штерна-Селькора, ?Е - максимальное значение интенсивности флуоресценции, в спектре, измеренном в отсутствие тушителя. Поиск дополнительных компонент можно было бы прекратить, как только становится меньше экспериментальной ошибки. Но поскольку точно это никогда не известно, то мы условно принимали, что увеличение числа' искомых компонент на одну оправдано, если при этом происходив значительное (не менее, чем примерно на 10%) уменьшение величины та. Во многих случаях: критерием отсутствия дополнительной компоненты служили физически бессмысленные решения (напр., . отрицательные значения интенсивности и т.п.). Число компонент. и • их параметры, соответствующие данной минимальной величине тЕ и. принимаются за окончательное решение для данного экспериментального массива.

.Входными данными, для программы, реализующей описанный алгоритм является экспериментальный массив спектров флуоресценции размером ЮШ (Ы - число точек в спектре, N - число спектров). Выходные данные - количество, положение и амплитуда максимумов компонент, а также их теоретические спектры, интегральные вклады и константы Штерна-Фолъмера. Типичное время разложения на 3 компоненты системы из 5 спектров и 20 точек в спектре,-около ю минут.

Свойства алгоритма. Для выяснения влияния различных факторов на точность разложения была проведена серия разложений модельных симулированных спектров. Для этого' использованы системы расчетных спектров, представляющих собой сумму двух или трех, лог-нормальных кривых,, с переменными значениями положений максимумов и других исходных параметров. Число искомых компонент

тв = т- (1+Б),

м

.2,-1

Т = 1/М-2 Б*(;)); 5=1

И

Б(з) = ей,;));

1=1

к=1 т

при разложении задавали заранее. Т.к. нас более всего интересовало спектрзльное разрешение кошокент, то точность разложения оценивали величиной ' <Д1>, представляющей собой среднюю абсолютную разность между, заданными и полученными в результате разложения значениями положения максимумов компонент в шкале длин волн (нанометры).

На рис.2, А-Е показаны зависимости <ДЬ>, соответственно от амплитуды вводимого шума (з), числа используемых для разложения спектров (N), числа используемых в счете точек в каждом спектре (М), расстояния между положениями максимумов спектров компонент (DLM), отношения констант Штерна-Фольмера (К(21/К(1)) и отношения интенсивностей в максимуме (1(1)/(1(1 )+l(2))) для разложения на две компоненты (кривые 1). Спектр шума имел прямоугольную форму, т.е.любые отклонения от среднего значения (от 0 до s) были равновероятны. Значения концентраций, тушителя изменяли таким образом, чтобы при максимальной ее величине амплитуда суммарного спектра уменьшалась примерно вдаое. При изменении одного из параметров остальные сохранялись постоянными и имели следующие стандартные значения: з=о,6Я, 11=5, м=15. DIJ'=10 HM, К(1)=0,1, К(2)=3,0, 1(1 )=1 (2).

5 I К2/К1

М

Il/t И*12И

Рис.2. Влияние различных факторов на разрешен;» отдельных компонент в симулированных спектрах при разложении мзтодок наименьших квадратов. Объяснения в текст«.

На тех »в рисунках (кривые 2) показаны зависимости для точности разложения модельной системы на три компонент1!. Стандартные значения для в, N, м, ЕШ те же, что и в предыдущем случае, но К(1)=1, к(2)=5, К(3)=о, 1(1 )=1(2)=1(3) (на рис. ЗГ меняются лишь Х(1) и К(2), а на рис.ЗЕ - 1(1) и 1(2)).

Видно, что разработанный метод достаточно хорошо (с точностью до 1 нм в двухкомпонентном и до 1,5 нм в трехкомпонентном разложении) "угадшает" положения максимумов компонент при исходных параметрах, обычно встречающихся на практике (б=о,5-1 ,555, N=3-10,' миЗ-20, Ш1=7-Э0 ем, вклад отдельной компоненты 0,1-0,9).

Точность разложения на 3 компоненты замето ниже, чем при разложении на две компоненты, но также вполне удовлетворительна, учитывая большую ширину (40-60 нм) и значительное перекрытие спектров компонент.

Примеры^азложжя_эксперженталь В таблице I

' в- качестве примера приведены ■ типичные результаты последовательных разложений экспериментальных ' спектров трилтофановой флуоресценции папаша при рН з,1 (тушение NaNo^ от О до 0,12 Ы) на одну, две и три компоненты . (разделены, пунктиром). В первых двух строках этой и других подобных таблиц кроме названия белка к даты проведения эксперимента, содержится, как правило, информация о буфере -(концентрация и рН), длине волны возбувдения (Le), тушителе (название и концентрации) и диапазона измерения флуоресценции. Результаты приводятся в формате выходных данных программы. Значения tk и Av в "Табл.1" обозначают средне-квадратичные ошибки в определении длин волн (Л) и частот (v) максимумов спектров компонент. В "Табл.2" и, 12 и 13 - максимальные интенсивности этих компонент с соответствующими относительными средне-квадратичными ошибками значения si%, S2J6, и 53% с, - вклады в площадь под спектром. В "Табл.З" - Кв(к) - константы Штерна-Фольмера (в Ы~1) со средне-квадратичными ошибками AKg(k) для соответствувдих. компонент; Р.(к) - коффициенты линейной корреляции параметров 1(1:,1 )/l(k,i) и o.(i) на графиках з координатах Штерна-Фольмэра. Средне-квадратичное отклонение при 1-той концентрации тушителя ("ТаОл.5"):

г.е„ЯН1) = 1/Ы-2 B^u.d); ¿=1

22.04.70. 1=310-400,

ТАБЛИЦА I

Папаин, ГЛИЦИН + .ЗМ КС1 рН 3.1. Ъе=297, НаКС,, шаг 5 ВМ, С(1) = 0.00 0.01 0.03 0.07 0.12 3

Табл. 1

КО.МЛ. N 1/1>,ем АХ.НМ 11,1/СИ ЬV

1 343.7 1 29095 85 340.6

Табл. 2 •

сш.м 11 в« 12 .£36 13 в« £12 г-'-.г" Г'

.000 411 0 > С 0 0 0 4 00

.012 зад 0 0 0 0 0 100 0

.032 338 0 0 0 0 0 100 0 и

.067 301 1 0 0 0 0 100 Г;

.119 249 1 0 0 0 0 100 0 0

Табл. з

Кош. N Кз (к) ДКя(к) НОО В(к)

1 5.13 „ 33 .99 1.04 .015

Табл. 5

С(1),М 0 • С12 .032 .067 . .119

т.е.% 9.14 7.31 9.21 7.39 7.43

Ср. квадр. ошибка: 3.15 Критерий 2: 3.03 Я; Гв: 3.15

Тгбл. 1

Комн. л 1/у,ш АЛ,на 1»,1/СМ ¡¡V К,35М

1 323.1 .5 30950 48 321.2

2 351.7 • э 28433 40 3*8.1

Табл. 2

с(1),м 11' ей 12 13 в% Б2,<? взж

.соо 162 297 1 0 0 35.3 64.7 0

.012 139 264 1 0 0 34.5 65.5 0

.032 146 1 236 1 0 0 33.1 61.9 0

.067 122 1 203 1 0 0 33.9 61.1 0

.119 118 1 «п СП 0 0 41.4 53.6 0

Табл. 3 ■

Ксмп. Кз(Ю ¿Кз(Ю нао тю Нзй(к)

1 2.71 .59 .94 1.05 .032

2 6.32 .29 1.0 1.03 .012

Табл. 5

С(1).И 0 012 .032 .067 .119

.87 .61 1.43 .86 .52 .

Ср. квадр. ошибка: .99 Ж; Критерий г: .4*5 % : '¿в: .47 %

Табл. 1 ■

Кош. н 1/У,НМ АХ,ЕМ V.'. /ом ¿V

1 316 1.0 31646 100 314.4

2 " 342 1 .0 29240 85 339

3 ' 361.5 ' 1.5 27663 115 357.2

Табл. 2

Сй),М И а% 12 е5£ 13 8« 31$ Б?1? £3*

.ООО 10С 2 252 2 116 7 21.3 53.9

.012 79 2 233 2 56 7 19.2 57И

-032 „ ЬЭ 2 198 2 97 7 25.1 зс-.з 24 .С

.067 73 2 135 1 71 7 22.6 ■ 56.7 20.7

.119 30 X. 143 Г 55 7 27.2 50.6 22

Тебл. 3

Каст, зг АКвОО В(й' Б(Н) йгаи

1 1.63 1 1 ,01 .034

2 5-4 0.7 .УТ ¡.02 ,035

3 6.64 1.06 .96 1.00 .043

Табл. 5

С(3.),Ы ' 0 012 ,032 ,067 .119

г.е.Я .43 39 1«03 1.06 .63 Тг: Ль %

Ср. квадр1 ошибка; .7? %; Критерий 'X: -?г; Ч;

f2

Средняя квадратичная ошибка (С.К.О.) получена как:

(1/N- 2 (r.e.!S(i))2)1/2 1=1

"Табл.4" зарезервированна для вывода полных спектров компонент и частных невязок при отдельных длинах волн.

Из таблиц видно, что в приведенном експаримвнте параметр тв существенно мишмалзн для трзхкомпонентного разложения к достаточно, мал по величине. Поэтому можно заключить, что исследуемый спектр наилучшим образом аппроксимируется тремя коклонентамии.

На рис.3 приведены эти же результаты в графической форме (в формате разработанной программы). Точки отражают экспериментальные значения, а сплошные линии - теоретические. В верхних частях рисунков приведены графики относительной невязки (в процентах) между теоретическими и экспериментальными значениями интексивностей флуоресценции (левый и средний графики) и квантовых выходов (правый график). Левые спектры отражают результаты разложения экспериментального спектра, измеренного в отсутствие тушителя (невязки - sd.j); . см. уравнение (6)); на средних изображены результаты подгонки для всэх измеренных спектров; невязки для них - з(1,jj (уравнение (6); ломанные линии) я их средние по , 1 значения s(j) (см. уравнение (5); кресты). На самых- правше трех графиках результаты анализа тушения. В нижней части - ' графики в координатах Штерна-Фольмера для площадей под спектрами каждой из компонент: в средней - экспериментальные (точки) п теоретические (линии) зависимости нормированной суммарной площади под спектром от концентрации тушителя; в верхней части - относительная (в процентах) невязка для кривых в средней части. Прямые в нижней части правого рисунка получены методом линейной регрессии ; компонента t (в соответстви ' с таблицей) обозначена редкой штриховой линией (точки), 2 - частой штриховой (кресты), а 3 -сплошной линией (квадраты.).

Иной результат получается, например, при разложении спектров триптофановой флуоресценции рибосомального белка S7. Поскольку разложение на три компоненты не приводит к существенному уменьшению навязки (Тз уменьшается от 0,26% лишь до 0,24%), то в кзчестьа адекватного решения в этом случае можно . принять разложение на две компоненты.

А

~Л "Т щ ^

1

'tv-X =■

Ч--1

¿о' зЬ' з!я' з1о' 4и

Ь-—d

0.00 0.05 0.12

нм

otoö о1.05 öl 12

HM

°зм' ¿о' з1о м- ч1я °ал' ¿о' Jo' ¿о' io' ч!в q Н Я КП

00 0.05 0.12

Б

^—t-

О'.ОО 0.06 0.12

аз :ieaEö1 ¿о' 4я 320 Jo' so' г/ГчЬ n'.00 о' cs öli2

__W1 __' КМ ____

Рес.з. Совеггарлешю экспортенте-юта детаых. а результатов разложения спектров 1рзгг~£ановоЗ - фгуорзсцвнцгз жизана в гляспювс:« буфере (pH 3,1) в прясутатвля 0,3 а KCl н разннх концентраций тувиталя на одну (А), два (а) 2 фа (В) компонента. Графам привэдчнн 2 фзрмгго разработанной npcrpoi«u. Ойъжзаяня 8 тохсто.

Примером существенно однокомпонентного решения является разложение системы спектров флуоресценции 7-актина. Это видно из .сравнения невязок для одно- (TQ=0,9) и двухкомпонентного (та=о,35) разложений, В этой случае попытка разложения на 3 компоненты вообще не дала физически осмысленного решения.

. Результаты разложения спектров триптофановой флуоресценции нескольких десятков белков, наряду с модельными расчетами для симулированных спектров позволяют заключить, что _ использование аналитического задания формы элементарного спектра, .наряду с системой регуляризующих факторов позволило создать алгоритм, позволяющий устойчиво и достаточно точно разлагать составные сп-истры флуоресценции остатков триптофана белков. Алгоритм прост и эффективен и требует не слишком много времени счета на ЭВМ. Ileo тому его можно рекомендовать для широкого использования при изучении свойств i: поведения белков. •

МЕТОД ФАЗОВОЙ ПЛОСКОСТИ. ' .

Кроме перечисленных во введении четырох регуляризующих факторов, этот метод основывается на предположении, что спектр белка аппроксимируется не более, чем двумя элементарными компонентами. В метода используется фазовое представление параметров флуоресценции, ужа получивоее широкое распространен!'» при анализе белковых переходов.

В общем случав, при использовании каксго-лабо параметра (Р) для изучения формы переходов, необходимо, чтобы этот параметр был линайпо связан со степенью зевврзюнности перехода (а). Например, при переходе из состояния А в состояние В степень его завершенности равна

ou Cg/'CC^Cg)

гдз СА и Са - концентрации-А и В, Тогда значение параметра р должно подчиняться уравненина

Р» р-РА + а-Рв,

т.е. Еыхзажается как взвешанное среднее параметров, присущих состояниям А и В - Рц к Pg, где возовами коэффициентами являются доли этих состояний в системе, р и а=1-р.

Если переход характеризуется даумя независимыми параметрами и Р.,, кахушй из которых линейно связан со степенью »•гавр>сг*нкос?и перехода а. то

?2 = (3-Р^ + а.РБ2

Можно легко показать, что при отсутстгтапромежуточен состояний значения. Р1 и Р2 также взаимосвязаны линейно. Плоскость с координатами Р1 и Р2 является фазовой плоскостью.

При применении метода флуоресценции бьлка, в качестве параметров Р1 и Р2 могут быть использованы ' интенсивно—7 флуоресценции при различных длинах волн и Эти парам0?-« хорошо отражают изменение и квантового выхода, и максимумов спектров флуоресценции и, следовательно, информационные перестройки в белке. Фазовые графика в 'координатах хорошо отражают картину перехода из одного состояния з другое к тонко чувствуют наличие промежуточного продукта ч случаях сохранения постоянной концентрации белка в растворе. В

используемом нами случае "физическое" состояние Селкз (положение и форма компонент) не изменяется,, а" изменяется (с гомонью тушения) лишь его "спектральное" состояние (соотношение вкладов компонент). Это должно обеспечивать линейность следа спектрального изменения ка фазовой плоскости.

Итак, спектральное состояние балка отражается точкой (х,у) на фазовой плоскости (X.Y). Чтобы избавиться от влияния на° 'график концентрации белка, фазовые коордшоты точки удобнее определять как отношения интенсивностей прг двух дягш воля \ (частотах у) Ti.v%) и 2?(vy) к норяирущой интенсивности при некоторой длине волны г>п (?(vn)):

x=P(v2)/?(vn), y^P(vy)/P(vn) (V)

Нетрудно показать, что, как и а случае оЗычшя фазовых координат, поркарсвашшэ координаты (з л у) при отсутствии промежуточного состояния связаны линейно, т.о. совокупность точек на фазовой плоскости тагскэ образует линейный след. 3 этом случае изучеемоз состояние белка отражает степень ЗЕвершвнности спектрального перехода (а) и фазовый, график может быть использоепн как для определения вкладов начального и конечное состояний, так а'дм опрвделеяая значений Ht-кгтсрих параметров этих состояний (в поят случае это паясдаямя махгагу?«св ■.

Для• отрезлэнгл пойожечэЗ чзксимумэ!. {Vqj й ) kokecbsh? И ЯС ЕЯЛЭДСЗ У ЯОРШРУГЕУК ¿-ЯвЕО: ЧНОСГЧ (Л1 и &>) при ДОННХ Vn используется линейная зкстрытол-^я да до copt^c-ченгя с кривей S, соэтзетствугвда сонокуяности ¡зсех возможных

элементарных лог-нормальных форм спектров.

На рис.4 изображен такой фазовый график. Точки получены из соответствующие спектров, измеренных при разных концентрациях тушителя (1-8, рис.5), в соответствии с уравнениями (7). Кривая э - теоретический фазовый график, все точки которого (х,у) получены так же как и в (7), но где Р(у) - однопара^етрическая лог- нормальная функция (1) с известным положением максимума г>и. Таким образом, каждая точка кривой з соответствует элементарному спектру с максимумом vm. Прямая, проведенная через' экспериментальные точки пересекает кривую э в точках, соотЕетствующих элементарным спектрам компонент с положением максимумов Лк>0) и VQ2• Кроме того оказалось, что если в качестве фазовых координат брать отношения к нормирующей интенсивности )/Г(уп) и то вклады этих компонент в

нормирующую интвнтзность пропорциональны длинам отрезкоЕ и Р-2 (рис.4.).

В разработанном алгоритме полученное частное решение (при лпьгнгт. г>,,г,у,г|п) усредняется 'вариацией сначала г>х и при зтиксироьаинсм г»п, а затем и Таким образом используется

г^лей статистический массив экспериментальных данных. В

результате усрсднэпня определяются наиболее вероятные положения

01

и V,

02

И их

максимумов спектров лог-нормальных компонент вклады,в общий спектр R1 и соответственно.

Свойства алгоритма. На модельных симулированных спэктрзх, как и для алгоритма наименьших квадратов было исследовано влияние важнейршх факторов на точность разложения. Результаты приведена на рис.б(А-Е). Из рисунков видно, что данный метод хорошо "угадывает" положения максимумов компонент при исходит, параметрах, обычно встречающихся на практике (s=o.5-2íStN=3-ior lí=i 5-20, DLíí=7-30em, 11 /(11+12) =10-90?). Исключение составляет лишь отношение Х2/К1, поскольку при равных константах координаты всех экспериментальных точек на фазовом графике скажутся одинаковыми и тощей на фазовой плос.:ости практически сольются в одну. Наклон прямой и, следовательно, положение максимумов компонент, будут определяться в итоге с большой ошибкой. Как видно из рис.6, метод начшаэт сравнительно хорошо "угадывать" и при.различии Х2 и к. не менее, чем вдвоо.

K2/KÍ

а и к ил :i*:2«

Рйс.6. Влияние различч^ых ■ факторов за развесе ;п:з отдельных компонент в симулированные еппктрзх при резлохании ?члоЕка иэтодом. Объяснен'*; в тог.сте.

В экспериментальных спектрах разли-гле К1 а Х2 проявляется е сдвиге положения максимума спектра при тушении (как правило, в

коротковолновую сторону). Если же сдвига нот и степень тушения на крыльях одинакова, то трудно надеяться на хороший результат разложения. Это обстоятельство ограничивает применение фазового метода, так как он не позволяет шделять из об;цего спектра спектры компонент с одинаковой доступностью тушителю (то есть с ■ одинаковыми К1 и К2).

Тем не менее, результаты разложения, полученные фазовым методом и катодом наименыних квадратов (в тех случаях, когда решение одно- или двухурмпонентне), для большинства белков совпадают с точностью до экспериментальной ошибки. Совпадение параметров компонент, .галученных с помощью принципиально разных алгоритмов является сильным доводом в пользу достоверности ранения.

СТАТИСТИЧЕСКИИ АНАЛИЗ РЕЗУЛЬТАТОВ РАЗЛОЖЕНИЯ.

Описанные алгоритмы дают возможность прямой экспериментальной проверки гипотезы дискретности структурно-гпзичоеккх л спектроскопических состояний триптофана в белке. Было про ведено разложение на компоненты спектров триптофановой флуоресценции 54 белков в 95 структурно-физических состояниях (т.е. для 95 случаев были опредэлэны количество, положение и вклады компонент). Количество компонент определялось еЗ основе анализа составного критерия Та (см. ф-лы 3-6).

На рис.ТА изображена гистограмма частоты ьстрочаемосгд макс:л1умов глазных спектров флуоресцегщгле состроенная следуЕ^гл образом. Каждое значение Ац^ является центрсм нормированного к единице распределения Гаусса. Часготз (К) при лзбом , значении А. вычисляется как сумма значений всех этих распределений при данном А (аналогично получены все последующие рисунки). Таксй способ построения гистограмма даэт (в отличии ст сбычного) гладкую кривите, что позволяет точнее определять положения гиков. Кз рисунка видно, что кривая имеет максимум при АгЗЗТ ем. Это означает, что наиболее часто встречаются белки, имеющие максимум спектра триптофаловой флуоресценции именно в этой области.

Гистограмуз частоты встречаемости ' максимумов спектров флуоресценции компоне!1т для всех измеренных балков, приведена на Эта криззя при А.г337 км имеет хорошо выраженный мшймум, разделений максимумы при Аа331 и А; 342 нм. Последний, ¿' сбою очередь, хорошо г - зле лен с максимумом при Аа350,5 игл. Также .с-гггэ виражаны м • ксимумы кривой при А=331, 342 и 351 ' нм на 7Ь. гл~ гг'.'^одй!« аналогичная гистограмма для нативных

Рве.7. Гистограммы частоты встречаемости положений максимумов (¡лусресценщя: этисэржзнтальггых спохтров йб'лхоь (А) и спектров теоретических компонент: для асах измеренных бе лгав (Б), только для нативных белков (В).

Селков. Отмэтим также, что на обоих рисунках хоть, и слабо, но выражены максимумы при Х=306-307, 314 и 322 нм (хотя первый из них совершенно отсутствует на рис.7А). Эти данные говорят о том, что, во-первых, по крайней мере очень многие белки имеют составные спектры триптофановой флуоресценции, а во-вторых (и. это главное) - наиболее вероятны положения максимумов компонент гчи \=331., 342 и 351 нм.

Последний факт является хорошим доводом в пользу справедливости модели дискретных состояний, предполагающей существование в белках трех наиболее вероятных структурно-физических состояний триптофанилов, каждому из которых соответствуют спектры флуоресценции с положениями максимумов А., =330-332 нм, =340-342 НМ И Лд=350-353 НМ.

Проведено сравнение результатов, полученных в настоящей работе и при помощи калибровочной диаграммы, приведенной в монографии Бурштейна. Несмотря на небольшую точность разложения в рамках модели дискретных состояний, результаты, полученные двумя различными способами, во многих случаях неплохо' совпадают как по количеству, так и по положению и вкладам компонент.

Таким образом, представленные результаты в совокупности с другими литературными денными показывают ,' что, возмогло, в белках существуют наиболее вероятные структурно-физические состояния триптофанового остатка, спектрально проявляющиеся в ' большей частоте встречаемости соответствующих компонент.

вывода. /

1. Используя логнормальное представление формы элементарного спектра в сочетании с методом избирательного тушения флуоресценции созданы и реализованы в программах алгоритмы для . разложения гладких спектров триптофановой флуоресценции балков на компоненты. Программы, позволяют вполне однозначно и с хорошей точностью определять количество компонент в сложном спектре и их параметры: положения максимумов интенсивности, вклады в общий спектр, константы Штерна-Фэльмора.

2. С помощью этих программ на большом статистическом материале била получена гистограмма . частоты встречаемости максимумов спектров флуоресценции компонент. Гистограмма имеет хорсзо Еырзжсщшч максимумы при Х<331,342 35Гнм, что является 1грлУиМ акспоримйнтальным подтверждением гипотезы дискретности структурно-фкзичас.ких и спектроскопических состояний триптофана а ек-лзот . . . ~а

Основные результаты диссертации опубликонаны п следующих работах:

1. Аборнев С. М., Бурштейн Э. А. Алгоритм разложения спектров триптофановой флуоресценции белков на лог-нормальные компоненты методом наименьших квадратов. Тез. докл. VII конф. спектроск. биополимеров, Харьков, 1991, стр. 3.

2. Бурштейн Э. А., Аборнев С. М. Алгоритмы разложения спектров триптофановой флуоресценции белков на лог-нормальные компоненты методом наименьших квадратов. Там же. стр. 31—32.

3. Аборнев С. М., Бурштейн Э. А. «Разложение спектров флуоресценции остатков триптофана на лог-нормальные компоненты методом наименьших квадратов». — Молекулярная биология, т. 26, № 6, 1992.

Зак. 4338—70