Бесплатный автореферат и диссертация по биологии на тему
Поиск и анализ структурных мотивов в белках
ВАК РФ 03.01.03, Молекулярная биология

Автореферат диссертации по теме "Поиск и анализ структурных мотивов в белках"

На правах рукописи

КАРГАТОВ АНТОН МИХАЙЛОВИЧ

ПОИСК И АНАЛИЗ СТРУКТУРНЫХ мотивов в БЕЛКАХ

03.01.03 - Молекулярная биология

АВТОРЕФЕРАТ

диссертации на соискание учёной степени кандидата биологических наук

1 7 013 23:1

Пущино-2011

4854461

Работа выполнена в Учреждении Российской академии наук Институте белка РАН

Научный руководитель:

доктор химических наук Ефимов Александр Васильевич

Официальные оппоненты:

доктор физико-математических наук, профессор Лунин Владимир Юрьевич

Ведущая организация:

Учреждение Российской академии наук Институт биоорганической химии им. академиков М.М. Шемякина и Ю.А. Овчинникова РАН

Защита состоится 17 февраля 2011 года в 14 часов на заседании диссертационного совета Д 002.038.01 при Учреждении Российской академии наук Институте биофизики клетки РАН по адресу: 142290, г. Пущино Московской обл., ул. Институтская, д. 3, ИБК РАН.

С диссертацией можно ознакомиться в библиотеке ИБК РАН.

Автореферат разослан «/^ » 2011 г.

Учёный секретарь диссертационного совета, кандидат биологических наук

доктор биологических наук, профессор Озолинь Ольга Николаевна

Т.И. Смолихина

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность проблемы. Функция белков определяется их пространственной укладкой, предсказание которой является одной из важнейших проблем структурной биологии. Однако решение этой проблемы невозможно без понимания принципов построения супервторичной структуры. В настоящее время известен целый ряд таких структур, называемых также структурными мотивами. В зависимости от своего строения и состава они обладают рядом индивидуальных особенностей. Многие из них хорошо изучены, однако до сих пор остаётся ряд нерешённых вопросов. Кроме того, увеличение числа расшифрованных белковых структур позволяет находить новые структурные мотивы, так же требующие внимательного рассмотрения.

Цели и задачи исследования. Целью работы является поиск новых структурных мотивов и выявление их свойств, а также изучение свойств некоторых известных структурных мотивов. На основе каждого нового мотива будет построено структурное древо, а построенные деревья будут включены в систему классификации белков и доменов РСВОБТ, разработанную в нашем институте.

В соответствии с этим работа была разбита на несколько этапов:

1. Создание выборки белков, содержащих комбинации ^-мотива и рар-единицы, и построение структурных деревьев для встречающихся типов таких комбинаций, а также их анализ.

2. Построение компьютерных версий структурных деревьев для наиболее распространённых типов комбинаций и включение их в систему классификации белков РСВОБТ (http://strees.protres.ru).

3. Создание выборки белков, содержащих правые и левые а-а-шпилыси, и проведение конформационного анализа боковых цепей остатков, расположенных в а-, (1-, g- и е-позициях семичленного повтора.

Научная новизна и практическая значимость работы. Описан ряд новых структурных мотивов, представляющих собой комбинации различных вариантов у-мотива и рар-единицы, и проведён их стереохимический анализ. Показана разница между ними в строении переходной петли. Смоделированы пути сворачивания белков, содержащих эти мотивы, через построение структурных деревьев, и отмечено различие в распределении белков по их ветвям. На основе двух мотивов, наиболее часто встречающихся в белках, построены

теоретические структурные деревья, включённые в систему классификации РСВОБТ. Проведён конформационный анализ боковых цепей остатков, расположенных в а-, <1-, §- и е-позициях семичленного повтора в левых и правых а-а-шпильках. Научная и практическая значимость работы заключается в предсказательной силе выявленных закономерностей, в исследовании структурного сходства между белками, моделировании путей их сворачивания и поиске наиболее выгодных структур.

Апробация работы. Материалы работы были представлены на IV Российском симпозиуме «Белки и пептиды» (Казань, 2009) и ежегодных научных конференциях в Институте белка РАН (2007-2010).

Публикации. Основные результаты диссертации опубликованы в 4 печатных работах, в том числе в 3 статьях в рецензируемых журналах.

Структура диссертации. Диссертационная работа состоит из следующих разделов: «Введение», «Обзор литературы», «Результаты и обсуждение», «Основные результаты и выводы» и «Список литературы». Диссертационная работа изложена на 102 страницах. Работу иллюстрируют 55 рисунков и 5 таблиц. Количество ссылок, приведённых в разделе «Список литературы» - 105.

РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ

Анализ комбинаций «{/-мотива и Рсф-единицы и построение структурных деревьев на их основе. В результате стереохимического анализа белков нами обнаружены новые структурные мотивы, которые представляют собой комбинации у-мотива и рсф-единицы. В этих структурных мотивах два соседних параллельных р-тяжа \|/-мотива соединены через а-спираль, проходящую в нижнем слое, если располагать переходную петлю сверху (рис. 1). Другими словами, у-мотив и рар-единица имеют два общих параллельных Р-тяжа и сосуществуют вместе как единый структурный мотив, состоящий из трёх Р-тяжей и а-спирали. И \|/-мотивы, и рсф-единицы бывают двух видов - правые и левые. Если смотреть с М-конца и располагать переходную петлю сверху - в правых «(/-мотивах цепь поворачивает направо, а в левых - налево. Рар-Единицы, в свою очередь, являются правыми, если их цепь закручена в правую суперспираль, и левыми -если в левую.

Таким образом, теоретически возможны четыре типа комбинаций (см. рис. 1).

В этом и всех последующих случаях выборки белков создавались с помощью PDB-банка и системы структурной классификации SCOP. Отбор вёлся вручную с использованием программы молекулярной

а)

Правый у-мотиа Правая finp-единица

в)

Левый у-мотив Правая рар-вдиница

VV

Правый v-мотив Левая рар-единица

V7

Комбинация I (Ра|3ч/-мотив)

Комбинация II (>|/Рар-мотив)

Комбинация III

г) rf^X

U L

Левый у-мотив

Левая рар-единица

V

Комбинация IV

Рисунок 1. Схематическое изображение теоретически возможных комбинаций у-мотива и РаР-единицы: правый у-мотив и правая рар-единица (а), левый ¡¡/-мотив и правая рар-единица (б), правый у/-мотив и левая рар-единица (в), левый ¡¡/-мотив и левая рар-единица (г), а-Спирали показаны в виде цилиндров, Р-тяжи - в виде стрелок, направленных от № к С-концаи, а переходные петли - двойными линиями.

графики RasMol. Наличие гомологии определялось программой попарного выравнивания Blast 2 Sequences.

Созданная база данных включает 159 негомологичных белков, содержащих 167 комбинаций (некоторые белки содержат больше одной комбинации). Было установлено, что встречаемость разных типов комбинаций различна и в собранной базе распределилась следующим образом:

1) комбинация правого \|/-мотива и правой РаР-единицы (Рсф\|/-мотив) - 87 мотивов в 80 белках (52%);

2) комбинация левого \|/-мотива и правой pap-единицы (\j/pap-мотив) - 61 мотив в 61 белке (37%);

3) комбинация правого \|/-мотива и левой pap-единицы - 19 мотивов в 18 белках (11%);

4) комбинация левого ^-мотива и левой PaP-единицы в белках не найдена.

Такое распределение частот встречаемости комбинаций объясняется тем, что в целом в белках левые pap-единицы встречаются очень редко и с точки зрения стереохимии являются невыгодными структурами. у-Мотивы в белках также встречаются преимущественно в правой форме. Таким образом, несмотря на то, что в комбинациях с мотивом найдено всего 11% левых pap-единиц, это намного выше, чем в целом в a/p-белках. Частота встречаемости в рассмотренных комбинациях левых \|/-мотивов (37%) также существенно выше, чем в других классах белков. Причины такой повышенной частоты встречаемости левых PaP-единиц и левых ^-мотивов именно в комбинациях до конца не определены, и для их выяснения требуются дальнейшие исследования.

На рис. 2 представлено структурное древо для белков, содержащих рару-мотивы. В основе древа лежит корневой структурный мотив, от которого идут линии, показывающие возможные пути роста. Структуры более высокого порядка получаются путём пристраивания р-тяжа или a-спирали к структуре, расположенной уровнем ниже, в соответствии со следующими правилами:

1) структуры белков рассматривались в упрощённом виде; в целях экономии места на древе показывали только такие пути роста структур, которые приводили к известным белковым структурам;

2) в качестве корневой структуры использовались различные

Рисунок 2. Структурное древо белков, содержащих рару-мотивы. Структуры изображены с торца. Кружочками показаны а-спирали, квадратиками - Р-птжи, двойными линиями - ближние перетяжки, а одинарными - дальние. Рядом подписаны РОВ-коды белков, содержащих эти структуры. Реальными белками занято 24 укладки.

5

комбинации ^-мотива и рсф-единицы;

3) рост структур осуществлялся путём последовательного присоединения а-спиралей и(или) Р-тяжей (иногда присоединялись целые блоки в виде Б-образного р-листа); первыми пристраивались элементы, расположенные к растущей структуре ближе других по цепи;

4) а-спирали и р-тяжи не могут быть упакованы в одном слое;

5) пересечение перетяжек и образование узлов запрещено, однако разрешается образование <р- и у-мотивов;

6) все структурные мотивы должны иметь свойственную им хиральность и пространственную укладку цепи;

7) все полученные структуры должны быть компактными в соответствии с принципом плотной упаковки.

Если структура может расти несколькими путями, она образует своеобразную точку разветвления древа. Соответственно, структуры из разных ветвей содержат в себе общую структуру, находящуюся в месте разветвления. Таким образом, структурное древо показывает не только возможные пути роста структур, но и степень структурного сходства между ними.

На рис. 3 и 4 представлены структурные деревья для белков, содержащих ^Рсф-мотивы и комбинации правых у-мотивов и левых Рсф-единиц соответственно. Их построение и основные черты не отличаются от таковых для структурного древа на рис. 2. Структуры всех трёх деревьев ориентированы одинаковым образом, и можно видеть, что корневые структурные мотивы в большинстве известных белков (показаны РБВ-кодами) располагаются на краях двухслойных или трёхслойных структур, за исключением белков на нижних ветвях древа на рис. 3.

Анализ деревьев показывает, что рару- и уроф-мотивы имеют совершенно разные пути развития: если у первого пик встречаемости приходится на структуры, содержащие 2-3 добавочных элемента, то у второго - на 9-10 (рис. 5). Кроме того видно, что хуРсф-мотив почти всегда комбинируются с 58-мотивом. Это можно объяснить большей выгодностью последнего, так как он является структурой, замкнутой в цикл. Однако в двух других типах комбинаций такие сочетания встречаются гораздо реже и не получают существенного развития в сторону 58-мотива. По-видимому, направление цепи здесь имеет определяющее значение.

Рисунок 3. Структурное древо белков, содержащих урар-мотивы. Структуры изображены с торца. Кружочками показаны а-спирали, квадратиками - Р-тяжи, двойными линиями - ближние перетяжки, а одинарными - дальние. Рядом подписаны РОВ-коды белков, содержащих эти структуры. Реальными белками занято 25 укладок.

Более детальный анализ показал, что мотивы различаются по длине и структуре переходной петли: её длина в (ЗаР^-мотивах оказывается в среднем вдвое больше, чем в урсф-мотивах (16.4 против 7.8 остатка), при этом последние почти не содержат в переходной петле а-спиралей (3 случая из 61, что составляет около 5%), в то время как в первых её содержит около 61% структур (53 из 87 случаев). Комбинация правого ^-мотива и левой роф-единицы в данном случае

Рисунок 4. Структурное древо белков, содержащих комбинации правого у-мотива и левой [}аР-единицы. Структуры изображены с торца. Кружочками показаны а-спирапи, квадратиками ~ (¡-тяжи, двойными линиями - ближние перетяжки, а одинарными - дальние. Рядом подписаны РОВ-коды белков, содержащих эти структуры. Реальными белками занято 4 укладки.

О 1 2 3 4 5 6 7 8 Э 10 11 12 13 Число добавочных элементов

I рсфцШотявы 1 ^Рсф-Мотивы Комбинации правого ф-мотиваи левой роф-едашщы

, Рисунок 5. Распределение негомологичных доменов по уровням

структурных деревьев. Видна почти обратная тенденция в развитии Ргфу- и урсф-мотивов.

оказывается близка к чфоф-мотиву: средняя длина переходной петли здесь составляет 6.9 остатка, а встречаемость в ней а-спирали - около | 16% (3 случая из 19). Также замечена существенная разница в длинах

переходных петель Рсфу-мотивов, содержащих и не содержащих а-| спираль: первые, в среднем, имеют перетяжку в 21.9 остатка, а вторые -

9.3 остатка. Из анализа этих данных можно заключить, что в длинных переходных петлях легче снимаются стерические напряжения, которые неизбежно в них присутствуют, а образование а-спиралей в этих участках позволяет избежать дегидратации свободных полярных групп, поскольку большая их часть занята в образовании водородных связей в составе а-спиралей.

Вклад в систему иерархической классификации белков на основе структурных деревьев (PCBOST). В соответствии с правилами, указанными в предыдущем разделе, а так же в соответствующих работах, были построены компьютерные версии двух структурных деревьев - для белков, содержащих рсфу- и \|/р<хр-мотивы. В отличие от деревьев на рис. 2 и 3, они включают все разрешённые укладки полипептидной цепи до трёх добавочных элементов включительно, а на последующих уровнях аналогичны этим деревьям. Такое ограничение вызвано резким увеличением числа разрешённых укладок на высоких уровнях и трудностью их размещения на картинке.

На компьютерных версиях деревьев все укладки пронумерованы. Первая цифра обозначает номер уровня, а вторая - номер укладки на этом уровне. Таким образом корневая структура имеет номер 0.1 (первая укладка нулевого уровня - без добавочных элементов), происходящие из неё укладки первого уровня (с одним добавочным элементом) - 1.1, 1.2, 1.3..., укладки второго уровня (с двумя добавочными элементами) - 2.1, 2.2, 2.3..., третьего - 3.1, 3.2, 3.3... и т.д. Если укладка может быть получена разными путями, то либо к ней идут пути от различных родительских структур, либо только от одной, принадлежащей наиболее заселённой ветви древа (если не получалось провести прямые линии между укладками без их пересечения).

Древо белков, содержащих Paffy-мотивы, имеет 6 уровней (до структур с 6 добавочными элементами включительно) и содержит 124 укладки, из которых 24 заняты реальными белками; всего в базе данных этого древа содержится 218 белков (655 PDB-файлов). В свою очередь, древо белков, содержащих урсф-мотивы, состоит из 13 уровней (до структур с 13 добавочными элементами включительно) и насчитывает 154 укладки, из которых 25 заняты реальными белками; общее число белков в этой базе - 167 (668 PDB-файлов). Структуры, найденные в белках, заключены в рамки.

Построенные деревья размещены в системе структурной классификации белков PCBOST (Protein Classification Based On Structural Trees) по адресу http://strees.protres.ru.

Система классификации PCBOST состоит из нескольких нижеследующих иерархических групп:

1) Класс (Class) - группа аналогична таковой в классификации Левитта и Чотиа: а-, Р-, (а + Р)- и а/р-белки (на данный момент система не содержит класса а-белков).

2) Структурное древо (Structural Tree) - все содержащиеся здесь укладки имеют общий корневой структурный мотив.

3) Уровень (Level) - в пределах данной группы все укладки имеют одинаковое число элементов вторичной структуры.

4) Укладка (Fold) - здесь все элементы вторичной структуры расположены одинаковым образом.

5) Белковый домен (Protein Domain) - список белков, домены которых содержат данную укладку.

6) Вид (Species) - организм, из которого получен белок.

7) PDB-коды доменов (PDB Entry of Domain) - список PDB-файлов, содержащих данный белок; рядом указано расположение домена с искомой укладкой цепи.

Таким образом, на данный момент система классификации PCBOST состоит из 6 структурных деревьев (для белков, содержащих abed- и abCd-единицы, 5S- и 78-мотивы, а также описанные здесь рару-и \|/РаР-мотивы), включающих 3847 белков (10547 PDB-кодов).

Конформационный анализ боковых цепей, расположенных в »-> d-? g- и е-позициях а-а-шпилек. Для работы была собрана база данных а-а-шпилек, имевших семичленный повтор (угол между а-спиралями Г2 = 20°) и упакованных «бок-о-бок». Она включает 65 левых а-а-шпилек в 43 белках и 88 правых - в 70 белках. В пределах рассмотренных групп все белки негомологичны и имеют разрешение до 2.5 А.

Чтобы уменьшить влияние гетерогенности на результаты анализа, в а- и d-позициях рассматривались только остатки Leu, Phe и Туг. Их боковые цепи сходны с точки зрения стереохимии - близки по размерам, имеют разветвления на Су-атомах и могут существовать в виде g"- или t-изомеров в составе а-спиралей. Для ослабления краезых эффектов рассматривались только а-а-шпильки с длинными а-спиралями - 4 витка (14 остатков) и более. Также в работе g'-изомерами считались конформации боковых цепей, имеющие углы = -50° - (100°), а t-изомерами - имеющие углы Xi = 180 ± 30°.

Расчёт углов & для определения поворотных изомеров боковых цепей производился программой MOLMOL. Позиции a, d, g и е семичленных повторов и характер упаковки (правая или левая а-а-шпилька) определялись визуально.

В соответствии с механизмом, предложенным Ефимовым (Биохимия. - 2007. - Т. 72, С. 223-227), межспиральные гидрофобные и полярные взаимодействия, а также стремление к плотной упаковке сближают между собой остовы а-спиралей и выталкивают из межспирального пространства боковые цепи, что приводит к отбору уникальных поворотных изомеров боковых цепей, расположенных на поверхности взаимодействия. В левых а-а-шпильках между остовами располагаются и §-позииик. а в правых - а- и е-позиции. На основании этого можно предположить, что в левых а-а-шпильках с1-позиции будут заняты ^изомерами, а §-позиции - £"-изомерами. Таким же образом в правых а-а-шпильках боковые цепи в а-позициях приобретут «"-конформации, а в е-позициях - ^конформации (рис. 6, 7).

Рисунок 6. Схема распределения позиций вокруг спирального остова в левых и правых а-а-шпильках. N и С - обозначения концов, направленных к наблюдателю.

Результаты расчётов показали, что в левых а-а-шпильках <1-позиции на 72% заняты 1-изомерами и на 21% - g"-изoмepaми, а позиции, наоборот, содержат 84% g"-изoмepoв и только 8% ^изомеров. В правых а-а-шпильках 84% боковых цепей в а-позициях имеют -изомеры и 8% - 1-изомеры, в то время как в е-позициях ^изомерами являются 60% боковых цепей, а g-изoмepaми - 31%. Все остальные случаи - боковые цепи, имеющие запрещённые конформации в этих позициях (рис. 8). Таким образом, подтверждается правильность выдвинутых предположений.

Существует несколько причин того, почему не все боковые цепи рассмотренных позиций удовлетворяют теоретической модели. Как

ОС-

ОС

/-изомер

(¿'-ПОЗИЦИЯ)

£ -изомер

({»-ПОЗИЦИЯ)

Левые

$ -изомер (¿-позиция)

-ШПИЛЬКИ

/-изомер (¿/-позиция)

Правые сс-

/-изомер (а-позиция)

ос-

шпильки

¿"-изомер (д-позиция)

Я -изомер (е-позмция)

/-изомер (г-позиция)

Рисунок 7. Схематическое изображение переходов боковых цепей лейцинов из «неправильных» (слева) в «правильные» (справа) изомеры в левых (а) и правых (Ъ) а-а-шпильках. N и С - обозначения концов а-спиралей, направленных к наблюдателю.

показывает анализ, отклонения часто наблюдаются на концах ос-спиралей, то есть имеют место краевые эффекты. Это связано с тем, что в некоторых а-а-шпильках концы а-спиралей расходятся и не оказывают достаточного влияния друг на друга (нет «выдавливания» боковых цепей). Гетерогенность набора боковых цепей также может быть причиной ряда отклонений. Например, в «лейциновых застёжках», где имеются почти гомогенные наборы гидрофобных остатков из лейцинов, закономерности в распределении поворотных изомеров проявляются намного чётче, чем в димерах с гетерогенным набором

Левые а-а-шпильки

(1-ПОШЦИИ

УО

!! Л

+ 1

■ V. \ *

-I5i.i t \ \\

\

-120

\

\ \ \ \

ч\

Ч \ .!!'

-г-9

% ,й 45 <0 йс!

V- / //

§~ш>зиции

12!),..--""""

I 5(1 /

/ ■

/' .

Ь1 но'

* \ 5 V ,50 1« I

/.А,

-15(1 Ч Ч .»,/>

V ' 1

_ 12п -----и"-,** -«'

_Ч(!

Правые а-а-шпилыш

а-пошцик

150

Т , " /

±1X0!, (»1 I

-1ЭД \ •

_12„,

/ -.№

е-позиции

I

12<>

150/.

Г . . / •■

.

,,,, ,¡0

А

\

4 & 4. 1°

- *

V. • • N -150 \ ч„ \ "'

-120

-00

Рисунок 8. Распределение торсионных углов боковых цепей, находящихся в с1-, g-noзm^uяx левых и а-, е-позициях правых а-а-итилек, показанное с помощью круговых диаграмм. Нижняя часть каждого круга соответствует отрицательным значениям углов //. а верхняя -положительным. Числа на осях показывают количество экспериментальных точек (значений углов находящихся внутри соответствующего круга.

гидрофобных остатков. Как отмечено выше, наибольшие отклонения наблюдаются в е-позициях правых a-ct-шпилек. С одной стороны, это так же можно объяснить гетерогенностью состава - кроме Leu, Phe и Туг в е-позициях учитывали и гидрофильные боковые цепи. С другой стороны, отбор поворотных изомеров гидрофильных боковых цепей зависит также от наличия партнёров для образования межспиральных водородных или солевых связей. В ряде случаев нарушается идеальное чередование гидрофильных и гидрофобных остатков, в результате чего семичленные повторы могут сменять регистр, то есть одна часть повтора смещается относительно другой. Это приводит к тому, что в межспиральном пространстве в а-а-шпильках оказываются другие позиции, на которые уже по-другому действует механизм «выталкивания». Из-за смены регистра семичленных повторов или из-за расширения гидрофобного кластера одна часть а-спирали может быть упакована с соседней а-спиралью по типу «бок-о-бок», а другая часть -по типу «лоб-в-лоб», что в итоге так же приводит к отклонениям от идеальной картины упаковки боковых цепей. Тем не менее большая часть боковых цепей (от 60% до 84%) в а-а-шпильках приобретает конформации в соответствии с рассмотренными выше закономерностями. Таким образом, можно сделать вывод, что отбор конформации боковых цепей в а-а-шпильках зависит от двух главных факторов - взаимного расположения или упаковки а-спиралей (левая, правая а-а-шпилька или упаковка «лоб-в-лоб») и позиции боковой цепи на а-спирали.

выводы

1. Обнаружены в белках и описаны три новых супервторичных структуры - ßaßv-мотив, yßaß-мотив и комбинация правого у-мотива и левой ßaß-единицы. Проведённый анализ показал существенную разницу в их свойствах, несмотря на внешнее сходство укладок.

2. Для белков, содержащих описанные мотивы, построены три новых структурных дерева.

3. Для двух деревьев построены компьютерные версии и размещены на сайте структурной классификации белков PCBOST (http://strees.protres.ru).

4. Показано, что отбор поворотных изомеров боковых цепей в межспиральном пространстве левых и правых a-a-шпилек происходит в соответствии с «механизмом выдавливания».

Основные результаты диссертации опубликованы в работах:

1. Каргатов А.М., Ефимов A.B. Поворотные изомеры боковых цепей в a-a-шпильках белков и механизм их отбора // Молекулярная биология. - 2007. - Т. 41. - С. 876-884.

2. Каргатов А.М., Ефимов A.B. Новый структурный мотив: комбинация ßaß-единицы и \|/-мотива // IV Российский симпозиум «Белки и пептиды». - Тезисы докладов. - Казань, 2009. - С. 317.

3. Каргатов А.М., Ефимов A.B. Новый структурный мотив и структурные деревья содержащих его белков // Биохимия. - 2010. -Т. 75.-С. 305-312.

4. Gordeev A.B., Kargatov А.М., Efimov A.V. PCBOST: Protein classification based on structural trees // Biochem. Biophys. Res. Commun. - 2010. - Vol. 397. - P. 470-471.

ООО «Фотон-век», ИНН 5039008988 г.Пущино, Московская область тел. (4967) 73-94-32 ЬеогпоЩгатЫег. ги Ь№р://рШоп-\/ек. пагод, ги

Подписано в печать 11.01.2011 Формат 60 x 90 Мб Тираж 100 экз.

Содержание диссертации, кандидата биологических наук, Каргатов, Антон Михайлович

ВВЕДЕНИЕ.

ГЛАВА 1. ОБЗОР ЛИТЕРАТУРЫ.

1.1 Упаковка а-спиралей и Р-структуры в белках.

1.2 Конформация полипептидной цепи.

1.3 Разнообразие структурных мотивов в белках.

ГЛАВА 2. РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ.

2.1 Постановка задачи.

2.2 Анализ комбинаций \|/-мотива и Рсф-единицы и построение структурных деревьев на их основе.

2.3 Вклад в систему иерархической классификации белков на основе структурных деревьев (РСВ08Т).

2.4 Конформационный анализ боковых цепей, расположенных в а-, (1-, gи е-позициях а-а-шпилек.

Введение Диссертация по биологии, на тему "Поиск и анализ структурных мотивов в белках"

Предсказание белковой структуры основывается на ряде принципов, отражающих свойства и характер взаимодействия её частей. Поэтому понимание закономерностей высокого порядка возможно только через изучение отдельных элементов и их последующего сбора в целую структуру. Такими элементами, в частности, являются структурные мотивы.

Структурные мотивы, также называемые супервторичными структурами, являются устойчивыми компонентами третичной структуры белков, находясь на уровень ниже в структурной иерархии и представляя собой составляющие её крупные блоки различной формы и свойств. Также существует гипотеза, согласно которой некоторые из них могут являться зародышами при белковом сворачивании. Но как бы то ни было, сворачивание белка не может миновать образования таких мотивов, следовательно, без их тщательного изучения нельзя понять этот процесс.

Число структурных мотивов, как наиболее выгодных состояний полипептидной цепи, безусловно, ограничено. Однако по мере увеличения количества известных белковых структур, становится возможным найти в их составе всё новые и новые мотивы. Таким образом, стоит проблема их поиска и систематизации.

Имея различный состав, структурные мотивы формируются различными путями и в дальнейшем по-разному влияют на общий вид белковой молекулы. Поэтому исследование их свойств необходимо, во-первых, для того, чтобы предсказать, во что свернётся та или иная аминокислотная последовательность, а во-вторых, чтобы понять, каких свойств ожидать от конечной структуры.

В работе проводился поиск новых структурных мотивов и анализ ряда их свойств, а также свойств некоторых известных мотивов. При этом были смоделированы пути сворачивания белков, содержащих новые мотивы, методом построения структурных деревьев и внесён вклад в создание новой системы классификации белков. Также исследовались свойства боковых цепей в области контакта а-спиралей известных, но не до конца изученных мотивов.

По теме диссертации было опубликовано три работы, не считая тезисов конференции.

Заключение Диссертация по теме "Молекулярная биология", Каргатов, Антон Михайлович

Основные результаты диссертационной работы представлены в публикациях [102,103, 104, 105].

Библиография Диссертация по биологии, кандидата биологических наук, Каргатов, Антон Михайлович, Пущино

1. Crick F.H.C. The packing of a-helices: simple coiled-coils // Acta Cryst. -1953.-Vol. 6.-P. 689-697.

2. Walshaw J., Woolfson D.N. Extended knobs-into-holes packing in classical and complex coiled-coil assemblies // J. Struct. Biol. 2003. -Vol. 144.-P. 349-361.

3. Chothia C., Levitt M., Richardson D. Structure of proteins: Packing of a-helices and pleated sheets // Proc. Nat. Akad. Sci. USA. 1977. - Vol. 74. -P. 4130-4134.

4. Chothia C., Levitt M., Richardson D. Helix to helix packing in proteins // J. Mol. Biol. 1981. - Vol. 145. - P. 215-250.

5. Walther D., Eisenhaber F., Argos P. Principles of helix-helix packing in proteins: helical lattice superposition model // J. Mol. Biol. 1996. - Vol. 255.-P. 536-553.

6. Murzin A.G., Finlcelstein A.V. General architecture of a-helical globule // J. Mol. Biol. 1988. - Vol. 204. - P. 749-769.

7. Richmond T.J., Richards F.M. Packing of a-helices: geometrical constraints and contact areas // J. Mol. Biol. 1978. - Vol. 119. - P. 537555.

8. Reddy B.V.B., Blundell T.L. Parking of secondary structural elements in proteins. Analysis and prediction of inter-helix distances // J. Mol. Biol. -1993. Vol. 233. - P. 464-479.

9. Jiang S., Vakser I.A. Shorter side chains optimize helix-helix packing // Protein Sci. 2004. - Vol. 13. - P. 1426-1429.

10. Schiffer M., Edmundson A. Use of helical wheels to represent the structures of proteins and to identify segments with helical potential // Biophysical Journal. 1967. - Vol. 7. - P. 121-134.

11. Lim V.I. Structural principles of globular organization of protein chains. A stereochemical theory of globular protein secondaiy structure // J. Mol. Biol. 1974. - Vol. 88. r P. 857-872.

12. Ефимов A.B. Стереохимия упаковок а-спиралей p-структуры в компактной глобуле // Докл. АН СССР. 1977. - Т. 235. - С. 699-702.

13. Efîmov A.V. Packing of a-helices in globular proteins. Layer structure of globin hydrophobic cores // J. Mol. Biol. 1979. - Vol. 134. - P. 23-40.

14. Efîmov A.V. Complementary packing of a-helices in proteins // FEBS Lett. 1999. - Vol. 463. - P. 3-6.

15. Efîmov A.V. Packing of amphipathic a-helices in proteins // Protein Structures: Kaleidoscope of Structural Properties and Functions. Research Singpost. India. 2003. - P. 17-32.

16. Chothia C., Levitt M., Richardson D. Structure of proteins: packing of alpha-helices and pleated sheets // Proc. Natl. Acad. Sci. USA. 1977. -Vol. 74.-P. 4130-4134.

17. Chothia C. Principles that determine the structure of proteins // Ann. Rev. Biochem. 1984. - Vol. 53. - P. 537-572.

18. Chothia C.} Janin J. Orthogonal packing of beta-pleated sheets in proteins // Biochemistry. 1982. - Vol. 21. - P. 3955-3965.

19. Cohen F.E., Sternberg M.J.E., Taylor W.R. Analysis of the tertiary . structure of protein beta-sheet sandwiches // J. Mol. Biol. 1981. - Vol.148.-P. 253-272.

20. Richardson J.S., Getzoff E.D., Richardson D.C. The beta bulge: a common small unit of nonrepetitive protein structure // Proc. Natl. Acad. Sci. USA. 1978. - Vol. 75. - P. 2574-2578.

21. Janin J., Chothia C. Packing of alpha-helices onto beta-pleated sheets and the anatomy of alpha/beta proteins // J. Mol. Biol. 1980. - Vol. 143. - P. 95-128.

22. Cohen F.E., Sternberg M.J.E., Taylor W.R. Analysis and prediction of the packing of alpha-helices against a beta-sheet in the tertiary structure of globular proteins // J. Mol. Biol. 1982. - Vol. 156. - P. 821-862.

23. Chothia C., Jatiin J. Relative orientation of close-packed р-pleated sheets in proteins // Proc. Natl. Acad. Sci. USA. 1981. - Vol. 78. - P. 41464150.

24. Ramachandran G.N., Ramakrishnan C., Sasisekharan V. Stereochemistry of polypeptide chain configurations // J. Mol. Biol. 1963. - Vol. 7. - P. 95-99.

25. Ефимов A.B. Стандартные конформации полипептидной цепи в нерегулярных участках белков // Молекулярная биология. 1986. -Т. 20. - С. 250-260.

26. Efimov A.V Standard structures in proteins // Prog. Biophys. Mol. Biol. -1993.-Vol. 60.-P. 201-239.

27. Scheraga H.A. Calculations of conformations of polypeptides // Advan. Phys. Org. Chem. 1968. - Vol. 6. - P. 103-184.

28. Watson H.C. Stereochemistry of the protein myoglobin // In: Progress in Stereochemistry. Eds. Aylett B.S., Harris M.M. Butterworth & Co. Ltd, London. 1969. - Vol. 4. - P. 299-333.

29. Ponnuswamy P.K., Sasisekharan VOL. Studies on the conformation of amino acids. IX. Conformations ofbutyl, seryl, threonyl, cystennyl, and valyl residues in a dipeptide unit // Biopolymers. 1971. - Vol. 10. - P. 565-582.

30. Gelin B, Karplus M. Sidechain torsional potentials and motion of amino acids in proteins: bovine pancreatic trypsin inhibitor // Proc. Natl. Acad. Sci. USA. 1975. - Vol. 72. - P. 2002-2006.

31. IUPAC-IUB Commission on Biochemical Nomenclature. Abbreviations and symbols for the description of the conformation of polypeptide chains //J. Mol. Biol. 1970. - Vol. 52. - P. 1-17.

32. Janin J., Wodak S., Levitt M., Maigret B. Conformation of amino acid side-chains in proteins // J. Mol. Biol. 1978. - Vol. 125. - P. 357-386.

33. Ponder J.W., Richards F.M. Use of packing criteria in the enumeration of allowed sequences for different structural classes // J. Mol. Biol. 1987. -Vol. 193.-P. 775-791.

34. Schrauber H., Eisenhaber F., Argos P. Rotamers: to be or not to be? An analysis of amino acid side-chain conformations in globular proteins // J. Mol. Biol. 1993. - Vol. 230. - P. 592-612.

35. Dunbrack R.L. Jr., Karplus M. Backbone-dependent rotamer library for proteins: Application to side-chain prediction // J. Mol. Biol. 1993. -Vol. 230.-P. 543-571.

36. Lovell S.C., Word J.M., Richardson J.S., Richardson D.C. The penultimate rotamer library // Proteins. 2000. - Vol. 40. - P. 389-408.

37. McGregor M.J., Islam S.A., Sternberg M.J.E. Analysis of the relationship between side-chain conformation and secondary structure in globular proteins//J. Mol. Biol. 1987. - Vol. 198. -P. 295-310.

38. Dunbrack R.L. Jr., Cohen F.E. Bayesian statistical analysis of protein side-chain rotamer preferences // Protein Sci. 1997. - Vol. 6. - P. 16611681.

39. Chamberlain A.K., Bowie J.U. Analysis of side-chain rotamers in transmembrane proteins. Biophys. J. 2004. - Vol. 87. - P. 3460-3469.

40. Бражников E.B., Ефимов A.B. Роль структурного контекста в отборе конформации гидрофобных боковых цепей, расположенных в а- и d-позициях а-спиралей // Молекулярная биология. 2007. - Т. 41. - С. 544-555.

41. Ефимов А.В. Механизм отбора поворотных изомеров боковых цепей в а-спиралях // Биохимия. 2007. - Т. 72. - С. 223-227.

42. Ефимов А.В. Новые структурные мотивы в а-спиральных белках // Биоорганическая химия. 1997. - Т. 23. - С. 243-250.

43. Efîmov A.V. Favoured structural motifs in globular proteins // Structure. -1994.-Vol. 2.-P. 999-1002.

44. Suguna, K., Bott, R.R., Padlan, E.A., Subramanian, E., Sheriff, S., Cohen, G.H., Davies, D.R. Structure and refinement at 1.8 À resolution of the aspartic proteinase from Rhizopus chinensis // J. Mol. Biol. 1987. - Vol. 196.-P. 877-900.

45. Castillo, R.M., Mizuguchi, K., Dhanaray, VOL., Albert, A., Blundell, T.L., Murzin, A.G. A six-stranded double-psi beta barrel is shared by several protein superfamilies // Structure. 1999. - Vol. 7. - P. 227-236.

46. Crick F.H.C. Is a-keratin a coiled coil? Nature. - 1952. - Vol. 170. - P. 882-883.

47. Crick F.H.C. The Fourier transform of a coiled-coil // Acta Cryst. 1953. -Vol. 6.-P. 685-689.

48. Crick F.H.C. The packing of a-helices: simple coiled-coils // Acta Cryst. -1953.-Vol. 6.-P. 689-697.

49. Fraser R.D., Macrae T.P., Miller A. The coiled-coil model of alpha-keratin structure // J. Mol. Biol. 1964. - Vol. 10. - P. 147-156.

50. Rao S.T., Rossmann M.G. Comparison of super-secondary structures in proteins //J. Mol. Biol. 1973. - Vol. 76. - P. 241-256.

51. Richardson J.S. P-Sheet topology and the relatedness of proteins // Nature. 1977^- Vol. 268. - P. 495-500.

52. Levitt M., Chothia C. Structural patterns in globular proteins // Nature. -1976.-Vol. 261.-P. 552-558.

53. Efimov A.V. Structure of a-a-hairpins with short connections // Prot. Eng. -1991.-Vol. 4.-P. 245-250.

54. Ефимов A.B. Новая супервторичная структура белков: аа-уголок // Молекулярная биология. 1984. - Т. 18. — С. 1524-1537.

55. Efimov A.V. A novel super-secondary structure of proteins and the relation between the structure and the amino acid sequence // FEBS Lett. -1984.-Vol. 166.-P. 33-38.

56. Schellman C. The аь-conformation at the ends of helices // In: Protein Folding. Ed. Elsevier J.R. Amsterdam, New York. 1980. - P. 53-61.

57. Harbury P.B., Plecs J.J, Tidor В., Alber Т., Kim P.S // 1998. Science. -Vol. 282.-P. 1462-1467.

58. Gonzalez L. Jr., Woolfson D.N., Alber T. Buried polar residues and structural specificity in the GCN4 leucine zipper // Nat. Struct. Biol. — 1996.-Vol.3.-P. 1011-1018.

59. Oakley M.G., Kim P.S. A buried polar interaction can direct the relative orientation of helices in a coiled coil // Biochemistry. 1998. - Vol. 37. -P. 12603-12610.

60. Harbury P.B., Zhang Т., Kim P.S., Alber T. A switch between two-, three-, and four-stranded coiled coils in GCN4 leucine zipper mutants // Science. 1993. - Vol. 262. - P. 1401-1407.

61. Harbury P.B., Kim P.S., Alber T. Crystal structure of an isoleucine-zipper trimer//Nature. 1994. - Vol. 371. -P. 80-83.

62. Krylov D., Mikhailenko I., Vinson C. A thermodynamic scale for leucine zipper stability and dimerization specificity: e and g interhelical mictions //EMBO J. 1994. - Vol. 13. -P. 2849-2861.

63. Ефимов A.B. Архитектура компактных структур из трёх а-спиралей // Биоорганическая химия. 1998. - Т. 24. - С. 517-522.

64. Schimmel P.R., Flory P.J. Conformational statistics of copolypeptides containing L-proline // J. Mol. Biol. 1968. - Vol. 34. - P. 105-120.

65. MacArthur M.W., Thornton J.M. Influence of proline residues on protein conformation // J. Mol. Biol. 1991. - Vol. 218. - P. 397-412.

66. Ефимов А.В. L-образная структура из двух а-спиралей с остатком пролина между ними // Молекулярная биология. 1992. - Т. 26. - С. 1370-1376.

67. Efïmov A.V. Super-secondary structures in proteins // In: Protein Structure by Distance Analysis. Eds. Bohr H., Brunak S. IOS Press and Ohmsha, Amsterdam-Oxford-Washington-Tokyo-Osaka-Kyoto. 1994. -P. 187-200.

68. Efimov A.V. Common structural motifs in small proteins and domains // FEBS Lett. 1994. - Vol. 355. - P. 213-219.

69. Efimov A.V. A structural tree for a-helical proteins containing a-a-corners and its application to protein classification // FEBS Lett. 1996. -Vol. 391.-P. 167-170.

70. Argos P., Rossmann M.G., Johnson J.E. A four-helical super-secondary structure // Biochem. Biophis. Res. Communs. 1977. - Vol. 75. - P. 8386.

71. Presnell S.R., Cohen F.E. Topological distribution of four-a-helix bundles //Proc. Natl. Acad. Sci. USA. 1989. - Vol. 86. - P. 6592-6596.

72. Sibanda B.L., Thornton J.M. P-Hairpin families in globular proteins // Nature. 1985. - Vol. 316. - P. 170-174.

73. Milner-White E.J., Poet R. Four classes of P-hairpins in proteins // Biochem. J. 1986. - Vol. 240. - P. 289-292.

74. Richardson J.S. The anatomy and taxonomy of protein structure // Adv. Protein Chem. 1981. - Vol. 34. - P. 167-339.

75. Efimov A.V. Pseudo-homology of protein standard structures formed by two consecutive p-strands //FEBS Lett. 1987. - Vol. 224. - P. 372-376.

76. Efimov A.V. Structure of coiled P-P-hairpins and p-p-corners // FEBS Lett., 1991. Vol. 284. - P. 288-292.

77. Ефимов A.B. Стереохимия упаковок а-спиралей и Р-структуры в компактной глобуле // Докл. АН СССР. 1977. - Т. 235. - С. 699-702.

78. Kajava A.V. Effect of peptide group-water interactions on the two-stranded P-structure // In: Water-Biomolecule Interactions. Eds. Palma M.U., Palma-Vittorelli M.B., Parak F. SIF, Bologna. 1993. - Vol. 43. -P. 89-92.

79. Efimov A.V. A structural tree for proteins containing S-like p-sheets // FEBS Lett. 1998. - Vol. 437. - P. 246-250.

80. Efimov A.V. A novel super-secondary structure of P-proteins: A triple-strand corner // FEBS Lett. 1992. - Vol. 298. - P. 261-265.

81. Efimov A.V. A structural tree for proteins containing 3p-corners // FEBS Lett. 1997. - Vol. 407. - P. 37-41.

82. Ефимов A.B. Структурные деревья белков, содержащих ср-мотивы // Биохимия. 2008. - Т. 73. - С. 29-35.

83. Ефимов А.В. Супервторичная структура р-белков // Молекулярная биология. 1982. - Т. 16. - С. 799-806.

84. Efimov A.V. Structural similarity between two-layer a/p- and P-proteins // J. Mol. Biol. 1995. - Vol. 245. - P. 402-415.

85. Ефимов A.B. Стандартные-структуры-в белковых молекулах. I.a-p-Шпильки // Молекулярная биология. 1986. - Т. 20. - С. 329-339.

86. Ефимов А.В. Стандартные структуры в белковых молекулах. II. Р-а-Шпилыш // Молекулярная биология. 1986. - Т. 20. - С. 340-345.

87. Sternberg M.J.E., Thornton J.M. On the conformation of proteins: the handedness of p-strand-a-helix-p-strand unit // J. Mol. Biol. 1976. -Vol. 105.-P. 367-382.

88. Sternberg M.J.E., Thornton J.M. On the conformation of proteins: The handedness of the connection between parallel P-sheets // J. Mol. Biol. -1977.-Vol. 110.-P. 269-283.

89. Eflmov A.V. Structural trees for protein superfamilies // Proteins. 1997. -Vol. 28.-P. 241-261.

90. Ефимов A.B. Структурные деревья глобулярных белков // Успехи биологической химии. 2004. - Т. 44. - С. 109-132.

91. Гордеев А.Б., Кондратова М.С., Ефимов А.В. Новое структурное древо Р-белков, содержащих abcd-единицы // Молекулярная биология. 2008. - Т. 42. - С. 323-326.

92. Гордеев А.Б., Ефимов А.В. Новое структурное древо (а + Р)-белков, содержащих abCd-единицы // Молекулярная биология. 2009. - Т. 43.-С. 521-526.

93. Berman Н.М., Westbrook J., Feng Z., Gilliland G., Bhat T.N., Weissig H., Shindyalov I.N., Bourne P.E. The Protein Data Bank // Nucl. Asids Res. -2000.-Vol. 28.-P. 235-242.

94. Murzin A.G., Brenner S.E., Hubbard T.5 Chothia C. SCOP: a structural classification of proteins database for the investigation of sequences and structures // J. Mol. Biol. 1995. - Vol. 247. - P. 536-540.

95. Sayle R., Milner-White J. RasMol: biomolecular graphics for all // Trends Biochem. Sci. 1995. - Vol. 20. - P. 374-376.

96. Altschul S.F., Gish W., Miller W., Myers E.W., Lipman D J. Basic local alignment search tool // J. Mol. Biol. 1990. - Vol. 215. - P. 403-410.

97. Tatusova T.A., Madden T.L., Blast 2 sequences a new tool for comparing protein and nucleotide sequences // FEMS Microbiol. Lett. -1999.-Vol. 174.-P. 247-250.

98. Koradi R., Billeter M., Wuthrich K. MOLMOL: a program for display and analysis of macromolecular structures // J. Mol. Graph. 1996. - Vol. 14, P. 51-55.

99. Лим В.И., Мазанов A.JL, Ефимов А.В. Стереохимическая теория пространственной структуры глобулярных белков. I. Высокоспиральные промежуточные структуры // Молекулярная биология. 1978. - Т. 12. - С. 206-213.

100. Efimov A.V. Structural motifs are closed into cycles in proteins // Biochem. Biophys. Res. Commun. 2010. - Vol. 399. - P. 412-415.

101. Gordeev A.B., Kargatov A.M., Efimov A.V. PCBOST: Protein classification based on structural trees // Biochem. Biophys. Res. Commun. 2010. - Vol. 397. - P. 470-471.

102. Каргатов A.M., Ефимов А.В. Поворотные изомеры боковых цепей в а-а-шпильках белков и механизм их отбора // Молекулярная биология. 2007. - Т. 41. - С. 876-884.

103. Каргатов A.M., Ефимов А.В. Новый структурный мотив: комбинация ра(3-единицы и \/-мотива // IV Российский симпозиум «Белки и пептиды». Тезисы докладов. - Казань, 2009. - С. 317.

104. Каргатов А.М., Ефимов А.В. Новый структурный мотив и структурные деревья содержащих его белков // Биохимия. 2010. -Т. 75.-С. 305-312.