Бесплатный автореферат и диссертация по биологии на тему
Петли и повторы в белках как отпечатки молекулярной эволюции
ВАК РФ 03.01.02, Биофизика

Автореферат диссертации по теме "Петли и повторы в белках как отпечатки молекулярной эволюции"

005055296

На правах рукописи

ДЕРЮШЕВА ЕВГЕНИЯ ИГОРЕВНА

ПЕТЛИ И ПОВТОРЫ В БЕЛКАХ КАК ОТПЕЧАТКИ МОЛЕКУЛЯРНОЙ ЭВОЛЮЦИИ

Специальность 03.01.02 - биофизика

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук

2 2 НОЯ 2012

Пущипо - 2012

005055296

Работа выполнена на кафедре физики Федерального государственного бюджетного образовательного учреждения высшего профессионального образования "Тульский государственный университет", а также в группе физики нуклеопротеидов Федерального государственного бюджетного учреждения науки Института белка Российской академии наук, г. Пущино.

Научные руководители: доктор физико-математических наук, профессор

¡Сердюк Игорь Николаевич!

доктор физико-математических наук, профессор Левин Даниил Михайлович

Научный консультант: доктор физико-математических наук

Галзитская Оксана Валернановна

Официальные оппоненты: доктор биологических наук, профессор

Пермяков Евгений Анатольевич (ИБП РАН, Пущино) кандидат физико-математических наук Есипова Наталья Георгиевпа (ИМБ РАН, Москва)

Ведущая организация: Федеральное государственное бюджетное

учреждение науки Институт математических проблем биологии Российской академии наук, г. Пущино

Защита диссертации состоится « 5 » декабря 2012 г. в 13-30 на заседании совета Д 002.093.01 по защите диссертаций на соискание ученой степени кандидата наук, на соискание ученой степени доктора наук, созданном на базе Федерального государственного бюджетного учреждения науки Института теоретической и экспериментальной биофизики Российской академии наук по адресу: 142290, г. Пущино Московской обл., ул. Институтская, 3, ИТЭБ РАН.

С диссертацией можно ознакомиться в Центральной библиотеке НЦБИ РАН по адресу: 142290, г. Пущино Московской обл., ул. Институтская, 3.

Автореферат разослан « 3 »_ ) Д 2012 г.

Ученый секретарь диссертационного

совета, кандидат физ.-мат. наук х/> ьС-СС&Ф Ланина Н. Ф.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность работы. Диссертационная работа посвящена выявлению взаимосвязи между функциональностью белков и количеством и спецификой гибких участков (петель) и структурных повторов в них.

В работе предложен новый взгляд на роль гибких участков в процессе функционирования белков и их эволюционного развития. В его основе лежит обнаруженная корреляция между числом петель в факторах элонгации и сложностью организма. Для обоснования выводов используются как данные о присутствии той или иной петли, так и о специфике, содержащейся в ней последовательности аминокислот. В работе сформулирована гипотеза об эволюционном развитии факторов элонгации EF1 и EF2.

Исследование семейства рибосомных белков S1 позволило рассматривать число структурных доменов как стабильный признак принадлежности микроорганизма к тому или иному таксономическому отделу, а также судить о "направлении" эволюции между этими отделами. В работе также проведено исследование центрального РНК-связывающий домена в семействе рибосомных белков S1.

Идея о том, что уникальная третичная структура белка необходима для его функционирования, берет свое начало из более чем столетней давности экспериментов Э. Фишера с экстрактом пивных дрожжей. На основании этих экспериментов он высказал гипотезу, согласно которой взаимодействие между молекулами можно представить подобно взаимодействию "ключ-замок", при котором строгое стереохимическое узнавание между молекулами является ключевым элементом взаимодействия. Позже на основе его экспериментов, а также экспериментов JI. Полинга, К. Анфинсена и Д. Эдсалла, была сформулирована центральная догма молекулярной биологии, согласно которой один ген, посредством транскрипции и трансляции, кодирует один белок, аминокислотная последовательность которого определяет одну уникальную трехмерную структуру и, как следствие, одну выполняемую им функцию.

Однако последующие исследования ряда белков доказали, что этот принцип не всегда выполняется. Первое сомнение в строгости гипотезы "ключ-замок" появилось в 1950 г., когда Ф. Каруш обратил внимание на то, что бычий сывороточный альбумин проявляет универсальную способность связываться со

многими малыми гидрофобными молекулами. Он полагал, что гипотеза Фишера должна быть дополнена представлением о конфигурационной приспособляемости. Однако его предсказание о конфигурационных изменениях в белках в процессе взаимодействия с лигандами и, как следствие этого, множественность функций белка долгое время игнорировались.

Тем не менее, первые сравнения структуры лизоцима в двух функциональных состояниях (с лигандом и без него) показали, что в белках действительно имеют место пространственные смещения отдельных атомов. Эти изменения носили локальный характер и не превышали 1 А. Однако в ряде случаев изменения такого рода могли принимать более масштабный характер, как это было в случае дрожжевой гексокиназы при ее связывании с глюкозой, или в случае прокариотического фактора элонгации ЕР1 при замене ГДФ на ГТФ. Намного позже был открыт ряд белков, которые при высокой идентичности последовательностей образовывали разные структуры, а для ряда амилоидогенных белков данные электронной и атомно-силовой микроскопии показывают, что часто один и тот же белок образует в растворе полиморфные структуры.

Кроме того, в отдельный класс белков стали выделять природно-неструктурированные белки. "Приобретаемая" структура для таких белков часто зависит от вида лиганда и при этом может сильно меняться. Такое структурное разнообразие и своеобразная "структурная гибкость (пластичность)" определяет полифункциональность таких белков. Таким образом, центральная догма молекулярной биологии для этих специфических белков преобразуется в следующую: один ген кодирует один белок, окончательную трехмерную структуру которого определяет партнер по взаимодействию или особенности окружающей его среды. Сформированная структура и определяет функцию или функции данного белка. Несмотря на то, что уже открыто около 600 природно-неструктурированных белков, часть из которых является биологически значимыми (например, белки аппарата биосинтеза), до сих пор не была четко установлена связь между количеством и спецификой подобных участков и функциональной активностью этих белков. Отметим тот факт, что полифункциональность не всегда является следствием наличия в белках дополнительных гибких участков структуры. Для ряда белков

характерным является множественное копирование собственной доменной структуры. При этом, в таких белках каждый домен, несмотря на одну и ту же структуру, выполняет различную функцию. До сих пор не найдено объяснение принципов такого копирования и, как следствие, полифункциональности таких многодоменных белков.

В данной работе предлагается новый взгляд на роль гибких участков (петель) в семействе факторов элонгации, а также на число структурных доменов (повторов) в семействе рибосомных белков 81, в процессе их эволюционного развития и, как следствие, в их функционировании. Эти семейства являются типичными представителями полифункциональных белков с разным числом неструктурированных участков. Отметим, что рибосомный белок 81 к тому же содержит различное количество структурных повторяющихся доменов в разных организмах. Обнаруженная в этих белках корреляция между числом петель и повторов и сложностью организма позволила нам рассматривать их число как стабильный признак принадлежности организма к определенному таксономическому отделу. Кроме того, выявленные закономерности позволили судить о "направлении" эволюции как этих белков, так и содержащих их организмов, что говорит об уникальности выявленных признаков с точки зрения молекулярной эволюции.

Цель и задачи работы. Цель данной работы - выявление взаимосвязи между функциональностью белков и количеством и спецификой гибких участков и структурных повторов в них. Для достижения этой цели были поставлены следующие задачи:

1. Выявить возможности программы РоЫипй)1с1 для характеристики белков, содержащих неструктурированные участки.

2. Установить взаимосвязь между количеством гибких участков в белках О-семейства и принадлежностью организма к тому или иному семейству Живого мира. Сформулировать альтернативный признак для классификации Живого мира.

3. Охарактеризовать семейство прокариотических рибосомных белков 81, в том числе:

• проанализировать с помощью специализированных пакетов биоинформатических программ аминокислотные последовательности семейства рибосомных белков 81;

• провести количественный и качественный анализ числа структурных доменов с целью выявления эволюционных закономерностей.

4. Установить роль петель и повторов в исследуемых белках.

Научная новизна диссертации.

1. Установлено, что суммарное число аминокислотных остатков в факторах элонгации ЕР1 отражает разделение Живого мира на три Надцарства; аналогичная закономерность прослеживается и для белков ЕР2.

2. Высказана гипотеза об эволюционном развитии факторов элонгации ЕР1 и Е¥2.

3. Выявлен уникальный консервативный домен в семействе рибосомных белков Э1, обладающий РНК-связывающими свойствами.

4. Найдено, что число структурных доменов в семействе рибосомных белков 81 отражает разделение прокариот на основные таксономические отделы.

5. Предложена гипотеза, согласно которой Природа оперирует различными вставками (петлями или повторами), приспосабливая их число и положение таким образом, чтобы белок мог выполнять ряд специализированных функций: одну в простейших организмах и несколько в высших или более сложных организмах.

Практическая значимость. Предложен новый взгляд на роль гибких участков (петель) в семействе факторов элонгации, а также на число структурных доменов (повторов) в семействе рибосомных белков 81, в процессе их эволюционного развития и, как следствие, в их функционировании. Он отличается от всех принятых признаков систематики и открывает новые возможности для исследования белковых последовательностей с точки зрения молекулярной эволюции.

Основные положения, выносимые на защиту 1. В качестве альтернативного признака для классификации Живого мира может быть взята способность аминокислотных последовательностей

белков образовывать неструктурированные участки, которые проявляются в их трехмерной структуре в виде петель.

2. В семействе прокариотических рибосомных белков S1, содержащих разное количество доменов, выявляется один консервативный домен, мигрирующий по цепи и локализующийся в белках с определенной закономерностью. Этот домен рассматривается как центральный РНК-связывающий домен в семействе рибосомных белков.

3. Число структурных доменов прокариотических рибосомных белков S1 является стабильным признаком принадлежности микроорганизма к тому или иному отделу.

4. Изменения числа структурных доменов прокариотических рибосомных белков S1 является следствием латерального переноса гена белка S1 в ходе редукционной эволюции между основными отделами Эубактерий.

5. Наряду с другими признаками, структурные петли и повторы в белках аппарата биосинтеза могут рассматриваться как уникальные отпечатки молекулярной эволюции.

Апробация работы. Основные результаты диссертационной работы были изложены в докладах на следующих российских и международных конференциях: Вычислительная филогенетика и геносистематика, Москва, 1619 ноября 2007; International EMBO workshop, Intrinsically unfolded proteins: biophysical characterisation and biological significance, Budapest, Hungary, 20-24 May 2007; Conference for young scientists, PhD students and students on Molecular Biology and Genetics, Ukraine, Kyiv, 20-22 September 2007; Mathematical Biology and Bioinformatics, Russia, Moscow region, Pushchino, 7-13 September 2008;Четырнадцатая Всероссийская Научная Конференция Студентов Физиков, Россия, г. Уфа, 27 марта - 3 апреля 2008; Международная научная конференция студентов, аспирантов и молодых учёных "Ломоносов-2009", Россия, Москва, 13-18 апреля 2009; Third International Conference on Mathematical Biology and Bioinformatics, Russia, Moscow region, Pushchino, 10-15 October 2010; на семинаре в Национальном Институте здоровья (NIH, Bethesda), Америка, 2007. Работа прошла апробацию на научных семинарах Института белка РАН (Пущино) и в Институте теоретической и экспериментальной биофизики РАН (Пущино).

Публикации. По теме диссертации опубликовано 11 работ, из них 5 статей [А1-А5], включая 4 статьи в реферируемых журналах, входящих в список ВАК [А1-АЗ, А5], и 5 тезисов докладов на конференциях.

Структура и объем диссертационной работы. Диссертация состоит из введения, 5 глав, выводов и списка литературы, включающего наименований. Работа изложена на страницах и содержит 26 рисунков и 18 таблиц.

Список сокращений, а.о. - аминокислотный остаток; в-семейство -семейство ГТФ-связывающих белков (ОТР); ГТФ - гуанозинтрифосфат; РЫРаяе - полинуклеотидфосфорилаза, ЯМР - ядерный магнитный резонанс.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность темы диссертационной работы, сформулирована цель работы, обсуждается новизна и практическая значимость полученных результатов.

В главе 2 представлен обзор литературы по теме диссертационной работы. В обзоре описаны общие физические и биофизические свойства белков, выполняющих одну и несколько функций. Особое внимание уделено свойствам природно-неструктурированных белков и белков со структурными повторами, а также основным проблемам идентификации в них границ функционально-значимых участков и доменов. [1, 2, 3]. Рассмотрены структурные и функциональные особенности исследуемых в работе белков с разной степенью внутренней неупорядоченности (семейство в-белков) и числом структурных доменов (семейство рибосомных белков 81).

В главе 3 предлагается новый взгляд на роль неструктурированных участков в семействе факторов элонгации.

Первая часть главы 3 посвящена описанию специализированных программ по предсказанию неструктурированных участков, таких как РОЫОК, ЯОШ, ШйЕМВЬ, РгеЬГЫК, ШРгсс1, С1оЬР1о1 2, Ро1с11пс1ех. Особое внимание уделено описанию принципа работы программы РоЫШйэШ, разработанной в Институте белка РАН [4, 5], отличительной особенностью которой является возможность выбора ширины усредняемого окна, что дает возможность идентифицировать даже короткие гибкие участки, соединяющие элементы

вторичной структуры. На примере анализа аминокислотных последовательностей белков С]-ссмейства и убиквитин-подобного домена ЬРЫС-2 нами было показано, что программа РоШипРэШ лучше предсказывает как короткие, так и длинные гибкие участки, положение которых находится в хорошей корреляции с данными рентгеноструктурного анализа и данными ядерного магнитного резонанса (ЯМР). Кроме того, проведенное сравнение результатов предсказания программы Ро1сШпГоШ с результатами предсказаний других программ (на примере ШЖЫ, О^ЕМВЬ, РгеЬтк, ШРгес!, 01оЬр1о1 2, Ро1с11пс1ех, РОЫЕЖ) для выбранных белков показало, что программа Ро1сШп(Ъ1с1 намного лучше предсказывает как совсем короткие (3 а.о.), так и относительно короткие неструктурированные участки (11 а.о.).

Во второй части главы 3 дается ответ на вопрос: "Существует ли взаимосвязь между количеством гибких участков (петель), выявляемых программой РоЫШАэШ, в семействе факторов элонгации и принадлежностью организма к тому или иному таксономическому отделу?".

Для этого, с помощью программы РоМипйэШ были проанализированы более 300 аминокислотных последовательностей этих белков. Нами было найдено, что суммарное число аминокислотных остатков в факторах элонгации ЕР-1 отражает разделение живого мира на три Надцарства. Длины полипептидной цепи факторов элонгации растут при усложнении организмов. Надцарство Эубактерий занимает интервал 393- 406 а.о., Надцарство Архей -интервал 422 - 444 а.о., а Надцарство Эукариот - интервал 458-464 а.о. Анализ обнаруженных дополнительных петель в факторах элонгации показал, что их максимальное число (кроме эффекторной) равно шести, из которых три петли (А, В, С) выявляются в первом домене, одна петля (Э) - во втором и две петли (Е и Р) - в третьем домене. Дополнительные предсказанные петли для ЕР-1 из Я. сегехч.ч'ше показаны на рисунке 1.

376-394, петля Е

121-135, петля А

J№'''

С-конец v петля F

40-52, эффекторная петля

N-конец

298-308, петля D

Рис. I. Пространственная структура эукариотического фактора элонгации ЕР1 из 5. сегеушае в комплексе с фрагментом ЕР-1В (последний не показан) (РИВ-код №60). Черным выделены предсказанные петли и перетяжки между доменами._

Факторы элонгации бактерий Надцарства Эубактерий содержат минимальное число петель. У Е. coli нет ни одной дополнительной петли кроме эффекторной, тогда как у термофильных бактерий (Т. aquations и Т. thermophilics) выявляется одна термофильная петля. Сине-зеленые водоросли содержат одну или две дополнительные петли. Одна выявляется на месте термофильной петли (петля С), а другая выявляется в третьем домене фактора (петля Е как у S. platensis). Для факторов эукариотического Надцарства предсказывается существование дополнительных петель, число которых равно трем или четырем. Так, факторы элонгации у животных содержат две петли (А и В) в первом домене фактора и две петли (Е и F) в третьем домене. Несколько особняком располагается отдел членистоногих: у них выявляется петля D. У Царства растений не выявляются петли В и D. У всех эукариотических факторов на С-конце всегда присутствует полностью неупорядоченная область F длиной около 20 аминокислот. Длины перетяжек, соединяющих первый и второй домены, в среднем одинаковы как в прокариотических, так и в эукариотических факторах элонгации. Однако длины петель между вторым и третьим доменами в среднем на 8-10 аминокислот больше в эукариотических факторах. Этот факт мы рассматриваем как аргумент в пользу того, что эукариотические факторы элонгации обладают большей междоменной подвижностью, чем прокариотические.

Принципиально новым результатом для понимания структуры эукариотических факторов элонгации является предсказание наличия у них на С-конце неструктурированной области длиной около 20 а.о. (петля Р). Длина этой области не зависит от источника выделения. Дополнительные петли внутри каждого из доменов, большая неструктурированная петля на С-конце и высокая междоменная подвижность в эукариотических факторах элонгации могут служить объяснением того факта, что до сих пор ни один из факторов эукариотического Надцарства не закристаллизован в изолированной форме.

Факторы элонгации Надцарства архей выглядят как специализированные белковые структуры, число петель в которых (две или три) и их расположение по доменам фактора определяются их функцией. Так, исключительным признаком серных бактерий является наличие петли А. Кроме того, у них предсказываются еще две петли (Б и Е). Гипертермофилы содержат петлю В, которой нет у остальных архей. Галлофилы не содержат петель А, В и С в первом домене, но всегда содержат петлю О во втором домене и петлю Е в третьем домене. Общей чертой, объединяющей архейные факторы элонгации с прокариотическими факторами, является отсутствие петли Р. Таким образом, данные, полученные при сопоставлении свойств белковых факторов элонгации, служат еще одним подтверждением того, что Архей представляют собой самостоятельное Надцарство, свойства которого сильно отличны от таковых Надцарства Эубактерий.

Предсказываемые для архейного фактора элонгации две дополнительные петли длиной 14 и 18 а.о. в районе 283-296 и 364-381 а.о. имеют суммарную длину, близкую к разности между средней длиной архейных и прокариотических факторов. Этот факт означает, что дополнительное удлинение полипептидной цепи архейных факторов элонгации по сравнению с прокариотическими связано с появлением новых петель (Рисунок 2).

Эубактерии

Эукариоты

Бактерии

.....-с

Грибы

] Кр*анх*оты

( А, В. С ) I"

Эврпархе.ОТЫ

л .

( о )

Ч|ГГ.)1.иЦ.С1:1 .....

.....|хнгр|щнопн«отз ^" ¿2?"'

"I Ч*ТВ

Члекхстоногхе Г

1 Хордовые

.....| Аскомккотл |~С"~458~";>-»

......¡Зс^^офта^^--™.-^-*'

—(Сульфобжтерии

-1

ДйМ^НЫ фжтйрл

Петли

А В С 1> Е Е петель

- - - - - а

- - + - - 1

- - + - + - 2

+ - - - + -

+ - - - + - 2

+ - - - + - 2

+ + - - + + 3-4

+ ± - ± + +

+ + - - + + 4

+ - - + + + 4

+ - - + + 3

+ - - + + -

+ - + + -

- - - + + - 2

- - - + + - 2

I II Ш

Рис. 2. Схематическое представление предсказываемых петель в факторах элонгации ЕР1 для трех Надцарств Живого мира.__

Аминокислотный состав некоторых петель весьма консервативен и удивительно совпадет для факторов элонгации из разных источников. Так, структурный мотив петли А для всех факторов внутри Надцарства Эукариот почти не отличается (ОЕРЕАИЗКЛчЮдТК - у животных, ООРЕГЮ18КООдТ11 - у растений, и ОЕРЕА018КОО<ЗТК - у грибов), тогда как та же петля А у типа кренархеоты Надцарства Археи имеет совершенно другой мотив (КОЕУЕАОМБАЕО). Также консервативна и петля Е у эукариот (0ИЯ(Т)80К). Интересно, что структурный мотив петли В у гипертермофилов архей (МОАТЕРРР8ЕК) напоминает таковой петли В у животных (ГуГОЭТЕРРУЗ), а мотив петли й у серных бактерий и гипертермофилов (РвОМЮР) близок к мотиву такой же петли для некоторых представителей эукариот (РОБМУОР).

Протесты содержат петли А и Е, типичные для Царства Животных и Грибов. Это подтверждает возможность существования такой супергруппы как

Ор1з1Ьокоп1а [6]. Однако ситуация не так проста: петля Р, которая является отличительной чертой эукариот, отсутствует в Протистах.

Анализ дополнительных петель, предсказанных в белке ЕР2, показывает, что их максимальное число равно десяти: четыре обнаруживаются в первом домене, по одной во втором и третьем, и четыре в четвертом домене. Как и для белка ЕР1 Надцарство Эубактерий содержит минимальное число петель, в то время как у представителей Эукариот число петель колеблется от пяти (растения) до восьми (грибы и членистоногие). Надцарство Архей условно можно поместить посередине между ними с тремя и четырьмя дополнительными петлями.

Таким образом, в рассмотренных белковых последовательностях факторов элонгации ЕР отличие одного организма от другого сводится к присутствию той или иной петли, а также специфики их аминокислотного состава. В простейших организмах их число оказалось минимальным, тогда как в высших — максимальным.

К сожалению, имеющиеся в литературе данные пока недостаточны для установления четкой связи между всеми петлями и функцией белка, за исключением эффекторной и термофильной петель. Кроме того, подробное исследование й-доменов семейства ГТФ-связывающих белков позволило нам установить функцию петли В в факторах элонгации ЕР1. Петля В в факторах элонгации ЕР1, предсказанная при ширине окна в 11 а.о. соответствует одной из пяти петель формирующих нуклеотид-связывающий сайт гуанина в О-домене. Эта петля имеет консервативный состав МКХО (X - любая аминокислота) и частично участвует в распознавании гетероцикла гуанина. Также отметим, что во всех дополнительных петлях присутствует лизин -аминокислота, специфичная для факторов элонгации.

Глава 4 посвящена выяснению возможной роли структурных повторов в семействе рибосомных белков 81. Проведенное в первой части этой главы теоретическое исследование белка позволило нам по ряду признаков отнести его к белкам, содержащим неструктурированные участки.

Вторая часть данной главы посвящена выявлению особенностей структурных характеристик семейства рибосомных белков БЬ Согласно существующим данным, этот белок идентифицирован только в прокариотах и

не найден в архебактериях и в эукарнотах. Число аминокислотных остатков рибосомного белка S1 у разных представителей бактерий меняется в большом диапазоне, от 111 а.о. у S. kunkelii до 863 а.о. у Т. pallidum. Известно, что белок полинуклеотидфосфорилаза (PNPase) из Е. coli на С-конце содержит один S1-домен, имеющий высокую идентичность с первоначально выделенными четырьмя Sl-повторами. Полученная методом ЯМР трехмерная структура S1 РНК-связывающего домена из PNPase Е. coli представляет собой бочкообразную укладку с дополнительной а-спиралью между третьим и четвертым ß-листами. Именно такую ОВ-укладку (oligonucleotide binding fold) вторичной структуры принято рассматривать как основной структурный элемент семейства рибосомных белков S1. Схематично архитектуру семейства принято изображать в виде повторяющихся S1 доменов (S1 РНК-связывающим мотивом), число которых зависит от длины белка [7].

Большинство остатков на поверхности бочонка S1 домена PNPase консервативны, что говорит о его РНК-связывающей роли. Однако, во многих доменах белков S1 некоторые из них консервативны (Phe-19, Phe-22, His-34, Asp-64 и Arg-68) и собраны в кластер на поверхности домена. Они расположены в петле между первым и вторым ß-листами (Phe-19), в середине второго ß-листа (Phe-22), в конце третьего ß-листа (His-34) и в петле между последними двумя ß-листами (Asp-64, Arg-68). Эти остатки пространственно сближены, располагаются с одной стороны бочонка и формируют участок, который рассматривается как РНК-связывающий сайт всего семейства рибосомных белков [7].

При выравнивании последовательностей прокариотических белков S1, содержащих разное количество доменов, с S1 РНК-связывающим доменом PNPase из Е. coli, было обнаружено, что в семействе выявляется один домен, имеющий максимальную идентичность с доменом S1 из PNPase (Рисунок 3).

один Б1-домен: два Б1-домена: три Б1-домена:

четыре Б1-домена: —(^(НдомЦНдоменО пять 51 -доменов (менее 500 а.о.): пять 51 -доменов (более 500 а.о.): шесть Б1 -доменов:

r-sTTLTTi у домену 7 у ДОМ'

зменуу V домену 7 ?

D-C

домен (>:омг->[")

Рис. 3. Белки содержащие разное количество доменов. Прямоугольником выделен уникальный консервативный домен._

Этот консервативный домен мигрирует по цепи, локализуется в белках с разным количеством доменов с определенной закономерностью. Для двух-, трех- и четырехдоменных белков он локализуется в последнем домене. Для пятидоменных белков с общей длиной до 500 а.о. таковым является второй домен, тогда как для этих же белков с длиной больше 500 а.о. - третий. Для шестидоменных белков длиной от 550 а.о. роль такого домена играет третий домен. Кроме того, именно в этом консервативном домене располагаются остатки Phe-19, Phe-22, His-34, Asp-64 и Arg-68 (в ряде случаев меняющиеся на взаимозаменяемые остатки), что еще раз подтверждает уникальность этого повтора, а также дает возможность рассматривать его как центральный РНК-связывающий домен в семействе рибосомных белков.

Третья часть главы 4 описывает возможность использования числа структурных S1-доменов в качестве признака классификации основных отделов эубактерий. Как было отмечено выше, число структурных Sl-доменов в прокариотических организмах меняется в ограниченном диапазоне: от одного до шести. Длина одного S1 домена около 70 а.о. Учитывая длину перетяжек между структурными доменами, легко вычислить число структурных доменов бактериальных белков различной длины. Однако, белок S1 из Т. pallidum длиной 863 а.о. содержит также как и белок из Е. coli длиной 557 а.о. только шесть структурных доменов. Увеличение размера белков длиной свыше 600 а.о.

происходит либо за счет удлинения его концов, либо за счет появления других структурных доменов.

На рисунке 4 представлены все исследуемые отделы бактерий и количество обнаруженных в них доменов.

Campylobacter horrotf*

Sp&fttasnwtan&tlii

: 1 S1

¡Муелрйвл» «да

8 I Spiroptai

Myxo coccus xanthus DHSulfuromonas aceloi ' 4

Syntrophobacter luroaroxidansV

V

\Dc$uHuromoriai}aceae\ SyniropnobacteraceaeX \ campytobact Acüiwbaöllus succinogenes \ ОвзиВигавиийЙ»? \

/

, АтлЬаопя spuui.nS /Synechaeocwts etovntus

. С'." к

V

3S1

Neisseria meningitidis-Neisseriaceae Buiklioldena dolosa - ВшМюШепасеае Г4 Nci<;s«fiaies Bordetella avium- Alcoligenacese JBurtdWieeriales" largirinto-Ai

Rickettsia akari- Ricketlsiaceae

\

-ЙЛеЯмг!»-: Rtiodobacteiawae-RtuxkitiaCteiateS, - „ . I / hlamydisej

Roseofcacter deriitrlflcans Oceancoin granulosus

byttirobac

Eryiitobacier Worati ЗрЫщорухк

о \ I

\

w

ИИИИ^ИИИ

Ttwfmöiiittoßeöeraceae Th«moanaomfjcte>e!es ^СНлм Ciostridlacoac

I , .

LjKWtWSa

Sir ;i «sees sae BSreptot

июдаясвижиюр'ию wen»

4 $1 |

My«cba[.'c.iacrre.... ■Je. My№h№JfHH I 1 tßrirjllrr,

N. rt^Ai *

5 S'

Ravobatfenacaaa _ FiavoDacienum psyclnoptiiluat

\ Bat«««, , 4 Ml

SpiiDcliaBlaurae 1

Bia&ajpireiiiiia m Bonelia sannii

Рис. 4. Филогенетическое дерево, отражающее деление исследуемых бактерий на отделы, классы, отряды, семейства (от центра к периферии). Дерево построено по данным определителя Bergey и Taxonomy Browser. Оттенками серого объединены бактерии, содержащие одинаковое число доменов рибосомного белка S1 (от одного до шести).

Наименьшая длина белка S1 наблюдается у представителей семейства Mycoplasmataceae (М mobilie 116 а.о) и Spiroplasmataceae (Sp. kunkelii 111 a.o). Рибосомный белок этих бактерий содержит один S1 домен. Цианобактерии (Cyanobacteria), с длиной белка S1 в среднем около 350 а.о., содержат три S1 домена, а представители отдела Firmicutes с длиной белка 390 а.о. содержат в зависимости от класса три (для Clostridia) или четыре S1 (для Bacillaceae) домена. Все рассмотренные бактерии, относящиеся к отделу Актиномицетов, имеют четыре S1 домена. Бактерии малочисленного монотипичного (состоит из одного класса Deinococci) отдела Deinococcus-Thermus имеют длину S1 белка в среднем около 530 а.о. и всегда содержат пять S1 доменов. Также пять S1 доменов обнаруживаются в бактериях отдела Nitrospirae. К

грамотрицательным, содержащим шесть S1 доменов, бактериям относятся Spirochaetes, Bacteroidetes, Chlamidiae и Proteobacteria (а, ß, у, 5, е). Длина рибосомного белка S1 у всех этих бактерий в среднем около 570 а.о. Также шестидоменными являются и рибосомные белки S1 бактерий отделов Chlorobi (зеленые сульфурные бактерии) и Planctomycetes. Интересным является тот факт, что во всех исследуемых отделах было обнаружено всего несколько бактерий, содержащих два S1 домена. Все остальные представители различных отделов и классов четко сохраняют фиксированное число структурных S1 доменов. Таким образом, число структурных доменов является стабильным признаком принадлежности микроорганизма к тому или иному отделу.

В заключительной части главы 4 приведены результаты исследования семейства рибосомных белков Sic эволюционной точки зрения.

Так как S1 домен является одним из "древнейших" белковых доменов, его наличие в прокариотах в различных сочетаниях, скорее всего, является прямым следствием эволюционного развития организмов. Возможны два пути эволюционного развития белковых молекул организмов - "вверх" и "вниз".

Принцип прогрессивной эволюции базируется на представлениях о Дарвиновской дивергенции: ветви филогенетического дерева расходятся, чтобы никогда не сойтись. Построенные описанным выше способом деревья отражают только вертикальную, направленную "вверх", эволюцию, при которой наследуется базовый геном, часто подверженный различным рекомбинациям и мутациям, приводящим в итоге к фенотипическим изменениям организмов. Однако, известны и случаи влияния на размер и функциональность генов и белков так называемой редукционной эволюции. При таком влиянии отсекается все "ненужное", т.е. со временем происходит сокращение числа генов, и, как следствие, белковых продуктов, а также утрата различных функций и даже целых клеточных органелл. Такая "закономерность" особенно свойственна патогенным бактериям, так как они используют для своей жизни метаболические системы клетки "хозяина" и не нуждаются в собственных аналогичных системах [8]. Еще одним важным ключевым направлением эволюции является "способность" горизонтального, или, как его принято называть, латерального переноса генов между организмами. Горизонтальный перенос генов — один из главных механизмов

видообразования в мире прокариот. На сегодняшний день уже доказано, что не менее 80% генов в каждом прокариотическом геноме участвовали в процессе горизонтального переноса на том или ином этапе эволюции, а множественные данные геномики подтверждают факт переноса массивных генов между организмами не только внутри различных царств, но также и между ними. Кроме того, доказан тот факт, что у прокариот возможен обмен целыми геномами, что ведет к мгновенному превращению одного вида бактерий в другой. О "чужеродном" происхождении гена говорит высокая степень его сходства с гомологичным геном из отдаленного таксона при отсутствии подобного гена у близких "родственников" [9].

В нашем случае "вверх" означает что более "древними" являются бактерии отдела Tenericutes (микоплазмы) с наименьшим количеством S1 доменов, а развитие "вниз" подразумевает эволюционное развитие от шестидоменных протеобактерий.

В литературе по данному вопросу развитие класса Mollicutes принято рассматривать с двух точек зрения. Согласно одной из них микоплазмы являются выжившей ветвью примитивных микроорганизмов, из которых впоследствии произошли прокариоты и эукариоты. Они появились как продукт прогрессивной эволюции еще до образования присущей бактериям клеточной стенки. Другая точка зрения состоит в том, что микоплазмы являются регрессивной ветвью эволюции некоторых или грамположительных бактерий, или клостридий (отдел Firmicutes). Для последней гипотезы находится экспериментальное подтверждение. Она рассматривается в двух возможных вариантах: все микоплазмы происходят либо от предка, общего с грамположительными бактериями, либо от разных бактерий. На основании проведенного сравнения последовательностей олигонуклеотидов 16S рРНК нескольких видов микоплазм и грамположительных бактерий из родов Clostridium, Bacillus, Lactobacillus, Streptococcus, было высказано обоснованное предположение об их эволюционном родстве с отделом Firmicutes. Более детальный анализ последовательностей 16S РНК показал, что филогенетически микоплазмы ближе всего к клостридиям. В свою очередь наиболее вероятными предками клостридий считаются грамположительные бактерии с низким содержанием G-C пар в ДНК.

В нашей работе анализ структурных особенностей семейства рибосомных белков S1, принадлежащих разным отделам, также подтверждает второй ("вниз") эволюционный путь развития прокариот. Это подтверждают несколько фактов. Во-первых, микоплазмы являются наиболее простыми самостоятельно воспроизводящимися живыми организмами, выполняющими все необходимые им функции. Во-вторых, биохимические эксперименты по изучению фрагментов шестидоменного белка S1 из Е. coli (обрезание доменов на концах последовательности) показали, что функциональность белка при этом сохраняется, а снижается лишь эффективность выполняемых белком функций [10]. Кроме того, S1 домен "переходит" в другие белки (как прокариотические, так и архейные) чаще всего одной "копией" (фактор инициации, рибонуклеаза).

В составе эукариотических клеток белок S1 не был обнаружен, однако в некоторых эукариотических белках было обнаружено множественное "копирование" S1 домена (от девяти до двенадцати копий). Например, дрожжевой белок Rrp5p, участвующий в процессинге пре-рРНК и созревании 40S и 60S субчастицы, содержит двенадцать тандемно повторяющихся S1 доменов [11]. Такое большое количество S1 доменов может объясняться латеральным переносом в эукариотический химерный геном "чужих", кодирующих белок генов, приобретенных сравнительно недавно и еще не подвергшихся амелиорации в составе генома. При этом партнерами для латерального переноса генов часто являются филогенетически отдаленные организмы. Такие случаи в большей степени свойственны белкам, ответственным за белок-белковые и ДНК-белковые взаимодействия, т.е. участвующие в сборке сложных комплексов или в регуляции действия генов. Напомним, что S1 домен является РНК-связывающим.

Как уже было отмечено ранее, проведенные исследования семейства рибосомных белков S1 эубактерий позволили выявить в нем уникальный консервативный домен, обладающий РНК-связывающими свойствами, который мигрирует по цепи, локализуется в белках с разным количеством доменов с определенной закономерностью. Суммируя все вышесказанное можно утверждать, что именно этот домен и являлся конечным продуктом действия эволюции: при минимальном размере белка — выполнение им всех необходимых функций.

В главе 5 подводятся основные итоги проведенного исследования.

Факторы элонгации были одними из первых белков, используемых для построения филогенетического дерева живых организмов. Исследование этих белков с эволюционной точки зрения продолжается и сейчас. В нашей работе мы обнаружили, что в качестве нового признака и отпечатка молекулярной эволюции для данного семейства белков может выступать количество гибких петель. Как было показано выше, в простейших организмах их число оказалось минимальным, тогда как в высших — максимальным. Это дало основание высказать гипотезу об эволюционном развитии факторов элонгации: "Природа, придерживаясь принципа бережливой изобретательности, оперирует разными универсальными вставками (в данной работе петли), комбинируя их число и положение в факторах таким образом, чтобы белок мог выполнять ряд специализированных функций: одну - в простейших микроорганизмах и несколько - в высших".

Длина белка увеличивается с увеличением сложности организма, что является характерной особенностью прогрессивной эволюции. Однако при этом вторичная структура и доменная организация прокариотических, архейных и эукариотических факторов элонгации ЕР1 и ЕР2 оставалась весьма консервативной. Различие же в длине факторов обусловлено появлением дополнительных гибких участков в трехмерной структуре белка, а также увеличением длины междоменных перетяжек, приводящих к большей подвижности доменов относительно друг друга в пространстве. Кроме того, наличие дополнительных петель со специфической последовательностью в эукариотических факторах элонгации может служить возможным объяснением полифункциональности этих белков. Как мы указывали, в дополнении к основной функции, взаимодействие с тРНК, эукариотические факторы образуют комплексы с различными лигандами, начиная от капьмодулина и заканчивая РНК. Столь разная природа лиганда требует наличия разных функциональных участков, в роли которых могут выступать обнаруженные нами петли.

При исследовании семейства рибосомных белков было обнаружено, что число структурных доменов (повторов) может рассматриваться как

стабильный признак принадлежности организма к тому или иному таксономическому отделу.

Обнаруженные закономерности позволили нам судить о "направлении" эволюции этих белков. Так, для семейства факторов элонгации, без сомнения, это действие прогрессивной эволюции, приведшей к появлению дополнительных петель в эукариотических организмах и, как следствие, их полифункционалыюсти. Для семейства рибосомных белков - это изменение числа структурных доменов, являющееся результатом латерального переноса гена белка в ходе редукционной эволюции между основными отделами Домена эубактерий с сохранением в качестве "конечного" продукта эволюции белка минимального размера. Это позволило паразитическим организмам класса МоШсМея, несмотря на маленькие по отношению к другим бактериям размеры, выполнять все необходимые им функции.

Таким образом, проведенное исследование дало нам основание рассматривать петли и повторы в белках аппарата биосинтеза как уникальные отпечатки молекулярной эволюции.

В приложении 1 приведены аминокислотные последовательности всех рассматриваемых в данной работе факторов элонгации.

В приложении 2 приведены примеры результатов обработки программой Ро1сШп1Ыс1 аминокислотных последовательностей.

Выводы

1. Показано, что программа РоИШРаШ по сравнению с результатами предсказаний других программ (на примере ЯОЫЫ, 01бЕМВЬ, РгеЫпк, 1иРгес1, С1оЬр1о1 2, РоШМех, РОЫОЯ) лучше предсказывает как короткие, так и длинные гибкие участки в белках в-семейства Положение предсказанных участков хорошо согласуется с данными рентгеноструктурного анализа и данными ЯМР.

2. Сформулирован альтернативный признак для классификации Живого мира, основанный на способности аминокислотной последовательности белка образовывать неструктурированные участки, которые проявляются в его трехмерной структуре в виде петель.

3. Установлено, что для рибосомных белков S1, содержащих разное количество Sl-доменов, существует уникальный консервативный домен, который может рассматриваться как функциональный центр всего семейства рибосомных белков S1.

4. Установлено, что число структурных доменов семейства рибосомных белков S1 является стабильным признаком принадлежности микроорганизма к тому или иному таксономическому отделу; изменение числа структурных доменов семейства рибосомных белков S1 является результатом латерального переноса гена белка S1 в ходе редукционной эволюции между основными отделами Домена эубактерий.

Список публикаций по теме диссертации:

[AI] Е.И. Дерюшева. О.М. Селиванова, И.Н.Сердюк "Петли и повторы в белках как отпечатки молекулярной эволюции"// Успехи биологической химии, -т. 52.-стр. 177-202.-2012.

[А2] Е.И. Дерюшева. A.B. Мачулин, О.М. Селиванова и И.Н. Сердюк. "Семейство рибосомных белков S1 содержит уникальный консервативный домен"// Молекулярная биология. - т. 44. - 4. - стр. 728-734. - 2010.

[A3] Дерюшева Е.И.. Левин Д.М., Сердюк И.Н. "Поиск и анализ гибких участков в белках" // Известия ТулГУ. Естественные науки. - вып. 3. - стр. 229. - 2009.

[A4] O.V. Galzitskaya, E.I. Deryusheva. I.N. Serdyuk "Phylogenetic Analyses of the Loops in Elongation Factors EF1A: Stronger Support for the Grouping of Animal and Fungi" // Journal of Computer Science & Systems Biology (JCSB). - v.l. - pp. 7380. - 2008.

[A5] Дерюшева Е.И.. Галзитская O.B., Сердюк И.Н. "Предсказание коротких петель в белках с внутренней неупорядоченностью"// Молекулярная биология, -т. 42.-5.-стр. 1067-1078.-2008.

[А6] A Timchenko, I Serdyuk, В Negrutskii, A Novosylna, Е Prituzhalov, Е Deryusheva, К Kimura, H Kihara "Comparative analysis of solution structure of two

20

isoforms of rabbit elongation factor eEFl-A by SAXS technique" // High Energy Accelerator Research Organization (KEK). Photon Factory Acivity Report 2007. -Part B25. - p.246. - 2008.

[A7] E.I. Deryusheva, O.V. Galzitskaya, I.N. Serdyuk "Novel criteria for protein phylogeny: application to elongation factors"// Ukraine, Kyiv, Conference for young scientists, PhD students and students on Molecular Biology and Genetics, 20-22 September 2007, Book of abstracts, p. 307.

[A8] E.I. Deryusheva. O.V. Galzitskaya, I.N. Serdyuk "G-proteins Family and Three Overkingdom of the Living World"// Russia, Moscow region, Pushchino, Mathematical Biology and Bioinformatics, 7-13September 2008, Book of abstracts, pp. 142-144.

[A9] Е.И. Дерюшева "Предсказание петель в белках с внутренней неупорядоченностью"// Россия, г. Уфа, Четырнадцатая Всероссийская Научная Конференция Студентов Физиков, 27 марта - 3 апреля 2008, Сборник тезисов, стр. 399.

[А 10] Е.И. Дерюшева "Предсказание гибких участков в белках" // Россия, Москва, Международная научная конференция студентов, аспирантов и молодых учёных "Ломоносов-2009", 13-18 апреля 2009, секция Биоинженерия и биоинформатика, Сборник тезисов, стр.15.

[All] A.V. Machulin, E.I. Deryusheva. O.M. Selivanova, I.N. Serdyuk "Family of ribosomal proteins SI contain unique conservative domain"// Russia, Moscow region, Pushchino, Third International Conference on Mathematical Biology and Bioinformatics, 10-15 October 2010, Book of abstracts, pp. 169-170.

Список цитируемой литературы:

1. Tompa P. Intrinsically unstructured proteins!/Trends Biochem.Sci.- 2002.-Vol. 27,-p. 527-533.

2. Dunker A. K., Brown C.J., Lawson J.D. Intrinsic disorder and protein /w7C//W/Biochemistry.- 2002.- Vol.41.- p.6573-6582.

3. Сердюк И.Н. Структурированные белки и белки с внутренней неупорядоченностью!'/Молекулярная биология. -2007.- Том 42 - с. 287-313

4. Галзитская О.В., Гарбузинский С. А., Лобанов М. Ю. Предсказание нативно-развернутых участков белковой гуеим//Молекулярная биология,-2006,- Том 40 - №2 -с. 341-348.

5. Galzitskaya O.V., Garbuzynskiy S.O., Lobanov M.Yu. FoldUnfold: web server for the prediction of disordered regions in protein с/г<яш//В ioin formati c.-2006.- Vol.22.- p.2948-2949.

6. E. Steekman, J. Wright, S. L Baldauf. The protistan origins of animal and fungi //MoI. Biol. Evol.- 2006- Vol.23, -p. 93-106.

7. Bycroft M., Hubbard Т., Proctor M., Freud S., Murzin G. The solution of the SI RNA binding domain: a member of an ancient nucleic acid-binding fold/ICQ11. - 1997- Vol.24. - p. 235-242.

8. W. Martin and R.G. Herrmann. Gene Transfer from Organelles to the Nucleus: How Much, What Happens, and Why?IIY\ant Phisiology.- 1998 - Vol.118, -p. 9-17.

9. T. Dagan, Y. Artzy-Randrup, W. Martin. Modular networks and cumulative of lateral transfer in prokaryote genome evolution II Proc. Natl. Acad. Sci. USA. -2008- Vol.105, -p. 10039-10044.

10. I. Boni, V. Artamonova, M. Dreyfus. The last RNA-binding repeat of the Escherichia coli ribosomal protein SI is specifically involved in autogenous control// Journal of bacteriology. -2000 -Vol. 182,- p. 5872-5879.

11. M. Gribskov. Translational initiation factors IF-1 and eIF-2a share an RNA-binding motif with prokaryotic ribosomal protein SI and polynucleotide phosphorylase //Gene.- 1992-Vol.119.- p.107-111.

Подписано в печать:

30.10.2012

Заказ № 7773 Тираж - 100 экз. Печать трафаретная. Типография «11-й ФОРМАТ» ИНН 7726330900 115230, Москва, Варшавское т., 36 (499) 788-78-56 www.autoreferat.ru

Содержание диссертации, кандидата физико-математических наук, Дерюшева, Евгения Игоревна

Введение.

Глава 2. Обзор литературы.

2.1. Петли и повторы в белках.

2.1.1. Белки с одной функцией.

2.1.2. Белки со многими функциями.

2.1.2.1. Природно-неструктурированные белки.

2.1.2.1.1. Предсказание неструктурированных участков в белках

2.1.2.2. Белки со структурными повторами.

2.1.2.2.1. Базы данных белковых доменов.

2.1.2.2.2. Предсказание границ доменов в белках.

2.2. Структурные и функциональные особенности белков трех семейств как представителей белков с разной степенью внутренней неупорядоченности и числом структурных доменов.

2.2.1. Яаз-белки - однодоменные белки.

2.2.2. Факторы элонгации - многодоменные белки.

2.2.3. Рибосомные белки 81 - белки с разным числом доменов (повторов).

Глава 3. Роль неструктурированных участков в семействе элонгационных факторов.

3.1. Программы РОМЖ, ЯОМК, 018ЕМВЬ, РгеЫпк, ШРгеё С1оЬР1о12, Го1ё1пёех.

3.2. Программа РоИШМё.

3.2.1. Предсказание положения и числа петель и их сравнение с данными рентгеноструктурного анализа.

3.2.2. Сравнение результатов предсказания программы РоЫип£о1с1 с результатами предсказаний других программ.

3.2.3. Гибкость петель в-домена в белках О-семейства; факторы Дебая-Валлера.

3.2.4. Предсказание границ в частично разупорядоченных белках.

3.3. Число и положение петель как признак классификации живых организмов.

3.3.1. Суммарное число петель и сложность организма.

3.3.1.1. Факторы элонгации ЕБ-1.

3.3.1.1.1. Факторы элонгации Надцарства Эубактерий.

3.3.1.1.2. Факторы элонгации Надцарства Эукариот.

3.3.1.1.3. Факторы элонгации Надцарства Архей.

3.3.1.1.4. Петли в факторах трех Надцарств Живого.

3.3.1.1.5. Мотивы петель в факторах трех Надцарств Живого.

3.3.1.1.6. Функции петель.

3.3.1.2. Факторы элонгации ЕР-2.

3.3.2. Новый признак для классификации живого мира.

Глава 4. Роль повторов в семействе рибосомных белков 81.

4.1. Природная неструктурированность белка 81.

4.2. Выделение структурных доменов с помощью анализа вторичной структуры.

4.3. Обнаружение уникального консервативного домена.

4.4. Число структурных доменов как стабильный признак принадлежности микроорганизма к определенному отделу Прокариот.

4.5. Уникальный повтор (домен) как консервативный РНК-связывающий центр семейства.

Глава 5. Новый взгляд на роль петель и повторов в белках.

Введение Диссертация по биологии, на тему "Петли и повторы в белках как отпечатки молекулярной эволюции"

Идея о том, что уникальная третичная структура белка необходима для его функционирования, берет свое начало из экспериментов Э.Фишера, осуществленных более ста лет назад на экстрактах пивных дрожжей. Он высказал гипотезу, согласно которой в основе специфического взаимодействия молекул при химических реакциях лежит их пространственное соответствие типа «ключ-замок» [1]. Позже на основе его экспериментов, а также экспериментов Л. Полинга, К. Анфинсена и Д. Эдсалла [2-4], была сформулирована центральная догма молекулярной биологии, согласно которой один ген, посредством транскрипции и трансляции, кодирует один белок, аминокислотная последовательность которого определяет одну уникальную трехмерную структуру и, как следствие, одну выполняемую им функцию.

Однако последующие исследования ряда белков доказали, что этот принцип не всегда выполняется. Первое сомнение в универсальности гипотезы «ключ-замок» появилось в 1950-е, когда Ф.Каруш обратил внимание на то, что обычный сывороточный альбумин проявляет способность связываться со многими малыми гидрофобными молекулами и высказал предположение о том, что гипотеза Фишера должна быть дополнена представлением о конфигурационной приспособляемости белков [5]. Однако идея Каруша о конфигурационных изменениях в белках в процессе их взаимодействия с лигандами, лежащих в основе множественности функций белка долгое время игнорировалась. Тем не менее, первые сравнения структуры лизоцима в двух функциональных состояниях (с лигандом и без него) показали, что в белках действительно имеют место пространственные смещения отдельных атомов [6]. Эти изменения носили локальный характер и не превышали 1 А. Однако в ряде случаев изменения такого рода могли принимать более масштабный характер, как это было показано для дрожжевой гексокиназы при ее связывании с глюкозой [7], или для эубактериального элонгационного фактора ЕБ-І при замене ГДФ на ГТФ [8].

Намного позже был открыт ряд белков, которые при высокой гомологии последовательностей образовывали разные структуры, а для ряда амилоидогенных белков данные электронной и атомно-силовой микроскопии показывали, что часто один и тот же белок образует в растворе полиморфные структуры [9; 10].

Кроме того, были открыты белки, которые не имеют стабильной третичной структуры и находятся в растворе в состоянии, традиционно считавшимся денатурированным. Они получили название белков с природной или внутренней неупорядоченностью [11]. «Приобретаемая» структура для таких белков часто зависит от вида лиганда, и при этом может сильно изменяться. Разнообразие образуемых структур и своеобразная «структурная гибкость» (пластичность) определяет полифункциональность таких белков [12]. Таким образом, центральная догма молекулярной биологии для этих специфических белков преобразуется в следующую: один ген кодирует один белок, трехмерную структуру которого определяет партнер по взаимодействию или особенности окружающей его среды. Сформированная структура и определяет функцию или функции данного белка. Несмотря на то, что порядка 30% белков частично или полностью неструктурированы, до сих пор не была четко установлена связь между количеством и спецификой подобных участков и функциональной активностью этих белков. Отметим тот факт, что полифункциональность не всегда является следствием наличия в белках дополнительных гибких участков структуры. Для ряда белков характерным является множественное копирование собственной доменной структуры [13; 14]. При этом, в таких белках, каждый домен, несмотря на одну и ту же структуру выполняет различную функцию. Объяснение такого копирования и как следствие полифункциональности белков до сих пор не найдено.

Цель данной работы - выявление взаимосвязи между функциональностью белков и количеством и спецификой гибких участков и структурных повторов в них.

В данной работе предлагается новый взгляд на роль гибких участков (петель) в семействе факторов элонгации, а также на число структурных доменов (повторов) в семействе рибосомных белков Б1, в процессе их эволюционного развития и, как следствие, в их функционировании. Эти семейства являются типичными представителями полифункциональных белков с разным числом неструктурированных участков. Отметим, что рибосомный белок 81 к тому же содержит различное количество структурных повторяющихся доменов в разных организмах. Обнаруженная в этих белках корреляция между числом петель и повторов и сложностью организма позволила нам рассматривать их число как стабильный признак принадлежности организма к определенному таксономическому отделу. Кроме того, выявленные закономерности позволили судить о "направлении" эволюции как этих белков, так и содержащих их организмов, что говорит об уникальности выявленных признаков с точки зрения молекулярной эволюции.

Заключение Диссертация по теме "Биофизика", Дерюшева, Евгения Игоревна

Выводы

1. Показано, что программа РоМЦпАэМ по сравнению с результатами предсказаний других программ (на примере КХЖЫ, В1зЕМВЬ, РгеГлпк, ШРгеё, 01оЬрЫ 2, РоЫ1пс1ех, РОМЖ) лучше предсказывает как короткие, так и длинные гибкие участки в белках О-семейства Положение предсказанных участков хорошо согласуется с данными рентгеноструктурного анализа и данными ЯМР.

2. Сформулирован альтернативный признак для классификации Живого мира, основанный на способности аминокислотной последовательности белка образовывать неструктурированные участки, которые проявляются в его трехмерной структуре в виде петель.

3. Установлено, что для рибосомных белков Б1, содержащих разное количество Б1-доменов, существует уникальный консервативный домен, который может рассматриваться как функциональный центр всего семейства рибосомных белков Б1.

4. Установлено, что число структурных доменов семейства рибосомных белков является стабильным признаком принадлежности микроорганизма к тому или иному таксономическому отделу; изменение числа структурных доменов семейства рибосомных белков 81 является результатом латерального переноса гена белка в ходе редукционной эволюции между основными отделами Домена эубактерий.

Благодарности

Выражаю глубокую признательность и благодарность моим научным руководителям |Сердюку Игорю Николаевичу! и Левину Даниилу Михайловичу за обеспечение возможности выполнения диссертационной работы, а также за внимание и заботу на протяжении всего времени работы. Приношу свою глубокую благодарность сотрудникам группы физики нуклеопротеидов ИБ РАН, а именно Селивановой Ольге Михайловне и Тимченко Александру Александровичу за дружескую атмосферу взаимопомощи, безусловно помогающей выполнению работы.

Особую благодарность выражаю своему научному консультанту Галзитской Оксане Валериановне за доброжелательное отношение на протяжении всего времени работы, а также за ценные практические советы, чуткое соруководство и адекватную критику, которая способствовала прогрессивной работе.

Заключение

В данной работе был проведен комплексный анализ петель в белках G-семейства с помощью специализированной Программы FoldUnfold. Возможность использования разного размера усредняемого окна является отличительной чертой Программы FoldUnfold. Как показало проведенное исследование, выбор ширины окна зависит от длины ожидаемой петли и, следовательно, от задачи, которая ставится исследователем. Так ширина окна в 41 а.о. оптимальна для поиска длинных неструктурированных участков в белках, относящихся к практически полностью неупорядоченным. Ширина окна в 11 а.о. оптимальна для поиска неструктурированных участков в полипептидной цепи длиной в 10—20 а.о. Уменьшение ширины окна до 3 а.о. позволяет выявить все или почти все короткие петли, соединяющие элементы вторичной структуры. Построение зависимости фактора Дебая-Валлера от номера остатка для белка Ras-p21 из Homo sapiens показывает, что предсказанные 10 петель можно отнести к двум типам. К первому относятся петли, характеризующиеся высокой величиной фактора Дебая-Валлера (Х2, А4, Х8, АЛО), которые могут рассматриваться как функциональные. Оставшиеся пять петель имеют более низкие величины факторов Дебая-Валлера (A3, Х5, Х6, А,7 и А,9) и могут рассматриваться как петли, соединяющие элементы вторичной структуры. Такие петли имеют существенно более низкую подвижность и обеспечивают дополнительную жесткость трехмерной структуры.

Сравнение результатов предсказания Программы FoldUnfold с другими программами (PONDR, RONN, DisEMBL, PreLINK, IUPred, GlobPlot 2, Foldlndex) на примере белков G-семейства и убиквитин-подобного домена hPLIC-2 показывает, что Программа FoldUnfold намного лучше предсказывает как совсем короткие, так и относительно длинные неструктурированные участки. Важно подчеркнуть, что эти предсказания хорошо согласуются со структурными данными, полученными РСА и ЯМР высокого разрешения.

Кроме того нами описан альтернативный признак для классификации Живого мира основанный на способности аминокислотной последовательности белка образовывать неструктурированные участки, которые проявляются в его трехмерной структуре в виде петель. Этим он принципиально отличается от признаков РНК-ой и белковой филогении, которые базируются на выравнивании той или иной последовательности из разных организмов. На примере нескольких десятков типичных представителей выявлены характерные признаки факторов элонгации для каждого из трех Надцарств Живого мира, которые сводятся к вариации числа петель и их расположения в доменах фактора. В простейших организмах их число оказалось минимальным, тогда как в высших -максимальным.

Принципиально также и то, что в нашем анализе важен не только факт присутствия той или иной петли, но и специфика содержащейся в ней последовательности аминокислот. Отметим также, что суммарное число аминокислотных остатков в элонгационных факторах отражает разделение Живого мира на три Надцарства. Длины полипептидной цепи элонгационных факторов из Надцарства Эубактерий распологаются в интервале 393- 406 а.о., Надцарство Архей - в интервале 422 - 444 а.о., а Надцарство Эукариот - в интервале 458-464 а.о.

В работе также было проведено исследование центрального РНКсвязывающий домена в семействе рибосомных белков 81. С помощью специализированных пакетов биоинформатических программ было показано, что для рибосомных белков 81, содержащих разное количество

81-доменов существует уникальный консервативный домен, который может рассматриваться как функциональный центр всего семейства рибосомных белков 81. Кроме того, исследование семейства рибосомных белков 81 позволило рассматривать число структурных доменов как

94 стабильный признак принадлежности микроорганизма к тому или иному отделу, а также судить о "направлении" эволюции между ними.

Библиография Диссертация по биологии, кандидата физико-математических наук, Дерюшева, Евгения Игоревна, Тула-Пущино

1. Lemieux R.U., Spohr U. How Emil Fischer was led to the lock and key concept for enzyme specificity // Adv. Carbohydrate Chem. Biochem., 1994, -V. 50 -pp. 1-20.

2. Mirsky A.E., Pauling L. On the structure of native, denatured, and coagulated proteins // Proc. Natl. Acad. Sci. USA, 1936, -V. 22 -pp. 439-447.

3. Edsall J.T. Some comments on proteins and protein structure // Proceedings of the Royal Society of London, 1953, -V. 147 -pp. 97-113.

4. Anfinsen C. Principles that govern the folding of protein chains // Science, 1973,-V. 181 -pp. 223-230.

5. Karush F. Heterogeneity of the Binding Sites of Bovine Serum Albuminl // Journal of the American Chemical Society, 1950, -V. 72 -pp. 2705-2713.

6. Blake C.C.F. et al. Structure of hen egg-white lysozyme, a three dimensional fourier synthesis at 2~Ângstroms resolution // Nature, 1965, -V. 206, -№ 4986 -pp. 757-761.

7. McDonald R.C., Steitz T.A., Engelman D.M. Yeast hexokinase in solution exhibits a large conformational change upon binding glucose or glucose 6-phosphate. // Biochemistry, 1979, -V. 18, -№ 2 -pp. 338-342.

8. Kjeldgaard M. et al. The crystal structure of elongation factor EF-Tu from Thermus aquaticus in the GTP conformation. // Structure, 1993, -V. 1, -№ 1 -pp. 35-50.

9. Dobson C.M. Protein misfolding, evolution and disease // Trends in biochemical sciences, 1999, -V. 24, -№ 9 -pp. 329-332.

10. Pedersen J.S., Andersen C.B., Otzen D.E. Amyloid structure—one but not the same: the many levels of fibrillar polymorphism. // The FEBS journal, 2010, -V. 277, -№22 -pp. 4591-4601.

11. Uversky V.N., Gillespie J.R., Fink A.L. Why are "natively unfolded" proteins unstructured under physiologic conditions? // Proteins, 2000, -V. 41, -№3 -pp. 415-427.

12. Сердюк И.Н. Структурированные белки и белки с внутренней неупорядоченностью //Молекулярная биология, 2007, -Т. 42 -с. 287-313.

13. Murzin A.G. OB(oligonucleotide/oligosaccharide binding)-fold: common structural and functional solution for non-homologous sequences. // The European Molecular Biology Organization Journal, 1993, -V. 12, -№ 3 -pp. 861-867.

14. Mosavi L.K. et al. The ankyrin repeat as molecular architecture for protein recognition. // Protein Science, 2004, -V. 13, -№ 6 -pp. 1435-1448.

15. Betz S.F. Disulfide bonds and the stability of globular proteins. // Protein Science, 1993, -V. 2, -№ 10 -pp. 1551-1558.

16. Fraser R.D., MacRae T.P., Suzuki E. Chain conformation in the collagen molecule. // Journal of Molecular Biology, 1979, -V. 129, -№ 3 -pp. 463-481.

17. Daley D.O. The assembly of membrane proteins into complexes. // Current Opinion in Structural Biology, 2008, -V. 18, -№ 4 -pp. 420^24.

18. Timasheff S.N., Gorbunoff M.J. Conformation of proteins // Annual Review of Biochemistry, 1967, -V. 36 -pp. 13-54.

19. Tanford C., Kawahara K., Lapanje S. Proteins as Random Coils. I. Intrinsic Viscosities and Sedimentation Coefficients in Concentrated Guanidine Hydrochloride // Journal of the American Chemical Society, 1967, -V. 89, -№ 4 -pp. 729-736.

20. Dunker A.K. et al. Intrinsically disordered proteins // Journal of Molecular Graphics and Modelling, 2001, -V. 19, -№ 1 -pp. 26-59.

21. Hinck A.P. et al. The RNA binding domain of ribosomal protein LI 1: three-dimensional structure of the RNA-bound form of the protein and its interaction with 23 S rRNA. // Journal of Molecular Biology, 1997, -V. 274, -№ 1 -pp. 101113.

22. Kissinger C.R. et al. Crystal structures of human calcineurin and the human FKBP12-FK506-calcineurin complex. // Nature, 1995, -V. 378, -№ 6557 -pp. 641-644.

23. Jeffery C. Moonlighting proteins // Trends in Biochemical Sciences , 2010, -V. 11, -№ Suppl 1 -pp. P21.

24. Fink A.L. Natively unfolded proteins. // Current Opinion in Structural Biology, 2005, -V. 15, -№ 1 -pp. 35-41.

25. Dyson H.J., Wright P.E. Intrinsically unstructured proteins and their functions. // Nature Reviews Molecular Cell Biology, 2005, -V. 6, -№ 3 -pp. 197-208.

26. Dunker A.K., Brown C.J., Lawson J.D. Intrinsic disorder and protein function //Biochemistry, 2002, -V. 41, -№ 21 -pp. 6573-6582.

27. Wright P.E., Dyson H.J. Intrinsically unstructured proteins: re-assessing the protein structure-function paradigm. // Journal of Molecular Biology, 1999, -V. 293,-№ 2-pp. 321-331.

28. Ptitsyn O. Molten globule and protein folding // Advances in protein chemistry, 1995, -V. 47 -pp. 83-229.

29. Receveur-Brechot V. et al. Assessing protein disorder and induced folding. // Proteins, 2006, -V. 62, -№ 1 -pp. 24-45.

30. Frankel A.D., Kim P.S. Modular structure of transcription factors: implications for gene regulation. // Cell, 1991, -V. 65, -№ 5 -pp. 717-719.

31. Negrutskii B.S., Deutscher M.P. Channeling of aminoacyl-tRNA for protein synthesis in vivo. // Proceedings of the National Academy of Sciences of the United States of America, 1991, -V. 88, -№ 11 -pp. 4991-4995.

32. Iakoucheva L.M. et al. Intrinsic disorder in cell-signaling and cancer-associated proteins. // Journal of Molecular Biology, 2002, -V. 323, -№ 3 -pp. 573-584.

33. Rechsteiner M., Rogers S.W. PEST sequences and regulation by proteolysis. // Trends in Biochemical Sciences , 1996, -V. 21, -№ 7 -pp. 267-271.

34. Schuster S.C., Khan S. The bacterial flagellar motor. // Annual review of biophysics and biomolecular structure, 1994, -V. 23 -pp. 509-539.

35. Daughdrill G.W. et al. The C-terminal half of the anti-sigma factor, FlgM, becomes structured when bound to its target, sigma 28. // Nature Structural Biology, 1997, -V. 4, -№ 4 -pp. 285-291.

36. Kostyukova A.S. et al. Flagellin parts acquiring a regular structure during polymerization are disposed on the molecule ends. // FEBS Letters, 1988, -V. 241, -№ 1-2 -pp. 141-144.

37. Plaxco K.W., Gross M. The importance of being unfolded. // Nature, 1997, -V. 386, -№ 6626 -pp. 657-659.

38. Shoemaker B.A., Portman J.J., Wolynes P.G. Speeding molecular recognition by using the folding funnel: The fly-casting mechanism // Proceedings of the National Academy of Sciences of the United States of America, 2000, -V. 97, -№ 16 -pp. 8868-8873.

39. Shulz G.E. Nucleotide binding proteins // Molecular Mechanism of Biological Recognition / ed. N. Balaban. New York: Elsevier/North Holland Biomedical Press, 1979. C. 74-94.

40. Gunasekaran K. et al. Extended disordered proteins: targeting function with less scaffold // Trends in Biochemical Sciences , 2003, -V. 28, -№ 2 -pp. 81-85.

41. Subramanian A.R. Structure and functions of ribosomal protein SI. // Progress in nucleic acid research and molecular biology, 1983, -V. 28 -pp. 101— 142.

42. Tompa P. Intrinsically unstructured proteins // Trends in biochemical sciences, 2002.

43. Prilusky J. et al. Foldlndex: a simple tool to predict whether a given protein sequence is intrinsically unfolded. // Bioinformatics, 2005, -V. 21, -№ 16 -pp. 3435-3438.

44. Linding R. et al. GlobPlot: exploring protein sequences for globularity and disorder //Nucleic Acids Research, 2003, -V. 31, -№ 13 -pp. 3701-3708.

45. Garbuzynskiy S.O., Lobanov M.Y., Galzitskaya O.V. To be folded or to be unfolded? // Protein Science, 2004, -V. 13, -№ 11 -pp. 2871-2877.

46. Dosztanyi Z. et al. The pairwise energy content estimated from amino acid composition discriminates between folded and intrinsically unstructured proteins. // Journal of Molecular Biology, 2005, -V. 347, -№ 4 -pp. 827-839.

47. Dyson H.J., Wright P.E. Coupling of folding and binding for unstructured proteins. // Current Opinion in Structural Biology, 2002, -V. 12, -№ 1 -pp. 5460.

48. Sugase K., Dyson H.J., Wright P.E. Mechanism of coupled folding and binding of an intrinsically disordered protein. // Nature, 2007, -V. 447, -№ 7147 -pp. 1021-1025.

49. Fuxreiter M., Tompa P., Simon I. Local structural disorder imparts plasticity on linear motifs. // Bioinformatics, 2007, -V. 23, -№ 8 -pp. 950-956.

50. Neduva V., Russell R.B. Peptides mediating interaction networks: new leads at last. // Current Opinion in Biotechnology, 2006, -V. 17, -№ 5 -pp. 465-471.

51. Linding R. et al. Protein Disorder Prediction-Implications for Structural Proteomics // Structure, 2003, -V. 11 -pp. 1453-1459.

52. Jones D.T., Ward J.J. Prediction of disordered regions in proteins from position specific score matrices // Proteins, 2003, -V. 53 -pp. 573-578.

53. Cheng J., Sweredoski M.J., Baldi P. Accurate Prediction of Protein Disordered Regions by Mining Protein Structure Data // Data Mining and Knowledge Discovery, 2005, -V. 11, -№ 3 -pp. 213-222.

54. Ward J.J. et al. Prediction and functional analysis of native disorder in proteins from the three kingdoms of life. // Journal of Molecular Biology, 2004, -V. 337, -№ 3 -pp. 635-645.

55. Melamud E., Moult J. Evaluation of disorder predictions in CASP5. // Proteins, 2003, -V. 53 -pp. 561-565.

56. Chen K., Kurgan L.A., Ruan J. Prediction of flexible/rigid regions from protein sequences using k-spaced amino acid pairs // BMC Structural Biology, 2007, -V. 7, -№ 1 -pp. 25.

57. Gu J., Gribskov M., Bourne P.E. Wiggle—Predicting Functionally Flexible Regions from Primary Sequence // PLoS Computational Biology, 2006, -V. 2, -№7-pp. 17.

58. Liu J., Rost B. NORSp: Predictions of long regions without regular secondary structure. //Nucleic Acids Research, 2003, -V. 31, -№ 13 -pp. 38333835.

59. Oldfield C.J. et al. Comparing and combining predictors of mostly disordered proteins. // Biochemistry, 2005, -V. 44, -№ 6 -pp. 1989-2000.

60. Peng K. et al. Length-dependent prediction of protein intrinsic disorder // BMC Bioinformatics, 2006, -V. 7, -№ 1 -pp. 208.

61. Romero P. et al. Sequence complexity of disordered protein. // Proteins, 2001,-V. 42, -№ 1 -pp. 38-48.

62. Yang Z.R. et al. RONN: the bio-basis function neural network technique applied to the detection of natively disordered regions in proteins. //-a

63. Bioinformatics, 2005, -V. 21, -№ 16 -pp. 3369-3376.

64. Coeytaux K., Poupon A. Prediction of unfolded segments in a protein sequence based on amino acid composition. // Bioinformatics, 2005, -V. 21, -№ 9-pp. 1891-1900.

65. Dosztanyi Z. et al. IUPred: web server for the prediction of intrinsically unstructured regions of proteins based on estimated energy content. // Bioinformatics, 2005, -V. 21, -№ 16 -pp. 3433-3434.

66. Ferron F. et al. A practical overview of protein disorder prediction methods // Proteins Structure Function And Bioinformatics, 2006, -V. 65, -№ 1 -pp. 114.

67. Schultz J. et al. SMART, a simple modular architecture research tool:identification of signaling domains. // Proceedings of the National Academy of

68. Sciences of the United States of America, 1998, -V. 95, -№ 11 -pp. 5857-5864.103

69. Sonnhammer E.L. et al. Pfam: multiple sequence alignments and HMM-profiles of protein domains. // Nucleic Acids Research, 1998, -V. 26, -№ 1 -pp. 320-322.

70. Hulo N. et al. The 20 years of PROSITE // Nucleic Acids Research, 2008, -V. 36 -pp. D245-D249.

71. Kim D.E. et al. Automated prediction of domain boundaries in CASP6 targets using Ginzu and RosettaDOM. // Proteins, 2005, -V. 61 -pp. 193-200.

72. Tress M. et al. Assessment of predictions submitted for the CASP7 domain prediction category. // Proteins, 2007, -V. 69 -pp. 137-151.

73. Marchler-Bauer A. et al. CDD: a conserved domain database for interactive domain family analysis // Nucleic Acids Research, 2007, -V. 35, -№ Database issue -pp. D237-D240.

74. Cheng J., Sweredoski M.J., Baldi P. DOMpro: protein domain prediction using profiles, secondary structure, relative solvent accessibility, and recursive neural networks // Data Mining and Knowledge Discovery, 2006, -V. 13 -pp. 110.

75. Marsden R.L., McGuffin L.J., Jones D.T. Rapid protein domain assignment from amino acid sequence using predicted secondary structure // Protein Science, 2002, -V. 11, -№ 12 -pp. 2814-2824.

76. Ye L. et al. Sequence-based protein domain boundary prediction using BP neural network with various property profiles. // Proteins, 2008, -V. 71, -№ 1 -pp. 300-307.

77. Yoo P.D. et al. Improved general regression network for protein domain boundary prediction // BMC Bioinformatics, 2008, -V. 9, -№ Suppl 1 -pp. SI2.

78. Gewehr J.E., Zimmer R. SSEP-Domain: protein domain prediction by alignment of secondary structure elements and profiles. // Bioinformatics, 2006, -V. 22, -№ 2 -pp. 181-187.

79. Orengo C.A. et al. CATH~a hierarchic classification of protein domain structures. // Structure London England 1993, 1997, -V. 5, -№ 8 -pp. 10931108.

80. Enright A.J., Ouzounis C.A. GeneRAGE: a robust algorithm for sequence clustering and domain detection. // Bioinformatics, 2000, -V. 16, -№ 5 -pp. 451— 457.

81. George R.A., Heringa J. An analysis of protein domain linkers: their classification and role in protein folding. // Protein Engineering, 2002, -V. 15, -№ 11 -pp. 871-879.

82. Chen L. et al. KemaDom: a web server for domain prediction using kernel machine with local context // Nucleic Acids Research, 2006, -V. 34, -№ Web Server issue -pp. W158-W163.

83. Nagarajan N., Yona G. Automatic prediction of protein domains from sequence information using a hybrid learning system. // Bioinformatics, 2004, -V. 20, -№ 9 -pp. 1335-1360.

84. Sim J., Kim S.-Y., Lee J. PPRODO: prediction of protein domain boundaries using neural networks. // Proteins, 2005, -V. 59, -№ 3 -pp. 627-632.

85. George R.A., Heringa J. SnapDRAGON: a method to delineate protein structural domains from sequence data. // Journal of Molecular Biology, 2002, -V. 316, -№ 3 -pp. 839-851.

86. Altschul S.F. et al. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. // Nucleic Acids Research, 1997, -V. 25, -№ 17-pp. 3389-3402.

87. Copley R.R. et al. Protein domain analysis in the era of complete genomes. // FEBS Letters, 2002, -V. 513, -№ 1 -pp. 129-134.

88. Galzitskaya O.V., Melnik B.S. Prediction of protein domain boundaries from sequence alone // Protein Science, 2003, -V. 12, -№ 4 -pp. 696-701.

89. Sikder A.R., Zomaya A.Y. Improving the performance of DomainDiscovery of protein domain boundary assignment using inter-domain linker index // BMC Bioinformatics, 2006, -V. 7, -№ Suppl 5 -pp. S6.

90. Wu Y. et al. OPUS-Dom: applying the folding-based method VECFOLD to determine protein domain boundaries. // Journal of Molecular Biology, 2009, -V. 385, -№4-pp. 1314-1329.

91. Cheng J. DOMAC: an accurate, hybrid protein domain prediction server // Nucleic Acids Research, 2007, -V. 35, -№ Web Server issue -pp. W354-W356.

92. Liu J., Rost B. Sequence-based prediction of protein domains // Nucleic Acids Research, 2004, -V. 32, -№ 12 -pp. 3522-3530.

93. Wheelan S.J., Marchler-Bauer A., Bryant S.H. Domain size distributions can predict domain boundaries. // Bioinformatics, 2000, -V. 16, -№ 7 -pp. 613-618.

94. Gouzy J., Corpet F., Kahn D. Whole genome protein domain analysis using a new method for domain clustering. // Computers chemistry, 1999, -V. 23, -№ 3-4 -pp. 333-340.

95. George R.A., Heringa J. Protein domain identification and improved sequence similarity searching using PSI-BLAST. // Proteins, 2002, -V. 48, -№ 4 -pp. 672-681.

96. Sonnhammer E.L., Durbin R. A workbench for large-scale sequence homology analysis. // Computer applications in the biosciences CABIOS, 1994, -V. 10, -№ 3 -pp. 301-307.

97. Kuroda Y. et al. Automated search of natively folded protein fragments for high-throughput structure determination in structural genomics. // Protein Science, 2000, -V. 9, -№ 12 -pp. 2313-2321.

98. Adams R.M., Das S., Smith T.F. Multiple domain protein diagnostic patterns. // Protein Science, 1996, -V. 5, -№ 7 -pp. 1240-1249.

99. Gokhale R.S., Khosla C. Role of linkers in communication between protein modules. // Current Opinion in Chemical Biology, 2000, -V. 4, -№ 1 -pp. 22-27.

100. Tanaka T., Yokoyama S., Kuroda Y. Improvement of domain linker prediction by incorporating loop-length-dependent characteristics. // Biopolymers, 2006, -V. 84, -№ 2 -pp. 161-168.

101. Murzin A.G., Brenner S.E. SCOP: a structural classification of proteins database for the investigation of sequences and structures // J. Mol. Biol., 1995, -V. 247 -pp. 536-540.

102. Holm L., Sander C. Dictionary of recurrent domains in protein structures. //

103. Proteins, 1998, -V. 33, -№ 1 -pp. 88-96.106

104. Budkevich T.V. et al. Extended conformation of mammalian translation elongation factor 1A in solution. // Biochemistry, 2002, -V. 41, -№ 2 -pp. 486495.

105. Kjeldgaard M., Nyborg J., Clark B.F. The GTP binding motif: variations on a theme. // The FASEB journal official publication of the Federation of American Societies for Experimental Biology, 1996, -V. 10, -№ 12 -pp. 1347— 1368.

106. Sprang S.R. G protein mechanisms: insights from structural analysis. // Annual Review of Biochemistry, 1997, -V. 66, -№ 1 -pp. 639-78.

107. AEvarsson A. et al. Three-dimensional structure of the ribosomal translocase: elongation factor G from Thermus thermophilus. // the The European Molecular Biology Organization Journal, 1994, -V. 13, -№ 16 -pp. 3669-3677.

108. Wower I.K. et al. Binding and cross-linking of tmRNA to ribosomal protein SI, on and off the Escherichia coli ribosome // the The European Molecular Biology Organization Journal, 2000, -V. 19, -№ 23 -pp. 6612-6621.

109. Berestowskaya N.H. et al. Electron microscopy study of Q beta replicase. // FEBS Letters, 1988, -V. 228, -№ 2 -pp. 263-267.

110. Suryanarayana T., Subramanian A.R. Function of the repeating homologous sequences in nucleic acid binding domain of ribosomal protein S1. //Biochemistry, 1984, -V. 23, -№ 6 -pp. 1047-1051.

111. Gribskov M. Translational initiation factors IF-1 and eIF-2 alpha share an RNA-binding motif with prokaryotic ribosomal protein SI and polynucleotide Phosphorylase. // Gene, 1992, -V. 119, -№ 1 -pp. 107-111.

112. Bycroft M. et al. The solution structure of the SI RNA binding domain: a member of an ancient nucleic acid-binding fold. // Cell, 1997, -V. 88, -№ 2 -pp. 235-242.

113. Boer P. De et al. Rrp5p, a trans-acting factor in yeast ribosome biogenesis,is an RNA-binding protein with a pronounced preference for U-rich sequences //

114. Rna New York Ny, 2006, -V. 12, -№ 2 -pp. 263-271.107

115. Kimura M. et al. Primary structure of Escherichia coli ribosomal protein S1 and features of its functional domains. // The Federation of European Biochemical Societies Journal, 1982, -V. 123, -№ 1 -pp. 37-53.

116. Boni I.V., Artamonova V.S., Dreyfus M. The last RNA-binding repeat of the Escherichia coli ribosomal protein S1 is specifically involved in autogenous control // Journal Of Bacteriology, 2000, -V. 182, -№ 20 -pp. 5872-5879.

117. Zeev-Ben-Mordehai T. et al. The intracellular domain of the Drosophila cholinesterase-like neural adhesion protein, gliotactin, is natively unfolded. // Proteins, 2003, -V. 53, -№ 3 -pp. 758-767.

118. Galzitskaya O.V., Garbuzynskiy S.O., Lobanov M.Y. Prediction of Amyloidogenic and Disordered Regions in Protein Chains // PLoS Computational Biology, 2006, -V. 2, -№ 12 -pp. 10.

119. Galzitskaya O.V., Garbuzynskiy S.O., Lobanov M.Y. FoldUnfold: web server for the prediction of disordered regions in protein chain. // Bioinformatics, 2006, -V. 22, -№ 23 -pp. 2948-2949.

120. Галзитская O.B., Гарбузинский С.А., Лобанов М.Ю. Предсказание нативно-развернутых участков белковой цепи // Молекулярная биология, 2006, -Т. 40, -№ 2 -с. 341-348.

121. Kabsch W., Sander С. Dictionary of protein secondary structure: pattern recognition of hydrogen-bonded and geometrical features. // Biopolymers, 1983, -V. 22, -№ 12 -pp. 2577-2637.

122. Serdyuk I.N., Zaccai N., Zaccai J. Methods in Molecular Biophysics. Cambridge: Cambridge University Press, 2007.

123. Kaye F.J. et al. A family of ubiquitin-like proteins binds the ATPase domain of Hsp70-like Steh. // FEBS Letters, 2000, -V. 467, -№ 2-3 -pp. 348-55.

124. Walters K.J. et al. Structural studies of the interaction between ubiquitin family proteins and proteasome subunit S5a. // Biochemistry, 2002, -V. 41, -№ 6 -pp. 1767-1777.

125. Woese C.R., Fox G.E. Phylogenetic structure of the prokaryotic domain: the primary kingdoms. // Proceedings of the National Academy of Sciences of the United States of America, 1977, -V. 74, -№ 11 -pp. 5088-5090.

126. Gupta R.S. Protein Phylogenies and Signature Sequences: A Reappraisal of Evolutionary Relationships among Archaebacteria, Eubacteria, and Eukaryotes // Microbiology and Molecular Biology Reviews, 1998, -V. 62, -№ 4 -pp. 14351491.

127. Brown J.R., Doolittle W.F. Archaea and the prokaryote-to-eukaryote transition. // Microbiology and Molecular Biology Reviews, 1997, -V. 61, -№ 4 -pp. 456-502.

128. Baldauf S.L., Palmer J.D. Animals and fungi are each other's closest relatives: congruent evidence from multiple proteins. // Proceedings of the National Academy of Sciences of the United States of America, 1993, -V. 90, -№24 -pp. 11558-11562.

129. Abel K., Jurnak F. A complex profile of protein elongation: translating chemical energy into molecular movement. // Structure London England 1993, 1996, -V. 4, -№ 3 -pp. 229-238.

130. Kjeldgaard M., Nyborg J. Refined structure of elongation factor EF-Tu from Escherichia coli. // Journal of Molecular Biology, 1992, -V. 223, -№ 3 -pp. 721-742.

131. Andersen G.R. et al. Structural basis for nucleotide exchange and competition with tRNA in the yeast elongation factor complex eEFIA: eEFIB alpha. //Molecular Cell, 2000, -V. 6, -№ 5 -pp. 1261-1266.

132. Gouy M., Li W.H. Molecular phylogeny of the kingdoms Animalia, Plantae, and Fungi. // Molecular Biology and Evolution, 1989, -V. 6, -№ 2 -pp. 109-122.

133. Steenkamp E.T., Wright J., Baldauf S.L. The protistan origins of animals and fungi // Molecular Biology and Evolution, 2006, -V. 23, -№ 1 -pp. 93-106.

134. Wang W., Poovaiah B.W. Interaction of plant chimeric calcium/calmodulin-dependent protein kinase with a homolog of eukaryotic elongation factor-1 alpha. // The Journal of Biological Chemistry, 1999, -V. 274, -№ 17-pp. 12001-12008.

135. Kim D.E., Chivian D., Baker D. Protein structure prediction and analysis using the Roberta server. // Nucleic Acids Research, 2004, -V. 32, -№ Web Server issue -pp. W526-W531.

136. Bairoch A., Apweiler R. The SWISS-PROT protein sequence database and its supplement TrEMBL in 2000 // Nucleic Acids Research, 2000, -V. 28, -№ 1 -pp. 45-48.

137. McGuffm L.J., Bryson K., Jones D.T. The PSIPRED protein structure prediction server. // Bioinformatics, 2000, -V. 16, -№ 4 -pp. 404-405.

138. Higgins D.G., Thompson J.D., Gibson T.J. Using CLUSTAL for multiple sequence alignments. // Methods in Enzymology, 1996, -V. 266, -№ 1988 -pp. 383-402.

139. Chenna R. et al. Multiple sequence alignment with the Clustal series of programs //Nucleic Acids Research, 2003, -V. 31, -№ 13 -pp. 3497-3500.

140. Doolittle W.F. Phylogenetic Classification and the Universal Tree // Science, 1999, -V. 284, -№ 5423 -pp. 2124-2128.

141. Lartigue C. et al. Genome transplantation in bacteria: changing one species to another. // Science, 2007, -V. 317, -№ 5838 -pp. 632-638.

142. Dagan T., Artzy-Randrup Y., Martin W. Modular networks and cumulative impact of lateral transfer in prokaryote genome evolution. // Proceedings of the National Academy of Sciences of the United States of America, 2008, -V. 105, -№29 -pp. 10039-10044.

143. Bhugra B., Dybvig K. High-frequency rearrangements in the chromosome of Mycoplasma pulmonis correlate with phenotypic switching. // Molecular Microbiology, 1992, -V. 6, -№ 9 -pp. 1149-1154.

144. Neimark H.C. Phylogenetic relationships between mycoplasmas and otherprokaryotes. In The Mycoplasmas. New York: Academic Press, 1979. №. 1.1.l

145. Борхсениус С.Н. и др. Микоплазмы: молекулярная и клеточная биология, взаимодействие с иммунной системой млекопитающих, патогенность, диагностика. Москва: Наука, 2002.

146. Blanchard A. Ureaplasma urealyticum urease genes; use of a UGA tryptophan codon. // Molecular Microbiology, 1990, -V. 4, -№ 4 -pp. 669-676.

147. Amblar M. et al. The role of the SI domain in exoribonucleolytic activity: Substrate specificity and multimerization // RnaNew YorkNy, 2007, -V. 13, -№ 3 -pp. 317-327.