Бесплатный автореферат и диссертация по биологии на тему
Построение и анализ новых структурных деревьев глобулярных белков
ВАК РФ 03.01.03, Молекулярная биология

Автореферат диссертации по теме "Построение и анализ новых структурных деревьев глобулярных белков"

00460У67У

На правах рукописи

ГОРДЕЕВ АЛЕКСЕЙ БОРИСОВИЧ

ПОСТРОЕНИЕ И АНАЛИЗ НОВЫХ СТРУКТУРНЫХ ДЕРЕВЬЕВ ГЛОБУЛЯРНЫХ БЕЛКОВ

03.01.03 - Молекулярная биология 03.01.09 - Математическая биология, биоинформатика

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата биологических наук

3 О СЕН 2010

Москва - 2010

004609679

Работа выполнена в Институте белка РАН

Научный руководитель:

доктор химических наук

Ефимов Александр Васильевич

Официальные оппоненты:

доктор биологических наук, профессор

Морозов Сергей Юрьевич

доктор физико-математических наук, профессор

Ефремов Роман Гербертович

Ведущая организация:

Институт биофизики клетки РАН

Защита состоится « л » (Ж4У1щ1Я 2010 года в часов на заседании совета Д 501.001.76. по защите докторских и кандидатских диссертаций при Московском государственном университете имени М.В. Ломоносова по адресу: 119992, Москва, ГСП-2, Ленинские горы, МГУ, НИИ физико-химической биологии имени А.Н. Белозерского, ауд.536.

С диссертацией можно ознакомиться в библиотеке Биологического факультета МГУ имени М.В. Ломоносова

Автореферат разослан « 2010 г.

Ученый секретарь диссертационного совета,

кандидат биологических наук И. А. Крашенинников

'•О

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность проблемы. Пространственная структура белков определяет их биологическую функцию, а также высокую эффективность и строгую избирательность большинства биологических процессов, в которых они участвуют. В связи с этим решение многих биохимических задач самым тесным образом связано с изучением пространственной структуры белковых молекул. Несмотря на значительный прогресс, достигнутый в этой области в последние десятилетия, определить пространственные структуры многих белков пока не удаётся. Таким образом, установление взаимосвязи между аминокислотной последовательностью белка и его трёхмерной структурой и разработка методов предсказания третичной структуры белка на этой основе являются важнейшими фундаментальными проблемами биохимии и молекулярной биологии.

В настоящее время более или менее надёжное предсказание третичной структуры белка возможно только методом моделирования на основе гомологии, то есть только в том случае, когда известна пространственная структура какого-либо гомологичного белка. Таким образом, несмотря на отдельные успехи, в целом проблема взаимосвязи между первичной и третичной структурами остаётся пока нерешённой. Одним из возможных подходов к решению этой проблемы является моделирование структуры белков и путей их сворачивания с помощью построения и анализа структурных деревьев.

Структурное древо белков - это совокупность всех разрешённых пространственных структур, которые могут быть получены из одной стартовой структуры путём последовательного пристраивания к ней других элементов вторичной структуры в соответствии с набором правил. В качестве стартовой структуры древа берётся соответствующий структурный мотив, а возможные пути роста структур показываются линиями, которые в итоге объединяют все структуры в одно древо. Количество расшифрованных пространственных

структур белков с каждым годом растёт, что предопределяет необходимость построения обновлённых структурных деревьев для уже описанных структурных групп белков, а также поиска новых структурных мотивов и построения новых структурных деревьев на их основе. С другой стороны, открывается возможность разработать иерархическую классификацию белков, основанную на построенных структурных деревьях. Такая классификация является уникальной, так как основана на сходстве и различиях смоделированных путей сворачивания белков. Таким образом, построение подобной системы структурной классификации белков актуально и имеет большое практическое значение. Кроме того, помимо задач, связанных с классификацией белков, новые структурные деревья можно использовать в качестве удобного инструмента для решения ряда научных задач в области молекулярной биологии, как фундаментальных, так и прикладных.

Цели и задачи исследования. Целью данной работы было выполнить построение и провести анализ четырёх новых структурных деревьев белков, разработать новую структурную классификацию для данных структурных групп белков, представив её в качестве общедоступного Интернет-ресурса, а также провести поиск новых корневых мотивов, пригодных для построения структурных деревьев, и, в случае успеха, построить новые деревья на их основе.

Исходя из нашей цели, был поставлен ряд задач, которые можно разбить на три группы:

1. Создание баз данных р-белков с аЬс<1-единицами, (а+р)-белков с аЬС<1-единицами, а/р-белков с пяти- и семисегментными а/р-мотивами, построение и анализ компьютерных версий новых структурных деревьев для данных структурных групп белков.

2. Разработка иерархической структурной классификации четырёх перечисленных выше групп белков, основанной на построенных и обработанных структурных деревьях, создание \\^ЕВ-сайта, разработка удобного интерфейса взаимодействия с пользователем и размещение на

сайте классификации белков, компьютерных версий построенных структурных деревьев и справочной информации, облегчающей работу с ресурсом.

3. Поиск новых корневых мотивов в белках, пригодных для построения деревьев, и, в случае успеха, построение новых структурных деревьев на их основе.

Научная новизна и практическая значимость работы. В рамках данной работы построен ряд структурных деревьев и проведён их анализ. Некоторые деревья являются обновлёнными версиями структурных деревьев для уже описанных структурных групп белков, другие деревья построены впервые на основе обнаруженных новых структурных мотивов. На базе построенных структурных деревьев разработана новая иерархическая классификация белков РСВОБТ, основанная на моделировании пошаговой укладки пространственных структур белков в виде структурных деревьев. Такая классификация уникальна, так как в настоящее время представляет собой единственный пример классификации белков, основанной на теоретическом моделировании путей их сворачивания. Разработанная классификация может быть полезной для решения ряда научных задач, таких как изучение структурного сходства белковых молекул, исследование механизмов сворачивания белков, поиск наиболее выгодных пространственных структур и исследование роли структурного контекста в сворачивании белков.

Апробация работы. Материалы работы были представлены на 11-й, 12-й и 14-й Пущинских конференциях молодых учёных (Пущино, Московская область, 2007, 2008, 2010), IV Российском симпозиуме «Белки и пептиды» (Казань, 2009), XXII Зимней молодежной научной школе "Перспективные направления физико-химической биологии и биотехнологии" (Москва, 2010), электронных конференциях «Информационно-вычислительные технологии в решении фундаментальных проблем и прикладных научных задач» (Москва, 2008, 2009), а также на ежегодных научных конференциях Института белка РАН (Пущино, Московская область, 2008,2009).

Публикации. Основные результаты диссертации опубликованы в 10 печатных работах, в том числе 3 статьях.

Структура диссертации. Диссертационная работа состоит из следующих разделов: «Введение», «Обзор литературы», «Методы исследования», «Результаты и обсуждение», «Основные результаты и выводы» и «Список литературы». Диссертационная работа изложена на 126 страницах. Работу иллюстрируют 49 рисунков и 5 таблиц. Количество ссылок, приведенных в разделе «Список литературы» - 119.

РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ

Построение и анализ структурного древа р-белков, содержащих abcd-единицы. На первом этапе в базу данных визуально были отобраны белки с abcd-единицей из системы классификации SCOP. В итоге в базу данных попало 528 белков, из которых 244 - негомологичных (1511 PDB-файлов). Для каждого белка из собранной базы данных был определён тип укладки; белки с одинаковым типом укладки мы объединили в группы, которые, в свою очередь, формировали группы белков с определённым количеством р-тяжей. Далее было построено теоретическое структурное древо р-белков с abcd-единицами, фрагмент которого изображен на рис. 1. На следующем этапе укладки на построенном структурном древе нумеровались, и каждый тип укладки стал иметь свой индивидуальный номер, состоящий из двух цифр, разделённых точкой. Первая цифра содержит информацию о количестве добавочных к корневому мотиву (в данном случае к abcd-единице) элементов вторичной структуры (Р-тяжей). Вторая цифра представляет собой порядковый номер по ходу одного уровня структурного древа слева направо. Добавление любой новой структуры на структурное древо (при условии, что укладка данной структуры не содержит модификаций, включает в себя abed-единицу и один-пять добавочных Р-тяжей) может происходить путём нахождения аналогичной структуры на теоретическом древе и отнесения

Рисунок 1. Фрагмент структурного древа Р-белков, содержащих аЬсё-единицы. Укладки пронумерованы; укладки, найденные в белках, обведены в рамочки.

5

структуры к найденной на древе пронумерованной укладке. То есть пустые, не занятые расшифрованными на настоящее время белками укладки, могут заполняться по мере расшифровки новых белков с течением времени.

Затем был проведён анализ построенного структурного древа. Проведено сравнение распределения найденных в белках укладок по уровням с аналогичным распределением для первого варианта структурного древа и обнаружено, что в обновлённом структурном древе число укладок на всех уровнях выше, чем в первом варианте древа. Таким образом, нами построено более полное структурное древо. В результате анализа распределения негомологичных белков из собранной базы данных по уровням нового структурного древа был сделан вывод о том, что наиболее заселён белками с известными структурами уровень с четырьмя добавочными Р-тяжами, населённость белками других уровней пропорционально снижается. Кроме того, показано, что с помощью первого структурного древа А. В. Ефимова были правильно предсказаны, по крайней мере, 7 неизвестных в то время укладок. В ходе анализа построенного дерева мы обнаружили, что один из запретов не является абсолютным и в ряде случаев (рис. 2а, б) нарушается (в 13 белках, относящихся к 7 различным укладкам). Нами не обнаружены белки, содержащие более трёх Р-тяжей, идущих подряд по ходу полипептидной цепи и расположенные в одном слое (рис. 2в). Мы объясняем это стремлением глобулы принять наиболее компактную форму.

Рисунок 2. Примеры запрещённых правилами укладок полипептидной цепи, а) Стереохимически невыгодная укладка цепи Р-тяж в слое 1 - Р-тяж в слое 2 - р -тяж в слое 1; б) Укладка белка эфрин а5 (РОВ-код: 15Н\У), нарушающего запрет; в) Запрещённая укладка, содержащая более трёх р-тяжей, идущих подряд по ходу полипептидной цепи, расположенных в одном слое.

В)

а)

б)

Построение и анализ структурного древа (а + Р)-белков, содержащих аЬС(1-единицы. Нами также собрана база данных для другой широко распространённой структурной группы белков - (а + (З)-белков, содержащих аЬС(1-единицы, и построено структурное древо белков, входящих в эту группу. Фрагмент древа приведен на рис. 3. В собранную базу данных вошло 926 белков (2636 РОВ-файлов). Затем был проведён анализ построенного структурного древа. Древо включает в себя 286 возможных укладок полипептидной цепи, из которых 77 - обнаружены в белках. На структурном древе, построенном ранее, общее число укладок было только 23. Для обновлённого структурного древа число укладок на всех уровнях выше, чем для первого варианта древа. Всего на древе находится 401 негомологичный белок, наиболее заселён существующими белками уровень с двумя добавочными элементами вторичной структуры, а населённость белками других уровней пропорционально снижается. Для структур белков, принадлежащих к данной группе, характерно наличие р-а-(3-единиц, которые образуют в подавляющем большинстве случаев правые суперспирали. Нами обнаружено 7 негомологичных белков, относящихся к четырём различным укладкам, которые содержат по одной (3-а-р-единице с левыми суперспиралями (рис. 4). При анализе белков, входящих в структурное древо, оказалось, что одни укладки широко представлены в белках, а другие - не встречаются вовсе. Причём, шире представлены в белках укладки, состоящие из аЬС<1-единицы и двух-трёх добавочных элементов вторичной структуры, то есть сравнительно простые укладки.

Рисунок 3. Фрагмент структурного древа (а+Р)-белков, содержащих аЬС<1-единицы. Укладки пронумерованы; укладки, найденные в белках, обведены в рамочки.

а) б)

Рисунок 4. Пример нарушения запрета образования левых р-а-р-единиц. а) Схематическое изображение стереохимически невыгодной левой Р-а-Р-единицы; б) Укладка белка гистидинкиназа СЬеА (РОВ-код: 1158), в котором имеется левая р-а-р-единица.

Построение и анализ структурного древа а/р-белков, содержащих пятисегментные а/р-мотивы. Следующим этапом работы было создание базы данных а/р-белков с пятисегментными а/р-мотивами, построение и анализ компьютерной версии нового структурного древа для данной структурной группы белков. В собранную базу данных вошёл 1301 белок и домен, среди них гомология не обнаружена в 388 белках (3926 РОВ-файлов). Далее мы построили структурное древо, включающее все теоретически возможные варианты роста белковых структур. Все без исключения белки с пятисегментными а/р-мотивами - трёхслойные, поэтому при построении древа мы допускали возможность роста структур в три слоя (а + р + а-слои). Фрагмент построенного структурного древа приведён на рис. 5.

Древо включает в себя 494 возможных укладки полипептидной цепи, из которых 172 - обнаружены в белках. На структурном древе, построенном ранее, число укладок, обнаруженных в белках, было только 39. Для обновлённого структурного древа число укладок на всех уровнях существенно выше, чем для первого варианта дерева. Таким образом, нами построено более полное структурное древо. Всего на древе находится 388 негомологичных белков, наиболее заселены существующими белками уровни с 3-9 добавочными элементами вторичной структуры, а населённость белками других уровней снижается в значительной степени. Для данной группы белков

Рисунок 5. - Фрагмент структурного древа а/р-белков, содержащих пятисегментные а/(5-мотивы. Укладки пронумерованы; укладки, найденные в белках, обведены в рамочки.

также характерно наличие р-а-р-единиц, которые образуют в подавляющем большинстве случаев стереохимически выгодные правые суперспирали. Мы нашли только 11 белков (из 388 негомологичных) с левыми суперспиралями, причём все белки содержали только по одной р-а-р-единице с левой суперспиралыо, остальные же р-а-р-единицы в этих белках образуют правые суперспирали.

Для пятисегментных а/р-мотивов возможен как прямой (рис. 6а), так и обратный (рис. 65) ход цепи. В нашей базе данных из 401 мотива, найденного в 388 негомологичных белках, 78 мотивов имеют обратный ход цепи (19%) и 323 - прямой (81%). Нами сделано предположение о том, что пятисегментные а/р-мотивы в укладках без дополнительных элементов вторичной структуры могут иметь с равной вероятностью как прямой, так и обратный ход полипептидной цепи. По-видимому, в случае обратного хода цепи возникает ограничение на стадии роста структуры при добавлении а-спирали в верхний а-спиральный слой и затем при добавлении р-тяжа в Р-слой (рис. 6в). Рост структуры в белках именно таким способом наиболее популярен, возможно, из-за того, что в результате получаются высококомпактные структуры. Из 214 мотивов с таким ростом 205 пятисегментных мотивов имели прямой ход полипептидной цепи и лишь 9 - обратный (4% от общего количества в группе). Среди белков, структуры которых прошли первый этап такого роста и не прошли второй (т.е. среди белков с а-спиралью в верхнем а-спиральном слое, но без стабилизирующего р-тяжа) из 111 мотивов 80 имеют прямой ход цепи, а 31 - обратный (около 28%). В случаях роста структур другими путями прямой и обратный ход цепи равновероятен: из 76 мотивов прямой ход имеют 38 мотивов, а обратный также -38 (50%).

ЭТАП 2

В)

Рисунок 6. Прямой (а) и обратный (б) ход полипептидной цепи в пятисегментном аф-мотиве. в) Ограничения роста структуры при обратном ходе цепи. Пятисегментные мотивы закрашены. 1. а-спираль, невыгодная при обратном ходе цепи; 2. стабилизирующий р-тяж.

Построение и анализ структурного древа а/р-белков, содержащих семисегментные а/р-мотивы. В собранную базу данных этого класса вошло 870 белков и доменов, среди белков взаимная гомология не обнаружена в 294 белках (2567 РЭВ-файлов). Построено структурное древо, включающее все теоретически возможные варианты роста белковых структур. Фрагмент построенного древа приведен на рис. 7. Древо включает в себя 310 возможных укладок полипептидной цепи, из которых 85 - обнаружены в белках. На структурном древе, построенном ранее, общее число укладок было только 25. Для обновлённого структурного древа число укладок на всех уровнях существенно выше, чем для первого варианта древа. Всего на древе находится 294 негомологичных белка, наиболее заселён существующими белками

уровень с шестью добавочными элементами вторичной структуры, а населённость белками других уровней снижается. Для данной группы белков также характерно наличие Р-а-Р-единиц, которые образуют правые суперспирали. Мы нашли только 14 белков из 294 негомологичных с левыми суперспиралями, причём все белки содержали только по одной р-а-р-единице с левой суперспиралью. Для семисегментных а/р-мотивов, как и для пятисегментных, возможен как прямой, так и обратный ход цепи. Для семисегментных а/р-мотивов обратный ход полипептидной цепи, по-видимому, невыгоден сам по себе. В негомологичных белках из соответствующей группы было обнаружено только 14 мотивов с обратным ходом полипептидной цепи из 294 (примерно 5% от общего количества), что гораздо меньше, чем в случае пятисегментных мотивов (19%). В случае семисегментных мотивов рост структур, имеющих обратный ход цепи, путём добавления а-спирали в верхний а-спиральный слой в белках не встречается. Среди структур с таким ростом все 235 мотивов (100%) имеют прямой ход цепи, в то время как среди структур, растущих другими путями, из 59 мотивов 14 (примерно 23%) имеют обратный ход цепи и 45 - прямой. Таким образом, ход полипептидной цепи в мотиве может вносить ограничения на способ дальнейшего пристраивания к мотиву элементов вторичной структуры и способен производить отбор путей роста.

Рисунок 7. - Фрагмент структурного древа а/р-белков, содержащих семисегментные а/р-мотивы. Укладки пронумерованы; укладки, найденные в белках, обведены в рамочки.

Разработка новой иерархической классификации белков на основе структурных деревьев. На основе структурных деревьев мы разработали новую иерархическую схему классификации белков. Схема включает следующие уровни иерархии: Класс - Структурное древо - Уровень - Укладка - Белковый домен - Вид организма - РОВ-файл. Из этих уровней новыми являются три: Структурное древо, Уровень и Укладка. К одному Структурному древу относятся белки с общим корневым структурным мотивом (например, с аЬСс!-единицей). К одному Уровню относятся белки из одного Структурного древа с равным количеством элементов вторичной структуры, и, наконец, к одной Укладке относятся белки из одного Уровня с одинаковым расположением элементов (рис. 8).

Структурное древо

Бета-белки с abcd-еднвицеб

Обший корневой структурный мотив

Белки с гремя добавочными бета-тяжаын

Укладка 3-2.

Уровень

Одинаковое количество элементов вторичной структуры

Укладка

Одинаковое расположение элементов вторичной структуры

Белковый домен

Рисунок 8. Иерархическая организация классификации белков, основанная на структурных деревьях. Пояснения в тексте.

На основе построенных структурных деревьев, исходя из этой схемы, разработана классификация четырёх структурных групп белков: [3-белков с abcd-единицами, (а+Р)-белков с abCd-единицами, а/р-белков с пяти- и семисегментными а/р-мотивами. Классификация включает в себя 4 Структурных древа, 45 Уровней, 428 Укладок и объединяет 3625 белковых доменов (суммарно - 9985 PDB-файлов). Классификация организована в виде WEB-pecypca PCBOST (Protein classification based on structural trees),

размещена на сервере Института белка РАН и свободно доступна в Интернете по адресу http://strees.protres.ru/.

Новые структурные деревья а/р-белков. Нами проведён поиск новых корневых структур, которые можно использовать для построения новых структурных деревьев. В результате в классе а/р-белков обнаружены две новые структуры: девятисегментный а/р-мотив (рис. 9а) и аналог семисегментного а/р-мотива с Б-образным р-листом (рис. 96). Для групп белков, содержащих эти структуры, были сформированы базы данных и построены соответствующие структурные деревья.

Рисунок 9. Новые структурные мотивы в классе а/р-белков. а) Девятисегментный а/р-мотив. б) Аналог семисегментного а/р-мотива, содержащий й-образный р-лист. Показан вид укладок с торца.

Всего найдено 34 домена и простых белка, в молекулах которых содержится девятисегментный а/р-мотив. Белки, содержащие эти мотивы, выполняют различные биологические функции; чёткой корреляции между наличием девятисегментных мотивов в белке и его функцией не обнаружено. Как видно, этот структурный мотив является членом ряда, в котором происходит последовательное увеличение укладки цепи на одну оф-единицу: пятисегментый мотив - семисегментный мотив - девятисегментный мотив. Отметим, что с ростом числа элементов вторичной структуры происходит уменьшение количества белков, в которых эти структуры встречаются; т.е. распространённость структур в белках в этом ряду падает. Так, мы собрали

а)

б)

388 негомологичных белков и доменов с пятисегментными мотивами, 294 - с семисегментными мотивами, и лишь 34 белка и домена имели девятисегментный мотив. Структуры с возрастанием ещё на одну сф-единицу, т.е. одиннадцати сегментные мотивы обнаружить пока не удалось.

В отличие от рассмотренного выше мотива наличие аналогов семисегментных мотивов коррелирует с функцией; мотивы встречаются только в группе РАО/К,ЛО(Р)-связывающих белковых доменов. Нам удалось обнаружить 90 белков и доменов, содержащих аналог семисегментного а/р-мотива с Б-образным р-листом; в некоторых белках этот мотив содержится дважды в разных доменах.

Новые структурные деревья (а+Р)-белков. В процессе составления базы данных (а+Р)-белков с аЬСс1-единицами была отмечена достаточно высокая частота встречаемости белков, содержащих структуры, сходные с аЬС(1-единицей, но отличающиеся от неё наличием одного или нескольких Р-тяжей, находящихся внутри укладки. Такие структуры мы назвали топологически сходными с аЬСс1-единицей структурами. Создана база данных белков, содержащих такие структуры, в которую вошло 485 белков и доменов, из них взаимная гомология не обнаружена в 199 белках. Далее мы промоделировали пошаговое добавление к аЬСс!-единице от одного до четырёх р-тяжей, направленных внутрь структуры. Процесс моделирования был ограничен добавлением четырёх Р-тяжей, так как структуры с пятью и более Р-тяжами не были обнаружены в белках. В результате получилось 10 теоретически возможных структур (рис. 10). Данные по распределению белков представлены в виде таблицы (таблица 1). Видно, что чаще встречаются структуры с небольшим количеством дополнительных р-тяжей, что мы связываем со снижением компактности глобулы при увеличении числа р-тяжей. Сравнение показывает, что белков с аЬС<1-единицами (всего один р-тяж, расположенный внутри структуры), гораздо больше, чем белков с её аналогами. Всего в белках обнаружено 7 структур из 10 теоретически возможных. Построены пять новых структурных деревьев, для которых в

качестве корневых структур используются: аЬСсМ-структура, ааЬС<3-структура, аааЬСё-структура, ааааЬСс1-структура, aaabCdd-cтpyктypa. Одно из пяти деревьев приведено на рис. 11.

Таблица 1. Частоты встречаемости структур, топологически сходных с аЬСё-сдиницей, в белках.

Обозначение Число различных Общее количество Из них

п.п. структуры укладок цепи белков негомологичных

1. аЬСсМ 3 7 5

2. ааЬСсЫ 1 16 2

3. ааЬС(1 39 283 104

4. аааЬСс! 24 84 52

5. аааЬСсй 4 63 23

6. ааааЬСс! 1 2 1

7. аааааЬСй 4 30 12

Рисунок 10. - Моделирование структур, топологически сходных с аЬСс!-единицей. Укладки, обнаруженные в белках, выделены в рамочки.

Рисунок И. Структурное древо белков, содержащих аааЬС ¿-структуры. Укладки, обнаруженные в белках, выделены в рамочки. Показаны только негомологичные белки.

19

выводы

1. Созданы базы данных четырёх наиболее крупных суперсемейств белков: р-белков с аЬс<1-единицами, (а+Р)-белков с аЬС<1-единицами, а/р-белков с пяти- и семисегментными а/р-мотивами.

2. Построены компьютерные версии структурных деревьев этих белковых суперсемейств и проведён их анализ.

3. Разработана иерархическая структурная классификация четырёх перечисленных выше групп белков, основанная на построенных структурных деревьях. Создан \УЕВ-сайт, содержащий классификацию белков, компьютерные версии построенных структурных деревьев и справочную информацию. \¥ЕВ-сайт находится на сервере Института белка РАН и доступен в Интернете по адресу http://strees.protres.ru/.

4. В а/р-белках обнаружены два новых структурных мотива: девятисегментный а/р-мотив и аналог семисегментного а/р-мотива с Б-образным Р-листом. Для групп белков, содержащих эти структуры, сформированы базы данных и построены соответствующие структурные деревья.

5. В (а+р)-белках обнаружены 7 структур, сходных по укладке с аЬС<1-единицей. Для пяти из них построены структурные деревья.

Основные результаты диссертации опубликованы в работах:

1. Гордеев А.Б., Кондратова М.С., Ефимов A.B. Новое структурное древо ß-белков, содержащих abcd-единицы // Молекулярная биология. - 2008. - Т. 42.-С. 323-326.

2. Гордеев А.Б., Ефимов A.B. Новое структурное древо (сгф)-белков, содержащих abCd-единицы // Молекулярная биология. - 2009. - Т. 43. - С. 521-526.

3. Gordeev A.B., Kargatov A.M., Efimov A.V. PCBOST: Protein classification based on structural trees // Biochemical and Biophysical Research Communications. -2010. -V. 397 -P. 470-471.

4. Гордеев А.Б., Ефимов A.B. Построение и анализ структурного древа ß-белков, содержащих abcd-единицы // 11-я Пущинская международная школа-конференция молодых учёных. - Пущино, 2007. - Сборник тезисов. - С. 75.

5. Гордеев А.Б., Ефимов A.B. Разработка структурной классификации белков, содержащих abcd-единицы // Информационно-вычислительные технологии в решении фундаментальных проблем и прикладных научных задач. Сборник материалов ИВТН-2008. - Москва, 2008. - С. 41.

6. Гордеев А.Б., Ефимов A.B. Построение и анализ обновлённого структурного древа (а+Р)-белков, содержащих abCd-единицы // 12-я Пущинская международная школа-конференция молодых учёных, Пущино, 2008. - Сборник тезисов. - С. 15.

7. Гордеев А.Б., Ефимов A.B. Построение и анализ новых структурных деревьев белков II IV Российский симпозиум «Белки и пептиды». - Тезисы докладов. - Казань, 2009. - С. 315.

8. Гордеев А.Б., Ефимов A.B. Разработка структурной классификации альфа/бета-белков, содержащих семисегментные альфа/бета-мотивы // Информационно-вычислительные технологии в решении

фундаментальных проблем и прикладных научных задач. Сборник материалов ИВТН-2009. - Москва, 2009. - С. 20.

9. Гордеев А.Б., Ефимов A.B. Новые структурные «деревья» альфа/бета-белков // XXII Зимняя молодежная научная школа "Перспективные направления физико-химической биологии и биотехнологии", тезисы докладов и стендовых сообщений. - Москва, 2010. - С. 33.

10. Гордеев А.Б., Ефимов A.B. Разработка новой иерархической классификации белков на основе структурных деревьев // 14-я Пущинская международная школа-конференция молодых учёных. - Пущино, 2010. -Сборник тезисов - Т.2. - С. 125-126.

Подписано в печать:

07.09.2010

Заказ № 4068 Тираж -100 экз. Печать трафаретная. Типография «11-й ФОРМАТ» ИНН 7726330900 115230, Москва, Варшавское ш„ 36 (499) 788-78-56 www.autoreferat.ru

Содержание диссертации, кандидата биологических наук, Гордеев, Алексей Борисович

ВВЕДЕНИЕ.

ГЛАВА 1. ОБЗОР ЛИТЕРАТУРЫ.

1.1 Структурные классификации белков.

1.2 Структурные деревья глобулярных белков.

ГЛАВА 2. МЕТОДЫ ИССЛЕДОВАНИЯ.

ГЛАВА 3. РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ.

3.1 Постановка задачи.

3.2 Построение и анализ структурного древа ^-белков, содержащих abcd-единицы.Г.

3.3 Построение и анализ структурного древа (а + Р)-белков, содержащих abCd-единицы.

3.4 Построение и анализ структурного древа а/р-белков, содержащих пятисегментные а/р-мотивы.

3.5 Построение и анализ структурного древа а/р-белков, содержащих семисегментные а/р-мотивы.

3.6 Разработка новой иерархической классификации белков на основе структурных деревьев.

3.7 Новые структурные деревья а/р-белков.

3.8 Новые структурные деревья (а+Р)-белков.

Введение Диссертация по биологии, на тему "Построение и анализ новых структурных деревьев глобулярных белков"

Пространственная структура белков определяет их биологическую функцию, а также высокую эффективность и строгую избирательность большинства биологических процессов, в которых они участвуют. В связи с этим решение многих биохимических задач самым тесным образом связано с изучением пространственной структуры белковых молекул. Несмотря на значительный прогресс, достигнутый в этой области в последние десятилетия, определить пространственные структуры многих белков пока не удаётся. Таким образом, установление взаимосвязи между аминокислотной последовательностью белка и его трёхмерной структурой и разработка методов предсказания третичной структуры белка на этой основе являются важнейшими фундаментальными проблемами биохимии и молекулярной биологии.

В настоящее время более или менее надёжное предсказание третичной структуры белка возможно только методом моделирования на основе гомологии, то есть только в том случае, когда известна пространственная структура какого-либо гомологичного белка. Таким образом, несмотря на отдельные успехи, в целом проблема взаимосвязи между первичной и третичной структурами остаётся пока нерешённой. Одним из возможных подходов к решению этой проблемы является моделирование структуры белков и путей их сворачивания с помощью построения и анализа структурных деревьев.

Структурное древо белков - это совокупность всех разрешённых пространственных структур, которые могут быть получены из одной стартовой структуры путём последовательного пристраивания к ней других элементов вторичной структуры в соответствии с набором правил. В качестве стартовой структуры древа берётся соответствующий структурный мотив, а возможные пути роста структур показываются линиями, которые в итоге объединяют все структуры в одно древо. Количество расшифрованных пространственных структур белков с каждым годом растёт, что предопределяет необходимость построения обновлённых структурных деревьев для уже описанных структурных групп белков, а также поиска новых структурных мотивов и построения новых структурных деревьев на их основе. С другой стороны, открывается возможность разработать иерархическую классификацию белков, основанную на построенных структурных деревьях. Такая классификация является уникальной, так как она основана на сходстве и различиях смоделированных путей сворачивания белков. Таким образом, построение подобной системы структурной классификации белков актуально и имеет большое практическое значение. Кроме того, помимо задач, связанных с классификацией белков, новые структурные деревья можно использовать в качестве удобного инструмента для решения ряда научных задач, таких как изучение структурного сходства белковых молекул, исследование механизмов сворачивания белков, поиск наиболее выгодных пространственных структур и исследование роли структурного контекста в сворачивании белков.

В ходе работы нами построено 4 новых структурных дерева для уже описанных структурных классов белков, проведён анализ построенных структурных деревьев и разработана современная иерархическая классификация белков, относящихся к этим классам. Кроме того, было обнаружено два новых структурных мотива: девятисегментный аф-мотив и аналог семисегментного а/р-мотива, содержащий S-образный {3-лист. Для белков, содержащих такие мотивы, построено два новых структурных дерева. Разработан WEB-сайт с иерархически организованной базой данных белков и построенными структурными деревьями, который доступен по адресу http://strees.protxes.ru/. База данных включает в себя 3625 белков и доменов (9985 PDB-файлов белков), а структурные деревья - суммарно 1249 укладок.

Материалы диссертации докладывались на научных конференциях. По теме диссертации опубликовано три печатные работы, не считая тезисов конференций.

Заключение Диссертация по теме "Молекулярная биология", Гордеев, Алексей Борисович

Основные результаты диссертационной работы представлены в публикациях [110,111,112,113,114,115,116,117,118,119].

Выражаю искреннюю благодарность своему научному руководителю, д. хим. н. А.В. Ефимову за помощь в постановке задач, освоении методов и обработке результатов при выполнении данной диссертационной работы. Также выражаю благодарность сотрудникам Группы моделирования белковых структур Института белка РАН Е.В. Бражникову и Е.А. Бошковой за помощь, ценные советы при обсуждении результатов и оформлении работы. Отдельно хочется поблагодарить М.С. Кондратову за ценные советы в отношении дизайна WEB-сайта и помощь в освоении методов на начальных этапах работы.

Библиография Диссертация по биологии, кандидата биологических наук, Гордеев, Алексей Борисович, Пущино

1. Levitt М., Chothia С. Structural patterns in globular proteins // Nature. -1976. Vol. 261. - P. 552-558.

2. Lesk A.M. Introduction to protein architecture. Oxford: Oxford university press, 2001.-348 p.

3. Bernstein F.C., Koetzle T.F., Williams G.J., Meyer E.F., Brice M.D., Rodgers J.R., Kennard O., Shimanouchi Т., Tasumi M. The protein data bank: a computer-based archival file for macromolecular structures // J. Mol. Biol. 1977. - Vol. 112. - P. 535-542.

4. Финкелыптейн A.B., Птицын О.Б. Физика белка: курс лекций. М.: Книжный дом «Университет», 2005. - 456 с.

5. Finn R.D., Tate J., Mistry J., Coggill P.C., Sammut S.J., Hotz H.R, Ceric G., Forslund K., Eddy S.R, Sonnhammer E.L., Bateman A. The Pfam protein families database // Nucleic Acids Res. 2008. - Vol. 36. - P. D281-D288.

6. Vogel C., Bashton M., Kerrison N.D., Chothia C, Teichmann S.A. Structure, function and evolution of multidomain proteins // Curr. Opin. Struct. Biol. 2004. - Vol. 14. - P. 208-216.

7. Hadley C., Jones D.T. A systematic comparison of protein structure classifications: SCOP, CATH and FSSP // Structure. 1999. - Vol. 7. - P. 1099-1112.

8. Murzin A.G., Brenner S.E., Hubbard T. and Chothia C. SCOP: a structural classification of proteins database for the investigation of sequences and structures // J. Mol. Biol. 1995. - Vol. 247. - P. 536-540.

9. Lo Conte L., Ailey В., Hubbard T.J.P., Brenner S.E., Murzin A.G., Chothia C. SCOP: a structural classification of proteins database // Nucleic Acids Res. 2000. - Vol. 28. - P. 257-259.

10. Orengo C.A., Flores T.P., Taylor W.R., Thornton J.M. Identification and classification of protein fold families // Protein Eng. 1993. - Vol. 6. - P. 485-500.

11. Orengo C.A., Jones D.T., Thornton J.M. Protein superfamilies and domain superfolds. //Nature. 1994. - Vol. 372. - P. 631-634.

12. Orengo C.A., Michie A.D., Jones S., Jones D.T., Swindells M.B. and Thornton J.M. CATH a hierarchic classification of protein domain structures // Structure. - 1997. - Vol. 5. - P. 1093-1108.

13. Reeves G.A., Dallman T.J., Redfern O.C., Akpor A., Orengo C.A. Structural diversity of domain superfamilies in the CATH database // J. Mol. Biol. 2006. - Vol. 360. - P. 725-741.

14. Andreeva A., Howorth D., Chandonia J.-M., Brenner S.E., Hubbard T.J.P., Chothia C., Murzin A.G. Data growth and its impact on the SCOP database: new developments // Nucleic Acids Res. 2008. - Vol. 36. - P. D419-425.

15. Holm L., Ouzounis C., Sander C., Tuparev G., Vriend G. A database of protein structure families with common folding motifs // Protein Science. -1992.-Vol. l.-P. 1691-1698.

16. Holm L., Sander C. The FSSP database of structurally aligned protein fold families // Nucleic Acids Res. 1994. - Vol. 22. - P. 3600-3609.

17. Holm L., Sander C. Protein folds and families: sequence and structure alignments // Nucleic Acids Res. 1999. - Vol. 27. - P. 244-247.

18. Holm L., Sander C. Protein structure comparison by alignment of distance matrices//J. Mol. Biol. 1993. - Vol. 233. - P. 123-138.

19. Holm L., Sander C. Dictionary of recurrent domains in protein structures // Proteins. 1998. - Vol. 33. - P. 88-96.

20. Dietmann S., Park J., Notredame C., Heger A., Lappe M., Holm L. A fully automatic evolutionary classification of protein folds: DALI domain dictionary version 3 // Nucleic Acids Res. 2001. - Vol. 29. - P. 55-57.

21. Sowdhamini R., Rufino S.D., Blundell T.L. A database of globular protein structural domains: clustering of representative family members into similar folds // Folding & Design. 1996. - Vol. 1. - P. 209-220.

22. Vinayagam A., Shi J., Pugalenthi G., Meenakshi В., Blundell T.L., Sowdhamini R. DDBASE2.0: updated domain database with improved identification of structural domains II Bioinformatics. 2003. - Vol. 19. - P. 1760-1764.

23. Sowdhamini R., Blundell T.L. An automatic method involving cluster analysis of secondary structures for the identification of domains in proteins // Protein Sci. 1995. - Vol. 4. - P. 506-520.

24. Przytycka Т., Aurora R., Rose G.D. A protein taxonomy based on secondary structure // Nature Struct. Biol. 1999. - Vol. 6. - P. 672-682.

25. Jeong J., Berman P., Przytycka T. Fold classification based on secondary structure how much is gained by including loop topology? // BMC Struct. Biol.-2006.-Vol. 6.-P. 3.

26. Mizuguchi K., Deane C.M., Blundell T.L. HOMSTRAD: a database of protein structure alignments for homologous families // Protein Science. -1998. Vol. 7. - P. 2469-2471.

27. Hogue C.W.V., Ohkawa H., Bryant S.H. A dynamic look at structures: WWW-Entrez and the Molecular Modeling Database // Trends Biochem. Sci. 1996. - Vol. 21. - P. 226-229.

28. Brenner S.E., Chothia C., Hubbard T.J.P. Population statistics of protein structures: lessons from structural classifications // Cur. Opin. Struc. Biol. -1997.-Vol. 7. P. 369-376.

29. Siddiqui A.S., Dengler U., Barton G.J. 3Dee: a database of protein structural domains // Bioinformatics. 2001. - Vol. 17. - P. 200-201.

30. Dengler U., Siddiqui A.S., Barton G.J. Protein structural domains: Analysis of the 3Dee domains database // Proteins. 2001. - Vol. 42. - P. 332-344.

31. Smith T.F., Waterman M.S. Identification of common molecular subsequences//J. Mol. Biol. 1981.-Vol. 147.-P. 195-197.

32. Day R., Beck D.A.C., Armen R.S., Daggett V. A consensus view of fold space: Combining SCOP, CATH and the Dali Domain Dictionary // Protein Science. -2003. Vol. 12. - P. 2150-2160.

33. Csaba G., Birzelle F., Zimmer R. Systematic comparison of SCOP and CATH: a new gold standard for protein structure analysis // BMC Struct. Biol.-2009.-Vol. 9.-P. 23.

34. Orengo C. Classification of protein folds // Curr. Opin. Struct. Biol. 1994. -Vol. 4.-P. 429-440.

35. Vriend G., Sander C. Detection of common three-dimensional substructures in proteins //Proteins. 1991. - Vol. 11. - P. 552-558.

36. Alexandrov N.N., Takahashi K., Go N. Common spatial arrangements of backbone fragments in homologous and non-homologous proteins // J. Mol. Biol. 1992. - Vol. 225. - P. 5-9.

37. Russel R.B., Barton G.J. Multiple protein sequence alignment from tertiary structure comparisons: assignments of global and residue level confidences // Proteins. 1993. - Vol. 14. - P. 309-323.

38. Subbiah S., Laurents D.V., Levitt M. Structural similarity of DNA-binding domains of bacteriophage repressors and the globin core // Curr. Biol. -1993.-Vol. 3.-P. 141-148.

39. Chen L., Zhou T. and Tang Y. Protein structure alignment by deterministic annealing // Bioinformatics. 2005. - Vol. 21. - P. 51-62.

40. Yee D.P., Dill K.A. Families and the structural relatedness among globular proteins // Protein Sci. 1993. - Vol. 2. - P. 884-899.

41. Godzik A., Skolnik J., Kolinski A. Regularities in interaction patterns of globular proteins I I Protein Eng. 1993. - Vol. 8. - P. 801-810.

42. Gridley H.M., Artymiuk P. J., Rice D.W., Willett P. Identification of tertiary structure resemblance in proteins using a maximal common subgraph isomorphism algorithm // J. Mol. Biol. 1993. - Vol. 229. - P. 707-721.

43. Madej Т., Gibrat J.-F., Bryant S.H. Threading a database of protein cores // Proteins. 1995. - Vol. 23. - P. 356-369.

44. Gibrat J.-F., Madej Т., Bryant S.H. Surprising similarities in structure comparison// Curr. Opin. Struct. Biol. 1996. - Vol. 6. - P. 377-385.

45. Harrison A., Pearl F., Mott R., Thornton J., Orengo C. Quantifying the similarities within fold space // J. Mol. Biol. 2002. - Vol. 323. - P. 909926.

46. Novotny M., Madsen D., Kleywegt G.J. Evaluation of protein fold comparison servers // Proteins. 2004. - Vol. 54. - P. 260-270.

47. Mizuguchi K., Go N. Comparison of spatial arrangements of secondary structural elements in proteins // Protein Eng. 1995. - Vol. 8. - P. 353-362.

48. Nussinov R., Wolfson H.J. Efficient detection of three-dimensional structural motifs in biological macromolecules by computer vision techniques // Proc. Natl. Acad. Sci. USA. 1989. - Vol. 88. - P. 1049510499.

49. Bachar O., Fischer D., Nussinov R., Wolfson H.J. A computer vision based technique for 3-D sequence independent structural comparison of proteins // Protein Eng. 1993. - Vol. 6. - P. 279-288.

50. Shih E.S.C., Hwang M.-J. Protein structure comparison by probability-based matching of secondary structure elements // Bioinformatics. 2003. -Vol. 19.-P. 735-741.

51. Carugo O., Pongor S. Protein fold similarity estimated by a probabilistic approach based on Ca-Ca distance comparison // J. Mol. Biol. 2002. -Vol. 315.-P. 887-898.

52. Taylor W.R., Orengo С.A. Protein structure alignment // J. Mol. Biol. -1989.-Vol. 208.-P. 1-22.

53. Taylor W.R., Flores T.P., Orengo C.A. Multiple protein structure alignment //Prot. Sci. 1994. - Vol. 3. -P. 1858-1870.

54. Luo Y., Lai L., Xu X., Tang Y. Defining topological equivalences in protein structures by means of a dynamic programming algorithm // Protein Eng. -1993.-Vol. 6.-P. 373-376.

55. Martin A.C.R. The ups and downs of protein topology; rapid comparison of protein structure // Protein Eng. 2000. - Vol. 13. - P. 829-837.

56. Shindyalov I.N., Bourne P.E. Protein structure alignment by incremental combinatorial extension (CE) of the optimal path // Protein Eng. 1998, Vol. 11.-P. 739-747.

57. Shindyalov I.N., Bourne P.E. An alternative view of protein fold space // Proteins. 2000. - Vol. 38. - P. 247-260.

58. Kawabata Т., Nishikawa K. Protein structure comparison using the Markov transition model of evolution // Proteins. 2000. - Vol. 41. - P. 108-122.

59. Jung J., Lee B. Protein structure alignment using environmental profiles // Protein Eng. -2000. Vol. 13. - P. 535-543.

60. Mayr G., Domingues F.S., Lackner P. Comparative analysis of protein structure alignments // BMC Struct. Biol. 2007. - Vol. 7. - P. 50.

61. Guda C., Lu S., Scheeff E.D., Bourne P.E., Shindyalov I.N. CE-MC: a multiple protein structure alignment server // Nucleic Acids Res. 2004. -Vol. 32.-P. W100-W103.

62. Gerstein M., Altman R.B. Average core structures and variability measures for protein families application to the immunoglobulins // J. Mol. Biol. -1995.-Vol. 251.-P. 161-175.

63. May A.C.W. Toward more meaningful hierarchical classification of protein three-dimensional structures // Proteins. 1999. - Vol. 37. - P. 20-29.

64. Abagyan R.A., Totrov M.M. Contact area difference (CAD): a robust measure to evaluate accuracy of protein models // J. Mol. Biol. 1997. -Vol. 268.-P. 678-685.

65. Falicov A., Cohen F.E. A surface of minimum area metric for the structural comparison of proteins // J. Mol. Biol. 1996. - Vol. 258. - P. 871-892.

66. Rogen P., Fain B. Automatic classification of protein structure by using Gauss integrals // Proc. Natl. Acad. Sci. USA. 2003. - Vol. 100. - P. 119124.

67. Krasnogor N., Pelta D. A. Measuring the similarity of protein structures by means of the universal similarity metric // Bioinformatics. 2004. - Vol. 20. -P. 1015-1021.

68. Sippl M.J. On distance and similarity in fold space // Bioinformatics. -2008. Vol. 24. - P. 872-873.

69. Kolodny R., Koehl P., Levitt M. Comprehensive evaluation of protein structure alignment methods: scoring by geometric measures // J. Mol. Biol. 2005. - Vol. 346. - P. 1173-1188.

70. Sasin J.M., Kurowski M.A., Bujnicki J.M. STRUCLA: a WWW meta-server for protein structure comparison and evolutionary classification // Bioinformatics. 2003. - Vol. 19, Suppl. l.-P. i252-i254.

71. Mavridis L., Ritchie D.W. 3d-Blast: 3d protein structure alignment, comparison, and classification using spherical polar Fourier correlations // Pacific Symposium on Biocomputing. 2010. - P. 281-292.

72. Hoffman D.L., Laiter S., Singh R.K., Vaisman I.I., Tropsha A. Rapid protein structure classification using one-dimensional structure profiles on the BioSCAN parallel computer // Comput. Appl. Biosci. 1995. - Vol. 11. -P. 675-679.

73. Zhang С.-Т., Zhang R. A new criterion to classify globular proteins based on their secondary structure contents // Bioinformatics. 1998. - Vol. 14. -P. 857-865.

74. Taylor W.R. A 'periodic table' for protein structures // Nature. 2002. -Vol.416.-P. 657-660.

75. Taylor W.R. Evolutionary transitions in protein fold space // Curr. Opin. Struct. Biol. 2007. - Vol. 17. - P. 354-361.

76. Wang Y., Wu L.-Y., Zhang X.-S., Chen L. Exploring the classification of protein structures on geometric patterns by neural networks // International Journal of computational intelligence research. 2006. - Vol. 2. - P. 105109.

77. Chiang Y.-S., Gelfand T.I., Kister A.E., Gelfand I.M. New classification of supersecondary structures of sandwich-like proteins uncovers strict patterns of strand assemblage // Proteins. 2007. - Vol. 68. -P. 915-921.

78. Kister A.E., Finkelstein A.V., Gelfand I.M. Common features in structures and sequences of sandwich-like proteins // Proc. Natl. Acad. Sci. USA. -2002,-Vol. 99.-P. 14137-14141.

79. Focas A.S., Papatheodorou T.S., Kister A.E., Gelfand I.M. A geometric construction determines all permissible strand arrangements of sandwich proteins // Proc. Natl. Acad. Sci. USA. 2005. - Vol. 102. - P. 1585115853.

80. Ефимов A.B. Супервторичная структура р-белков // Молекулярная биология. 1982. - Т. 16. - С. 799-806.

81. Ефимов А.В. Новая супервторичная структура белков: сш-уголок. // Молекулярная биология. 1984. - Т. 18. - Р. 1524-1537.

82. Efimov A.V. A novel super-secondary structure of proteins and the relation between the structure and the amino acid sequence // FEBS Lett. 1984. -Vol. 166.-P. 33-38.

83. Efimov A.V. Structural similarity between two-layer a/p and P-proteins // J. Mol. Biol. 1995. - Vol. 245. - P. 402-415.

84. Efimov A.V. A novel super-secondary structure of (3-proteins: A triple strand corner // FEBS Lett. 1992. - Vol. 298. - P. 261-265.

85. Efimov A.V. Standard structures in proteins // Prog. Biophys. molec. Biol. -1993.-Vol. 60.-P. 201-239.

86. Efimov A. V. Super-secondary structures involving triple-strand p-sheets // FEBS Lett. 1993. - Vol. 334. - P. 253-256.

87. Efimov A.V. Structural trees for protein superfamilies // Proteins. 1997. -Vol. 28.-P. 241-260.

88. Ефимов A.B. Структурные деревья глобулярных белков // Успехи биологической химии. 2004. - Т. 44. - С. 109-132.

89. Ptitsyn О.В., Finkelstein A.V., Falk (Bendzko) P. Principal folding pathway and topology of all-p-proteins. // FEBS Lett. 1979. - Vol. 101. - P. 1-5.

90. Ptitsyn O.B., Finkelstein A.V. Similarities of protein topologies. Evolutionary divergence, functional convergence or principles of folding? // Q. Rev. Biophys. 1980. - Vol. 13. - P. 339-386.

91. Лим В.И., Мазанов А.Д., Ефимов A.B. Стереохимическая теория пространственной структуры глобулярных белков. I. Высокоспиральные промежуточные структуры // Молекулярная биология. 1978. - Т. 12. - С. 206-213.

92. Richardson J.S. P-Sheet topology and relatedness of proteins // Nature. -1977. Vol. 268. - P. 495-500.

93. Ефимов A.B. Структурное древо для белков, содержащих ф-мотивы // Биохимия. 2008. - Т. 73. - С. 29-35.

94. Rao S.T., Rossmann M.G. Comparison of super-secondary structures in proteins // J. Mol. Biol. 1973. - Vol. 76. - P. 241-256.

95. Sternberg M.J.E. and Thornton J.M. On the conformation of proteins: the handedness of the P-strand-a-helix-strand unit // J. Mol. Biol. 1976. -Vol. 105.-P. 367-382.

96. Efimov A.V. A structural tree for a-helical proteins, containing aa-corners and its application to protein classification // FEBS Lett. 1996. - Vol. 391. -P. 167-170.

97. Efimov A.V. A structural tree for proteins containing S-like (3-sheets // FEBS Lett. 1998. - Vol. 437. - P. 246-250.

98. Efimov A.V. A structural tree for proteins containing 3P-corners // FEBS Lett. 1997. - Vol. 407. - P. 37-41.

99. Каргатов A.M., Ефимов A.B. Новый структурный мотив и структурные деревья содержащих его белков // Биохимия. 2010. - Т. 75. - С. 305312.

100. Johannissen L.O., Taylor W.R. Protein fold comparison by the alignment of topological strings // Prot. Eng. 2003. - Vol. 16. - P. 949-955.

101. Zhang C., Kim S.-H. A comprehensive analysis of the Greek key motifs in protein P-barrels and p-sandwiches // Proteins. 2000. - Vol. 40. - P. 409419.

102. Efimov A.V. Common structural motifs in small proteins and domains // FEBS Lett. 1994. - Vol. 355. - P. 213-219.

103. Garbuzynskiy S.O., Kondratova M.S. Structural features of protein folding nuclei // FEBS Lett. 2008. - Vol. 582. - P. 768-772.

104. Tatusova T.A., Madden T.L. Blast 2 sequences a new tool for comparing protein and nucleotide sequences // FEMS Microbiol. Lett. - 1999. - Vol. 174.-P. 247-250.

105. Altschul S.F., Gish W., Miller W., Myers E.W., Lipman D.J. Basic local alignment search tool // J. Mol. Biol. 1990. - Vol. 215. - P. 403-410.

106. Sayle R., Milner-White J. RasMol: biomolecular graphics for all // Trends Biochem. Sci. 1995. - Vol. 20. - P. 374-376.

107. Janin J. Shared structural motif in proteins // Nature. 1993. - Vol. 365. -P. 21.

108. Гордеев А.Б., Кондратова М.С., Ефимов А.В. Новое структурное древо Р-белков, содержащих abcd-единицы // Молекулярная биология. 2008. - Т. 42. - С. 323-326.

109. Гордеев А.Б., Ефимов А.В. Новое структурное древо (а+Р)-белков, содержащих abCd-единицы // Молекулярная биология. 2009. - Т. 43. -С. 521-526.

110. Gordeev А.В., Kargatov A.M., Efimov A.V. PCBOST: Protein classification based on structural trees // Biochemical and Biophysical Research Communications. 2010. - V. 397 - P. 470-471.

111. Гордеев А.Б., Ефимов А.В. Построение и анализ структурного древа Р-белков, содержащих abcd-единицы // 11-я Пущинская международная школа-конференция молодых учёных. Пущино, 2007. - Сборник тезисов. - С. 75.

112. Гордеев А.Б., Ефимов А.В. Построение и анализ обновлённого структурного древа (а+Р)-белков, содержащих abCd-единицы // 12-я Пущинская международная школа-конференция молодых учёных, Пущино, 2008. Сборник тезисов. - С. 15.

113. Гордеев А.Б., Ефимов А.В. Построение и анализ новых структурных деревьев белков // IV Российский симпозиум «Белки и пептиды». -Тезисы докладов. Казань, 2009. - С. 315.

114. Гордеев А.Б., Ефимов A.B. Новые структурные «деревья» альфа/бета-белков // XXII Зимняя молодежная научная школа "Перспективные направления физико-химической биологии и биотехнологии", тезисы докладов и стендовых сообщений. Москва, 2010. - С. 33.

115. Гордеев А.Б., Ефимов А.В. Разработка новой иерархической классификации белков на основе структурных деревьев // 14-я Путинская международная школа-конференция молодых учёных. -Пущино, 2010. Сборник тезисов - Т.2. - С. 125-126.