Бесплатный автореферат и диссертация по биологии на тему
Исследование структур мембраноассоциированных белков и белковых комплексов методами молекулярного моделирования
ВАК РФ 03.01.03, Молекулярная биология

Автореферат диссертации по теме "Исследование структур мембраноассоциированных белков и белковых комплексов методами молекулярного моделирования"

п

На правах рукописи Бакулина Анастасия Юрьевна

ИССЛЕДОВАНИЕ СТРУКТУР МЕМБРАНОАССОЦИИРОВАННЫХ БЕЛКОВ И БЕЛКОВЫХ КОМПЛЕКСОВ МЕТОДАМИ МОЛЕКУЛЯРНОГО МОДЕЛИРОВАНИЯ

03.01.03 - молекулярная биология

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата биологических наук

2 1 ОКТ

Кольцово-2010

004611241

Работа выполнена в Федеральном государственном учреждении науки Государственный научный центр вирусологии и биотехнологии «Вектор» Федеральной службы по надзору в сфере защиты прав потребителей и благополучия человека Минздравсоцразвития России.

Научный руководитель

кандидат биологических наук Максютов Амир Закиевич

Официальные оппоненты

доктор биологических наук Карпенко Лариса Ивановна

доктор биологических наук, доцент Лихошвай Виталий Александрович

Ведущая организация

Государственное учреждение Научно-исследовательский институт биомедицинской химии имени В.Н. Ореховича Российской академии медицинских наук, г. Москва

Защита состоится «29» октября 2010 года в 11 часов на заседании диссертационного совета Д 208.020.01 при ФГУН «Государственный научный центр вирусологии и биотехнологии «Вектор» Роспотребнадзора по адресу: ФГУН ГНЦ ВБ «Вектор» Роспотребнадзора, Кольцово Новосибирской области, 630559; тел. (383) 336-74-28.

С диссертацией можно ознакомиться в библиотеке ФГУН «Государственный научный центр вирусологии и биотехнологии «Вектор» Роспотребнадзора.

Автореферат разослан «27 » /2? 2010 г.

Учёный секретарь

диссертационного совета, доктор биологических наук

Г. П. Трошкова

Актуальность работы

Для решения многих фундаментальных и прикладных задач современной биологии требуется знание пространственной структуры белков и их комплексов с другими белками, нуклеиновыми кислотами и низкомолекулярными лигандами. В частности, такое знание необходимо для разработки новых лекарственных препаратов, современных вакцин, выбора антигенов для диагностических систем и ряда других актуальных задач. Без определения пространственной организации белков и их комплексов невозможно раскрыть молекулярные механизмы различных биологических процессов. Информация о структуре белка помогает интерпретировать результаты молекулярно-биологических экспериментов и планировать дальнейшие исследования.

В настоящее время известно около 10 миллионов нуклеотидных последовательностей, кодирующих белки. В то же время пространственные структуры экспериментально определены только для 60 тысяч белков. Для подавляющего большинства белков неизвестны ни третичная, ни четвертичная структуры. Еще сложнее ситуация с определением пространственной структуры белковых комплексов: в лучшем случае известны структуры всех белков по отдельности, но не их комплекса. В связи с этим сейчас активно развиваются и совершенствуются методы компьютерной биологии, позволяющие построить модель пространственной структуры белка с известной аминокислотной последовательностью, а также методы предсказания структур белковых комплексов.

Теоретически можно построить модель третичной или четвертичной структуры белка аЪ initio, исходя из физических законов, описывающих белок как термодинамическую систему. Правильная структура соответствует минимуму свободной энергии белка с учетом его окружения. Однако точное вычисление свободной энергии - крайне ресурсоемкая и недостижимая в настоящее время задача, несмотря на несомненный прогресс в развитии компьютерной техники и алгоритмов (Meirovitch Н. et al., 2009). Поэтому на практике для построения пространственных моделей белков и их комплексов обычно используется моделирование по гомологии. При этом в качестве шаблона используют известные из экспериментов структуры аналогичных белков (Shi J. et al., 2009). Такой подход основан на том факте, что третичная структура белка в среднем более консервативна, чем первичная (Murzin A.G., 2001). Для белок-белковош докинга и оценки качества моделей используются базирующиеся на статистических данных оценочные функции, которые позволяют упрощенно оценить свободную энергию.

При высокой степени сходства аминокислотных последовательностей шаблона и моделируемого белка, такая процедура не предсташиет сложности и может быть выполнена современными программами в автоматическом режиме. Если же уровень сходства первичных структур сравниваемых белков невелик, построение адекватной пространственной модели белка становится

нетривиальной задачей (Dalton J.A.R., Jackson R.M., 2007). Также в общем случае нелегко построить достоверную модель структуры белкового комплекса (Vajda S., Kozakov D., 2009).

Как правило, программы предсказания белковых структур позволяют рассчитать множество допустимых вариантов моделей. В простых случаях можно выбрать наилучшую модель с помощью оценочной функции, аппроксимирующей свободную энергию белка, но в более сложных случаях нельзя полагаться на точность такого подхода (Shi J. et al., 2009). Поэтому для выбора достоверной модели белка приходится либо сопоставлять результаты расчета с помощью различных оценочных функций (консенсусный подход), либо оценивать модели по согласованности с какими-либо известными экспериментальными данными (селекция моделей).

Для многих белков с неизвестной пространственной структурой имеется какая-то информация об их структуре, полученная экспериментальным путем. Например, расстояние между определенными участками белка или доступность каких-то районов для растворителя. Такие данные можно использовать в качестве критериев для селекции моделей белковых структур. Очевидно, что анализ соответствия множества теоретических моделей этим критериям вручную - процедура трудоемкая и крайне неэффективная. Поэтому представляется актуальной разработка удобного инструмента для автоматизации отбора белковых структур по заданным критериям.

Отметим, что в современных базах данных пространственных структур белков и их комплексов наиболее представлены не столько функционально важные белки, сколько те, пространственные структуры которых легче определить экспериментально. В то время как в большинстве геномов не менее трети генов кодирует мембранные белки, пространственная структура подавляющего большинства из них неизвестна. На долю трансмембранных и ассоциированных с мембраной белков приходятся такие важные функции, как мембранный транспорт и передача сигналов. К этому классу белков относится множество антигенов и некоторые токсины патогенных микроорганизмов. Рецепторы и другие белки, ассоциированные с плазматической мембраной, представляют интерес в качестве потенциальных мишеней лекарственных препаратов. Высокая сложность получения кристаллов мембранных белков делает применение методов молекулярного моделирования для этих белков особенно актуальным. Однако большинство таких методов разрабатывалось для глобулярных белков, поэтому для моделирования структур белков, интегрированных в мембрану или ассоциированных с ней, компьютерные подходы следует применять с осторожностью.

Цели исследования

Целью данной работы было построение и анализ моделей третичной и четвертичной структуры мембраноассоциированных белков человека и

патогенных микроорганизмов. Задачи исследования

• Разработка программы отбора моделей белковых структур по заданным критериям.

• Построение моделей структур гексамера, гептамера и октамера гемолизина II (Hlyll) Bacillus cereus, анализ структур ионных каналов, образованных олигомерами Hlyll, и предсказание функции С-концевого домена Hlyll.

• Построение и анализ модели структуры комплекса человеческой металлопротеазы ТАСЕ с субстратом коллагеном XVII.

• Построение модели структуры тримера OmpF-подобного белка Yersinia pseudotuberculosis и выбор районов, наиболее доступных для связывания антител.

• Построение модели пространственной структуры шикопротеина SAG 1 Eimeria tenella и идентификация района связывания моноклонального антитела 2Н10ЕЗ.

• Построение и анализ моделей пространственных структур аутоингибированной и активной конформации человеческих белков ARNO, ARF6, изоформы а2 субъединицы а V-АТФазы, комплексов ARNO с ARF6, ARNO с а2.

Научная новизна работы

Была разработана программа FILTREST3D, впервые позволяющая в удобном для пользователя виде задавать ограничения для селекции результатов моделирования белковых структур. Программа предназначена для отбора структур, соответствующих известным экспериментальным данньм, и таким образом помогает получать достоверные модели белковых структур в сложных случаях моделирования.

Впервые получены модели структур гептамерной мембранной поры белка Hlyll Bacillus cereus и С-концевого домена этого белка. Впервые рассмотрена возможность существования гексамерной и октамерной форм мембранных пор и построены модели их четвертичных структур. Впервые построена модель структуры OmpF-подобного белка Y. pseudotuberculosis. Впервые построены модели, описывающие взаимодействие металлопротеазы человека ТАСЕ с субстратами ФНО (фактором некроза опухолей) и коллагеном XVII. Впервые построена модель структуры белка EtSAGl Е. tenella. Впервые построены модели пространственных структур следующих белков человека: ARNO с СС доменом, ARNO с фосфорилированным и нефосфорилированным доменом РВ, ARNO в комплексе с ARF6, N-концевого фрагмента изоформы а2 субъединицы а V-АТФазы.

Теоретическая н практическая значимость работы

Программа FILTREST3D использовалась в практической работе различными исследователями и в данный момент доступна по адресу

http://filtrest3d.genesilico.pl/filtrest3d/index.html.

Построенные модели белковых структур имеют как теоретическую ценность, поскольку позволяют понимать молекулярные механизмы биологических процессов, так и практическую. Модель структуры ионного канала Hlyll используется для конструирования его ингибиторов на основе циклодекстринов. С помощью модели структуры OmpF были выбраны районы, на основе которых будут сконструированы иммуногены для защиты против Y. pseudotuberculosis. Модель структуры белка EtSAGl была использована для определения сайта связывания антитела 2Н10ЕЗ, в дальнейшем она может быть использована для харакгеризации других антител и для выбора антигенов на базе этого белка.

Апробация работы

Результаты работы были представлены на нескольких конференциях: 1st International Student Symposium in Computational Biology, Madrid, 2005; ISMB (Intelligent Systems for Molecular Biology) annual meeting, 2005, Michigan, USA; 5th International Conference on Bioinformatics of Genome Regulation, Structure, Novosibirsk, 2006; 14th Annual International Conference On Intelligent Systems For Molecular Biology, Fortaleza, Brazil, 2006; American Society for Microbiology, 106th General Meeting, Orlando, 2006; Конференция молодых ученых и специалистов ФГУН ГНЦ ВБ «Вектор», 2009, Новосибирск.

Публикации

По материалам работы было опубликовано 5 статей в реферируемых научных журналах.

Структура и объем работы

Диссертация изложена на 127 страницах текста и состоит из введения, 4 глав, заключения и списка литературы. Содержит 3 таблицы и 45 иллюстраций.

МЕТОДЫ

Вторичная структура белков предсказывалась с помощью программы PSIPRED (Jones D.T., 1999), предсказание суперспиральных районов проводилось в программе COILS (Lupas A.et al., 1991).

Поиск гомологичных аминокислотных последовательностей проводился программой BLASTP из пакета программ BLAST (Altschul S.F. et al., 1997). Поиск шаблонов для моделирования методом распознавания третичной структуры проводился на метасервере Genesilico Metaserver (Kurowski М.А., Bujnicki J.M., 2003).Для множественных и попарных выравниваний аминокислотных последовательностей использовалась программа MUSCLE (Edgar R., 2004). Для построения моделей по гомологии выравнивания редактировались вручную с учетом пространственной структуры шаблона, предсказанной вторичной структуры модели и

множественных выравниваний гомологов шаблона и гомологов модели. Иногда также учитывались результаты работы сервера Frankenstein, который автоматически оценивает различные варианты построения моделей (Kosinski М.А. et al., 2003).

Для построения и оптимизации моделей с использованием шаблона использовался пакет Modeller (Sali A., Blundell T.L., 1993). Для построения моделей de novo использовался пакет Rosetta (Röhl С.А. et al., 2004).

Для построения моделей структур белок-белковых комплексов использовались программы ZDOCK (Wiehe К. et al., 2007) и M-ZDOCK (Pierce В. et al., 2005). Для построения моделей структур комплексов белка с пептидами использовалась программа AutoDock (Morris G.M. et al., 2008).

Для структурного выравнивания белковых структур использовалась программа СЕ (Shindyalov I.N., Bourne P.E., 1998).

Минимизация энергии осуществлялась с помощью пакета молекулярной динамики Gromacs (Van Der Spoel D. et al., 2005) методом L-BFGS.

Визуальный анализ структур моделей, определение расстояний между атомами, определение доступности участков белков выполнялись в программах Swiss-PDB Viewer (Guex N., Peitsch M.C., 1997) и PyMOL (http://pymol.sourceforge.net/). Для редактирования белковых структур использовалась программа Swiss-PDB Viewer. Для расчета электростатического потенциала на поверхности белка использовалась программа PyMOL.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ

Разработка программы отбора белковых моделей по заданны»! критериям. Разработана программа FILTREST3D для селекции результатов различных программ молекулярного моделирования по заданным критериям. Эта программа предназначена для отбора моделей структур белков или белковых комплексов, удовлетворяющих ограничениям, которые задает сам пользователь с помощью простого специально разработанного языка. Примеры ограничений: расстояние между атомами или участками белка, вторичная структура определенного района белка, доступность остатка для

растворителя. Общая схема работы программы приведена на рис. 1. В качестве входных данных программа принимает файл с ограничениями и множество файлов с моделями структуры белка, на выходе выдается список моделей и штрафные баллы за нарушения ограничений для каждой модели. Список моделей

Рис. 1. Схема работы программы FILTREST3D.

сортируется в порядке возрастания штрафных баллов, таким образом на первом месте оказывается модель, максимально соответствующая заданным ограничениям. Программа написана на языке Python с использованием библиотек biopython и PLY. и свободно распространяется (http://filtrest3d.genesilico.pl/filtrest3d/index.html).

Программа используется рядом исследователей при моделировании структур белков (Gabant G. et al., 2006; Husain N. et al., 2010; Purta E. et al., 2008).

Моделирование структуры гемолизина II Bacillus cereus. Гемолизин II (Hlyll) является одним из пороформирующих цитолитических белков В. cereus, оппортунистического патогена человека (Drobniewski F.А., 1993; Granum P.E., 2001). Показано, что Hlyll в растворе образует гептамерные поры, способные встраиваться в мембрану (Miles G. et al., 2002). Имеющиеся экспериментальные данные по защите эритроцитов от гемолиза в присутствии Hlyll с помощью полиэтиленгликолей различной молекулярной массы при разных температурах показали, что эффективный диаметр поры зависит от условий ее формирования. Характер измеренной ионной проводимости каналов, сформированных на липидном бислое, позволяет предполагать гетерогенность образованных каналов (Andreeva Z.I. et al., 2007) (Рис.2). Для объяснения необычных свойств сформированных Hlyll мембранных ионных каналов необходимо было построение модели его пространственной структуры.

Методом моделирования по гомологии построена модель структуры гептамерного канала Hlyll без С-концевого домена. В качестве шаблона для моделирования использовали структуру альфа-гемолизина (aHL) S. aureus, который также образует гептамерные поры. Идентичность аминокислотных последовательностей этих белков составляет 31%, что соответствует достаточно высокому уровню достоверности моделирования. Попарное выравнивание Hlyll и aHL дополнительно редактировали с учетом

Рис. 2. Гистограммы проводимости каналов Hlyll в двойном липидном бислое при концентрации КС1 равной 1 моль. А - поры, сформированные в растворе (Miles G. et al., 2002), В - поры, сформированные на мембране (Andreeva Z.I. et al., 2007).

Цитоплазма

Мембрана

Внеклеточное пространство

Рис. 3. Модель гептамера белка Hlyll В. cereiis. Одна из цепей выделена темным цветом.

предсказанной вторичной структуры, пространственной структуры aHL, множественного выравнивания гомологов Hlyll и aHL, а также результатов сервера Frankenstein (Kosinski J. et al., 2003).

Построенная модель структуры гептамерного ионного канала Hlyll имеет грибовидную форму, внешний диаметр около 10 нм, высота 10 нм. Диаметр поры составляет 4 нм в центре внеклеточной части, 2 нм на внешней границе внеклеточной части и около 1 нм вдоль трансмембранной части. Внутренняя поверхность трансмембранной части Hlyll преимущественно гидрофильна, на ней имеется четыре пояса заряженных остатков (К105 и D146, Е109 и К140, К119 и D130, D124 и К125), которые могут вносить существенный вклад в стабильность канала. Внешняя поверхность трансмембранной части Hlyll преимущественно гидрофобна, за исключением остатка Е141, который доступен для растворителя с внешней стороны мембраны через маленькие боковые поры Hlyll и может, по аналогии с остатком HI44 aHL, функционировать как рН-сенсор.

Районы, образующие взаимодействующие друг с другом поверхности

Hlyll, имеют малое сходство с соответствующими районами aHL. В то же время районы Hlyll и aHL, контактирующие с мембраной, имеют высокий процент сходства друг с другом.

В качестве объяснения особенностей поведения сформированных на мембране ионных каналов Hlyll была предложена гипотеза о существовании различных олигомерных форм Hlyll. С помощью симметричного докинга в программе M-ZDOCK были построены модели структур окгамера и гексамера Hlyll. Предварительно было показано, что эта программа адекватно воспроизводит внеклеточную часть гептамера Hlyll, среднеквадратичное отклонение модели от истинной структуры составляет 1,53 Â. Не было обнаружено стерических препятствий для существования гексамеров и октамеров Hlyll. Из литературы известно, что гомологичные белки способны образовывать поры, отличные от гептамерных: в частности, альфа-токсин Chlostridium septicum образует гексамерные поры (Kennedy C.L . et al., 2005), а гемолизин Е Escherichia coli - октамерные (Wallace A.J. et al., 2000).

Размер С-концевого домена Hlyll составляет 94 остатка, что позволяет применять моделирование de novo (Kaufmann K.W. et al., 2010). При кластеризации моделей, полученных с помощью пакета Rosetta, оказалось, что в кластере наибольшего размера содержится около 5% структур, что соответствует среднему уровню достоверности (Röhl С.А. et al., 2004). Модель третичной структуры С-концевого домена Hlyll имеет сходство со структурой белка CyaY Е. coli, связывающего железо. Возможно, этот домен либо его эволюционный предшественник имеет аналогичную функцию. Известно, что экспрессия гена Hlyll контролируется регулятором транскрипции Fur (ferrum uptake repressor), который также контролирует экспрессию генов, отвечающих за захват и транспорт железа (Harvie D.R. et al., 2005). Эти данные косвенно подтверждают нашу гипотезу о том, что С-концевой домен Н1уП может связывать железо.

Моделирование структур комплексов металлопротеазы TACE с субстратами. Металлопротеаза человека TACE (TNF-a converting enzyme, ФНО-конвертирующий фермент) является трансмембранным ферментом, который участвует в отщеплении различных трансмембранных белков, включая ФНО (фактор некроза опухолей) и коллаген XVII (Franzke С. et al., 2002). Экспериментально показано, что коллаген XVII фосфорилируется казеиновой киназой 2 в позициях Ser542 и Ser544, и фосфорилирование в позиции Ser542 препятствует расщеплению коллагена XVII металлопротеазой TACE (Zimina Е.Р. et al., 2007). Для понимания молекулярных механизмов взаимодействия коллагена XVII и TACE потребовалось построить модель структуры комплекса TACE с субстратом.

На первом этапе был выбран оптимальный метод для докинга пептидных фрагментов субстратов TACE к металлопротеазе TACE на основе литературных данных и результатов воспроизведения известных структур

TACE с ингибиторами. Данные литературы свидетельствуют о том, что для докинга лигандов к цинковым металлопротеазам хорошо подходит npoqjaMMa AutoDock (Ни X. et al., 2004). Оказалось, что программа AutoDock хорошо воспроизводит известные комплексы TACE с ингибиторами, среднеквадратичное отклонение от истинного положения лиганда не превышает 2, 2 А (Табл. 1).

Таблица 1. Среднеквадратичное отклонение между истинным положением лиганда в комплексе и тем, которое было получено докингом в программе AutoDock.

Идентификатор структуры в PDB Разрешение структуры, А Среднеквадратичное отклонение, Â

1ZXC 2,2 1, 1

2А8Н 2,3 1, 1

2DDF 1,7 1,2

2FV9 2,02 2,2

Анализ литературных данных по расщеплению металлопротеазой ТАСЕ различных субстратов (Budagian V. et al., 2004; Zheng Y. et al., 2004; Black R.A. et al., 1996; Brou C. et al., 2000; Lambert M.H. et al., 2005; Zhang Z. et al., 2001) и первичной структуры коллагена XVII показал, что наиболее

Рис. 4. (А) Сопоставление структур пептида IGLHS (светло-серый) и пептидоподобного ингибитора TACE (темно-серый) в связанном состоянии. Обозначены карманы S Г и S3' на поверхности белка TACE. (Б) Комплекс TACE с пептидом IGLHS. Обозначены карманы на поверхности TACE, каталитическая молекула воды, ион цинка.

вероятная позиция расщепления коллагена XVII расположена между остатками Gly539 и Leu540.

С помощью молекулярного докинга в программе AutoDock, селекции моделей программой FILTREST3D и минимизации энергии в пакете Gromacs была создана структура, моделирующая переходный комплекс ТАСЕ с ФНО. Мы применяли наш метод селекции для отбрасывания тех моделей, у которых N-конец либо С-конец пептида взаимодействовал с какой-либо полостью на поверхности ТАСЕ.

На основе модели комплекса ТАСЕ с фрагментом ФНО была получена модель структуры, соответствующей комплексу ТАСЕ с коллагеном XVII.

Общее положение лигандов и структуры водородных связей полученных комплексов ТАСЕ с фрагментами субстратов сходны с описанным в литературе комплексом ТАСЕ с пептидоподобным ингибитором (Maskos К- et al., 1998) (рис. 4А), что говорит о высокой достоверности построенных моделей.

Анализ полученной модели позволил предположить, что металлопротеаза ТАСЕ расщепляет коллаген XVII между остатками Gly539 и Leu540 (рис. 4Б). В модели структуры комплекса ТАСЕ с фрагментом коллагена XVII остаток Leu540 занимает гидрофобную полость SI", His541 координирован с карбонильной и гидроксильной группами на краю каталитического центра ТАСЕ. Боковой радикал Ser542, фосфорилирование которого влияет на расщепление коллагена XVII ТАСЕ, взаимодействует с карманом S3'.

Моделирование структуры OmpF-подобного белка Yersinia pseudotuberculosis. Грам-отрицательная бактерия Y. pseudotuberculosis является возбудителем псевдотуберкулеза - острого зоонозного заболевания человека. OmpF-подобный белок Y. pseudotuberculosis образует поры во внешней бактериальной мембране. Иммунизация мышей и морских свинок этим порином защищает их при заражении Y. pseudotuberculosis (Тимченко Н.Ф. и др., 1990). Построение модели пространственной структуры OmpF-подобного порина необходимо для определения фрагментов белка, применимых в качестве антигенов для индукции гуморального иммунного ответа.

Модель структуры тримера построена методом моделирования по гомологии (с помощью программы Modeller) с использованием бежа OmpF Е. coli в качестве шаблона. Идентичность аминокислотных последовательностей сравниваемых белков составляет 56%, что соответствует высокому уровню достоверности моделирования. Шаблон был выбран на основе поиска в базе данных последовательностей белков с известной пространственной структурой с помощью программы BLASTP.

Анализ модели структуры тримера OmpF-подобного белка показал, что наиболее перспективными для иммунизации районами являются внеклеточные петли L5 (202-213 а.о.), L7 (285-289 а.о.) и L8 (321-336 а.о.),

так как в структуре тримера они наиболее доступны для антител. Интересно, что аминокислотная последовательность петли L8 полностью совпадает с последовательностью соответствующей петли у Y. pestis.

Моделирование структуры белка EtSAGl Eimeria tenella. Eimeria tenella является одним из основных возбудителей кокцидиоза домашней птицы (Williams R.B., 1999). Поверхность Е. tenella покрыта поверхностными антигенами SAG, связанными с GPI (glycosylphosphatidylinositol, гликозилфосфатидилинозитол). Один из них, белок EtSAGl, - мишень мышиного моноклонального антитела 2Н10ЕЗ. Разрезание EtSAGl в районе 68-77 а.о. разрушает связывание 2Н10ЕЗ (Jahn D. et al., 2009). Для того, чтобы охарактеризовать эпитоп антитела 2Н10ЕЗ, требовалось построить модель

пространственной структуры белка EtSAGl.

Для выбора подходящего шаблона для построения модели по гомологии мы провели сравнительный анализ результатов работы нескольких программ распознавания третичной

структуры. Оказалось, что практически все программы предлагают в качестве шаблона белки, относящиеся к семейству PR-1-подобных (Pathogenesis-Related group 1, группа 1 белков, связанных с патогенезом). Поэтому, хотя во всех случаях уровень достоверности структуры оценивался как низкий, высока вероятность того, что EtS AG 1 структурно близок PR-1-подобным белкам. Выравнивания были сделаны вручную с учетом как множественных выравниваний гомологов шаблонов и модели, так I и пространственной структуры

• шаблонов. Построение моделей

G PI проводилось в программе Modeller.

Окончательная модель была построена с использованием белка Na-ASP-2 Necator ameiicanus в качестве шаблона.

В модели структуры EtSAGl

Рис. 5. Модель пространственной структуры белка EtSAGl Е. tenella. Тяжелая цепь обозначена белым цветом, легкая - серым, эпитоп антитела 2Н10ЕЗ -черным.

присутствует три пары цистеинов, консервативных среди всех белков семейства SAG, но отсутствующие в шаблоне. Все пары цистеинов в модели оказались сближены и соединены дисульфидными связями, как и ожидалось для внеклеточного белка.

Анализ структуры модели EtSAGl показывает, что антитело 2Н10ЕЗ связывается с петлей 60-76 а.о. (рис. 5). Обращенная к мембране часть EtSAGl заряжена отрицательно, противоположная, в районе которой происходит связывание 2Н10ЕЗ - положительно.

Моделирование структур белка ARNO человека и предположительно взаимодействующих с ним белков ARF6 и изоформы а2 субъединицы а V-АТФазы. Н+-АТФаза вакуолярного типа (V-АТФаза) -многокомпонентный мембранный комплекс, который катализирует гидролиз АТФ и переносит протон через мембрану (Marshansky V., Futai M., 2008). В состав этого комплекса входит субъединица а, которая у млекопитающих представлена четырьмя изоформами: al, а2, аЗ и а4 (Forgac M., 2007). Белки семейства ARF (ADP ribosylation factor, фактор АДФ-рибозилирования) участвуют в регуляции множества клеточных процессов (D'Souza-Schorey С., Chavrier Р., 2006). Одним из активаторов ARF является белок ARNO (Casanova J.E., 2007), состоящий из 4 доменов: СС, Sec7, PH, PB. Известно, что V-АТФаза, имеющая в своем составе изоформу а2, может работать в качестве рН-сенсора, при этом в процессе передачи сигнала задействованы белки ARNO и ARF6 (Marshansky V., 2007). Экспериментально было показано, что с полноразмерным ARNO взаимодействуют пептиды, соответствующие шести участкам а2 (1-17 а.о., 35-49 а.о., 198-214 а.о., 215-230 а.о., 313-331 а.о. и 386-402 а.о.), при этом только два из них (1-17 а.о., 35-49 а.о.) взаимодействовали с отдельно синтезированным доменом Sec7 ARNO (Merkulova M. et al., 2010). Для изучения молекулярных механизмов передачи сигнала потребовалось построить модели пространственных структур ARNO, а2, ARF6 и комплексов ARNO с ARF6 и ARNO с а2.

Модель структуры аутоингибированной формы ARNO без СС домена была построена методом моделирования по гомологии (с помощью программы Modeller) с использованием белка GRP1 (general receptor for phosphoinositides 1, основной рецептор фосфоинозитидов 1) в качестве шаблона. Сравнение построенной модельной структуры ARNO и структуры шаблона позволило выявить кластеризацию замен в ARNO относительно GRP1 в следующих районах: домен PB, прилегающая к нему альфа-спираль домена РН, петля домена РН, часть домена Sec7 недалеко от суперспирального района.

Модель комплекса ARNO и ARF6 также была построена методом моделирования по гомологии. При этом в качестве шаблона применяли структуру комплекса домена Sec7 белка ARNO с белком ARF1. Идентичность аминокислотных последовательностей моделируемого ARF6 и шаблона ARF1 составила 70%. Показано, что in vivo ARFl и ARF6 взаимодействуют с

Рис. 6. Модели структур комплексов белков ARNO (светло-серый) с ARF6 (темно-серый) с фосфорилированным (А) и нефосфорилированным (Б) доменом PB. Буквой К обозначен предполагаемый карман связывания на до.мене Sec7.

ARNO одинаковым образом (Santy L.C., Casanova J.E., 2001). Анализ модели показал, что взаимодействие ARNO с ARF6 должно сопровождаться конформационными перестройками ARNO, так как домен РН в аутоингибированной форме ARNO стерически препятствует связыванию ARF6 с 8ес7-доменом ARNO.

Для домена PB белка ARNO известны экспериментально полученные методом ядерного магнитного резонанса структуры фосфорилированного и нефосфорилированного вариантов этого домена. Построенные модельные структуры ARNO, учитывающие эти данные, позволили показать, что фосфорилирование домена PB способно увеличивать доступность отдельных районов Sec7 домена ARNO (Рис. 6).

Белок а2 (субъединица V-АТФазы) состоит из цитоплазматической (a2N) и мембранной части. Для мембранной части не удалось найти подходящий для моделирования по гомологии шаблон. Использовались различные методы предсказания топологии трансмембранных спиральных белков, однако их результаты значительно различались. В то же время в настоящее время не существует экспериментальных данных, достаточных для обоснованного сопоставления этих результатов.

Для моделирования a2N был проведен поиск гомологов с помощью различных программ распознавания третичной структуры. В результате в качестве шаблона была выбрана субъединица С, также входящая в состав V-АТФазы. Построенная модель a2N состоит из дистального и проксимального доменов, соединенных суперспиральным участком. Идентичность аминокислотных последовательностей a2N и шаблона составила всего 9%, что обычно делает моделирование по гомологии малодостоверным. Однако в

экспериментальных данных и построенных моделей ARNO и a2N, можно предположить, что домен Sec7 ARNO взаимодействует с

проксимальным доменом a2N, а с дистальным доменом a2N

взаимодействуют домены РВ и РН. С помощью докинга в программах ZDOCK и HADDOCK не уцалось получить комплекс модели a2N и модели аутоингибированной формы ARNO, который бы соответствовал известным экспериментальным данным о взаимодействии ARNO и фрагментов а2. Можно предположить, что взаимодействие а2 и ARNO сопровождается структурными перестройками ARNO и, вероятно, его активацией.

Таким образом, мы применили молекулярное моделирование для выявления механизмов передачи сигнала в сложном мультибелковом комплексе, включающем а2 и ARNO. Исходя из полученных результатов моделирования и имеющихся литературных данных, можно предположить

Рис. 7. Модель цитоплазменной части изоформы а2 субъединицы а V-АТФазы. Темным цветом выделены позиции пептидов, для которых было экспериментально показано

взаимодействие с белком ARNO.

случае этих двух белков мы опирались на тот факт, что субъединицы в составе одного белкового комплекса могут иметь сходную третичную структуру при низком сходстве первичных. Например, субъединицы альфа и бета протеасомы имеют одинаковую укладку по классификации SCOP и высокий уровень визуального сходства пространственной структуры,

несмотря на уровень идентичности первичной структуры около 15% (Li D. et al., 2010). Также пространственная структура модели a2N хорошо согласуется с предсказанной вторичной структурой и суперспиральными районами а2.

На рис. 7 на модели a2N выделены пептиды, для которых было показано взаимодействие с ARNO, кроме пептида 386-402, который лежит в области, отсутствующей в данной модели. Исходя из имеющихся

следующую последовательность событий: субъединица а2 V-АТФазы связывается с ARNO, что вызывает конформационную перестройку ARNO и его активацию. После этого активированный ARNO связывается с ARF6 и, в свою очередь, активирует его.

ВЫВОДЫ

1. Разработана программа FILTREST3D отбора результатов моделированга белковых структур по соответствию известным экспериментальным данным, позволяющая выделять наиболее достоверные модели.

2. Построены модели пространственной структуры ионных каналов, образованных белком Hlyll (гемолизин II) В. cereus, которые позволяют объяснить экспериментально обнаруженные отличия характеристик проводимости каналов Hlyll, сформированных на мембране, от характеристик проводимости каналов Hlyll, сформированных в растворе, и каналов, образованных альфа-гемолизином S. aureus. Построенная модель С-концевого домена Hlyll имеет структурное сходство с белком CyaY Е. coli.

3. Построена модель пространственной структуры тримера OmpF-подобного белка Y. Pseudotuberculosis. Выбраны районы, потенциально наиболее доступные для связывания антителами: внеклеточные петли L5 (202-213 а.о.), L7 (285-289 а.о) и L8 (321-336 а.о).

4. Построена модель взаимодействия металлопротеазы ТАСЕ и коллагена XVII. Согласно модели, ТАСЕ расщепляет коллаген XVII между остатками Gly539 и Leu540, что согласуется с известным мотивом расщепления субстратов ТАСЕ. Боковой радикал нефосфорилированного остатка Ser542 непосредственно взаимодействует с карманом S3' ТАСЕ.

5. Выявлено сходство пространственных структур белка EtSAGl Е. tenella и семейства белков PR-1 (группа 1 белков, связанных с патогенезом). Охарактеризован район связывания антитела 2Н10ЕЗ.

6. Построены модели пространственных структур аутоингибированной формы белка ARNO, белка ARNO в комплексе с ARF6 и цитоплазматической части изоформы а2 белка а, входящего в состав V-АТФазы. Согласно моделям, взаимодействие ARNO как с ARF6, так и с а2 сопровождается структурными перестройками и предположительно активацией ARNO.

Список работ, опубликованных по теме диссертации Статьи

1. Антонец Д.В., Бакулина А.Ю., Портнягина О.Ю., Сидорова О.В., Новикова О.Д., Максютов А.З. Предсказание антигенно-активных районов OmpF-подобного порина Yersinia pseudotuberculosis // Доклады РАН, 2007, том 414, №4, с. 544-546.

2. Andreeva Z.I., Nesterenko V.F., Fomkina M.G., Temovsky V.I., Suzina N.E., Bakulina A.Y., Solonin A.S., Sineva E.V. The properties of Bacillus cereus hemolysin II pores depend on environmental conditions // Biochim. Biophys. Acta. 2007. V. 1768. № 2. P. 253-263.

3. Zimina E.P., Fritsch A., Schermer В., Bakulina A.Y., Bashkurov M., Benzing Т., Bruckner-Tuderman L. Extracellular phosphorylation of collagen XVII by ecto-casein kinase 2 inhibits ectodomain shedding // J. Biol. Chem. 2007. V. 282. № 31. P. 22737-22746.

4. Jahn D., Matros A., Bakulina A.Y., Tiedemann J., Schubert U., Giersberg M., Haehnel S., Zoufal K., Mock H., Kipriyanov S.M. Model structure of the immunodominant surface antigen of Eimeria tenella identified as a target for sporozoite-neutralizing monoclonal antibody // Parasitol. Res. 2009. V. 105. №3. P. 655-668.

5. Merkulova M., Bakulina A., Thaker Y.R., Griiber G., Marshansky V. Specific motifs of the V-ATPase a2-subunit isoform interact with catalytic, regulatory domains of ARNO // Biochim. Biophys. Acta. 2010. V. 1797. № 8. P. 1398-1409.

Тезисы конференций

1. Gajda M.J., Kaczor M., Bakulina A., Bujnicki J.M. FILTREST3D: program for discrimination of protein structure models that match the restraints from experimental data // 1st International Student Symposium in Computational Biology, Madrid, 2005, P. 87-88.

2. Bakulina A.Yu., Sineva E.V., Solonin A.S., Maksyutov A.Z. Molecular modeling of B. Cereus hemolysin II, a pore-forming protein // Proceedings of the Fifth International Conference on Bioinformatics of Genome Regulation, Structure, Novosibirsk, Russia, July 16-22, 2006, V.l, P. 231-234.

3. Andreeva Z.I., Bakulina A.Y., Nesterenko V.F., Fomkina M.G., Ternovsky V.I., Suzina N.E., Solonin A.S., Sineva E.V. Pore-forming properties of Bacillus cereus hemolysin II: experiments, modeling // Abstracts of the General Meeting of the American Society for Microbiology, 2006, V. 106, P. 30.

Благодарности

Автор выражает благодарность Michal J. Gaida и всему коллективу лаборатории Биоинформатики и конструирования белков польского Международного института молекулярной и клеточной биологии за помощь в освоении принципов и методов молекулярного моделирования, а также Шебалину Виктору Александровичу за моральную поддержку при написании диссертации.

Автор выражает признательность биологам-экспериментаторам, без тесного сотрудничества с которыми было бы невозможно построить осмысленные модели белков:

Елене Синевой, Skaggs School of Pharmacy, Pharmaceutical Science, University of California, San Diego, USA;

Марии Меркуловой, Massachusetts General Hospital, Harvard Medical School, Boston, USA;

Елене Зиминой, University of Toronto, Canada;

Сергею Киприянову, Affitech AS, Oslo, Norway.

А также Нине Опариной (Институт молекулярной биологии им. В.А.Энгельгардта РАН) и Вадиму Волкову (Institute for Health Research, Policy, London Metropolitan University, London) за помощь в редактировании текстов.

Подписано в печать 23.09.2010. Заказ № 91. Формат 60x84/16. Усл. печ. л. 1,0. Тираж 100 экз. Типография Института катализа им. Г.К. Борескова СО РАН

Содержание диссертации, кандидата биологических наук, Бакулина, Анастасия Юрьевна

СПИСОК СОКРАЩЕНИИ.

ВВЕДЕНИЕ.

Глава 1.ОБЗОР ЛИТЕРАТУРЫ.

1.1. Иерархия структурной организаций белков.

1.1.1. Первичная структура.

1.1.2. Вторичная структура.

1.1.3. Супервторичная структура.

1.1.4. Доменная структура.

1.1.5. Третичная структура.

1.1.6. Четвертичная структура.

Ф 1.2. Предсказание белковых структур.

1.2.1. Общие принципы статистических методов предсказания.

1.2.2. Дизайн первичной структуры.

1.2.3. Предсказание вторичной структуры.

1.2.4. Предсказание супер вторичной структуры.

1.2.5. Предсказание доменной структуры.

1.2.6. Предсказание третичной структуры.

1.2.7. Предсказание четвертичной структуры.

1.3. Особенности практического применения методов моделирования третичной структуры белков.

1.3.1. Автоматизация моделирования.

1.3.2. Моделирование мембранных белков. ф 1.3.3. Построение моделей белков и белковых комплексов в сложных случаях.

Глава 2.МЕТОДЫ.

Глава 3.РАЗРАБОТКА ПРОГРАММЫ FILTREST3D.

Глава 4.РЕЗУЛБТАТЫ И ОБСУЖДЕНИЕ.

4.1. Моделирование структуры гемолизина II Bacillus cereus.

4.1.1. Построение модели гептамера Hlyll.

4.1.2. Анализ структуры гептамера Hlyll.

4.1.3. Построение и анализ моделей структур гексамера и октамера Н1у

4.1.4. Построение и анализ модели структуры С-концевого домена Н1у

4.2. Моделирование структуры комплексов металлопротеазы ТАСЕ с субстратами.

4.2.1. Выбор оптимального метода для докинга лигандов к ТАСЕ.

4.2.2. Построение и анализ структуры комплекса ТАСЕ с фрагментом коллагена XVII типа.

4.3. Моделирование структуры OmpF-подобного белка Yersinia pseudotuberculosis.

4.3.1. Построение модели структуры OmpF-подобного белка и выбор перспективных антигенных районов.

4.4. Моделирование структуры белка EtSAGl Eimeria tenella.

4.4.1. Построение модели белка EtSAGl.

4.4.2. Анализ модели белка EtSAGl.

4.5. Моделирование структур белка ARNO человека и предположительно взаимодействующих с ним белков а2 и ARF6.

4.5.1. Построение и анализ моделей структуры белка ARNO.

4.5.2. Построение и анализ модели структуры комплекса ARNO с ARF

4.5.3. Построение и анализ моделей ARNO с экспериментально полученными структурами РВ домена.

4.5.4. Построение и анализ модели белка а2.

4.5.5. Построение модели структуры комплекса ARNO и a2N.

Введение Диссертация по биологии, на тему "Исследование структур мембраноассоциированных белков и белковых комплексов методами молекулярного моделирования"

Для решения многих фундаментальных и прикладных задач современной биологии требуется знание пространственной структуры белков и их комплексов с другими белками, нуклеиновыми кислотами и низкомолекулярными лигандами. В частности, такое знание необходимо для разработки новых лекарственных препаратов, современных вакцин, выбора антигенов для диагностических систем и ряда других актуальных задач. Без определения пространственной организации белков и их комплексов невозможно раскрыть молекулярные механизмы различных биологических процессов. Информация о структуре белка помогает интерпретировать результаты молекулярно-биологических экспериментов и планировать дальнейшие исследования.

В настоящее время известно около 10 миллионов нуклеотидных последовательностей, кодирующих белки. В то же время пространственные структуры экспериментально определены только для 60 тысяч белков. Для подавляющего большинства белков неизвестны ни третичная, ни четвертичная структуры. Еще сложнее ситуация с определением пространственной структуры белковых комплексов: в лучшем случае известны структуры всех белков по отдельности, но не их комплекса. В связи с этим сейчас активно развиваются и совершенствуются методы компьютерной биологии, позволяющие построить модель пространственной структуры белка с известной аминокислотной последовательностью, а также методы предсказания структур белковых комплексов.

Теоретически можно построить модель третичной или четвертичной структуры белка ab initio, исходя из физических законов, описывающих белок как термодинамическую систему. Правильная структура соответствует минимуму свободной энергии белка с учетом его окружения. Однако точное вычисление свободной энергии — крайне ресурсоемкая и недостижимая в настоящее время задача, несмотря на несомненный прогресс в развитии компьютерной техники и алгоритмов (Meirovitch et al., 2009). Поэтому на практике для построения пространственных моделей белков и их комплексов обычно используется моделирование по гомологии. При этом в качестве шаблона используют известные из экспериментов структуры аналогичных белков (Shi et al., 2009). Такой подход основан на том факте, что третичная структура белка в среднем более консервативна, чем первичная (Murzin, 2001). Для белок-белкового докинга и оценки качества моделей используются базирующиеся на статистических данных оценочные функции, которые позволяют упрощенно оценить свободную энергию.

При высокой степени сходства аминокислотных последовательностей шаблона и моделируемого белка, такая процедура не представляет сложности и может быть выполнена современными программами в автоматическом режиме. Если же уровень сходства первичных структур сравниваемых белков невелик, построение адекватной пространственной модели белка становится нетривиальной задачей (Dalton, Jackson., 2007). Также в общем случае нелегко построить достоверную модель структуры белкового комплекса (Vajda, Kozakov, 2009).

Как правило, программы предсказания белковых структур позволяют рассчитать множество допустимых вариантов моделей. В простых случаях можно выбрать наилучшую модель с помощью оценочной функции, аппроксимирующей свободную энергию белка, но в более сложных случаях нельзя полагаться на точность такого подхода (Shi et al., 2009). Поэтому для выбора достоверной модели белка приходится либо сопоставлять результаты расчета с помощью различных оценочных функций (консенсусный подход), либо оценивать модели по согласованности с какими-либо известными экспериментальными данными (селекция моделей).

Для многих белков с неизвестной пространственной структурой имеется какая-то информация об их структуре, полученная экспериментальным путем. Например, расстояние между определенными участками белка или доступность каких-то районов для растворителя. Такие данные можно использовать в качестве критериев для селекции моделей белковых структур. Очевидно, что анализ соответствия множества теоретических моделей этим критериям вручную — процедура трудоемкая и крайне неэффективная. Поэтому представляется актуальной разработка удобного инструмента для автоматизации отбора белковых структур по заданным критериям.

Отметим, что в современных базах данных пространственных структур белков и их комплексов наиболее представлены не столько функционально важные белки, сколько те, пространственные структуры которых легче определить экспериментально. В то время как в большинстве геномов не менее трети генов кодирует мембранные белки, пространственная структура подавляющего большинства из них неизвестна. На долю трансмембранных и ассоциированных с мембраной белков приходятся такие важные функции, как мембранный транспорт и передача сигналов. К этому классу белков относится множество антигенов и некоторые токсины патогенных микроорганизмов. Рецепторы и другие белки, ассоциированные с плазматической мембраной, представляют интерес в качестве потенциальных мишеней лекарственных препаратов. Высокая сложность получения кристаллов мембранных белков делает применение методов молекулярного моделирования для этих белков особенно актуальным. Однако большинство таких методов разрабатывалось для глобулярных белков, поэтому для моделирования структур белков, интегрированных в мембрану или ассоциированных с ней, компьютерные подходы следует применять с осторожностью.

Цели исследования

Целью данной работы было построение и анализ моделей третичной и четвертичной структуры мембраноассоциированных белков человека и патогенных микроорганизмов. Задачи исследования

• Разработка программы отбора моделей белковых структур по заданным критериям.

• Построение моделей структур гексамера, гептамера и октамера гемолизина II (Hlyll) Bacillus cereus, анализ структур ионных каналов, образованных олигомерами Hlyll, и предсказание функции С-концевого домена Hlyll.

• Построение и анализ модели • структуры комплекса человеческой металлопротеазы ТАСЕ с субстратом коллагеном XVII типа.

• Построение модели структуры тримера OmpF-подобного белка Yersinia pseudotuberculosis и выбор районов, наиболее доступных для связывания антител.

• Построение модели пространственной структуры гликопротеина SAG1 Eimeria tenella и идентификация района связывания моноклонального антитела 2Н10ЕЗ.

• Построение и анализ моделей пространственных структур аутоингибированной и активной конформации человеческих белков ARNO, ARF6, изоформы а2 субъединицы а V-АТФазы, комплексов ARNO с ARF6, ARNO с а2.

Научная новизна работы

Была разработана программа FILTREST3D, впервые позволяющая в удобном для пользователя виде задавать ограничения для селекции результатов моделирования белковых структур. Программа предназначена для отбора структур, соответствующих известным экспериментальным данным, и таким образом помогает получать достоверные модели белковых структур в сложных случаях моделирования.

Впервые получены модели структур гептамерной мембранной поры белка Hlyll Bacillus cereus и С-концевого домена этого белка. Впервые рассмотрена возможность существования гексамерной и октамерной форм мембранных пор и построены модели их четвертичных структур. Впервые построена модель структуры OmpF-подобного белка Y. pseudotuberculosis. Впервые построены модели, описывающие взаимодействие металлопротеазы человека ТАСЕ с субстратами ФНО (фактором некроза опухолей) и коллагеном XVII типа. Впервые построена модель структуры белка EtSAGl Е. tenella. Впервые построены модели пространственных структур следующих белков человека: ARNO с СС доменом, ARNO с фосфорилированным и нефосфорилированным доменом РВ, ARNO в комплексе с ARF6, N-концевого фрагмента изоформы а2 субъединицы а V-АТФазы.

Теоретическая и практическая значимость работы

Программа FILTREST3D использовалась в практической работе различными исследователями и в данный момент доступна по адресу http://filtrest3d.genesilico.pl/filtrest3d/index.html.

Построенные модели белковых структур имеют как теоретическую ценность, поскольку позволяют понимать молекулярные механизмы биологических процессов, так и практическую. Модель структуры ионного канала Hlyll используется для конструирования его ингибиторов на основе циклодекстринов. С помощью модели структуры OmpF были выбраны районы, на основе которых будут сконструированы иммуногены для защиты против Y. pseudotuberculosis. Модель структуры белка EtSAGl была использована для определения сайта связывания антитела 2Н10ЕЗ, в дальнейшем она может быть использована для характеризации других антител и для выбора антигенов на базе этого белка.

Апробация работы

Результаты работы были представлены на конференциях: lst International Student Symposium in Computational Biology, Madrid,

2005.

ISMB (Intelligent Systems for Molecular Biology) annual meeting, 2005, Michigan, USA.

14th Annual International Conference On Intelligent Systems For Molecular Biology, Fortaleza, Brazil, 2006.

5th International Conference on Bioinformatics of Genome Regulation and Structure, Novosibirsk, 2006.

American Society for Microbiology, 106ül General Meeting, Orlando, 2006.

Конференции молодых ученых и специалистов ФГУН ГНЦ ВБ «Вектор», 2009, Новосибирск.

Публикации

По материалам работы было опубликовано 5 статей в реферируемых научных журналах.

Структура работы

Диссертация изложена на 127 страницах текста и состоит из введения, 4 глав, заключения и списка литературы. Содержит 3 таблицы и 45 иллюстраций.

Заключение Диссертация по теме "Молекулярная биология", Бакулина, Анастасия Юрьевна

выводы

1. Разработана программа FILTREST3D отбора результатов моделирования белковых структур по соответствию известным экспериментальным данным, позволяющая выделять наиболее достоверные модели.

2. Построены модели пространственной структуры ионных каналов, образованных белком Hlyll (гемолизин II) В. cereus, которые позволяют объяснить экспериментально обнаруженные отличия характеристик проводимости каналов Hlyll, сформированных на мембране, от характеристик проводимости каналов Hlyll, сформированных в растворе, и каналов, образованных альфа-гемолизином S. aureus. Построенная модель С-концевого домена Hlyll имеет структурное сходство с белком CyaY Е. coli.

3. Построена модель пространственной структуры тримера OmpF-подобного белка Y. Pseudotuberculosis. Выбраны районы, потенциально наиболее доступные для связывания антителами: внеклеточные петли L5 (202-213 а.о.), L7 (285-289 а.о) иЬ8 (321-336 а.о).

4. Построена модель взаимодействия металлопротеазы ТАСЕ и коллагена XVII. Согласно модели, ТАСЕ расщепляет коллаген XVII между остатками Gly539 и Leu540, что согласуется с известным мотивом расщепления субстратов ТАСЕ. Боковой радикал нефосфорилированного остатка Ser542 непосредственно взаимодействует с карманом S3' ТАСЕ.

5. Выявлено сходство пространственных структур белка EtSAGl Е. tenella и семейства белков PR-1 (группа 1 белков, связанных с патогенезом). Охарактеризован район связывания антитела 2Н10ЕЗ.

6. Построены модели пространственных структур аутоингибированной формы белка ARNO, белка ARNO в комплексе с

ARF6 и цитоплазматической части изоформы а2 белка а, входящего в состав V-АТФазы. Согласно моделям, взаимодействие ARNO как с ARF6, так и с а2 сопровождается структурными перестройками и предположительно активацией ARNO.

Благодарности

Автор выражает благодарность Michal J. Gaida и всему коллективу лаборатории Биоинформатики и конструирования белков польского Международного института молекулярной и клеточной биологии за помощь в освоении принципов и методов молекулярного моделирования, а также Шабалину Виктору Александровичу за моральную поддержку при написании диссертации.

Автор выражает признательность биологам-экспериментаторам^, без тесного сотрудничества с которыми было бы невозможно построить осмысленные модели белков:

Елене Синевой, Skaggs School of Pharmacy, Pharmaceutical Science, University of California, San Diego, USA;

Марии Меркуловой, Massachusetts General Hospital, Harvard Medical School, Boston, USA;

Елене Зиминой, University of Toronto, Canada;

Сергею Киприянову, Affitech AS-, Oslo, Norway.

ЗАКЛЮЧЕНИЕ

Несмотря на развитие методов экспериментального определения пространственной структуры белков и белковых комплексов, пока требуемых структур гораздо больше, чем определенных экспериментально, и этот разрыв имеет тенденцию к увеличению. В этой ситуации методы молекулярного моделирования выступают как полноправный исследовательский инструмент молекулярной биологии, позволяющий как объяснять имеющиеся факты, так и выдвигать обоснованные гипотезы для экспериментальной проверки.

В настоящей работе представлены результаты моделирования и анализа структуры для нескольких моделей белков и белковых комплексов, построенных с использованием широкого спектра современных методов молекулярного моделирования, включая разработанную нами программу Р1ЫТ1Е8ТЗВ. Все модели были построены впервые. Для большинства моделей их построение являлось достаточно сложной и нестандартной задачей. Сопоставление результатов различных методов, проверка согласования с экспериментально полученными данными, тесное общение с исследователями, изучающими эти белки, позволило создать модели достаточно высокого уровня достоверности. С помощью построенных моделей были объяснены некоторые интересные экспериментально полученные результаты, выбрано направление для дальнейшей экспериментальной работы.

Построение моделей гексамерной и октамерной форм ионного канала белка Н1у11 позволило объяснить гетерогенность наблюдаемых свойств каналов, сформированных на мембране. Модель ионного канала Н1у11 в данный момент используется для конструирования его ингибиторов на основе циклодекстринов. Также планируется изучение возможной роли С-концевого домена Н1у11 в связывании железа

Модель взаимодействия металлопротеазы ТАСЕ с коллагеном XVII типа позволяет уточнить положение сайта расщепления коллагена XVII типа и роль отдельных аминокислотных остатков в окрестности сайта расщепления, помогает понять молекулярный механизм влияния фосфорилирования коллагена XVII типа на его расщепление ТАСЕ.

С помощью модели тримера OmpF были выбраны районы, на основе которых будут сконструированы иммуногены для защиты против Y. pseudotuberculosis.

Модель белка EtSAGl была использована для определения сайта связывания антитела 2Н10ЕЗ. Возможная принадлежность EtSAGl к классу PR-1-подобных белков открывает новые возможности в его исследовании, в частности, требует проверки его способность мимикрировать цитокины. Модель EtSAGl в дальнейшем может быть использована для характеризации других антител и для выбора антигенов на базе этого белка для диагностики и вакцинации.

Моделирование белков ARNO, а2 и ARF6 позволило предположить влияние взаимодействия ARNO с а2 и ARF6 на активацию ARNO, а также возможную роль фосфорилирования ARNO. Это помогает понять молекулярные механизмы функционирования V-АТФазы в качестве рН-сенсора.

Библиография Диссертация по биологии, кандидата биологических наук, Бакулина, Анастасия Юрьевна, Кольцово

1. Антонец Д.В., Бакулина А.Ю., Портнягина О.Ю., Сидорова О.В., Новикова О.Д., Максютов А.З. Предсказание антигенно-активных районов OmpF-подобного порина Yersinia pseudotuberculosis // Доклады РАН. 2007. V. 414. № 4. Р. 544-546.

2. Тимченко Н.Ф., Новикова О.Д., Павлова Г.Н., Венедиктов B.C., Соловьева Т.Ф. Протективные свойства порина из внешней мембраны Yersinia pseudotuberculosis // Журн. микробиол. 1990. № 11. Р. 48-50.

3. Финкелыитейн А.В., Птицын О.Б. Физика белка. Курс лекций. М.: Книжный Дом Университет , 2002.

4. Шульц Г.Е., Ширмер Р.Х. Принципы структурной организации белков. М: Мир, 1982.

5. Achouak W., Heulin Т., Pages J.M. Multiple facets of bacterial porins // FEMS Microbiol. Lett. 2001. V. 199. № 1. P. 1-7.

6. Aksimentiev A., Schulten K. Imaging alpha-hemolysin with molecular dynamics: ionic conductance, osmotic permeability, and the electrostatic potential map // Biophys. J. 2005. V. 88. № 6. P. 3745-3761.

7. Allen P.C., Fetterer R.H. Recent advances in biology and immunobiology of Eimeria species and in diagnosis and control of infection with these coccidian parasites of poultry // Clin. Microbiol. Rev. 2002. V. 15. № 1. P. 58-65.

8. Almén M.S., Nordstrom K.J.V., Fredriksson R., Schioth H.B. Mapping the human membrane proteome: a "majority of the human membrane proteins can be classified according to function and evolutionary origin // BMC Biol. 2009. V. 7. P. 50.

9. Altschul S.F., Madden T.L., Schäffer A.A., Zhang J., Zhang Z., Miller W., Lipman D.J. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs // Nucleic Acids Res. 1997. V. 25. № 17. P. 3389-3402.

10. Andreeva A., Howorth D., Chandonia J., Brenner S.E., Hubbard T.J.P., Chothia C., Murzin A.G. Data growth and its impact on the SCOP database: new developments // Nucleic Acids Res. 2008. V. 36. P. D419-25.

11. Andreeva Z.I., Nesterenko V.F., Yurkov I.S., Budarina Z.I., Sineva E.V., Solonin A.S. Purification and cytotoxic properties of Bacillus cereus hemolysin II // Protein Expr. Purif. 2006. V. 47. № 1. P. 186-193.

12. Arnold K., Kiefer F., Kopp J., Battey J.N.D., Podvinec M., Westbrook J.D., Berman H.M., Bordoli L., Schwede T. The Protein Model Portal // J. Struct. Funct. Genomics. 2009. V. 10.№ 1. P. 1-8.

13. Bagos P.G., Liakopoulos T.D., Hamodrakas S.J. Evaluation of methods for predicting the topology of beta-barrel outer membrane proteins and a consensus prediction method // BMC Bioinformatics. 2005. V. 6. P. 7.

14. Bagos P.G., Liakopoulos T.D., Spyrop.oulos I.C., Hamodrakas S.J. PRED-TMBB: a web server for predicting the topology of beta-barrel outer membrane proteins // Nucleic Acids Res. 2004. V. 32. P. W400-4.

15. Baida G.E., Kuzmin N.P. Mechanism of action of hemolysin III from Bacillus cereus // Biochim. Biophys. Acta. 1996. V. 1284. № 2. P. 122-124.

16. Bigelow H.R., Petrey D.S., Liu J., Przybylski D., Rost B. Predicting transmembrane beta-barrels in proteomes // Nucleic Acids Res. 2004. V. 32. № 8. P. 2566-2577.

17. Black R.A. Tumor necrosis factor-alpha converting enzyme // Int. J. Biochem. Cell Biol. 2002. V. 34. № 1. P. 1-5.

18. Blobel C.P. Remarkable roles of proteolysis on and beyond the cell surface // Curr. Opin. Cell Biol. 2000. V. 12. № 5. P. 606-612.

19. Bourne H.R., Sanders D.A., McCormick F. The GTPase superfamily: a conserved switch for diverse cell functions // Nature. 1990. V. 348. № 6297. P. 125-132.

20. Bower M.A., Constant S.L., Mendez S. Necator americanus: the Na-ASP-2 protein secreted by the infective larvae induces neutrophil recruitment in vivo and in vitro // Exp. Parasitol. 2008. V. 118. № 4. P. 569-575.

21. Bowie J.U. Helix-bundle membrane protein fold templates // Protein Sci. 1999. V. 8. № 12. P. 2711-2719.

22. Braha O., Walker B., Cheley S., Kasianowicz J.J., Song L., Gouaux J.E., Bayley H. Designed protein pores as components for biosensors // Chem. Biol. 1997. V. 4. № 7. P. 497-505.

23. Caiazza N., O'Toole G. Alpha-toxin is required for biofilm formation by Staphylococcus aureus // J. Bacteriol. -2003. V. 185. № 10. P. 3214-3217.

24. Casanova J.E. Regulation of Arf activation: the Sec7 family of guanine nucleotide exchange factors // Traffic. 2007. V. 8. № 11. P. 1476-1485.

25. Chiang Y., Gelfand T.I., Kister A.E., Gelfand I.M. New classification of supersecondary structures of sandwich-like proteins uncovers strict patterns of strand assemblage // Proteins. 2007. V. 68. № 4. P. 915-921.

26. Christ D., Winter G. Identification of protein domains by shotgun proteolysis // J. Mol. Biol. 2006. V. 358. № 2. P. 364-371.

27. Cohen L.A., Honda A., Varnai P., Brown F.D., Balla T., Donaldson J.G. Active Arf6 recruits ARNO/cytohesin GEFs to the PM by binding their PH domains // Mol. Biol. Cell. 2007. V. 18. № 6. P. 2244-2253.

28. Cuthbertson J.M., Doyle D.A., Sansom M.S.P. Transmembrane helix prediction: a comparative evaluation and analysis // Protein Eng. Des. Sei. 2005. V. 18. №6. P. 295-308.

29. D'Souza-Schorey C., Chavrier P. ARF proteins: roles in membrane traffic and beyond //Nat. Rev. Mol. Cell Biol. 2006. V. 7. № 5. P. 347-358.

30. Dalloul RA., Lillehoj H.S. Poultry coccidiosis: recent advancements in control measures and vaccine development // Expert Rev Vaccines. 2006. V. 5. № l.P. 143-163.

31. Dalton J.A.R., Jackson R.M. An evaluation of automated homology modelling methods at low target template sequence similarity // Bioinformatics. 2007. V. 23. № 15. P. 1901 -1908.

32. Denessiouk K.A., Johnson M.S. "Acceptor-donor-acceptor" motifs recognize the Watson-Crick, Hoogsteen and Sugar "donor-acceptor-donor" edges of adenine and adenosine-containing ligands // J. Mol. Biol. 2003. V. 333. № 5. P. 1025-1043.

33. Dominguez C., Boelens R., Bonvin A.M.J J. HADDOCK: a proteinprotein docking approach based on biochemical or biophysical information // J. Am. Chem. Soc. 2003. V. 125. № 7. P. 1731-1737.

34. Donaldson J.G., Klausner R.D. ARF: a key regulatory switch in membrane traffic and organelle structure // Curr. Opin. Cell Biol. 1994. V. 6. № 4. P. 527-532.

35. Drobniewski F.A. Bacillus cereus and related species // Clin. Microbiol. Rev. 1993. V. 6. № 4. P. 324-338.

36. Drory O., Mor A., Frolow F., Nelson N. Expression, crystallization and phasing of vacuolar H(+)-ATPase subunit C (Vma5p) of Saccharomyces cerevisiae // Acta Crystallogr. D Biol. Crystallogr. 2004. V. 60. № Pt 10. P. 1906-1909.

37. Edgar R. MUSCLE: multiple sequence alignment with high accuracy and high throughput // Nucleic Acids Res. 2004. V. 32. № 5. P. 1792-1797.

38. Eisenberg D., Liithy R., Bowie J.U. VERIFY3D: assessment of protein models with three-dimensional profiles // Meth. Enzymol. 1997. V. 277. P. 396-404.

39. Ekins S., Mestres J., Testa B. In silico pharmacology for drug discovery: applications to targets and beyond // Br. J. Pharmacol. 2007. V. 152. № 1. P. 21-37.

40. Fagerlund A., Ween O., Lund T., Hardy S., Granum P. Genetic and functional analysis of the cytK family of genes in Bacillus cereus // Microbiology. 2004. V. 150. № Pt 8. P. 2689-2697.

41. Fan H., Mark A.E. Refinement of homology-based protein structures by molecular dynamics simulation techniques // Protein Sci. 2004. V. 13. № l.P. 211-220.

42. Fernandez-Fuentes N., Oliva B., Fiser A. A supersecondary structure library and search algorithm for modeling loops in protein structures // Nucleic Acids Res. 2006. V. 34. № 7. P. 2085-2097.

43. Fernández-Recio J., Totrov M., Abagyan R. ICM-DISCO docking by global energy optimization with fully flexible side-chains // Proteins. 2003. V. 52. № l.P. 113-117.

44. Fischer D. Hybrid fold recognition: combining sequence derived properties with evolutionary information // Pac Symp Biocomput. 2000. V. .P. 119-130.

45. Fiser A., Sali A. ModLoop: automated modeling of loops in protein structures // Bioinformatics. 2003. V. 19. № 18. P. 2500-2501.

46. Forgac M. Vacuolar ATPases: rotary proton pumps in physiology and pathophysiology // Nat. Rev. Mol. Cell Biol. 2007. V. 8. № 11. P. 917-929.

47. Franzke C., Bruckner P., Bruckner-Tuderman L. Collagenous transmembrane proteins: recent insights into biology and pathology // J. Biol. Chem. 2005. V. 280. № 6. P. 4005-4008.

48. Franzke C., Tasanen K., Borradori L., Huotari V., Bruckner-Tuderman L. Shedding of collagen XVII/BP180: structural motifs influence cleavage from cell surface // J. Biol. Chem. 200.4. V. 279. № 23. P. 24521-24529.

49. Frishman D., Argos P. Knowledge-based protein secondary structure assignment // Proteins. 1995. V. 23. № 4. P. 566-579.

50. Gabant G., Auxilien S., Tuszynska I., Locard M., Gajda M.J., Chaussinand G., Fernandez B., Dedieu A., Grosjean H., Golinelli

51. Pimpaneau B., Bujnicki J.M., Armengaud J. THUMP from archaeal tRNA:m22G10 methyltransferase, a genuine autonomously folding domain //Nucleic Acids Res. 2006. V. 34. № 9. P. 2483-2494.

52. Golovin A., Henrick K. MSDmotif: exploring protein sites and motifs // BMC Bioinformatics. 2008. V. 9. P. 312.

53. Gouaux E. alpha-Hemolysin from Staphylococcus aureus: an archetype of beta-barrel, channel-forming toxins // J. Struct. Biol. 1998. V. 121. № 2. P. 110-122.

54. Gouaux E., Hobaugh M., Song L. alpha-Hemolysin, gamma-hemolysin, and leukocidin from Staphylococcus aureus: distant in sequence but similar in structure // Protein Sci. 1997- V. 6. № 12. P. 2631-2635.

55. Granum P.E. Bacillus cereus //Food Microbiology. Fundamentals and Frontiers. M. Doyle LB&TM (Ed. M. Doyle, L. Beuchat & T. Montville). 2001. P. 373-381.

56. Gray J J., Moughon S., Wang C., Schueler-Furman O., Kuhlman B., Rohl C.A., Baker D. Protein-protein docking with simultaneous optimization of rigid-body displacement and side-chain conformations // J. Mol. Biol. 2003. V. 331. № 1. p. 281-299.

57. Gribenko A.V., Patel M.M., Liu J., McCallum S.A., Wang C., Makhatadze G.I. Rational stabilization of enzymes by computationalredesign of surface charge-charge interactions // Proc. Natl. Acad. Sei. m U.S.A. 2009. V. 106. № 8. P. 2601-2606.

58. Gribskov M., McLachlan A.D., Eisenberg D. Profile analysis: detection of distantly related proteins // Proc. Natl. Acad. Sei. U.S.A. 1987. V. 84. № 13. P. 4355-4358.

59. De novo design of a non-natural fold for an iron-sulfur protein: alpha-helical coiled-coil with a four-iron four-sulfur cluster binding site in its central core //Biochim. Biophys. Acta!'2010. V. 1797. № 3. P. 406-413.

60. Guex N., Peitsch M.C. SWISS-MODEL and the Swiss-PdbViewer: an environment for comparative protein modeling // Electrophoresis. 1997. V. 18. № 15. P. 2714-2723.

61. Harvie D.R., Vilchez S., Steggles J.R., Ellar DJ. Bacillus cereus Fur regulates iron metabolism and is required for full virulence // Microbiology. 2005. V. 151. № Pt 2. P. 569-577.

62. Hu X., Balaz S., Shelver W.H. A practical approach to docking of zinc metalloproteinase inhibitors // J. Mol. Graph. Model. 2004. V. 22. № 4. P. 293-307.

63. Hu X., Shelver W.H. Docking studies of matrix metalloproteinase inhibitors: zinc parameter optimization to improve the binding free energy prediction // J. Mol. Graph. Model. 2003. V. 22. № 2. P. 115-126.

64. Hubbard S.J. The structural aspects of limited proteolysis of native proteins // Biochim. Biophys. Acta. 1998. V. 1382. № 2. P. 191-206.

65. Humphrey W., Dalke A., Schulten K. VMD: visual molecular dynamics // J Mol Graph. 1996. V. 14. № 1. p. 33:8, 27-8.

66. Inoue T., Forgac M. Cysteine-mediated cross-linking indicates that subunit C of the V-ATPase is in close proximity to subunits E and G of the VI domain and subunit a of the V0 domain // J. Biol. Chem. 2005. V. 280. № 30. P. 27896-27903.

67. Commission on Biochemical Nomenclature (CBN). Abbreviations and symbols for nucleic acids, polynucleotides and their constituents. Recommendations 1970 //Biochem. J. 1970. V. 120. № 3. P. 449-454.

68. Jaroszewski L., Rychlewski L., Godzik A. Improving the quality of twilight-zone alignments //Protein Sci. 2000. V. 9. № 8. P. 1487-1496.

69. Jaroszewski L., Rychlewski L., Li Z., Li W., Godzik A. FFAS03: a server for profile—profile sequence alignments // Nucleic Acids Res. 2005. V. 33. № Web Server issue. P. W284-8.

70. Jin Lee Y. Mass spectrometric analysis of cross-linking sites for the structure of proteins and protein complexes //Mol Biosyst. 2008. V. 4. № 8. P. 816-823.

71. Jones D.T. Protein secondary structure prediction based ori position-specific scoring matrices // J. Mol. Biol. 1999. V. 292. № 2. P. 195-202.

72. Juretic D., Zoranic L., Zucic D. Basic charge clusters and predictions of membrane protein topology // J Chem Inf Comput Sci. 2002. V. 42. № 3. P. 620-632.

73. Kabsch W., Sander C. Dictionary of protein secondary structure: pattern recognition of hydrogen-bonded and geometrical features // Biopolymers. 1983. V. 22. № 12. P. 2577-2637.

74. Karplus K., Karchin R., Draper J., Casper J., Man del- Gutfr eund Y., Diekhans M., Hughey R. Combining local-structure, fold-recognition, and new fold methods for protein structure prediction // Proteins. 2003. V. 53 Suppl 6. P. 491-496.

75. Kaufmann K.W., Lemmon G.H., Deluca S.L., Sheehan J.H., Meiler J. Practically useful: what the Rosetta protein modeling suite can do for you//Biochemistry. 2010. V. 49. № 14. P. 2987-2998.

76. Kecman V. Learning and Soft Computing. Support Vector Machines, Neural Networks, and Fuzzy Logic Models. . The MIT Press, 2001.

77. Kelley L.A., MacCallum R.M., Sternberg M.J. Enhanced genome annotation using structural profiles in the program 3D-PSSM // J. Mol. Biol. 2000. V. 299. № 2. P. 499-520.

78. Kennedy C.L., Krejany E.O., Young.L.F., O'Connor J.R., Awad M.M., Boyd R.L., Emmins J.J., Lyras D., Rood J.I. The alpha-toxin of Clostridium septicum is essential for virulence // Mol. Microbiol. 2005. V. 57. № 5. P. 1357-1366.

79. Kester W.R., Matthews B.W. Crystallographic study of the binding of dipeptide inhibitors to thermolysin: implications for the mechanism of catalysis //Biochemistry. 1977. V. 16. № 11. P. 2506-2516.

80. Kiefer J.R., Mao C., Hansen C.J., Basehore S.L., Hogrefe H.H., Braman J.C., Beese L.S. Crystal structure of a thermostable Bacillus DNA polymerase I large fragment at 2.1 A resolution // Structure. 1997. V. 5. № l.P. 95-108.

81. Kirillova S., Kumar S., Carugo O. Protein domain boundary predictions: a structural biology perspective // Open Biochem J. 2009. V. 3. P. 1-8.

82. Krivov G.G., Shapovalov M.V., Dunbrack R.L.J. Improved prediction of protein side-chain conformations with SCWRL4 // Proteins. 2009. V. 77. № 4. P. 778-795.

83. Krogh A., Larsson B., von Heijne G., Sonnhammer E.L. Predicting transmembrane protein topology with a hidden Markov model: application to complete genomes // J. Mol. Biol. 2001. V. 305. № 3. P. 567-580.

84. Kuhlman B., Dantas G., Ireton G.C., Varani G., Stoddard B.L., Baker D. Design of a novel globular protein fold with atomic-level accuracy // Science. 2003. V. 302. № 5649. P. 1364-1368.

85. Kurowski M.A., Bujnicki J.M. GeneSilico protein structure prediction meta-server //Nucleic Acids Res. 2003. V. 31. № 13. P. 3305-3307.

86. Kusharyoto W., Pleiss J., Bachmann T.T., Schmid R.D. Mapping of a hapten-binding site: molecular modeling and site-directed mutagenesis study of an anti-atrazine antibody // Protein Eng. 2002. V. 15. № 3. P. 233-241.

87. Laskowski R.A., MacArthur M.W., Moss D.S., Thornton J.M. PROCHECK: A program to check the stereochemical quality of protein structures // J. Appl. Crystallogr. 1993. V. 26. P. 283-291.

88. Leader D.P., Milner-White E.J. Motivated proteins: a web application for studying small three-dimensional protein motifs // BMC Bioinformatics. 2009. V. 10. P. 60.

89. Levin J.I., Chen J.M., Laakso L.M., Du M., Schmid J., Xu W., Cummons T., Xu J., Jin G., Barone D., Skotnicki J.S. Acetylenic TACE inhibitors. Part 3: Thiomorpholine sulfonamide hydroxamates // Bioorg. Med. Chem. Lett. 2006. V. 16. № 6. P. 1605-1609.

90. Levy E.D., Pereira-Leal J.B., Chothia C., Teichmann S.A. 3D complex: a structural classification of protein complexes // PLoS Comput. Biol. 2006. V. 2. № 11. P. el55.

91. Linderstrom-Lang K.U. Lane Medical Lectures. . Stanford University Press, 1952.

92. Liu S., Zhang C., Liang S., Zhou Y. Fold recognition by concurrent use of solvent accessibility and residue depth // Proteins. 2007. V. 68. № 3. P. 636-645.

93. Lopez-Mendez B., Guntert P. Automated protein structure determination from NMR spectra // J. Am. Chem. Soc. 2006. V. 128. № 40. P. 13112-13122.

94. Lund Т., De Buyser M.L., Granum P.E. A new cytotoxin from Bacillus cereus that may cause necrotic enteritis // Mol. Microbiol. 2000. V. 38. № 2. P. 254-261.

95. Lupas A., Van Dyke M., Stock J. Predicting coiled coils from protein sequences // Science. 1991a. V. 252. № 5010. P. 1162-1164.

96. Marshansky V. The V-ATPase a2-subunit as a putative endosomal pH-sensor //Biochem. Soc. Trans. 2007. V. 35. № Pt 5. P. 1092-1099.

97. Marshansky V., Futai M. The V-type H+-ATPase in vesicular trafficking: targeting, regulation and function // Curr. Opin. Cell Biol. 2008. V. 20. № 4. P. 415-426.

98. Martelli P.L., Fariselli P., Krogh A., Casadio R. A sequence-profile-based HMM for predicting and discriminating beta barrel membrane proteins //Bioinformatics. 2002. V. 18 Suppl 1. P. S46-53.

99. McGuffin L.J., Jones D.T. Improvement of the GenTHREADER method for genomic fold recognition // Bioinformatics. 2003. V. 19. № 7. P. 874-881.

100. Meirovitch H., Cheluvaraja S., White R.P. Methods for calculating the entropy and free energy and their application to problems involving protein flexibility and ligand binding // Curr. Protein Pept. Sci. 2009. V. 10. №3. P. 229-243.

101. Melo F., Sali A. Fold assessment for comparative protein structure modeling // Protein Sci. 2007. V. 16. № 11. P. 2412-2426.

102. Merkulova M., Bakulina A., Thaker Y.R., Griiber G., Marshansky V. Specific motifs of the V-ATPase a2-subunit isoform interact with catalytic and regulatory domains of ARNO // Biochim. Biophys. Acta. 2010. V. 1797. № 8. P. 1398-1409.

103. Miles G., Bayley H., Cheley S. Properties of Bacillus cereus hemolysin II: a heptameric transmembrane pore // Protein Sci. 2002. V. 11. № 7. P. 1813-1824.

104. Morea V., Lesk A.M., Tramontano A. Antibody modeling: implications for engineering and design // Methods. 2000. V. 20. № 3. P. 267-279.

105. Morris G.M., Huey R., Lindstrom W., Sanner M.F., Belew R.K., Goodsell D.S., Olson A.J. AutoDock4 and AutoDockTools4: Automated docking with selective receptor flexibility // J Comput Chem. 2009. V. 30. №16. P. 2785-2791.

106. Morris G.M., Huey R., Olson A.J. Using AutoDock for ligand-receptor docking // Curr Protoc Bioinformatics. 2008. V. Chapter 8. P. Unit 8.14.

107. Moult J. A decade of CASP: progress, bottlenecks and prognosis in protein structure prediction // Curr. Opin. Struct. Biol. 2005. V. 15. № 3. P. 285-289.

108. Muench S.P., Huss M., Song C.F., Phillips C., Wieczorek H., Trinick J., Harrison M.A. Cryo-electron microscopy of the vacuolar ATPase motor reveals its mechanical and regulatory -complexity // J. Mol. Biol. 2009. V. 386. № 4. P. 989-999.

109. Murzin A.G. Progress in protein structure prediction // Nat. Struct. Biol. 2001. V. 8. №2. P. 110-112.

110. Murzin A.G., Lesk A.M., Chothia C. Principles determining the structure of beta-sheet barrels in proteins. I. A theoretical analysis // J. Mol. Biol. 1994a. V. 236. № 5. P. 1369-1381.

111. Murzin A.G., Lesk A.M., Chothia C. Principles determining the structure of beta-sheet barrels in proteins. II. The observed structures // J. Mol. Biol. 1994b. V. 236. № 5. P. 1382-1400.

112. Nishizawa Y., Uematsu J., Owaribe K. HD4, a 180 kDa bullous pemphigoid antigen, is a major transmembrane glycoprotein of the hemidesmosome // J Biochem. 1993. V. 113. № 4. P. 493-501.

113. Noireaux V., Libchaber A. A vesicle bioreactor as a step toward an artificial cell assembly // Proc. Natl. Acad. Sci. U.S.A. 2004. V. 101. № 51. P. 17669-17674.

114. Norgett E.E., Borthwick K.J., Al-Lamki R.S., Su Y., Smith A.N., Karet F.E. VI and V0 domains of the human H+-ATPase are linked by an interaction between the G and a subunits // J. Biol. Chem. 2007. V. 282. № 19. P. 14421-14427.

115. Persson B., Argos P. Prediction of membrane protein topology utilizing multiple sequence alignments // J. Protein Chem. 1997. V. 16. № 5. P. 453-457.

116. Pettersen E.F., Goddard T.D., Huang C.C., Couch G.S., Greenblatt D.M., Meng E.C., Ferrin T.E. UCSF Chimera--a visualization system for exploratory research and analysis // J Comput Chem. 2004. V. 25. № 13. P. 1605-1612.

117. Phale P.S., Philippsen A., Widmer C., Phale V.P., Rosenbusch J.P., Schirmer T. Role of charged residues at the OmpF porin channel constriction probed by mutagenesis and simulation // Biochemistry. 2001. V. 40. №21. P. 6319-6325.

118. Pierce B., Tong W., Weng Z. M-ZDOCK: a grid-based approach for Cn symmetric multimer docking // Bioinformatics. 2005. V. 21. № 8. P. 1472-1478.

119. Poleksic A., Fienup M. Optimizing the size of the sequence profiles to increase the accuracy of protein sequence alignments generated by profile-profile algorithms // Bioinformatics. 2008. V. 24. № 9. P. 1145-1153.

120. Promdonkoy B., Ellar DJ. Investigation of the pore-forming mechanism of a cytolytic delta-endotoxin from Bacillus thuringiensis // Biochem. J. 2003. V. 374. № Pt 1. P. 255-259.

121. Punta M., Forrest L.R., Bigelow H., Kernytsky A., Liu J., Rost B. Membrane protein prediction methods // Methods. 2007. V. 41. № 4. P. 460-474.

122. Purta E., Kaminska K.H., Kasprzak J.M., Bujnicki J.M., Douthwaite S. YbeA is the m3Psi methyltransferase RlmH that targets nucleotide 1915 in 23S rRNA // RNA. 2008. V. 14. № 10. P. 2234-2244.

123. Qi J., Forgac M. Function and subunit interactions of the N-terminal domain of subunit a (Vphlp) of the yeast V-ATPase // J. Biol. Chem. 2008. V. 283. № 28. P. 19274-19282.'

124. Reddy C.S., Vijayasarathy K., Srinivas E., Sastry G.M., Sastry G.N. Homology modeling of membrane proteins: a critical assessment // Comput Biol Chem. 2006. V. 30. № 2. P. 120-126.

125. Repsys V., Margelevicius M., Venclovas C. Re-searcher: a system for recurrent detection of homologous protein sequences // BMC Bioinformatics. 2008. V. 9. P. 296.

126. Rohl C.A., Strauss C.E.M., Misura K.M.S., Baker D. Protein structure prediction using Rosetta // Meth. Enzymol. 2004. V. 383. P. 66-93.

127. Roy A., Kucukural A., Zhang Y. I-TASSER: a unified platform for automated protein structure and function prediction // Nat Protoc. 2010. V. 5. № 4. P. 725-738.

128. Sali A., Blundell T.L. Comparative protein modelling by satisfaction of spatial restraints // J. Mol. Biol. 1993.-V. 234. № 3. P. 779-815.

129. Santy L.C., Casanova J.E. Activation of ARF6 by ARNO stimulates epithelial cell migration through downstream activation of both Racl and phospholipase D // J. Cell Biol. 2001. V. 154. № 3. P. 599-610.

130. Santy L.C., Frank S.R., Hatfield J.C., Casanova J.E. Regulation of ARNO nucleotide exchange by a PH domain electrostatic switch // Curr. Biol. 1999. V. 9. №20. P. 1173-1176.

131. Schneidman-Duhovny D., Nussinov R., Wolfson H.J. Automatic prediction of protein interactions with large scale motion // Proteins. 2007. V. 69. № 4. P. 764-773.

132. Shen Y., Brenke R., Kozakov D., Comeau S.R., Beglov D., Vajda S. Docking with PIPER and refinement with SDU in rounds 6-11 of CAPRI // Proteins. 2007. V. 69. № 4. P. 734-742.

133. Shi J., Blundell T.L., Mizuguchi K. FUGUE: sequence-structure homology recognition using environment-specific substitution-tables and structure-dependent gap penalties // J. Mol. Biol. 2001. V. 310. № 1. P. 243-257.

134. Shi S., Pei J., Sadreyev R.I., Kinch L.N., Majumdar I., Tong J., Cheng H., Kim B., Grishin N.V. Analysis of CASP8 targets, predictions and assessment methods // Database (Oxford). 2009. V. 2009. P. bap003.

135. Shindyalov I.N., Bourne P.E. Protein structure alignment by incremental combinatorial extension (CE) of the optimal path // Protein Eng. 1998. V. 11. №9. P. 739-747.

136. Bioinformatics. 2005. V. 21. № 7. P. 951-960. 166.Song L., Hobaugh M.R., Shustak C., Cheley S., Bayley H., Gouaux J. Structure of Staphylococcal alpha -Hemolysin, a Heptameric Transmembrane Pore // Science. 1996. V. 274. № 5294. P. 1859-1865.

137. Toyomura T., Oka T., Yamaguchi C., Wada Y., Futai M. Three subunit a isoforms of mouse vacuolar H(+)-ATPase. Preferential expression of the a3 isoform during osteoclast differentiation // J. Biol. Chem. 2000. V. 275. № 12. P. 8760-8765.

138. Tusnady G.E., Simon I. The HMMTOP transmembrane topology prediction server // Bioinformatics. 2001. V. 17. № 9. P. 849-850.

139. Unger R., Moult J. Finding the lowest free energy conformation of a protein is an NP-hard problem: proof and implications // Bull. Math. Biol. 1993. V. 55. №6. P. 1183-1198.

140. Vajda S. Classification of protein complexes based on docking difficulty // Proteins. 2005. V. 60. № 2. P. 176-180.

141. Vajda S., Kozakov D. Convergence and combination of methods in protein-protein docking // Curr. Opin. Struct. Biol. 2009. V. 19. № 2. P. 164-170.

142. Van Der Spoel D., Lindahl E., Hess B., Groenhof G., Mark A.E., Berendsen H.J.C. GROMACS: fast, flexible, and free // J Comput Chem. 2005. V. 26. № 16. P. 1701-1718.

143. Wagner C.A., Finberg K.E., Breton S., Marshansky V., Brown D., Geibel J.P. Renal vacuolar H+-ATPase // Physiol. Rev. 2004. V. 84. № 4. P. 1263-1314.

144. Wallner B., Elofsson A. All are not equal: a benchmark of different homology modeling programs // Protein Sci. 2005a. V. 14. № 5. P. 1315-1327.

145. Wallner B., Elofsson A. Pcons5: combining consensus, structural evaluation and fold recognition scores // Bioinformatics. 2005b. V. 21. № 23. P. 4248-4254.

146. Wang Y., Toei M., Forgac M. Analysis of the membrane topology of transmembrane segments in the C-terminal hydrophobic domain of the yeast vacuolar ATPase subunit a (Vphlp) by chemical modification // J. Biol. Chem. 2008. V. 283. № 30. P. 20696-20702.

147. Wetlaufer D.B. Nucleation, rapid folding, and globular intrachain regions in proteins // Proc. Natl. Acad. Sci. U.S.A. 1973. V. 70. № 3. P. 697-701.

148. Wiehe K., Pierce B., Tong W.W., Hwang H., Mintseris J., Weng Z. The performance of ZDOCK and ZRANK in rounds 6-11 of CAPRI // Proteins. 2007. V. 69. № 4. P. 719-725.

149. Williams R.B. A compartmentalised model for the estimation of the cost of coccidiosis to the world's chicken production industry // Int. J. Parasitai. 1999. V. 29. № 8. P. 1209-1229.

150. Wilmot C.M., Thornton J.M. Beta-turns and their distortions: a proposed new nomenclature // Protein Eng. 1990. V. 3. № 6. P. 479-493.

151. Xiang Z. Advances in homology protein structure modeling // Curr. Protein Pept. Sci. 2006. V. 7. № 3. P. 217-227.

152. Xing Y., Bôcking T., Wolf M., Grigorieff N., Kirchhausen T., Harrison S.C. Structure of clathrin coat with bound Hsc70 and auxilin: mechanism of Hsc70-facilitated disassembly // EMBO J. 2010. V. 29. № 3. P. 655-665.

153. Xu Q., Canutescu A.A., Wang G., Shapovalov M., Obradovic Z., Dunbrack R.L J. Statistical analysis of interface similarity in crystals of homologous proteins II J. Mol. Biol. 2008. V. 381. № 2. P. 487-507.

154. Xu T., Vasilyeva E., Forgac M. Subunit interactions in the clathrin-coated vesicle vacuolar (H(+))-ATPase complex // J. Biol. Chem. 1999. V. 274. № 41. P. 28909-28915.

155. Yang J., Peng Z., Chen X. Prediction of protein structural classes for low-homology sequences based on predicted secondary structure // BMC Bioinformatics. 2010. V. 11 Suppl 1. P. S9.

156. Yarnitzky T., Levit A., Niv M.Y. Homology modeling of G-protein-coupled receptors with X-ray structures on the rise // Curr Opin Drug Discov Devel. 2010. V. 13. № 3. P. 317-325.

157. Ye Y., Godzik A. FATCAT: a web server for flexible structure comparison and structure similarity searching // Nucleic Acids Res. 2004. V. 32. № Web Server issue. P. W582-5.

158. Zhang Y. I-TASSER: fully automated protein structure prediction in CASP8 //Proteins. 2009. V. 77 Suppl 9. P. 100-113.

159. Zhang Y., Hubner I.A., Arakaki A.K., Shakhnovich E., Skolnick J. On the origin and highly likely completeness of single-domain protein structures // Proc. Natl. Acad. Sci. U.S.A. 2006. V. 103. № 8. P. 2605-2610.

160. Zhang Z., Zheng Y., Mazon H., Milgrom E., Kitagawa N., Kish-Trier E., Heck A.J.R., Kane P.M., Wilkens S. Structure of the yeast vacuolar ATPase //J. Biol. Chem. 2008. V. 283. № 51. P. 35983-35995.

161. Zhou H., Skolnick J. Ab initio protein structure prediction using chunk-TASSER // Biophys. J. 2007. V. 93. № 5. P. 1510-1518.

162. Zhu J., Fan H., Periole X., Honig B., Mark A.E. Refining homology models by combining replica-exchange molecular dynamics and statistical potentials //Proteins. 2008. V. 72. № 4. P. 1171-1188.