Бесплатный автореферат и диссертация по биологии на тему
Компьютерный анализ связи конформационных пептидов с аллергенностью белков
ВАК РФ 03.01.09, Математическая биология, биоинформатика

Автореферат диссертации по теме "Компьютерный анализ связи конформационных пептидов с аллергенностью белков"

На правах рукописи

БРАГИН АНАТОЛИЙ ОЛЕГОВИЧ

КОМПЬЮТЕРНЫЙ АНАЛИЗ СВЯЗИ КОНФОРМАЦИОННЫХ ПЕПТИДОВ С АЛЛЕРГЕННОСТЬЮ БЕЛКОВ

03.01.09 Математическая биология, биоинформатика

Автореферат диссертации иа соискание ученой степени кандидата биологических наук

1 8 АПР 2013

Новосибирск

2013

005052113

005052113

Работа выполнена в лаборатории компьютерной протеомики Федерального государственного бюджетного учреждения науки Институт цитологии и генетики Сибирского отделения Российской академии наук (ИІДиГ СО РАН), г. Новосибирск, Россия.

Научный руководитель: кандидат биологических наук, доцент

Иванисенко Владимир Александрович

Официальные оппоненты:

Самсонова Мария Георгиевна,

доктор биологических наук,

зав. отделом компьютерной биологии Центра Перспективных Исследований

Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования Санкт-Петербургский государственный политехнический университет, г. Санкт-Петербург

Мошкин Михаил Павлович,

доктор биологических наук, профессор,

зав. отделом генофондов экспериментальных животных

Федеральное государственное бюджетное учреждение науки

Институт цитологии и генетики Сибирского отделения РАН, г.

Новосибирск

Ведущее учреждение: ФГУН Государственный научный центр вирусологии и

биотехнологии «Вектор», п. Кольцово, Новосибирская область

Защита диссертации состоится «¿?_» 2013 г. на утреннем заседании

диссертационного совета Д 003.011.01 по защите диссертаций на соискание ученой

степени кандидата наук, на соискание ученой степени доктора наук в ИЦиГ СО РАН в

конференц-зале Института по адресу:

630090, г. Новосибирск, проспект ак. Лаврентьева, 10,

т./ф. (383)363-49-06, факс (383) 333-12-78, e-mail: dissov@bionet.nsc.ru.

С диссертацией можно ознакомиться в библиотеке ИЦиГ СО РАН.

Автореферат разослан ift 2013 г.

Ученый секретарь диссертационного совета, доктор биологических наук

Т.М. Хлебодарова

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность проблемы. На сегодняшний день по данным WAO (всемирной организации аллергии) от различных аллергических заболеваний страдает более трети населения в мире. Белки являются основным агентом, вызывающим IgE-опосредованную аллергию (Колхир, 2010). Одним из наиболее эффективных средств предотвращения развития аллергических реакций является элиминационная терапия, поэтому важно знать, какие белки могут вызывать аллергические реакции у людей. В настоящее время, накоплены данные по многим главным аллергенам (белкам, способным взаимодействовать с IgE-антителами у более чем 50% аллергиков, чувствительных к источнику данного белка-аллергена), что делает актуальным проблему компьютерного анализа их аллергенных свойств. Аллергены могут встречаться среди белков генетически модифицированных продуктов, косметики, лекарственных препаратов, искусственно синтезированных белков и других белков, с которыми может контактировать человек. Появление высокопроизводительных параллельных технологий секвенирования обеспечило стремительный рост de novo секвенированных последовательностей. Экспериментально проверить способность вызывать IgE-опосредованные реакции в организме у всех белков невозможно (только в базе данных UniProt содержится более 25 млн. последовательностей белков). По этим причинам разработка методов предсказания аллергенности (перекрестной реактивности между белками-аллергенами) белков является важной задачей.

Один из первых методов предсказания аллергенности белков был предложен Всемирной организацией здравоохранения (WHO) Продовольственной и сельскохозяйственной организацией (FAO). В дополнение к экспериментальным методам оценки аллергенности продуктов ими было предложено проводить сравнение анализируемых белков пищи с известными белками-аллергенами для оценки перекрестной реактивности. Считалось, что белок можно рассматривать как аллерген, если он имеет участок длиною более 6 аминокислотных остатков, идентичный участку аминокислотной последовательности известного аллергена. Кроме того, анализируемый белок мог считаться аллергеном, если его аминокислотная последовательность имела фрагмент, гомологичный последовательности известного аллергена. Однако этот метод предсказывал большое количество ложноположительных результатов. Кроме подхода, предложенного FAO/WHO, в последнее время активно разрабатываются новые методы анализа аллергенности белков. Известно, что белки-аллергены взаимодействуют с IgE-антителами (Ройт и др., 2000). Эпитопы на поверхности белка, с которыми взаимодействуют антитела, могут быть

линейными или конформационными (Schramm et al, 2001; Takagi et al., 2005). Линейные эпитопы белков состоят из аминокислотных остатков, расположенных последовательно в первичной структуре белка. Аминокислоты конформационных эпитопов формируют разрывные фрагменты в первичной структуре, но компактный кластер в третичной структуре. Большинство методов предсказания аллергенности явно или неявно используют информацию о линейных антигенных эпитопах. Например, такие эпитопы могут входить в состав мотивов или консервативных участков аминокислотных последовательностей белков, используемых при предсказании аллергенности (Stadler and Stadler, 2003).' Однако учесть конформационные эпитопы при анализе первичной структуры значительно сложнее в силу того, что они могут быть распределены вдоль протяженных участков последовательности. Для их анализа требуется использование данных о пространственной структуре белков. По этой причине остро стоит проблема создания методов предсказания аллергенных свойств белков, которые в дополнение к информации о первичной структуре белков способны учитывать еще и пространственную организацию белковых молекул.

Цель настоящего исследования. Таким образом, целью исследования был поиск взаимосвязи между структурной организацией и аллергенными свойствами белков с использованием представления поверхности их пространственной структуры наборами конформационных пептидов (цепочек сближенных в пространственной структуре аминокислотных остатков, среди которых могут находиться остатки, удаленные друг от друга в первичной структуре). Для достижения этой цели решались следующие задачи:

1. Анализ физико-химических свойств конформационных пептидов аллергенных белков.

2. Анализ сходства конформационных и линейных пептидов в белках-аллергенах.

3. Разработка метода представления поверхностных участков пространственной структуры белка набором конформационных пептидов.

4. Анализ структурной и функциональной близости белков-аллергенов, обладающих сходными конформационными пептидами.

5. Разработка метода предсказания аллергенности белков на основе анализа конформационных пептидов.

6. Анализ влияния факторов среды обитания микроорганизмов на наличие аллергенных белков в их протеомах.

Научная новизна. В данной работе впервые предложено использовать для предсказания аллергенности белков представление их поверхности в виде набора конформационных пептидов. Такие пептиды являются моделью

линейных пептидов, поскольку составлены из разрывных участков аминокислотной последовательности белка. В работе впервые была создана база данных конформационных и линейных пептидов, со средствами поиска при помощи программы BLAST. С использованием этой базы создан новый метод предсказания аллергенности белков, превосходящий по точности известные методы. Проведена оценка перекрестной реактивности между белками Schistosoma mansoni и известными аллергенами. Показано, что негомологичные белки, содержащие на своей поверхности сходные конформационные пептиды, могут иметь как сходные аллергенные, так и функциональные свойства. Предсказано наличие связи между патогенностью микроорганизмов и количеством аллергенных для человека белков у данных микроорганизмов.

Практическая ценность. Метод предсказания аллергенности белков и база данных пептидов из белков-аллергенов были интегрированы в системы Protein Structure Discovery (Иванисенко и др., 2011) и ICGenomics (Орлов и др., 2012). Метод позволяет анализировать аллергенность белков по их первичной структуре, что делает возможным его применение для анализа больших множеств белков и целых протеомов. Полученные результаты могут быть использованы для планирования экспериментов по проверке аллергенных свойств белков, поиску эпитопов IgE-антител, проектированию новых белков и пептидов для проведения аллерген-специфической иммунотерапии.

Положения, выносимые на защиту.

Разработанный метод определения аллергенности белков на основе сравнения конформационных пептидов известных белков-аллергенов с пептидами анализируемых белков позволяет предсказывать аллергенность белков с высокой точностью.

Негомологичные белки-аллергены характеризуются наличием сходных конформационных и линейных пептидов.

Аллергенность микроорганизмов (отношение количества белков, предсказанных как аллергены, к общему числу белков в протеоме данного микроорганизма) положительно коррелирует с их патогенностью.

Апробация. Результаты работы были представлены на международных и российских конференциях: на осенней школе International Autumn School for Young Scientists on Computational Systems Biology and Bioinformatics -2009, Novosibirsk, Russia, на летней школе summer school and workshop Integrative Biological Pathway Analysis and Simulation - 2010, Bielefeld, Germany, на международной конференции The 7th International Conférence on Bioinformatics of Genome Régulation and Structure - 2010, Novosibirsk, Russia, конференции Интерра-2011 Секция "Биомедицина", Новосибирск, Россия,'

школе молодых ученых "Биоинформатика и системная биология"-2011, Новосибирск, Россия, конференции "Постгеномные методы анализа в биологии, лабораторной и клинической медицине: геномика, протеомика, биоинформатика" 2011, Новосибирск, Россия, открытии RCIBC 2011, Новосибирск, Россия, международной конференции Bioinformatics of Genome Regulation and StructureYSystems Biology — BGRS\SB-2012, международной конференции International Conference on Postgenomic Technology for Biomedicine 2012, Новосибирск, Россия, конкурс «Участник молодежного научно-инновационного конкурса» («УМНИК») Медицина Будущего - 2012, Новосибирск, Россия.

Публикации. В результате выполнения работы было опубликовано 5 статей в рецензируемых журналах, рекомендованных ВАК, 4 тезиса к российским и международным конференциям, получено одно свидетельство о государственной регистрации программы для ЭВМ.

Личный вклад автора. Основные результаты работы были получены и проанализированы автором самостоятельно. А именно: в создании базы данных конформационных и линейных пептидов аллергенных белков, в разработке метода предсказания аллергенности белков с использованием конформационных пептидов, в анализе аллергенности белков Schistosoma mansoni, в анализе аллергенности белков микроорганизмов и связи факторов среды обитания на наличие аллергенных для человека белков в протеомах микроорганизмов, в анализе конформационных пептидов ДНК-связывающих белков. При расчете конформационных пептидов для пространственных структур белков автор использовал фрагменты кода программ (язык программирования С), написанных В. А. Иванисенко.

Структура и объем работы. Работа состоит из оглавления, списка сокращений, введения, пяти глав, заключения, выводов, списка литературы и четырех приложений. Материал изложен на 144 страницах (136 страниц текста и 8 страниц приложений), содержит 22 рисунка, 9 таблиц, 10 формул.

СОДЕРЖАНИЕ РАБОТЫ

Глава 1. Обзор литературы. В обзоре литературы освещены публикации, содержащие результаты исследований аллергии и механизмов развития аллергических реакций, белков-аллергенов, эпитопов, конформационных пептидов, а также описывающие методы предсказания эпитопов и аллергенности белков.

На сегодняшний день IgE-опосредованная аллергия является распространенной проблемой со здоровьем в мире. Одним из способов борьбы с аллергией является элиминационная терапия, поэтому важно знать, какие белки могут взаимодействовать с IgE-антителами, наработанными к

известным белкам-аллергенам. В дополнение к экспериментальным методам оценки аллергенных свойств белков был разработан ряд компьютерных методов предсказания аллергенности белков (перекрестной реактивности между известными аллергенами и исследуемыми белками). При предсказании аллергенности белков важно учитывать информацию об эпитопах. Поскольку компьютерные методы предсказания аллергенности белков используют информацию только о первичной структуре белка, то конформационные эпитопы ими не учитываются. Учесть информацию о конформационных эпитопах можно при помощи конформационных пептидов, моделирующих поверхность белка. При моделировании конформационными пептидами Б-клеточных эпитопов важно учитывать физико-химические свойства аминокислот.

В виду вышесказанного, разработка метода предсказания аллергенности белков, использующего информацию о конформационных пептидах, является важной задачей для изучения аллергенных свойств белков.

Глава 2. База данных конформационных и линейных пептидов из известных белков-аллергенов (ЬСР). Данная глава посвящена созданию базы данных конформационных и линейных пептидов аллергенных белков (ЬСР). База данных содержит последовательности пептидов, а также оценки их вклада в аллергенность белка. Информация об известных белках аллергенах извлекалась из базы данных БОАР (1уапсшс е/ а1, 2003). Конформационные пептиды рассчитывались на основе анализа экспериментально расшифрованных или предсказанных пространственных структур белков. Всего из БОАР было отобрано 586 белков, уровень сходства между которыми не превышал 90%. Для 16 белков третичная структура была известна, для 329 была предсказана. Для этих белков рассчитывали конформационные и линейные пептиды. Для оставшегося 241 белка, для которых предсказать пространственную структуру не удалось, рассчитывали только линейные пептиды. Линейные пептиды рассчитывались посредством сдвига окна длиною 8 аминокислотных остатков. Конформационные пептиды рассчитывались в пространственных структурах белков-аллергенов по следующим правилам: 1) два аминокислотных остатка рассматривались как «связанные» в конформационном пептиде, если расстояние между их С-альфа атомами в пространственной структуре белка было не более 5 ангстрем; 2) требовалось, чтобы аминокислотные остатки, формирующие конформационный пептид, располагались на поверхности белка. Для этого рассматривались только те конформационные пептиды, для которых усредненная доступность для растворителя была не менее 50 % от

максимальной доступности аминокислот для растворителя; 3) длина конформационных пептидов, как и в случае с линейными пептидами, задавалась равной восьми аминокислотным остаткам. Пример конформационных пептидов, рассчитанных для белка-аллергена «Zea m 1», изображен на рисунке 1.

Рис. Í а) Пространственная структура белка-аллергена кукурузы «Zea m 1» (PDB индекс 2HCZ). Темными кружками изображены

аминокислоты, линии между ними обозначают пептидные связи. Светлыми кружками отмечены аминокислоты

входящие в состав

конформационных пептидов 1, 2 и 3. б) Примеры найденных конформационных пептидов для пространственной

структуры белка-аллергена кукурузы «Zea m 1».

б)

Тй0 % Рзо

•А

"Ь Се 7 Л*" 7

Q

Чю^

^ lUít

Cg» 3

В базу данных ЬСР вошли только те пептиды, которые встречались не менее, чем в двух белках-аллергенах с учетом вырожденного алфавита (табл. 1).

Табл. 1 Группировка аминокислот по близости физико-химических свойств.

Гидрофобные

V, М, Т, L, F, Y, W

Положительно заряженные

R, К,Н

Отрицательно заряженные Полярные

Е, D

S, Т, N, О

Малые аминокислоты

Цистеин ____Лролин_

A, G С

При сравнении пептидов между собой их последовательности представлялись в вырожденном алфавите согласно группировке аминокислот по близости физико-химических свойств. Последовательности пептидов, идентичные друг другу с учетом только 20-буквенного алфавита, заносились в ЬСР базу в единственном экземпляре. Для каждого пептида из ЬСР был рассчитан специальный параметр Б А по формуле 1

&4 = 1пГ—1

I Vh

(і)

где Va - частота встречаемости пептида в белках-аллергенах, Vh - частота встречаемости пептидов в не аллергенных белках (белках человека). Частота встречаемости оценивалась с учетом вырожденного алфавита (табл. 1). SA является показателем вклада пептидов в аллергенность белков. Можно предположить, что пептиды с высоким значением SA являются частью IgE-эпитопов.

База данных LCP была интегрирована в систему PSD (Иванисенко и др., 2011), где была также создана система поиска по базе данных LCP при помощи программы BLAST.

Глава 3. Метод предсказания аллергенности белков на основе анализа линейных и «информационных пептидов. В главе 3 приведены описание разработанных методов предсказания аллергенности белков и результаты оценки их точности. Схематичное описание алгоритма предсказания аллергенности белка, основанного на анализе конформационных и линейных пептидов, представлено на рисунке 2.

Рис. 2 Алгоритм метода предсказания аллергенности белков, основанного на анализе конформационных и линейных пептидов.

анализируемый белок

расчет линейных пептидов анализируемого белка при помощи подвижного окна

сравнение пептидов анализируемого белка с пептидами из LP или LCP

расчет значения функцииDF для анализируемого белка

сравнение значения DF с заданным порогом

На первом шаге алгоритма анализируемая последовательность представлялась в виде набора пептидов, полученных путем сдвига окна, длиною 8 аминокислотных остатков. Далее пептиды анализируемого белка сравнивались с пептидами из ЬСР с учетом физико-химических свойств аминокислот (табл. 1). Результаты таких сравнений использовались для отнесения анализируемой последовательности к группе аллергенов или не аллергенов. Расчет решающей функции ОБ, на основе которой проводилась классификация последовательности, осуществлялся по формуле:

где SAj - значения SA у пептидов из LCP, совпадающих с пептидами анализируемого белка, L - длина анализируемого белка.

Белок относился к аллергенам, если значение решающей функции DF превышало заданный порог. Значение порога для DF в программе может задаваться пользователем в зависимости от требований к точности метода (соотношения ошибок первого и второго рода).

Для оценки вклада конформационных пептидов в предсказание аллергенности по отношению к линейным пептидам также был реализован метод LP, аналогичный LCP, но основанный только на анализе линейных пептидов. Оценка точности разработанных методов предсказания аллергенности показала, что при учете конформационных пептидов ошибка первого рода при фиксированной ошибке второго рода снижается на 2,8% (табл. 2). Оказалось, что метод LCP превосходит по точности широко известный метод AllerHunter (Muh et al., 2009), который являлся наиболее точным методом на момент выполнения работы.

Табл. 2. Оценка точности методов предсказания аллергенности белков._

Название метода Значение ошибки Значение ошибки

N

l>

DF =

(2)

L

LCP-BLAST

0,079** 0,143* (0,164**)

0,042** 0,068* (0,036**)

Метод конформационных пептидов LCP

AllerHunter&

Метод линейных пептидов

0,163 0,171*

0,068 0,068*

LP

* метод использовал пептиды, полученные из базы данных SDAP версии 2010 года ♦♦метод использовал пептиды, полученные из базы данных SDAP обновленной версии 2011 года

&метод AllerHunter (Muh et al, 2009)

Точность методов измерялась на тестовых выборках белков аллергенов и не аллергенов «testing.allergen.fa», «testing.putative_non_allergen.fa» из работы (Muh et al., 2009)

Для большего увеличения точности метод LCP был модифицирован путем добавления программы выравнивания BLASTP. На первом шаге модифицированного метода проводится выравнивание анализируемой аминокислотной последовательности с последовательностями известных белков-аллергенов с использованием BLASTP. Анализируемый белок на первом шаге относится к аллергенам в случаях, если обнаруживается высокая гомология (Е-value < 10"21). В противном случае, применяется метод LCP. Точность метода приведена в таблице 2. .

Разработанные методы предсказания аллергенности белков были интегрированы в систему PSD (Иванисенко и др., 2011) и ICGenomics (Орлов и др., 2012).

Глава 4. Анализ конформационных пептидов белков со схожими свойствами. В главе 4 приводятся результаты анализа свойств конформационных и линейных пептидов аллергенных белков, а также результаты анализа конформационных пептидов ДНК-связывающих белков.

Анализ связи физико-химических свойств конформационных пептидов с показателем их аллергенности. В качестве показателя аллергенности пептидов из базы данных LCP использовались значения SA (формула 1). С использованием метода опорных векторов было проанализировано более 544 физико-химических свойства аминокислот, взятых из базы данных aaindex (Kawashima and Kanehisa, 2000). В качестве свойств пептидов брались суммарные значения свойств аминокислот, входящих в пептид. Было показано, что в совокупности физико-химические свойства пептидов связаны с SA с коэффициентом множественной детерминации, равным 0.29. Для выявления наиболее значимых индивидуальных физико-химических свойств применяли парный линейный регрессионный анализ. Было показано, что наиболее высокая корреляция наблюдается между полярностью пептидов и значением SA (R=0,25, p-value <10"15).

Анализ конформационных пептидов из ДНК-связывающих белков. Для проверки гипотезы о том, что белки с общими функциональными свойствами могут иметь схожие конформационные пептиды, провели анализ конформационных пептидов различных ДНК-связывающих белков. ДНК-связывающие белки были выбраны в связи с тем, что многие из таких белков не имеют между собой гомологии, а также на их поверхности располагаются достаточно протяженные сайты связывания с ДНК (подобно сайтам связывания IgE с аллергенами), которые могут быть представлены в виде наборов конформационных пептидов. Из базы данных PDB были случайным образом взяты 50 негомологичных ДНК-связывающих белков. Уровень сходства между последовательностями этих белков не превышал 30%. Кроме того, в качестве отрицательной выборки из базы данных PDB были случайным образом отобраны еще 49 белков, не являющихся ДНК-связывающими. Таким образом, для 50 ДНК-связывающих белков и 49 случайно выбранных белков проводился расчет конформационных пептидов методом, описанным выше. При сравнении конформационных пептидов двух белков рассчитывалось значение SIMscore по формуле 3.

SIM

SIMscore =

CP 1 * CP2 , (3)

где SIM - количество совпадений между пептидами двух сравниваемых белков; пептиды считались совпадающими, если их Pscore, рассчитанный по формуле 4, был выше 0,2. СР1 - количество конформационных пептидов в первом белке, СР2 - количество пептидов во втором белке.

Pscore рассчитывался как сумма отношений веса аминокислотных замен, задаваемого матрицей РАМ, по позициям парного выравнивания пептидов к сумме диагональных элементов матрицы РАМ, соответствующих аминокислотам в позиции первого и второго пептида. В качестве матрицы аминокислотных замен была взята матрица РАМ30, которая в программе Blast (Stephen et al., 1997) часто используется при выравнивании коротких пептидов.

(1\ V1 2 хР?, Pscore = — х > —г-Ц-

(4)

где Ы- длинна пептида, к- позиция парного выравнивания Рку - значение матрицы РАМ30 для аминокислот в позиции к, соответствующее заменам

аминокислоты i на j, Ркн и Pkjj - значения диагональных элементов матрицы РАМЗО для аминокислот в позиции к.

Для каждого ДНК-связывающего белка было составлено два множества значений SIMscore. Первое множество состояло из значений SIMscore, полученных в результате сравнения одного из 50 анализируемых ДНК-связывающих белков с остальными 49 ДНК-связывающими белками. Второе множество, состояло из значений SIMscore, полученных в результате сравнения этого же ДНК-связывающего белка с 49 случайно выбранными белками из отрицательной выборки. Для статистической оценки различий между распределениями значений SIMscore, рассчитанными для ДНК-связывающих белков и белков из отрицательной выборки при их попарном сравнении, использовался критерий Уилкоксона. Тест Уилкоксона проводился посредством языка R, использовался стандартный набор библиотек (R Development Core Team, 2011). В результате было получено, что для 25 из 50 ДНК-связывающих белков наблюдается значимое (p-value < 0,05) различие между значениями SIMscore, полученными при сравнении рассматриваемого ДНК-связывающего белка с другими ДНК-связывающими белками, и значениями SIMscore, полученными при сравнении рассматриваемого ДНК-связывающего белка со случайным набором белков. Как оказалось, многие конформационные пептиды, сходные в разных ДНК-связывающих белках, пересекаются с ДНК-связывающими участками этих белков, предсказанными с помощью программы BindN+ (Wang et al., 2012).

Дополнительно к анализу, при котором для каждого отдельно взятого ДНК-связывающего белка проводилось сравнение показателя его сходства с другими ДНК-связывающими белками и белками из контрольной выборки, с помощью критерия Уилкоксона также было проведено сравнение распределений SIMscore, рассчитанных по всей совокупности ДНК-связывающих белков. Множество SIMscore, характеризующее сходство между ДНК-связывающими белками, в этом случае состояло из 2450 значений, полученных при объединении результатов сравнения каждого из 50 белков с оставшимися 49. Такое же по количеству было множество SIMscore, характеризующее сходство между ДНК-связывающими белками и белками контрольной выборки. В результате анализа было выявлено статистически значимое различие между этими двумя множествами (p-value <10' ). Среднее значение SIMscore, характеризующих близость между ДНК-связывающими белками составило 0,00041, а близость между ДНК-связывающими белками и белками из контрольной выборки характеризовалась средним значением SIMscore, равным 0,00033. Таким образом, ДНК-связывающие белки проявляют большее сходство между

собой в результате наличия в их структуре сходных конформационных пептидов по сравнению со случайными белками.

Глава 5. Предсказание аллергенных свойств у белков с использованием разработанных методов. Данная глава содержит результаты анализа аллергенности белков шистосомы {Schistosoma mansoni) и результаты анализа связи факторов среды обитания с аллергенностью белков 546 видов микроорганизмов.

Анализ аллергенности белков шистосомы. Известно, что при многих паразитарных инфекциях, включая шистосому, наблюдается повышенный уровень антител класса Е в крови больных людей. Существует предположение, что это связано с защитной ролью IgE антител против гельминтов (Ройт и др., 2000). В связи с этим, большой интерес представляет выявление потенциальных белков-аллергенов шистосомы и идентификация возможных IgE эпитопов.

Для анализа были взяты белки вида Schistosoma mansoni, для которого существуют данные, свидетельствующие о повышенном уровне IgE у людей, зараженных этими гельминтами (Rihet et al., 1991). Для анализа брались белки Schistosoma mansoni с известной, а также предсказанной трехмерной структурой. Координаты атомов предсказанных 54 структур белков были взяты из SWISS-MODEL Repository (Kiefer et al., 2009). 29 пространственных структур белков, полученных рентгеноструктурным анализом, были взяты из банка данных PDB. Всего в анализе использовалось 83 пространственных структур белков.

Для каждого из рассматриваемых белков проводился расчет конформационных пептидов по методике, описанной выше (см. главу 2). Для оценки попарного сходства белков проводили сравнение их конформационных пептидов. Для каждой пары последовательностей пептидов при сравнении рассчитывалось значение Pscore, характеризующее их сходство, аналогично тому, как в главе 4 (см. формула 4).

Для кластеризации белков рассчитывалось парное расстояние Dist, характеризующие сходство конформационных пептидов в их структуре (см. формула 5).

где Б^у - расстояние между ¿-м и >м белком, 8ппСотру - количество пар пептидов, сходство между которыми превышает заданный порог при

(5)

сравнении i-ro и j-ro белка, Nj - общее число пептидов из i-ro белка, Nj -общее число пептидов из j-ro белка.

Значение порога для показателя сходства пептидов Pscore задавалось равным 0,2. В результате анализа аллергенности белков шистосомы было предсказано 22 белка, потенциальных аллергена. Для предсказания аллергенности применялся двухшаговый подход, включающий в себя выравнивание анализируемой последовательности с известными белками-аллергенами с помощью BLASTP и применение метода LCP.

Иерархическую кластеризацию белков проводили посредством программы MeV (MultiExperiment Viewer) v4.7.3. Была проведена статистическая оценка представленности аллергенных белков в кластерах, образующих отдельно взятые ветви, при случайном перемешивании положения белков на построенном древе. Случайные перемешиваний проводили 100000 раз, на основе которых строили распределение количества аллергенных белков, попавших в тот или иной кластер. С помощью данного распределения оценивали значимость отклонения наблюдаемого количества аллергенных белков от ожидаемого по случайным причинам. Было показано, что распределение белков-аллергенов по вершинам ветвей отличается от ожидаемого по случайным причинам. Белки-аллергены чаще, чем ожидалось, попадали в общие кластеры. Один из таких кластеров был преимущественно представлен только аллергенными белками (7 аллергеннов из 8 белков).

Аналогичным образом была проанализирована кластеризация белков шистосомы, обладающих сходными функциональными свойствами. Были выявлены кластеры, содержащие значимо большее число цинк-связывающих, а также АТФ-связывающих белков. Полученные результаты согласуются с гипотезой о том, что белки, обладающие сходными конформационными и линейными пептидами, могут проявлять общие функциональные и аллергенные свойства.

Анализ связи факторов среды обитания с аллергенностью белков микроорганизмов. Основной целью данной части работы было предсказание белков-аллергенов в протеомах микроорганизмов и исследование связи аллергенности протеома с факторами среды обитания микроорганизмов. Рассматривались микроорганизмы, которые распространены в среде обитания, позволяющей легко контактировать с человеком, а также различные экстремофилы, для которых контакты с человеком маловероятны. Предсказание аллергенности проводилось для 546 видов бактерий и архей, геномы которых были полностью секвенированы. Последовательности белков вместе с характеристиками микроорганизмов, включая их патогенность, подвижность, среду обитания и т.д. (табл. 3), были взяты из баз данных GenBank и BioProject (Benson et al., 2011; Barrett et al., 2012).

Табл. З.Характеристики микроорганизмов.

Группа

Характеристика микроорганизма

Царство

Потребность в кислороде

Патогенность

Способ существования

Температурные факторы

Подвижность

Бактерии

Археи

Факультативные анаэробы____

Микроаэрофилы

Аэробы__________

Патогенность по отношению к млекопитающим

Наземные

Специализированные Множественные

Психрофилы

Гипертермофилы Термофилы Мезофиллы__

Неподвижные

Малоподвижные

Подвижные

Для предсказания аллергенности белков рассматриваемых микроорганизмов использовался ранее описанный двухшаговый подход, основанный на применении методов ВЬАБТР и ЬСР. Расчеты проводились на высокопроизводительном кластере центра коллективного пользования «Биоинформатика» СО РАН. Аллергенность микроорганизма рассчитывалась как отношение количества белков, предсказанных как аллергены, к общему числу белков в протеоме данного микроорганизма.

Для установления связи между характеристиками микроорганизмов (табл. 3) и их аллергенностью использовались методы множественной линейной регрессии и дисперсионный анализ. Характеристики микроорганизмов, представленные в таблице 3, рассматривались как независимые переменные, а аллергенность микроорганизмов как зависимая переменная. Независимые переменные принимали значения 0 или 1. Например, если вид архей или бактерий относился к термофилам, то характеристика «термофил!.¡гость» этого микроорганизма задавалась как 1, в противном случае как 0. Результаты дисперсионного анализа связи между

характеристиками микроорганизмов и их аллергенностью приведены в таблице 4.

Табл. 4. Характеристики микроорганизмов, статистически значимо связанные с аллергенностью._

Характеристика Направление Статистика Значимость

микроорганизма связи с Фишера

аллергенностью

Патогенность* + 31,7 3,447е-08

Наземный способ - 21,1 5,683е-06

существования

Аэробы - 12,9 0,0003571

Мезофилы - 12,6 0,0004324

* Патогенность рассматривалась по отношению к млекопитающим.

С помощью дисперсионного анализа были выявлены 4 наиболее значимые характеристики микроорганизмов, связанные с их аллергенностью (табл. 4). На первом месте по значимости оказалась патогенность микроорганизма. При этом согласно предсказаниям патогенные микроорганизмы обладали повышенной аллергенностью.

Другие выявленные менее значимые факторы (наземный способ существования, принадлежность к аэробам и принадлежность к мезофиллам) оказались отрицательно связанными с аллергенностью. Согласно полученным предсказаниям, аллергенные белки встречаются реже среди микроорганизмов, ведущих наземный способ существования, а также мезофиллов и аэробов по сравнению с остальными микроорганизмами. Наиболее аллергенными среди патогенных для человека микроорганизмов можно выделить Bacillus weihenstephanensis, Streptococcus pneumonia, Staphylococcus saprophyticus и Staphylococcus haemolyticus, часто вызывающие пищевое отравление, пневмонию, инфекции мочевыводящих путей и оппортунистические инфекции, соответственно. Полученные результаты могут быть использованы для более точной постановки диагнозов, а также для коррекции терапевтического лечения с учетом возможных IgE-опосредованных реакций, вызываемых белками патогенных микроорганизмов.

Выводы

1) Впервые создана база данных конформационных и линейных пептидов, моделирующих молекулярную поверхность известных белков-аллергенов, содержащая также оценки их возможного вклада в аллергенность данных

белков. База данных интегрирована с программой BLAST, позволяющей проводить сравнение пептидов с последовательностями белков.

2) Впервые разработан метод предсказания аллергенности белков на основе использования данных об их пространственных структурах путем идентификации и анализа конформационных пептидов. Показано, что использование информации о конформационных пептидах для предсказания аллергенности белков повышает точность предсказания по сравнению с методами, использующими только линейные пептиды. Точность разработанного метода превышает точности известных аналогов.

3) С помощью разработанного метода предсказаны белки-аллергены из Schistosoma mansoni. Проведена иерархическая кластеризация белков Schistosoma mansoni, основанная на критерии сходства их конформационных и линейных пептидов. Показано, что распределение белков-аллергенов по вершинам ветвей отличается от ожидаемого по случайным причинам. Белки-аллергены с большей частотой, чем ожидалось, распределяются в общие кластеры.

4) На примере негомологичных ДНК-связывающих белков впервые показано, что белки, обладающие общими функциями, статистически чаще по сравнению со случайными белками обладают сходными конформационными пептидами.

5) На основе анализа более 500 видов архей и бактерий, включая экстремофилов, впервые показано, что аллергенность микроорганизмов (доля аллергенных белков в протеоме) статистически значимо связана с их патогенностью, ареалом, температурными условиями среды обитания и потребностью в кислороде. Оказалось, что фактором, наиболее тесно связанным с аллергенностью, является патогенность микроорганизмов.

Список работ, опубликованных по теме диссертации.

1. Брагин А.О. Компьютерный анализ взаимосвязи аллергенности микроорганизмов и среды их обитания / А.О. Брагин, П.С. Деменков, Р. Хофештадт, Н.А. Колчанов, В.А. Иванисенко // Вавиловский журнал генетики и селекции. - 2012. - Т. 16. № 4/1. - С. 784-790.

2. Брагин, А.О. Предсказание аллергенности белков с использованием информации о конформационных пептидах / А.О. Брагин, П.С. Деменков, В.А. Иванисенко // Вавиловский журнал генетики и селекции. - 2011. - Т. 15. №3,-С. 462-468.

3. Орлов, Ю.Л. ICGenomics: программный комплекс анализа символьных последовательностей геномики / Ю.Л. Орлов, А.О. Брагин, И.В. Медведева, К.В. Гунбин, П.С. Деменков, О.В. Вишневский, В.Г.

Левицкий, Д.Ю. Ошейков, Н.Л. Подколодный, Д.А. Афонников, И. Гроссе, Н.А. Колчанов // Вавиловский журнал генетики и селекции. -2012.-Т. 16. №4/1. -С. 732-741.

4. Пат. 2012613523 Российская Федерация дата поступления 02.05.2012, дата регистрации 20.06.2012. Программа для предсказания аллергенности белков с использованием конформационных пептидов (Аллпред)/ Program for the prediction of allergenicity of proteins using conformation peptides (Allpred) авторы: A.O. Брагин, П.С. Деменков, В.А. Иванисенко

5. Bragin A.O., Demenkov P.S., Kolchanov N.A., Ivanisenko V.A. Accuracy of protein allergenicity prediction can be improved by taking into account data on allergenic protein discontinuous peptides // J. Biomol. Struct. Dyn. - 2013. -Vol. 31, N 1,- P. 59-64.

6. Sommer В., Tiys E.S., Kormeier В., Hippe K., Janowski S.J., Ivanisenko T.V., Bragin A.O., Arrigo P., Demenkov P.S., Kochetov A.V., Ivanisenko V.A., Kolchanov N.A., Hofestadt R. Visualization and analysis of a cardio vascular disease- and MUPP1 -related biological network combining text mining and data warehouse approaches // J. Integr. Bioinfonn. - 2010. - Vol. 7, N 1. - P. 148.

Подписано к печати 28.03 2013 г. Формат бумаги 60x90 1/16. Печ.д. 1. Уч.-изд.л. 0,7 Тираж 110 экз. Заказ 24

Отпечатано на полиграфической базе ИЦиГ СО РАН

Текст научной работыДиссертация по биологии, кандидата биологических наук, Брагин, Анатолий Олегович, Новосибирск

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ УЧРЕЖДЕНИЕ НАУКИ ИНСТИТУТ ЦИТОЛОГИИ И ГЕНЕТИКИ СИБИРСКОГО ОТДЕЛЕНИЯ РОССИЙСКОЙ АКАДЕМИИ НАУК

БРАГИН АНАТОЛИЙ ОЛЕГОВИЧ

КОМПЬЮТЕРНЫЙ АНАЛИЗ СВЯЗИ КОНФОРМАЦИОННЫХ ПЕПТИДОВ С АЛЛЕРГЕННОСТЬЮ БЕЛКОВ

Специальность 03.01.09 математическая биология, биоинформатика

На правах рукописи

Диссертация на соискание ученой степени кандидата биологических наук

Научный руководитель: к.б.н., доцент Иванисенко Владимир Александрович

Новосибирск-2013

Оглавление

Оглавление.........................................................................................................2

Список сокращений...........................................................................................4

Введение............................................................................................................6

Актуальность исследования..........................................................................6

Цели и задачи исследования..........................................................................8

Объект и предмет исследования....................................................................9

Научная новизна исследования.....................................................................9

Практическая значимость работы...............................................................10

Положения, выносимые на защиту.............................................................11

Апробация результатов исследования........................................................11

Публикации..................................................................................................12

Структура диссертации................................................................................12

Личный вклад автора...................................................................................12

Благодарности..............................................................................................13

1. Обзор литературы........................................................................................14

1.1. Аллергия, аллергические заболевания.................................................14

1.2. Механизмы развития 1§Е-опосредованных реакций...........................18

1.3. Аллергены, вызывающие ^Е-опосредованные реакции....................22

1.4. Эпитопы. Предсказание конформационных эпитопов с использованием конформационных пептидов...........................................28

1.5. Методы анализа аллергенности белков................................................37

1.6. Мимикрия пептидами свойств белков.................................................45

1.7. Заключение............................................................................................47

2. База данных конформационных и линейных пептидов из известных белков-аллергенов (ЬСР)................................................................................48

2.1. Алгоритм расчета конформационных и линейных пептидов.............48

2.2. Структура и содержание базы данных ЬСР.........................................56

3. Метод предсказания аллергенности белков на основе анализа линейных и конформационных пептидов..........................................................................62

3.1. Расчет сходства между анализируемым белком и белком-аллергеном с использованием информации о линейных и конформационных пептидах .......................................................................................................................62

3.2. Комбинированный подход оценки аллергенности белков на основе анализа линейных и конформационных пептидов и BLAST.....................65

3.3. Оценка точности метода предсказания аллергенности белков...........68

4. Анализ конформационных пептидов из белков со схожими свойствами 74

4.1. Анализ физико-химических свойств пептидов LCP...........................74

4.2. Анализ сходства конформационных пептидов аллергенов с линейными пептидами белков из Swiss-Prot..............................................77

4.3. Анализ сходства конформационных пептидов в ДНК-связывающих белках............................................................................................................81

5 Предсказание аллергенных свойств у белков с использованием разработанных методов...................................................................................89

5.1. Предсказание и анализ белков-аллергенов из Schistosoma mansoni ...89

5.2. Анализ аллергенности белков микроорганизмов..............................104

Заключение....................................................................................................110

Выводы..........................................................................................................113

Список цитируемой литературы..................................................................115

Публикации с результатами работы.............................................................135

Приложение 1. Базы данных, содержащие информацию об аллергенных

белках.............................................................................................................137

Приложение 2. Свойства аминокислот, используемые для разделения 20

аминокислот на 7 групп................................................................................138

Приложение 3. Матрица РАМ30..................................................................141

Приложение 4. Свойства аминокислот, используемые для анализа физико-химических свойств конформационных пептидов аллергенных белков... 142

Список сокращений

ARP - allergen-representative peptides

В7 - мембранный белок антигенпрезентирующих клеток, взаимодействующий с CD28

BLAST - Basic Local Alignment Search Tool, алгоритм выравнивания

нуклеиновых и аминокислотных последовательностей

CD28 - белок Т-клеток, способный взаимодействовать с В7

CD40 - белок антигенпрезентирующих клеток

CD40L - белок Т-клеток, способный взаимодействовать с CD40

EAACI - европейская академия аллергии и клинической иммунологии

FAO - продовольственная и сельскохозяйственная организация

FcsRI - Fc рецепторы, способные взаимодействовать с IgE-антителами,

первого типа

FcsRII - Fc рецепторы, способные взаимодействовать с IgE-антителами, второго типа

НММ - hidden Markov model IgE-антитело - антитело класса Е

LCP - база данных содержащая информацию о конформационных и линейных пептидах, встречающихся не менее чем в двух белках аллергенах с учетом физико-химических свойств аминокислот

LP- база данных линейных пептидов, содержащая линейные пептиды, которые встречаются не менее чем в двух известных белках-аллергенах с учетом физико-химических свойств аминокислот

SDAP- Structural Database of Allergenic Proteins, база данных аллергенных белков

WAO - всемирная организация аллергии

WHO - всемирная организация здравоохранения

АСИТ - аллерген-специфическая иммунотерапия

ГКГС2 -главный комплекс гистосовместимости второго типа

ИЛ - интерлейкин

ТхО, Txl, Тх2 - различные субпопуляции Т-лимфоцитов (Т-хелперов), осуществляющих регуляцию иммунного ответа

Введение

Актуальность исследования

На сегодняшний день по данным WAO (Всемирной организации аллергии) от различных аллергических заболеваний страдает более трети населения в мире. Белки являются основным агентом, вызывающим IgE-опосредованную аллергию (Колхир, 2010). Одним из наиболее эффективных средств предотвращения развития аллергических реакций является элиминационная терапия, поэтому важно знать, какие белки могут вызывать аллергические реакции у людей. В настоящее время накоплен огромный массив экспериментальных данных по многим главным аллергенам (белкам, способным взаимодействовать с IgE-антителами у более чем 50% аллергиков, чувствительных к источнику данного белка-аллергена), что делает актуальным проблему компьютерного анализа их аллергенных свойств. Аллергены могут встречаться среди белков генетически модифицированных продуктов, косметики, лекарственных препаратов, искусственно синтезированных белков и других белков, с которыми может контактировать человек. Появление высокопроизводительных параллельных технологий секвенирования обеспечило стремительный рост de novo секвенированных последовательностей. Экспериментально проверить способность вызывать IgE-опосредованные реакции в организме у всех белков в настоящее время невозможно (только в базе данных UniProt содержится более 25 млн. последовательностей белков). По этим причинам разработка методов предсказания аллергенности (перекрестной реактивности между белками-аллергенами) белков является важной задачей.

Один из первых методов предсказания аллергенности белков был предложен Всемирной организацией здравоохранения (WHO) и

Продовольственной и сельскохозяйственной организацией (FAO). В дополнение к экспериментальным методам оценки аллергенности продуктов ими было предложено проводить сравнение анализируемых белков пищи с известными белками-аллергенами для оценки перекрестной реактивности. Считалось, что белок можно рассматривать, как аллерген, если он имеет участок длиною более 6 аминокислотных остатков, идентичный участку аминокислотной последовательности известного аллергена. Кроме того, анализируемый белок мог считаться аллергеном, если его аминокислотная последовательность имела фрагмент, гомологичный последовательности известного аллергена. Однако этот метод предсказывал большое количество ложноположительных результатов. Кроме подхода, предложенного FAO/WHO, в последнее время активно разрабатываются новые методы анализа аллергенности белков. Известно, что белки-аллергены взаимодействуют с IgE-антителами (Ройт и др., 2000). Эпитопы на поверхности белка, с которыми взаимодействуют антитела, могут быть линейными или конформационными (Schramm et al., 2001; Takagi et al., 2005). Линейные эпитопы белков состоят из аминокислотных остатков, расположенных последовательно в первичной структуре белка. Аминокислоты конформационных эпитопов формируют разрывные фрагменты в первичной структуре, но компактный кластер в третичной структуре. Большинство методов предсказания аллергенности явно или неявно используют информацию о линейных антигенных эпитопах. Например, такие эпитопы могут входить в состав мотивов или консервативных участков аминокислотных последовательностей белков, используемых при предсказании аллергенности (Stadler and Stadler, 2003). Однако учесть конформационные эпитопы при анализе первичной структуры значительно сложнее в силу того, что они могут быть распределены вдоль протяженных участков последовательности. Для их анализа требуется использование данных о пространственной структуре белков. По этой причине создание методов предсказания аллергенных свойств белков,

которые в дополнение к информации о первичной структуре белков способны учитывать еще и пространственную организацию белковых молекул, является наиболее актуальным в этой области исследований и практических приложений.

Цели и задачи исследования

Таким образом, целью исследования был поиск взаимосвязи между структурной организацией и аллергенными свойствами белков с использованием представления поверхности их пространственной структуры наборами конформационных пептидов (цепочек сближенных в пространственной структуре аминокислотных остатков, среди которых могут находиться остатки, удаленные друг от друга в первичной структуре). Для достижения этой цели решались следующие задачи:

1. Анализ физико-химических свойств конформационных пептидов

аллергенных белков.

2. Анализ сходства конформационных и линейных пептидов в

белках-аллергенах.

3. Разработка метода представления поверхностных участков

пространственной структуры белка набором

конформационных пептидов.

4. Анализ структурной и функциональной близости белков-

аллергенов, обладающих сходными конформационными

пептидами.

5. Разработка метода предсказания аллергенности белков на основе

анализа конформационных пептидов.

6. Анализ влияния факторов среды обитания микроорганизмов на

наличие аллергенных белков в их протеомах.

Объект и предмет исследования

Аллергия - это одна из наиболее распространенных проблем со здоровьем в индустриальных странах. Элиминационная терапия остается эффективным способом предотвращения развития аллергических реакций, в связи с чем, представляет интерес анализ аллергенных свойств белков. Объектом исследования являются конформационные пептиды, рассчитанные на основе анализа первичной и пространственной структуры белков. Основным предметом исследований в настоящей работе является связь конформационных пептидов с аллергенностью белков. Конформационные пептиды - это цепочки аминокислотных остатков, которые сближены на поверхности белка, но могут лежать отдельно друг от друга в его аминокислотной последовательности. Пространственные структуры белков используются для выявления участков белковой поверхности, способных взаимодействовать с ^Е-антителами, участвующими в развитии аллергических реакций. Поверхность белковой молекулы представляется в виде набора конформационных пептидов. Предполагается, что такие пептиды могут содержать информацию об эпитопах, распознаваемых антителами. С использованием конформационных пептидов осуществляется предсказания аллергенности белков.

Научная новизна исследования

Существующие методы предсказания аллергенности белков строятся на подходах, основанных на выявлении гомологии по аминокислотным последовательностям между анализируемыми белками и известными белками-аллергенами, а также на анализе аминокислотного состава и физико-химических свойств коротких линейных фрагментов аминокислотных последовательностей. При этом упускается очень важная информация о структурной организации белковых поверхностей, которые содержат сайты

связывания IgE, т.е., непосредственные мишени для взаимодействия IgE с белком. Прямой учет в методах предсказания аллергенности различных сайтов, образованных на поверхности белковой молекулы, представляет большую сложность в связи с тем, что эти сайты, как правило, являются конформационными, т.е. состоящими из удаленных друг от друга в последовательности аминокислотных остатков. В данной работе впервые предложено использовать для предсказания аллергенности белков представление их поверхности в виде набора конформационных пептидов. Такие пептиды являются моделью линейных пептидов, поскольку составлены из разрывных участков аминокислотной последовательности белка. В работе впервые была создана база данных конформационных и линейных пептидов аллергенных белков, с указанием их потенциального вклада в аллергенность. Обеспечены доступ к базе данных через Интернет и возможность поиска при помощи программы BLAST (http://www-bionet.sscc.ru/psd/cgi-bin/programs/Blast/blast_local.cgi). С использованием этой базы создан новый метод предсказания аллергенности белков, превосходящий по точности известные методы. Проведена оценка перекрестной реактивности между белками Schistosoma mansoni и известными аллергенами. Впервые показано, что негомологичные белки, содержащие на своей поверхности сходные конформационные пептиды, могут иметь также сходные аллергенные и функциональные свойства. Впервые предсказано наличие связи между патогенностью микроорганизмов и количеством аллергенных для человека белков у данных микроорганизмов.

Практическая значимость работы

Метод предсказания аллергенности белков и база данных конформационных пептидов белков-аллергенов были интегрированы в систему Protein Structure Discovery и ICGenomics. Метод способен анализировать аллергенность белков по их первичной структуре, учитывая

при этом информацию о конформационных эпитопах известных аллергенов, что делает возможным его применение для анализа больших множеств белков и целых протеомов. Полученные результаты могут быть использованы для планирования экспериментов по проверке аллергенных свойств белков, поиску эпитопов IgE-антител, проектированию новых белков и пептидов для проведения аллерген-специфической иммунотерапии (АСИТ).

Положения, выносимые на защиту

Разработанный метод определения аллергенности белков на основе сравнения конформационных пептидов известных белков-аллергенов с пептидами анализируемых белков позволяет предсказывать аллергенность белков с высокой точностью.

Негомологичные белки-аллергены характеризуются наличием сходных конформационных и линейных пептидов.

Аллергенность микроорганизмов (отношение количества белков, предсказанных как аллергены, к общему числу белков в протеоме данного микроорганизма) положительно коррелирует с их патогенностью.

Апробация результатов исследования

Результаты работы были представлены на международных и российских конференциях: на осенней школе International Autumn School for Young Scientists on Computational Systems Biology and Bioinformatics, 2009, Novosibirsk, Russia; на летней школе summer school and workshop Integrative Biological Pathway Analysis and Simulation - 2010, Bielefeld, Germany; международной конференции The 7th International Conference on Bioinformatics of Genome Regulation and Structure - 2010, Novosibirsk, Russia; конференции Интерра-2011 Секция "Биомедицина", Новосибирск, Россия;

школе молодых ученых "Биоинформатика и системная биология" 2011, Новосибирск, Россия; конференции "Постгеномные методы анализа в биологии, лабораторной и клинической медицине: геномика, протеомика, биоинформатика" 2011, Новосибирск, Россия; открытии RCIBC 2011, Новосибирск, Россия; международной конференции Bioinformatics of Genome Regulation and StructureVSystems Biology — BGRS\SB-2012; международной конференции International Conference on Postgenomic Technology for Biomedicine 2012, Новосибирск, Россия; конкурс «Участник молодежного научно-инновационного конкурса» («УМНИК») Медицина Будущего 2012, Новосибирск, Россия.

Публикации

В результате выполнения работы было опубликовано 5 статей в рецензируемых журналах, рекомендованных ВАК, 4 тезиса к российским и международным конференциям, получено одно свидетельство о государственной регистрации программы для ЭВМ.

Структура диссертации

Работа состоит из оглавления, списка сокращений, введения, пяти гл