Бесплатный автореферат и диссертация по биологии на тему
Разработка методических подходов к рациональному дизайну полиэпитопных T-клеточных антигенов
ВАК РФ 03.01.03, Молекулярная биология

Автореферат диссертации по теме "Разработка методических подходов к рациональному дизайну полиэпитопных T-клеточных антигенов"

На правах рукописи QQ5U40V«- 4------

Антонец Денис Викторович

Разработка методических подходов к рациональному дизайну полиэнитопных Т-клеточных антигенов

03.01.03 - Молекулярная биология

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата биологических наук

Кольцово - 2013

3 1 ЯНВ 2013

005048888

Работа выполнена в Федеральном бюджетном учреждении науки «Государственный научный центр вирусологии и биотехнологии «Вектор»

Научный руководитель

Бажан Сергей Иванович, доктор биологических наук, заведующий теоретическим отделом ФБУН Государственный научный центр вирусологии и биотехнологии «Вектор»

Официальные Жуков Владимир Александрович - доктор

оппоненты биологических наук, кандидат технических наук,

заместитель генерального директора по ИТ ЗАО «Вектор-Бест»

Рыжиков Александр Борисович - кандидат биологических наук, заведующий отделом зоонозных инфекций и гриппа ФБУН Государственный научный центр вирусологии и биотехнологии «Вектор»

Ведущая ФГБУН Институт цитологии и генетики Сибирского

организация отделения Российской академии наук

Защита состоится «01 » марта 2013 г. в 11 часов на заседании диссертационного совета Д 208.020.01 при ФБУН Государственный научный центр вирусологии и биотехнологии «Вектор» по адресу: 630559, р.п. Кольцово, Новосибирского района Новосибирской области, тел. (383)336-74-28

С диссертацией можно ознакомиться в библиотеке ФБУН ГНЦ ВБ «Вектор»

Автореферат разослан « 18 » января 2013 г.

Ученый секретарь диссертационного совета д.б.н. Г.П. Трошкова

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Аю-уальность проблемы. Т-клеточные эпитопы приобретают все большее значение в качестве инструментов для разработки новых средств иммунодиагностики и иммунотерапии, а также для проектирования искусственных полиэпитопных антигенов — вакцин против инфекционных и онкологических заболеваний (Berzofsky & Berkower, 1995; Woodberry et al., 1999; Bazhan et al., 2004; Tine et al., 2005; Iglesias et al., 2007; Cardinaud et al., 2009). Разработка компьютерных методов предсказания Т-клеточных эпитопов является одной из главнейших задач биоинформатики в области иммунологии, так как применение программ, предсказывающих Т-клеточные эпитопы, позволяет значительно сократить временные и материальные затраты по сравнению с использованием при поиске новых эпитопов и разработке полиэпитопных антигенов только экспериментальных подходов (Liu et al., 2011). Несмотря на то, что к настоящему времени создано большое количество различных программ для предсказания Т-клеточных эпитопов (Singh & Raghava, 2003; Nielsen et al., 2004; Wan et al., 2006; Kim et al, 2012), разработка новых методов остается по-прежнему актуальной задачей, так как ни один из ныне существующих методов не может быть признан единственно верным и превосходящим прочие, и поскольку использование консенсусного подхода, объединяющего возможности различных алгоритмов, в значительной степени превосходит по качеству предсказаний Т-клеточных эпитопов каждый из методов по отдельности (Wang et al., 2008; Lafuente & Reche, 2009).

Конструирование полиэпитопных Т-клеточных антигенов, содержащих множественные Т-клеточные эпитопы, является одним из наиболее многообещающих подходов к созданию новых эффективных и безопасных вакцин (Berzofsky & Berkower, 1995; Woodberry et al., 1999; Bazhan et al., 2004; Tine et al., 2005; Iglesias et al., 2007; Cardinaud et al., 2009). Несмотря на то, что в первых работах, посвященных изучению ДНК-вакцин, кодирующих искусственные полиэпитопные антигены, была показана способность конструкций, составленных в результате простого объединения эпитопов, индуцировать цитотоксический Т-клеточный ответ на все эпитопы, включенные в их состав (Thomson et al., 1995), в дальнейшем было обнаружено, что иммуногенность пептидов в составе полиэпитопа в значительной степени зависит от фланкирующих аминокислотных остатков (Livingston et al., 2001). Введение в состав полиэпитопного антигена спейсерных аминокислотных последовательностей, обеспечивающих образование сайтов протеасомного расщепления между эпитопами и оптимизирующих связывание пептидных фрагментов с ТАР (транспортерами, ассоциированными с процессингом антигенов, транслоцирующими олигопептиды в эндоплазматический ретикулум), приводит к увеличению иммуногенности за счет повышения эффективности процессинга и презентации целевых эпитопов иммунной системе (Ishioka et al., 1999; Livingston et al., 2001; Cardinaud et al., 2009). Кроме того, существенное влияние на иммуногенность оказывают перестановки эпитопов в составе полиэпитопной конструкции (Livingston et al., 2001).

Однако, несмотря на большое количество работ, посвященных конструированию полиэпитопных антигенных конструкций и исследованию их иммуногенности и протективности, к настоящему моменту не было предложено ни одного алгоритма рационального конструирования полиэпитопных Т-клеточных антигенов.

Цели исследования. Разработка новых методов предсказания Т-клеточных эпитопов и алгоритмов рационального дизайна полиэпитопных Т-клеточных антигенов.

Задачи исследования:

1. Разработка статистических моделей, предсказывающих аффинность связывания олигопептидов с различными алломорфами молекул МНС.

2. Выбор оптимальной схемы параметризации пептидов в результате сравнения качества предсказаний, полученных моделями, использующими различные способы параметризации олигопептидов -записи аминокислотных последовательностей в виде разреженных векторов (факторизация аминокислот), либо в виде векторов физико-химических свойств аминокислотных остатков.

3. Подтверждение качества полученных предсказательных моделей в результате сравнительного тестирования с рядом других известных методов предсказания Т-клеточных эпитопов (БУРРЕГГШ, РгоРгесП, 8УМНС, БУЯМНС, ЫегМНС, 8ММРМВЕС и 1ЕОВ_гесоттспс1ес1).

4. Формализация задачи рационального дизайна полиэпитопных антигенов и разработка алгоритма ее решения, выбирающего наилучшие спейсерные последовательности для каждой пары эпитопов и подбирающего оптимальное взаимное расположение эпитопов в составе полиэпитопа с целью увеличения эффективности презентации целевых эпитопов и минимизации количества нецелевых.

5. Создание на основе разработанных алгоритмов и методов программного обеспечения для предсказания Т-клеточных эпитопов и для проектирования полиэпитопных Т-клеточных антигенов.

6. Конструирование с помощью созданного программного обеспечения прототипа полиэпитопного антигена меланомы человека для верификации разработанных моделей, алгоритмов и программ.

Научная новизна и праетическая значимость. В рамках данной работы были разработаны статистические регрессионные модели для предсказания аффинности связывания олигопептидов с 35 различными аллельными вариантами молекул НЬА I класса. Полученные модели продемонстрировали высокое качество предсказаний. Впервые было проведено исследование, направленное на выявление скрытой размерности пространства, описывающего взаимное сходство иммунохимических свойств аминокислотных остатков. Впервые была формализована задача рационального дизайна полиэпитопных Т-клеточных антигенов и разработан алгоритм ее решения.

На основе разработанных моделей и алгоритмов было создано программное обеспечение для предсказания Т-клеточных эпитопов (ТЕргесИй) и рационального дизайна полиэпитопных Т-клеточных антигенов

(PolyCTLDesigner). Был проведен дизайн полиэпитопного антигена, составленного из предсказанных CD8+ и CD4+ Т-клеточных эпитопов 6 антигенов меланомы человека, и получена ДНК-вакцинная конструкция, несущая искусственный ген, кодирующий целевой полиэпитоп. Изучение созданной ДНК-вакцины в системе индукции Т-клеточного иммунного ответа ex vivo подтвердило иммуногенность полиэпитопной конструкции и перспективность выбранного направления исследований.

Разработанные в рамках исследования методы, алгоритмы и программное обеспечение могут быть использованы для проектирования полиэпитопных антигенов — новых кандидатных иммунотерапевтических и профилактических вакцин от онкологических и инфекционных заболеваний человека.

Положения, выносимые на защиту:

1. Разработанные статистические регрессионные модели предсказывают аффинность связывания нонамерных пептидов с 35 аллельными вариантами молекул МНС I класса человека.

2. Модели, использующие кодирование пептидов в виде векторов свойств составляющих их аминокислотных остатков, обеспечивают большую специфичность при соответствующей чувствительности предсказаний, по сравнению с моделями, кодирующими олигопептиды в виде разреженных векторов.

3. Разработанные модели по качеству предсказаний превосходят такие методы как SYFPEITHI, ProPredl, SVMHC и SVRMHC и не уступают лучшим современным методам предсказания Т-клеточных эпитопов NetMHC, SMMPMBEC и IEDB_recommended.

4. Разработанный алгоритм рационального дизайна полиэптопных Т-клеточных антигенов позволяет оптимизировать структуру полиэпитопной конструкции с учетом современных знаний о путях процессинга белковых антигенов и их презентации иммунной системе.

5. Полиэпитопная конструкция MEL-TCI-A0201, спроектированная с помощью разработанных моделей и алгоритмов, содержащая множественные CD4+ и CD8+ Т-клеточные эпитопы основных антигенов меланомы человека, обладает способностью индуцировать специфический Т-клеточный иммунный ответ.

Вклад автора. Создание статистических регрессионных моделей для предсказания аффинности связывания олигопептидов с 35 аллельными вариантами молекул HLA I класса, создание программного обеспечения для предсказания Т-клеточных эпитопов и разработка алгоритма и программного обеспечения для дизайна полиэпитопных Т-клеточных антигенов, проектирование Т-клеточных полиэпитопных антигенов было осуществлено автором лично. Получение ДНК-вакцин, кодирующих целевые полиэпитопные антигены, было осуществлено сотрудниками отдела биоинженерии ФБУН ГНЦ ВБ «Вектор». Исследование иммуногенности созданных полиэпитопных антигенов проведено сотрудниками лаборатории молекулярной иммунологии НИИ Клинической иммунологии СО РАМН без участия автора.

Структура и объем работы. Диссертация изложена на 144 страницах машинописного текста и состоит из введения, обзора литературы, главы «Материалы и методы», главы «Результаты и обсуждение», заключения, выводов и списка литературы. Библиография включает 274 работы. Работа иллюстрирована 24 рисунками и включает 6 таблиц.

Апробация результатов диссертации и публикации. По материалам диссертационной работы опубликовано 5 статьей в реферируемых научных журналах, входящих в список ВАК, подана заявка на патент РФ (регистрационный №2012136088 от 21.08.2012 г.). Результаты работы были представлены на 17 международных и российских конференциях.

Программное обеспечение, созданное в рамках данной работы, опубликовано на сайте проекта (http://tepredict.sourceforge.net) под свободной лицензией Creative Commons Attribution Non-Commercial License V2.0 (CC BY-NC 2.0). С момента создания было загружено более 200 раз пользователями из 30 стран.

МАТЕРИАЛЫ И МЕТОДЫ ИССЛЕДОВАНИЯ

Формулировка моделей, предсказывающих аффинность связывания олигопептидов с молекулами МНС. Модели, предсказывающие аффинность связывания олигопептидов с молекулами МНС, как правило, основаны на предположении о том, что энергия связывания пептида с молекулой МНС может быть представлена как сумма вкладов каждого из аминокислотных остатков (а.к.о.) пептида (Parker et al., 1994). Для построения предсказательных моделей была использована информация, извлеченная из IEDB (Immune Epitope Database) (Peters et al., 2005). В качестве количественной меры аффинности связывания олигопептида с молекулой МНС для построения моделей использовалось значение pICso — отрицательного десятичного логарифма значения 1С50 (50 % ингибирующей концентрации), извлеченного из IEDB. При построении моделей использовались данные только о нонамерных пептидах, поскольку показано, что пептиды, взаимодействующие с молекулами МНС I класса, в основном имеют длину в 9 а.к.о. (Rudolph et al., 2006; Lundegaard et al., 2010).

Модели, предполагающие независимость вкладов индивидуальных а.к.о., могут быть представлены в виде формулы (1), где Р, является вектором свойств, кодирующим аминокислоту в позиции г, а /?, - вектор коэффициентов уравнения регрессии.

р1С;0 = ¿ДР, + const (1)

i=1

Кроме того, были созданы модели, учитывающие взаимное влияние соседних аминокислот, представленные формулой (2), где Р, является вектором свойств, кодирующим аминокислоту в позиции i, aß, — вектор коэффициентов независимых вкладов каждого из а.к.о. олигопептида; г, — вектор коэффициентов для пар соседних а.к.о., а ю, - для троек соседних а.к.о.

pic 10= i А p,, ir, +1 ^ + (2 >

Для построения предсказательных моделей использовались метод частных наименьших квадратов (PLS - partial least squares) и его недавняя модификация

- SPLS (sparse partial least squares).

Параметризация аминокислот и олигопептидов. Существенное влияние на точность моделей оказывает выбор схемы параметризации (Lui et al., 2006; Kim et al., 2009). Для параметризации пептидов в данной работе были использованы следующие способы:

1) а.к.о. пептида представляются в виде взаимно ортогональных факторов

- каждый а.к.о. кодируется в виде разреженного вектора (sparse encoding);

2) а.к.о. записываются в виде векторов свойств, полученных из шкалы свойств а.к.о., созданной Кидера и соавторами (Kidera et al., 1985);

3) кодирование в виде векторов свойств, полученных из шкалы свойств а.к.о., предложенной Лю и соавторами (Liu et al., 2006);

4) кодирование а.к.о. в виде соответствующих строк матрицы THREADERÑORM (Dosztanyi & Torda, 2001), приведенной к симметричному виду и нормированной согласно By и коллегам (Wu et al., 2006);

5) кодирование а.к.о. пептида в виде соответствующих строк матрицы РМВЕС (Kim et al., 2009).

С помощью метода независимых компонент (ICA - independent component analysis), реализованного в библиотеке программ PearsonICA (Karvanen & Koivunen, 2002) для языка и среды статистического анализа и моделирования R (http://r-project.org), а также с помощью метода Саммона (Sammon, 1969) и метода изометрического шкалирования (Chen et al., 2008), реализованных в библиотеке MASS (Venables & Ripley, 2002) для R, на основе матрицы РМВЕС был создан ряд шкал меньшей размерности (от 2 до 19 координат).

Метод частных наименьших квадратов (PLS). Метод частных наименьших квадратов (Partial Least Squares) был разработан в 1966 году для решения задач эконометрики (Wold, 1966), но стал популярным уже как метод хемометрики (Wold et al., 1983), а затем начал широко использоваться в самых различных областях, в том числе в биоинформатике (Doytchinova et al., 2004а; Bremel & Homan, 2010). Столь широкое использование метода PLS обусловлено тем, что он способен эффективно работать с данными со значительным уровнем шума и коллинеарности, а также в случаях, когда количество регрессоров превышает количество наблюдений, когда обычные методы множественной регрессии практически бессильны. Подробное описание метода представлено в литературных источниках (Эсбенсен, 2003; Mevik & Wehrens, 2007). В данной работе был использован метод, реализованный в библиотеке компьютерных программ pis (Mevik & Wehrens, 2007) для R.

Метод SPLS (Sparse Partial Least Squares). Несмотря на то, что в основе метода PLS лежит снижение размерности, он не предназначен для отбора признаков, и, кроме того, поскольку скрытые компоненты, найденные с помощью PLS, представляют собой линейные комбинации всех переменных,

интерпретация полученной модели может вызвать значительные затруднения, особенно в случае высокой размерности данных. Недавно было показано, что при использовании метода PLS наличие в данных нерелевантных предикторов оказывает существенное влияние на результат, и был предложен новый метод, названный SPLS (sparse partial least squares), способный выбрать оптимальное количество релевантных предикторов и число скрытых компонент (Chun & Keles, 2010; Chun & Keles, 2010a). В данной работе был использован метод SPLS, реализованный в библиотеке программ spls (Chun & Keles, 2010) для R.

Использованное программное обеспечение. Все программы, созданные в рамках данной работы, были написаны на языке программирования Python. Операции с массивами и матрицами реализованы с использованием библиотеки SciPy (Jones et al., 2001). Для чтения аминокислотных последовательностей из файлов формата Fasta или GenBank использованы функции, реализованные в библиотеке BioPython (Cock et al., 2009). Построение статистических моделей проводилось с использованием языка и среды статистического моделирования R (версии 2.4.1-2.15.1) с помощью среды разработки RStudio. Для анализа способов параметризации аминокислот и для снижения размерности описательного пространства были использованы метод Саммона и метод изометрического шкалирования, реализованные в библиотеке MASS (Venables & Ripley, 2002) для R, а также метод независимых компонент, реализованный в бибилиотеке PearsonICA (Karvanen & Koivunen, 2002) для R. Для построения предсказательных моделей были использованы специализированные библиотеки для R: pis (Mevik & Wehrens, 2007) и spls (Chun & Keles, 2010). Для оценки качества предсказаний использовалась библиотека ROCR (Sing et al., 2005) для R. При создании программы PolyCTLDesigner для выбора оптимальной последовательности цитотоксических эпитопов был использован генетический алгоритм решения задачи коммивояжера, реализованный в библиотеке программ PyEvolve для Python. Все использованное в данной работе программное обеспечение, а также программы, созданные автором данного исследования, распространяются под различными свободными лицензиями.

Дополнительные модели, использованные в программах TEpredict и PolyCTLDesigner. Кроме оригинальных моделей в программы TEpredict и PolyCTLDesigner были включены:

• Модель для предсказания протеасомного процессинга белковых антигенов (Toes et al., 2001; Singh & Raghava, 2003).

• Модель для предсказания иммунопротеасомного процессинга белковых антигенов (Toes et al., 2001; Singh & Raghava, 2003).

• Модели для предсказания CD8+ Т-клеточных эпитопов, разработанные Сингхом и Рагхавой для ProPredl (Singh & Raghava, 2003).

• Модели для предсказания CD4+ Т-клеточных эпитопов, разработанные Сингхом и Рагхавой для ProPred (Singh & Raghava, 2001). В основе этих моделей лежат виртуальные матрицы, описывающие специфичность сайтов связывания пептидов различных алломорф HLA-DRB, реализованные в программе TEPITOPE (Sturniolo et al., 1999).

• Модели для предсказания CD8+ Т-клеточных эпитопов, разработанные Бхасином и Рагхавой для nHLAPred (Bhasin & Raghava, 2007).

• Модель для предсказания аффинности связывания олигопептидов с ТАР, разработанная Петерсом и коллегами (Peters et al., 2003).

• Модель для предсказания аффинности связывания олигопептидов с ТАР, разработанная Дойчиновой и коллегами (Doytchinova et al., 2004).

РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ

Создание статистических моделей для предсказания аффинности связывания олигопептидов с различными алломорфами молекул HLA I класса. Для построения моделей был выбран метод частных наименьших квадратов (PLS). Из базы данных Immune Epitope Database (IEDB) (Peters et al., 2005) были собраны тренировочные наборы пептидов, для которых были определены количественные характеристики связывания с любым из 35 аллельных вариантов молекул HLA I класса (HLA-A*0101, А*0201, А*0202, А*0203, А*0206, А*0301, А* 1101, А*2301, А*2402, А*2403, А*2601, А*2902, А*3001, А*3002, А*3101, А*3301, А*6801, А*6802, А*6901, В*0702, В*0801, В* 1501, В* 1801, В*2705, В*3501, В*4001, В*4002, В*4402, В*4403, В*4501, В*5101, В*5301, В*5401, В*5701, В*5801) - значения 1С50, концентрации полумаксимального ингибирования. 1С50 определяется в результате исследования конкурентного ингибирования связывания с молекулой МНС меченного референсного пептида различными концентрациями исследуемого пептида (Sette et al., 1994; van der Burg et al., 1996). Пептиды, для которых значение 1С50 превышает 500 нМ (pIC50 < 6.3), что соответствует низкой аффинности связывания с молекулой МНС, практически не обладают способностью индуцировать цитотоксический Т-клеточный ответ (Sette et al., 1994). Нонапептиды, для которых аффинность связывания была измерена недостаточно точно или была охарактеризована лишь качественно, вошли в тестовые наборы. При обучении моделей использовался метод полной кросс-валидации (LOO - leave one out).

Для параметризации пептидов применялось кодирование аминокислот в виде векторов свойств, поскольку такой подход позволяет учесть взаимное сходство а.к.о., как это было отмечено в литературе (Nielsen et al., 2003; Wan et al., 2006; Kim et al., 2009). Было использовано несколько схем кодирования: запись аминокислот в виде векторов с 10 координатами - значениями, взятыми из шкал, разработанных Кидера и др. (К 10); запись в виде векторов с 11 координатами, соответствующими значениям, взятым из шкал, разработанных Лю и др. (LI 1); и запись в виде соответствующих строк матрицы THREADER_NORM (THDR).

Полученные модели были протестированы на данных, не включенных в тренировочные выборки. Для каждого из аллельных вариантов МНС были выбраны наилучшие модели. В двух из них для параметризации аминокислот используется шкала К10; в восьми - шкала L11 и в 25 моделях используется шкала THDR. Большинство моделей продемонстрировали хорошее качество

предсказания - значение площади под графиком ошибок (AUC - Area Under the Curve), характеризующим специфичность и чувствительность предсказания, было не меньше 0.76, у 20 из них значение AUC было больше 0.80 (HLA-А*0101, А*0201, А*0206, А*0301, А*1101, А*2402, А*2403, А*3001, А*3101, А*3301, А*6801, А*6802, А*6901, В*0702, В*0801, В* 1501. В*2705, В*4402, В*5701, В*5801), для 8 моделей полученное значение AUC превысило 0.9 (высокое качество предсказаний). При пороговом значении р1С50, равном 6.3, для всех выбранных моделей специфичность (Спец) предсказаний находилась в диапазоне от 0.25 до 1.0 (медианное значение Спецб.З было равно 0.70), чувствительность (Чув) - в диапазоне от 0.33 до 1.0 (медианное значение Чувб.З было 0.81), точность (Точ) - 0.35-0.96 (медианное значение Точб.З равно 0.76). При р1С50, равном 7.3, специфичность находилась в пределах от 0.74 до 1.0 (медианное значение было равно 0.95), чувствительность - от 0.03 до 0.82 (медианное значение 0.35), точность - 0.48-0.98 (медианное значение 0.72) (Рис. 1).

1.0

0.8 0.6 0.4 0.2 0.0

Qcococooootocotocoeo

Рис. 1. Результаты тестирования новых PLS-моделей, предсказывающих аффинность связывания олигопептидов с 35 различными аллельными вариантами молекул HLA I класса. AUC - распределение значений площади под кривой ошибок, характеризующей специфичность и чувствительность предсказания. Обозначения Спецб.З, Чувб.З и Точб.З соответствуют значениям специфичности, чувствительности и точности (accuracy) предсказаний при пороговом значении pIC5o = 6.3.

Для четырех аллельных вариантов молекул HLA I класса (А*0101, А*0201, А*0301 и В*0702) проводилось сравнительное тестирование качества предсказаний, полученных с помощью созданных моделей и программ SVRMHC (Wan et al., 2006), SVMHC (Donnes & Elofsson, 2002), ProPredl (Singh & Raghava, 2003) и SYFPEITHI (Rammensee et al., 1999). Для каждого из аллелей было сформировано по две тестовые выборки: одна из данных, собранных из базы MHCBN (Bhasin et al., 2003), и другая из данных IEDB. В тестовые выборки были включены как нонамерные пептиды, так и пептиды большей длины. В последнем случае пептид считался связывающимся с аллельным вариантом молекулы МНС, если в его составе предсказывался способный к связыванию нонапептид. ROC-кривые (кривые ошибки, характеризующие специфичность и чувствительность предсказания) приведены

на Рисунке 2. Результаты сравнительного тестирования показали, что разработанные модели превосходят все другие использованные методы.

а б

HLA-A-OIOI HLA-Aft020I

ТЕрмйМ: 0.79. РтСг.чП: 1).(о, ХУКМНСЮ.Об, ТЕргаКи: 11.91, РгоРге<П: (Ш. ^'а.ЧНС: (1.36;

5УРРЕ1ТН1:1) 62. ХУМНСш. »,6Н. 5¥РРЫТН1. 0.Й1. 5УМНСнпО.М>, SVMHCs-.li.59

Чувствительность

Рис. 2. Сравнение качества предсказаний программ ТЕргесНй (оригинальные модели), РгоРгесП, БУМНС, вУЯМНС и 8УРРЕ1ТН1 для НЬА-А*0101 (а), НЕА-А*0201 (б), НЬА-А*0301 (в) и НЬА-В*0702 (г) с использованием тестовых наборов из базы данных МНСВЫ. Приведены графики ошибок (ЯОС) - графики чувствительности (ось абсцисс) и специфичности (ось ординат). Для каждого из методов указано значение АиС. вУМНСт обозначает, что для предсказания использовались модели БУМНС, для обучения которых использовались данные МНСВЫ, ЗУМНСэ - что данные модели были получены с использованием базы данных 8УРРЕГГН1.

Создание программы для предсказания Т-клеточных эпитопов. На

основе разработанных моделей была создана программа TEpredict. Для ее написания был выбран высокоуровневый объектно-ориентированный интерпретируемый язык программирования Python. TEpredict - кросс-платформенное программное обеспечение. Кроме того, был создан дистрибутив программы для ОС Windows, содержащий исполняемые файлы и не требующий установки Python на компьютере пользователя. TEpredict позволяет проводить предсказание CD8+ Т-клеточных эпитопов с использованием как оригинальных моделей, так и моделей программ ProPredl (Singh & Raghava, 2003) и nHLAPred (Bhasin & Raghava, 2007); предсказывать CD4+ Т-клеточные эпитопы с

помощью моделей ProPred (Singh & Raghava, 2001); предсказывать протеасомный и иммунопротеасомный процессинг антигенов, используя модели, разработанные Тоузом и коллегами (Toes et al., 2001), и аффинность связывания олигопептидов с ТАР, используя известные модели (Peters et al., 2003; Doytchinova et al., 2004). Программа находится в свободном доступе на сайте проекта http://tepredict.sourceforge.net.

Обновление моделей, используемых программой TEpredict для предсказания Т-клеточных эпитопов. Выбор схемы параметризации олигопептидов оказывает существенное влияние на точность моделей, особенно когда построение модели выполняется на основе небольшого тренировочного набора данных, в то время как теоретически возможное количество различных нонапептидов равно 5.12 * 10м (209). Таким образом, использование адекватной меры взаимного сходства а.к.о. позволяет создать более точные модели, чем кодирование а.к.о. в виде разреженных векторов (Wan et al., 2006; Kim et al., 2009). В данной работе для параметризации пептидов, помимо кодирования а.к.о. в виде взаимно ортогональных факторов (sparse encoding), была использована недавно разработанная матрица сходства аминокислотных остатков РМВЕС (Kim et al., 2009). Авторами матрицы РМВЕС было убедительно показано превосходство моделей, построенных с ее помощью, над моделями, построенных с помощью записи пептидов в виде разреженных векторов или с помощью матрицы BLOSUM62. В отличие от матрицы BLOSUM62, согласно РМВЕС аминокислотные остатки, имеющие противоположные заряды, существенно отличаются, что гораздо более обосновано с физической точки зрения при анализе взаимодействия пептидов с молекулой МНС (Kim et al., 2009). Кроме того, были созданы модели, использующие для параметризации пептидов матрицу THDR, показавшую хорошие результаты ранее.

Матрица РМВЕС является вырожденной - существует значительная корреляция между профилями различных аминокислотных остатков. Согласно литературным данным (Kidera et al., 1985; Wan et al., 2006; Launay et al., 2007), скрытая размерность пространства, описывающего аминокислотные остатки, должна быть ниже 20 и согласно указанным источникам должна равняться 10, 11 и 4, соответственно. С помощью метода главных компонент и факторного анализа матрицы РМВЕС было обнаружено, что оптимальным для описания а.к.о. является использование от 4 до 8 компонент. Даже проекция шкалы РМВЕС в двумерное и трехмерное пространство приводит к отчетливой кластеризации аминокислот по их физико-химическим свойствам (Рис. 3).

Оригинальное 20-мерное пространство РМВЕС, описывающее аминокислотные остатки, было преобразовано в ряд пространств меньшей размерности (от 2 до 19 измерений). Шкалирование проводилось с использованием метода независимых компонент (ICA) (Karvanen & Koivunen, 2002) либо с использованием изометрического многомерного шкалирования (isoMDS) (Chen et al., 2008) и метода Саммона (Sammon, 1969), реализованных в библиотеке MASS для R. Все полученные шкалы (наряду с оригинальной матрицей РМВЕС и кодированием пептидов в виде разреженных векторов)

были использованы для построения моделей, предсказывающих аффинность связывания нонапептидов с 35 различными аллельными вариантами молекул НЬА I класса. Шкалы, полученные с помощью изометрического шкалирования и метода Саммона в дальнейшей работе не использовались, так как РЬБ-модели, построенные с их использованием, по качеству предсказаний уступают моделям, построенным с помощью шкал той же размерности, полученных методом независимых компонент (Рис. 4).

Рис. 3. А и Б - отображения аминокислотных остатков, записанных в виде строк матрицы РМВЕС, в двумерное и трехмерное пространство, соответственно. Снижение размерности матрицы РМВЕС было выполнено с помощью метода независимых компонент ICA (Karvanen & Koivunen, 2002).

Comparison of 10D scales AUC values

Рис. 4. Сравнение PLS моделей, использующих для параметризации пептидов различные 10-мерные шкалы, и моделей, использующих шкалы РМВЕС и sparse. 10-мерные шкалы были полученны из оригинальной матрицы РМВЕС с помощью метода Саммона (samlO), изометрического шкалирования (isomdslO) или анализа независимых компонент (icalO). Также приведены распределения значений AUC, полученных в результате тестирования моделей, использующих шкалы РМВЕС и sparse.

Для создания новых статистических моделей были использованы методы PLS и SPLS. Были использованы готовые тестовые и тренировочные наборы пептидов (Kim el al., 2009). Модели строились с использованием 10-кратной кросс-валидации. Для каждого из 35 аллельных вариантов HLA было построено по 5 моделей и итоговым результатом предсказания является среднее арифметическое значений р1С50.

На основе анализа построенных моделей для дальнейшей работы была выбрана 11-мерная шкала (ical Is), так как модели, использующие ее, содержат меньшее количество скрытых переменных, чем построенные с использованием шкал ica7s-ical0s, ical2s, ical3s и, тем более, с РМВЕС. По значениям AUC и коэффициента корреляции Пирсона PLS модели, построенные с использованием ical Is, превосходили модели, построенные с использованием

шкал ica3s-icalOs, и не уступали моделям, построенным с использованием шкал ical2s-ical4s, а также РМВЕС и sparse (Рис. 5).

A. PL S models AUC val ues Б- PL S models Pearson's correlation с oeffteient values

1-0 -

0.3 -

o.a -

o.e

Рис. 5. Распределения значений AUC (А) и коэффициентов корреляции Пирсона (Б), полученных в результате тестирования моделей. Модели были построены с помощью метода PLS, для параметризации олигопептидов использовались шкалы ica3s, ica4s, ica5s, ica6s, ica7s, ica8s, ica9s, icalOs, ical Is, ical2s, ical3s, ical4s, РМВЕС или sparse.

Для PLS моделей, построенных с помощью шкалы ical Is, среднее и медианное значения AUC, полученные в результате тестирования, составили 0.9054 и 0.9163, соответственно; для моделей, построенных с использованием РМВЕС, эти значения составили 0.9142 и 0.9263, а с использованием sparse -0.9102 и 0.9197, соответственно. Модели, построенные с использованием РМВЕС, достоверно превзошли по значениям AUC модели, построенные на основе шкалы sparse (р = 2.01 х 10"6), значимость отличий определяли с помощью парного теста Уилкоксона. Однако модели, использующие РМВЕС, обладали меньшей точностью в отношении аллелей с небольшими тренировочными наборами (< 500 пептидов), чем модели, построенные на основе шкал, полученных с помощью ICA.

Далее проводилось построение моделей с помощью SPLS с использованием шкалы ical Is, РМВЕС, THDR, и шкалы ica5. Результаты анализа качества предсказаний полученных моделей показали, что модели, построенные с использованием шкалы ica5, существенно уступают моделям, использующим другие шкалы. Интересно отметить, что качество моделей, построенных с помощью РМВЕС, THDR и ical Is практически не отличается ни по значениям AUC, ни по значениям коэффициента корреляции Пирсона (Рис. 6). Для моделей, построенных с помощью шкал ical Is, РМВЕС и THDR, медианные значения AUC составили 0.8975, 0.9017 и 0.9039, а средние - 0.8811, 0.8767 и 0.8828, соответственно. Однако модели, построенные с помощью ical Is, отличаются меньшей сложностью - они содержат меньшее количество скрытых компонент, а значит, в меньшей степени подвержены переобучению. Кроме того, для аллельных вариантов молекул HLA I с небольшими тренировочными наборами пептидов (менее 500) модели, построенные с

А.

1.0" 0.9 " 0.8 "

¿ее

0.9 " 0.8 -= 0.70.6 -

гЦЦ— -

'ёодЩ-Т

. . и . . . . р . .

1.0 -0.9 -0.8 -

$0.7-о.в -

Ер •

а т

,0 р.

в

■ йе

- а"

■г пЙ'

а ^ . ^

^ в

8 8 ;

оооЗооооо1

<' <' <' <' <! <' <' <' < <' < <' <' <' <' <| <| ш| ю| т' т' т аз аз| со т аэ| со т аз со аз|

5 з' 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 3 5 5 5' 5 5 555 5553335

I I X X X I X

ХХХХХХХХХХХХХХХХХХХХХХХХХХ

Рис. 6. Распределения значений АиС (А) и коэффициента корреляции Пирсона (СС) (Б), полученных в результате тестирования предсказаний аффинности связывания олигопептидов с 35 аллельными вариантами молекул НЬА I класса. Модели были построены с помощью метода ЗРЬБ. Для каждого из указанных аллелей НЬА было построено по пять моделей, использующих для параметризации пептидов шкалы РМВЕС, ТНОЯ или ¡саПэ. Насыщенность окраски показывает число пептидов в тренировочном наборе (от 47 для НЬА-В*5701 до 2471 для НЬА-А*0201).

помощью icalls, продемонстрировали достоверно более высокое качество предсказаний (значение AUC), чем модели, построенные с помощью РМВЕС (р = 0.03). Затем проводилось повторное обучение SPLS-моделей, использующих шкалу ical Is. При этом из тренировочных наборов исключалось до 10 пептидов, определенных как вероятные выбросы с помощью функции pcout из пакета mvoutlier (Filzmoser et al., 2008) для R. После этого качество моделей заметно выросло и достоверно превзошло качество моделей, построенных с помощью РМВЕС (р = 2.7х 10"5) и THDR Ср = 0.002). После повторного обучения моделей, использующих icalls, медианное значение AUC составило 0.9161, среднее - 0.9056. Значение AUC для 75 % моделей превысило 0.88. Значения коэффициентов корреляции Пирсона между предсказанными и измеренными значениями pICso находились в пределах от 0.40 до 0.89; медиана и среднее составили 0.73 и 0.70, соответственно. Несмотря на то, что по значениям AUC SLPS модели практически не отличались от PLS моделей (р = 0.1), они достоверно превзошли PLS модели по значениям коэффициентов корреляции Пирсона (р = 5.84 х 10"8).

Было проведено сравнение качества предсказаний, полученных с помощью новых моделей TEpredict, использующих шкалы РМВЕС и icalls, с предсказаниями, полученными с использованием методов, реализованных на веб-портале IEDB: ann (NetMHC) (Nielsen et al., 2004), SMMPMBEC (Kim et al., 2009) и IEDB_recommended (Kim et al., 2012). Для тестирования были выбраны наборы пептидов для 7 аллельных вариантов молекул HLA I класса (А*0101, А*0201, А*0301, А* 1101, А*2402, В*0801 и В*1501), использованные в недавнем соревновании методов предсказания Т-клеточных эпитопов (Zhang et al., 2011).

Наилучшие результаты (по значению AUC) были получены с использованием метода IEDBrecommended (Рис. 7), но этот метод является полуколичественным, и среди сравниваемых методов результаты его предсказаний в наименьшей степени коррелируют с экспериментально определенными значениями аффинности связывания пептидов с молекулами МНС. По медианным значениям AUC после IEDB_recommended (0.9461) идут icalls (0.9121) и РМВЕС (0.9174), затем следуют ann (0.9081) и smmpmbec (0.9072). Медианные значения коэффициентов корреляции Пирсона для IEDB recommended, icalls, РМВЕС, ann и smmpmbec составили 0.51, 0.65, 0.64, 0.75 и 0.74, соответственно. При сравнении результатов предсказаний по HLA-А*0201, А* 1101 и А*2402 оригинальные модели TEpredict превзошли (по AUC) smmpmbec и ann. Для аллелей HLA-A*0101, А*0301, В*0702 и В* 1501 качество предсказаний, полученных с использованием разных методов, отличалось незначительно. Новые модели, построенные с использованием SPLS и шкал РМВЕС и icalls, показали хорошее качество предсказаний, сопоставимое с качеством лучших современных методов предсказания Т-клеточных эпитопов.

Рис. 7. Сравнение качества предсказаний (AUC) пептидов, связывающихся с различными аллельными вариантами молекул HLA I класса. Проводили сравнение различных методов предсказания: оригинальных моделей, созданных с помощью SLPS с использованием шкалы icalls, и методов IEDB_recommended, smmpmbec и ann, реализованных на сервере IEDB. Тестирование проводилось с использованием тестовых наборов пептидов для HLA-A*0101, HLA-A*0201, HLA-A*0301, HLA-A*1101, HLA-A*2402, HLA-B*0702, HLA-B*0801 и HLA-B*1501 (Zhang et al, 2011)

Разработка программного обеспечения для рационального дизайна полиэпитопных Т-клеточных антигенов. Одним из наиболее многообещающих подходов к созданию новых эффективных и безопасных вакцин является конструирование искусственных полиэпитопных антигенов. В настоящее время активно ведутся работы по созданию и изучению искусственных вакцинных конструкций, содержащих множественные CTL-эпитопы вирусных и раковых антигенов (Woodbeny et al., 1999; Smith et al., 2001; Iglesias et al., 2007; Cardinaud et al., 2009; Gao et al., 2009; Bei & Scardino, 2010; Rosa et al., 2011). Показано, что перестановки эпитопов в рамках полиэпитопной конструкции влияют на иммуногенность эпитопов (Livingston et al., 2001), и что использование спейсерных последовательностей, создающих сайты протеасомного расщепления между эпитопами и оптимизирующих взаимодействие пептидов с ТАР, в значительной степени увеличивает способность полиэпитопов индуцировать цитотоксический Т-клеточный иммунный ответ (Livingston et al., 2001; Cardinaud et al., 2009). Но, несмотря на большое количество работ, посвященных конструированию и исследованию полиэпитопных антигенных конструкций, к настоящему моменту не предложено ни одного алгоритма рационального конструирования полиэпитопных Т-клеточных антигенов. Целью данной работы явилась разработка программного обеспечения PolyCTLDesigner, предназначенного для дизайна полиэпитопных Т-клеточных антигенов, обеспечивающих высокий уровень ответа CD8+ Т-лимфоцитов на все включенные в их состав CTL-эпитопы за счет оптимизации спейсерных последовательностей между эпитопами и оптимизации порядка расположения эпитопов в конструкции.

PolyCTLDesigner интегрирован с программой TEpredict, используемой для предсказания Т-клеточных эпитопов. PolyCTLDesigner позволяет пользователю выбрать минимальный набор эпитопов с известной или предсказанной специфичностью к разным аллельным вариантам молекул МНС I класса, охватывающий выбранный репертуар аллелей HLA с заданным уровнем избыточности. Для выбранного набора эпитопов PolyCTLDesigner проводит предсказание аффинности связывания с ТАР с помощью модели,

recommended smmpirfcec afín ica11s

разработанной Петерсом и коллегами (Peters et al., 2003). После анализа аффинности связывания пептидов с ТАР PolyCTLDesigner проводит анализ всех возможных паросочетаний выбранных пептидов и для каждой пары (пептид «1»-пептид «2») определяет оптимальную спейсерную последовательность, обеспечивающую расщепление эпитопов с высвобождением С-конца первого из пары пептидов. Для предсказания протеасомного и иммунопротеасомного расщепления PolyCTLDesigner использует модели, разработанные Тоузом и коллегами (Toes et al., 2001). Для оптимизации протеасомного расщепления, обеспечивающего высвобождение С-конца пептида «1», N-конец пептида «2» при необходимости может быть продлен спейсерной последовательностью до шести аминокислотных остатков в длину. При этом из предложенной спейсерной последовательности (например, из оптимального, согласно выбранной модели, спейсера ADLVKV) с помощью PolyCTLDesigner последовательно тестируются спейсеры A, AD, ADL, ADLV, ADLVK, ADLVKV. PolyCTLDesigner может использовать и вырожденные мотивы, например [ARSP][DLIT][LGA][VKA], тогда программа генерирует и проверяет все возможные спейсерные последовательности.

При анализе паросочетаний эпитопов создается ориентированный граф, в котором вершины соответствуют эпитопам, а ребра - допустимым паросочетаниям. Для каждого ребра определяется оптимальная последовательность спейсера и вес, вычисляемый ранжирующей функцией согласно формуле (3), где W - вычисляемый вес ребра, который зависит от пептидов pepl и рер2 и спейсерной последовательности ss (spacer sequence); гапкны обозначает ранг наиболее эффективно связывающегося с данным аллелем HLA нецелевого эпитопа; freqHLA ~ генотипическую частоту встречаемости аллеля HLA в целевой популяции; len(ss) - длина спейсера ss; rank,,, — предсказанный ранг сайта протеасомного расщепления, а гапк,трг — сайта иммунопротеасомного расщепления; гапкщл с чертой сверху означает среднее значение параметра; Neps - количество предсказанных нецелевых эпитопов; Nhla ~ количество аллелей HLA, рестриктирующих ответ на нецелевые эпитопы.

W(pepl,pep2,ss) = (£¡H"rankHLJI х freqHul) + len(ss) + 0.5 х min(rankpr,rank¡mpr) + 0.05 x рч (4 - rañI„M) + 0.05 x N^, + 0.05 x NHLÍ + 0.25 x rmk^ + 0.25 x ranklmpr

В созданном ориентированном графе создаются недостающие ребра, соответствующие недопустимым вариантам паросочетаний пептидов, и им присваиваются слишком большие веса. Оптимальная последовательность полиэпитопного антигена находится как полный простой путь в построенном графе, обладающий наименьшей длиной (весом). Для решения этой задачи PolyCTLDesigner использует либо эвристический подход - метод ближайшего соседа, либо генетический алгоритм решения задачи коммивояжера, реализованный в библиотеке PyEvolve. Алгоритм PolyCTLDesigner представлен на Рис. 8.

Epitope!

Epitope?

ill

Epitopel

Epitopeî

Epitope 3

®

ilii Epitope3

®J

£pitope3

£pitope2 '

. ._1 Prot,l

■I 1 Epitopel Î -— 1 £p?tope2

\\ /

Desired pofyepitope CTL immunogen

®

TAI» Epitope3

Рис. 8. Алгоритм работы программы PolyCTLDesigner. I - предсказание аффинности связывания пептидов с ТАР и добавление N-концевых фланкирующих а.к.о., II - подбор оптимальных спейсерных последовательностей для каждой пары пептидов и создание направленного взвешенного графа, в котором вершины представляют целевые эпитопы, а ребра - допустимые варианты их объединения; III - конструирование последовательности полиэпитопного иммуногена (искомая последовательность определяется как наиболее длинный простой путь в созданном графе, обладающий наименьшим весом).

Кроме того, PolyCTLDesigner позволяет конструировать и последовательность полиэпитопного фрагмента, содержащего Т-хелперные (Th) эпитопы. В предложенных антигенах программа выбирает пептидные фрагменты длиной 20-40 а.к.о., содержащие наибольшее количество перекрывающихся Т-хелперных эпитопов, рестриктированных наиболее широким репертуаром алломорф HLA II класса. К каждому из выбранных фрагментов из исходной последовательности антигена добавляется по 5 С- и N-концевых фланкирующих аминокислотных остатков, поскольку они могут играть важную роль в связывании с Т-клеточными рецепторами CD4+ Т-лимфоцитов (Lafuente & Reche, 2009; Wang et al., 2008; Liao & Arthur, 2011; Rudolph et al., 2006). Фрагменты, содержащие Т-хелперные эпитопы, объединяются с использованием мотива [KR][KR], являющегося сайтом расщепления для ряда лизосомных катепсинов, участвующих в процессинге антигенов. Показано, что использование такого мотива увеличивает иммуногенность Т-клеточных эпитопов (Schneider et al., 2000; Zhu et al., 2005). Разработанное программное обеспечение доступно на сайте проекта http://tepredict.sourceforge.net/PolyCTLDesigner.html.

Проектирование полиэпитопных меланомных антигенов. Несмотря на то, что на долю меланомы приходится достаточно небольшое количество случаев, примерно 3-9 % от всех случаев рака кожи, являющегося одним из самых распространенных онкологических заболеваний, меланома привлекает

значительное внимание исследователей, поскольку отличается чрезвычайно быстрым развитием и метастазированием, наиболее трудно поддается лечению и является наиболее агрессивным и опасным видом рака кожи. Высокая иммуногенность меланомных опухолей позволяет предположить возможность создания эффективной терапевтической меланомной вакцины или разработки эффективной иммунотерапевтической стратегии, использующей последние достижения молекулярной иммунологии и клеточных технологий (Halama et al., 2010). Ряд меланомных антигенов, такие как Melan-A/MART-1, gplOO, тирозиназа, MAGE-3 и NY-ESO-1, были использованы для разработки кандидатных вакцин (Halama et al., 2010; Pandolfi et al., 2008).

Для апробации разработанного программного обеспечения было решено исследовать иммуногенность полиэпитопных антигенных конструкций, спроектированных с помощью TEpredict и PolyCTLDesigner, в модели индукции Т-клеточного иммунного ответа ex vivo, аналогично экспериментам, описанным в литературных источниках (Bonehill et al., 2004; Bonini et al., 2001; Su et al., 2002). Для дизайна полиэпитопных конструкций было выбрано шесть меланомных антигенов: NY-ESO-1 (Р78358), MART-1 (Q16655), MAGE-А1 (Р43355), MAGE-A11 (Р43364), MAGE-A3 {Р43357) и MAGE-C1 (060732).

С помощью разработанного программного обеспечения было проведено проектирование последовательностей двух искусственных Т-клеточных иммуногенов MEL-TCI (MELanoma T-Çell Immunogen) и MEL-TCI-A0201. Универсальный иммуноген (MEL-TCI) содержит множественные Т-клеточные эпитопы (как CD4+ Th, так и CD8+ CTL) опухолевых антигенов меланомы, рестриктированные 12 наиболее распространенными аллельными вариантами молекул HLA I класса (HLA-A*0101, А*0201, А*0301, А* 1101, А*2402, А*6801, В*0702, В*0801, В*3501, В*1801, В*4402, В*2705), тогда как аллелеспецифический иммуноген (MEL-TCI-A0201) содержит эпитопы, рестриктированные только HLА-А*0201.

При проектировании конструкции MEL-TCI для включения в состав полиэпитопов отбирались только те пептиды, для которых предсказанное значение р1С50 было не ниже 6.8 при связывании хотя бы с одним из 12 выбранных аллелей HLA. Кроме того, предсказывался протеасомный и иммунопротеасомный процессинг антигенов, а также аффинность связывания пептидов с транспортерами, ассоциированными с процессингом антигенов. С помощью программы PolyCTLDesigner из каждого из 6 антигенов было выбрано 74 потенциальных Т-клеточных эпитопа, покрывающих выбранный репертуар аллелей HLA с двукратной избыточностью.

При проектировании аллелеспецифического варианта полиэпитопного антигена MEL-TCI-A0201, с помощью программы TEpredict в выбранных антигенах были предсказаны CTL-эпитопы, рестриктированные HLA-А*0201. Также как и в случае предсказания эпитопов для универсальной конструкции, в качестве порогового значения было выбрано значение

р1С5о = 6.8; предсказывался протеасомный и иммунопротеасомный процессинг антигенов, а также аффинность связывания пептидов с транспортерами, ассоциированными с процессингом антигенов. В результате было отобрано 19 пептидов.

Далее проводился дизайн поли-СТЪ-эпитопных фрагментов МЕЬ-ТС1 и МЕЬ-ТС1-А0201. Использовался вырожденный спейсерный аминокислотный мотив [АЯБР] [ОЫТ][ЬОА][УКА]. В обоих случаях при выборе наилучших спейсеров для каждой пары эпитопов проводилась минимизация количества нецелевых эпитопов, образующихся при стыковке пептидов, рестриктированных 12 наиболее распространенными аллелельными вариантами молекул НЬА I класса.

Для наиболее эффективной индукции Т-клеточного иммунного ответа необходимо стимулировать ответ не только С08+, но и С04+ Т-лимфоцитов, поэтому следующей задачей было конструирование поли-ТЪ-эпитопного фрагмента. Для этого с помощью ТЕргесПс! проводилось предсказание в составе выбранных раковых антигенов ТЬ эпитопов с наиболее широкой специфичностью по отношению к НЬА II. Было выбрано 6 фрагментов длиной от 20 до 30 а.к.о., содержавших наибольшее количество ТЬ эпитопов (Табл. 1).

Табл. 1. Фрагменты антигенов, выбранные для конструирования поли-ТЬ-эпитопного фрагмента._ ____

Последовательность Антиген Начало-конец : П-НЩ К-по аллелей К-но uuuomm

EEAAGIGILTVILGVLLLIGCWYCRRRNGYRALMDKS MARI 25-61 45 11

LSYDGLLGDNQIMPKTGFLIIVLVMIAMEGGHAPEE MAGA1 177-212 47 8

MSQNRLLILILSIIFIKGTYASEEVIW MAGC1 994-1020 48 6

SFSQDILHDKIIDLVHLLLRKYRVKGLITKAEMLGSV MAGEA11 216-252 40 8

KASSSLQLVFGIELMEVDPIGHLYIFATCLGLSYDGL MAGA3 153-189 41 6

VSGNILTIRLTAADHRQLQLSISSCLQQLSLLMWITQCF CTGIB 128-166 34 6

Кроме того, в состав поли-ТЬ-эпитопной конструкции был включен универсальный хелперный эпитоп PADRE - Pan-DR Epitope (Ishioka et al., 1999). Для подтверждения экспрессии целевого полипептида в его состав был включен B-клеточный эпитоп белка Gag ВИЧ-1 (EPFRDYVDRFYKTLR) (Bazhan et al., 2004). Эпитопы были объединены с использованием мотива [KR][KR] - формирующего сайты расщепления лизосомных катепсинов В и L, принимающих участие в МНС-П-зависимом процессинге антигенов (Schneider et al., 2000; Zhu et al., 2005).

Согласно литературным данным добавление к целевому антигену сигнального пептида (обеспечивающего транспорт полиэпитопной конструкции в ЭПР) одновременно с С-концевым фрагментом LAMP-1 (перенаправляющего полиэпитоп в лизосомы для представления пептидов по пути МНС II) значительно увеличивает уровень ответа CD4+ Т-лимфоцитов (Bonehill et al., 2004; Bonini et al., 2001), поэтому на N-конец полиэпитопного полипептида был добавлен сигнальный пептид белка HER2 (Р04626), а на его С-конец - 11 последних аминокислотных остатков белка LAMP-1 человека. Подбор последовательности сигнального пептида был проведен с

использованием сервера SignalP 3.0 (Bendtsen et al., 2004). Последовательность антигена MEL-TC1-A0201 представлена на Рис. 9.

С помощью программы GeneDesigner (Villalobos et al., 2012) были спроектированы последовательности искусственных генов, кодирующих целевые полиэпитопные антигены, оптимизированные для экспрессии в клетках человека.

Синтезированные искусственные гены, кодирующие целевые полиэпитопные иммуногены, были клонированы в векторную плазмиду pcDNA3.1. Полученные рекомбинантные плазмиды pMEL-TCI-A0201 и pMEL-TCI - кандидаты ДНК-вакцины против меланомы - использовались для подтверждения экспрессии целевых генов с помощью ОТ-ПЦР, иммуноблоттинга и по окрашиванию клеток с помощью МАТ к Gag-эпитопу, экспрессируемому в составе полиэпитопных конструкций. Эти исследования были проведены в отделе биоинженерии ФБУН ГНЦ ВБ «ВЕКТОР» без участия автора.

MELAALCRWGLLLALLPPGAASAMDAIFGSLALMDKSLHVllLILSIIFlIlGILTVILQvilMPKAGLL l|¡Í¡ÍLMWITQCFL£HLLLRKYRVÍg¡t¡HLYI FATCLÍ|eYVLVTCLGLÍiljKFLWGPRALAÍBFLI I VLVMI^|gCILESLFRAM>ijVCMQLLFGI&^

tclgiJIÍ'i^lkntvíllíiviaii

NGYRALMDKSMLSYDGLLGDNQIMPKTGFLIIVLVMIAMEGGHAPEEMMSQNRLLILILSIIFIKGTY ASEEVIWKRSFSQDILtmKIIDLVHLLLRKYRVKGLITKAEMLGSVKRKASSSLQLVFGIELMEVDPIGH LYIFATCLGLSYDGLKHVSGNILTIRLTAADHRQLQLSISSCLQQLSLLMWITQCFgPFRDyVDRFyiCTb

Рис. 9. Аллелеспецифический полиэпитопный антиген MEL-TCI-A0201. Серым цветом выделены спейеерные последовательности, обеспечивающие формирование необходимых сайтов протеасомного расщепления. Подчеркнутым полужирным курсивом - сайты расщепления эндосомными катепсинами. Полужирным курсивом с двойным подчеркиванием показан маркерный пептид из белка Gag ВИЧ-1, рамкой выделен эпитоп PADRE, с которого начинается поли-Т1>эпитопный фрагмент. На N-конце полиэпитопа полужирным подчеркнутым шрифтом показан лидерный пептид белка ErbB2 (HER2), а белым полужирным подчеркнутым шрифтом на черном фоне - С-концевой фрагмент белка LAMP-1.

В дальнейшем в рамках работ по государственному контракту №16.512.11.2186 сотрудниками лаборатории молекулярной иммунологии НИИКИ СО РАМН было проведено исследование иммуногенности ДНК-вакцинной конструкции pMEL-TCI-A0201, кодирующей полиэпитопный иммуноген, содержащий цитотоксические эпитопы, рестриктированные HLA-A*0201, и ее способности индуцировать специфический лизис раковых клеток. Экспериментальные работы проводились в системе индукции Т-клеточного иммунного ответа ex vivo с использованием переферических мононуклеарных клеток крови условно-здоровых HLA-A*0201-положительных доноров. Разрешение на проведение этих исследований было одобрено локальным этическим комитетом при ФГУН НИИКИ СО РАМН (протокола № 68 заседания этического комитета НИИКИ СОРАМН от 13 февраля 2012 г.).

В качестве клеток-мишеней была использована культура клеток меланомы человека Mel Is, любезно предоставленная Российским онкологическим научным центром имени H.H. Блохина РАМН. В качестве отрицательного контроля использовалась культура мононуклеарных клеток (МНК) и совместная культура МНК и дендритных клеток (ДК), трансфецированных контрольной (векторной) плазмидой. В качестве положительного контроля была использована совместная культура МНК и ДК, трансфецированных плазмидой pcDNA-mar//, кодирующей полноразмерный меланомный антиген MART-1. Получение дендритных клеток и индукция их созревания проводились по методикам, описанным ранее (Хрипко и др., 2008). Трансфекция дендритных клеток ДНК-вакцинными конструкциями проводилась с помощью системы магнитной трансфекции (MATra - Magnet-Assisted Transfection) по протоколу, рекомендованному производителем (Promokine, USA). Способность полиэпитопной конструкции индуцировать специфический Т-клеточный иммунный ответ изучали в реакции IFNy-ELISpot (Рис. 10).

Рис. 10. (А) Количество спот-формирующих IFNy-продуцирующих клеток (на 100000 клеток) в культуре мононуклеарных клеток периферической крови (МНК) условно-здоровых доноров и в совместной культуре с аутологичными ДК (п = 21). (Б) Доля от максимального количества спот-формирующих IFNy-продуцирующих клеток (для каждого из пациентов) в культуре мононуклеарных клеток периферической крови (МНК) условно-здоровых доноров и в совместной культуре с аутологичными ДК (п = 15). Жирной горизонтальной линией отмечено среднее значение. РВМС (peripheral blood mononuclear cells) — контрольная культура МНК; DCC -совместная культура МНК и ДК, трансфецированных контрольной плазмидой; DCA -совместная культура МНК и ДК, трансфецированных плазмидой специфичной для HLA-A0201 (PMEL-TCI-A0201); DCM - совместная культура МНК и ДК, трансфецированных плазмидой, кодирующей полноразмерный белок MART-1; РВМС.Lys, DCC.Lys, DCA.Lys и DCM.Lys - соответствующие культуры с лизатом клеток Mel Is

Сравнение способности ДК, трансфецированных различными плазмидами, индуцировать Т-клеточный ответ (рис.ЮА) показало, что в присутствии лизата клеток меланомы (Mel Is) в совместных культурах МНК и ДК, трансфецированных плазмидами pMEL-TCI-A0201 (DCA.Lys) и pcDNA-marf/ (DCM.Lys - положительный контроль), образуется достоверно большее количество IFNy-продуцирующих клеток, чем при культивировании МНК (PBMC.Lys) (р = 0.0004 и 0.0398) и ДК, трансфецированных контрольной плазмидой (DCC.Lys) (р = 0.0107 и р = 0.0864) в присутствии лизата. Уровень клеток, продуцирующих IFNy в совместной культуре МНК и ДК, трансфецированных целевой плазмидой pMEL-TCI-A0201, и при стимуляции ДК, трансфецированных плазмидой pcDNA-marf/, не отличался (р = 0.599). При этом группы DCC, DCA и DCM статистически не отличаются между собой, но достоверно отличны от РВМС (р < 0.005). Группы DCA.Lys и DCM.Lys (положительный контроль) отличаются от отрицательных контролей и от групп DCA и DCM (р < 0.028). Статистический анализ проводился с использованием парного теста Уилкоксона с использованием FDR-коррекции.

На Рис. 10А видно, что целевая полиэпитопная конструкция и плазмида, кодирующая полноразмерный белок MART-1, обеспечивают наибольшую экспрессию IFNy. Все экспериментальные группы, в которых проводилась стимуляция лизатом клеток меланомы, демонстрируют бимодальность распределения - то есть, по-видимому, клетки части пациентов не ответили на стимуляцию лизатом. Лишь у 15 пациентов из 21 (71.4 %) число IFNy-продуцирующих клеток в присутствии лизата превысило в 4 раза среднее число клеток, продуцирующих IFNy, в отрицательной контрольной группе РВМС в отсутствие лизата.

На Рис. 10Б приведены результаты IFNy-ELISpot для 15 пациентов, продемонстрировавших индукцию Т-клеточного ответа, - доля от максимального количества IFNy-продуцирующих клеток, полученного для каждого из пациентов. Целевая полиэпитопная конструкция в наибольшей степени стимулирует экспрессию IFNy. Однако и в данном случае отличия между группами DCA.Lys и DCM.Lys были статистически незначимы.

Таким образом, исследования, проведенные в системе индукции Т-клеточного иммунного ответа ex vivo, показали, что спроектированная с помощью разработанных моделей и алгоритмов полиэпитопная конструкция MEL-TCI-A0201 обладает способностью индуцировать Т-клеточный иммунный ответ против антигенов меланомы человека и не уступает по эффективности полноразмерному меланомному антигену MART-1.

выводы

1. Разработаны новые статистические регрессионные модели, предсказывающие аффинность связывания нонамерных пептидов с 35 аллельными вариантами молекул МНС I класса человека по аминокислотной последовательности пептидов.

2. Сравнение различных схем параметризации олигопептидов подтвердило, что модели, использующие кодирование пептидов в виде векторов свойств составляющих их аминокислотных остатков (РМВЕС), обеспечивают лучшее качество предсказаний (по значению AUC - площади под кривой ошибок, характеризующей специфичность и чувствительность предсказаний), по сравнению с моделями, кодирующими олигопептиды виде разреженных векторов (р = 2.01 х 10"6).

3. Сравнительное тестирование полученных моделей с рядом других известных методов предсказания Т-клеточных эпитопов подтвердило их высокое качество. По медианному значению AUC (площади под кривой ошибок, характеризующей специфичность и чувствительность предсказаний) оригинальные модели (0.855) превзошли такие методы как SYFPEITHI (0.715), ProPredl (0.810), SVMHC (0.710) и SVRMHC (0.710), а обновленные модели (0.917) не уступают лучшим современным методам предсказания Т-клеточных эпитопов NetMHC (0.908), SMMPMBEC (0.907). По значению AUC новые модели (0.917) незначительно уступили методу IEDB_recommended (0.946), но превзошли его по значению коэффициента корреляции Пирсона (0.65 и 0.51, соответственно).

4. Разработан алгоритм рационального дизайна полиэптопных Т-клеточных антигенов, согласно которому оптимальная последовательность полиэпитопа определяется путем поиска наиболее длинного простого пути с наименьшим весом в направленном взвешенном графе, вершины которого соответствуют эпитопам, а ребра - допустимым паросочетаниям эпитопов. Вес каждого ребра определяется ранжирующей функцией, учитывающей количество предсказанных нецелевых эпитопов, образовавшихся на стыке эпитопов, распространенность аллельных вариантов молекул HLA, рестриктирующих нецелевые эпитопы, эффективность сайта протеасомного расщепления на С-конце первого из пары эпитопов и длину спейсерной последовательности.

5. На основе разработанных моделей и алгоритмов создано программное обеспечение для предсказания Т-клеточных эпитопов (TEpredict) и программа для рационального дизайна полиэпитопных антигенов (PolyCTLDesigner).

6. С использованием созданного программного обеспечения проведен дизайн полиэпитопного Т-клеточного антигена - кандидатной иммунотерапевтической вакцины для лечения меланомы человека (MEL-TCI-A0201).

7. Исследования полученной ДНК-вакцины (pMEL-TCI-A0201), кодирующей целевой полиэпитопный антиген, в системе индукции Т-клеточного иммунного ответа ex vivo с использованием первичных культур иммунокомпетентных клеток человека подтвердили иммуногенность созданной конструкции (р < 0.05).

Публикации по теме диссертации Статьи

1. Антонец Д.В.. Бакулина А.Ю., Портнягина О.Ю., Сидорова О.В., Новикова О.Д., Максютов А.З. Предсказание антигенно-активных районов OmpF-подобного порина Yersinia pseudotuberculosis. // Доклады Академии наук. - 2007. - Т.414. -С.544-546.

2. Антонец Д.В.. Максютов А.З. TEpredict: программное обеспечение для предсказания Т-клеточных эпитопов. // Молекулярная биология. - 2010. - Т.44. -С.130-139.

3. Bazhan S.I., Karpenko L.I., Ilyicheva T.N., Belavin P.A., Seregin S.V., Danilyuk N.K., Antonets D.V.. Ilyichev A.A. Rational design based synthetic polyepitope DNA vaccine for eliciting HIV-specific CD8+ T cell responses. // Mol. Immunol. - 2010. -V.47. -P.1507-1515.

4. Антонец Д.В. Обновление программного обеспечения TEpredict, предназначенного для предсказания Т-клеточных эпитопов. // Вестник НГУ. -2012. - Т. 10, вып. 5. -С.49-56.

5. Боробова Е.А., Антонец Д.В.. Старостина Е.В., Смирнова О.Ю., Щербаков Д.Н., Волкова О.Ю., Орешкова С.Ф., Карпенко Л.И., Ильичев А.А., Бажан С.И. Кандидаты ДНК-вакцины против меланомы: дизайн, конструирование и оценка экспрессии целевых генов в эукариотических клетках. // Вестник НГУ. - 2012. -Т. 10, вып. 5. - С.23-30.

Патенты

Антонец Д.В.. Бажан С.И., Ильичев А.А., Карпенко Л.И., Боробова Е.А., Старостина Е.В., Смирнова О.Ю., Щербаков Д.Н., Орешкова С.Ф. Искусственный ген MEL-TCI-A0201, кодирующий полиэпитопный белок-иммуноген MEL-TCI-А0201, рекомбинантная плазмидная ДНК pMEL-TCI-A0201, обеспечивающая экспрессию искусственного гена MEL-TCI-A0201 и искусственный белок-иммуноген MEL-TCI-A0201, содержащий множественные CTL- и Th-эпитопы антигенов меланомы. // Заявка на патент РФ от 21.08.2012, регистрационный № 2012136088.

Тезисы конференций

1. Antonets D.V.. Maksyutov A.Z. Prediction of T-cell epitopes within protein antigens: theoretical analysis and software development. // 8'h John Humphrey Advanced Summer Programme in Immunology. Immunology and viral infection, Moscow, September 10-14,2007. - Abstr. Book, 2007. -P.5.

2. Антонец Д.В.. Максютов А.З. Предсказание Т-клеточных эпитопов: теоретический анализ и разработка программного обеспечения. // Вторая конференция по вопросам ВИЧ/СПИДа в Восточной Европе и Центральной Азии, Москва, 3-5 мая 2008 года: сб. тез. - М., 2008. - С.22.

3. Антонец Д.В.. Максютов А.З. TEpredict: программа для предсказания Т-клеточных эпитопов. // IV съезд Российского общества биохимиков и молекулярных биологов, Новосибирск, Россия, 11-15 мая 2008 года: сб. тез. -Новосибирск, 2008. - С.262.

4. Antonets D.V.. Maksyutov A.Z. TEpredict: software for predicting T-cell epitopes. // The Sixth International Conference on Bioinformatics of Genome Regulation and Structure BGRS'2008, Novosibirsk, Russia, June 22-28, 2008. - Abstr. Book, 2008. -P.28.

5. Антонец Д.В.. Максютов A.3. TEpredict: новые подходы к предсказанию Т-клеточных эпитопов. // Объединенный иммунологический форум, Санкт-Петербург, 30 июня - 5 июля 2008 года. - Российский иммунологический журнал. - 2008. - Т.2. - С. 118.

6. Antonets D.V.. Maksyutov A.Z., Bazhan S.I. PolyCTLDesigner - the software for constructing polyepitope immunogens. // 4th Moscow Conference on Computational Molecular Biology. Moscow, July 20-23, 2009. - Abstr. Book, 2009. - P. 19-20.

7. Антонец Д.В.. Максютов А.З., Бажан С.И. PolyCTLDesigner: программное обеспечение для конструирования полиэпитопных вакцин. // Медицинская геномика и протеомика. Новосибирск, 9-13 сентября 2009 г.: сб. тез. -Новосибирск, 2009. -С.63.

8. Antonets Р.. Maksyutov A., Bazhan S. PolyCTLDesigner: the software for constructing highly efficient polyepitope immunogens. Application to H1V-1. // AIPS Vaccine 2009. Paris, France, October 19-22, 2009. - Retrovirology. - 2009. - V.6, suppl. 3.-P.284.

9. Антонец Д.В.. Максютов A.3., Бажан С.И. PolyCTLDesigner. Создание новой полиэпитопной ВИЧ-1 вакцины in silico. II Третья конференция по вопросам ВИЧ/СПИДа в Восточной Европе и Центральной Азии, Москва, 28-30 октября 2009 г.: сб. тез. - М„ 2009. - Т.2. - С.85.

10. Бажан С.И., Карпенко Л.И., Ильичева Т.Н., Белавин П.А., Серегин С.В., Антонец Д.В.. Ильичев А.А., Ирвайн К., Гиббс Дж., Бенник Дж., Юделл Дж. Рациональный дизайн вакцин для индукции ВИЧ-1 специфического ответа CD8+-T-mieTOK. // Третья конференция по вопросам ВИЧ/СПИДа в Восточной Европе и Центральной Азии, Москва, 28-30 октября 2009 г.: сб. тез. — М., 2009. -Т.2.-С.87.

П.Регузова А.Ю., Антонец Д.В.. Максютов Р.А., Бажан С.И., Карпенко Л.И. Конструирование и биологическое тестирование ДНК-вакцинных конструкций, кодирующих структурные варианты искусственного поли-СТЕ-эпитопного иммуногена ВИЧ-1. // Третья конференция по вопросам ВИЧ/СПИДа в Восточной Европе и Центральной Азии, Москва, 28-30 октября 2009 г.: сб. тез. - М., 2009. - Т.2. - С. 125.

12. Antonets D.V.. Maksyutov A.Z., Bazhan S.I. PolyCTLDesigner: A program for designing cytotoxic T-cell polyepitope immunogens. // 35th FEBS Congress. Gothenburg, Sweden, June 26 - July 1, 2010. - FEBS Journal. - 2010. - V.277. -P.45.

13. Antonets D.V.. Maksyutov A.Z., Bazhan S.I. PolyCTLDesigner - software for constructing polyepitope cytotoxic T-cell immunogens. // 7th International Conference on Bioinformatics of Genome Regulation and Structure\Systems Biology (BGRS\S B-2010). Novosibirsk, Russia, June 20-27, 2010. - Abstr. Book, 2010. -P.29

14. Bazhan S.I., Karpenko L.I., Ilyicheva T.N., Belavin P.A., Seregin S.V., Antonets P.V.. Ilyichev A.A. Promising strategies for designing poly-CD8+ T cell-epitope DNA vaccine. // XVIII International Congress AIDS 2010, Vienna, Austria, July 1823,2010. - Abstr. Book, 2010. - V. 1, P. 290 (TUAA0103).

15.Bazhan S.I., Karpenko L.I., Ilyicheva T.N., Belavin P.A., Seregin S.V., Antonets D.V.. Ilyichev A.A. Rational approaches for designing highly efficient DNA vaccines for eliciting HIV-specific CD8+ T cell responses. // WCVI'2010, Busan, South Korea, July 31- August 5, 2010. - Abstr. Book, 2010. - P. 185.

16. Antonets D. TEpredict - software for predicting T-cell epitopes: an update. // International Moscow Conference on Computational Molecular Biology (MCCMB-2011). Moscow, Russia, July 21-24, 2011. - Abstr. Book, 2011. -P.45-46.

17. Antonets D.V.. Grudin D.S. TEpredict - software for predicting T-cell epitopes. An update. II The 8th International Conference on the Bioinformatics of Genome Regulation and Structure\Systems Biology (BGRS\SB-2012). Novosibirsk, Russia, June 25-29, 2012. - Abstr. Book, 2012. - P.38.

БЛАГОДАРНОСТИ

Автор выражает благодарность заведующему отделом биоинженерии ФБУН ГНЦ ВБ «Вектор» д.б.н. Ильичеву А.А., сотрудникам отдела биоинженерии д.б.н. Карпенко Л.И., Боробовой Е.А., Старостиной Е.В., Регузовой А.Ю. за создание ДНК-вакцинных конструкций, несущих полиэпитопные Т-клеточные антигены. Также благодарит заведующего лабораторией молекулярной иммунологии НИИКИ СО РАМН, д.м.н., профессора Сенникова С.В. и сотрудников лаборатории Лопатникову Ю.А., Курилина В.В. и Шевченко Ю.А. за исследование иммунологических характеристик ДНК-вакцины pMEL-TCI-A0201 в системе индукции Т-клеточного иммунного ответа ex vivo с использованием первичных культур иммунокомпетентных клеток человека. Автор благодарит сотрудников Российского онкологического научного центра имени Н.Н. Блохина РАМН за любезно предоставленные культуры клеток меланомы человека. Также признателен сотрудникам теоретического отдела ФБУН ГНЦ ВБ «Вектор» к.б.н. Бакулиной А.Ю. и к.б.н. Максютову А.З. Особую благодарность автор выражает своему научному руководителю, заведующему теоретическим отделом ФБУН ГНЦ ВБ «Вектор», д.б.н. Бажану С.И. за всестороннюю поддержку при проведении исследований и написании диссертации.

Работа выполнена при финансовой поддержке Министерства образования и науки Российской Федерации (гос. контракт №16.512.11.2186 и №8289) и Российского фонда фундаментальных исследований (грант РФФИ № 12-04-31746 мол_а).

Подписано в печать 15.01.2013 г. Печать цифровая. Бумага офсетная. Формат 60x84/16. Усл. печ. л. 2 Тираж 100 экз. Заказ № 137.

Отпечатано в типографии «Срочная полиграфия» ИП Малыгин Алексей Михайлович 630090, Новосибирск, пр-т Академика Лаврентьева, 6/1, оф. 104 Тел. (383) 217-43-46, 8-913-922-19-07

Содержание диссертации, кандидата биологических наук, Антонец, Денис Викторович

СПИСОК СОКРАЩЕНИЙ.

ВВЕДЕНИЕ.

Актуальность проблемы.

Цели и задачи исследования.

Научная новизна и практическая значимость.

Положения, выносимые на защиту.

Апробация работы.

Публикации по теме диссертации.

Вклад автора.

1. ОБЗОР ЛИТЕРАТУРЫ.

1.1. Архитектура молекул МНС и TCR.

1.2. Функции молекул МНС, процессинг и презентация антигенов.

1.2.1. Процессинг антигенов.

1.2.2. Протеасома.

1.2.3. Транспорт пептидов в ЭПР.

1.2.4. Полиморфизм молекул МНС I класса.

1.2.5. МНС 1-зависимый путь процессинга и презентации антигенов в цифрах.

1.2.6. МНС П-зависимый путь процессинга и презентации антигенов.

1.3. Предсказание Т-клеточных эпитопов.

1.4. Использование клеточных технологий для разработки новых способов иммунотерапии онкологических заболеваний. Полиэпитопные антигены.

2. МАТЕРИАЛЫ И МЕТОДЫ.

2.1. Формулировка моделей предсказывающих аффинность связывания олигопептидов с молекулами МНС.

2.2. Параметризация аминокислот и олигопептидов.

2.3. Метод частных наименьших квадратов (PLS).

2.4. Метод SPLS (Sparse Partial Least Squares).

2.5. Использованное программное обеспечение.

2.6. Дополнительные модели, использованные в программах TEpredict и PolyCTLDesigner.

3. РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ.

3.1. Создание статистических моделей для предсказания аффинности связывания олигопептидов с различными алломорфами молекул HLAI класса.

3.2. Создание программы TEpredict.

3.3. Обновление статистических моделей, используемых программой TEpredict для предсказания

Т-клеточных эпитопов.

3.4. Разработка программного обеспечения для рационального дизайна полиэпитопных Т-клеточных антигенов.

3.5. Проектирование полиэпитопных меланомных антигенов.

Введение Диссертация по биологии, на тему "Разработка методических подходов к рациональному дизайну полиэпитопных T-клеточных антигенов"

Актуальность проблемы

В настоящее время Т-клеточные эпитопы приобретают все большее значение в качестве инструментов для разработки новых средств иммунодиагностики и иммунотерапии, а также для проектирования искусственных полиэпитопных антигенов - вакцин против инфекционных и онкологических заболеваний (Bazhan et al., 2004; Berzofsky, Berkower, 1995; Cardinaud et al., 2009; Iglesias et al., 2007; Tine et al., 2005; Woodberry et al., 1999). Разработка компьютерных методов предсказания Т-клеточных эпитопов является одной из главнейших задач биоинформатики в области иммунологии, так как применение программ, предсказывающих Т-клеточные эпитопы, позволяет значительно сократить временные и материальные затраты по сравнению с использованием при поиске новых эпитопов и разработке полиэпитопных антигенов только экспериментальных подходов (Liu et al., 2011). Несмотря на то, что к настоящему времени создано большое количество различных программ для предсказания Т-клеточных эпитопов (Donnes, Elofsson, 2002; Hattotuwagama et al., 2004; Kim et al., 2012; Nielsen et al., 2004a; Parker et al., 1994; Reche et al., 2004; Singh, Raghava, 2001, 2003; Wan et al., 2006), разработка новых методов остается по-прежнему актуальной задачей, поскольку ни один из ныне существующих методов не может быть признан единственно верным и превосходящим прочие, и поскольку использование консенсусного подхода, объединяющего возможности различных алгоритмов, в значительной степени превосходит по качеству предсказаний Т-клеточных эпитопов каждый из использованых методов по отдельности (Lafuente, Reche, 2009; Wang et al., 2008).

Конструирование полиэпитопных Т-клеточных антигенов, содержащих множественные Т-клеточные эпитопы, является одним из наиболее многообещающих подходов к созданию новых эффективных и безопасных вакцин (Bazhan et al., 2004; Berzofsky, Berkower, 1995; Cardinaud et al., 2009; 6

Iglesias et al., 2007; Tine et al., 2005; Woodberry et al., 1999). Несмотря на то, что первые работы, посвященные изучению ДНК-вакцин, кодирующих полиэпитопные антигены, показали способность конструкций, составленных в результате простого объединения эпитопов, индуцировать цитотоксический Т-клеточный ответ на все эпитопы, включенные в их состав (Thomson et al., 1995), в дальнейшем было показано, что иммуногенность пептидов в составе полиэпитопа в значительной степени зависит от фланкирующих аминокислотных остатков (Livingston et al., 2001). Было показано, что введение в состав полиэпитопного антигена спейсерных аминокислотных последовательностей, обеспечивающих образование сайтов протеасомного расщепления между эпитопами и оптимизирующих связывание пептидных фрагментов с ТАР (транспортерами, ассоциированными с процессингом антигенов, транслоцирующими олигопептиды в эндоплазматический ретикулум), приводит к увеличению иммуногенности таких конструкций за счет повышения эффективности процессинга и презентации целевых эпитопов иммунной системе (Cardinaud et al., 2009; Ishioka et al., 1999; Livingston et al., 2001). Кроме того, было показано, что существенное влияние на иммуногенность оказывает и перестановка эпитопов в составе полиэпитопной конструкции (Livingston et al., 2001).

В настоящее время разработаны методы предсказания аффинности связывания олигопептидов с комплексом ТАР (Doytchinova et al., 2004а; Larsen et al., 2005; Peters et al., 2003a; Ren et al., 2011), и методы предсказания протеасомного и иммунопротеасомного расщепления антигенов (Kuttler et al.,

2000; Larsen et al., 2005; Nielsen et al., 2005; Nussbaum et al., 2001; Toes et al.,

2001). Однако, несмотря на большое количество работ, посвященных конструированию полиэпитопных антигенных конструкций и исследованию их иммуногенности и протективности, и, несмотря на наличие большого количества программ для предсказания аффинности связывания пептидов с молекулами МНС и с комплексом ТАР, программ для предсказания сайтов протеасомного расщепления, к настоящему моменту не было предложено ни 7 одного алгоритма рационального конструирования полиэпитопных Т-клеточных антигенов. То есть, алгоритма, позволяющего проектировать аминокислотную последовательность полиэпитопного антигена, подбирая наилучшие спейсерные последовательности для каждой пары эпитопов и оптимальное взаимное расположение эпитопов в рамках конструкции с учетом современных знаний о специфичности протеасомного процессинга антигенов и о взаимодействии пептидов с ТАР для увеличения иммуногенности целевого полиэпитопа.

Цели и задачи исследования

Целью настоящего исследования являлись разработка новых методов предсказания Т-клеточных эпитопов и алгоритмов рационального дизайна полиэпитопных Т-клеточных антигенов, а также проектирование с помощью разработанных методов прототипа полиэпитопного Т-клеточного антигена, содержащего множественные Т-клеточные эпитопы из основных антигенов меланомы человека.

В рамках проекта решались следующие задачи:

1. Разработка статистических моделей, предсказывающих аффинность связывания олигопептидов с различными алломорфами молекул МНС.

2. Выбор оптимальной схемы параметризации пептидов в результате сравнения качества предсказаний, полученных моделями, использующими различные способы параметризации олигопептидов -записи аминокислотных последовательностей в виде разреженных векторов (факторизация аминокислот), либо в виде векторов физико-химических свойств аминокислотных остатков.

3. Подтверждение качества полученных предсказательных моделей в результате сравнительного тестирования с рядом других известных методов предсказания Т-клеточных эпитопов (ЗУРРЕГГШ, РгоРгесП, БУМНС, БУЯМНС, ^МНС, БММРМВЕС и ШБВ.гесоттепсЫ).

4. Формализация задачи рационального дизайна полиэпитопных антигенов и разработка алгоритма ее решения, выбирающего наилучшие спейсерные последовательности для каждой пары эпитопов и подбирающего оптимальное взаимное расположение эпитопов в составе полиэпитопа с целью увеличения эффективности презентации целевых эпитопов и минимизации количества нецелевых.

5. Создание на основе разработанных алгоритмов и методов программного обеспечения для предсказания Т-клеточных эпитопов и для проектирования полиэпитопных Т-клеточных антигенов.

6. Конструирование с помощью созданного программного обеспечения прототипа полиэпитопного антигена меланомы человека для верификации разработанных моделей, алгоритмов и программ.

Научная новизна и практическая значимость

В рамках данной работы были разработаны статистические регрессионные модели для предсказания аффинности связывания олигопептидов с 35 различными аллельными вариантами молекул НЬА I класса. Полученные модели продемонстрировали высокое качество предсказаний. Впервые было проведено исследование, направленное на выявление скрытой размерности пространства, описывающего взаимное сходство иммунохимических свойств аминокислотных остатков. Впервые была формализована задача рационального дизайна полиэпитопных Т-клеточных антигенов и разработан алгоритм ее решения.

На основе разработанных моделей и алгоритмов было создано программное обеспечение для предсказания Т-клеточных эпитопов (ТЕргеШсО и рационального дизайна полиэпитопных Т-клеточных антигенов (Ро1уСТ1Л)е81§пег). Был проведен дизайн полиэпитопного антигена, составленного из предсказанных СБ8+ и СБ4+ Т-клеточных эпитопов 6 антигенов меланомы человека, и получена ДНК-вакцинная конструкция, несущая искусственный ген, кодирующий целевой полиэпитоп. Изучение созданной ДНК-вакцины в системе индукции Т-клеточного иммунного ответа ex vivo подтвердило иммуногенность полиэпитопной конструкции и перспективность выбранного направления исследований.

Разработанные в рамках исследования методы, алгоритмы и программное обеспечение могут быть использованы для проектирования полиэпитопных антигенов - новых кандидатных иммунотерапевтических и профилактических вакцин от онкологических и инфекционных заболеваний человека.

Положения, выносимые на защиту

1. Разработанные статистические регрессионные модели предсказывают аффинность связывания нонамерных пептидов с 35 аллельными вариантами молекул МНС I класса человека.

2. Модели, использующие кодирование пептидов в виде векторов свойств составляющих их аминокислотных остатков, обеспечивают большую специфичность при соответствующей чувствительности предсказаний, по сравнению с моделями, кодирующими олигопептиды в виде разреженных векторов.

3. Разработанные модели по качеству предсказаний превосходят такие методы как SYFPEITHI, ProPredl, SVMHC и SVRMHC и не уступают лучшим современным методам предсказания Т-клеточных эпитопов NetMHC, SMMPMBEC и IEDBrecommended.

4. Разработанный алгоритм рационального дизайна полиэптопных Т-клеточных антигенов позволяет оптимизировать структуру полиэпитопной конструкции с учетом современных знаний о путях процессинга белковых антигенов и их презентации иммунной системе.

5. Полиэпитопная конструкция MEL-TCI-A0201, спроектированная с помощью разработанных моделей и алгоритмов, содержащая множественные CD4+ и CD8+ Т-клеточные эпитопы основных антигенов

10 меланомы человека, обладает способностью индуцировать специфический Т-клеточный иммунный ответ.

Апробация работы

По материалам диссертационной работы опубликовано 5 статей в реферируемых научных журналах, входящих в список ВАК, написан 1 патент

Российской Федерации. Результаты работы были представлены на международных и российских конференциях: 6th International Conference on

Bioinformatics of Genome Regulation and Structure BGRS'2008 (Novosibirsk,

Russia, June 22-28, 2008); Объединенный иммунологический форум (Санкт

Петербург, Россия, 30 июня-5 июля 2008 г.); 4th Moscow Conference on

Computational Molecular Biology MCCMB'2009 (Moscow, Russia, July 20-23,

2009); AIDS Vaccine 2009 (Paris, France, October 19-22, 2009), 35th FEBS

Congress (Gothenburg, Sweden, June 26 - July 1, 2010); 7th International

Conference on Bioinformatics of Genome Regulation and StructureXSystems Biology

BGRS\SB-2010 (Novosibirsk, Russia, June 20-27, 2010); XVIII International

Congress "AIDS 2010" (Vienna, Austria, July 18-23, 2010); World Congress of

Virus and Infections WCVI'2010 (Busan, South Korea, July 31 - August 5, 2010);

International Moscow Conference on Computational Molecular Biology

MCCMB'2011 (Moscow, Russia, July 21-24, 2011); The 8th International

Conference on the Bioinformatics of Genome Regulation and Structure\Systems

Biology BGRSVSB-2012 (Novosibirsk, Russia, June 25-29, 2012).

Программное обеспечение, созданное в рамках данной работы, опубликовано на сайте проекта (http://tepredict.sourceforge.net) под свободной лицензией Creative Commons Attribution Non-Commercial License V2.0 (CC BY

NC 2.0). С момента создания было загружено более 200 раз пользователями из

30 стран. Созданное программное обеспечение использовалось при выполнении работ в рамках распоряжения правительства РФ № 1905-р от 25 декабря 2007 г. о проведении научно-исследовательских работ по разработке вакцины против

ВИЧ-инфекции и совершенствовании мониторинга ВИЧ-1 инфекции. Был создан ряда новых вариантов полиэпитопных антигенов ВИЧ-1, содержащих

11 консервативные CTL-эпитопы белков ВИЧ-1 субтипов А, В и С. В настоящее время ведутся работы по изучению их иммуногенности. Работа по созданию программного обеспечения TEpredict и PolyCTLDesigner была поддержана Министерством образования и науки Российской Федерации (гос. контракт №16.512.11.2186) и Российским фондом фундаментальных исследований (грант РФФИ № 12-04-31746 мола).

Публикации по теме диссертации

Статьи

1. Антонец Д.В., Бакулина А.Ю., Портнягина О.Ю., Сидорова О.В., Новикова О.Д., Максютов А.З. Предсказание антигенно-активных районов OmpF-подобного порина Yersinia pseudotuberculosis. II Доклады Академии наук. -2007. - Т.414. - С.544-546.

2. Антонец Д.В., Максютов А.З. TEpredict: программное обеспечение для предсказания Т-клеточных эпитопов. // Молекулярная биология. - 2010. -Т.44. - С.130-139.

3. Bazhan S.I., Karpenko L.I., Ilyicheva T.N., Belavin P.A., Seregin S.V., Danilyuk N.K., Antonets D.V., Ilyichev A.A. Rational design based synthetic polyepitope DNA vaccine for eliciting HIV-specific CD8+ T cell responses. // Mol. Immunol.

- 2010. - V.47. - P.1507-1515.

4. Антонец Д.В. Обновление программного обеспечения TEpredict, предназначенного для предсказания Т-клеточных эпитопов. // Вестник НГУ.

- 2012. - Т. 10, вып. 5. - С.49-56.

5. Боробова Е.А., Антонец Д.В., Старостина Е.В., Смирнова О.Ю., Щербаков Д.Н., Волкова О.Ю., Орешкова С.Ф., Карпенко Л.И., Ильичев А.А., Бажан С.И. Кандидаты ДНК-вакцины против меланомы: дизайн, конструирование и оценка экспрессии целевых генов в эукариотических клетках. // Вестник НГУ. - 2012. - Т.10, вып. 5. - С.23-30.

Патенты

Антонец Д.В., Бажан С.И., Ильичев А.А., Карпенко Л.И., Боробова Е.А., Старостина Е.В., Смирнова О.Ю., Щербаков Д.Н., Орешкова С.Ф. Искусственный ген MEL-TCI-A0201, кодирующий полиэпитопный белок-иммуноген MEL-TCI-A0201, рекомбинантная плазмидная ДНК pMEL-TCI-А0201, обеспечивающая экспрессию искусственного гена MEL-TCI-A0201 и искусственный белок-иммуноген MEL-TCI-A0201, содержащий множественные CTL- и Th-эпитопы антигенов меланомы. // Заявка на патент РФ от 21.08.2012, регистрационный № 2012136088.

Тезисы конференций

1. Antonets D.V., Maksyutov A.Z. Prediction of T-cell epitopes within protein antigens: theoretical analysis and software development. // 8th John Humphrey Advanced Summer Programme in Immunology. Immunology and viral infection, Moscow, September 10-14, 2007. - Abstr. Book, 2007. - P.5.

2. Антонец Д.В., Максютов А.З. Предсказание Т-клеточных эпитопов: теоретический анализ и разработка программного обеспечения. // Вторая конференция по вопросам ВИЧ/СПИДа в Восточной Европе и Центральной Азии, Москва, 3-5 мая 2008 года: сб. тез. - М., 2008. - С.22.

3. Антонец Д.В., Максютов А.З. TEpredict: программа для предсказания Т-клеточных эпитопов. // IV съезд Российского общества биохимиков и молекулярных биологов, Новосибирск, Россия, 11-15 мая 2008 года: сб. тез. - Новосибирск, 2008. - С.262.

4. Antonets D.V. Maksyutov A.Z. TEpredict: software for predicting T-cell epitopes. // The Sixth International Conference on Bioinformatics of Genome Regulation and Structure BGRS'2008, Novosibirsk, Russia, June 22-28, 2008. - Abstr. Book, 2008. - P.28.

5. Антонец Д.В., Максютов А.З. TEpredict: новые подходы к предсказанию Т-клеточных эпитопов. // Объединенный иммунологический форум,

Санкт-Петербург, 30 июня - 5 июля 2008 года. - Российский иммунологический журнал. - 2008. - Т.2. - С.118.

6. Antonets D.V., Maksyutov A.Z., Bazhan S.I. PolyCTLDesigner - the software for constructing polyepitope immunogens. // 4th Moscow Conference on Computational Molecular Biology. Moscow, July 20-23, 2009. - Abstr. Book, 2009.-P. 19-20.

7. Антонец Д.В., Максютов А.З., Бажан С.И. PolyCTLDesigner: программное обеспечение для конструирования полиэпитопных вакцин. // Медицинская геномика и протеомика. Новосибирск, 9-13 сентября 2009 г.: сб. тез. - Новосибирск, 2009. - С.63.

8. Antonets Р., Maksyutov A., Bazhan S. PolyCTLDesigner: the software for constructing highly efficient polyepitope immunogens. Application to HIV-1. // AIDS Vaccine 2009. Paris, France, October 19-22, 2009. - Retro virology. -2009. - V.6, suppl. 3. - P.284.

9- Антонец Д.В., Максютов A.3., Бажан С.И. PolyCTLDesigner. Создание новой полиэпитопной ВИЧ-1 вакцины in silico. Н Третья конференция по вопросам ВИЧ/СПИДа в Восточной Европе и Центральной Азии, Москва, 28-30 октября 2009 г.: сб. тез. - М., 2009. - Т.2. - С.85.

Ю.Бажан С.И., Карпенко Л.И., Ильичева Т., Белавин П.А., Серегин C.B., Антонец Д.В., Ильичев A.A., Ирвайн К., Гиббс Дж., Бенник Дж., Юделл Дж. Рациональный дизайн вакцин для индукции ВИЧ-1 специфического ответа С08+-Т-клеток. // Третья конференция по вопросам ВИЧ/СПИДа в Восточной Европе и Центральной Азии, Москва, 28-30 октября 2009 г.: сб. тез. - М., 2009. - Т.2. - С.87.

П.Регузова А.Ю., Антонец Д.В., Максютов P.A., Бажан С.И., Карпенко Л.И. Конструирование и биологическое тестирование ДНК-вакцинных конструкций, кодирующих структурные варианты искусственного поли-CTL-эпитопного иммуногена ВИЧ-1. // Третья конференция по вопросам ВИЧ/СПИДа в Восточной Европе и Центральной Азии, Москва, 28-30 октября 2009 г.: сб. тез. - М., 2009. - Т.2. - С. 125.

14

12.Antonets D.V., Maksyutov A.Z., Bazhan S.I. PolyCTLDesigner: A program for designing cytotoxic T-cell polyepitope immunogens. // 35th FEBS Congress. Gothenburg, Sweden, June 26 - July 1, 2010. - FEBS Journal. -2010.-V.277.-P.45.

13.Antonets D.V., Maksyutov A.Z., Bazhan S.I. PolyCTLDesigner - software for constructing polyepitope cytotoxic T-cell immunogens. // 7th International Conference on Bioinformatics of Genome Regulation and Structure\Systems Biology (BGRS\SB-2010). Novosibirsk, Russia, June 20-27, 2010. - Abstr. Book, 2010.-P.29

14.Bazhan S.I., Karpenko L.I., Ilyicheva T.N., Belavin P.A., Seregin S.V., Antonets D.V., Ilyichev A.A. Promising strategies for designing poly-CD8+ T cell-epitope DNA vaccine. // XVIII International Congress AIDS 2010, Vienna, Austria, July 18-23, 2010. - Abstr. Book, 2010. - V. 1, P. 290 (TUAA0103).

15.Bazhan S.I., Karpenko L.I., Ilyicheva T.N., Belavin P.A., Seregin S.V., Antonets D.V. Ilyichev A.A. Rational approaches for designing highly efficient DNA vaccines for eliciting HIV-specific CD8+ T cell responses. // WCVI'2010, Busan, South Korea, July 31- August 5, 2010. - Abstr. Book, 2010.-P. 185.

16.Antonets D. TEpredict - software for predicting T-cell epitopes: an update. // International Moscow Conference on Computational Molecular Biology (MCCMB-2011). Moscow, Russia, July 21-24, 2011. - Abstr. Book, 2011. -P.45-46.

17.Antonets D.V., Grudin D.S. TEpredict - software for predicting T-cell epitopes. An update. // The 8th International Conference on the Bioinformatics of Genome Regulation and Structure\Systems Biology (BGRS\SB-2012). Novosibirsk, Russia, June 25-29, 2012. - Abstr. Book, 2012. - P.38.

Вклад автора

Разработка статистических моделей, предназначенных для предсказания аффинности связывания олигопептидов с молекулами МНС, анализ и сравнительное тестирование полученных моделей, разработка алгоритма рационального дизайна полиэпитопных Т-клеточных антигенов, а также создание программного обеспечения, основанного на разработанных моделях и алгоритмах, и дизайн полиэпитопных Т-клеточных антигенов меланомы человека, выполнены автором лично. ДНК-вакцинные конструкции, кодирующие разработанные автором полиэпитопные антигены, получены сотрудниками отдела биоинженерии ФБУН ГНЦ ВБ "Вектор" Боробовой Е.А. и Старостиной Е.В. Исследования иммуногенности ДНК-вакцинной конструкции pMEL-TCI-A0201 в системе индукции Т-клеточного ответа ex vivo с использованием первичных культур иммунокомпетентных клеток человека было выполнено сотрудниками лаборатории молекулярной иммунологии НИИ КИ СО РАМН Лопатниковой Ю.А., Курилиным В.В. и Шевченко Ю.А. под руководством доктора медицинских наук, профессора Сенникова Сергея Витальевича.

1. ОБЗОР ЛИТЕРАТУРЫ

Организмы животных обладают целым рядом защитных механизмов, направленных против инфекционных агентов. Такие защитные реакции подразделяют на неспецифические врожденные, направленные против любых чужеродных клеток, вирусов, крупных молекул, и специфические приобретенные защитные реакции, направленные против конкретных инфекционных агентов. Центральная роль в регуляции и осуществлении специфического иммунного ответа принадлежит лимфоцитам - В- и Т-клеткам (Mesquita Junior et al., 2010; Ploegh, 2007). B-лимфоциты секретируют антитела - эффекторные молекулы гуморального иммунного ответа. Т-лимфоциты осуществляют регуляторные и эффекторные функции клеточного иммунного ответа. Т-клетки подразделяются на большое количество специализированных субпопуляций: Т-хелперы, Т-киллеры и регуляторные Т-лимфоциты. Их свойства и функции подробно описаны в многочисленных литературных источниках (Castellino, Germain, 2006; Josefowicz et al., 2012; Marshall, Swain, 2011; Mauri, Bosma, 2011; Wan, 2010; Williams, Bevan, 2007; Zhu et al., 2010).

Т-лимфоциты распознают антигены, презентируемые молекулами МНС I или II класса, с помощью специализированного рецепторного комплекса, состоящего из Т-клеточного рецептора и CD3, ассоциированных с корецептором CD4 (или CD8), CD2 и костимулирующими молекулами CD28 и CTLA-4 (Rudolph et al., 2006; Smith-Garvin et al., 2009). Далее термином Т-клетки (Т-лимфоциты) будут обозначаться a/ß-T-лимфоциты, а термином Т-клеточный рецептор - a/ß-T-клеточный рецептор.

Т-клеточный рецептор узнает чужеродные молекулярные структуры, в виде коротких пептидных фрагментов процессированных антигенов, представленных на поверхности клеток в ассоциации с молекулами МНС -главного комплекса гистосовместимости (Goldberg, Rock, 1992; Oldstone, 1989; Pâmer, Cresswell, 1998). Связавшись с комплексом пептида с молекулой МНС, Т-клеточный рецепторный комплекс активирует Т-лимфоцит (Kjer-Nielsen et al., 2003; Rudolph et al., 2006; Sim et al., 1996; Vasmatzis et al., 1996). Пептиды, способные связываться с молекулами МНС и активировать Т-лимфоциты называют Т-клеточными эпитопами.

Заключение Диссертация по теме "Молекулярная биология", Антонец, Денис Викторович

выводы

1. Разработаны новые статистические регрессионные модели, предсказывающие аффинность связывания нонамерных пептидов с 35 аллельными вариантами молекул МНС I класса человека по аминокислотной последовательности пептидов.

2. Сравнение различных схем параметризации олигопептидов подтвердило, что модели, использующие кодирование пептидов в виде векторов свойств составляющих их аминокислотных остатков (РМВЕС), обеспечивают лучшее качество предсказаний (по значению AUC - площади под кривой ошибок, характеризующей специфичность и чувствительность предсказаний), по сравнению с моделями, кодирующими олигопептиды виде разреженных векторов (р = 2.01 х 10~6).

3. Сравнительное тестирование полученных моделей с рядом других известных методов предсказания Т-клеточных эпитопов подтвердило их высокое качество. По медианному значению AUC (площади под кривой ошибок, характеризующей специфичность и чувствительность предсказаний) оригинальные модели (0.855) превзошли такие методы как SYFPEITHI (0.715), ProPredl (0.810), SVMHC (0.710) и SVRMHC (0.710), а обновленные модели (0.917) не уступают лучшим современным методам предсказания Т-клеточных эпитопов NetMHC (0.908), SMMPMBEC (0.907). По значению AUC новые модели (0.917) незначительно уступили методу IEDBrecommended (0.946), но превзошли его по значению коэффициента корреляции Пирсона (0.65 и 0.51, соответственно).

4. Разработан алгоритм рационального дизайна полиэптопных Тклеточных антигенов, согласно которому оптимальная последовательность полиэпитопа определяется путем поиска наиболее длинного простого пути с наименьшим весом в направленном взвешенном графе, вершины которого соответствуют эпитопам, а ребра

111

- допустимым паросочетаниям эпитопов. Вес каждого ребра определяется ранжирующей функцией, учитывающей количество предсказанных нецелевых эпитопов, образовавшихся на стыке эпитопов, распространенность аллельных вариантов молекул HLA, рестриктирующих нецелевые эпитопы, эффективность сайта протеасомного расщепления на С-конце первого из пары эпитопов и длину спейсерной последовательности.

5. На основе разработанных моделей и алгоритмов создано программное обеспечение для предсказания Т-клеточных эпитопов (TEpredict) и программа для рационального дизайна полиэпитопных антигенов (PolyCTLDesigner).

6. С использованием созданного программного обеспечения проведен дизайн полиэпитопного Т-клеточного антигена - кандидатной иммунотерапевтической вакцины для лечения меланомы человека (MEL-TCI-А0201).

7. Исследования полученной ДНК-вакцины (pMEL-TCI-A0201), кодирующей целевой полиэпитопный антиген, в системе индукции Т-клеточного иммунного ответа ex vivo с использованием первичных культур иммунокомпетентных клеток человека подтвердили иммуногенность созданной конструкции (р < 0.05).

БЛАГОДАРНОСТИ

Автор выражает благодарность заведующему отделом биоинженерии ФБУН ГНЦ ВБ «Вектор» д.б.н. Ильичеву A.A., сотрудникам отдела биоинженерии д.б.н. Карпенко Л.И., Боробовой Е.А., Старостиной Е.В., Регузовой А.Ю. за создание ДНК-вакцинных конструкций, несущих полиэпитопные Т-клеточные антигены. Также благодарит заведующего лабораторией молекулярной иммунологии НИИКИ СО РАМН, д.м.н., профессора Сенникова C.B. и сотрудников лаборатории Лопатникову Ю.А., КурилинаВ.В. и Шевченко Ю.А. за исследование иммунологических характеристик ДНК-вакцины pMEL-TCI-A0201 в системе индукции Т-клеточного иммунного ответа ex vivo с использованием первичных культур иммунокомпетентных клеток человека. Автор благодарит сотрудников Российского онкологического научного центра имени H.H. Блохина РАМН за любезно предоставленные культуры клеток меланомы человека. Также признателен сотрудникам теоретического отдела ФБУН ГНЦ ВБ «Вектор» к.б.н. Бакулиной А.Ю. и к.б.н. Максютову А.З. Особую благодарность автор выражает своему научному руководителю, заведующему теоретическим отделом ФБУН ГНЦ ВБ «Вектор», д.б.н. Бажану С.И. за всестороннюю поддержку при проведении исследований и написании диссертации.

Работа выполнена при финансовой поддержке Министерства образования и науки Российской Федерации (гос. контракт № 16.512.11.2186 и №8289) и Российского фонда фундаментальных исследований (грант РФФИИ2 12-04-31746 мола).

Библиография Диссертация по биологии, кандидата биологических наук, Антонец, Денис Викторович, Кольцово

1. Хрипко, О.П., Якушенко, Е.В., Сенников, С.В., Красильникова, И.В., Козлов, В.А. Использование дендритных клеток и интерлейкина-18 для модуляции иммунного ответа против HBcAg in vitro // Бюллетень СО РАМН. 2008. Т. 5. № 133. С. 109-113.

2. Эсбенсен, К. Анализ многомерных данных // под ред. О.Е. Родионова. Барнаул: Издательство Алтайского университета, 2003. 157 с.

3. Aarntzen, E.H.J.G., Figdor, C.G., Adema, G.J., Punt, CJ. a, Vries, I.J.M. de. Dendritic cell vaccination and immune monitoring // Cancer immunology, immunotherapy. 2008. V. 57. № 10. P. 1559-68.

4. Abdi, H. Partial least squares regression and projection on latent structure regression (PLS Regression) // Wiley Interdisciplinary Reviews: Computational Statistics. 2010. V. 2. № 1. P. 97-106.

5. Altschul, S.F., Madden, T.L., Schaffer, A.A., Zhang, J., Zhang, Z., Miller, W., Lipman, D.J. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs // Nucleic acids research. 1997. V. 25. № 17. P. 3389^02.

6. Anders, A.K. HLA-DM captures partially empty HLA-DR molecules for catalyzed removal of peptide // Nature Immunol. 2011. V. 12. P. 54-61.

7. Balasse, E., Gatouillat, G., Patigny, D., Andry, M.C., Madoulet, C. In vivo anti-melanoma activities of the Melan-A // Vaccine. 2009. V. 27. № 44. P. 6107-9.

8. Bailee, E., Mansouri, M., Hovey Nerenberg, B.T., Gouveia, K., Fruh, K. Downregulation of major histocompatibility complex class I by human ubiquitin ligases related to viral immune evasion proteins // J. Virol. 2004. V. 78. P. 1109-1120.

9. Bei, R., Scardino, A. TAA polyepitope DNA-based vaccines: a potential tool for cancer therapy // Journal of biomedicine & biotechnology. 2010. V. 2010. P. 102758.

10. Bendtsen, J.D., Nielsen, H., Heijne, G. von, Brunak, S. Improved prediction of signal peptides: SignalP 3.0 // Journal of molecular biology. 2004. V. 340. № 4. P. 783-95.

11. Berglund, P., Finzi, D., Bennink, J.R., Yewdell, J.W. Viral alteration of cellular translational machinery increases defective ribosomal products // J. Virol. 2007. V. 81. P. 7220-7229.

12. Bertolino, P., Rabourdin-Combe, C. The MHC class II-associated invariant chain: a molecule with multiple roles in MHC class II biosynthesis and antigen presentation to CD4+ T cells // Crit. Rev. Immunol. 1996. V. 16. P. 359-379.

13. Berzofsky, J.A., Berkower, I.J. Novel approaches to peptide and engineered protein vaccines for HIV using defined epitopes: advances in 1994-1995 // AIDS (London, England). 1995. V. 9 Suppl A. P. S143-57.

14. Bhasin, M., Raghava, G.P.S. A hybrid approach for predicting promiscuous MHC class I restricted T cell epitopes // Journal of biosciences. 2007. V. 32. № l.P. 31^12.

15. Bhasin, M., Singh, H., Raghava, G.P.S. MHCBN: a comprehensive database of MHC binding and non-binding peptides // Bioinformatics (Oxford, England). 2003. V. 19. № 5. P. 665-6.

16. Blackwell, J.M., Jamieson, S.E., Burgner, D. HLA and infectious diseases // Clinical microbiology reviews. 2009. V. 22. № 2. P. 370-85, Table of Contents.

17. Bonini, C., Lee, S.P., Riddell, S.R., Greenberg, P.D. Targeting antigen in mature dendritic cells for simultaneous stimulation of CD4+ and CD8+ T cells // Journal of immunology. 2001. V. 166. № 8. P. 5250-7.

18. Bouvier, M., Wiley, D.C. Importance of peptide amino and carboxyl termini to the stability of MHC class I molecules // Science (New York, N.Y.). 1994. V. 265. № 5170. P. 398-402.

19. Brady, B.L., Steinel, N.C., Bassing, C.H. Antigen receptor allelic exclusion: an update and reappraisal // Journal of immunology. 2010. V. 185. № 7. P. 3801-8.

20. Bremel, R.D., Homan, E.J. An integrated approach to epitope analysis I: Dimensional reduction, visualization and prediction of MHC binding using amino acid principal components and regression approaches // Immunome Research. 2010. V. 6. № 1. P. 7.

21. Broeke, T. ten, Niel, G. van, Wauben, M.H., Wubbolts, R„ Stoorvogel, W. Endosomally stored MHC class II does not contribute to antigen presentation by dendritic cells at inflammatory conditions // Traffic. 2011. V. 12. P. 1025-1036.

22. Burg, S.H. van der, Visseren, M.J., Brandt, R.M., Kast, W.M., Melief, C.J. Immunogenicity of peptides bound to MHC class I molecules depends on the MHC-peptide complex stability // Journal of immunology. 1996. V. 156. № 9. P. 3308-14.

23. Call, M.J. Small molecule modulators of MHC class II antigen presentation: mechanistic insights and implications for therapeutic application // Molecular immunology. 2011. V. 48. № 15-16. P. 1735-43.

24. Cascio, P., Hilton, C„ Kisselev, A.F., Rock, K.L., Goldberg, A.L. 26S proteasomes and immunoproteasomes produce mainly N-extended versions of an antigenic peptide // EMBO J. 2001. V. 20. P. 2357-2366.

25. Castellino, F., Germain, R.N. Cooperation between CD4+ and CD8+ T cells: when, where, and how // Annual review of immunology. 2006. V. 24. P. 519-40.

26. Castellino, F., Zappacosta, F., Coligan, J.E., Germain, R.N. Large protein fragments as substrates for endocytic antigen capture by MHC class II molecules // Journal of immunology. 1998. V. 161. № 8. P. 4048-57.

27. Castellino, F., Zhong, G., Germain, R.N. Antigen presentation by MHC class II molecules: invariant chain function, protein trafficking, and the molecular basis of diverse determinant capture // Human immunology. 1997. V. 54. №2. P. 159-69.

28. Cebon, J., MacGregor, D., Scott, A., DeBoer, R. Immunotherapy of melanoma: targeting defined antigens // The Australasian journal of dermatology. 1997. V. 38 Suppl 1. P. S66-72.

29. Chen, C., Hardle, W., Unwin, A., Cox, M.A.A., Cox, T.F. Multidimensional Scaling // Handbook of Data Visualization. Springer Berlin Heidelberg, 2008. P. 315-347.

30. Chun, H., Keles, S. Sparse partial least squares regression for simultaneous dimension reduction and variable selection // Journal of the Royal Statistical Society. Series B, Statistical methodology. 2010. V. 72. № 1. P. 3-25.

31. Chung, D., Keles, S. Sparse partial least squares classification for high dimensional data // Statistical applications in genetics and molecular biology. 2010. V. 9. № 1. P. Article 17.

32. Cobb, R.M., Oestreich, K.J., Osipovich, O. a, Oltz, E.M. Accessibility control of V(D)J recombination // Advances in immunology. 2006. V. 91. № D. P. 45-109.

33. Crotzer, V.L., Glosson, N., Zhou, D., Nishino, I., Blum, J.S. LAMP-2-deficient human B cells exhibit altered MHC class II presentation of exogenous antigens // Immunology. 2010. V. 131. № 3. P. 318-30.

34. Dalet, A. An antigenic peptide produced by reverse splicing and double asparagine deamidation // Proc. Natl Acad. Sci. USA. 2011. V. 108. P. e323-e331.

35. Dolan, B.P. Distinct pathways generate peptides from defective ribosomal products for CD8+ T cell immunosurveillance // J. Immunol. 2011. V. 186. P. 2065-2072.

36. Dosztanyi, Z., Torda, A.E. Amino acid similarity matrices based on force fields // Bioinformatics (Oxford, England). 2001. V. 17. № 8. P. 686-99.

37. Doytchinova, I., Hemsley, S., Flower, D.R. Transporter associated with antigen processing preselection of peptides binding to the MHC: a bioinformatic evaluation // Journal of immunology. 2004a. V. 173. № 11. P. 6813-9.

38. Doytchinova, I.A., Flower, D.R. In silico identification of supertypes for class II MHCs //Journal of immunology. 2005. V. 174. № 11. P. 7085-95.

39. Doytchinova, I.A., Guan, P., Flower, D.R. Identifiying human MHC supertypes using bioinformatic methods // Journal of immunology. 2004b. V. 172. №7. P. 4314-23.

40. Doytchinova, I.A., Guan, P., Flower, D.R. Quantitative structure-activity relationships and the prediction of MHC supermotifs // Methods (San Diego, Calif.). 2004c. V. 34. № 4. P. 444-53.

41. Doytchinova, I.A., Guan, P., Flower, D.R. EpiJen: a server for multistep T cell epitope prediction // BMC bioinformatics. 2006. V. 7. P. 131.

42. Donnes, P., Elofsson, A. Prediction of MHC class I binding peptides, using SVMHC // BMC bioinformatics. 2002. V. 3. P. 25.

43. Eisenlohr, L., Huang, L., Golovina, T. Rethinking peptide supply to MHC class I molecules // Nature Reviews Immunology. 2007. V. 7. № May. P. 403-410.

44. Erlich, H. HLA Polymorphism and Disease Susceptibility // Computational Genetics and Genomics. 2005.

45. Falk, K., Rotzschke, O., Stevanovic, S., Jung, G., Rammensee, H.G. Allele-specific motifs revealed by sequencing of self-peptides eluted from MHC molecules // Nature. 1991. V. 351. № 6324. P. 290-6.

46. Fernando, M.M. Defining the role of the MHC in autoimmunity: a review and pooled analysis // PLoS Genet. 2008. V. 4. P. el000024.

47. Ferrara, T.A., Hodge, J.W., Gulley, J.L. Combining radiation and immunotherapy for synergistic antitumor therapy // Curr. Opin. Mol. Ther. 2009. V. 11. P. 37-42.

48. Filzmoser, P., Maronna, R., Werner, M. Outlier identification in high dimensions // Computational Statistics & Data Analysis. 2008. V. 52. № 3. P. 1694-1711.

49. Fooksman, D.R., Vardhana, S., Vasiliver-Shamis, G., Liese, J., Blair, D. a,

50. Waite, J., Sacristan, C., Victora, G.D., Zanin-Zhorov, A., Dustin, M.L.

51. Functional anatomy of T cell activation and synapse formation // Annualreview of immunology. 2010. V. 28. P. 79-105.121

52. Gautier, L. RPy2: A simple and efficient access to R from Python (Электронный ресурс). URL: http: //rpy.sourceforge.net/rpy2.html.

53. Ge, W„ Hu, P.-Z., Huang, Y„ Wang, X.-M., Zhang, X.-M., Sun, Y.-J., Li, Z.-S., Si, S.-Y., Sui, Y.-F. The antitumor immune responses induced by nanoemulsion-encapsulated MAGE1-HSP70 // Oncology reports. 2009. V. 22. №4. P. 915-20.

54. Goldberg, A.L., Rock, K.L. Proteolysis, proteasomes and antigen presentation//Nature. 1992. V. 357. № 6377. P. 375-9.

55. Gonzalez-Galarza, F.F., Christmas, S., Middleton, D., Jones, A.R. Allele frequency net: a database and online repository for immune gene frequencies in worldwide populations // Nucleic acids research. 2011. V. 39. № Database issue. P. D913-9.

56. Groettrup, M., Kirk, C.J., Basler, M. Proteasomes in immune cells: more than peptide producers? // Nature reviews. Immunology. 2010. V. 10. № 1. P. 73-8.

57. Gromme, M. Recycling MHC class I molecules and endosomal peptide loading // Proc. Natl Acad. Sci. USA. 1999. V. 96. P. 10326-10331.

58. Guan, P., Doytchinova, I.A., Zygouri, C., Flower, D.R. MHCPred: bringing a quantitative dimension to the online prediction of MHC binding // Applied bioinformatics. 2003. V. 2. № 1. P. 63-6.

59. Halama, N., Zoernig, I., Jaeger, D. Advanced malignant melanoma: immunologic and multimodal therapeutic strategies // Journal of oncology. 2010. V. 2010. P. 689893.

60. Hammer, J., Takacs, B., Sinigaglia, F. Identification of a motif for HLA-DR1 binding peptides using M13 display libraries // The Journal of experimental medicine. 1992. V. 176. № 4. P. 1007-13.

61. Hammer, J., Valsasnini, P., Tolba, K., Bolin, D., Higelin, J., Takacs, B., Sinigaglia, F. Promiscuous and allele-specific anchors in HLA-DR-binding peptides // Cell. 1993. V. 74. № 1. P. 197-203.

62. Hanada, K., Yewdell, J.W., Yang, J.C. Immune recognition of a human renal cancer antigen through post-translational protein splicing // Nature. 2004. V. 427. P. 252-256.

63. Hartman, I.Z. A reductionist cell-free major histocompatibility complex class II antigen processing system identifies immunodominant epitopes // Nature Med. 2010. V. 16. P. 1333-1340.

64. Hattotuwagama, C.K., Guan, P., Doytchinova, I.A., Zygouri, C., Flower, D.R. Quantitative online prediction of peptide binding to the major histocompatibility complex // Journal of molecular graphics & modelling. 2004. V. 22. № 3. P. 195-207.

65. Herberts, C.A. Cutting edge: HLA-B27 acquires many N-terminal dibasic peptides: coupling cytosolic peptide stability to antigen presentation // J. Immunol. 2006. V. 176. P. 2697-2701.

66. Herrera-Najera, C., Pina-Aguilar, R., Xacur-Garcia, F., Ramirez-Sierra, M.J., Dumonteil, E. Mining the Leishmania genome for novel antigens and vaccine candidates // Proteomics. 2009. V. 9. № 5. P. 1293-301.

67. Hofmann, M.W. The leucine-based sorting motifs in the cytoplasmic domain of the invariant chain are recognized by the clathrin adaptors API and AP2 and their medium chains // J. Biol. Chem. 1999. V. 274. P. 36153-36158.

68. Hoof, I., Peters, В., Sidney, J., Pedersen, L.E., Sette, A., Lund, O., Buus, S., Nielsen, M. NetMHCpan, a method for MHC class I binding prediction beyond humans // Immunogenetics. 2009. V. 61. № 1. P. 1-13.

69. Howe, С. Calreticulin-dependent recycling in the early secretory pathway mediates optimal peptide loading of MHC class I molecules // EMBO J. 2009. V. 28. P. 3730-3744.

70. Hsing, L.C., Rudensky, A.Y. The lysosomal cysteine proteases in MHC class II antigen presentation // Immunol. Rev. 2005. V. 207. P. 229-241.

71. Hughes, E.A., Hammond, C., Cresswell, P. Misfolded major histocompatibility complex class I heavy chains are translocated into the cytoplasm and degraded by the proteasome // Proc. Natl Acad. Sci. USA. 1997. V. 94. P. 1896-1901.

72. Jojic, N., Reyes-Gomez, M., Heckerman, D., Kadie, C., Schueler-Furman, O. Learning MHC I—peptide binding // Bioinformatics (Oxford, England). 2006. V. 22. № 14. P. e227-35.

73. Jones, E., Oliphant, Т., Peterson, P., Al., E. SciPy: Open source scientific tools for Python (Электронный ресурс). URL: http: //www.scipy.org/.

74. Josefowicz, S.Z., Lu, L.-F., Rudensky, A.Y. Regulatory T Cells: Mechanisms of Differentiation and Function // Annual review of immunology. 2012. № December 2011. P. 531-564.

75. Jahnisch, H., Fussel, S., Kiessling, A., Wehner, R., Zastrow, S., Bachmann, M., Rieber, E.P., Wirth, M.P., Schmitz, M. Dendritic cell-based immunotherapy for prostate cancer // Clinical & developmental immunology. 2010. V. 2010. P. 517493.

76. Karvanen, J., Koivunen, V. Blind separation methods based on Pearson system and its extensions // Signal Processing. 2002. V. 82. № 4. P. 663673.

77. Kawahara, M., York, I.A., Hearn, A., Farfan, D., Rock, K.L. Analysis of the role of tripeptidyl peptidase II in MHC class I antigen presentation in vivo // J. Immunol. 2009. V. 183. P. 6069-6077.

78. Kawashima, S., Kanehisa, M. AAindex: amino acid index database // Nucleic acids research. 2000. V. 28. № 1. P. 374.

79. Kessler, J.H. Antigen processing by nardilysin and thimet oligopeptidase generates cytotoxic T cell epitopes // Nature Immunol. 2011. V. 12. P. 4553.

80. Khan, S. Cutting edge: neosynthesis is required for the presentation of a T cell epitope from a long-lived viral protein // J. Immunol. 2001. V. 167. P. 4801^804.

81. Kidera, A., Konishi, Y., Oka, M., Ooi, T., Scheraga, H.A. Statistical analysis of the physical properties of the 20 naturally occurring amino acids // Journal of Protein Chemistry. 1985. V. 4. № 1. P. 23-55.

82. Kim, Y., Sidney, J., Pinilla, C., Sette, A., Peters, B. Derivation of an amino acid similarity matrix for peptide: MHC binding and its application as a Bayesian prior // BMC bioinformatics. 2009. V. 10. P. 394.

83. Klein, C., Bueler, H., Mulligan, R.C. Comparative analysis of genetically modified dendritic cells and tumor cells as therapeutic cancer vaccines // The Journal of experimental medicine. 2000. V. 191. № 10. P. 1699-708.

84. Kloetzel, P.M. Generation of major histocompatibility compl 21f0 ex class I antigens: functional interplay between proteasomes and TPPII // Nature1.munol. 2004. V. 5. P. 661-669.127

85. Koopmann, J.O. Export of antigenic peptides from the endoplasmic reticulum intersects with retrograde protein translocation through the Sec61p channel//Immunity. 2000. V. 13. P. 117-127.

86. Kropshofer, H. Editing of the HLA-DR-peptide repertoire by HLA-DM // EMBO J. 1996. V. 15. P. 6144-6154.

87. Kulkarni, S. Differential microRNA regulation of HLA-C expression and its association with HIV control // Nature. 2011. V. 472. P. 495-498.

88. Kurts, C., Robinson, B.W.S., Knolle, P.A. Cross-priming in health and disease // Nature reviews. Immunology. 2010. V. 10. № 6. P. 403-14.

89. Kuttler, C., Nussbaum, A.K., Dick, T.P., Rammensee, H., Hadeler, K. An Algorithm for the Prediction of Proteasomal Cleavages // Learning. 2000.

90. Lafuente, E.M., Reche, P.A. Prediction of MHC-peptide binding: a systematic and comprehensive overview // Current pharmaceutical design. 2009. V. 15. № 28. P. 3209-20.

91. Landsverk, O.J., Bakke, O., Gregers, T.F. MHC II and the endocytic pathway: regulation by invariant chain // Scand. J. Immunol. 2009. V. 70. P. 184-193.

92. Larsen, M. V, Lundegaard, C., Lamberth, K., Buus, S., Lund, O., Nielsen, M. Large-scale validation of methods for cytotoxic T-lymphocyte epitope prediction // BMC bioinformatics. 2007. V. 8. P. 424.

93. Launay, G., Mendez, R., Wodak, S., Simonson, T. Recognizing proteinprotein interfaces with empirical potentials and reduced amino acid alphabets // BMC bioinformatics. 2007. V. 8. P. 270.

94. Lev, A. The exception that reinforces the rule: crosspriming by cytosolicpeptides that escape degradation // Immunity. 2008. V. 28. P. 787-798.128

95. Li, M. Widespread RNA and DNA sequence differences in the human transcriptome // Science. 2011. V. 333. P. 53-58.

96. Liao, W.W.P., Arthur, J.W. Predicting peptide binding to Major Histocompatibility Complex molecules // Autoimmunity reviews. 2011. V. 10. № 8. P. 469-73.

97. Lin, H.H., Ray, S., Tongchusak, S., Reinherz, E.L., Brusic, V. Evaluation of MHC class I peptide binding prediction servers: applications for vaccine research // BMC immunology. 2008. V. 9. P. 8.

98. Liu, W., Meng, X., Xu, Q., Flower, D.R., Li, T. Quantitative prediction of mouse class I MHC peptide binding affinity using support vector machine regression (SVR) models // BMC bioinformatics. 2006. V. 7. P. 182.

99. Livingston, B.D., Newman, M., Crimi, C., McKinney, D., Chesnut, R., Sette, A. Optimization of epitope processing enhances immunogenicity of multiepitope DNA vaccines // Vaccine. 2001. V. 19. № 32. P. 4652-60.

100. Lundegaard, C., Lund, O., Buus, S., Nielsen, M. Major histocompatibility complex class I binding predictions as a tool in epitope discovery // Immunology. 2010a. V. 130. P. 309-318.

101. Lundegaard, C., Lund, O., Buus, S., Nielsen, M. Major histocompatibility complex class I binding predictions as a tool in epitope discovery // Immunology. 2010b. V. 130. № 3. P. 309-18.

102. Marshall, N.B., Swain, S.L. Cytotoxic CD4 T cells in antiviral immunity //

103. Journal of biomedicine & biotechnology. 2011. V. 2011. P. 954602.129

104. Mateo, L„ Gardner, J., Chen, Q., Schmidt, C., Down, M., Elliott, S.L., Pye, S.J., Firat, H., Lemonnier, F.A., Cebon, J., Suhrbier, A. An HLA-A2 polyepitope vaccine for melanoma immunotherapy // Journal of immunology. 1999. V. 163. № 7. P. 4058-63.

105. Mauri, C., Bosma, A. Immune Regulatory Function of В Cells // Annual review of immunology. 2011. V. 10. № December 2011. P. 221-241.

106. Max, H., Haider, Т., Kropshofer, H., Kalbus, M., Muller, C.A., Kalbacher, H. Characterization of peptides bound to extracellular and intracellular HLA-DR1 molecules // Human immunology. 1993. V. 38. № 3. P. 193-200.

107. Mester, G., Hoffmann, V., Stevanovic, S. Insights into MHC class I antigen processing gained from large-scale analysis of class I ligands // Cell. Mol. Life Sci. 2011. V. 68. P. 1521-1532.

108. Mevik, B.-H., Wehrens, R. The pis package: Principal component and partial least squares regression in R // Journal of Statistical Software. 2007. V. 18. №2. P. 1-24.

109. Mo, X.Y., Cascio, P., Lemerise, K., Goldberg, A.L., Rock, K. Distinct proteolytic processes generate the С and N termini of MHC class I-binding peptides // Journal of immunology. 1999. V. 163. № 11. P. 5851-9.

110. Moreira, W., Warnes, G.R. RPy: A simple and efficient access to R from Python (Электронный ресурс). URL: http: //rpy.sourceforge.net/rpy.html.

111. Mustafa, A.S., Shaban, F.A. ProPred analysis and experimental evaluationof promiscuous T-cell epitopes of three major secreted antigens of130

112. Mycobacterium tuberculosis // Tuberculosis (Edinburgh, Scotland). 2006. V. 86. №2. P. 115-24.

113. Neefjes, J., Jongsma, M.L.M., Paul, P., Bakke, O. Towards a systems understanding of MHC class I and MHC class II antigen presentation // Nature reviews. Immunology. 2011. V. 11. № 12. P. 823-36.

114. Neijssen, J. Cross-presentation by intercellular peptide transfer through gap junctions // Nature. 2005. V. 434. P. 83-88.

115. Neisig, A., Melief, С J., Neefjes, J. Reduced cell surface expression of HLA-C molecules correlates with restricted peptide binding and stable TAP interaction // J. Immunol. 1998. V. 160. P. 171-179.

116. Neisig, A., Wubbolts, R., Zang, X., Melief, C., Neefjes, J. Allele-specific differences in the interaction of MHC class I molecules with transporters associated with antigen processing // J. Immunol. 1996. V. 156. P. 31963206.

117. Netzer, N. Innate immune and chemically triggered oxidative stress modifies translational fidelity // Nature. 2009. V. 462. P. 522-526.

118. Nielsen, M., Lundegaard, C., Lund, O., Kesmir, C. The role of the proteasome in generating cytotoxic T-cell epitopes: insights obtained from improved predictions of proteasomal cleavage // Immunogenetics. 2005. V. 57. № 1-2. P. 33-41.

119. Nielsen, M., Lundegaard, C., Worning, P., Lamberth, K., Lund, O. Improved prediction of MHC class I and II epitopes using a novel Gibbs sampling approach // Building. 2004b. V. 29. № c. P. 1-29.

120. Nitta, T. Thymoproteasome shapes immunocompetent repertoire of CD8+ T cells // Immunity. 2010. V. 32. P. 29^10.

121. Norton, D.L., Haque, A. Insights into the Role of GILT in HLA Class II Antigen Processing and Presentation by Melanoma // Journal of oncology. 2009. V. 2009. P. 142959.

122. Nussbaum, A.K., Kuttler, C., Hadeler, K.P., Rammensee, H.G., Schild, H. PAProC: a prediction algorithm for proteasomal cleavages available on the WWW // Immunogenetics. 2001. V. 53. № 2. P. 87-94.

123. Oldstone, M.B. Viral persistence // Cell. 1989. V. 56. № 4. P. 517-20.

124. Osipovich, O., Oltz, B.M. Regulation of antigen receptor gene assembly by genetic-epigenetic crosstalk // Seminars in immunology. 2010. V. 22. № 6. P. 313-22.

125. Pamer, E., Cresswell, P. Mechanisms of MHC class I—restricted antigen processing // Annual review of immunology. 1998. V. 16. P. 323-58.

126. Pamer, E.G., Harty, J.T., Bevan, M.J. Precise prediction of a dominant class I MHC-restricted epitope of Listeria monocytogenes // Nature. 1991. V. 353. № 6347. P. 852-5.

127. Pang, B. Direct antigen presentation and gap junction mediated cross-presentation during apoptosis // J. Immunol. 2009. V. 183. P. 1083-1090.

128. Parcej, D., Tampe, R. ABC proteins in antigen translocation and viral inhibition // Nature Cliem. Biol. 2010. V. 6. P. 572-580.

129. Park, B. Redox regulation facilitates optimal peptide selection by MHC class I during antigen processing // Cell. 2006. V. 127. P. 369-382.

130. Parker, K.C., Bednarek, M.A., Coligan, J.E. Scheme for ranking potential HLA-A2 binding peptides based on independent binding of individualpeptide side-chains // Journal of immunology. 1994. V. 152. № 1. P. 16375.

131. Peh, C.A. HLA-B27-restricted antigen presentation in the absence of tapasin reveals polymorphism in mechanisms of HLA class I peptide loading // Immunity. 1998. V. 8. P. 531-542.

132. Perone, C.S. Pyevolvc: Genetic Algorithm framework written in pure python (Электронный ресурс). URL: http: //pyevolve.sourceforge.net.

133. Peters, В., Bulik, S., Tampe, R., Endert, P.M. Van, Holzhutter, H.-G. Identifying MHC class I epitopes by predicting the TAP transport efficiency of epitope precursors // Journal of immunology. 2003a. V. 171. № 4. P. 1741-9.

134. Peters, В., Tong, W., Sidney, J., Sette, A., Weng, Z. Examining the independent binding assumption for binding of peptide epitopes to MHC-I molecules // Bioinformatics (Oxford, England). 2003b. V. 19. № 14. P. 1765-72.

135. Ploegh, H.L. Bridging В ccll and T cell recognition of antigen // Journal of immunology. 2007. V. 179. № 11. P. 7193.

136. Princiotta, M.F. Quantitating protein synthesis, degradation, and endogenous antigen processing //Immunity. 2003. V. 18. P. 343-354.

137. R: A Language and Environment for Statistical Computing // 2012.134

138. Raiborg, С., Stenmark, H. The ESCRT machinery in endosomal sorting of ubiquitylated membrane proteins // Nature. 2009. V. 458. P. 445^52.

139. Rammensee, H., Bachmann, J., Emmerich, N.P., Bachor, O.A., Stevanovic, S. SYFPEITHI: database for MHC ligands and peptide motifs // Immunogenetics. 1999. V. 50. № 3-4. P. 213-9.

140. Reche, P., Reinherz, E. Prediction of Peptide-МНС Binding Using Profiles // Immunoinformatics SE 13 / под ред. D. Flower. Humana Press, 2007. P. 185-200.

141. Reche, P.A., Glutting, J.-P., Zhang, H., Reinherz, E.L. Enhancement to the RANKPEP resource for the prediction of peptide binding to MHC molecules using profiles // Immunogenetics. 2004. V. 56. № 6. P. 405-19.

142. Reits, E. Peptide diffusion, protection, and degradation in nuclear and cytoplasmic compartments before antigen presentation by MHC class I // Immunity. 2003. V. 18. P. 97-108.

143. Reits, E. A major role for TPPII in trimming proteasomal degradation products for MHC class I antigen presentation // Immunity. 2004. V. 20. P. 495-506.

144. Reits, E. a, Vos, J.C., Gramme, M., Neefjes, J. The major substrates for TAP in vivo are derived from newly synthesized proteins // Nature. 2000. V. 404. № 6779. P. 774-8.

145. Reits, E.A. Radiation modulates the peptide repertoire, enhances MHC class I expression, and induces successful antitumor immunotherapy // J. Exp. Med. 2006. V. 203. P. 1259-1271.

146. Robinson, J., Mistry, K., McWilliam, H., Lopez, R., Parham, P., Marsh, S.G.E. The IMGT // Nucleic acids research. 2011. V. 39. № Database issue. P. D1171-6.

147. Rocca, A. Localization of the conformational alteration of MHC molecules induced by the association of mouse class I heavy chain with a xenogeneic ?2-microglobulin //Mol. Immunol. 1992. V. 29. P. 481-487.

148. Rock, K.L., York, I.A., Saric, Т., Goldberg, A.L. Protein degradation and the generation of MHC class I-presented peptides // Adv. Immunol. 2002. V. 80. P. 1-70.

149. Roelse, J., Gromme, M., Momburg, F., Hammerling, G., Neefjes, J. Trimming of TAP-translocated peptides in the endoplasmic reticulum and in the cytosol during recycling // J. Exp. Med. 1994. V. 180. P. 1591-1597.

150. Rosa, D.S., Ribeiro, S.P., Almeida, R.R., Mairena, E.C. A DNA Vaccine Encoding Multiple HIV CD4 Epitopes Elicits Vigorous Polyfunctional , Long-Lived CD4 + and CD8 + T Cell Responses // 2011. V. 6. № 2.

151. Rossum, G. van. Python Programming Language Official Website (Электронный ресурс). URL: http: //python.org.

152. Rothbard, J.B., Taylor, W.R. A sequence pattern common to T cell epitopes // The EMBO journal. 1988. V. 7. № 1. P. 93-100.

153. RStudio: Integrated development environment for R (Version 0.96.122) // 2012.

154. Rudolph, M.G., Stanfield, R.L., Wilson, I. a. How TCRs bind MHCs, peptides, and coreceptors // Annual review of immunology. 2006. V. 24. P. 419-66.

155. Ruff, A.L., Guarnieri, F.G., Staveley-O'Carroll, K., Siliciano, R.F., August, J.T. The enhanced immune response to the HIV gpl60 // The Journal of biological chemistry. 1997. V. 272. № 13. P. 8671-8.

156. Ruppert, J., Sidney, J., Celis, E., Kubo, R.T., Grey, H.M., Sette, A. Prominent role of secondary anchor residues in peptide binding to HLA-A2.1 molecules // Cell. 1993. V. 74. № 5. P. 929-37.

157. Rotzschke, O., Falk, K., Stevanovic, S., Jung, G., Walden, P., Rammensee, H.G. Exact prediction of a natural T cell epitope // European journal of immunology. 1991. V. 21. № 11. P. 2891-4.

158. Saccheri, F. Bacteria-induced gap junctions in tumors favor antigen cross-presentation and antitumor immunity // Sci. Transl. Med. 2010. V. 2. P. 44ra57.

159. Salomon, J., Flower, D.R. Predicting Class II MHC-Peptide binding: a kernel based approach using similarity scores // BMC bioinformatics. 2006. V. 7. № l.P. 501.

160. Sammon, J.W. A Nonlinear Mapping for Data Structure Analysis // IEEE Transactions on Computers. 1969. V. C-18. № 5. P. 401^09.

161. Sanderson, F. Accumulation of HLA-DM, a regulator of antigen presentation, in MHC class II compartments // Science. 1994. V. 266. P. 1566-1569.

162. Saric, T. An IFN-?-induced aminopeptidase in the ER, ERAP1, trims precursors to MHC class I-presented peptides // Nature Immunol. 2002. V. 3.P. 1169-1176.

163. Saveanu, L. Concerted peptide trimming by human ERAP1 and ERAP2 aminopeptidase complexes in the endoplasmic reticulum // Nature Immunol. 2005. V. 6. P. 689-697.

164. Saveanu, L., Carroll, O., Hassainya, Y., Endert, P. van. Complexity, contradictions, and conundrums: studying post-proteasomal proteolysis in HLA class I antigen presentation // Immunol. Rev. 2005. V. 207. P. 42-59.

165. Schneider, S.C., Ohmen, J., Fosdick, L., Gladstone, B., Guo, J., Ametani, A.,

166. Sefcarz, E.E., Deng, H. Cutting edge: introduction "of an endopeptidasecleavage motif into a determinant flanking region of hen egg lysozyme results in enhanced T cell determinant display // Journal of immunology. 2000. V. 165. № l.P. 20-3.

167. Schubert, U. Rapid degradation of a large fraction of newly synthesized proteins by proteasomes // Nature. 2000. V. 404. P. 770-774.

168. Serwold, T., Gonzalez, F., Kim, J., Jacob, R., Shastri, N. ERAAP customizes peptides for MHC class I molecules in the endoplasmic reticulum // Nature. 2002. V. 419. № 6906. P. 480-3.

169. Sette, A., Sidney, J. HLA supertypes and supermotifs: a functional perspective on HLA polymorphism // Current opinion in immunology. 1998. V. 10. №4. P. 478-82.

170. Sette, A., Sidney, J. Nine major HLA class I supertypes account for the vast preponderance of HLA-A and -B polymorphism // Immunogenetics. 1999. V. 50. № 3-4. P. 201-12.

171. Sijts, E.J., Kloetzel, P.M. The role of the proteasome in the generation of MHC class I ligands and immune responses // Cell. Mol. Life Sci. 2011. V. 68. P. 1491-1502.

172. Sim, B.C., Zerva, L., Greene, M.I., Gascoigne, N.R. Control of MHC restriction by TCR Valpha CDR1 and CDR2 // Science (New York, N.Y.). 1996. V. 273. № 5277. P. 963-6.

173. Sing, T., Sander, O., Beerenwinkel, N., Lengauer, T. ROCR: visualizing classifier performance in R // Bioinformatics (Oxford, England). 2005. V. 21. №20. P. 3940-1.

174. Singh, H., Raghava, G.P. ProPred: prediction of HLA-DR binding sites // Bioinformatics (Oxford, England). 2001. V. 17. № 12. P. 1236-7.

175. Singh, H., Raghava, G.P.S. ProPredl: prediction of promiscuous MHC Class-I binding sites // Bioinformatics. 2003. V. 19. № 8. P. 1009-1014.

176. Smith-Garvin, J.E., Koretzky, G. a, Jordan, M.S. T cell activation // Annual review of immunology. 2009. V. 27. P. 591-619.

177. Stassar, M.J., Raddrizzani, L., Hammer, J., Zoller, M. T-helper cell-response to MHC class II-binding peptides of the renal cell carcinoma-associated antigen RAGE-1 // Immunobiology. 2001. V. 203. № 5. P. 743-55.

178. Stranzl, T., Larsen, M.V., Lundegaard, C., Nielsen, M. NetCTLpan: pan-specific MHC class I pathway epitope predictions // Immunogenetics. 2010. V. 62. № 6. P. 357-68.

179. Sturniolo, T., Bono, E., Ding, J., Raddrizzani, L., Tuereci, O., Sahin, U., Braxenthaler, M., Gallazzi, F., Protti, M.P., Sinigaglia, F., Hammer, J. Generation of tissue-specific and promiscuous HLA ligand databases using

180. DNA microarrays and virtual HLA class II matrices // Nature biotechnology. 1999. V. 17. №6. P. 555-61.

181. Sun, X., Hodge, L.M., Jones, H.P., Tabor, L., Simecka, J.W. Co-expression of granulocyte-macrophage colony-stimulating factor with antigen enhances humoral and tumor immunity after DNA vaccination // Vaccine. 2002. V. 20. № 9-10. P. 1466-74.

182. Sundar, K., Boesen, A., Coico, R. Computational prediction and identification of HLA-A2.1-specific Ebola virus CTL epitopes // Virology. 2007. V. 360. № 2. P. 257-63.

183. Swets, J.A. Measuring the accuracy of diagnostic systems // Science (New York, N.Y.). 1988. V. 240. № 4857. P. 1285-93.

184. Taylor, M., Bolton, L.M., Johnson, P., Elliott, T., Murray, N. Breast cancer is a promising target for vaccination using cancer-testis antigens known to elicit immune responses // Breast cancer research?: BCR. 2007. V. 9. № 4. P. R46.

185. Tewari, M.K., Sinnathamby, G., Rajagopal, D., Eisenlohr, L.C. A cytosolic pathway for MHC class II-restricted antigen processing that is proteasome and TAP dependent // Nature Immunol. 2005. V. 6. P. 287-294.

186. Trowsdale, J. The MHC, disease and selection // Immunology letters. 2011. V. 137. № 1-2. P. 1-8.

187. Uebel, S., Tampe, R. Specificity of the proteasome and the TAP transporter // Current opinion in immunology. 1999. V. 11. № 2. P. 203-8.

188. Varshavsky, A., Turner, G., Du, F., Xie, Y. Felix Hoppe-Seyler Lecture 2000. The ubiquitin system and the N-end rule pathway // Biological chemistry. 2000. V. 381. № 9-10. P. 779-89.

189. Vasmatzis, G., Cornette, J., Sezerman, U., DeLisi, C. TcR recognition of the МНС-peptide dimer: structural properties of a ternary complex // Journal of molecular biology. 1996. V. 261. № 1. P. 72-89.

190. Venables, W.N., Ripley, B.D. Modern Applied Statistics with S / W.N.

191. Venables, B.D. Ripley / New York: Springer, 2002. Вып. Fourth 495 c.141

192. Vigneron, N. An antigenic peptide produced by peptide splicing in the proteasome // Science. 2004. V. 304. P. 587-590.

193. Villalobos, A., Welch, M., Minshull, J. In silico design of functional DNA constructs // Methods in molecular biology (Clifton, N.J.). 2012. V. 852. P. 197-213.

194. Vyas, J.M., Veen, A.G. Van der, Ploegh, H.L. The known unknowns of antigen processing and presentation // Nature reviews. Immunology. 2008. V. 8. №8. P. 607-18.

195. Wan, J., Liu, W., Xu, Q., Ren, Y., Flower, D.R., Li, T. SVRMHC prediction server for MHC-binding peptides // BMC bioinformatics. 2006. V. 7. P. 463.

196. Wan, Y.Y. Multi-tasking of helper T cells // Immunology. 2010. V. 130. № 2. P. 166-71.

197. Wang, P., Sidney, J., Dow, C., Mothe, B., Sette, A., Peters, B. A systematic assessment of MHC class II peptide binding predictions and evaluation of a consensus approach // PLoS computational biology. 2008. V. 4. № 4. P. el000048.

198. Wearsch, P.A., Cresswell, P. The quality control of MHC class I peptide loading // Curr. Opin. Cell Biol. 2008. V. 20. P. 624-631.

199. Wen, J.-S., Jiang, L.-F., Zhou, J.-M., Yan, H.-J., Fang, D.-Y. Computational prediction and identification of dengue virus-specific CD4(+) T-cell epitopes // Virus research. 2008. V. 132. № 1-2. P. 42-8.

200. Williams, M. a, Bevan, M.J. Effector and memory CTL differentiation // Annual review of immunology. 2007. V. 25. P. 171-92.

201. Wilson, E.M. Androgen receptor molecular biology and potential targets in prostate cancer // Therapeutic advances in urology. 2010. V. 2. № 3. P. 10517.

202. Wold, H. Estimation of Principal Components and Related Models by Iterative Least squares // Multivariate Analysis. New York: Academic Press, 1966. P. 391-420.

203. Wold, S., Martens, H., Wold, H. The multivariate calibration problem in chemistry solved by the PLS method // Matrix Pencils / под ред. В. Kagstrom, A. Ruhe. Springer Berlin / Heidelberg, 1983. P. 286-293.

204. Wu, F., Olson, В., Dobbs, D., Honavar, V. Comparing Kernels for Predicting Protein Binding Sites from Amino Acid Sequence // The 2006 IEEE International Joint Conference on Neural Network Proceedings. IEEE, 2006. P. 1612-1616.

205. Wojcik, C., DeMartino, G.N. Intracellular localization of proteasomes // The International Journal of Biochemistry & Cell Biology. 2003. V. 35. № 5. P. 579-589.

206. Yewdell, J.W., Haeryfar, S.M.M. Understanding presentation of viral antigens to CD8+ T cells in vivo: the key to rational vaccine design // Annual review of immunology. 2005. V. 23. P. 651-82.

207. Yewdell, J.W., Hickman, H.D. New lane in the information highway: alternative reading frame peptides elicit T cells with potent antiretrovirus activity //J. Exp. Med. 2007. V. 204. P. 2501-2504.

208. Yewdell, J.W., Reits, E., Neefjes, J. Making sense of mass destruction: quantitating MHC class I antigen presentation // Nature Rev. Immunol. 2003. V. 3.P. 952-961.

209. York, I.A. The ER aminopeptidase ERAP1 enhances or limits antigen presentation by trimming epitopes to 8-9 residues // Nature Immunol. 2002. V. 3. P. 1177-1184.

210. Handbook of Partial Least Squares // под ред. V. Esposito Vinzi, W.W. Chin, J. Henseler, H. Wang. Berlin, Heidelberg: Springer Berlin Heidelberg,