Бесплатный автореферат и диссертация по биологии на тему
Анализ нуклеотидных последовательностей геномов ВИЧ-1, выделенных в России
ВАК РФ 03.01.03, Молекулярная биология

Автореферат диссертации по теме "Анализ нуклеотидных последовательностей геномов ВИЧ-1, выделенных в России"

На правах рукописи

БАРЫШЕВ Павел Борисович

Анализ нуклеотидных последовательностей геномов ВИЧ-1, выделенных в России

03.01.03 - молекулярная биология

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата биологических наук

005060574

3 О МАЙ 2013

Колыдово - 2013

005060574

Работа выполнена в Федеральном бюджетном учреждении науки «Государственный научный центр вирусологии и биотехнологии «Вектор»

Научный руководитель:

Официальные оппоненты:

Гашникова Наталья Матвеевна, кандидат биологических наук, ФБУН Государственный научный центр вирусологии и биотехнологии «Вектор»

Локтев Валерий Борисович, доктор биологических наук, профессор, ФБУН Государственный научный центр вирусологии и биотехнологии «Вектор», заведующий отделом молекулярной вирусологии флавивирусов и вирусных гепатитов

Бабкин Игорь Викторович, кандидат биологических наук, ФГБУН Институт химической биологии и фундаментальной медицины СО РАН, с.н.с. лаборатории молекулярной микробиологии

Ведущая организация:

ФБУН «Центральный научно-исследовательский институт эпидемиологии», г. Москва

Защита состоится «21 »

.2013г. в 9 часов на заседании

диссертационного совета Д 208.020.01 при ФБУН Государственный научный центр вирусологии и биотехнологии «Вектор» по адресу: р.п. Кольцово, Новосибирского района, Новосибирской области, 630559, тел. 8(383) 336-74-28

С диссертацией можно ознакомиться в библиотеке ФБУН ГНЦ ВБ «Вектор». Автореферат разослан « ЛСДсР 2013 года

Ученый секретарь диссертационного совета,

доктор биологических наук, профессор ^JfífíCШ£/■-- Г.П. Трошкова

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ Актуальность исследования.

Россия и окружающие ее страны бывшего Советского Союза занимают одну из лидирующих позиций в мире по скорости распространения эпидемии. По данным Объединенной программы ООН по СПИДу на декабрь 2011 года доля ВИЧ-инфицированных в регионе Восточной Европы и Центральной Азии, к которому относят и Россию, составляет около 4%, причем доля ВИЧ-инфицированных, приходящихся на нашу страну, превышает 52% (Joint United Nations Programme on HIV/AIDS, 2012). Несмотря на это генетические исследования современных циркулирующих в стране вариантов ВИЧ-1 осуществляются недостаточно. Например, в международной базе данных (Los Alamos HIV Sequence database) на сентябрь 2012 года было представлено 622 последовательности полных геномов ВИЧ-1, выделенных от жителей Северной и 242 последовательности от лиц, проживающих в Южной и Центральной Америках, 438 последовательностей геномов ВИЧ-1 происходят из Центральной и Западной Европы. Российских расшифрованных полных геномов ВИЧ-1 было доступно лишь 11. Из них всего 7 геномов (3 генома субтипа А и 4 - субтипа В) принадлежат к эпидемически значимым для страны генетическим вариантам ВИЧ-1, которые были выделены от лиц, инфицированных в начале 2000-х.

По мере развития пандемии ВИЧ-инфекции наблюдаются не только количественные, но и качественные изменения, т. е. происходит усложнение вирусной популяции из-за возникновения новых вариантов вируса, зачастую обладающих неизвестными и малоизученными свойствами. Примером этого может служить эпидемическая ситуация в Новосибирской области (НСО). До недавнего времени основными генетическими вариантами, определяющими эпидемию ВИЧ-инфекции в НСО, были субтипы А и В ВИЧ-1 (Bobkov A. et al., 1998; Vinogradova A. et al., 2010; Fernandez-Garcia A. et al, 2012). При этом на субтип А приходилось большинство случаев инфицирования людей (более 95%), распространенность субтипа В колебалась в пределах 4-6%, как и в других регионах России. Однако с 2006 г. на территории НСО начинают регистрироваться лица, инфицированные рекомбинантной формой 02_AG ВИЧ-1, а в 2010-2012 годах данный генетический вариант выявлялся более чем в 50% новых случаев ВИЧ-инфекции.

Известно, что существует территориальная специфика распространения генетических вариантов ВИЧ-1. Поэтому для разработки эффективных мер борьбы с распространением ВИЧ первым шагом должна быть молекулярно-генетическая характеризация основных циркулирующих в стране вирусных вариантов, обуславливающих эпидемию ВИЧ-инфекции. Чтобы ответить на

з

вопрос, насколько велики отличия современных вариантов циркулирующих ВИЧ от исследованных ранее вирусов, какими могут быть последствия в отношении развития эпидемии ВИЧ-инфекции, создания новых противовирусных лекарственных препаратов, вакцин, диагностических тест систем, необходимо пополнять существующую базу новыми данными о структуре геномов циркулирующих в России вариантов ВИЧ-1.

Цель и задачи исследования

Целью данного исследования является расшифровка и молекулярно-генетический анализ нуклеотидных последовательностей полноразмерных геномов современных российских вариантов ВИЧ-1

Задачи исследования:

Подобрать праймеры и схемы амплификации фрагментов ВИЧ-1 для различных генетических вариантов вируса, оптимальные для расшифровки нуклеотидных последовательностей полноразмерных вирусных геномов.

Расшифровать нуклеотидные последовательности полноразмерных геномов для основных генетических вариантов ВИЧ-1, характерных для территории России.

Провести филогенетический анализ полученных нуклеотидных последовательностей ВИЧ-1.

Для рекомбинантных форм ВИЧ-1 определить точки рекомбинации и структуру вирусных геномов.

Провести анализ мутаций аминокислотных последовательностей вирусных белков, кодируемых геном pol, с целью предсказания возможных биологических особенностей вариантов ВИЧ-1.

Научная новизна работы

Расшифрованы и проанализированы полноразмерные геномы трёх новых вариантов ВИЧ-1 субтипа А, трёх вариантов субтипа В, а также трех геномов циркулирующей рекомбинантной формы (CRF - circulating recombinant form) CRF02_AG ВИЧ-1, распространяющихся на территориях России и стран Средней Азии и проведено их сравнение с другими представителями данных субтипов, полученных ранее. Впервые в мире описан полный геном нового генетического варианта - CRF02AG/A ВИЧ-1, вызвавшего вспышку распространения эпидемии ВИЧ-инфекции в Новосибирской области в 20082012 гг. На основании филогенетического и рекомбинационного анализа показано, что CRF02 AG/A ВИЧ-1 является новой рекомбинантной формой, появившейся в результате рекомбинации между российским субтипом А и классической CRF02AG ВИЧ-1. Получены и проанализированы 8 полноразмерных геномных последовательностей CRF02AG/A ВИЧ-1, выделенных от пациентов, проживающих в различных регионах России.

4

Показано, что новый генетический вариант CRF02_AG/A имеет стабильную структуру генома и, таким образом, является новой циркулирующей рекомбинантной формой CRF02AG/A ВИЧ-1.

Практическая значимость работы

В рамках работы расшифрованы нуклеотидные последовательности 17 полноразмерных геномов четырех различных генетических вариантов ВИЧ-1, имеющих широкое распространение на территории России. Эти нуклеотидные последовательности являются важным дополнением к существующей базе данных последовательностей полных геномов ВИЧ-1 и могут служить основой для разработки подходов к созданию вакцин и новых диагностических тест систем, специфичных для российских вариантов ВИЧ-1.

Положения, выносимые на защиту

1. Среди полученных 17 нуклеотидных последовательностей полноразмерных геномов ВИЧ-1 из разных городов России, Узбекистана, Таджикистана 3 принадлежат субтипу А, 3 - субтипу В и 11 вариантов к рекомбинантной форме CRF02AG.

2. Среди полученных 11 нуклеотидных последовательностей CRF02_AG ВИЧ-1 8 принадлежат к новой, распространяющейся на территории России рекомбинантной форме, получившейся в результате рекомбинации между CRF02_AG и субтипом А ВИЧ-1.

3. Новая CRF02_AG/A ВИЧ-1 характеризуется высокой степенью генетической гомогенности. Меньшая генетическая дистанция между геномами CRF02_AG/A и субтипом А по сравнению с CRF02AG говорит о наличии дополнительных вставок, гомологичных субтипу А, в нуклеотидных последовательностях генома CRF02AG/A.

4. Сравнение коэффициента адаптивности, рассчитанного для CRF02_AG/A с другими группами нуклеотидных последовательностей генетических вариантов ВИЧ-1, говорит о большей скорости эволюции новой CRF ВИЧ.

5. CRF02AG/A ВИЧ-1 содержит в аминокислотной последовательности гена pol субтип-специфические мутации, характерные для каждого из исходных субтипов вируса. Кроме того наблюдаются мутации, свойственные только CRF02 AG/A, не встречающиеся у CRF02 AG и субтипа А ВИЧ-1.

Апробация и публикации

Материалы диссертации были представлены на конференциях: 9th International AIDS Conference, 2012; X съезда Всероссийского научно-практического общества эпидемиологов, микробиологов и паразитологов,

2012. По результатам работы опубликовано 6 статей: 6 индексированы в Scopus, из них 4 опубликованы в журналах из списка ВАК.

Объем и структура диссертации

Диссертация состоит из введения, обзора литературы, описания материалов и методов, результатов работы, обсуждения полученных результатов, выводов и списка литературы. Работа изложена на 134 страницах текста, содержит 25 рисунков и 16 таблиц. Список литературы состоит из 216 ссылок.

МАТЕРИАЛЫ И МЕТОДЫ ИССЛЕДОВАНИЯ

В данном исследовании были взяты образцы сыворотки крови от 17 ВИЧ-инфицированных пациентов. Сбор образцов крови осуществляли на базе ГБУЗ Новосибирской области «Центр по профилактике и борьбе со СПИД и инфекционными заболеваниями». Выделение высокомолекулярной РНК из лимфоцитов проводилось с помощью набора ViroSeq (Celera Diagnostics, США). Реакцию обратной транскрипции проводили с помощью набора Superscript III First-Strand Synthesis System for RT-PCR (Invitrogen, США) с праймеров oligo(dT) и специфического праймера VIF-VPUoutRl (Nadai Y. et al, 2008). Полученный продукт использовали на следующей стадии постановки ПЦР. Для подбора праймеров использовались программы Oligo v. 6.1 (http://www.oIigo.net/) и PerlPrimer v. 1.1.19 (http://perIprimer.sourceforge.net). Амплифицирование фрагментов генома ВИЧ-1 проводили методом двухраундовой полимеразной цепной реакции (ПЦР). Для получения длинных фрагментов использовали наборы "Expand long template PCR system" (Roche Diagnostics, США) и "GeneAmp XL PCR kit" (Applied Biosystems, США). Секвенирование амплифицированных фрагментов ДНК проводили с использованием набора реагентов "BigDye TerminatorTM v 3.1" на автоматическом секвенаторе "ABI 3130" (Applied Biosystems, США).

Для проведения теоретического анализа отбирали референсные нуклеотидные последовательности основных субтипов ВИЧ-1 и рекомбинантных форм 02_AG, 01_АЕ с помощью специализированной базы данных "Los Alamos HIV Sequence Database" (http://www.hiv.lanl.gov/). Множественное выравнивание нуклеотидных последовательностей строилось программами muscle, t-coffee. Редактирование проводилось программами BioEdit. Для филогенетического анализа использовали программы PhyML v.3.0, Mega 5, FindModel. Для обнаружения возможных рекомбинационных событий между различными субтипами применяли два метода поиска, реализованные в программах jpHMM и Recco. Определение и сравнение скоростей синонимичных и несинонимичных замен проводили программой KaKs

6

Calculator. Для определения позиций нуклеотидных последовательностей ВИЧ, находящихся под действием селективного давления, использовалась программа HyPhy. Программа SDPPred позволяет предсказать позиции множественного выравнивания, специфичные в функциональном плане для каждой группы. Обработка статистических данных в работе проводилась с помощью пакета прикладных программ Statistica v. 10.

РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ И ИХ ОБСУЖДЕНИЕ

Для изучения полных геномов вариантов ВИЧ-1, характерных для эпидемии ВИЧ-инфекции в России, были отобраны генетические варианты вируса, имеющие значимую распространенность на территории страны. Кроме субтипов А и В, составляющих суммарно более 70% всех случаев инфицирования (Bobkov A. et al., 1998; Vinogradova A. et al., 2010; Fernandez-Garcia A. et al., 2012) в разных регионах России, необходимо было включить и новую циркулирующую рекомбинантную форму 02_AG ВИЧ-1, которая не только вызвала вспышку эпидемии в Сибири, но и выявляется на других территориях РФ и в странах СНГ (Гашникова Н.М. и др., 2011). В результате было отобрано для секвенирования 17 образцов плазмы крови, полученных от лиц, инфицированных разными генетическими вариантами вируса: 3 — субтипом А, 3 - субтипом В, 11 образцов - CRF02 AG ВИЧ-1. Два образца было получено от жителей стран Средней Азии (Узбекистан, Таджикистан), пятнадцать пациентов проживали в разных городах России. Даты сбора образцов крови варьируют от 2009 г. (один образец из Новосибирска) до 2012 г. (Ростов).

Генетическое разнообразие создает большие трудности при проведении молекулярно-генетических исследований, важной частью которых является получение вирусоспецифических нуклеотидных последовательностей. Дивергенция нуклеотидных последовательностей между различными генетическими вариантами может достигать значения 35% (Korber В. et al., 2001). В ранее проведенных работах показано, что широко используемые в мире тест системы, основанные на методе ПЦР, не обладают необходимой чувствительностью и эффективностью для не В субтипов ВИЧ-1 (Peeters М. et al., 2010; Kim J.E. et al., 2007). Поэтому ключевым моментом становится разработка системы праймеров, которые окажутся эффективными для вирусных вариантов, распространенных на территории России и прилегающих стран. Особенно это становится актуальным в случае секвенирования нуклеотидных последовательностей штаммов ВИЧ-1, появившихся в результате рекомбинации между различными субтипами и CRF ВИЧ. В данной диссертации подобрано 56 праймеров, 17 из них были использованы для

7

синтеза вирусоспецифических фрагментов геномов, 38 - для секвенирования полученных нуклеотидных последовательностей ВИЧ-1. Разработанная система праймеров позволила получить нуклеотидные последовательности, начиная от позиции 516 НХВ2 ВИЧ-1, располагающейся в середине Я области на 5'-конце, и до позиции 9606 НХВ2 в конце Я области на 3' -конце. Праймеры подобраны таким образом, чтобы осуществлялось перекрывание недостающих участков на концах вирусного генома, и чтобы была возможность осуществить реконструкцию получившегося генома с полными ЬТЯ. Полученные последовательности 17 геномов ВИЧ-1 содержали все открытые рамки считывания без сдвигов. Последовательности депонированы в базе данных вепВапк.

Филогенетический анализ проводился для трех генетических вариантов ВИЧ-1: субтипов А, В и СЯР02 АО (см. рисунок 1). Все три исследуемых генома субтипа А ВИЧ-1 принадлежат к кластеру ИЗ и-А. Ранее проведенные работы по анализу эпидемической ситуации в России и странах бывшего СССР показали, что Р8и-А является подсубтипом субтипа А ВИЧ-1, отличается высокой степенью гомогенности (ЬикавЬоу У.У. с1 а1., 1998; Моукзку У.А., 1998). Время и место инфицирования пациента, которому принадлежит геном 11.RU.6950 из Новороссийска и расположение этого генома рядом с вариантом ВИЧ-1 из Украины согласуются с этой гипотезой. Остальные два генома ВИЧ-1, происходящие из Новосибирска и Самары, по своей структуре должны быть ближе к образцам из России, взятыми в качестве референсных и депонированных в базу данных "ОепВапк" в 2006-2010 гг. (У1ш^га<к>уа А., 2010). В группе, в которую попадают исследованные геномы субтипа В ВИЧ-1, гетерогенность значительно выше, чем для субтипа А (генетическая дистанция внутри группы В равна 0,1231, что более чем в два раза больше, чем для субтипа А, которая составляет 0,0533). Тем не менее, два российских генома из Новосибирска и Новокузнецка лежат на одной ветке. Геном из Москвы находится на одной ветке с российским геномом, полученным другими авторами (Оа1кт А.Ы. е1 а1., 2006), и, как и ожидалось, ближе к европейскому варианту ВИЧ-1. Полученный результат подтверждает гипотезу о множественном независимом проникновении отдаленных вариантов ВИЧ-1 субтипа В и распространения этих вирусов на территории России. Ветвь, принадлежащую СГ1Р02АС ВИЧ-1, можно разделить на две подветви. К одной относятся все изоляты, характерные для стран Африки.

Другая ветвь включает все полученные геномные последовательности ВИЧ-1 и один геном вируса из Узбекистана. В свою очередь, в последней ветви можно выделить еще два кластера ВИЧ-1. К одному принадлежит последовательность ВИЧ-1 из Узбекистана (ОепВапк # АУ829214), с которой

8

~АУ829206 (Узбекистан)

-FJ388951(Кипр)

- 00292892 (Россия!

- 10.RU.6617

— 10.RU.6792

— 0О292893 (Россия) 00292895 (Россия)

— JQ292891 (Россия) Р0864679(Россия

JQ292898 (Россия)

11.RU.6950

ЕР589044 (Казахстан) АР413987 (Украина) 00292900 (Россия) 00292899 (Россия)

FSJ-A

00292896(Россия) 00292897 (Россия) ЕР545108(Россия) Еи861977 (Италия)

00676872 (Австралия) Р0670519(Испания) АР107771 (Швеция) Р0623487(Кения) АУ253314 (Танзания) -АР107770 (Швеция)

- Р0694792 (Гвинея-Биссау) -А0251057 (Сенегал)

- АУ444811 (США) -АВ485637 (Либерия)

-Р0168578 (Нигерия) АЯ063223 (Франция)

Р0388902(Кипр) " АВ286862 (Гана)

- АУ371146 (Камерун) АУ829214 (Узбекистан) -10.RU.6509

11.RU.6900 11.RU.6939

10.RU.6649

12.RU.15r

10.RU.6366

10.RU.6637

09.RU.4829

10.RU.6829

11.RU.18n 10.RU.5983

02 AG/А

AG

-Е1Ш39605 (Ямайка

-11.RU.21n

-09.RU.4457

-00207940 (Грузия)

— 10.RU.6629

~АУ682547 (Россия)

— Р0694790(Дания) -00295195 (Корея)

- 00823364 (Украина) —ЕР057102(Китай)

- 00383749 (Аргентина

-hxb2

н

АУ751406 (Россия) о

АУ819715 (Россия) с'

-АУ751407 (Рос. ия)

Р0388937(К*пр)

DQ396398 (I - НМ586198 (Англ

- AF538303 (Австралия)

-DQ886037 (США)

-AY314056 (Канада^

юния)

ЗАР)

,я)

Рис. 1. Филогенетическое дерево, построенное методом присоединения соседей (Ш). Черным курсивом выделены полученные в работе анализируемые геномы ВИЧ-1.

группируется один из исследуемых геномов из Новосибирска (10.RU.6509) и два расшифрованных в данной работе генома ВИЧ-1 из Узбекистана (11.RU.6939) и Таджикистана (11.RU.6900). К другому кластеру относятся 8 исследуемых геномов вируса - 6 из Новосибирска, один из Ростова, один из Новокузнецка. Формирование отдельного кластера внутри вариантов ВИЧ из Средней Азии подтверждено значениями бутстреп-анализа. Сообщение об обнаружении в Средней Азии варианта CRF02_AG, отличающегося от классического (Carr J., 2005), позволяет выдвинуть гипотезу о возможном пути попадания представителей этой генетической формы на территорию России. Выявление вариантов ВИЧ с идентичной рекомбинантной структурой генома в других городах России, а не только в Новосибирске, говорит о стабильности структуры генома этого варианта ВИЧ-1. Таким образом, исследуемые геномы ВИЧ-1 можно разделить на 4 группы: группа, соответствующая субтипу А, группа субтипа В, группа AGI - CRF02 AG из Средней Азии и группа AG2, включающая новую рекомбинантную форму 02 AG из России.

Анализ генетических дистанций внутри группы AGI показал, что она сравнима с дистанцией для субтипа А, тогда как для второй группы, AG2, дистанция оказывается в два раза меньшей. Еще одной особенностью является расстояние между субтипом А и группой AG2. Оно оказалось меньше (dA-AG2=0,1449), чем дистанция между субтипом А и группой AGI (dA-AG1=0,1848), что говорит в пользу гипотезы о рекомбинации между вирусами субтипа А и CRF02_AG азиатского типа (см. таблицу 1).

Таблица 1

Эволюционные дистанции между геномами ВИЧ-1, принадлежащими разным кластерам

А AGI AG2 В

А 0,0533 0,1848 0,1449 0,2705

AGI 0.0519 0,0699 0,2528

AG2 0.0222 0.2507

В 0,1231

Для доказательства того, что российские исследуемые рекомбинантные геномы 02_Ай ВИЧ-1 имеют структуру, отличную от CRF02 АО ВИЧ-1, необходимо определить точки рекомбинации. Существует большое количество методов, с помощью которых можно выполнить данную задачу. Для повышения достоверности необходимо использовать несколько программ. Первым шагом являлось определение точек рекомбинации в присутствии последовательностей субтипов А и й ВИЧ-1. Программа jpHMM показала

ю

отличие найденных точек рекомбинации для восьми геномов, принадлежащих российскому кластеру, от стандартных для СЯР02_АС ВИЧ-1 (см. рисунок 2).

III IV V-! V-!! VI VII VIII IX XXI

1 5' 1-тя 1

Я

15 и" 1 1

И Щ]

Рис. 2. Схема расположения зон рекомбинации геномов, принадлежащих среднеазиатскому кластеру рекомбинантной формы СЯР02_АС ВИЧ-1 (обозначен справа цифрой 1), и новосибирскому кластеру (схема под цифрой II справа) 02_АС ВИЧ-1.

Точность определения точек рекомбинации в геноме ВИЧ программой ]рНММ для различных зон может варьировать. Анализ стандартных отклонений показал, что для точек 1, 4, 6, 8 и 10 эти значения минимальны и не превышают 2, а для точек 4, 6, 10 равны 0, точки 5 и 7 обладают максимальными значениями. Для остальных трех точек флуктуации вызваны одиночными незначительными отклонениями отдельных геномов вируса (см. рисунок 3).

Рис. 3. Оценка величин стандартных отклонений для 10 точек рекомбинации в геномах ВИЧ-1. Для удобства сравнения из каждой точки было вычтено минимальное значение среди геномов.

Данные по стандартным отклонениям коррелируют с вычисленными программой значениями длин интервалов рекомбинации (ранговый коэффициент Кэндала равен 0,966, ранговый коэффициент Спирмена равен 0,987), что позволяет оценить точность предсказания различных позиций, в которых происходит рекомбинация. Причиной подобных отклонений могут быть особенности нуклеотидной структуры области рекомбинации. Полученные данные подтверждаются с помощью другой программы - Recco. У части геномов ВИЧ-1 возможно "выпадение" некоторых зон рекомбинации, предсказанных программой jpHMM, однако в случае с другой программой этого не наблюдалось. Кроме того, сходное явление изменения зон рекомбинации в зависимости от генома и места в этом геноме наблюдается и для классической CRF02 AG ВИЧ-1 (Zhang М. et al., 2010).

Согласно возникшей гипотезе о рекомбинации между вирусами субтипа А и CRF02 AG и после того, как в ходе проведенного анализа стало очевидным отличие точек рекомбинации российского варианта рекомбинантного 02_AG от CRF02AG, необходимо было подтвердить наличие обоих предков вируса в структуре генома новой рекомбинантной формы ВИЧ-1. Для этого в состав множественного выравнивания были включены последовательности CRF02_AG. Проведенный анализ показал наличие в геноме исследуемых 02_AG ВИЧ-1 пяти областей, гомологичных субтипу А, тогда как на всем протяжении генома сохранялась гомология с рекомбинантной формой CRF02_AG ВИЧ-1. Схема расположения зон рекомбинации изображена на рисунке 4. На филогенетических деревьях, построенных для областей, гомологичных субтипу А, полученные вирусные геномы, относящиеся к новой CRF02 AG/A, принадлежали ветке с референсными последовательностями субтипа А. Наличие пяти областей субтипа А предполагает высокую частоту рекомбинации при образовании этого генетического варианта, однако по данным ряда авторов частота рекомбинации в некоторых случаях может достигать 10 событий на цикл репликации (Jetzt А.Е. et al., 2000).

pol

Рис 4. Схема расположения зон рекомбинации новой циркулирующей рекомбинантной формы СЯР()2_АО/А ВИЧ-1.

Существующие значительные генетические различия между разными вариантами ВИЧ-1 позволяют предположить, что между ними могут быть и биологические различия. Наибольший интерес с точки зрения исследования субтип-специфических особенностей представляет ген pol ВИЧ-1, т. к. именно белки этого гена являются мишенью для подавляющего большинства созданных терапевтических препаратов. Определение характера естественного отбора основывается на измерении отношения числа несинонимичных и синонимичных замен. Для целого гена pol эта величина оказывается меньше 1, что означает преобладание числа синонимичных замен и, следовательно, отсутствие влияния стабилизирующего отбора (Ziheng Y. et al., 2000). Несмотря на это определяемая программами величина может являться показателем скорости адаптивной эволюции для различных субтипов ВИЧ. В проведенной работе между коэффициентом адаптивности и генетическими дистанциями наблюдалась обратная корреляция, что связано с разной скоростью накопления несинонимичных замен и синонимичных замен, т. к. скорость фиксации синонимичных замен из-за отсутствия действия отбора значительно выше (см. рисунок 5).

0.3 0.4

Ks

□ AG/A о -AG О -А

-A-AG/A о AAG о -А-В

а - AG/A-AG □ ■ AG/A-B О - AG-B

Рис. 5. Анализ синонимичных и песинонимичных замен гена pol исследуемых вариантов ВИЧ-1. Красная диагональ показывает отношение K.a/Ks, равное 1.

Коэффициент адаптивности увеличивается от вариантов субтипа В до СЯР02 АО/А ВИЧ-1 (В - 0,147, А - 0,189, СЯР02_АС - 0,235, 02_АС/А -0,350). Чем выше данный коэффициент, тем более вероятно появление мутаций, ведущих к увеличению приспособляемости вирусной частицы, следовательно, вновь образованная форма обладает большей способностью к изменчивости. Сравнение доли несинонимичных замен для четырех групп показало большие значения для геномов групп СЯР02 АО и 02_АС/А. Для 8

13

геномов из 11 значения были больше 50%, тогда как для групп субтипов А и В данные значения не превышали 46%.

Анализ относительного содержания несинонимичных замен нуклеотидных последовательностей отдельных белков гена pol выявил общую тенденцию среди всех белков субтипа В. Значения для данного субтипа были максимальными среди других четырех групп. В протеазе (р10) разница между группами CRF02AG и 02 AG/A была минимальной (1 замена на длину нуклеотидной последовательности белка), что может быть следствием того, что на всем протяжении белка р10 новая рекомбинантная форма гомологична CRF02_AG. Нуклеотидная последовательность ревертазы (рбб) 02 AG/A содержит, согласно проведенному ранее рекомбинационному анализу, вставку субтипа А длиной около 550 нт. Интеграза (рЗ 1) 02_AG/A на 3/4 гомологична субтипу А, в оставшейся четверти сохраняет гомологию с CRF02 AG. Такое расположение зон рекомбинации отражается на паттерне и, следовательно, количестве мутаций. Например, относительное содержание несинонимичных замен для групп А и 02_AG/A в интегразе сравнимо, тогда как группа CRF02AG содержит больше замен. Однако, количество замен в ревертазе для группы 02_AG/A достигает значения 3,0%, что значительно больше, чем в группах А и CRF02 AG. Это может указывать на более активный характер эволюции этого белка в группе 02_AG/A (см. таблицу 2).

Таблица 2

Анализ несинонимичных замен в областях, кодирующих белки гена pol исследуемых вариантов ВИЧ-1

n/L • А В CRF02AG 02_AG/A

plO 0,027 0,061 0,020 0,017

рбб 0,018 0,034 0,021 0,030

Р31 0,006 0,022 0,014 0,007

* — п - количество несинонимичных замен, L - длина нуклеотидной последовательности белка.

Несмотря на то, что ген pol находится под действием отрицательного отбора, ряд отдельных позиций в этой обрасти ВИЧ-1 могут находиться под действием положительного отбора. Условиями фиксации замен нуклеотидной последовательности, находящейся под действием отрицательного отбора, может стать смена условий, например, при применении терапии. Среди последовательности вариантов ревертазы ВИЧ-1 таких позиций было найдено две. Положительно селективная позиция 41 может быть причиной

возникновения устойчивости, но в анализируемых геномах ВИЧ-1 в данной позиции находится метионин, как и в белке дикого типа. Аналогичная ситуация складывается и в отношении позиции 179, которая может при наличии фенилаланина вызывать лекарственную устойчивость, но в белке рбб исследуемых геномов находится аминокислота, обеспечивающая фенотип дикого типа вируса. В случае интегразы ВИЧ-1 подобных позиций найдено не было. Остальные позиции не были связаны с мутациями устойчивости вируса к лекарственным препаратам. Однако не стоит отбрасывать в сторону гипотезу, что некоторые мутации могут определять неизвестные субтип-специфические свойства белковых молекул. В свете того, что на различных территориях мира постоянно появляются новые генетические варианты ВИЧ-1 (Tramuto F. et al., 2013), примером чего может служить и данная работа, становится актуальным усовершенствование существующих подходов по определению мутаций устойчивости. Одним из подходов может являться применение пакета программ HyPhy для предсказания ранее неизвестных особенностей этих вирусных вариантов.

Целью программы SDPPred, используемой в работе, является нахождение аминокислотных остатков белка, определяющих функциональную специфичность данного белкового семейства в отношении субстрата, т. е. в данном случае субтип-специфических мутаций. Исследование показало, что каждый белок, входящий в состав гена pol ВИЧ-1, содержит ряд позиций, характерных для определенного генетического варианта (или генетических вариантов). Для протеазы таких позиций было обнаружено 11, ревертаза содержала 36 позиций, интеграза - 16. Для новой рекомбинантной формы 02_AG/A ВИЧ-1 подобные позиции включали не только аминокислоты, характерные либо для субтипа А, либо для CRF02_AG, но и были найдены аминокислотные замены, принадлежащие только этой рекомбинантной форме (см. таблицу 3).

Таблица 3

Субтип-специфические позиции в областях ВИЧ-1, кодирующих белки гена pol, определенные программой SDPPred

Белок гена pol Количество субтип-специфических позиций в белке Характерные для CRF02AG/A позиции

рЮ 11 M64-I, YS67-C

рбб 36 N2U-KSR

Р31 16 N24-S, VI 13-1

Существующие генетические различия между субтипами и циркулирующими рекомбинантными формами ВИЧ-1 позволяют предположить, что между ними могут быть и биологические различия. Это, в свою очередь, является доказательством того, что исследование новых появляющихся вариантов вируса с учетом эпидемической обстановки в стране должно стать одной из приоритетных задач в плане борьбы с ВИЧ-инфекцией.

ВЫВОДЫ

1. Определены и проанализированы нуклеотидные последовательности 17 полных геномов ВИЧ-1, представляющих, согласно имеющимся эпидемическим данным по России и ранее проведенному филогенетическому анализу, наиболее распространенные генетические варианты ВИЧ, циркулирующие в России: 3 генома ВИЧ-1 субтипа А, 3 - субтипа В и 11 вариантов рекомбинантной формы CRF02_AG. Расшифрованные нуклеотидные последовательности геномов ВИЧ-1 содержат гены, имеющие открытые рамки считывания без сдвигов и стоп кодонов в середине генов.

2. Впервые проведен молекулярно-генетический анализ нуклеотидной последовательности полного генома новой рекомбинантной формы 02 AG/A ВИЧ-1. Показано, что данный вариант ВИЧ-1 образовался в результате повторной рекомбинации между CRF02_AG и российским штаммом ВИЧ-1 субтипа А. Анализ 8 полноразмерных геномов 02_AG/A ВИЧ-1, выделенных в разных регионах России, позволяет отнести этот генетический вариант к новой циркулирующей рекомбинантной форме - CRF02AG/A ВИЧ-1.

3. На основании анализа генетических дистанций внутри групп исследованных генетических вариантов ВИЧ-1 показано, что штаммы новой CRF02AG/A ВИЧ-1 характеризуются высоким процентом гомогенности вирусной популяции, что говорит о недавнем времени ее возникновения. Оценка генетической дистанции между группами исследованных геномов ВИЧ-1 показала, что дистанция между CRF02_AG и CRF02AG/A является минимальной (0,0699); величина дистанции между CRF02_AG/A и субтипом А (0,1449) меньше в сравнении с дистанцией между группами CRF02_AG и субтипом А ВИЧ-1 (0,1848), что подтверждает гипотезу происхождения новой рекомбинантной формы CRF02_AG/A ВИЧ-1.

4. Анализ несинонимичных/синонимичных замен не показал наличия адаптивной эволюции для целого гена pol исследуемых вариантов ВИЧ-1. Выявлено увеличение коэффициента адаптивности для всех четырех групп геномов ВИЧ-1 в ряду субтап В - субтип А - CRF02_AG - CRF02_AG/A ВИЧ-1 в пределах от 0,147 до 0,350, что может говорить о повышении адаптивных

свойств нового генетического варианта CRF02 AG/A по сравнению с циркулирующими российскими вариантами ВИЧ-1.

5. Анализ позиций аминокислотного выравнивания программой SDPPred выявил наличие мутаций, определяющих функциональные особенности различных генетических вариантов в белках ВИЧ-1, кодируемых геном pol. Для CRF02_AG/A ВИЧ-1 субтип-специфичными являются позиции 20, 64 и 67 в области гена pol, кодирующей протеазу, позиция 211 в области обратной транскриптазы и позиции 24 и 113 в области интегразы.

СПИСОК РАБОТ, ОПУБЛИКОВАННЫХ ПО ТЕМЕ ДИССЕРТАЦИИ

1. Baryshev Р.В., Bogachev V.V., Gashnikova N.M.. Genetic characterization of an isolate of HIV type 1 AG recombinant form circulating in Siberia, Russia // Arch. Virol. 2012. 157(12). P. 2335-2341.

2. Baryshev P.B., Gashnikova N.M. Bogachev V.V. Near full-lenght genome characterization of a newly derived unique recombinant form AG HIV-1 circulating in Siberia // Retrovirology. 2012. 9 (Suppl 1). P. 28. Published online, doi: 10.1186/1742-4690-9-S1-P28.

3. Богачев В.В., Тотменин А.В., Барышев П.Б., Мещерякова Ю.В., Черноусова Н.Я., Гашникова Н.М. Молекулярно-генетическая характеристика современных вариантов субтипов А и В ВИЧ-1, выделенных на территории Новосибирской области // ЖМЭИ. 2012. N. 6. С. 45-52.

4. Гашникова Н.М., Богачев В.В., Барышев П.Б., Мещерякова Ю.В., Савочкина Е.Н., Черноусова Н.Я. Распространенность мутаций, ответственных за резистентность к антиретровирусным препаратам, среди вариантов ВИЧ-1, циркулирующих в Новосибирской области // ЖМЭИ. 2012. N.6. С. 56-60.

5. Никонорова Ю.В., Унагаева Н.В., Богачев В.В., Барышев П.Б., Мещерякова Ю.В., Черноусова Н.Я., Гашникова Н.М. Исследование биологических свойств вариантов ВИЧ-1, резистентных к антиретровирусным препаратам // ЖМЭИ. 2012. N. 6. С. 52-56.

6. Мирджамалова Ф.О., Мещерякова Ю.В., Казаева Е.В., Савочкина Е.Б., Богачев В.В., Барышев П.Б., Никонорова Ю.В., Топчин Ю.А., Черноусова Н.Я., Михеев В.Н., Гашникова Н.М. Случаи развития множественной лекарственной устойчивости ВИЧ-1 у детей в Новосибирской области // Бюллетень СО РАМН. 2012. N. 6. С. 46-54.

СПИСОК ИСПОЛЬЗОВАННЫХ СОКРАЩЕНИЙ

AIDS acquired immunodeficiency syndrome

CRP circulating recombinant form (циркулирующая рекомбинантная форма)

FSU former Soviet Union (страны бывшего СССР)

HIV human immunodeficiency virus

LTR long terminal repeat (длинный концевой повтор)

ВИЧ вирус иммунодефицита человека

ДНК дезоксирибонуклеиновая кислота

дНТФ дезоксинуклеозид трифосфат

нт нуклеотиды

п.н. пара нуклеотидов

ПЦР полимеразная цепная реакция

РНК рибонуклеиновая кислота

СПИД синдром приобретенного иммунодефицита

Подписано в печать 08.05.2013 г. Печать цифровая. Бумага офсетная. Формат 60x84/16. Усл. печ. л. 2 Тираж 100 экз. Заказ № 161.

Отпечатано в типографии «Срочная полиграфия» ИП Малыгин Алексей Михайлович 630090, Новосибирск, пр-т Академика Лаврентьева, 6/1, оф.104 Тел. (383) 217-43-46, 8-913-922-19-07

Текст научной работыДиссертация по биологии, кандидата биологических наук, Барышев, Павел Борисович, Кольцово

ФЕДЕРАЛЬНАЯ СЛУЖБА ПО НАДЗОРУ В СФЕРЕ ЗАЩИТЫ ПРАВ ПОТРЕБИТЕЛЕЙ И БЛАГОПОЛУЧИЯ ЧЕЛОВЕКА

ФЕДЕРАЛЬНОЕ БЮДЖЕТНОЕ УЧРЕЖДЕНИЕ НАУКИ ГОСУДАРСТВЕННЫЙ НАУЧНЫЙ ЦЕНТР ВИРУСОЛОГИИ И БИОТЕХНОЛОГИИ «ВЕКТОР»

04201358258

На правах рукописи

Барышев Павел Борисович

Анализ нуклеотидных последовательностей геномов ВИЧ-1,

выделенных в России

03.01.03 - молекулярная биология

ДИССЕРТАЦИЯ на соискание ученой степени кандидата биологических наук

Научный руководитель кандидат биологических наук, Гашникова Наталья Матвеевна

Кольцово - 2013

ОГЛАВЛЕНИЕ

ВВЕДЕНИЕ........................................................................................................................................................4

1. ОБЗОР ЛИТЕРАТУРЫ....................................................................................................................9

1.1. Структура генома ВИЧ-1 ......................................................................................................9

1.1.1. Некодирующая область ВИЧ-1 ..........................................................................9

1.1.2. Структурные гены ВИЧ-1 ........................................................................................11

1.1.3. Неструктурные гены ВИЧ-1 ..................................................................................17

1.2. Вариабельность генома ВИЧ-1 ........................................................................................19

1.2.1. Мутационная изменчивость..................................................................................19

1.2.2. Рекомбинационная изменчивость....................................................................22

1.3. Классификация ВИЧ-1 ............................................................................................................26

1.4. Значение генетического разнообразия ВИЧ-1 ..................................................30

1.5. Способы исследования полноразмерных геномов ВИЧ-1 ......................31

1.5.1. Секвенирование полноразмерных геномов ВИЧ-1 ..........................31

1.5.2. Методы филогенетического анализа............................................................35

1.5.3. Методы рекомбинационного анализа............................................................38

1.6. Характеристика эпидемии ВИЧ-инфекции в России..................................39

2. МАТЕРИАЛЫ И МЕТОДЫ........................................................................................................43

2.1. Практическая часть..................................................................................................................43

2.1.1. Образцы крови..................................................................................................................43

2.1.2. Выделение РНК ВИЧ-1 ..............................................................................................43

2.1.3. Получение кДНК............................................................................................................44

2.1.4. Амплификация фрагментов геномов ВИЧ-1 ..........................................44

2.1.4.1. Подбор праймеров............................................................................................44

2.1.4.2. Схемы амплификации....................................................................................45

2.1.4.3. Условия ПЦР............................................................................................................46

2.1.5. Методы электрофореза ДНК................................................................................49

2.1.5.1. Аналитический электрофорез ДНК в агарозном геле .... 49

2.1.5.2. Препаративный электрофорез ДНК в легкоплавкой агарозе............................................................................................................................50

2.1.6. Очистка продуктов ПЦР..........................................................................................50

2.1.7. Секвенирование геномов ВИЧ-1 ........................................................................50

2.2. Теоретический анализ............................................................................................................52

2.2.1. Сбор данных для проведения компьютерного анализа................52

2.2.2. Построение множественного выравнивания..........................................53

2.2.3. Первичный анализ нуклеотидных последовательностей............53

2.2.4. Филогенетический анализ нуклеотидных последовательностей........................................................................................................55

2.2.5. Рекомбинационный анализ нуклеотидных последовательностей........................................................................................................56

2.2.6. Анализ адаптивной молекулярной эволюции......................................57

2.2.7. Статистическая обработка полученных результатов....................58

3. РЕЗУЛЬТАТЫ..........................................................................................................................................59

3.1. Получение нуклеотидных последовательностей полноразмерных

геномов ВИЧ-1 ..............................................................................................................................59

3.2. Анализ нуклеотидных последовательностей геномов ВИЧ-1 ............61

3.2.1. Анализ нуклеотидного состава геномов ВИЧ-1 ..................................61

3.2.2. Вариабельность различных участков геномов ВИЧ-1 ..................64

3.2.3. Филогенетический анализ полноразмерных геномов ВИЧ-1 66

3.2.3.1. Определение параметров филогенетического анализа ... 66

3.2.3.2. Анализ филогенетических деревьев..................................................68

3.2.3.3. Определение эволюционных дистанций......................................73

3.2.4. Рекомбинационный анализ полноразмерных геномов ВИЧ-1 74

3.2.4.1. Определение точек рекомбинации программой jpHMM 74

3.2.4.2. Сравнение результатов работы программ Recco и jpHMM..........................................................................................................................78

3.2.4.3. Исследование гипотезы о дополнительной рекомбинации между субтипом А и CRF02 AG ВИЧ-1 81

3.3. Анализ гена pol ............................................................................................................................86

4. ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ............................................................................................96

ВЫВОДЫ............................................................................... 108

СПИСОК СОКРАЩЕНИЙ И ОБОЗНАЧЕНИЙ................................................................110

СПИСОК ЛИТЕРАТУРЫ......................................................................................................................111

ВВЕДЕНИЕ Актуальность исследования

Россия и окружающие ее страны бывшего Советского Союза занимают одну из лидирующих позиций в мире по скорости распространения эпидемии. По данным Объединенной программы ООН по СПИДу на декабрь 2011 года доля ВИЧ-инфицированных в регионе Восточной Европы и Центральной Азии, к которому относят и Россию, составляет около 4%, причем доля ВИЧ-инфицированных, приходящихся на нашу страну, превышает 52% (Joint United Nations Programme on HIV/AIDS, 2012). Несмотря на это генетические исследования современных циркулирующих в стране вариантов ВИЧ-1 осуществляются недостаточно. Например, в международной базе данных (Los Alamos HIV Sequence database) на сентябрь 2012 года было представлено 622 последовательности полных геномов ВИЧ-1, выделенных от жителей Северной и 242 последовательности от лиц, проживающих в Южной и Центральной Америках, 438 последовательностей геномов ВИЧ-1 происходят из Центральной и Западной Европы. Российских расшифрованных полных геномов ВИЧ-1 было доступно лишь 11. Из них всего 7 геномов (3 генома субтипа А и 4 - субтипа В) принадлежат к эпидемически значимым для страны генетическим вариантам ВИЧ-1, которые были выделены от лиц, инфицированных в начале 2000-х.

По мере развития пандемии ВИЧ-инфекции наблюдаются не только количественные, но и качественные изменения, т. е. происходит усложнение вирусной популяции из-за возникновения новых вариантов вируса, зачастую обладающих неизвестными и малоизученными свойствами. Примером этого может служить эпидемическая ситуация в Новосибирской области (НСО). До недавнего времени основными генетическими вариантами, определяющими эпидемию ВИЧ-инфекции в НСО, были субтипы А и В ВИЧ-1 (Bobkov A. et al., 1998; Vinogradova A. et al., 2010; Fernandez-Garcia A. et al., 2012). При этом на субтип А приходилось большинство случаев инфицирования людей (более 95%), распространенность субтипа В колебалась в пределах 4-6%, как и в других регионах России. Однако с 2006 г. на территории НСО начинают

регистрироваться лица, инфицированные рекомбинантной формой 02_АС ВИЧ-1, а в 2010-2012 годах данный генетический вариант выявлялся более чем в 50% новых случаев ВИЧ-инфекции.

Известно, что существует территориальная специфика распространения генетических вариантов ВИЧ-1. Поэтому для разработки эффективных мер борьбы с распространением ВИЧ первым шагом должна быть молекулярно-генетическая характеризация основных циркулирующих в стране вирусных вариантов, обуславливающих эпидемию ВИЧ-инфекции. Чтобы ответить на вопрос, насколько велики отличия современных вариантов циркулирующих ВИЧ от исследованных ранее вирусов, какими могут быть последствия в отношении развития эпидемии ВИЧ-инфекции, создания новых противовирусных лекарственных препаратов, вакцин, диагностических тест систем, необходимо пополнять существующую базу новыми данными о структуре геномов циркулирующих в России вариантов ВИЧ-1.

Цель и задачи исследования

Целью данного исследования является расшифровка и молекулярно-генетический анализ нуклеотидных последовательностей полноразмерных геномов современных российских вариантов ВИЧ-1

Задачи исследования:

Подобрать праймеры и схемы амплификации фрагментов ВИЧ-1 для различных генетических вариантов вируса, оптимальные для расшифровки нуклеотидных последовательностей полноразмерных вирусных геномов.

Расшифровать нуклеотидные последовательности полноразмерных геномов для основных генетических вариантов ВИЧ-1, характерных для территории России.

Провести филогенетический анализ полученных нуклеотидных последовательностей ВИЧ-1.

Для рекомбинантных форм ВИЧ-1 определить точки рекомбинации и структуру вирусных геномов.

Провести анализ мутаций аминокислотных последовательностей вирусных белков, кодируемых геном pol, с целью предсказания возможных биологических особенностей вариантов ВИЧ-1.

Научная новизна работы

Расшифрованы и проанализированы полноразмерные геномы трёх новых вариантов ВИЧ-1 субтипа А, трёх вариантов субтипа В, а также трех геномов циркулирующей рекомбинантной формы (CRF - circulating recombinant form) CRF02_AG ВИЧ-1, распространяющихся на территориях России и стран Средней Азии и проведено их сравнение с другими представителями данных субтипов, полученных ранее. Впервые в мире описан полный геном нового генетического варианта - CRF02_AG/A ВИЧ-1, вызвавшего вспышку распространения эпидемии ВИЧ-инфекции в Новосибирской области в 2008-2012 гг. На основании филогенетического и рекомбинационного анализа показано, что CRF02AG/A ВИЧ-1 является новой рекомбинантной формой, появившейся в результате рекомбинации между российским субтипом А и классической CRF02AG ВИЧ-1. Получены и проанализированы 8 полноразмерных геномных последовательностей CRF02_AG/A ВИЧ-1, выделенных от пациентов, проживающих в различных регионах России. Показано, что новый генетический вариант CRF02_AG/A имеет стабильную структуру генома и, таким образом, является новой циркулирующей рекомбинантной формой CRF02_AG/A ВИЧ-1.

Практическая значимость работы

В рамках работы расшифрованы нуклеотидные последовательности 17 полноразмерных геномов четырех различных генетических вариантов ВИЧ-1, имеющих широкое распространение на территории России. Эти нуклеотидные последовательности являются важным дополнением к существующей базе данных последовательностей полных геномов ВИЧ-1 и могут служить основой для разработки подходов к созданию вакцин и новых диагностических тест систем, специфичных для российских вариантов ВИЧ-1.

Положения, выносимые на защиту

1. Среди полученных 17 нуклеотидных последовательностей полноразмерных геномов ВИЧ-1 из разных городов России, Узбекистана, Таджикистана 3 принадлежат субтипу А, 3 - субтипу В и 11 вариантов к рекомбинантной форме CRF02_AG.

2. Среди полученных 11 нуклеотидных последовательностей CRF02_AG ВИЧ-1 8 принадлежат к новой, распространяющейся на территории России рекомбинантной форме, получившейся в результате рекомбинации между CRF02 AG и субтипом А ВИЧ-1.

3. Новая CRF02AG/A ВИЧ-1 характеризуется высокой степенью генетической гомогенности. Меньшая генетическая дистанция между геномами CRF02AG/A и субтипом А по сравнению с CRF02_AG говорит о наличии дополнительных вставок, гомологичных субтипу А, в нуклеотидных последовательностях генома CRF02_AG/A.

4. Сравнение коэффициента адаптивности, рассчитанного для CRP02_AG/A с другими группами нуклеотидных последовательностей генетических вариантов ВИЧ-1, говорит о большей скорости эволюции новой CRF ВИЧ.

5. CRF02_AG/A ВИЧ-1 содержит в аминокислотной последовательности гена pol субтип-специфические мутации, характерные для каждого из исходных субтипов вируса. Кроме того наблюдаются мутации, свойственные только CRF02 AG/A, не встречающиеся у CRF02_AG и субтипа А ВИЧ-1.

Апробация и публикации

Материалы диссертации были представлены на конференциях: 9th International AIDS Conference, 2012; X съезда Всероссийского научно-практического общества эпидемиологов, микробиологов и паразитологов, 2012. По результатам работы опубликовано 6 статей: 6 индексированы в Scopus, из них 4 опубликованы в журналах из списка ВАК.

Объем и структура диссертации

Диссертация состоит из введения, обзора литературы, описания материалов и методов, результатов работы, обсуждения полученных результатов, выводов и списка литературы. Работа изложена на 134 страницах текста, содержит 25 рисунков и 16 таблиц. Список литературы состоит из 216 ссылок.

1. ОБЗОР ЛИТЕРАТУРЫ 1.1. Структура генома ВИЧ-1 1.1.1. Некодирующая область ВИЧ-1

ВИЧ-1 представляет собой РНК-содержащий вирус, принадлежащий к роду Lentivirus семейства Retroviridae [1]. Диаметр вирусной чистицы составляет около 100 нм. Нуклеокапсид и матрикс окружены липидной мембраной с включенными в нее гликопротеинами. Геном представлен двумя копиями одноцепочечной РНК. Отличительной особенностью репликации ретровирусов, обуславливающей многие их свойства, является стадия обратной транскрипции, осуществляемая с помощью вирусного фермента обратной транскриптазы (ревертазы). В ходе обратной транскрипции происходит два "прыжка" с одной молекулы вирусной РНК на другую. Результатом этих "прыжков" является образование длинных концевых повторов (LTR - Long Terminal Repeat) на 5'- и 3'- концах, необходимых для интеграции образовавшейся в ходе транскрипции двуцепочечной провирусной ДНК в клеточный геном. Интегрированный провирус напоминает обычные клеточные гены с экзон-интронной структурой и использует для своей экспрессии клеточные экспрессионные системы [1,2].

Virion RNA

5'САР

-J

]

АААЗ*

R US

I

из R

ю

Provirus

из R US

из R US

S САР

D

R US

i

Transcript

1

AAA 3

U3 Я

Рис. 1.1. Сравнение РНК и ДНК форм генома ВИЧ-1.

Вирусная геномная РНК имеет размер около 9200 нуклеотидов (9181 нуклеотид для референсного штамма ВИЧ-1 НХВ2 (ОепВапк # К03455)). На 5'- и

3'-концах вирусной РНК находятся одинаковые короткие (98 нуклеотидов) области R, рядом с которыми располагаются некодирующие области U5 (83 нуклеотида) и U3 (454 нуклеотида), соответственно. В результате обратной транскрипции на 5'-конце провирусной ДНК появляется дополнительная область U3, а на 3'-конце - дополнительная область U5 со структурой U3-R-U5. Размер провирусной ДНК составляет около 9700 п.н. (9719 п.н. для штамма ВИЧ-1 НХВ2).

Генная экспрессия ВИЧ-1 строго регулируется посредством присоединения клеточных и вирусных белков к цис-факторам, располагающимся в LTR вирусного генома. В состав TTR входит четыре функциональных региона: TAR (Trans-Activation Response), находящийся внутри R области (от +1 до +60 нт), промоторный (basal) регион (от -78 до -1 нт), энхансер (от -105 до -79 нт) и модуляторный (modulatory) регион (от -454 до -104 нт) [4]. Последние 3 располагаются в U3 области LTR.

in I

из R lb

nt -454

■454/5 551П 634 744 7УО/2 SDIAUG

i(>5 -1/-H 4-60 -s-ISI

I_I и и

I_iTARpciyA t R N A

i_| Basal

, Enhancer

Modulatory

-1S4 _i

NRE

gag

J

Рис. 1.2. Структура 1ЛИ ВИЧ-1 [6].

В настоящее время известно множество транскрипционных факторов, взаимодействующих с LTR, их сайты посадки, другие вирусные и клеточные факторы, участвующие в регуляции экспрессии [5, 6]. Ключевыми элементами промоторного региона является ТАТАА бокс, служащий для связывания с

белками транскрипционного комплекса РНК полимеразы II, и три GC-богатых тандемно расположенных сайта посадки белков Sp семейства транскрипционных факторов [7]. Энхансер, располагающийся сразу после промоторного участка и сайтов связывания Sp факторов, содержит в большинстве случаев два консервативных участка связывания фактора транскрипции NF-кВ и родственных ему белков [8]. В модуляторной области обнаружены цис-элементы для большого количества факторов транскрипции, включая С/ЕВР, ATP/CREB, LEF-1, NF-AT и др. [8, 9]. Исследования модуляторного региона LTR показали, что удаление участка в районе -340 - -184 нт приводит к 2-3-х кратному увеличению транскрипции, что послужило причиной назвать этот участок негативным регуляторным элементом (NRE - Negative Regulatory Element) [10]. Последующие исследования выяснили, что этот участок содержит большое количество цис-факторов, способствующих как увеличению, так и уменьшению транскрипции [6]. Активность вирусных белков, особенно tat и vpr, дополняет картину регуляции репликации ВИЧ-1. Помимо элементов, ответственных за регуляцию транскрипции, LTR содержит универсальный сайт полиаденилирования ААТААА (polyA) и сайт связывания для тРНК, являющийся промотором при обратной транскрипции (PBS - primer binding site)[9].

1.1.2. Структурные гены ВИЧ-1

Все белки ВИЧ-1 можно разделить на три группы: структурные белки Gag, Pol и Env, регуляторные белки Tat и Rev, вспомогательные белки Vpu, Vpr, Vif и Nef. Основная задача по строительству вирусной частицы возложена на структурные белки; регуляторные и вспомогательные белки в состав вириона либо не входят, либо находятся в минимальном количестве. Они становятся нужны на этапе размножения вируса. Схема организации

li.CC < Ш Ш

Рис. 1.3. Схема организации провирусного генома ВИЧ-1.

провирусного генома ВИЧ-1 представлен�