Бесплатный автореферат и диссертация по биологии на тему
Эндогенные ретровирусы человека: структурно-эволюционный анализ
ВАК РФ 03.00.03, Молекулярная биология

Автореферат диссертации по теме "Эндогенные ретровирусы человека: структурно-эволюционный анализ"

РОССИЙСКАЯ АКАДЕМИЯ НАУК

ИНСТИТУТ БИООРГАНИЧЕСКОЙ ХИМИИ им. академиков М.М.ШЕМЯКИНА И Ю.А.ОВЧИННИКОВА

на правах рукописи

ЛЕБЕДЕВ Юрий Борисович

Эндогенные ретровирусы человека: структурно-эволюционный анализ

03.00.03 - молекулярная биология

ДИССЕРТАЦИЯ на соискание ученой степени доктора биологических наук

в форме научного доклада

Москва 2004

Работа выполнена в Институте биоорганической химии им академиков М. М Шемякина и Ю А Овчинникова РАН

Научный консультант:

доктор химических наук, академик РАН Е.Д Свердлов

Официальные оппоненты:

доктор биологических наук, член-корр РАН С А Лукьянов доктор биологических наук, профессор Н.К. Янковский доктор биологических наук, профессор В 3. Тарантул

Ведущая организация'

Институт молекулярной биологии им В.А. Энгельгардта РАН

Защита состоится "В " октября 2004 года в ! 0 часов на заседании специализированного совета Д 002 019.01 при Институте биоорганической химии им академиков М М Шемякина и Ю А Овчинникова РАН по адресу 117997 ГСП, Москва В-437, ул. Миклухо-Маклая, 16/10.

С диссертацией можно ознакомиться в библиотеке Института биоорганической химии им. академиков М.М Шемякина и Ю.А. Овчинникова РАН

Автореферат разослан " 10 " сентября 2004г

Ученый секретарь специализированного совета, доктор химических наук, профессор

В. А Несмеянов

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность проблемы.

Осуществление международных программ секвенирования геномов, особенно таких сложных как геномы млекопитающих, стало определяющим фактором развития исследований молекулярных основ жизнедеятельности организмов. Решение задачи массированного определения первичной структуры геномной ДНК потребовало разработки новых методологических подходов и эффективных технологий клонирования, физического и генетического картирования, компьютерной обработки получаемых данных Одновременно, реконструкция полных нуклеотидных последова1ельностей геномных ДНК и накопление колоссальных объемов генетической информации, требующей дальнейшей переработки и биологической интерпретации, инициируют возникновение новых отраслей молекулярной биологии, таких как биоинформатика и функциональная геномика. Вслед за полногеномным секвенированием, изучение механизмов реализации генетической информации, дальнейшее изучение функционирования и эволюции генома как целостной биологической системы становятся приоритетными направлениями современных исследований. Например, функциональная геномика решает проблемы расшифровки систем функциональных взаимосвязей элементов генома и определения молекулярпо-гепетических механизмов его эволюции. В этой связи изучение эволюции генома человека следует отнести к первоочередным задачам современной молекулярной биологии.

Одним из наиболее драматических следствий секвенирования генома человека стало установление того факта, что около половины генома занято многочисленными копиями мобильных элементов различных типов, в то время как белок-кодирующие экзонные области суммарно составляют приблизительно 2% нуклеотидной последовательности генома Высокая насыщенность мобильными элементами, в основном ретроэлементами (РЭ), показана для геномов мыши, шимпанзе и крысы и является, по-видимому, характерной особенностью структуры геномов млекопитающих. Данные предварительного анализа структуры геномной ДНК человека позволяют предполагать, что ретроэлементы непрерывно распространялись в I еноме приматов на протяжении последних 65 миллионов лет. Считается, что свыше миллиона копий различных РЭ возникло и зафиксировалось в геномах приматов в процессе эволюции и тысячи из них, вероятно, отличают геном человека от генома шимпанзе. Хотя механизмы распространения и фиксации РЭ в геноме недостаточно изучены, а сравнительный анализ структур секвенированных геномов далек от завершения, полученные к настоящему времени данные сформировали широко принятое мнение о том, что РЭ активно реформировали геном, вызывая геномные перестройки, нарушая или модифицируя структуру существующих генов, участвуя в гшоцессах формирования новых генов Кроме структурных

Р0('-' "МЛЬНА*

' ^ 1 'КА

?00£ V

изменений перемещения РЭ способны приводить и к изменению функциональных свойств отдельных локусов генома за счет перераспределения регуляторных элементов Так например, длинные концевые повторы (ЬТЯ) эндогенных ретровирусов (Е1*У) содержат множество потенциальных регуляторных элементов, узнаваемых клеточными системами регуляции транскрипции Вновь интегрированные ЬТЯ способны быть альтернативными промоторами, энхансерами, входить в состав локус контролирующих областей, или служить источником других регуляторных сигналов для окружающих генов.

Несмотря на интенсификацию исследований ретроэлементов геномов различных эукариот, накопленные к настоящему времени данные об активности РЭ в геномах приматов носят либо фрагментарный, либо, наоборот, слишком общий характер, и гипотеза о роли РЭ как универсальных регуляторов эволюции требует дальнейшего подтверждения Кроме того следует учитывать, что каждый из активных ретроэлементов, например индивидуальный 1ЛТ1, может выполнять свою функцию в определенной сети регуляторных взаимодействий клетки, и его роль может существенно отличаться от роли другого индивидуального Ь'ГК, вовлеченного в другую регуляторную сеть. Поэтому для исчерпывающего анализа функционального и эволюционного потенциала необходимо знать положение в геноме всех ЬТИ. и рассматривать каждый из них в том геномном контексте, в котором он был фиксирован эволюцией после внедрения Определение эволюционной истории эндогенных ретровирусов и каждого из 1ЛТ1 элементов предоставило бы ценнейшую информацию об образовании видоспецифических регуляторных элементов и дало ключ к пониманию молекулярно-генетических отличий человека от высших приматов.

Таким образом, структурно-функциональные исследования эндогенных ретровирусов человека и определение эволюционной динамики их распространения в геноме являются одной из наиболее актуальных проблем современной молекулярной биологии и функциональной геномики

Цель и задачи исследования.

Целью данной работы являлось определение эволюционной динамики

распространения и особенностей расположения в геноме эндогенных ретровирусов человека семейства НЕЛУ-К, позволяющие выявить ряд молекулярно-генетических отличий человека от высших приматов.

В ходе исследований решались следующие задачи- разработка экспериментальных методов идентификации участков интеграции ретроэлементов в составе отдельных хромосом и целого генома; идентификация, секвенирование и исчерпывающее картирование длинных концевых повторов (ЬТЯ) семейства НЕЯУ-К на 19-ой и 21-ой хромосомах человека.

проведение сравнительно-структурного анализа нуклеотидных последовательностей и участков их интеграции в ортологичных локусах геномов различных видов приматов, разработка систематики ЬТЯ НЕЯУ-К и определение времен возникновения и распространения в геноме выявленных групп ЬТК.

разработка метода полногеномного сравнительного анализа распределения повторяющихся элементов в геномах близкородственных видов и идентификация I_.TR НЕЯУ-К и участков их интеграции, отличающих геном человека от генома шимпанзе

- определение особенностей распределения 1>ТЯ в геноме человека, определение генного окружения 1ЛТ1 и составление каталога генов человека, содержащих эволюционно недавние интеграции ЬТЯ НЕЮ/-К.

Научная новизна и практическая ценность работы.

В настоящей работе сформулирована концепция об эволюционно значимых изменениях систем регуляции экспрессии генов, возникающих в результате интеграции ЬТК эндогенных ретровирусов, как важной молекулярно-генетической причине видообразования у приматов. Проведен структурно-эволюционный анализ Г.ТИ элементов наиболее функционально активного семейства эндогенных ретровирусов НЕЫУ-К и получены первые подтверждения высказанной гипотезы:

- Впервые проведено полнохромосомное картирование ЕТЯ элементов, что позволило выявить новую тенденцию к концентрации ЦГО в обогащенных генами участках генома. В ходе выполнения картирования Ь'Г'К на двух хромосомах человека были разработаны оригинальные методы и новый подход к экспериментальному сравнительному анализу распределения ретроэлементов в образцах ДНК различной сложности.

- Разработана первая систематика эндогенных ретровирусов и определена эволюционная динамика распространения семейства НЕИУ-К в геноме приматов. Выявлено несколько волн ретротранспозиций эндогенных ретровирусов, совпадавших по времени с эволюционным расхождением основных линий приматов.

- По резулыатам гранзиенгной экспрессии репортерного гена показано эволюционно длительное сохранение промоторной активности индивидуальными ЕТИ элементами генома человека В составе ТЛИ НЕКУ-К элементов открыт альтернативно направленный промотор.

- Впервые выделена многочисленная группа ЬТИ элементов, предположительно отличающая геномы человека и шимпанзе. Экспериментальная проверка, проведенная на основе оригинального методического подхода, подтвердила человек-специфичность интеграции свыше ста 1ЛИ.НЕЯУ-К элементов

Таким образом, в холе выполнения настоящей работы были выявлены существенные молекулярно-генетические различия двух близкородственных видов приматов и создана необходимая база для дальнейшего изучения функциональных свойств охарактеризованных LTR элементов генома человека.

Полученная информация о структуре, геномной локализации и генном окружении LTR, особенно LTR элементов, специфичных для генома человека, открывает новые перспективы в изучении регуляторных систем нормального функционирования генома человека

Разработанные методы полногеномного анализа и резулыаш струк1урно-зволюционного анализа LTR элементов генома человека, полученные в настоящей работе, могут быть эффективно использованы в широком спектре эвотоционно- генетических и медико-генетических исследований

Апробация полученных результатов.

Результаты диссертационной работы были представлены на следующих симпозиумах и конференциях' Итоговые конференции Российской программы Геном человека (1995-2001), конгрессы HUGO (1996-2001), BITS (1998, 99) - специальные конференции Министерства энергетики США (DOE US) по проблемам идентификации генов и регуляции их экспрессии, ESF Retrotransposon network (2001-03) - специальные совещания Европейского Научного Фонда по ретротранспозонам и эволюции геномов

Цикл работ по хромосомному картированию LTR и транскрибируемых последовательностей был отмечен премией им акад А А Баева (1997), результаты отдельных исследований неоднократно были включены в ('Важнейшие итоги деятельности РАН»

Публикации.

Диссертация обобщает данные 37 основных публикаций Личный вклад автора

Автору принадлежит ведущая роль в формировании концепции о роли LTR элементов в эволюции генома приматов, разработке оригинальных методов для экспериментального подтверждения сформулированной концепции, обсуждении и оформлении полученных результатов Весь экспериментальный материал получен автором и руководимыми им аспирантами ИБХ РАН, за исключением экспериментов по транзиснтной экспрессии репортерного гена люциферазы, выполненных совместно с сотрудниками лаборатории Е П Копанцевым, Е В. Снежковым и С Б. Акоповым.

СОДЕРЖАНИЕ РАБОТЫ

1. STS/EST картирование 19-ой хромосомы человека и идентификация LTR в составе клонов хромосом-специфических библиотек.

На начальных этапах осуществления международного проекта «Геном Человека» центральной задачей являлось широкомасштабное физическое и генетическое картирование генома и составление интегральных карт всех хромосом человека Для решения чтой задачи были созданы основные ресурсы в виде гибридных клеточных линий, содержащих набор фрагментов (радиационные гибриды) либо индивидуальные (моносомики) хромосомы человека, и хромосом-специфические библиотеки космидных, ВАС, РАС и YAC клонов. В основу физико-генетического картирования генома Международной Организацией «Геном Человека» (HUGO) была положена концепция STS (Sequence Tagged Site) и EST (Expressed Sequence Tag) маркеров. Физические STS маркеры представляют собой короткие (обычно 150-300 пар оснований) секвепированные фрагменты геномной ДНК, ограниченные парой ПЦР праймеров и имеющие известную координату на карте хромосомы Таким образом, наличие определенного набора STS маркеров однозначно характеризует положение клонированного фрагмента в геноме. Аналогичные маркеры, создаваемые на основе клонов кДНК библиотек, получили название экспрессионных маркеров (EST) и использовались для определения положения в геноме отдельных генов и других транскрибируемых последовательностей В целом, создание интегральных физико-генетических карт, описывающих взаиморасположение функциональных генов, предоставляло необходимую основу для изучения «функциональной анатомии генома» Идентификация, определение взаиморасположения и взаимодействия всех функциональных областей генома остается приоритетной задачей современной функциональной i еномики, продолжающей активно использовать STS/HST маркеры и созданные интегральные карты генома

Данный раздел настоящей работы выполнен в сотрудничестве с геномным центром Национальной Лаборатории Лоуренса Ливермора (LLNL, США) как часть программы секвенирования и конструирования интегральной карты 19-ой хромосомы человека в рамках международною проект «Геном Человека» Целью данной часги работы было создание плотной сети EST/STS маркеров, сконструированных на основе гетерогенной ядерной РНК (гяРНК) из гибридной клеточной линии, содержащей 19-ую хромосому человека

1.1. Создание карты EST/STS маркеров хромосомы 19.

Использование гяРНК как источника EST маркеров имеет ряд существенных преимуществ по сравнению с другими аналогичными подходами: создаваемые EST, в основном, идентичны геномной нуклеотидной последовательности и представляют как

интронные фрагменты белок-кодирующих генов, так и любые транскрибируемые участки генома, разнообразие транскриптов гибридных клеточных линий, по-видимому, существенно выше по сравнению с соматическими клетками различных тканей; транскрипты человеческого генома отличимы от общего пула транскриптов гибридной линии по наличию нуклеотидных последовательностей человек-специфических типов диспергированных повторов. В настоящей работе для конструирования гяРНК клонотек был использован принцип, предложенный Корбо с соавторами, который заключается в праймировании первой цепи кДНК олигонуклеотидами, соответствующими фрагментам Alu повторов генома человека С использованием этого принципа нами был разработан усовершенствованный метод конструирования человек-специфических гякДНК клонотек и хромосом-специфических EST/STS маркеров. Общая схема метода представлена на Рисунке 1А

Следует отметить, что по специфичности и представленности транскрибируемых участков человеческого генома в результирующих гякДНК клонотеках разработанный метод значительно превосходил все известные аналоги. Ключевыми стадиями метода стали использование двустадийной ЛЦР амплификации гякДНК с частично перекрывающихся праймеров (так называемая «nested PCR» стратегия) и смена участка узнавания рестрикционной эндонуклеазы в составе второго праймера (праймер В на рис 1 А), что обеспечило высокую эффективность клонирования и специфичность клонотеки Для картирования гякДНК клонов проводили их гибридизацию с фильтрами высокой плотности, содержащими 6-ти кратно избыточную космидную библиотеку 19-ой хромосомы. Результаты гибридизации подтверждали дополнительным ПЦР анализом гибридизующихся космидных контигов с парами предположительно уникальных олигонуклеотидных праймеров. В общей сложности было синтезировано и тестировано 263 пары праймеров Проведенный ПЦР анализ, в то время более употребимый для STS маркеров, чем для картирования фрагментов кДНК, дал ряд преимуществ. Во-первых, повышалась достоверность и точность картирования гякДПК клонов. Одновременно, полученные EST/STS маркеры использовались для уточнения состава и сборки космидных контигов. Во-вторых, ПЦР анализ исключал артефакты перекрестной гибридизации повторяющихся последовательностей и позволял успешно картировать большее число клонов гякДНК библиотеки, что также повысило общую эффективность предложенного метода создания EST/STS маркеров. В результате работы была построена карта высокого разрешения транскрибируемых последовательностей 19-ой хромосомы Ее схематический вариант представлен на рисунке 1Б. Карта содержит 156 EST/STS маркеров в целом равномерно распределенных по длине хромосомы со средним интервалом около 300 тыс. пар оснований.

0

г

1

Гибридная клеточная линяя

гяРНК

ЕС

GGO-

Е

ЕС

1

|1 | I цепь гякДНК I раунд ПЦР

**

в II раунд ПЦР

-м-

*

х EcoRI, BamHI

КЛОНИРОВАНИЕ i

СЕКВЕНИРОВАНИЕ КАРТИРОВАНИЕ

fr

.St t

i3 f

SS

Рис. 1 Конструирование карты высокого разрешения гякДНК (STS/EST) маркеров

хромосомы 19.

Рис 1А Схема метода создания EST/STS маркеров Пунктирными линиями обозначены фрагменты

[ яРНК, жирными одинарными и двойными линиями - одно- и двухцепочечные фрагменты гякДНК,

серыми прямоугольниками - Alu повторы и их фрагменты, стрелками - последовательности олигонук-

леотидных праймеров. Наличие в составе праймеров участков узнавания эндонуклеаз EcoRI и BamHI

обозначено вертикальными линиями с буквами Е и В соответственно

Рис 1Б Схематизированная карта EST/STS маркеров 19-ой хромосомы человека

На левой части рисунка представлена идеограмма хромосомы 19 С грелками на выносках в правой

части рисунка отмечено положение EST/STS маркеров в каждом из локусов хромосомы

При анализе первичной структуры клонированной гякДНК было выявлено три группы, каждая из которых включала более шести индивидуальных клонов, содержащих протяженные участки высокогомологичных нуклеотидных последовательностей Вставки первой группы клонов состояли из фрагмента эндо1енного ретровируса HERV70, включающего участки длинного концевого повтора (LTR) и ет гена, и короткого вариабельного участка Гибридизационное картирование локализовало данную группу в трех космидных контигах, содержащих маркеры ZNF91-подобных генов Вторая группа состояла, в основном, из фрагмента центральной части эндогенного ретровируса HERV-L и остаточного участка Alu повтора, использовавшегося для праймирования первой цепи гякДНК Попытки картировать данную группу оказались безуспешными, ввиду высокой фоновой гибридизации повторяющихся элементов Структура гякДНК вставок двух клонов третьей группы схематически представлена на Рисунке 2

B/S

.tgttatgtgctaag.. tgttatgtoctaag

HRE........

Enh.....

из

U5

LTR K10/KI8 a590

B/S

T3

Pr

polyA

S'LTR K10 aS90 (гякДНК) 6a 12 (гякДНК)

cagTATAAAACccga tagTATAAAACccga -Pr......

LTR KI0/K18 6al2

Рис 2 Схема клонов гякДНК, гомолог ичных LTR HERV-K

5' LTR провирусного элемента HERV-K10 обозначен светлым прямоугольником с выделенными U3, R и U5 функциональными областями Схематическое изображения нуклеотидных вставок двух гякДНК клонов приведено в средней части рисунка сплошными линиями отмечены последовательности, совпадающие со структурой LTR К10, пунктиром - области делеций в составе гякДНК клонов; темными прямоугольниками - остатки олигонуклеотидных праймеров с участками узнавания эндонуклеаз BamHl/Sau3A (B/S) или EcoRl (R), использованных при клонировании гякДНК Положение и структура гормон-чувствительного элемента (HRE), предположительной энхансерной последовательности (Enh), промотора (Рг) и сигнала полиаденилирования LTR HERV-K приведены в нижней части рисунка

Проведенный сравнительный анализ структуры клонов а590 и 6а12 с имевшимися базами данных вуклеотидных последовательностей генома человека показал, чго оба клона имеют 89-95% степень идентичности с фрагментами мРНК и нескольких геномных носледова1ельностей, включая оба известных эндогенных ретровируса семейства К - HFR V-К10 и HERV-K18. Во всех случаях область гомологии охватывала фрагмент U3 функциональной части LTR, расположенный непосредственно перед промотором и содержащий потенциальные регуляторные участки - коровую последовательность энхансера

и участок связывания кортикоидных гормонов. За пределами регуляторных участков оба гякДНК клона имели множественные моно- или ди-нуклеотидные замены и две короткие делеции, что не позволило отнести выявленные транскрипты к продуктам ни одного из 23 известных к тому времени HERV-K-подобных элементов генома Тем не менее полученные нами результаты предоставляли уникальную возможность выяснить распределение эндогенных ретровирусов человека в целой хромосоме В связи с общей важностью решения этой проблемы, в данной работе была предпринята первая попытка картирования LTR HERV-К элементов на отдельной хромосоме.

1.2. Картирование LTR-подобных элементов на космидных контигах 19-ой хромосомы человека.

Картирование LTR было проведено по схеме, аналогичной с локализацией гякДНК, которая включала гибридизацию с космидной клонотекой на фильтрах высокой плотности, ПЦР анализ гибридизующихся космид и соотнесение последних с одним из 800 контигов, перекрывавших около 95% длины 19-ой хромосомы. В результате LTR-подобные последовательности были выявлены в составе 171 космидного контига и 60 космид, не имевших определенного положения на карте. С учетом возможных погрешностей общее количество LTR семейства HERV-K на 19-ой хромосоме было оценено как 110 индивидуальных элементов. Такая оценка является минимальным пределом числа LTR на хромосоме, так как картирование с точностью до одной космиды не позволяет определить количества LTR элементов внутри каждого из космидных клонов

Картированные LTR оказались рассеяны по всей длине хромосомы, хотя была отмечена их некоторая концентрация в локусах, содержащих некоторые из генных кластеров, характерных для структуры 19-ой хромосомы. 187 космид, гибридизующихся с пробой а590, содержали генные маркеры - гены и их фрагменты, разнообразные EST и гякДНК маркеры В качестве примера, на рисунке 3 представлено положение LTR элементов в локусе, содержащем кластер генов CYP семейства. Приведенный на рисунке фрагмент карты контигов представляет стандартное отображение базы данных Геномного Центра LLNL. Базовые перекрывающиеся космидные клоны соединены зигзагообразной линией в нижней части рисунка Охарактеризованные клоны хромосом-специфической космидной клонотеки обозначены идентификационными номерами (ГО), а положение клонов внутри контига представлено колонками ID. Наличие гибридизационных маркеров в охарактеризованных космидных клонах стандартно обозначают специальным символом рядом с ГО клона.

Как видно из рисунка 3 рассматриваемый локус представлен на карте двумя космидными контигами и включает три гена, кодирующих белки семейства цитохром Р450

ЕТЛ последовательности обнаружены в трех отдельных группах перекрывающихся космид, каждая из которых одновременно содержит один из генных маркеров

П

»рКвЗДОШОД

- СУР2Р1 = СУР2АЭ

- СУРгв7

✓ \ ✓ \

.Г. ..Г!.........3

!4 й 5 я

или • ПВо1 им • М11

С553* П*я\

эшз» пяи

♦» Я5)

1ХЯ1 »1

И№( от *1 С2Э

ЭТЯ* 1гт (та

224« 1 Е53

НИ»* им • 1Ж4

ш»* МП

«т* мчмк< ш

шк

Стивен МММПМиП' 12Ш

мяи »с* мни ЯМ)Ш> ГШ* Ш1»

ами им» «ш 1 |КШ11и»>|||щ>' 7*4?

1«ВМ ХС1 ши* ш«ти4И(1 пт

Рис 3 Распределение ЬТЯ-содержащих гякДНК маркеров на карте космидных контигов

19-ой хромосомы человека В верхней части рисунка изображена идеограмма 19-ой хромосомы. Цифрами над идеограммой указано количество 1ЛТ? НЕЛУ-К (верхняя цифра) и EST/STS (нижняя цифра) маркеров, картированных в каждом из структурных локусов. Фрагмент карты космидных контигов локуса 19ц13 2 представлен в нижней части рисунка Космидные клоны, гибридизующиеся с ГЯ-пробой, отмечены прямоугольниками, гибридизующиеся с пробами кДНК генов СУР2Л - кружками разной величины, с кДНК пробой гена СУР2В7 - темными треугольниками. Под схематизированным изображением космидных контигов приведена рестриктная ЕсоЯ! карта объединенного мегаконтига длиной 350 т п н.

I аким образом, на примере ЬТИ. семейства ШЖУ-К, нами были получены одни из первых данных о полнохромосомном распределении ретроэлементов генома человека. Среди наиболее интересных результатов проведенного исследования необходимо отметить обнаружение ЬТЯ в транскрибируемой фракции габридных клеточных линий, консервативность регуляторных последовательностей в транскрибируемых 1,ТЯ и факты совместной локализация маркеров 1.Т11 с известными генными маркерами, включая гены транскрипционных факторов 2ЫР семейства, в составе отдельных космидных клонов 19-ой хромосомы.

Открытие интеграция LTR вблизи регуляторных генов человека заставляет существенным образом изменить представления о возможном воздействии эндогенных регровирусов на процесс эволюции генома человека. С учетом результатов собственных предварительных исследований и на основе широкого анализа опубликованных данных о взаимодействиях эндогенных ретровирусов с геномами млекопитающих, нами была предложена гипотеза о роли LTR в эволюции генома человека

2. Гипотеза о роли эндогенных ретровирусов и их LTR в эволюции генома человека.

Согласно общепринятой гипотезе возникновение HERV элементов генома человека происходило в результате ретровируснот о заражения клеток зародышевого пути предковых линий современных видов приматов и последующей фиксации провирусного элемента в геноме популяции организмов Процесс эндогенизации предполагает также потерю интегрировавшим в геном ретровирусом инфекционных свойств с одновременным сохранением способности к ретротранспозиции кДНК копий в иные участки генома «хозяина», как это схематизировано на рисунке 4 В тех случаях, когда ретротранспозиции

sdr LI'K gag pol env LTR «dr

Д транскрипция

д. синтез кДНК ^ 1С

РЕТРОТРАНСПОЗИЦИЯ

Рис 4 Принципиальная схема процесса ретротранспозиции эндогенного ретровируса Сплошными горизонтальными линиями обозначены последовательности ДНК, пунктирными линиями - РНК, положение коротких прямых повторов участка интеграции HERV элемента отмечено черными стрелками и аббревиатурой "sdr"; положение LTR, ограничивающих HERV элемент, обозначено тремя слитыми прямоугольниками, каждый из которых отмечает положение одной из функциональных областей- U3 (белый прямоугольник), R (светло серый) или U5 (наиболее темный прямоугольник), основные вирусные гены обозначены аббревиатурами "gag", "pol" и "env", а кодируемые ими белки -черными кругами и черным овалом Клеточные белки, осуществляющие транскрипцию провирусы, обозначены белыми овалами, прикрепленными промотору и регуляторным участкам 5' L1R, функция продукта вирусного гена pol состоит в синтезе полноразмерной кДНК копии HERV элемента и ее встраивании в новый участок геномной ДНК, что схематически указано дополнительными черными овалами на соответствующих стадиях

происходили в половых клетках или на первых стадиях эмбриогенеза, вновь интегрированная копия начинала передаваться по наследству согласно общим правилам генетики и могла бы ib зафиксирована в геноме целого вида В пользу такой общей схемы распространения HERV элементов в геноме приматов свидетельствовало открытие нескольких групп (или семейств)

sdr LTR gag pot env LTR sdr

=еГД „

fl

гидролиз ДНК и интеграция кДНК копии

гомологичных провирус-подобных последовательностей в составе секвенированных учааков генома человека.

Большинство из известных последовательностей HERV элементов представляли сходные с провирусом структуры, разрушенные большим числом накопленных мутаций в областях как структурных генов gag, pol и env, так и в регуля горных LTR областях Опубликованные результаты гибридизационного анализа мРНК из различных тканей человека, гибридизации полного набора хромосом человека и другие косвенные данные свидетельствовали о том, что семейство HERV-K является самой представительной и наиболее функционально активной группой эндогенных ретровирусов человека С учетом существовавших данных о первичной структуре ДНК человека, также считалось, что семейство HERV-K представлено в геноме человека, в основном, многочисленными одиночными LTR элементами. Изолированные LTR других известных эндогенных ретровирусов были обнаружены в некоторых секвенированных областях генома человека. Такие одиночные LTR элементы ограничены, как правило, короткой дуплицированной последовательностью участка интеграции и, вероятно, образованы в результате гомоло! ичной рекомбинации двух LTR провируса, которые имеют идентичные нуклеотидные последовательности в момент ин reí рации провирусной копии.

Распространение ретроэлементов в геноме определяется (1) их транскрипцией и транспозиционной активностью в половых или зародышевых клетках и (2) эволюционной фиксацией новых интеграции в геноме вида, зависящей от функциональных последствий структурных изменений геномного локуса, образовавшихся в результате транспозиции В отличие от транскрипции простых ретропозонов SINE или LINE типов, определяемой лишь сохранностью структуры их промоторного участка, транскрипция ретровирусов определятся сложным взаимодействием многих клеточных и, в некоторых случаях, отдельных вирусных регуляторных белков с последовательностями в составе LTR. Существовавшие данные анализа структуры секвенированных LTR HERV элементов указывали на наличие в их составе последовательности, сходной с энхансером вируса SV40, элементов реагирования на внешние сигналы (например hormone response elements, HRE) и участков узнавания клеточных транскрипционных факторов (например YY1 или Spl). П0Э1 ому транспозиция эндогенно1 о ретровируса и образование одиночных LTR в том или ином локусе генома может рассматриваться как привнесение кассеты регуляторных элементов. В случае реализации регуляторного потенциала LTR, такая интеграция способна модулировать экспрессию окружающих клеточных генов. Благоприятные для организма последствия такой модуляции способствовали бы, в свою очередь, эволюционной фиксации LTR в данном учас!ке 1енома вида Особенно важные эволюционные последствия могла бы иметь фиксация новых

интеграции ЬТЯ вблизи регуляторных генов, поскольку изменения именно регуляторных систем общепринято считать основой эволюции приматов

Таким образом нами была сформулирована концепция об интеграциях Т.ТЯ эндогенных ретровирусов, вызывающих изменения систем регуляции экспрессии генов, как важной молекулярно-генетической причине видообразования у приматов.

Одним из способов проверки высказанной гипотезы является анализ распределения 1Л'1* эндогенных ретровирусов в геноме человека В частности, представляло интерес провести высокоразрешающее картирование ЬТК относительно генов на некоторых хромосомах человека Решение этой задачи требовало как совершенствования интегральных карт хромосом, так и создания высокоточных и эффективных методов идентификации 1Л К элементов в образцах ДНК любой сложности.

3. Метод идентификации участков интеграции ретроэлементов в смеси образцов ДНК

любой сложности

Наиболее эффективным признаком, по которому возможно отличить два 1ЛТ? элемента и определить положение каждого из них в геноме, является уникальная последовательность геномной ДНК, примыкающая к участку интеграции ретроэлемента Для получения фрагментов ДНК, фланкирующих Ь'ГИ элементы, нами был разработан метод сслсктивной ПЦР амплификации участков интеграции ретроэлементов При разработке метода был использован эффект «селективной супрессии полимеразной цепной реакции», описанный ранее С.А. Лукьяновым.

Общая схема метода, представленная на Рисунке 5А, включает несколько стадий На первой из них проводят исчерпывающий гидролиз анализируемого образца ДНК с помощью выбранной эндонуклеазы рестрикции. Полученные рестриктные фрагменты лигируют к 45-47звенным олигонуклеотидным адаптерам. Очищенную от избытка супрессионных адаптеров смесь подвергают ПЦР амплификации, предварительно проведя достройку 3'-концов фрагментов ДНК В результате достройки на концах рестриктпых фрагментов ДНК формируются инвертированные концевые повторы Наличие таких самокомплсментарных концов позволяет каждой из цепей рестриктных фрагментов образовывать петельно-стеблевую структуру Образование подобных внугримолекулярных структур предотвращает отжиг праймера А1, комплементарного внешней части стебельного участка, и эффективно супрессирует ПЦР амплификацию фрагментов ДНК Эффективная амплификация тем не

менее может быть восстановлена при использовании второго праймера Т1, комплементарного части петельного участка петельно-стеблевой структуры Сформированный на первом цикле П11Р амплификации Т1 -А 1 фрагмент не будет иметь самокоплементарных концов и, следовательно, перестанет быть объектом ПЦР супрессии Целевой Т1 праймер может быть специально подобран к консервативным участкам повторяющихся элементов, например к консенсусной последовательности НЕИУ-К ЕТЯ В таком случае из общего пула рестриктных фрагментов ДНК эффективной ПЦР амплификации будут подвергаться исключительно те, которые содержат Г,ТИ последовательности Для увеличения специфичности амплификации таких фрагментов на последней стадии метода проводят второй раунд ПЦР с праймерами Т2 и А2 Продуктами селективной амплификации являются фрагменты состоящие из концевого остатка ЦГЯ последовательности, фланкирующего участка геномной ДНК, ограниченного участком узнавания использованной рестриктазы, и олигонуклеотидная последовательность внутренней части супрессионного адаптера Смена целевого Т праймера и (или) направления праймирования относительно структуры ЬТК позволяет получить оба - соответственно 5'- и 3'-прилежащих - набора фрагментов геномной ДНК фланкирующих всю совокупность ЬТЯ элементов, присутствующих в исходном образце ДНК При разработке метода нами были использованы образцы ДНК различной сложности (вплоть до 109 для геномной ДНК гибридных клеточных линий), содержащие различные количества ЬТЯ элементов. Отдельные примеры структуры идентифицированных фланков ЬТЛ, выделенных из ДНК индивидуальных космидных или У АС клонов и моносомика 21-ой хромосомы человека, представлены на Рисунке 5Б.

В данной работе разработанный метод был успешно использован для идентификации и картирования НЕЯУ-К ЬТЯ элементов на отдельных хромосомах человека Вместе с тем область применения метода может быть существенно расширена.

Очевидно, во-первых, что метод может быть использован для анализа распределения различных типов ретроэлементов, а не только ЬТЯ Строго говоря, объектом селективной амплификации могут бьпь любые повторяющиеся элементы генома

Во-вторых, поскольку специфичность амплификации определяется структурой целевого Т праймера или набором Т праймеров, метод позволяет эффективно дифференцировать одни группы родственных ретроэлементов от других. Для конструирования набора праймеров, в таком случае, необходимо определить вариабельные и консервативные участки нуклеотидной последовательности исследуемой группы ретроэлементов Специальный набор праймеров, соответствующих различным областям ЬТЯ семейства НЕЯУ-К, был сконструирован для настоящего исследования. Результаты экспериментов, выполненных вне рамок данной

Расщепление Я нуклеазой

Рсстриктные фрагменты ДНК

Ш Лигнрование супрессионных адаптеров

А1А2 ПК А1А2

ИР71 -О

п—^'ишмлыа шруут

А1А2 У N.

* X -У

ПЦР, раунд 1

ПЦР, раунд 2

А1А2

АР

Супрессия ПЦР

Т2

7р15.1

^13.4

РА 16

Рис.5 Селективная ПЦР амплификация фланков ИИ

(А) Схема метода Фрагменты геномной ДНК обозначены горизонтальными линиями, последовательности СГЯ - серыми прямоугольниками, адаптеров - заштрихованными прямоугольниками, праймеры - прямыми стрелками с указанием названия праймера (см также пояснения в тексте) (Б) Структура идентифицированных фланков ГЛ'Я Приведены схемы строения ЕсоМ (обозначены символом Ы) и А1и1 (А1) рестриктных фрагментов. Повторяющиеся элементы генома обозначены прямоугольниками с различной штриховкой, секвенированные участки отмечены стрелками У правого нижнего конца схем указаны названия геномных локусов

работы, подтвердили возможность селективной амплификации отдельных групп Alu и LINE элементов.

Наконец, разработанный метод может быть использован для сравнительного анализа двух аналогичных образцов ДНК. При этом, в зависимости от целей исследования, может быть выбран тот или иной способ анализа продуктов селективной ПЦР амплификации. Продукты амплификации сложных смесей ДНК, как, например, геномная ДНК или суммарная гякДНК, содержат фланкирующие участки различных копий изучаемого ретроэлемента В составе такой смеси один амплифицируемый участок отличается от другого по нуклеотидной последовательности и по размеру, т.е положению ближайшего ретроэлементу рестриктного сайта Соответственно, различия в составе двух ампликонов сравниваемых образцов ДНК могут быть выявлены различными вариантами гибридизации, дифференциального дисплея или прямого секвенирования амплифицированных фрагментов.

В настоящей работе, метод селективной ПЦР амплификаций LTR-фланкирующих последовательностей был успешно применен для решения нескольких задач. Первой из них было высокоточное полнохромосомное картирование LTR HERV-K элементов на 19-ой и 21-ой хромосомах человека.

4. Высокоразрешающее картирование LTR на отдельных хромосомах человека.

Анализ, опубликованных к началу настоящей работы, данных позволял предполагать, что LTR элементы семейства HERV-K представлены в геноме многими тысячами копий, а насыщенность различных хромосом LTR-подобными последовательностями неодинакова. Однако, количество и расположение на отдельных хромосомах полноразмерных LTR элементов, представляющих следы прежних ретротранспозиций эндогенных ретровирусов, оставалось неизвестным. Определение точного положения всех LTR на отдельных хромосомах и анализ геномного окружения таких инсерций могли бы существенно расширить представления о закономерностях распространения эндогенных ретровирусов в геноме и о возможном взаимодействии регуляторных элементов, которыми богаты последовательности LTR, с окружающими их генами.

4.1. Полнохромосомное картирование LTR HERV-K элементов на 19-ой и 21-ой хромосомах человека

В настоящей работе для проведения высокоточного картирования полноразмерных LTR семейства HERV-K были выбраны две хромосомы человека - типичный метацентрик, хромосома 19, и необычный для кариотипа человека акроцентрик, хромосома 21. Вторым,

после разных удельных долей гетерохроматина, предполагаемым отличием хромосом было общее количество функциональных генов и генетических маркеров на каждой из них Анализ имевшихся данных позволял считать 19-ую хромосому более обогащенной генами по сравнению с 21-ой хромосомой. Вместе с тем степень изученности и отдельные свойства хромосом имели значительное сходство Эти хромосомы, имея размеры около 50 млн пар оснований каждая, представляют сходные фракции генома человека На момент проведения картирования размер и плотность секвенированных областей для обеих хромосом также были сопоставимы Сходную структуру имели физические карты хромосом, представляющие протяженные контиги космидных клонов, перекрытые или связанные ВАС, в случае карты хромосомы 19, и YAC, для хромосомы 21, клонами. EcoRI фингерпринт был выполнен для наборов базовых клонов обеих хромосом так, что обе доступные карты состояли из последовательности EcoRI рестриктных фрагментов, длина каждого из которых была известна Наличие перечисленных сходств предполагало возможность достижения одинаковой достоверности, точности и полноты предпринимаемого картирования LTR элементов на данных хромосомах. Идентичные характеристики эффективности картирования, в свою очередь, необходимы для корректного сравнения распределения картируемых LTR элементов на двух хромосомах человека.

Физические ресурсы для картирования LTR в виде избыточных хромосом-специфических клонотек на гибридизационных фильтрах высокой плотности и отдельных клонов были любезно предоставлены проф. Э. Бранскомбом (LLNL, США) и проф. К. Гардинер (ERI, США) Определение положения отдельных космидных клонов, а также гибридизующихся ЕсоШ-рестриктных фрагментов, на интегральных картах 19-ой и 21-ой хромосом проводили с использованием локальных баз данных и других ИНТЕРНЕТ ресурсов Геномных Центров Лаборатории Лоуренса Ливермора (http7/bbrp.llnl.gov:80/bbrp/genome/html/chrom_map.html), Института Элеоноры Рузвельт (http //www nsm du.edu/eri/chromosome21 html) и Института Макса Планка (http://seq.mpimg-berlin-dahlem mpg.de/hgs/chrom_21 .html).

Картирование полноразмерных ITR элементов выполняли по общему плану, схематически представленному на рисунке 6 На первом этапе проводили гибридизацию 5-6-кратно избыточных клонотек космидных клонов, нанесенных на фильтры высокой плотности, с пробами, соответствующими полноразмерному LTR HERV-K элементу усредненного состава. В качестве такой пробы был использован суммарный ПЦР продукт амплификации геномной ДНК человека с праймерами, соответствующими 5'- и З'-концевым участкам консенсусной последовательности LTR семейства HERV-K При картирования LTR на 19-ои хромосоме использовались также результаты предварительной гибридизации с зондами, полученными на основе а590 и 6а12 клонов ранее сконструированной нами гякДНК

полученными на основе а590 и 6а12 клонов ранее сконструированной нами гякДНК библиотеки Для дальнейшего анализа отбирали только те космидные клоиы, которые давали интенсивный гибридизационный сигнал с обоими гякДНК зондами и пробой полноразмерного LTR Пример результатов гибридизации на фильтрах высокой плотности представлен на рисунке 6а Сочетание нескольких гибридизационных зондов и применение жестких условий гибридизации и отмывки обеспечило выявление фрагментов хромосом, содержащих, как показали результаты дальнейшего анализа, только полноразмерные LTR HERV-K элементы. Известно, что геном человека содержит другие, например, так называемые SVA, гипы ретроэлементов, склонных к перекрестной гибридизации с фрагментами нуклеотидных последовательностей LTR HERV-K, но имеющими принципиально иной механизм распространения в геноме Кроме того, учитывалась возможность присутствия в геноме инактивированных фрагментов LTR, образованных в результате транслокаций, инверсий, рекомбинационных событий и других перестроек генома. Такие, LTR-подобные нуклеотидные последовательности, не были следствием ретротранспозий эндогенных ретровирусов и заведомо не содержали сбалансированно! о набора регуляторных элементов, характерного для LTR элементов. Поэтому настоящее исследование было сосредоточено на идентификации именно полноразмерных LTR на всех стадиях проводимого анализа.

На втором этапе хромосомного картирования подтверждение присутствия полноразмерных LTR элементов в гибридизующихся клонах получали с помощью ПЦР амплификации космидной ДНК с праймерами, соответствующими концевым участкам консенсусной последовательности LTR HERV-K. Примеры результатов амплификации ДНК космидных клонов из клонотеки хромосомы 19 представлены на рисунке 66 Положительные результаты ПЦР анализа были получены для 157 и 23 гибридизующихся космид избыточных клонотек 19-ой и 21-ой хромосом, соответственно Дальнейший анализ, проведенный с использованием локальных баз данных и 'Browser'-систем обработки Геномных Центров LLNL (Ливермор, США) и MPIMG (Берлин, Германия), позволил отнести большинство гибридизующихся космид к тому или иному из существовавших контигов, для каждого из которых была известна карта распределения участков узнавания EcoRl и BamHI эндонуклеаз С целью утоадения положения I.TR элементов в составе контигов, а также для фингерпринтинга некартированных положительно гибридизующихся космидных клонов, проводили Саузерн-блот гибридизацию EcoRI-рестриктных фрагментов ДНК космид с пробой полноразмерного LTR HERV-K. В качестве примера результатов, полученных для двух космидных контигов 19-ой хромосомы, на рисунке 6в представлены электрофореграммы разделения EcoRI-рестриктных фрагментов и радиоавтограф гибридизации соответствующих

Схема метопа полнохромосомного картирования СП*

Гибридизация зондов ЬТЯ с клонами хромосом-специ-фических клонотек

..'.'л*., ..........

I

! ' '

Картирование гибридизую-щихся клонов и ПЦР-анализ "'^фрагментов соответствующих ^ контигов

^кЕсоЯ! фингерпринтинг положительных клонов и I_.TR

пробы

гибпи лизутоптийся космидный клон

о • •

дуллицированный рис маркер

и.

Секвенирование индиви-'■►I дуальных полноразмерных I [,ТЯ и их геномных фланков

Рис. 6а Гибридизация 1ЛИ с космидной клонотекой

Представлен фрагмент радиоавтографа. На выноске указан формат нанесения космид хромосом-специфи-ческой клонотеки на фильтры высокой плотности и схематизированы результаты гибридизации с одним из космидных клонов

—( Ш ' " К И5 |—

2 3 4 56 7 8 9 ЮМ

' Высокоразрешающее I картирование 1Л"Я элементов ! на интегральных картах [_ хромосом человека

1

СВ. ' УК *.■

м 21 22 23 24 25 26 27 28 29 30 М

Рис. бб ПЦР анализ космидных клонов

В верхней части рисунка представлена схема ЬТЯ и указано положение праймеров В нижней часги приведены примеры электрофореграмм разделения продуктов ПЦР амплификации ДНК гибридизуютцихся космидных

ЕсоМ фингерпринтинг

11 Я 8 § 3 8 £

ММ мМммймЯЙ

м?

м м д я я м

!0Ш1 ) 162 8 144 7 126 6 108 $ 090

1

Электрофореграмма разделения ЕсоЫ рестрикгаых фрагментов | космидных ДНК

Результаты Саузерн-блот гибридизации космидных ДНК с I_.TR зондом

Стратегия ПЦР-амплификации и секвенирования фланков ЬТК из локуса 112

Chrl9ql2

0,64 кЬ

ПЦР-2

А1

ПЦР-1

ПЦР-1

I

Фрагмент интегральной карты 19-ой хромосомы

I.

ьтя,

иге,-

- ьт»

мл 9

II' г 1*1 I» 1" "Т ' " ' * " *■_ЦЦ-ЩЯ 1111111 | ш

I СТМ1 »108 ч ■ > СТМ1 ЯЭ1К4 " - ■ ч СТМ1

Ю1в1? ■ ■ ■" 01561 КЭШ» 'Г "' ■ СТ581 Т222 (467)

стаг - СГ222

^ СТ222 щ. СШ

111 СТ332

И)

СТ43

»■■ СТ43 Р10091 ■ СТО

...................ЮЯ» ШШ_I- ОТ«

яжв! огач "я»« II I'

828617 ■ ■ ■ тт СТ311 (621)

»27933 ■_IX СТЭ11

ПЭ0060 ■ ■»■ СТЭ11 (535)

В31700 ■ '' СТ1343 МЮЯ) ■ ' ' ' СТ134Э

йао1в) ■ ■■■■■■ СТ1ЭО

ЯЭ1МВ ■■■■■■ СТ1343 Р171Б4 -■»■■' СТ1Э4Э Р1в0в1 ' — СТ1МЗ Я291Э» « ■ ~ ■ СТ1Э4Э Р1707В ' — ■■ СПЗ« «01)

Вертикальными стрелками отмечено положение картированных I_.TR

Рис. 6в ЕсоШ фингерпринтинг, секвенирование фланков и картирование ЬТИ

фрагментов с зондом полноразмерного LTR. Суммарно, с помощью гибридизационного и ПЦР анализов и EcoRI-фингерпринтинга было выявлено 119 полноразмерных LTR, принадлежащих космидам из клонотеки 19-ой хромосомы, и 23 LTR элементов в составе космид 21-ой хромосомы. Параллельно, полученные нами результаты позволили определить положение нескольких ранее не картированных космидных клонов. Так, 7 LTR-содержащих космид 21-ой хромосомы удалось объединить в один контиг и определить его положение на карте Таким образом, для 72 идентифицированных LTR элементов хромосомы 19 и 9 LTR 21-ой хромосомы нами было определено, с точностью до размера соответствующего EcoRI-рестриктного фрагмента, положение на хромосомных картах. Оставшаяся часть индивидуальных LTR входила в состав отдельных клонов или контигов с неизвестным положением на хромосомах.

Третий этап картирования включал определение первичной структуры идентифицированных полноразмерных LTR и прилегающих к ним последовательностей геномной ДНК Как было отмечено выше, именно структура фланков максимально точно и однозначно определяет положение каждого индивидуального LTR в геноме Следовало также учитывать, что космидные контиги с известным положением составляли лишь часть физических карт хромосом, а разрывы в космидном клональном покрытии заполнялись перекрывающимися ВАС и YAC клонами. Кроме того, различные геномные центры сменили стратегию и проводили ускоренное секвенирование ВАС клонов, а не космидных контигов С учетом вышеизложенных соображений пами было решено определить первичную структуру фланков LTR элементов, идентифицированных в составе некартированных космид Для завершения полнохромосомного картирования LTR элементов нами, также, был предпринят дополнительный скрининг YAC клонов, содержащих участки 21-ой хромосомы, которые отсутствовали в известных космидных контигах. Для получения LTR-фланкирующих фрагментов нами применялся разработанный метод селективной ПЦР-амплификации геномных последовательностей, прилежащих к участкам интеграции ретроэлементов. ДНК отдельных космидных и YAC клонов подвергали исчерпывающему гидролизу с помощью EcoRI эндонуклеазы. В ряде случаев дополнительно использовали BamHI и Rsal эндонуклеазы рестрикции К полученным рестриктным фрагментам лигировали супрессионные адаптеры и проводили селективную ПЦР-амплификацию, как это описано выше. К особенностям применения метода в данной части работы следует отнести обязательную амплификацию обоих фланков изучаемых LTR, использование в ряде случаев лишь одного раунда ПЦР и специальный подбор целевых праймеров к наиболее консервативным центральным участкам LTR последовательности Результаты амплификации подтвердили наличие единственного LTR элемента в составе каждого из проанализированных

клонов Таким образом, для каждого из изучаемых космидных или YAC клонов было получено по три ПЦР-фрагмента, включая собственно LTR, его 3'- и 5'-фланкирующие области Последующее клонирование и секвенирование полученных ТТЦР-фрагментов позволило реконсгруировать нуклеотидную последовательность 23 одиночных LTR элементов и 4 LTR, принадлежащих провирусам семейства HERV-K, вместе с участками интеграции изучаемых ретроэлсментов и прилегающими участками геномной ДНК Полученные данные о первичной структуре LTR-содержащих фрагментов изучаемых хромосом были использованы для компьютерного поиска в международной базе данных нуклеотидных последовательностей NCBI. Результаты поиска позволили дополнительно картировать 6 LTR элементов. Одновременно, бьшо уточнено или вновь установлено положение на изучаемых хромосомах нескольких космидных клонов

Гаким образом, нами было впервые проведено полнохромосомное картирование LTR семейства HERV-K на двух хромосомах человека Установлено положение 72 LTR элементов на 19-ой хромосоме и 16 LTR на 21-ой хромосоме человека Определена первичная структура всех идентифицированных LTR и получены уникальные данные для проведения сравнительного анализа и выявления особенностей хромосомного распределения эндогенных ретровирусов семейства HERV-K.

4.2. Сравнительный анализ распределения LTR HERV-K элементов на 19-ой и 21-ой хромосомах человека.

Как уже отмечалось, хромосомы 19 и 21, имея множество сходных черт, отличаются по удельному количеству эухроматина и белок-кодирующих генов Согласно данным приведенным на ИНТЕРНЕТ серверах проекта Геном Человека

(http //wvm.ensembl.org/Homo_sapiens/mapview'?chi=:19 и /mapview?chr=21), секвенированная к настоящему времени часть хромосомы 19 составляет около 64 млн пар оснований, что сравнимо с 47 млн пар оснований, известных для 21-ой хромосомы. Анализы первичных структур хромосом, проведенные консорциумами секвенирования хромосомы 19 (Gnmwood et al, 2004) и хромосомы 21 (Hatorri, et al 2000), подтвердили драматическую разницу между хромосомами по содержанию известных и кандидатных генов. Так, было выяснено, что плотность 1,5 тысяч генов на 19 хромосоме в 3,5 раза превосходит среднюю по геному величину При этом, описано 20 кластеров генов ZNF, OR, СУР и других семейств, образующих особо ген-богатые участки 19 хромосомы Существующие данные характерную г 21 хромосому, напротив, как ген-обеднепную В ее составе описано лишь около 300 генов.

Как один из результатов полнохромосомного картирования LTR элементов нами обнаружены существенные и сходные с различиями в числе генов различия между

22

хромосомами и по числу идентифицированных 1ТЯ 72 и 16 элементов картированы нами соответственно на 19-ой и 21-ой хромосомах. Проведенная оценка ожидаемого числа получаемого с соблюдением условия случайного и равномерного распределения ретроэлементов в геноме, составила около 30 ЬТК элементов для каждой из хромосом. Несоответствие ожидаемого и экспериментально установленного числа 1ЛП позволило сделать вывод о неравномерном характере распределении НЕИУ-К элементов в геноме человека При этом 19-ую хромосомы следует считать крайне обогащенной ЦП* НЕЯУ-К последовательностями, а хромосому 21, наоборот, обедненной Здесь следует отметить, что впоследствии, при анализе опубликованной первичной структуры генома человека, вывод о неравномерности распределения был сделан разными авторами для нескольких типов ретроэлементов Неравномерность распределения между хромосомами эндогенных ретровирусов ставит вопрос о специфичности участков генома, в которые при ретротранспоциях происходит интеграция новых копий или которые сохраняют встроенные копии в ходе эволюции Выявлению таких участков может способствовать сравнительный анализ распределения НЕЯУ элементов на отдельных хромосомах. На рисунке 7 представлено установленное нами распределение ЬТО. семейства НЕЮ/-К вдоль хромосом 19 и 21 Распределение 1ЛТ1 на 19-ой хромосоме возможно охарактеризовать как более равномерное по длине хромосомы. ЬТЯ элементы на 21-ой хромосоме, наоборот, сосредоточены преимущественно в двух областях- перицентромерной, содержащей 61Л'Я и 3 провирусных элемента, и прителомерной, в которой расположены остальные 7 ЬТК. Как известно, прителомерная область содержит сравнительно больше генов, чем другие участки хромосомы 21-ой хромосомы Следует обратить внимание, также, на 21 ql 1.2 прицентромерный район, в котором положение 41ЛП совпадает с локальным увеличением плотности известных генов. Подобные участки локальной концентрации 1ЛТ1 элементов, совпадающие с увеличенной плотностью генов, обнаруживаются и на 19-ой хромосоме. Особый интерес представляет идентификация 21 ЬТТ1 элемента в районах кластеризации 2Ш91-подобных генов, кодирующих транскрипционные факторы. Дополнительный анализ опубликованной структуры генома человека показал, что 39 из72 картированных нами ЬТЯ элементов хромосомы 19 расположены в интронах известных генов или на расстоянии менее 10 т.п.о. 01 них. Следует отметить, что, статистический анализ совместной локализации генов и 1/ГО в пределах одной хромосомы затруднен ввиду относительно небольшого числа 1ЛТ1 элементов. Тем не менее, сравнение двух хромосом по распределению генов и 1ЛИ выявило четкую тенденцию к расположению ЦШ элементов в обогащенных генами областях генома. Возникновение упомянутых выше кластеров генов традиционно объясняют дупликациями соответствующих участков генома. При этом дуплицируемый участок может содержать и

р13.3 5 ZNF

10 ZNF

P13.2

27 ZNF

ИЗ. 12

plJ.11

34 ZNF

5 ZNF

413.11

,13.12 8 ZNF

413.13

СУР

413.2 СЕЛ

113.31 19 ZNF

я1з.зг

413.33

413.41 13 ZNF

413.«

17 ZNF

413.43

15,16

PRED6

SOD!

ERG

MX I MX2 PKNOX ,22.3 CRYAA AIRE

Рис. 7 Распределение LTR элементов и генов на 19-ой и 21-ой хромосомах

Приведены идеограммы хромосом, слева от которых помещены диаграммы плотности генов (по данным, представленным Сенгер Центром на апрель 2004

http //www ensembl org/Homo_sapiem/mapview) Стрелками с цифрами в левых частях отмечено положение картированных LTR HERV-K. Шрифтом серого цвета выделены картированные нами LTR 21-ой хромосомы, отсутствующие в опубликованной нуклеотидной последовательности хромосомы; фигурными скобками отмечена точность результатов FISH картирования Справа от идеограмм указано положение некоторых генов и генных кластеров, приведены количества ZNF91 -подобных генов в отдельных кластерах 19-ой хромосомы

отдельные ретроэлемепты Напротив, основным механизмом распространения эндогенных ретровирусов считается ретротранспозиция, при которой кДНК копия стабильного элемента переносится в другой произвольный участок генома Механизм ретротрапепозиции включает несколько стадий, которые остаются далеко не полностью и ¡ученными В частности, не определено насколько случайно интеграционный комплекс «выбирает» положение в геноме для внедрения дочерней копии эндогенного ретровируса, и насколько такая копия способна «запоминать» хромосомную территорию своего возникновения В этой связи представляет интерес сравнение первичных структур LTR элементов, располагающихся на отдельных хромосомах. Такое сравнение проведено нами для всех идентифицированных LTR на двух изучаемых хромосомах и хромосоме 22, LTR элементы которой были выявлены in silico на основе опубликованной первичной структуры.

На рисунке 8 представлены идеограммы трех хромосом с обозначенным положением LTR элементов и дендрограммы ближайших гомологий первичных структур LTR Сравнение нуклеотидных последовательностей индивидуальных LTR элементов и построение дендрограмм проводили с использованием пакетов программ ClustalW v.1.6, GDE v.2.0, Phylip v.3.5 и TREEVIEW. Дендрограмма ближайших гомологий представляет пропорциональный тип деревьев То есть, данный метод позволяет установить величину нуклеотидных различий между любыми двумя рассматриваемыми структурами как сумму длин горизонтальных ветвей дендрограммы, соединяющих эти элемен1ы. А топология дендрограммы рассчитывается таким образом, чтобы элементы, содержащие наиболее сходную совокупность структурных характеристик, располагались наиболее близко на результирующем дереве. Как следует из представленных результатов, каждая из хромосом содержит множественные структурные варианты LTR элементов Особенно сильное разнообразие первичных структур наблюдается для 72 LTR элементов 19-ой хромосомы, которые представляют две явно выраженные группы (анализ групп см. в разделе 6). Даже относительно небольшое число индивидуальных LTR, расположенных на 21-ой и 22-ой хромосомах, проявляют значительные структурные расхождения. Ввиду высокого разнообразия нуклеотидных последовательностей LTR элементов, локализованных на рассматриваемых хромосомах, можно сделать вывод об общем характере распространения HERV-K элементов в геноме как достаточно случайном процессе. Еще одной характеристикой распределения LTR элементов вдоль рассматриваемых хромосом является отсутствие корреляции между степенью сходства первичных структур LTR элементов и близостью их положения на хромосоме. Как следует из данных приведенных па рисунке 8, многие пары LTR, соседствующие на дендрограммах и, следовательно, обладающие высокой степенью идентичности, расположены в различных и удаленных участках хромосом.

г?-"

I 4а

гс:

1 с

Н7|(

уз ап! ВСИ.4

вси.в

АТР4

ТЕГ

СЫ22 СЬг21

Рис. 8 Дендрограммы ближайших гомологий последовательностей ЦП* НЕЯУ-К, картированных на трех хромосомах человека

Положение картированных ПЯ на идеограммах хромосом указано стрелками с номерами. Соответствующими номерами обозначены индивидуальные ЦП?, на дендрограммах. На дендрограммах и схемах хромосомного распределения ТЛИ хромосом 21 и 2? буквами а или Ь при номере 1Л"Я обозначены 5' или 3' ЦШ одного НЕЯУ-К элемента. Группы , включающие высокогомологичные ЦГЯ, обведены пунктирной линией

Обнаружено и большое число противоположных примеров близкого расположения на хромосомах структурно несхожих LTR элементов.

Таким образом, проведенный нами анализ показал, что при сравнительно случайном распределении LTR HERV-K элементов вдоль хромосомы, выявляется значительная разница в межхромосомном распределении LTR Одним из разрешений такого противоречия может бьггь выявленная нами тенденция к сосредоточению LTR семейства HERV-K в обогащенных генами участках генома. Последний вывод согласуется с общепринятой гипотезой о том, что не особенности первичной структуры, а функциональное состояние участка генома определяет места преимущественной интеграции ретровирусов, в том числе и эндогенных ретровирусов С другой стороны, предпочтительная локализация вблизи белок-кодирующих генов является, по-видимому, характерной чертой HERV-K семейства эндогенных ретровирусов человека Такое предположение подтверждается данными, недавно полученными П Медстрандом и Д. Магер при биоинформационном анализе структуры I енома человека (Medstrand and Mager, 2002). Авторы выявили близкий к случайному характер распределения в геноме различных типов эндогенных ретровирусов, за исключением статистически достоверной концентрации HERV-K элементов на расстоянии 5-10 т п о по обе стороны от известных генов.

5. Определение промоторной активности LTR HERV-K

Обнаруженная нами тенденция к локализации HERV-K элементов в обогащенных i енами районах увеличивает интерес к проблеме возможного участия одиночных LTR элементов в регуляции экспрессии генов человека Общепринято, что сохранение I.TR последовательностями своих регуляторных свойств на протяжении длительных периодов эволюции обеспечивало ретротранспозиционное распространение эндогенных ретровирусов человека в геноме. Вместе с тем, вопрос о сохранении и проявлении LTR элементами регуляторного потенциала в геноме современного человека широко дискутируется, но остается мало изученным В частности, до недавнего времени полностью отсутствовали сведения о промоторной активности одиночных LTR семейства HERV-K.

В рамках данной работы, с целью первой проверки регуляторных свойств изучаемых LTR, нами было проведено исследование промоторной активности трех из картированных на 19 хромосоме LTR(LTR9a, 30, 50b на рис 7 и рис 8) Одним из способов обнаружения промоторной активности является транзиентная экспрессия репортерных генов Нами была выбрана система pGL (Promega) с геном люциферазы в качестве репортерного гена Данная часть работы проводилась в сотрудничестве с проф. К. Лейб-Мош (Мюнхен, Германия). Эксперименты по трансфекции и определению люциферазной активности трансфектантов

проведены сотрудниками лаборатории Е.П Копанцевым и Е В Снежковым Трансфекцию с помощью ВЕАЕ-декстрана проводили в клетки тератокарципомы линии КТ2/П1 Один из исследованных ЬТЯ, картированный в локусе ^13 31 (50Ь на рис 7 и рис 8), был тестирован в нескольких вариантах, включая фрагменты лишенные энхансерной, энхансерной и промоторной областей или Ш-концевого участка Результаты определения относительной люциферазной активности в клетках, трапсфицированных различными типами конструктов, приведены на Рисунке 9

А

из и и5

РР'К;

Щ^гз/'Ч"?

1-2

4-2

5-2 1-6 3-6 5-6

промотор

Ьис Люциферазнан активность

В

рОЬЗВУ

рвиЭДО

1-2—(

р01Ш

рС1.35у40_8У40

1-2

Рис. 9 Тестирование промоторной активности LTR в системе транзиентной экспрессии

репортерпого гена люциферазы

В верхней (А) части рисунка представлено схематическое изображение LTR элемента и используемых ПЦР-продуктов, в нижней (Б и В) части - схемы рекомбинантных плазмид и результаты определения люциферазной активности На схеме LTR обозначены функциональные U3, R и U5 области, тонкими стрелками указано положение пронумерованных ПЦР-праймеров, фигурной стрелкой - положение промотора, область негативного регулятора отмечена серым фоном Отрезками под схемой LTR обозначены продукты ПЦР амплификации LTR элемента с соответствующих праймеров На схемах конструктов клонированные части LTR элемента обозначены прямоугольниками, делегированные -зигзагообразными линиями, репортерный ген (Luc) - черным прямоугольником. Величины люциферазной активности в соответствующих трансфекташах относительно люциферазной активности в клетках, трансфицированных контрольной плазмидой pGL3BV, приведены на диаграммах в правой части рисунка

В результате проведенного исследования, для всех трех LTR IIERV-K элементов, имеющих существенные различия в положении на хромосоме и первичной структуре (как это видно из рис. 7 и рис 8), была показана явно выраженная промоторная активность. Впервые было обнаружено наличие альтернашвного, противоположно направленного промотора в L I'R семейства HERV-K. Также было открыто существование негативного регуляторного элемента в концевом участке U5 области изучаемых LTR. Наличие дополнительного регуляторного элемента в структуре LTR сближает эндогенные ретровирусы человека семейства HERV-K с особой группой так называемых «сложных ретровирусов», обладающих специальной системой координированных сигнальных последовагельностей Таким образом, результаты данного исследования не только подтвердили для некоторых LTR сохранение промоторных свойств, но и позволили предположить существование более сложных взаимодействий HERV-K элементов с регуляторным системами клетки.

6. Сравнительный структурный анализ нуклеотидных последовательностей LTR.

Сравнительный анализ нуклеотидных последовательностей ретроэлементов является мощнейшим инструментом, позволяющим реконструировать многие структурные изменения генома, произошедшие в ходе эволюции Новый импульс развитию биоинформационных подходов исследований ретроэлементов и эволюционной динамики их распространения придает ускоренное накопление информации о структуре геномов различных организмов. Сравнение ретроэлементов, проводимое на полпогеномном уровне, позволило выявить многочисленные копии повторов, специфичные для отдельных геномов. Так, с помощью филогенетического анализа Alu и LINE1 повторов, интенсивно проводимого в лабораториях M Батцера, П Дейнинжера. А Фурано, X. Казазяна и др., обнаружено и охарактеризовано несколько групп этих элементов, специфичных для генома человека.

В ходе данной работы нами проведен один из первых сравнительных анализов структуры Г.ТЯ эпдогеппых ретровирусов человека и реконструирована эволюционная динамика распространения в геноме НЕЛУ-К элементов.

6.1. Сравнение нуклеотидных последовательностей картированных ЬТЯ элементов и разработка систематики НЕЯУ-К.

Первый сравнительный анализ последовательностей индивидуальных ЬТТ? был выполнен для 72 секвенированных и картированных нами элементов 19-ой хромосомы человека Топология построенной дендрограммы ближайших гомологий, как упомянуто выше и представлено на рисунке 8, свидетельствует о возможном разделении анализируемых 1Л'Я на две основные группы При филогенетическом анализе любое разделение на группы родственных последовательностей подразумевает происхождение от различных цредковых элементов или так называемых «мастер-генов». Характерные особенности структуры предкового ретроэлемента сохраняются, в основном, при транспозициях и могут быть выявлены в структуре большинства потомков как диагностические позиции.

С целью выявления диагностических позиций в структуре 1Л"11 для двух предположительных групп нами было произведено выравнивание нуклеотидных последовательностей 88 полноразмерных ЬТЯ семейства НЕЯУ-К с помощью пакетов программ С1шЫХ V. 1.6 и ООЕ у.2.0. Для первоначального анализа были использованы 45 полноразмерных секвенированных ЦП*. 19-ой хромосомы и 43 полноразмерных 1Л~И НЕЯУ-К, идешифицированных нами в составе секвенированных фрагментов генома человека, депонированных в вепВапк базе данных Результаты проведенного анализа действительно позволили разделить все последовательности на два крупных подсемейства, названных нами ЬТЯ-1 и 1ЛИ-П. Диагностическими признаками служили 8 инсерций-делеций различной протяженности, 34 мононуклеотидных замены и структура двух вариабельных районов. В качестве основных диагностических отличий были выявлены: а) гептануклеотид ССООУСС (позиции 902-908 на рисунке 10), который образует прямой тандемный повтор с гексамером на и 5/И. границе членов ЬТК-1 подсемейства и делетирован у представителей подсемейства ЬТЯ-И, б) последовательность ТЯЯТКНА (позиции 854-860, рис. 10) подсемейства ЬТ11-1, замененная у членов ЬТЯ-Н подсемейства на последовательность ААСАССС; в) тетрануклеотидная вставка МАТС (позиции 499-502, рис. 10), характерная для 1Л"11-П и отсутствовавшая у всех изученных представителей подсемейства 1ЛТ1.-1. В целом, по составу и внутренней вариабельности структур ЬТЯ, подсемейства могут быть охарактеризованы следующим образом: подсемейство ЬТЯ-П включает слабодивергированные близкородственные последовательности, напротив, группа последовательностей, образующих

LTR-I подсемейство, существенно более вариабельная и разнородная Очевидно, что большая внутригрупповая вариабельность может отражать либо происхождение от многих Maciep-генов, либо более длительное и независимое существование всех членов группы, в течение которого они накопили большее число индивидуальных мутаций. Как показал дальнейший анализ, для членов подсемейства LTR-I справедливо последнее предположение и это подсемейство существенно «старше» подсемейства Т-TR-II

1-Е а а tgg tgata ---- t tataaaa gag ctc taatgaa ccggtgc a—rt te gg tca

I-D а а tgg tgata ---- t tataaaa gag etc taatgaa ------с a-ct te gg tca

I-S а а tgg tgata ---- t tataaaa gag ctc taatgaa ccggtgc a-ct te gg tca

I-P а а tgg agaça ---- t tgtaaaa gag cta tagtaaa ccggtgc a-ct te gg tca

I-K а а tgg agaça ---- t tgtaaaa gag cta tagtraa ccggtgc a—et te gg tca

I - Y а а tgt agaça ---- t tgtaaaa gag ctg tggtaga ccggtgc a-ct te gg tca

I-A а а tgt agaça ---- t tgtaaaa gag atg tggtaga ccggcgc a—et te gg tca

I-I - - cgt tgaya ---- t tgtaaaa rag atg tggtaga ctggcgc

т-х а а cct tgata aacg t tgtaaar ggg agg aacgccc ccggcgc a—tt ca ac tca

II-H - - cct tgata aatg с tgtaaaa ggg agg cacaccc ------- ------ -- ---

11-0 а g cct tgata aacg с tgtaaaa ggg agg aacaccc ctttt ca ac tc<a

II-B - - cct tgata ---- t tgtaaaa ggg atg aacaccc ------- -----— •---

II-N - - cct tgata catg с tataaaa ggg aag aacaccc

II-V а g crt tgata catg с tataaaa ggg agg aacaccc cctta ta ac tca

II-T с g cct tgata catg с tataaaa ggg aag aacaccc cctta ca ac tca

II-L с g cct tgata aatg с tataaaa ggg aag aacaccc ------- cctta ya ас аса

/////// II I / ^v-^v

22 42,278-80,395-9,499-502,547 572-8(промотор), 614-6, 679-81, 854-60,902-8, 947-51,994-4,1044-5 1054-6

Рис. 10 Фрагмент множественного выравнивания консенсусиых последовательностей групп

ЬТК НЕИУ-К элементов

В правой части рисунка приведены названия групп символ I соответствует подсемейству символ II — подсемейству I ,ТЯ-Н Координаты приводимых диагностических позиций указаны в нижней части рисунка.

Проведенный нами анализ нуклеотидных последовательностей 1ЛГЯ позволил провести и более детальную группировку семейства НЕЯУ-К. Кроме упомянутых высоко консервативных позиций, послуживших критериями для выделения двух подсемейств, были обнаружены и другие отличия в первичной структуре, характерные для отдельных групп ЬТЯ внутри каждого из подсемейств Основными отличительными признаками были точечные замены, динуклеотидные инсерции и четыре делеции размером от 6 до 23 п н. каждая в Ш и R областях ЬТЯ последовательностей Дополнительно нами было выявлено несколько [ . обладающих характерными особенностями двух групп или даже семейств Такие 1ЛИ, образованные, по-видимому, в результате рекомбинационных событий, были исключены из дальнейшего анализа. Оставшиеся 85 индивидуальных полноразмерных ЬТК были разделены, с учетом характерных структурных отличий в диагностических позициях, на 16 отдельных групп Для каждой из групп была выведена консенсусная последовательность

Обоснованность выделения отдельных групп была проверена путем сравнения внутри- и межгрупповой вариабельности нуклеотидных последовательностей LTR. Для каждой из групп был проведен расчет степени отклонения от консенсусной последовательности каждого из членов группы. В дальнейшем консенсусные последовательности были использованы для компьютерного поиска гомологичных последовательностей в геномных базах данных NCBI (http //www.ncbi nlm.nih gov) и UCSC (http://genome.ucsc edu/) с помощью программ BLASTN и BLAT. Выявленные индивидуальные полноразмерные LTR элементы относили к одной из 1 б групп и повторяли проверку состоятельности группирования с помощью методов статистического анализа и компьютерных программ анализа выборок ДНК последовательностей. В результате, была доказана корректность первоначальной группировки и сформированы более строгие консенсусные последовательности для каждой из групп. Кроме того, обосновано выделение отдельных подгрупп внутри LTR-II L и LTR-IK ветвей Таким образом, была разработана первая систематика LTR HERV-K элементов генома человека

В процессе разработки систематики нами выявлялись характерные особенности структуры LTR и оценивался общий и внутригрупповой уровень вариабельности нуклеотидных последовательностей LTR элементов. Вместе с тем, не только общее число мутаций в структуре индивидуальных LTR, но и характер их распределения по длине нуклеотидной последовательности может быть использован при описании отдельных групп Сосредоточение мутаций или их отсутствие в отдельных участках ретроэлемента может служить указанием на функциональную важность таких участков или быть следствием негативного отбора. Так например, впервые описанная Бритеном и Смитом (Britten 1994, Smil et al, 1995) «исчезновение» G оснований из структуры Alu повторов, относящихся в древним систематическим группам, приводит к инактивации промоторной области этих ретроэлементов. Эти изменения структуры стали одним из классических примеров механизмов защиты генома от инсерционного мутагенеза, вызываемого транспозициями ретроэлементов Нами впервые описаны консервативные и варибельные участки в структуре LTR эндогенных резровирусов человека. Распределение таких участков для двух групп LTR HERV-K приведено на Рисунке 11.

Результаты распределения частот индивидуальных мутаций вдоль последовательности предегавлены для 77 LTR, отнесенных к группе 1_А, и 94 элементов группы LTR-II L. Кроме уже отмечавшейся разницы в общей вариабельности "молодых" и "старых" групп LTR, заметны отличия между группами и в распределении вариабельных участков нуклеотидных последовательностей. Так, для предположительно более древней группы 1_А характерна повышенная частота мутаций в области энхансерного, промоторного и участков связывания

ядерных факторов Участок, содержащий негативный регуляторный элемент, вьплядит вариабельным для обеих трупп. Однако, все пики гипервариабельности ЬТЯ-П Ь последовательности приходятся на участки диагностических замен, характери ¡утощих отдельные подгруппы, и должны быть исключены из рассмотрения Достаточно консервативными для обеих групп оказались границы функциональных областей Ш/Я и 1^/115, а также сигнал полиадснилирования, расположенный в конце I? области ЬТИ. Выявленные консервативные и вариабельные области ЬТЛ и, особенно, различия между группами в распределении часто! мутаций могут быть следствием особенностей расположения каждой группы в геноме или их разной эволюционной истории Для выяснения эволюционной истории различных систематических групп нами были проведены специальные исследования, результаты которых описаны в следующем разделе

я о

2 а В

I

I А

400 600 800 1000 1200 ЬТИ роз Шоп (Ьр)

НЕпЬК

из

и

115

V И

Рис. 11 Вариабельность нуклеотидных последовательностей ЬТЛ элементов генома человека, отнесенных к двум систематическим группам

На диаграмме представлено распределение частот мутаций в индивидуальных ЬТЯ элементах, принадлежащих группам иГЫ-11_Ь и 1Л"К-1_А. В нижней части рисунка приведена схема ЬТЯ с отмеченными звездочками положениями гормон-чувствительного элемента (Н), энхансера (ЬпЬ), участка связывания фактора УУ1 (Т), черной стрелкой - положением промотора, фигурной стрелкой -сигнала полиаденилирования, серым фоном - негативного регуляторного элемента

6.2. Определение эволюционной динамики распространения в геноме НЕЯУ-К элементов

Как было упомянуто выше, существование отдельных групп ретроэлементов с характерными структурными признаками предполагает их происхождение от отдельных маегер-генов. При этом возраст группы, или время ретротранспозиции мастер-гена, пропорционален уровню внутригрупповой дивергенции и скорости накопления нейтральных мутаций членами группы. Скорости накопления мутаций, как известно, могут бьггь разными как я отдельных локусах одного генома, так и для различных групп или видов организмов. Для оценки скорости накопления мутаций в геномах приматов нами было проведено сравнение имевшихся литературных данных и данных о структуре нескольких ортологичных локусов геномов приматов. Время расхождения различных линий приматов, предложенное разными авторами, было также усреднено и выбрано на уровне 45 млн лет для узконосых обезьян Нового Света, 28 млн лет для мартышкообразных (обезьян Старого Света) и 18,13, 8 и 5,6 млн. лет соответственно для отделения линий гиббоновых, орангутана, гориллы и шимпанзе. С учетом принятых возрастов линий приматов проводили дополнительную оценку скорости накопления мутаций по дивергенции 5' и 3' 1ЛТ1 последовательностей эндогенного ретровируса НЕ11У-К(С4) в ортологичном локусе геномов человека, орангутана и зеленой мартышки (по данным Оагще10 а1, 1995) В результате всех расчетов скорость накопления нейтральных мутаций в усредненных локусах геномов приматов была принята на уровне 0,13% за 1 млн. лет. Таким образом, возраст отдельных систематических групп ЬТЯ НЕЯУ-К последовательностей может быть рассчитан по формуле Т=Г)/2 х 0,13, где Т - время ретротранспозиций соответствующего мастер-гена, а П средняя дивергенция нуклеотидных последовательностей 1ЛТ1 для данной группы. Результаты подобных расчетов, представленных в Таблице 1, позволили нам установить возможный возраст каждой из выявленных групп ЬТЯ. Впоследствии данные проверяли и уточняли при анализе нуклеотидных последовательностей 1053 индивидуальных нерекомбинантных полноразмерных [ЛИНЕЯУ-К, выявленных в составе недуплицированных локусов опубликованной структуры генома человека Данные по численному составу каждой из групп, полученные в результате поиска в базе банных иСвС, приведены в скобках в соответствующем столбце. Состав, численность и возраст подгрупп, входящих в наиболее «молодую» группу ЬТК-П_Е, дополнительно анализировали в ходе исследований специфичных для генома человека интеграции НЕЯУ-К элементов (детали см в разделе 7).

Таким образом, нам удалось выявить несколько независимых групп в составе семейства НЕЯУ-К, предположительно образованных в результате ретротранспозиций индивидуальных или близкородственных мастер-генов, и рассчитать время их возникновения. Следует, однако,

учитывать предварительный характер большинства выводов, полученных с использованием биоинформационных методов анализа.

Подсемейство Средняя Группа Число ЬТЯ Средняя Возраст

дивергенция (в геноме, по поиску дивергенция Т в млн лет

(%) в ЮС) 0 (%)

21 !_КЬ 10(32) 13,8 53,1

I Ка 7(27) 11,2 43,1

I А 17(77) 11,3 43,5

1 У 12 (84) 10,7 41,2

ПЗ 8(72) 10,4 40,0

I Е 17(43) 8,7 33,5

I И 3 (108) 6,5 25,0

1 Р 7(64) 9,2 35,4

1_Х 5(64) 7,7 29,6

м 5(69) 6,1 23,5

ЬТЯ-Н 5 по 6(21) 8,6 33,1

II V 14(92) 8,2 31,5

11 н 4(4) 6,5 25,0

11 N 6(76) 5,7 21,9

II Т 12(127) 4,2 (3,5*) 16,1(13,5»)

И Ьа 5(21) 2,7 (2,1») 10,4 (8,1*)

II ЬЬ 6(22) 2,5 (1,8») 9,6 (7,2*)

11 1х 10(27) 1,6(1,1») 6,2 (4,2»)

II Ы 6(35) 0,9(1,0») 3,5(3,8»)

Таблица 1 Представленность и предполагаемое время существования в геноме

различных групп ЬТЛ семейства НЕКУ-К

* Представлены результаты дополнительного анализа специфичных для генома человека инсерций 1.ТК элементов (см раздел 7)

С целью экспериментальной проверки результатов систематики I ТЯ семейства НИКУ К, нами был предпринят массированный анализ ЬТТС-содержащих локусов генома человека в сравнении с ортологичными локусами в геномах современных видов приматов Анализ проводили стандартным для исследования участков интеграции ретроэлементов методом ПЦР амплификации с парами уникальных праймеров, соответствующих фланкирующим ТТЛ элементы участкам генома человека Вывод о присутствии или отсутствии 1ЛИ инсерции в ортологичных локусах делают на основании разницы длин получаемых ПЦР продуктов Для конструирования локус-специфических праймеров были использованы структуры фланков 1ЛИ, картированных нами на 19-ой, 21-ой и, частично, 7-ой хромосомах человека В этих случаях нуклеотидные последовательности ТТЯ-фланкирующих областей получали секвенированием клонированных продуктов селективной ПЦР амплификации участков интеграции ЬТЯ, как это описано в разделах 3,4 1 и представлено на рисунке 5 Кроме того

35

для конструирования праймеров использовали участки геномной ДНК человека, окружающие все LTR HERV-K элементы 22-хромосомы и LTR некоторых других локусов, идентифицированных нами при анализе баз данных NCBI и UCSC В общей сложности, филогенетический анализ проведен для 54 участков интеграции индивидуальных LTR, принадлежащих к различным систематическим группам Отдельные примеры результатов ПЦР анализа ортологичных локусов ДНК приматов вместе со схемами строения соответствующих локусов приведены на рисунке 12.

Ч Ш Г Ор Гиб Map Сай М

ltr+

MER4A

LTR

21q22.2 (LTR-IIO)

Ч Ш Г Op Гиб Map Сай М

19ql3.2 (LTR-I_S)

Рис. 12 Примеры локус-специфнческого ПЦР-анализа геномных ДНК различных видов

приматов

В левой части приведены электрофореграммы разделения продуктов амплификации геномных ДНК человека (Ч), шимпанзе (Ш), гориллы (Г), орангутана (Ор), гиббона (Гиб), мартышкообразных (Мар), обезьян Нового Света (Сай - саймири). Символом "М" обозначены маркерные ДНК фрагменты Черной фигурной стрелкой указано положение LTR-coдepжaщeгo ПЦР-фрагмента, белой - фрагмента без ЦП* В правой части указаны названия амплифицируемых локусов I енома человека и названия групп соответствующих LTR На схемах локусов отмечены положения РЭ (прямоугольники с названием РЭ над ними) и используемых ПЦР-праймеров (тонкие стрелки)

Оценку времени интеграции индивидуальных 1ЛП элементов проводили с учетом принятых времен формирования основных эволюционных линий приматов. Так, например, I TR из локуса 2^22 2 (см. рис 12) идентифицирован в образцах геномных ДНК человека, шимпанзе и гориллы, но отсутствует в ортологичных участках геномов орангутана, гиббонов, зеленой мартышки и гамадрила (мартышкообразных или обезьян Старого Света), мармозетки

и саймири (обезьян Нового Света). Следовательно, интеграция данного LTR элемента возникла у общего предка человека и африканских человекообразных обезьян после отделения линии орангутана, т е в интервале от 8 до 13 млн лет назад Рассматриваемый LTR, по своей нуклеотидной последовательности, принадлежит группе И-Т с предполагаемым возрастом мастер-гена 13-16 млн лет (см. габл. 1) По результатам филогенетический анализа локуса 19ql3 2 определено время интеграции другого LTR в промежутке 18-28 млн ле! назад Этот LTR элемент, в свою очередь, принадлежит к группе 1-Е, начавшей формироваться около 33 млн. лет назад (см. рис. 12 и табл. 1).

Подобное рассмотренному выше сопоставление времени интеграции индивидуальных LTR с возрастом соответствующих мастер-генов было проведено для всех 54 локусов. В большинстве случаев отмечено совпадение результатов филогенетического анализа LTR-содержащих локусов с предсказанным возрастом соответствующих систематических групп LTR HERV-K элементов. Таким образом была экспериментально подтверждена разработанная нами систематика LTR и доказано существование в геноме предков современных видов приматов многочисленных транспозиционно активных HERV-K элементов. Результаты проведенного филогенетического анализа позволили нам не только подтвердить наличие нескольких мастер-генов семейства HERV-K, но и выявить длительные периоды ретротранспозиционной активности некоторых из них Так, по результатам ПЦР анализа ортологичных локусов, было выяснено, что времена интеграций отдельных представителей групп П-О и II-V отличаются более чем на 10 млн. лет (см. рис. 13). Первые ретротранспозиции соответствующих HERV-K мастер-генов совпадают, по-видимому, с периодом дивергенции обезьян Старого и Нового Света, т.е. более 28 млн. лет назад. 1 огда как наиболее поздние интеграции LTR П-О обнаружены в локусах 21ql 1 и 21q21 геномов гориллы, шимпанзе и человека, но не орангутана, т.е. в период от 18 до 13 млн лет назад Наиболее вероятным объяснением расхождений во времени интеграций структурно близких копий LTR является сохранение «родительским» HERV-K элементом (мастер-геном) своей ретротранспозиционной активности в течении длительного периода эволюции генома На рисунке 13 периоды транспозиционной активности отдельных групп эндогенных ретровирусов HERV-K соотнесены с эволюционным деревом линий приматов. Реконструированная нами эволюционная динамика распространения в геноме приматов эндогенных ретровирусов семейства HERV-K имеет ряд особенностей Данное семейство является одним из наиболее древних семейств эндогенных ретровирусов человека Косвенным свидетельством длительного существования в геноме HERV-K элементов служит высокий уровень вариабельности нуклеотидных последовательностей LTR из групп I-Ka,b и I-Л. Кроме того нами прямо показано присутствие нескольких I-K LTR инсерций в

1ЫЗ 1-У

Тыс.

1-А

, г'"0 "-Н

1-Р П-У Ом

7-г-гтт

млн лет назад 40

Щ

11-Х

11-Ьа П-Ьс Н-ЬЬ ц-ьа

О <ЗР О О

, У УУ

30

20

10

орангутан

гиббон

обезьяны Старого Света

обезьяны ■Нового Света

Рис. 13 Эволюционная динамика распространения JL.TR НБИУ-К элементов в геноме приматов

В верхней части рисунка на временной шкале указано предполагаемое время возникновения мастер-генов отдельных групп КТО HERV-K. Черными стрелками отмечены группы подсемейства 1ЛТ?.-1, светлыми - группы подсемейства СПС-И. В нижней части рисунка с временной шкалой соотнесено эволюционное дерево приматов, на котором стрелками отмечено время интеграции 1ЛИ элементов в различные локусы генома. Цвет стрелок обозначает принадлежность индивидуального 1ЛИ к группе подсемейства !Л'К-1 (темные стрелки) или ЬТЯ-П (светлые стрелки) Над стрелками приведены названия соответствующих локусов генома или порядковый номер ГЛИ на карте 19-ой хромосомы

ортологичных локусах генома различных приматов, включая такие виды обезьян как мармозетки и капуцины Ранее считалось, что внедрение ШЖУ-К-подобпого ретровируса произошло в геном предка мартышкообразных Обнаруженные нами ЦП* элементы в геномах обезьян Нового Света свидетельствуют о более раннем происхождении семейства НЕЯУ-К По-видимому, родоначальником семейства является эндогенизированный провирус, структурно схожий с консенсусной нуклеотидной последовательностью 1-К группы Заражение экзогенным предшественником клеток зародышевого пути произошло более 45 млн лет назад до расхождения линий обезьян Старого и Нового Света Вместе с тем, семейство НЕИУ-К следует о шести к наиболее активным эндогенным ретровирусам В ходе эволюции генома неоднократно формировались многочисленные мастер-гены, некоторые из которых сохраняли ретропозиционную активность в течении длительного времени В геноме предков обезьян Старого Света активно размножались сразу несколько мастер-генов, что привело к разделению активных ретроэлементов на два подсемейства и отдельные группы В дальнейшем подсемейство ЕТ11-1 постепенно утрачивало свой ретропозиционный потенциал, тогда как мастер-гены второго подсемейства продолжали эволюционировать, формировать новые группы ЬТЯ. Таким образом, размножение НЕЯУ-К элементов является результатом не отдельного ретропозиционного взрыва, но нескольких волн ретротранспозиций, сопровождавших весь период эволюции приматов и обусловленных активностью большой группы родственных эндогенных ретровирусов. Возникновение новых мастер-генов волн ретротранспозиций НЕЯУ-К семейства приблизительно совпадает по времени с эволюционным расхождением основных линий приматов Следует отметить, что последняя из таких ретропозиционных волн охватывает период расхождения предков человека и шимпанзе. Действительно, филогенетический анализ позволил нам выявить в геноме человека несколько инсерций Г.ТК, отсутствующих в ортологичных локусах генома шимпанзе. Таким образом, семейство НЕЯУ-К является единственным из известных к настоящему времени семейств эндогенных ретровирусов, включающих специфичные для генома человека инсерции 1ЛИ элементов.

7. Идентификация инсерций I_.TR НЕ11У-К, специфичных для генома человека.

Определение молекулярно-генетических отличий человека современного вида от близкородственных видов высших человекообразных обезьян имеет более чем тридцатилетнюю историю, но продолжает оставаться одной из центральных проблем современной геномики Непрерывно растущее число данных сравнительно структурных исследований геномов человека и шимпанзе подтверждает гипотезу Кинга и Вильсона, которые, отмечая необычно высокую консервативность структуры генов высших приматов,

считали возможные изменения систем регуляции экспрессии генов наиболее значимыми эволюционными событиями, определившими видообразование человека Действительно, современный анализ показывает более чем 98% идентичность нуклеотидных последовательностей геномов человека и шимпанзе При этом все известные различия в структуре геномов этих видов могут быть классифицированы как следующие

- различия в кариотипе и хромосомной организации. Известно одно слияние ауюсом и 2-3 десятка более мелких хромосомных перестроек.

- различия в числе и экспрессной ной активности генов мультигенных семейств Так сравнительное уменьшение числа или инактивация отдельных генов описаны для семейств, кодирующих обонятельные рецепторы и некоторые поверхностные антш ены.

- различия в числе и геномном распределении диспергированных повторов, в подавляющем большинстве случаев представляющих специфичные для приматов типы ретроэлементов

Ретроэлементы, как это обсуждалось в предыдущих разделах, способны инициировать любое из перечисленных изменений структуры генома Очевидно, что первым шагом на пути к определению эволюционно значимых изменений, связанных с ретропозициями, является идентификация всех видоспецифических ретроэлементов.

Crpaiei ия поиска интеграции регроэлементов, специфичных для человека, может быть основана на компьютерном анализе известных нуклеотидных последовательностей генома, отборе всех копий рассматриваемых ретроэлементов, воссоздании их филогенетических деревьев и определении «эволюционно наиболее молодых» ветвей деревьев Такой подход успешно используется для идентификации недавно возникших субпопуляций высоко представленных ретроэлементов, например Alu иовюров. Вместе с тем компьютерный филогенетический анализ искусствешю ограничивает круг рассматриваемых геномных перестроек, а результаты анализа требуют последующего кропотливого экспериментального подтверждения.

Альтернативная стратегия предполагает прямое экспериментальное сравнение геномной ДНК человека с ДНК приматов. Этот подход позволяет провести исчерпывающий полногеномный анализ участков интеграции ретроэлементов, специфичных для человека, независимо от того, возникли ли они как интеграции молодых или более древних семейств ретроэлементов. До недавнего времени применение стратегии экспериментального сравнения геномных ДНК было ограничено отсутствием адекватных методов анализа. В ходе настоящей работы нами была использована вычитающая гибридизация ДНК в растворе и разработан метод полногеномного сравнительною анализа распределения участков интеграции ретроэлементов в ДНК близкородственных видов.

7.1. Полногеномный поиск специфичных для человека интеграции ЬТЯ НЕЯУ-К элементов.

Разработанный нами метод включает три основные стадии (см рис 14)- а) полногеномную селективную ПЦР амплификацию ДНК человека и шимпанзе, б) вычитающую гибридизацию полученных ампликонов и в) конструирование клонотеки продуктов вычитания с последующим анализом клонированных фрагментов.

На первой стадии проводили селективную амплификацию фрагментов геномной ДНК, прилегающих к Ш или 115 областям I_.TR элементов. Специальный подбор эндонуклеазы рестрикции, условий амплификации и структур целевых нраймеров, соответствующих наиболее консервативным областям последовательности 1ЛИ, обеспечили получение полногеномной фракции фрагментов ДНК, фланкирующих все участки интеграции 1ЛИ НЬЯУ-К. элементов.

На второй с г адии проводили вычитающую гибридизацию полученных ампликонов Вычитающая гибридизация основана на денатурации и последующей длительной совместной ренатурации двух сравниваемых образцов ДНК, Один из образцов, называемый драйвером, берут в значительном молярном избытке относительно второго образца, называемого трейсером. В данном случае драйвером служил ампликон геномной ДНК шимпанзе В ходе совместной ренатурации большинство фрагментов трейсера образуют гетеродуплексы с комплементарными фрагментами драйвера, за исключением специфичных для трейссра фрагментов, формирующих гомодуплексы и представляющие дифференциальные нуклеотидные последовательности. Степень избыточности драйвера и время гибридизации определяют обогащение смеси гомодуплексами трейсер-специфических последовательностей ДНК Обогащенную фракцию клонируют и подвергают последующему анализу До недавнего времени применение вычитающей гибридизации для сравнительного анализа эукариотических ДНК сдерживалось двумя существенными ограничениями- 1) высокой сложностью эукариотической ДНК, не позволяющей создавать концентрацию одноцепочечных трейсер-специфических фрагментов, необходимую для их эффективной ренатурации и 2) необходимостью эффективного отделения фракции трейсерных гомодуплексов от гетеродуплексов и избытка драйверных молекул Разработанный нами метод позволяет преодолеть первое ограничение путем приготовления однотипных ампликонов двух сравниваемых геномов, приводящей к резкому упрощению образцов геномных ДНК С учетом копийносги различных групп ретроэлементов в геноме человека и средней длины получаемых ПЦР-фрагментов ожидаемая сложность ампликонов не превышает 107 нуклеотидов, т е сравнима со сложностью бактериальных геномов. Так, сложность полученных нами ЬТЯ-содержащих ампликонов составляла приблизительно 3x105

Ы 1\ К (Ч Ь1 IV

=fc

к ык к к -=t=^±=tz

ДНК человека _ _________ _ ДНК шимпанзе

СЕЛЕКТИВНАЯ ПЦР-АМ1ШИФИКАЦИЯ I Д

LTR Т LTR

LTR

Рис. 14 Принципиальная схема метода полногеиомного сравнительного анализа распределения LTR элементов в геномах близкородственных видов

Фрагменты геномных ДНК обозначены двойными горизонтальными линиями, общие для обоих геномов LTR элементы и их фрагменты обозначены светлыми прямоугольниками, специфичные для генома человека - черными, овалами разного цвета и размера обозначены нуклеотидные последовательности супрессионных адаптеров.

1

12q24.11 уд -рр2с

«Ж-1-1--D—

i—

9р22.2

АК021596

ВС040679 14q23.3

i ¿UKJ

FNTB

■4

Рис. 15 Выявленные примеры интронного расположения инсерций LTR, специфичных

для генома человека.

Приведены схемы строения грех локусов генома человека. Названия генов приведены над схемами строения Кодирующие экзоны обозначены черными прямоугольниками, нетрансли-руемые области генов - светлыми, направление транскрипции указано стрелками, интронные части тонкими горизонтальными линиями. Положение и направление LTR элементов указано фигурными стрелками Толстой линией выделен межгенный участок локуса 14q23 3

Столь сильное упрощение генома позволяет использовать повышенное соотношение концентраций драйвера и трейсера и обеспечивает общую высокую эффективность проводимой вычитающей гибридизации. Одним из современных методических подходов, преодолевающих второе из упомянутых ограничений, стала селективная вычитающая гибридизация (SSH) Используя принципы SSH метода, мы осуществляли дополнительную подготовку трейсера, разделяя его на две порции и лигируя к каждой из порций разные по составу супрессионные адаптеры В результате, применение нескольких супрессионных адаптеров и двух раундов селективной амплификации обеспечивает высокоэффективный отбор трейсер-специфических последовательностей ДНК после проведения вычитающей гибридизации.

На третьей стадии конструировали ранжированные клонотеки продуктов вычитания и проводили их анализ Использование специально разработанной методики дифференциальной гибридизации с ампликонами геномов человека и шимпанзе позволило существенно повысить эффективность скрининга клонотек Последующий анализ дифференциальных клонов включал секвенирование клонированных фрагментов, их картирование в геноме человека и ПЦР-анализ ортологичных локусов геномов приматов, проводимый для окончательного подтверждения видоспецифичности идентифицированных интеграции LTR элементов

Применение разработанного метода позволило нам успешно осуществить первый, в масштабе целых геномов, экспериментальный поиск различий в интеграциях ретроэлементов между геномами человека и шимпанзе. Было впервые обнаружено свыше 30 интеграций HERV-K, что вдвое увеличило число известных к тому времени внедрений LTR элементов, отличающих геном человека oi генома шимпанзе. Ретротранспозиция одного из обнаруженных нами LTR элементов произошла так недавно, что он не зафиксирован в i еноме и представляет редкий случай истинного инсерционно-делециопного полиморфизма интеграций эндогенных ретровирусов человека Обнаружение многочисленных видоспецифических инсерций LTR подтверждает гипотезу о сохранении эндогенными ретровирусами транспозиционной активности после расхождения эволюционных линий человека и шимпанзе и об участии HERV-K элементов в формировании генома Homo sapiens sapiens Косвенным подтверждением гипотезы о функциональном влиянии видоспецифичных LTR служит эволюционная фиксация 12 выявленных инсерций в интронах известных генов человека (см. отдельные примеры на рисунке 15)

7.2 Отдельные характеристики видоспецифических LTR и содержащих их локусов генома человека.

от_

Рис. 16 Эволюционно-систематические группы ЬТИ, специфичных для генома человека

Приведена фнлограмма 180 ЬТЯ НЕКУ-К элементов генома человека Масштаб уровня дивергенции нуклеотидных последовательностей указан в нижней левой части рисунка. Овалами отмечены эволюционно-систематические группы П-Ьа, П-ЬЬ, Н-1х, и И-Т. Темными кружками отмечены I_.TR, найденные только в геноме человека, светлыми - обнаруженные при ПЦР-анализе в геномах человека и шимпанзе.

Первоначальная характеристика выявленных геномных различий, проведенная в рамках настоящей работы, включала анализ нуклеотидной последовательности LTR элементов, исчерпывающий компьютерный анализ опубликованной структуры генома человека, определения особенностей распределения участков интеграции LTR и особенностей структуры LTR-содержащих локусов генома Первичные структуры выявленных видоспецифических LTR были использованы для формирования консенсусной последовательности и исчерпывающего скрининга геномных баз данных В результате поиска нами было выявлено 128 высокогомологичных LTR генома человека, нидоспецифичность интеграции которых была подтверждена по результатам ПЦР-анализа ортологичных локусов геномов приматов С учетом незавершенности секвенирования генома общее количество интеграций LTR, специфичных для генома человека, было оценено как 150-160 элементов На основании результатов сравнительного анализа структур LTR и ПЦР-анализа было сделано заключение о эволюционно продолжительной и одновременной транспозиционной активности нескольких мастер-генов HERV-K, сохранявшейся после разделения линий человека и шимпанзе. На рисунке 16 приведена бескорневая филограмма LTR элементов, показывающая степень родства и активности мастер-генов наиболее молодых HERV-K Другим важным результатом проведенного анализа специфичных для человека инсерции LTR HERV-K стало картирование 28 из них в интронах известных и кандидатных генов человека Было также выяснено, что ориентация подавляющей часш интронных LTR противоположна направлению транскрипции соответствующих генов. Учитывая известные факты транскрипционной активности LTR HERV-K, возможно предположить участие интронных LTR в регуляции экспрессии генов человека по механизму интерференции РНК Проверка высказанной гипотезы определяет одно из направлений дальнейшего изучения взаимодействия эволюционно молодых LTR с регуляторными системами генома человека В рамках настоящего исследования нами был сделан первый шаг к изучению возможной функциональной роли о LTR в регуляции экспрессии генов человека - проведено определение генного окружения молодых LTR Свыше половины ITR, специфичных для генома человека, локализованы в непосредственной близости (на расстоянии менее 10 т.п.о. от кодирующих областей) от индивидуальных генов Многие из видоспецифических инсерций обнаружены в локусах генома, обогащенных белок-кодирующими генами, известными EST маркерами или участками, кодирующими транскрипты с неизвестными функциями Структура таких локусов и возможные изменения в функционировании, произошедшие благодаря интеграциям LTR, являются перспективными кандидатами для поиска молекулярно-гснетических причин видообразования у приматов и факторов эволюции генома человека.

выводы

1 Сформулирована концепция об интеграциях ретроэлементов, включая ЬТК эндогенных ретровирусов, вызывающих изменения систем регуляции экспрессии генов, как важной молекулярно-генетической причине видообразования у приматов

2 Для подтверждения концепции впервые изучены особенности распределения в геноме человека интеграций эндогенных ретровирусов и проведено полнохромосомное картирование и секвенирование ЬТЯ семейства НЕКЛ'-К на 19-ой и 21-ой хромосомах человека Показан случайный характер распределения П К элементов с различной степенью структурного сходства по длине хромосом Обнаружены резкие отличия в насыщенности хромосом Ы'Я элементами и выявлена тенденция к концентрации 1Л'К в обогащенных генами участках генома Сформулирована гипотеза об эволюционной фиксации случайных интеграций ЦТИ в отдельных I ен-богатых участках генома и выполнении такими ЬТЯ элементами функций альтернативных регуляторов экспрессии генов

3 Проведено определение промоторной активности набора фрагментов 1 .1Я элемента 19-ой хромосомы в системе транзиентной экспрессии репортерно! о гена люциферазы в клеточных линиях человека Доказано эволюционно длительное сохранение ЬТИ. элементами своей промоторной активности Показано существование двух разнонаправленных промоторов в структуре ЦП*, и открыт негативный регулятор транскрипции в и5 области 1ЛТ1 элемента..

4 Для оценки времени интеграции 1,Т11 в различные локусы генома человека проведен исчерпывающий сравнительный анализ полных нуклеотидных последовательностей 88 картированных ЬТЯ элементов. По результатам проведенного анализа реконструированы консенсусные последовательности двух подсемейств и 16 отдельных групп 1ЛТИ, отличающихся по времени возникновения и геноме. Постулировано существование последовательных периодов активной множественной ретротранспозиции 16 различных НЕЯУ-К мастер генов на протяжении последних 45 млн. лет эволюции приматов

5. С целью экспериментальной проверки разработанной систематики семейства НЕЯУ-К и предсказанных периодов ретротранспозиционной активности мастер генов эндогенных ретровирусов проведен локус-спсцифический ПЦР анализ ЬТР-содержащих фрагментов генома человека и ортологичных участков геномной ДНК

современных видов приматов По результатам анализа установлено время интеграции 54 LTR элементов, открыта эволюционно длительная ретропозиционная активность нескольких групп LTR и сформулировано понятие ретропозиционных волн.

6 На основании биоинформационного и экспериментального анализа возраста LTR элементов определена эволюционная динамика распространения эндогенных ретровирусов HERV-K в геноме и показано существование в эволюции генома приматов нескольких продолжительных волн ретротранспозиций не менее 22 активных элементов семейства HERV-K. Предсказано существование обширной труппы LTR, специфичных для генома человека.

7 С целью полной идентификации специфичных для человека LTR элементов разработана серия оригинальных методов и осуществлен полногеномный сравнительный анализ распределения участков интеграции ретроэлементов в ДНК человека и шимпанзе Впервые показана специфичность для генома человека для 67 LTR элементов. На основании результатов биоинформационного анализа опубликованной структуры генома человека и широкомасштабной экспериментальной проверки выявлено и картировано 124 участка интеграции LTR HERV-K элементов, специфичных для генома человека. Составлен каталог генов, окружающих человек-специфические участки интеграции LTR HERV-K элементов

8 Итоги проведенного анализа не противоречат высказанной гипотезе Полученные данные о времени интеграции, регуляторном потенциале и положении в геноме LTR элементов создают необходимую базу для дальнейших исследований функциональных последствий выявленных различий между геномами человека и шимпанзе и окончательного подтверждения гипотезы о роли эндогенных ретровирусов в видообразовании Homo sapiens

Основные результаты диссертационной работы изложены в следующих публикациях:

ОБЧОРЫ

1 Лебедев Ю Б. Эндогенные ретровирусы: Возможная роль в функционировании клеток человека Молекулярная биология 2000, 34(4): 635-645

2 LebedevY Genome-wide search for human specific retroelements 146-163 In. Sverdlov ED (editor) Retroviruses and primate genome evolution ISBN: 1-58706-213-5 Georgetown, TX, USA Landes Bioscience (http.//www.eurekah com). 2004. p 146-163

3 Khodosevich K, Lebedev Y, Sverdlov E Endogenous retroviruses and human evolution Comparative and Functional Genomics, 2002, 3-494-498

С1А1БИ:

4. Lebedev Y В , Belonovitch О S , Zybrova N V , Khil P.P , Kurdyukov S G , Vinogradova T V , Hunsmann G., Sverdlov E D. Differences in HERV-K LTR insertions in orthologous loci of humans and great apes. Gene. 2000. 247: 265-727.

5 Lebedev Y В , Volik S V., Obradovic D , Ermolaeva О D , Ashworth L.K , Lennon G G , Sverdlov E.D. Physical mapping of sequences homologous to an endogenous retrovirus LTR on human chromosome 19. Molecular and General Genetics. 1995. 247(6)' 742-748

6 Lavrentieva I, Khil P , Vinogradova T, Akhmedov A., Lapuk A , Shakhova O., Lebedev Y , Monastyrskaya G , Sverdlov E.D. Subfamilies and nearest-neighbour dendrogram for the LTRs of human endogenous retroviruses HERV-K mapped on human chromosome 19: physical neighbourhood does not correlate with identity level Human Genetics 1998 102-107-116

7 Kurdyukov S.G , Lebedev Y.B., Artamonova I.I., Gorodentseva T.N., Batrak A.V., Mamedov I 7 , Azhikina T L , Legchilina S P , Efimenko I.G., Gardiner K., Sverdlov E.D. Full-sized HERV-K (HML-2) human endogenous retroviral LTR sequences on human chromosome 21 map locations and evolutionary history Gene 2001 273-51-61.

8. Vinogradova Т., Volik S., Lebedev Y , Shevchenko Y., Lavrentyeva I., Khil P , Grzeschik K-H , Ashworth L К , Sverdlov E Positioning of 72 potentially full size LTRs of human endogenous retroviruses HERV-K on the human chromosome 19 map. Occurrences of the LTRs in human gene sites Gene. 1997 199(1-2)-255-264.

9 Mamedov I, Batrak A, Buzdin A, Arzumanyan E, Lebedev Y, Sverdlov ED Genome-wide comparison of differences in the integration sites of interspersed repeats between closely related genomes. Nucleic Acids Research. 2002. 30(14): e71.

10 Buzdin A, Khodosevich K, Mamedov I, Vinogradova T, Lebedev Y, Hunsmann G, Sverdlov E. A Technique for Genome-Wide Identification of Differences in the Interspersed Repeats Integrations between Closely Related Genomes and Its Application to Detection of Human-Specific Integrations of HERV-K LTRs. Genomics. 2002 79: 413-422

11 Volik S , Lebedev Y., Nikolaev L., Shevchenko Y., Vinogradova Т., Kopantzev E., Kolesnik T , Monastyrskaya G., Kunz U, Grzeschik K-H., Ashworth L К, Lennon G , Sverdlov E. Mapping of transcribed sequences on human chromosome 19 DNA Sequencing 1995. 6(1)- 13-26.

12 Mamedov I, Lebedev Y, Sverdlov E. Unusually long Target Site Duplications flanking some of HERV-K LTRs in the human genome. J Gen Virol. 2004. 85(6):1485-1488.

13 Mamedov I, Lebedev Y, Hunsmann G, Khusnutdinova E, Sverdlov E A rare event of insertion polymorphism of a HERV-K LTR in the human genome Genomics. 2004. 84. 596-599

14. Khodosevich K, Lebedev Y, Sverdlov ED. Large-scale determination of the methylation status of retrotransposons in different tissues using a methylation tags approach. Nucleic Acids Research 2004. 32(3): E31.

15 Buzdin A, Ustyugova S, Khodosevich K, Mamedov I, Lebedev Y, Hunsmann G, Sverdlov E Human-specific subfamilies of HERV-K (HML-2) long terminal repeats: three master genes were active simultaneously during branching of hominoid lineages. Genomics. 2003. 81(2)-149-156

16 Буздин A A , Лебедев Ю Б , Свердлов E Д Специфичные для генома человека LTR HFRV-К в интронах генов имеют неслучайную ориентацию относительно направления

транскрипции и, возможно, принимают участие в антисенс-регуляции экспрессии генов Биоорганическая Химия. 2003. 29(1): 103-106.

17 Доманский All, Акопов С Б , Лебедев Ю Б, Николаев Л.Г., Свердлов Е.Д. Энханссрная активность одиночного длинного концевого повтора эндогенного ретровируса человека семейства HERV-K. Биоорганическая Химия. 2002.28(4): 341-345.

18 Nadezhdin Е V , Lebedev Y.B., Glazkova D V, Bornholdt D , Arman I P , Graschik K-H , Hunsmann G , Sverdlov E D. Identification of paraiogous HERV-K LTRs on human chromosomes 3,4, 7 and 11 in regions containing clusters of olfactory receptor genes Molecular Genetics and Genomics. 2001 265: 820-825.

19 Лапук А В , Лебедев Ю Б , Свердлов Е Д Анализ эволюции гибридного человеческого эндогенного ретровируса HERV-K/HERV-H в геноме приматов Доклады Академии Наук 2000. 373(1): 150-152.

20 Артамонова И.И , Городенцева Т.Н., Лебедев Ю Б , Свердлов Е.Д Неслучайное распределение эндогенных ретровирусных регуляторных элементов HERV-K LTR на 22-й хромосоме человека Доклады Академии Наук 2000. 372(3) 401-403.

21. Domansky А N , Kopantzev Е Р , Snezhkov E.V , Lebedev Y В , Leib-Mosch С , Sverdlov Е D Solitary HERV-K LTRs possess bi-directional promoter activity and contain a negative regulatory element in the U5 region FEBS Letters. 2000 472:191-195.

22. Kurdjukov S., Azhikina Т., Lebedev Y., Gardiner К , Sverdlov E Mapping of endogenous retroviral LTRs on Chr21-concentration of the regulatory elements within the gene-enriched 21q22 region Cytogenetics and Cell Genetics. 1999. 86(1): 2-20.

23 Lapuk A.V , Khil P P., Lavrentieva I.V., Lebedev Y.B , Sverdlov E D. A human endogenous retrovirus-like (HERV) LTR formed more than 10 million years ago due to an insertion of HERV-H LTR into the 5' LTR of HERV-K is situated on human chromosomes 10,19 and Y Journal of General Virology 1999 80(4)-835-839.

24 Lavrentieva 1, Broude N E , Lebedev Y., Gottesman 11., Lukyanov S A , Smith C.L , Sverdlov E.D. High polymorphism level of genomic sequences flanking insertion sites of human endogenous retroviral long terminal repeats. FEBS Letters. 1999 443: 341-347

25. Klinov D V , Lagutina I V , Prokhorov V V., Neretina T, Khil P P , Lebedev Y В , Cherny D I, Demin V V , Sverdlov E D High resolution mapping DNAs by R-loop atomic force microscopy Nucleic Acids Research. 1998. 26(20). 4603-10.

26 Akopov S В., Nikolaev L.G., Khil P.P , Lebedev Y В., Sverdlov E.D. Long terminal repeats of human endogenous retrovirus К family (HERV-K) specifically bind host cell nuclear proteins FEBS Letters. 1998. 421: 229-233.

27 Stauffer Y, Theiler G, Sperisen P, Lebedev У, Jongeneel CV. Digital expression profiles of human endogenous retroviral families in normal and cancerous tissues. Cancer Immunology 2004.4. 2-16.

28. Хиль П.П., Лебедев Ю Б., Свердлов Е.Д. Длинный концевой повтор эндогенного ретровируса человека HERV-K в интроне гена ZNF91 Биоорганическая Химия 1998 24(2)- 126-131

29 Хиль П.П., Лебедев Ю.Б., Свердлов Е.Д. Потенциальный ген, специфически экспрессирующийся в мозге человека, расположен на хромосоме 19q 12 рядом с LTR эндогенного человеческого ретровируса HERV-K. Биоорганическая Химия. 1998. 24(1 )• 72-74.

30 Хиль П П , Лебедев Ю Б , Свердлов Е Д Подсемейства длинных концевых повторов (1 TR) человеческих эндогенных ретровирусов типа HERV-K. Биоорганическая Химия. 1997. 356(6): 833-837.

31. Хиль П.П., Костина М Б , Ажикина Т.Л , Колесник Т Б , Лебедев Ю.Б., Свердлов Е Д Структурные характеристики четырех длинных концевых повторов (LTR) эндогенных человеческих рстровирусов и особенности участков их интеграции. Биоорганическая Химия 1997 23(5): 434-440.

32 Лебедев Ю Б., Болорма В., Кжишковска Ю.г, Осташкин А С., Ильин К.В , Мяндина Г И , Пягай П.Э., Иткес А.В. Интеграция генома ретровируса типа D Мейзона-Пфайзера в хромосому человека. Молекулярная Биология. 2002. 36(6). 1012-1014.

33 Глазкова Д В , Надеждин Е В , Виноградова Т В , Лебедев Ю Б , Борнхольд Д , Гржешик К-Х., Арман И П, Свердлов Е Д. Последовательности длинных концевых повторов эндогенного ретровируса человека (LTR HERV-K) короткого плеча хромосомы 7 человека поиск, анализ и определение транскрипционной активности Генетика 2003 39(5): 702-708.

34 Borodin А , Kopant/ev Е, Wagner L., Volik S., Ermolaeva О., Lebedev Y , Monastyrskaya G , Kunz J , Grzeschik K-H., Sverdlov E. An arrayed library enriched in hncDNA corresponding to transcribed sequences of human chromosome 19: preparation and analysis. Genet Anal. 1995. 12(1). 23-31.

35 Batrak A V., Mamedov I Z , Arzumanyan E S , Lebcdcv Y В , Sverdlov E.D Differences in the integration sites of interspersed repeats between closely related genomes Biophysical Journal 2003 84(2): 184-186.

36 Обрадович Д., Бородин A.M , Копанцев Е.П., Вагнер Л.Л., Волик С.В., Ермолаева О Д, Лебедев Ю.Б , Монастырская Г С , Свердлов Е Д. Получение и характеристики упорядоченной библиотеки транскрибируемых последовательностей хромосомы 19 человека из гибридных клеток человек-хомяк. Биоорганическая Химия. 1994. 20(8-9)" 919-931.

37 Buzdin A, Ustyugova S, Gogvadze Е, Lebedev Y, Hunsmann G, Sverdlov E Genome-wide targeted search for human specific and polymorphic LI integrations Human Genetics 2003 112(5-6): 527-33.

Отпечатано в копицентре Москва, Ленинские горы, МГУ, 1 Гуманитарный корпус. www.stprint.ru e-mail: zakaz@stprint.ru тел. 939-3338 Заказ № 58 тираж 100 экз. Подписано в печать 10.09.2004 г.

ДЛЯ ЗАМЕТОК

РНБ Русский фонд

2006-4 4688