Бесплатный автореферат и диссертация по биологии на тему
Методы идентификации инсерционной вариабельности ретроэлементов
ВАК РФ 03.00.03, Молекулярная биология

Содержание диссертации, кандидата биологических наук, Мамедов, Ильгар Зияддинович

СПИСОК СОКРАЩЕНИЙ

ГЛАВА I. РЕТРОЭЛЕМЕНТЫ И ИХ РОЛЬ В ГЕНОМЕ

ПРИМАТОВ. ОБЗОР ЛИТЕРАТУРЫ

Введение

1.1 Ретроэлементы. Деление на группы. Различия в плане строения и механизме размножения. Численность и распространение

1.2 LINE и SINE элементы

1.3 LTR ретротранспозоны

1.4 Ретроэлементы и геном приматов. Их взаимодействие

1.5 Интеграционный полиморфизм ретроэлементов в геномах приматов. Его изучение и использование

Введение Диссертация по биологии, на тему "Методы идентификации инсерционной вариабельности ретроэлементов"

В последнее десятилетие достигнут большой прогресс в определении нуклеотидной последовательности геномов различных эукариотических организмов. К сегодняшнему дню практически полностью определены нуклеотидные последовательности геномов нескольких видов животных, таких как рыба фугу (Fugu rubripes), мышь (Mus musculus), крыса (Rattus Norvegicus) и человек [1-5]. Полученные данные окончательно подтвердили предположение о том, что значительную часть геномов эукариотических организмов составляют мобильные повторяющиеся элементы. Так, в геномах млекопитающих не менее половины всех нуклеотидных последовательностей генома составляют мобильные элементы или их части [2, 4]. В геномах растений доля мобильных элементов существенно больше и может доходить до 90 % [6]. Таким образом, стало очевидно, что мобильные элементы являются неотъемлемой частью геномов всех эукариот и должны оказывать существенное влияние на его структуру и функции.

Мобильные элементы это повторяющиеся последовательности ДНК, способные интегрировать в новое место в геноме внутри одной клетки [7]. Впервые они были описаны Барбарой МакКлинток в геноме кукурузы [8]. Все мобильные элементы можно принципиально разделить на 2 группы: ДНК транспозоны и ретротранспозоны (ретропозоны или ретроэлементы). ДНК транспозоны, в основном, перемещаются, вырезаясь из одного места генома и встраиваясь в другое, при помощи транспозазы (механизм cut and paste). Напротив, ретротранспозоны в процессе своего размножения, (ретротранспозиции или ретропозиции) транскрибируются, переходя в РНК форму, которая затем подвергается действию обратной транскриптазы (РНК зависимой ДНК полимеразы). Образовавшаяся в результате ДНК копия встраивается в новое место генома. В геноме приматов ретроэлементы составляют подавляющее большинство, в то время как ДНК траспозоны - всего лишь около 2 %, поэтому в рамках данной работы последние рассматриваться не будут.

Каким образом взаимодействуют мобильные элементы с геномом? Являются ли они полностью эгоистичной ДНК, опасным мусором, фактором риска и источником постоянной нестабильности в геноме хозяина или мы имеем дело с многовековым симбиозом генов и мобильных элементов?

1.1 Ретроэлементы. Деление на группы. Различия в плане строения и механизме размножения. Численность и распространение

Ретроэлементы (RE - Retroelements) или ретро(транс)позоны, как уже было отмечено ранее, это мобильные повторяющиеся элементы, размножение которых проходит через стадию РНК интермедиатов. Все ретроэлементы можно разделить на 2 большие группы: LTR не содержащие и LTR содержащие ретротранспозоны [7, 9-11]. Эти группы различаются между собой как в плане строения (Рис. 1), так и механизмом размножения. Первая группа включает в себя автономные LINE и неавтономные SINE элементы. LINE элементы (Long Interspersed Nuclear Elements) имеют длину 4-6 тыс. п. о. и содержат, как правило, две открытые рамки считывания (ORF - Open Reading Frame) и поли А последовательность на 3' конце. Нуклеотидная последовательность LINE кодирует эндонуклеазу и обратную транскриптазу, необходимые для их размножения. По краям LINE элементов имеется короткий прямой повтор (SDR — Short Direct Repeat) длиной 7-20 п. о., представляющий собой дупликацию сайта мишени (TSD - Target Site Duplication). Реакция обратной транскрипции РНК LINE элементов происходит в ядре по типу TPRT (Target Primed Reverse Transcription), в ходе которой на РНК матрице синтезируется цепь кДНК, в месте её будущей интеграции. Таким образом, этот класс элементов считается автономным, поскольку белки необходимые для ретротранспозиции кодируются нуклеотидной последовательностью самого элемента.

В отличие от LINE нуклеотидная последовательность SINE (Short Interspersed Nuclear Elements) элементов лишена каких-либо ORF. В её состав входит внутренний промотор для РНК-полимеразы III, поли А последовательность на 3' конце и короткий прямой повтор такой же длины как у LINE по краям. Для размножения они используют ретротранспозиционный аппарат LINE элементов. Наиболее вероятным считается, что SINE элементы ведут своё начало от небольших клеточных РНК, о чём свидетельствует структурная гомология. Так, представители наиболее многочисленного и транспозиционно активного подкласса SINE элементов - Alu гомологичны клеточной 7SL РНК, входящей в состав SRP (Signal Recognition Particles).

Кроме того, в геноме приматов встречаются также химерные ретроэлементы, включающие в себя фрагменты последовательностей LINE или SINE, объединённые, как правило, с какими-либо клеточными РНК и фланкированные общим прямым повтором. Такие элементы были впервые исследованы в нашей лаборатории [12-14]. В геноме приматов обнаружена немногочисленная группа ретроэлементов SINE-R/SVA, имеющих ретровирусное или смешанное происхождение, но размножающихся при помощи ретротранспозиционного аппарата LINE [15]. Все ретроэлементы такого строения являются, по-видимому, продуктами РНК рекомбинации или результатом смены матрицы в процессе обратной транскрипции.

Рг

HERV ОТТпГ> j LTR » gag ро! env

Рг

Одиночный LTR Q LTR >0

Рг

LINE

5'UTR ORF1 ORF2 "JuTR

AAAAO

SINE

Pr t>

AAAAO

Ретропсевдоген [>: з AAAAO exonl exon2 ехопЗ exon4

Рисунок 1. Схема строения различных ретроэлементов. LTR - длинный концевой повтор; gag, pol и env - гомологи основных ретровирусных генов; Рг - промотор; PBS - сайт связывания тРНК затравки; 5' UTR и 3' UTR - нетранслируемые участки; ORF1 и ORF2 -открытые рамки считывания LINE; exonl-ехоп4 - экзоны процессированного псевдогена; белые треугольники обозначают дупликации сайта мишени, образовавшиеся в результате интеграции RE.

Обратная транскриптаза LINE элементов служит также, по-видимому, основным источником многочисленных псевдогенов [16]. Псевдогены, в отличие от соответствующих им генов, как правило, лишены интронов и собственного промотора и представляют собой продукт обратной транскрипции и последующей интеграции в геном клеточных мРНК.

Вторая группа RE - LTR ретропозоны - имеет ряд существенных отличий от группы LINE и SINE элементов. Прежде всего, что следует из названия, все повторяющиеся последовательности, относящиеся к этой группе, имеют на концах LTR (Long Terminal Repeat) или длинные концевые повторы длиной несколько сотен п. о. Они также окружены дупликацией сайта мишени (TSD), длина которой, как правило, составляет 3-6 п. о. Наиболее сложным строением обладают полноразмерные эндогенные ретровирусы (HERV - Human Endogenous Retrovirus), содержащие несколько ORF, представляющих собой гомологи основных ретровирусных генов gag, pol и env (Рис. 1). Другие LTR ретропозоны, как правило, лишены гена env, необходимого для перемещения из одной клетки в другую. Большинство копий LTR ретропозонов представляют собой одиночные LTR, в которых сконцентрированы основные регуляторные последовательности, необходимые для транскрипции и размножения ретровирусов. Обратная транскрипция у всех представителей данной группы происходит в цитоплазме и сходна с таковой экзогенных ретровирусов.

LINE, SINE и LTR ретропозоны составляют соответственно 20 %, 13 % и 8 % от общего количества последовательностей в геноме (Табл. 1). В действительности эти количественные оценки занижены, так как последовательности, возникшие более 200 млн. лет назад настолько сильно дивергировали, что не поддаются распознаванию. В каждом классе RE имеются семейства, которые возникли и были активны достаточно давно, и есть такие, которые возникли относительно недавно. Последние, как правило, специфичны для определённого таксона животных и представлены большим количеством копий в геноме. Так, существуют семейства L1P в составе LINE и семейство Alu в составе SINE, специфичные для генома приматов. Семейство Alu представлено 1000000 копий в человеческом геноме (Табл. 1). В следующих главах классы ретроэлементов будут рассмотрены более подробно.

Таблица 1. Распространение различных классов ретроэлементов в геноме человека.

Класс ретропозонов Число копий (xlO3) Общее число пар оснований (xlO6) Доля генома (%)

LINE 868 558.8 20.42

LI (LINE-1) 516 462.1 16.89

L2 (LINE-2) 315 88.2 3.22

L3 (LINE-3) 37 8.4 0.31

SINE 1558 359.6 13.14

Alu 1090 290.1 10.60

MIR 393 60.1 2.20

MIR3 75 9.3 0.34

LTR 443 227.0 8.29

ERV класс I 112 79.2 2.89

ERV класс II 8 8.5 0.31

ERV класс III 83 39.5 1.44

MaLR 240 99.8 3.65

Прочие RE 3 3.8 0.14

Показано, что ретроэлементы распределены по геному человека неравномерно [2]. Например, на X хромосоме имеется протяжённый участок на 89 % состоящий из разного рода мобильных элементов; в то же время участки локализации генов Нох обеднены мобильными элементами. Показано, что LINE элементы в основном сосредоточены в областях генома, обогащенных нуклеотидами А/Т. Такая особенность распределения LINE возможно связана с тем, что эндонуклеаза этих элементов предпочтительно узнаёт и вносит разрыв в последовательность ТТАААА (см. ниже). С другой стороны представители семейства Alu чаще встречаются в участках генома, обогащенных нуклеотидами Г/Ц. Такое распределение достаточно необычно, учитывая тот факт, что Alu элементы используют для размножения ретротранспозиционную активность LINE. Интеграции Alu, произошедшие сравнительно недавно в процессе эволюции, чаще встречаются в областях генома, обогащенных нуклеотидами А/Т. Вероятно существует неизвестный эволюционный механизм, приводящий к потере интеграций в А/Т обогащенных областях генома.

Заключение Диссертация по теме "Молекулярная биология", Мамедов, Ильгар Зияддинович

выводы

1) Разработан новый метод экспериментального поиска различий в распределении сайтов интеграции ретроэлементов между двумя родственными геномами (DifflR). Разработанный метод DifflR использован для полногеномной идентификации интеграций LTR HERV-K, специфичных для человека.

2) Впервые выявлено 12 инсерций, специфичных для генома человека, и охарактеризовано их геномное окружение. Обнаружен редкий пример внутривидового полиморфизма одиночного LTR.

3) Разработан метод полногеномной идентификации интеграций ретроэлементов, полиморфных внутри одного вида.

4) С использованием разработанного метода была обнаружена 41 полиморфная инсерция Alu Ya5/8 в геноме человека. Высокая эффективность метода подтверждена открытием 18 интеграций Alu элементов, которые невозможно обнаружить при изучении геномных баз данных.

Заключение

Ретроэлементы оказывают существенное влияние на функционирование и эволюцию генома приматов. Несмотря на большое количество полученных за последнее время данных многие особенности механизмов взаимодействия RE с геномом и участия отдельных элементов в процессах, происходящих в клетке всё ещё остаются достаточно слабо изученными. Проявление функциональной активности RE зависит от множества факторов, таких как положение в геноме, тип клеток, состояние хроматина и так далее. Поэтому изучение локализации ретроэлементов в геноме человека, сравнение структурных и функциональных свойств RE, находящихся в ортологичных локусах современных приматов, необходимо для понимания роли ретроэлементов в геноме. Обнаружение полиморфных внутри вида интеграций ретроэлементов также важно для исследования функциональных особенностей RE. Таким образом, изучение межвидовой интеграционной вариабельности, а также внутривидового полиморфизма РЭ, является одним из актуальных направлений современной молекулярной биологии.

ГЛАВА II. РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЯ

Ретроэлементы (RE) могут принимать активное участие в процессах происходящих в клетке, а также имеют важное значение для эволюции генома приматов. Поэтому, изучение распределения ретроэлементов по геному, определение их точного местоположения относительно различных функциональных областей генома, является одной из существенных задач современной геномики. Интеграции RE, произошедшие относительно недавно, обладают, как правило, очень схожей нуклеотидной последовательностью. Поэтому, наиболее рациональным подходом для определения положения инсерций в геноме является картирование уникальных последовательностей, фланкирующих такие инсерции.

2.1 Метод селективной ПЦР амплификация и его применение для полногеномного анализа интеграций ретроэлементов

Метод селективной ПЦР амплификации (Рис. 8) с использованием эффекта супрессии, разработанный в нашей лаборатории [156, 157], был адаптирован для полногеномного анализа интеграций ретроэлементов. Данный метод позволяет получать набор ДНК фрагментов, представляющих собой последовательности, фланкирующие индивидуальные повторяющиеся элементы в исследуемом геноме. Он включает в себя исчерпывающий гидролиз образца геномной ДНК исследуемого генома (например человека или других видов приматов) при помощи эндонуклеазы рестрикции (Рис. 8 а). При этом варьирование размеров рестриктных фрагментов ДНК в пределах 100-2000 пар оснований считается оптимальным. Кроме того, желательно, чтобы в последовательности большинства представителей исследуемого семейства повторяющихся элементов отсутствовал сайт узнавания данной рестриктазой или чтобы такой сайт находился на достаточном удалении от концов RE. Обычно таким условиям удовлетворяют эндонуклеазы рестрикции узнающие последовательность из четырёх нуклеотидов.

На следующем этапе (Рис. 8 б) к полученному геномному гидролизату лигируют супрессионные адаптеры (А1А2), представляющие собой одноцепочечные Г/Ц богатые фрагменты ДНК длиной около 40 нуклеотидов. Для повышения эффективности лигирования адаптер предварительно реассоциируют с небольшим олигонуклеотидом, комплементарным 3' концевой части адаптера.

При последующей достройке заглублённых 3' концов при помощи ДНК полимеразы образуется инвертированный повтор на концах рестриктных фрагментов ДНК. В ходе последующей ПЦР амплификации с праймером, комплементарным «внешней» 5' части адаптера (А1), этот инвертированный повтор формирует внутримолекулярную 40-звенную шпильку и препятствует отжигу праймера А1 (эффект «ГЩР-супрессии»). Фрагменты ДНК образуют структуру похожую на сковородку с ручкой (Рис. 8 в, справа).

R R

JL

Ретроэлемент

ARE а. Рестрикция

А1 А2 шп

Т1 б. Лигирование адаптера и достройка концов

А1 А2

Т2 в. 1ая ПЦР

А2

ARE г. 2ая ПЦР

А2 —KWVM

Нет амплификации

Рисунок 8. Схема метода селективной амплификации последовательностей, фланкирующих RE в геноме. R - сайты узнавания эндоиуклеазой рестрикции, ARE - остаток ретроэлемента. Al, А2, TI и Т2- используемые праймеры.

При добавлении в реакционную смесь праймера, комплементарного последовательности исследуемого ретроэлемента и называемого Т1 праймер (от англ. target), происходит его отжиг и достройка с расплетанием шпильки, в результате чего образуются фрагменты ДНК способные к дальнейшей амплификации (Рис. 8 в, слева). Полученный ампликон подвергают второму раунду амплификации (Рис. 8 г) с использованием вложенной пары праймеров один из которых комплементарен «внутренней» 3' части адаптера (А2), а второй комплементарен концевой части последовательности ретроэлемента (Т2). Таким образом, в результате селективной ПЦР получается набор фрагментов ДНК, фланкирующих ретроэлементы в геноме и несущих на одном конце остаток адаптера (примерно 20 п. о.), а на другом остаток RE. В данной работе методом селективной амплификации были получены и использованы полногеномные фракции последовательностей, фланкирующих интеграции LTR эндогенных ретровирусов семейства HERV-K, а также инсерции AluYa5/8.

2.2 Идентификация LTR семейства HERV-K, отличающих геном человека от генома шимпанзе методом DifflR

Ранее было показано, что среди представителей семейства HERV-К встречаются интеграции, специфичные для генома человека и отсутствующие в ортологичных локусах геномов других приматов, в том числе и ближайших родственников -шимпанзе и горилл [136, 141, 158-160]. Однако, до недавнего времени, полногеномного исследования направленного на выявление одиночных LTR и полноразмерных провирусов семейства HERV-K специфичных для генома человека не проводилось.

Одна из первых работ, направленных на решение такой задачи, была проведена в нашей лаборатории с использованием метода TGDA [161], при участии автора данной работы. Метод позволяет выявлять различия в сайтах интеграции диспергированных повторов между двумя родственными геномами и включает в себя две стадии. На первой стадии проводится селективная амплификация последовательностей, фланкирующих исследуемые повторяющиеся элементы в двух сравниваемых геномах. На второй стадии полученные ампликоны подвергаются вычитающей гибридизации в ходе которой происходит обогащение смеси последовательностями, присутствующими в одном из ампликонов (трейсере), и отсутствующими в другом (драйвере). После вычитающей гибридизации получают ранжированную библиотеку, обогащенную клонами, содержащими вставки фланкирующих последовательностей диспергированных повторов, отличающих один геном от другого. Для выявления интеграций LTR HERV-K специфичных для генома человека в вычитающей гибридизации использовались ампликоны, полученные из геномов человека (в качестве трейсера) и шимпанзе (в качестве драйвера). Эта работа позволила выявить 21 инсерцию специфичную для генома человека.

Для продолжения исследований направленных на выявление интеграций LTR HERV-K специфичных для генома человека в нашей лаборатории был разработан ещё один метод, позволяющий выявлять различия в сайтах интеграции диспергированных повторяющихся элементов для близкородственных геномов. Этот метод получил название DifflR (от англ. Differences in the integration sites of Interspersed Repeats).

Метод включает в себя две стадии: а) конструирование ранжированной библиотеки, содержащей последовательности, фланкирующие повторяющиеся элементы нужного семейства (в данном случае LTR HERV-K), которые получают при помощи селективной ПЦР-амплификации (Рис. 8, рис. 10 а) генома человека и б) дифференциальную гибридизацию библиотеки с радиоактивно мечеными пробами, полученными из двух сравниваемых геномов, в данном случае человека и шимпанзе, с последующим анализом дифференциальных клонов.

Селективная амплификация последовательностей фланкирующих интеграции LTR HERV-K в геномах человека и шимпанзе

В настоящей работе были получены полногеномные наборы фрагментов ДНК, фланкирующие LTR HERV-K в геномах человека и шимпанзе со стороны U5 области LTR. Для исчерпывающего гидролиза образцов геномной ДНК человека {Homo sapiens) и шимпанзе (Pan troglodytes) была использована эндонуклеаза рестрикции Alu I, узнающая тетрануклеотид 5'-АГЦТ-3'. Использование данной эндонуклеазы позволяет получать рестриктные фрагменты ДНК длиной в среднем от 100 до 800 п. о. К полученному набору рестриктных фрагментов лигировали супрессионный адаптер Na21Stl9, предварительно реассоциированный с олигонуклеотидом St20, комплементарным 3' части адаптера. В первом раунде амплификации использовалась смесь олигонуклеотидов LTR-915yF /LTR-927oF (праймер Т1, рис. 8), комплементарных консервативным участкам U5 области LTR HERV-K (Рис. 9), в комбинации с праймером Na21 (А1, рис. 8), комплементарным внешней части лигированного адаптера (Na21Stl9). Смесь праймеров LTR-915yF и LTR-922oF, использованная в первом раунде амплификации, позволяет наиболее полно амплифицировать фланки LTR - представителей различных подсемейств семейства HERV-К, отличающиеся по структуре участка комплементарного данным праймерам.

LTR-915/927 LTR-957 LTR(-31)

LTR h iERV-K из R U5

Рисунок 9. Локализация праймеров, использованных для амплификации LTR HERV-K.

Стрелками обозначена локализация использованных праймеров на консенсусной последовательности LTR HERV-К. U3, R и U5 - структурные области LTR.

Во втором раунде амплификации был применён подход, позволивший разделить ампликон LTR фланков человека на 4 субампликона. Для этого использовали праймер LTR-957F, комплементарный U5 области LTR (Рис. 9), в комбинации с одним из заглублённых (А2) праймеров Stl9-AluI-a, Stl9-AluI-g, Stl9-AluI-t и Stl9-AluI-c. Так, при амплификации с праймером Stl9-AluI-a, получавшийся субампликон обогащался последовательностями LTR фланков, в которых в комплементарной цепи сразу после остатка сайта, узнаваемого рестриктазой Alu I (динуклеотид АГ), следует нуклеотид Т, а при амплификации с праймером Stl9-AluI-g ампликон обогащался фланками, содержащими в аналогичной позиции Ц и так далее. (Рис. 10 б). Приём разделения ампликона на субампликоны был использован нами для исключения артефактов ПЦР-амплификации сложных матриц при клонировании ПЦР продуктов.

Конструирование библиотеки и получение гибридизационных фильтров

Полученные субампликоны, содержащие последовательности, фланкирующие LTR HERV-K в геноме человека, были клонированы в составе векторной ДНК pGEM-T (Рис. 10 в). Затем полученные суббиблиотеки рассевали в 96 луночные микробиологические планшеты. Всего было получено 864 клона (9 планшетов) - по 192 (2 планшета) для суббиблиотек Г, Т и Ц (названия соответствуют нуклеотиду на 3' конце праймера) и 288 (3 планшета) для суббиблиотеки А. Далее ДНК полученных рекомбинантных клонов подвергали ПЦР с праймерами M13For/Rev, соответствующими векторной части рекомбинантных плазмид. Полученные ПЦР фрагменты переносили на нейлоновые мембраны так, что для каждой планшеты были получены по две идентичные мембраны, на которых нанесены ПЦР фрагменты, соответствующие каждому клону библиотеки. Нанесённые на мембрану ДНК фрагменты состояли из следующих частей: внутренняя часть адаптера Stl9 (около 20 п.о.), фланкирующая геномная последовательность (различной длины) уникальная для каждого LTR, остаток самого LTR (около 80 п. о.), а также фрагменты ДНК вектора pGEM-T по краям (по 110-120 п. о.).

Дифференциальная гибридизация

На следующем этапе работы были получены гибридизационные пробы из геномов человека и шимпанзе (Рис. 10 г). Для этого полученные в ходе первого раунда селективной амплификации наборы LTR фланков для обоих геномов реамплифицировали с парой праймеров Stl9/LTR(-31)F (Рис. 9). Первый из них комплементарен внутренней части адаптера, а второй 3' концу консенсусной

РОССИЙСКАЯ ГОСУДЛ1 ПАЯ BKSJIHOTiiiii последовательности LTR. Полученные таким образом ампликоны состояли из фрагментов ДНК имеющих следующую структуру; внутренняя часть адаптера St] 9 (около 20 п. о.), фланкирующая геномная последовательность (различной длины) уникальная для каждого LTR и остаток самого LTR (около 30 п. о,).

Геномная ДНК человека Геномная ДНК шимпанзе

LTR

A LTR-U5

LTR б. 2ая ПЦР а. Селективная амплификация

Л LTR-U5 г. Получение гибридизационных проб I в. Получение гибридизационных фильтров

Stl9 ЧЧ\Ч\Ч1 тз

Stl9 © ©о © © © ©о © © о ® © © © © © © © © ©

Проба ДНК человека Проба ДНК шимпанзе д. Дифференциальная гибридизация I е. Отбор дифференциальных клонов, определение нуклеотидной последовательности I

Картирование, подбор праймеров и локус-специфическая ПЦР

Рисунок 10. Общ;)и схема метода DifflR. ALTR-U5 — остаток LTR. Т2 - праймер LTR-957, Stl9-alu(N) - набор заглублённых праймеров, ТЗ -праймер LTR(-3I). Волнистыми линиями обзначены последовательности, фланкирующие интеграции HERV-К в геноме шимпанзе, прямыми линиями - 11 геноме человека.

Сложность полученных ампликонов (т. е. суммарную длину всех ДНК фрагментов различной нуклеотидной последовательности) можно рассчитать, учитывая количество LTR HERV-K в геноме и средний размер фланкирующего LTR фрагмента, который составляет примерно 250 п.о, (т.к. использовалась рестриктаза узнающая тетрануклеотид, то частота встречаемости его равна 44 = 256). 2000*(250+20+30) — 6* 105, что составляет около 10 % среднего бактериального генома. Такая сравнительно небольшая сложность позволяет использовать ампликон напрямую, в качестве гибридизапионной пробы. Дифференциальная гибридизация проводилась при строгих условиях (смотри методы). Одна из двух идентичных мембран, с нанесёнными LTR фланками человеческого генома, гибридизовалась с пробой, полученной из генома человека, а вторая - с пробой, полученной из генома шимпанзе. При этом, фрагменты ДНК, как входящие в состав пробы, так и нанесённые на мембрану имели общие части (внутренняя часть адаптера длиной около 20 п. о. и остаток 3' копна LTR около 30 п. о.). Было показано, что наличие таких общих частей приводит к перекрестной гибридизации, в результате чего появляются ложно позитивные сигналы. Для снижения количества ложно позитивных сигналов в гибридизационную смесь были добавлены в 200-кратном молярном избытке немеченые олигонуклеотиды, комплементарные вышеуказанным общим частям. Как показали результаты дальнейшего анализа, такой подход позволил существенно снизить число ложно позитивных сигналов.

1 А' 12 а

• *

• •/ # I

• * / h * « * * ♦ * Н

1 Б" 12 а ШМ

• 7 ^ •

Г»« # • f • * t #f •

Рисунок 11. Примеры результатов дифференциальной гибридизации. Л. С пробой полученной из геномной ДНК человека. Б. С пробой полученной из геномной ДНК шимпанзе. Стрелками обозначены примеры отобранных дифференциальных клонов.

Пример результатов дифференциальной гибридизации приведён на рисунке 11. Последовательности, фланкирующие LTR HERV-K специфичные для генома человека давали интенсивный положительный сигнал при гибридизации с пробой, полученной из генома человека (Рис. 11 А), и существенно менее интенсивный сигнал с пробой, полученной из генома шимпанзе (Рис. 11 Б). При этом в ортологичном локусе генома шимпанзе, фланкирующая последовательность — преинтеграционный сайт -присутствует, но поскольку LTR HERV-K в ортологичном локусе отсутствует, то такая последовательность не амплифицируется в ходе селективной ПЦР и в гибридизационную пробу не попадает.

По результатам гибридизации для дальнейшего анализа было отобрано 40 клонов, дающих строго дифференциальный сигнал.

Определение нуклеотидной последовательности отобранных клонов и анализ видоспецифичности интеграций LTR методом локус-специфической ПЦР

На следующем этапе была установлена нуклеотидная последовательность вставок плазмид дифференциальных клонов. Все вставки включали в себя остаток LTR HERV-K, фланкирующую последовательность различной длины и остаток адаптера (олигонуклеотид Stl9). Часть клонов содержали идентичные по нуклеотидной последовательности вставки: 7 последовательностей были представлены двумя клонами каждая и 1 последовательность тремя клонами. Таким образом, 40 независимых клонов соответствовали 31 уникальной нуклеотидной последовательности. Далее было проведено картирование полученных последовательностей в геноме человека с использованием ресурсов NCBI BLAST (http://www.ncbi.nlm.nih.gov/BLAST') и UCSC Human Genome Browser (http://genome.ucsc.edu/goldenPath/hgTracks.html'), и подтверждено, что все секвенированные фрагменты являются геномными фланками инсерций LTR HERV-K элементов. Одна последовательность ДНК не имела гомологов в геномных базах данных. Возможно, это было связано с тем, что геномные базы данных содержали недостаточно полную информацию о нуклеотидной последовательности генома человека. Ещё 7 последовательностей, были исключены из дальнейшего анализа, так как представляли собой фланки LTR, для которых видоспецифичность интеграции была определена другими авторами. 5 из них были охарактеризованы в опубликованных работах как специфичные для генома человека [141, 158, 160, 161]. Оставшиеся 23 интеграции LTR HERV-K были подвергнуты дальнейшему анализу методом локус-специфической ПЦР. Для этого были подобраны и синтезированы пары праймеров, комплементарные уникальным последовательностям генома, окружающим каждый исследуемый LTR. На этом этапе 4 LTR элемента были исключены из дальнейшего анализа, так как находились в окружении ретроэлементов других семейств, представленных в геноме большим количеством очень близких по нуклеотидной последовательности копий. Такое геномное окружение делает невозможным подбор уникальных праймеров к участкам фланкирующим LTR. Для LTR 2а4-а12, входящего в состав полноразмерного провируса, в пару к геномным праймерам, комплементарным последовательности фланкирующей 3' LTR, использовался праймер, комплементарный консервативной области гена env эндогенного ретровируса. Подобранные пары праймеров применялись для локус-специфической ПЦР в которой в качестве матриц использовались образцы геномной ДНК 2-х индивидуумов человека (Homo sapiens), 2-х шимпанзе (Pan troglodytes) и 2-х горилл (Gorilla gorilla). По длине получающегося ПЦР продукта можно судить о присутствии или отсутствии интеграции LTR в данном локусе генома исследуемого вида приматов. Примеры геномных ПЦР представлены на рисунке 12.

Для трёх локусов не удалось однозначно определить видоспецифичность интеграции LTR, либо потому что подобранные праймеры не позволяли получать уникальный ПЦР фрагмент, либо же такой продукт получался только на человеческом ДНК геноме и не образовывался при использовании ДНК других приматов в качестве матриц (LTR С2Ь8 и LTR Т1Ь7 в таблице 5). В последнем случае отсутствие ПЦР продуктов при использовании геномной ДНК шимпанзе и горилл может объясняться сильной дивергенцией участка отжига праймеров или значительными делециями в данном геномном локусе, приводящими к полной потере сайта отжига праймера. По той же причине эти сигналы детектируются как дифференциальные при гибридизации с пробами, полученными из геномов человека и шимпанзе. Из оставшихся 16-ти индивидуальных LTR 12 охарактеризованы как специфичные для генома человека, а 4 встречались в ортологичных локусах горилл и шимпанзе. Результаты ПЦР анализа ортологичных локусов геномов приматов, а также некоторые другие характеристики исследованных LTR, приведены в таблице 5. Нуклеотидные последовательности вставок клонов, соответствующих интеграциям LTR, специфичным для генома человека, были депонированы в геномную базу данных NCBI под номерами AF493416-AF493426. м

LTR С2е8 1.5 т.п.о. "1 т.п.о. * 500 п.о.

LTR G2hll

4 1.5 т.п.о. 1 Т.П.О. 500 п.о. М

LTR G2el2 1.5 т.п.о.

41 т.п.о. ^ 500 п.о.

Рисунок 12. Примеры результатов локус-спецнфнческой ПЦР. А. Тёмные стрелки слева от электрофореграммы показывают полосу, соответствующую ПЦР продукту, содержащему LTR, а белые - LTR не содержащему продукту. 1,2 — образцы геномной ДНК человека, 3, 4 -шимпанзе, 5, 6 — горилл, М — маркёр длин ДНК. Б. Локализация праймеров, используемых для локус-специфической ПЦР. Сверху - ПЦР продукт, содержащий LTR, снизу - не содержащий LTR.

Библиография Диссертация по биологии, кандидата биологических наук, Мамедов, Ильгар Зияддинович, Москва

1. Pennisi, Е. (2003) Evolution. Chimp genome draft online. Science. 302, 1876.

2. Lander, E.S., Linton, L.M., Birren, В., Nusbaum, C., Zody, M.C., Baldwin, J., Devon, K., Dewar, K., Doyle, M., FitzHugh, W. et al. (2001) Initial sequencing and analysis of the human genome. Nature. 409, 860-921.

3. Waterston, R.H., Lindblad-Toh, K., Birney, E., Rogers, J., Abril, J.F., Agarwal, P., Agarwala, R., Ainscough, R., Alexandersson, M., An, P. et al. (2002) Initial sequencing and comparative analysis of the mouse genome. Nature. 420, 520-62.

4. Aparicio, S., Chapman, J., Stupka, E., Putnam, N., Chia, J.M., Dehal, P., Christoffels, A., Rash, S., Hoon, S., Smit, A. et al. (2002) Whole-genome shotgun assembly and analysis of the genome of Fugu rubripes. Science. 297, 1301-10.

5. SanMiguel, P., Tikhonov, A., Jin, Y.K., Motchoulskaia, N., Zakharov, D., Melake-Berhan, A., Springer, P.S., Edwards, K.J., Lee, M., Avramova, Z. et al. (1996) Nested retrotransposons in the intergenic regions of the maize genome. Science. 274, 765-8.

6. Kazazian, H.H., Jr. (2004) Mobile elements: drivers of genome evolution. Science. 303, 1626-32.

7. McClintock, B. (1956) Controlling elements and the gene. Cold Spring Harb Symp Quant Biol. 21, 197-216.

8. Bowen, N.J. and Jordan, I.K. (2002) Transposable elements and the evolution of eukaryotic complexity. Curr Issues Mol Biol. 4, 65-76.

9. Buzdin, A. A. (2004) Retroelements and formation of chimeric retrogenes. Cell Mol Life Sci. 61, 2046-59.

10. Buzdin, A., Ustyugova, S., Gogvadze, E., Vinogradova, Т., Lebedev, Y. and Sverdlov, E. (2002) A new family of chimeric retrotranscripts formed by a full copy of U6 small nuclear RNA fused to the 3' terminus of 11. Genomics. 80, 402-6.

11. Ostertag, E.M., Goodier, J.L., Zhang, Y. and Kazazian, H.H., Jr. (2003) SVA elements are nonautonomous retrotransposons that cause disease in humans. Am J Hum Genet. 73, 1444-51.

12. Esnault, C., Maestre, J. and Heidmann, T. (2000) Human LINE retrotransposons generate processed pseudogenes. Nat Genet. 24, 363-7.

13. Smit, A.F. (1999) Interspersed repeats and other mementos of transposable elements in mammalian genomes. Curr Opin Genet Dev. 9, 657-63.

14. Malik, H.S., Burke, W.D. and Eickbush, Т.Н. (1999) The age and evolution of non-LTR retrotransposable elements. Mol Biol Evol. 16, 793-805.

15. Curcio, M.J. and Belfort, M. (1996) Retrohoming: cDNA-mediated mobility of group II introns requires a catalytic RNA. Cell. 84, 9-12.

16. Cavalier-Smith, T. (1991) Intron phylogeny: a new hypothesis. Trends Genet. 7, 145-8.

17. Smit, A.F. (1996) The origin of interspersed repeats in the human genome. Curr Opin Genet Dev. 6, 743-8.

18. Smit, A.F., Toth, G., Riggs, A.D. and Jurka, J. (1995) Ancestral, mammalian-wide subfamilies of LINE-1 repetitive sequences. J Mol Biol. 246, 401-417.

19. Kazazian, H.H., Jr. and Goodier, J.L. (2002) LINE drive, retrotransposition and genome instability. Cell. 110,277-80.

20. Ostertag, E.M. and Kazazian, H.H., Jr. (2001) Biology of mammalian LI retrotransposons. Annu Rev Genet. 35, 501-38.

21. Brouha, В., Schustak, J., Badge, R.M., Lutz-Prigge, S., Farley, A.H., Moran, J.V. and Kazazian, H.H., Jr. (2003) Hot Lis account for the bulk of retrotransposition in the human population. Proc Natl Acad Sci USA. 100, 5280-5.

22. Skowronski, J. and Singer, M.F. (1986) The abundant LINE-1 family of repeated DNA sequences in mammals: genes and pseudogenes. Cold Spring Harb Symp Quant Biol. 51 Pt 1, 457-64.

23. Boissinot, S., Chevret, P. and Furano, A.V. (2000) LI (LINE-1) retrotransposon evolution and amplification in recent human history. Mol Biol Evol. 17, 915-28.

24. Swergold, G.D. (1990) Identification, characterization, and cell specificity of a human LINE-1 promoter. Mol Cell Biol. 10, 6718-29.

25. Mizrokhi, L.J., Georgieva, S.G. and Ilyin, Y.V. (1988) jockey, a mobile Drosophila element similar to mammalian LINEs, is transcribed from the internal promoter by RNA polymerase II. Cell. 54, 685-91.

26. Kurose, K., Hata, K., Hattori, M. and Sakaki, Y. (1995) RNA polymerase III dependence of the human LI promoter and possible participation of the RNA polymerase II factor YY1 in the RNA polymerase III transcription system. Nucleic Acids Res. 23, 3704-9.

27. Becker, K.G., Swergold, G.D., Ozato, K. and Thayer, R.E. (1993) Binding of the ubiquitous nuclear transcription factor YY1 to a cis regulatory sequence in the human LINE-1 transposable element. Hum Mol Genet. 2, 1697-702.

28. Hyde-DeRuyscher, R.P., Jennings, E. and Shenk, T. (1995) DNA binding sites for the transcriptional activator/repressor YY1. Nucleic Acids Res. 23, 4457-65.

29. Mathias, S.L. and Scott, A.F. (1993) Promoter binding proteins of an active human LI retrotransposon. Biochem Biophys Res Commun. 191, 625-32.

30. Minakami, R., Kurose, K., Etoh, K., Furuhata, Y., Hattori, M. and Sakaki, Y. (1992) Identification of an internal cis-element essential for the human LI transcription and a nuclear factor(s) binding to the element. Nucleic Acids Res. 20, 3139-45.

31. Yang, N., Zhang, L., Zhang, Y. and Kazazian, H.H., Jr. (2003) An important role for RUNX3 in human LI transcription and retrotransposition. Nucleic Acids Res. 31, 4929-40.

32. Tchenio, Т., Casella, J.F. and Heidmann, T. (2000) Members of the SRY family regulate the human LINE retrotransposons. Nucleic Acids Res. 28, 411-5.

33. Athanikar, J.N., Badge, R.M. and Moran, J.V. (2004) A YY1-binding site is required for accurate human LINE-1 transcription initiation. Nucleic Acids Res. 32, 3846-55.

34. Speek, M. (2001) Antisense promoter of human LI retrotransposon drives transcription of adjacent cellular genes. Mol Cell Biol. 21, 1973-85.

35. Nigumann, P., Redik, K., Matlik, K. and Speek, M. (2002) Many human genes are transcribed from the antisense promoter of LI retrotransposon. Genomics. 79, 628-34.

36. Hohjoh, H. and Singer, M.F. (1996) Cytoplasmic ribonucleoprotein complexes containing human LINE-1 protein and RNA. Embo J. 15, 630-9.

37. Asch, H.L., Eliacin, E., Fanning, T.G., Connolly, J.L., Bratthauer, G. and Asch, B.B. (1996) Comparative expression of the LINE-1 p40 protein in human breast carcinomas and normal breast tissues. Oncol Res. 8, 239-47.

38. Bratthauer, G.L., Cardiff, R.D. and Fanning, T.G. (1994) Expression of LINE-1 retrotransposons in human breast cancer. Cancer. 73, 2333-6.

39. Kolosha, V.O. and Martin, S.L. (2003) High-affinity, non-sequence-specific RNA binding by the open reading frame 1 (ORF1) protein from long interspersed nuclear element 1 (LINE-1). J Biol Chem. 278, 8112-7.

40. Martin, S.L., Branciforte, D., Keller, D. and Bain, D.L. (2003) Trimeric structure for an essential protein in LI retrotransposition. Proc Natl Acad Sci USA. 100, 13815-20.

41. Martin, S.L. and Bushman, F.D. (2001) Nucleic acid chaperone activity of the ORF1 protein from the mouse LINE-1 retrotransposon. Mol Cell Biol. 21, 467-75.

42. Moran, J.V., Holmes, S.E., Naas, T.P., DeBerardinis, R.J., Boeke, J.D. and Kazazian, H.H., Jr. (1996) High frequency retrotransposition in cultured mammalian cells. Cell. 87, 91727.

43. Feng, Q., Moran, J.V., Kazazian, H.H., Jr. and Boeke, J.D. (1996) Human LI retrotransposon encodes a conserved endonuclease required for retrotransposition. Cell. 87, 905-16.

44. Mathias, S.L., Scott, A.F., Kazazian, H.H., Jr., Boeke, J.D. and Gabriel, A. (1991) Reverse transcriptase encoded by a human transposable element. Science. 254, 1808-10.

45. Goodier, J.L., Ostertag, E.M., Engleka, K.A., Seleme, M.C. and Kazazian, H.H., Jr. (2004) A potential role for the nucleolus in LI retrotransposition. Hum Mol Genet. 13, 10418.

46. Cost, G.J., Feng, Q., Jacquier, A. and Boeke, J.D. (2002) Human LI element target-primed reverse transcription in vitro. Embo J. 21, 5899-910.

47. Luan, D.D., Korman, M.H., Jakubczak, J.L. and Eickbush, Т.Н. (1993) Reverse transcription of R2Bm RNA is primed by a nick at the chromosomal target site: a mechanism for non-LTR retrotransposition. Cell. 72, 595-605.

48. Cost, G.J. and Boeke, J.D. (1998) Targeting of human retrotransposon integration is directed by the specificity of the LI endonuclease for regions of unusual DNA structure. Biochemistry. 37, 18081-93.

49. Cost, G.J., Golding, A., Schlissel, M.S. and Boeke, J.D. (2001) Target DNA chromatinization modulates nicking by LI endonuclease. Nucleic Acids Res. 29, 573-7.

50. Morrish, T.A., Gilbert, N., Myers, J.S., Vincent, B.J., Stamato, T.D., Taccioli, G.E., Batzer, M.A. and Moran, J.V. (2002) DNA repair mediated by endonuclease-independent LINE-1 retrotransposition. Nat Genet. 31, 159-65.

51. Jurka, J. (1997) Sequence patterns indicate an enzymatic involvement in integration of mammalian retroposons. Proc Natl Acad Sci USA. 94, 1872-7.

52. Wei, W., Gilbert, N., Ooi, S.L., Lawler, J.F., Ostertag, E.M., Kazazian, H.H., Boeke, J.D. and Moran, J.V. (2001) Human LI retrotransposition: cis preference versus trans complementation. Mol Cell Biol. 21, 1429-39.

53. Dewannieux, M., Esnault, C. and Heidmann, T. (2003) LINE-mediated retrotransposition of marked Alu sequences. Nat Genet. 35, 41-8.

54. Farley, A.H., Luning Prak, E.T. and Kazazian, H.H., Jr. (2004) More active human LI retrotransposons produce longer insertions. Nucleic Acids Res. 32, 502-10.

55. Ostertag, E.M. and Kazazian, H.H., Jr. (2001) Twin priming: a proposed mechanism for the creation of inversions in LI retrotransposition. Genome Res. 11, 2059-65.

56. Jurka, J., Zietkiewicz, E. and Labuda, D. (1995) Ubiquitous mammalian-wide interspersed repeats (MIRs) are molecular fossils from the mesozoic era. Nucleic Acids Res. 23, 170-5.

57. Smit, A.F. and Riggs, A.D. (1995) MIRs are classic, tRNA-derived SINEs that amplified before the mammalian radiation. Nucleic Acids Res. 23, 98-102.

58. Gilbert, N. and Labuda, D. (2000) Evolutionary inventions and continuity of CORE-SINEs in mammals. J Mol Biol. 298, 365-77.

59. Houck, C.M., Rinehart, F.P. and Schmid, C.W. (1979) A ubiquitous family of repeated DNA sequences in the human genome. J Mol Biol. 132, 289-306.

60. Batzer, M.A. and Deininger, P.L. (2002) Alu repeats and human genomic diversity. Nat Rev Genet. 3, 370-9.

61. Ullu, E. and Tschudi, C. (1984) Alu sequences are processed 7SL RNA genes. Nature. 312,171-2.

62. Weiner, A.M. (1980) An abundant cytoplasmic 7S RNA is complementary to the dominant interspersed middle repetitive DNA sequence family in the human genome. Cell. 22, 209-18.

63. Jurka, J. and Milosavljevic, A. (1991) Reconstruction and analysis of human Alu genes. J MolEvol. 32,105-21.

64. Jurka, J. and Smith, T. (1988) A fundamental division in the Alu family of repeated sequences. Proc Natl Acad Sci USA. 85, 4775-8.

65. Willard, C., Nguyen, H.T. and Schmid, C.W. (1987) Existence of at least three distinct Alu subfamilies. J MolEvol. 26, 180-6.

66. Slagel, V., Flemington, E., Traina-Dorge, V., Bradshaw, H. and Deininger, P. (1987) Clustering and subfamily relationships of the Alu family in the human genome. Mol Biol Evol. 4, 19-29.

67. Batzer, M.A., Deininger, P.L., Hellmann-Blumberg, U., Jurka, J., Labuda, D., Rubin, C.M., Schmid, C.W., Zietkiewicz, E. and Zuckerkandl, E. (1996) Standardized nomenclature for Alu repeats. J Mol Evol. 42, 3-6.

68. Matera, A.G., Hellmann, U. and Schmid, C.W. (1990) A transpositionally and transcriptionally competent Alu subfamily. Mol Cell Biol. 10, 5424-32.

69. Matera, A.G., Hellmann, U., Hintz, M.F. and Schmid, C.W. (1990) Recently transposed Alu repeats result from multiple source genes. Nucleic Acids Res. 18, 6019-23.

70. Batzer, M.A. and Deininger, P.L. (1991) A human-specific subfamily of Alu sequences. Genomics. 9,481-7.

71. Deininger, P.L. and Slagel, V.K. (1988) Recently amplified Alu family members share a common parental Alu sequence. Mol Cell Biol. 8, 4566-9.

72. Jurka, J. (1993) A new subfamily of recently retroposed human Alu repeats. Nucleic Acids Res. 21, 2252.

73. Hutchinson, G.B., Andrew, S.E., McDonald, H., Goldberg, Y.P., Graham, R., Rommens, J.M. and Hayden, M.R. (1993) An Alu element retroposition in two families with Huntington disease defines a new active Alu subfamily. Nucleic Acids Res. 21, 3379-83.

74. Price, A.L., Eskin, E. and Pevzner, P.A. (2004) Whole-genome analysis of Alu repeat elements reveals complex evolutionary history. Genome Res. 14, 2245-52.

75. Kajikawa, M. and Okada, N. (2002) LINEs mobilize SINEs in the eel through a shared 3' sequence. Cell. Ill, 433-44.

76. Опо, М., Kawakami, M. and Takezawa, Т. (1987) A novel human nonviral retroposon derived from an endogenous retrovirus. Nucleic Acids Res. 15, 8725-37.

77. Zhu, Z.B., Jian, B. and Volanakis, J.E. (1994) Ancestry of SINE-R.C2 a human-specific retroposon. Hum Genet. 93, 545-51.

78. Li, W.H., Gu, Z., Wang, H. and Nekrutenko, A. (2001) Evolutionary analyses of the human genome. Nature. 409, 847-9.

79. Jurka, J. (2000) Repbase update: a database and an electronic journal of repetitive elements. Trends Genet. 16,418-20.

80. Smit, A.F. (1993) Identification of a new, abundant superfamily of mammalian LTR-transposons .Nucleic Acids Res. 21, 1863-72.

81. Sverdlov, E.D. (1998) Perpetually mobile footprints of ancient infections in human genome. FEBS Lett. 428,1-6.

82. Lower, R., Lower, J. and Kurth, R. (1996) The viruses in all of us: characteristics and biological significance of human endogenous retrovirus sequences. Proc Natl Acad Sci USA. 93, 5177-84.

83. Harris, J.M., Mcintosh, E.M. and Muscat, G.E. (2000) Expression and cytoplasmic localisation of deoxyuridine triphosphate pyrophosphatase encoded by a human endogenous retrovirus. Arch Virol. 145,353-63.

84. Magin, C., Lower, R. and Lower, J. (1999) cORF and RcRE, the Rev/Rex and RRE/RxRE homologues of the human endogenous retrovirus family HTDV/HERV-K. J Virol. 73, 9496-507.

85. Schon, U., Seifarth, W., Baust, C., Hohenadl, C., Erfle, V. and Leib-Mosch, C. (2001) Cell type-specific expression and promoter activity of human endogenous retroviral long terminal repeats. Virology. 279, 280-91.

86. Domansky, A.N., Kopantzev, E.P., Snezhkov, E.V., Lebedev, Y.B., Leib-Mosch, C. and Sverdlov, E.D. (2000) Solitary HERV-K LTRs possess bi-directional promoter activity and contain a negative regulatory element in the U5 region. FEBS Lett. 472, 191-5.

87. Mager, D. and Medstrand, P. (2002) Retroviral Repeat Sequences. In Gardiner, K. (ed.), Encyclopedia of the Human Genome. Nature Publishing Group, http://www.ehgonline.net.

88. Hughes, J.F. and Coffin, J.M. (2004) Human endogenous retrovirus К solo-LTR formation and insertional polymorphisms: implications for human and viral evolution. Proc Natl Acad Sci USA. 101, 1668-72.

89. Lin, J.H. and Levin, H.L. (1997) Self-primed reverse transcription is a mechanism shared by several LTR-containing retrotransposons. Rna. 3, 952-3.

90. Hindmarsh, P. and Leis, J. (1999) Retroviral DNA integration. Microbiol Mol Biol Rev. 63, 836-43, table of contents.

91. Giles, K.E., Caputi, M. and Beemon, K.L. (2004) Packaging and reverse transcription of snRNAs by retroviruses may generate pseudogenes. Rna. 10, 299-307.

92. Tristem, M. (2000) Identification and characterization of novel human endogenous retrovirus families by phylogenetic screening of the human genome mapping project database. J Virol. 74,3715-30.

93. Costas, J. and Naveira, H. (2000) Evolutionary history of the human endogenous retrovirus family ERV9. Mol Biol Evol. 17, 320-30.

94. Howard, B.H. and Sakamoto, K. (1990) Alu interspersed repeats: selfish DNA or a functional gene family? New Biol. 2, 759-70.

95. Or gel, L.E. and Crick, F.H. (1980) Selfish DNA: the ultimate parasite. Nature. 284, 604-7.

96. Perepelitsa-Belancio, V. and Deininger, P. (2003) RNA truncation by premature polyadenylation attenuates human mobile element activity. Nat Genet. 35, 363-6.

97. Blond, J.L., Beseme, F., Duret, L., Bouton, O., Bedin, F., Perron, H., Mandrand, B. and Mallet, F. (1999) Molecular characterization and placental expression of HERV-W, a new human endogenous retrovirus family. J Virol. 73, 1175-85.

98. Andersson, A.C., Svensson, A.C., Rolny, C., Andersson, G. and Larsson, E. (1998) Expression of human endogenous retrovirus ERV3 (HERV-R) mRNA in normal and neoplastic tissues. IntJ Oncol. 12, 309-13.

99. Jordan, I.K., Rogozin, I.B., Glazko, G.V. and Koonin, E.V. (2003) Origin of a substantial fraction of human regulatory sequences from transposable elements. Trends Genet. 19, 68-72.

100. Mager, D.L., Hunter, D.G., Schertzer, M. and Freeman, J.D. (1999) Endogenous retroviruses provide the primary polyadenylation signal for two new human genes (HHLA2 and HHLA3). Genomics. 59,255-63.

101. Goodchild, N.L., Wilkinson, D.A. and Mager, D.L. (1992) A human endogenous long terminal repeat provides a polyadenylation signal to a novel, alternatively spliced transcript in normal placenta. Gene. 121, 287-94.

102. Hamdi, H.K., Nishio, H., Tavis, J., Zielinski, R. and Dugaiczyk, A. (2000) Alu-mediated phylogenetic novelties in gene regulation and development. J Mol Biol. 299, 931-9.

103. Rubin, C.M., VandeVoort, C.A., Teplitz, R.L. and Schmid, C.W. (1994) Alu repeated DNAs are differentially methylated in primate germ cells. Nucleic Acids Res. 22, 5121-7.

104. Long, Q., Bengra, C., Li, C., Kutlar, F. and Tuan, D. (1998) A long terminal repeat of the human endogenous retrovirus ERV-9 is located in the 5' boundary area of the human beta-globin locus control region. Genomics. 54, 542-55.

105. Harris, J.M., Mcintosh, E.M. and Muscat, G.E. (1999) Structure/function analysis of a dUTPase: catalytic mechanism of a potential chemotherapeutic target. J Mol Biol. 288, 27587.

106. Berkhout, В., Jebbink, M. and Zsiros, J. (1999) Identification of an active reverse transcriptase enzyme encoded by a human endogenous HERV-K retrovirus. J Virol. 73, 236575.

107. Christensen, Т., Dissing Sorensen, P., Riemann, H., Hansen, H.J. and Moller-Larsen, A. (1998) Expression of sequence variants of endogenous retrovirus RGH in particle form in multiple sclerosis. Lancet. 352, 1033.

108. Kazazian, H.H., Jr. and Moran, J.V. (1998) The impact of LI retrotransposons on the human genome. Nat Genet. 19,19-24.

109. Deininger, P.L. and Batzer, M.A. (1999) Alu repeats and human disease. Mol Genet Metab. 67, 183-93.

110. Stenger, J.E., Lobachev, K.S., Gordenin, D., Darden, T.A., Jurka, J. and Resnick, M.A. (2001) Biased distribution of inverted and direct Alus in the human genome: implications for insertion, exclusion, and genome stability. Genome Res. 11,12-27.

111. Bailey, J. A. and Eichler, E.E. (2003) Genome-wide detection and analysis of recent segmental duplications within mammalian organisms. Cold Spring Harb Symp Quant Biol. 68,115-24.

112. Goodier, J.L., Ostertag, E.M. and Kazazian, H.H., Jr. (2000) Transduction of 3'-flanking sequences is common in LI retrotransposition. Hum Mol Genet. 9, 653-7.

113. Moran, J.V. (1999) Human LI retrotransposition: insights and peculiarities learned from a cultured cell retrotransposition assay. Genetica. 107, 39-51.

114. Pickeral, O.K., Makalowski, W., Boguski, M.S. and Boeke, J.D. (2000) Frequent human genomic DNA transduction driven by LINE-1 retrotransposition. Genome Res. 10, 411-5.

115. Symer, D.E., Connelly, C., Szak, S.T., Caputo, E.M., Cost, G.J., Parmigiani, G. and Boeke, J.D. (2002) Human 11 retrotransposition is associated with genetic instability in vivo. Cell. 110, 327-38.

116. Gilbert, N., Lutz-Prigge, S. and Moran, J.V. (2002) Genomic deletions created upon LINE-1 retrotransposition. Cell. 110, 315-25.

117. Salem, A.H., Kilroy, G.E., Watkins, W.S., Jorde, L.B. and Batzer, M.A. (2003) Recently integrated Alu elements and human genomic diversity. Mol Biol Evol. 20, 1349-61.

118. Roy-Engel, A.M., Carroll, M.L., El-Sawy, M., Salem, A.H., Garber, R.K., Nguyen, S.V., Deininger, P.L. and Batzer, M.A. (2002) Non-traditional Alu evolution and primate genomic diversity. J Mol Biol. 316, 1033-40.

119. Hughes, J.F. and Coffin, J.M. (2001) Evidence for genomic rearrangements mediated by human endogenous retroviruses during primate evolution. Nat Genet. 29, 487-9.

120. Gardner, M.B., Kozak, C.A. and O'Brien, S.J. (1991) The Lake Casitas wild mouse: evolving genetic resistance to retroviral disease. Trends Genet. 7, 22-7.

121. Schmid, C.W. (2003) Alu: a parasite's parasite? Nat Genet. 35, 15-6.

122. Deininger, P.L., Batzer, M.A., Hutchison, C.A., 3rd and Edgell, M.H. (1992) Master genes in mammalian repetitive DNA amplification. Trends Genet. 8, 307-11.

123. Lebedev, Y.B., Belonovitch, O.S., Zybrova, N.V., Khil, P.P., Kurdyukov, S.G., Vinogradova, T.V., Hunsmann, G. and Sverdlov, E.D. (2000) Differences in HERV-K LTR insertions in orthologous loci of humans and great apes. Gene. 247, 265-77.

124. Sverdlov, E.D. (2000) Retroviruses and primate evolution. Bioessays. 22, 161-71.

125. Liu, G., Zhao, S., Bailey, J.A., Sahinalp, S.C., Alkan, C., Tuzun, E., Green, E.D. and Eichler, E.E. (2003) Analysis of primate genomic variation reveals a repeat-driven expansion of the human genome. Genome Res. 13, 358-68.

126. Carter, A.B., A.-H. Salem,*, D. J. Hedges, C. Nguyen Keegan , B. Kimball, J. A. Walker , W. S. Watkins , L. B. Jorde and M. A. Batzer (2004) Genome wide analysis of the human Alu Yb lineage. Human Genomics. 1, 167-178.

127. Barbulescu, M., Turner, G., Seaman, M.I., Deinard, A.S., Kidd, K.K. and Lenz, J. (1999) Many human endogenous retrovirus К (HERV-K) proviruses are unique to humans. Curr Biol. 9, 861-8.

128. Myers, J.S., Vincent, B.J., Udall, H., Watkins, W.S., Morrish, T.A., Kilroy, G.E., Swergold, G.D., Henke, J., Henke, L., Moran, J.V. et al. (2002) A comprehensive analysis of recently integrated human Та LI elements. Am J Hum Genet. 71, 312-26.

129. Otieno, A.C., Carter, A.B., Hedges, D.J., Walker, J.A., Ray, D.A., Garber, R.K., Anders, B.A., Stoilova, N., Laborde, M.E., Fowlkes, J.D. et al. (2004) Analysis of the Human Alu Ya-lineagq.JMol Biol. 342,109-18.

130. Roy-Engel, A.M., Carroll, M.L., Vogel, E., Garber, R.K., Nguyen, S.V., Salem, A.H., Batzer, M.A. and Deininger, P.L. (2001) Alu insertion polymorphisms for the study of human genomic diversity. Genetics. 159, 279-90.

131. Salem, A.H., Myers, J.S., Otieno, A.C., Watkins, W.S., Jorde, L.B. and Batzer, M.A. (2003) LINE-1 preTa elements in the human genome. J Mol Biol. 326, 1127-46.

132. Xing, J., Salem, A.H., Hedges, D.J., Kilroy, G.E., Watkins, W.S., Schienman, J.E., Stewart, C.B., Jurka, J., Jorde, L.B. and Batzer, M.A. (2003) Comprehensive analysis of two Alu Yd subfamilies. J Mol Evol. 57 Suppl 1, S76-89.

133. Hedges, D.J., Callinan, P.A., Cordaux, R., Xing, J., Barnes, E. and Batzer, M.A. (2004) Differential alu mobilization and polymorphism among the human and chimpanzee lineages. Genome Res. 14, 1068-75.

134. Dornelles, C.L., Battilana, J., Fagundes, N.J., Freitas, L.B., Bonatto, S.L. and Salzano, F.M. (2004) Mitochondrial DNA and Alu insertions in a genetically peculiar population: the Ayoreo Indians of Bolivia and Paraguay. Am J Hum Biol. 16, 479-88.

135. Bamshad, M.J., Wooding, S., Watkins, W.S., Ostler, C.T., Batzer, M.A. and Jorde, L.B. (2003) Human population genetic structure and inference of group membership. Am J Hum Genet. 72, 578-89.

136. Nasidze, I., Risch, G.M., Robichaux, M., Sherry, S.T., Batzer, M.A. and Stoneking, M. (2001) Alu insertion polymorphisms and the genetic structure of human populations from the Caucasus. Eur J Hum Genet. 9, 267-72.

137. Bamshad, M., Kivisild, Т., Watkins, W.S., Dixon, M.E., Ricker, C.E., Rao, B.B., Naidu, J.M., Prasad, B.V., Reddy, P.G., Rasanayagam, A. et al. (2001) Genetic evidence on the origins of Indian caste populations. Genome Res. 11, 994-1004.

138. Medstrand, P. and Mager, D.L. (1998) Human-specific integrations of the HERV-K endogenous retrovirus family. J Virol. 72, 9782-7.

139. Turner, G., Barbulescu, M., Su, M., Jensen-Seaman, M.I., Kidd, K.K. and Lenz, J. (2001) Insertional polymorphisms of full-length endogenous retroviruses in humans. Curr Biol. 11,1531-5.

140. Hattori, M., Fujiyama, A., Taylor, T.D., Watanabe, H., Yada, Т., Park, H.S., Toyoda, A., Ishii, K., Totoki, Y., Choi, D.K. et al. (2000) The DNA sequence of human chromosome 21 .Nature. 405,311-9.

141. Tanaka, I. and Ishihara, H. (1995) Unusual long target duplication by insertion of intracisternal A-particle element in radiation-induced acute myeloid leukemia cells in mouse. FEBS Lett. 376, 146-50.

142. Paces, J., Pavlicek, A. and Paces, V. (2002) HERVd: database of human endogenous retroviruses. Nucleic Acids Res. 30,205-6.

143. Kambhu, S., Falldorf, P. and Lee, J.S. (1990) Endogenous retroviral long terminal repeats within the HLA-DQ locus. Proc Natl Acad Sci USA. 87, 4927-31.

144. Galushkin, S.K., Spitsyn, V.A. and Crawford, M.H. (2001) Genetic structure of Mongolic-speaking Kalmyks. Hum Biol. 73, 823-34.

145. Arcot, S.S., DeAngelis, M.M., Sherry, S.T., Adamson, A.W., Lamerdin, J.E., Deininger, P.L., Carrano, A.V. and Batzer, M.A. (1997) Identification and characterization of two polymorphic Ya5 Alu repeats. Mutat Res. 382, 5-11.

146. Автор выражает глубокую признательность сотрудникам кафедры молекулярной биологии Биологического факультета Московского Государственного Университета имени М. В. Ломоносова за полученные знания, а также за высокую требовательность и постоянное внимание.