Бесплатный автореферат и диссертация по биологии на тему
Влияние человек-специфических ретроэлементов семейств L1 и HERV-K(HML-2) на структуру генома и функционирование близлежащих генов
ВАК РФ 03.00.03, Молекулярная биология

Автореферат диссертации по теме "Влияние человек-специфических ретроэлементов семейств L1 и HERV-K(HML-2) на структуру генома и функционирование близлежащих генов"

РОССИЙСКАЯ АКАДЕМИЯ НАУГ---

ии^и52785

Институт биоорганической химии им. академ______

М.М. Шемякина и Ю. А. Овчинникова

На правах рукописи

ГОГВАДЗЕ ЕЛЕНА ВЛАДИМИРОВНА

ВЛИЯНИЕ ЧЕЛОВЕК-СПЕЦИФИЧЕСКИХ РЕТРОЭЛЕМЕНТОВ СЕМЕЙСТВ Ы И НЕКУ-К (НМЬ-2) НА СТРУКТУРУ ГЕНОМА И ФУНКЦИОНИРОВАНИЕ БЛИЗЛЕЖАЩИХ ГЕНОВ

специальность 03.00.03 - молекулярная биология

АВТОРЕФЕРАТ

диссертации на соискание учёной степени кандидата биологических наук

Москва - 2007

003052785

Рабо га выполнена в лаборатории структуры и функций генов человека Института биоорганической химии им академиков М.М. Шемякина и Ю.А. Овчинникова РАН

Научный руководитель:

доктор химических наук, академик РАН Свердлов Е.Д

Официальные оппоненты:

доктор биологических наук, член-корреспондент РАН Лукьянов С. А.

доктор биологических наук, Евгеньев М. Б

Ведущая организация: Институт Молекулярной Генетики РАН

Защита состоится "4" апреля 2007 года в 10 часов на заседании Специализированного совета при Институте биоорганической химии им. академиков М.М. Шемякина и Ю.А. Овчинникова РАН по адресу: 117997, ГСП-7, г. Москва, В-437, ул. Миклухо-Маклая 16/10.

С текстом диссертации можно ознакомиться в библиотеке Института биоорганической химии им. академиков М.М. Шемякина и Ю.А. Овчинникова РАН

Автореферат разослан "2" марта 2007 года Учёный секретарь

Специализированного совета доктор химических наук

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ. Актуальность проблемы.

Геном эукариот представляет собой сложную и динамичную структуру. Только небольшая часть генома человека (3-5%) занята последовательностями экзонов функциональных генов, в то время как до 50% ДНК представлено мобильными элементами. Большинство мобильных элементов геномов млекопитающих образуется в результате обратной транскрипции матрицы РНК и последующей интеграции образующейся кДНК-копии в геном (ретроэлементы, РЭ). Все РЭ разделяют на содержащие длинные концевые повторы (Long Terminal Repeats, LTRs) - эндогенные ретровирусы; и не содержащие их (non-LTR) - длинные диспергированные повторы (Long Interspersed Nuclear Elements, LINEs), короткие диспергированные повторы (Short Interspersed Nuclear Elements, SINEs) и процессированные псевдогены. Наибольшего внимания заслуживают эндогенные ретровирусы и LINE-ретротранспозоны, поскольку они являются автономными элементами, то есть содержат последовательности, кодирующие белки, необходимые для обратной транскрипции и последующей интеграции кДНК-копии ретроэлемента в геном.

Входящие в суперсемейство LINE РЭ LI (LINE-1) занимают примерно 20% геномной ДНК млекопитающих. Большинство L1 укорочены с 5' конца, хотя существует и небольшое количество полноразмерных элементов, длина которых составляет 6-7 тысяч пар нуклеотидов. Полноразмерный L1 кодирует белки, ответственные за размножение РЭ в геноме. Однако известно, что кроме собственных копий, энзиматический аппарат L1 также способен перемещать другие последовательности, в основном ретропозоны SINE, а также кДНК различных клеточных РНК, формируя при этом псевдогены.

Эндогенные ретровирусы (HERVs-Human Endogenous Retroviruses) -это повторяющиеся мобильные элементы, являющиеся отпечатками древних экзогенных ретровирусов, заразивших клетки линии зародышевого пути и закрепившихся в геноме. Типичный

полноразмерный HERV имеет длину 3.3 - 10 тысяч пар оснований и содержит гомологи основных ретровирусных генов gag, pol и env, которые фланкированы длинными концевыми повторами (LTR). Одна из классификаций HERV основана на определении типа тРНК, используемой ретровирусом в качестве праймера в процессе инициации обратной транскрипции. Семейство HERV-K (праймером для обратной транскрипции является лизиновая тРНК) присутствует исключительно в геномах приматов. Подсемейство HML-2 - одно из наиболее полно исследованных среди HERV-K. В геноме человека присутствует около 150 полноразмерных HERV-K (HML-2) и примерно 1.500-2.000 одиночных длинных концевых повторов (LTR), образованных в результате рекомбинации между двумя LTR полноразмерного элемента.

РЭ могут играть существенную роль в изменчивости и эволюции геномов путём взаимодействий с окружающими их последовательностями и близлежащими генами. Они могут служить мишенями рекомбинации, предоставлять новые промоторы, энхансеры и сайты терминации транскрипции, становиться частью кодирующей белок последовательности, играть важную роль в «перетасовке» экзонов. Кроме того, РЭ выполняют и структурную функцию (например, поддержание длины теломер у дрозофилы). Внедрения РЭ в новые позиции генома могут приводить к появлению новых фенотипических признаков, являющихся предметом естественного отбора, способствуя, таким образом, эволюционньм процессам.

Поиск новых геномных перестроек, вызванных РЭ, и механизмов их возникновения, а также изучение влияния РЭ на активность близлежащих генов, таким образом, представляет собой актуальную и интересную тему молекулярной биологии.

Цели и задачи работы.

Целью данной работы являлся поиск химерных РЭ, образующихся за счет смены матрицы при обратной транскрипции элементов LI, в геномах эукариот, а также изучение влияния человек-специфических РЭ HERV-K (HML-2) на транскрипцию близлежащих генов.

Были поставлены следующие задачи:

- провести биоинформационный скрининг баз данных геномов млекопитающих Homo sapiens, Mus musculus и Rattus norvégiens, земноводного Xenopus laevis, рыб Danio rerio и Takifugu rubripes, беспозвоночных Drosophila melanogaster, Anopheles gambiae и Caenorhabditis elegans для выявления в них химерных РЭ.

- выявить специфичные для генома человека LTR семейства HERV-K (HML-2), расположенные в интронах известных генов человека в противоположной направлению транскрипции гена ориентации и служащие промоторами для образования транскриптов, перекрывающихся с экзонами гена.

- изучить возможность влияния транскриптов, образующихся с промотора LTR, на активность клеточных генов по механизму РНК-интерференции.

Научная новизна и практическая ценность работы.

Показано, что образование химерных РЭ, происходящее в результате смены матрицы в ходе обратной транскрипции РНК с помощью энзиматического аппарата LINE-ретротранспозонов, является эволюционно консервативным механизмом «перетасовывания» транскрибируемых компонентов генома, найденным не только у млекопитающих, но даже у гриба Magnaporthe grísea. При этом в ходе обратной транскрипции могут происходить как однократные, так и двукратные смены матриц, в результате чего образуются, соответственно, двойные или тройные химерные РЭ. Интересно, что многие химеры экспрессируются и некоторые из них - тканеспецифично. Это позволяет предположить, что химерные ретротранскрипты могут быть вовлечены в функционирование клетки.

Впервые показано, что человек-специфические LTR, расположенные в интронах генов, служат промоторами для антисмысловых к гену транскриптов. Такие, транскрипты экспрессируются тканеспецифично и в опытах in ,vitro оказывают влияние на уровень экспрессии комплементарной РНК, а также на жизнеспособность клеток. Таким образом, на основании полученных данных можно говорить о том, что

3

помимо промоторной и энхансерной активности, ЬТЯ принимают участие в регуляции генов по механизму РНК-интерференции.

Структура диссертации.

Диссертационная работа изложена на 107 страницах машинописного текста и состоит из следующих разделов: введения, обзора литературы, изложения результатов и их обсуждения, экспериментальной части, выводов и списка цитируемой литературы, включающего 164 ссылки.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ.

I. Поиск химерных ретрогеиов, образующихся за счет смены матрицы при обратной транскрипции РЭ L1. в геномах эукариот.

Входящие в суперсемейство LINE РЭ L1 занимают около 20% геномной ДНК млекопитающих. Однако большинство L1 представлено неспособными к ретропозиции копиями, укороченными с 5'-конца, тогда как лишь небольшое количество (80-100) элементов человека транспозиционно активно. Известно, что транспозиция L1 проходит в несколько стадий, включая транскрипцию ретроэлемента РНК-полимеразой II, обратную транскрипцию образовавшейся РНК с помощью кодируемой L1 РНК-зависимой ДНК-полимеразы (обратной транскриптазы), а также интеграцию получившейся кДНК в новый участок генома. Благодаря эффекту так называемого «цис-предпочтения», энзиматический аппарат ретропозиционно-компетентных L1 предпочтительно перемещает копии своих собственных мРНК. Тем не менее, L1 также способны перемещать другие последовательности, в основном ретропозоны Alu, а также кДНК других типов клеточных РНК, формируя при этом псевдогены. Кроме того, недавно мы показали возможность формирования транспозиционным аппаратом L1 химерных РЭ в процессе смены матрицы при обратной транскрипции. При детальном исследовании специфичных для генома человека интеграций L1, мы обнаружили РЭ необычной структуры, состоящий из двух частей:

копии малой ядерной РНК U6, непосредственно соединенной с 5'-укороченным элементом L1 (Рис 1А). Обе части располагались в одной ориентации относительно направления транскрипции. На 3'-конце химерного ретроэлемента находился поли(А) участок, весь элемент фланкировали короткие прямые повторы, а вблизи 5'-конца обнаружена последовательность ТТАААА, узнаваемая обратной

транскриптазой/интегразой L1 как предпочтительный участок встраивания. Эти особенности свидетельствовали об использовании ферментативного аппарата L1 при формировании химеры. Скрининг других псевдогенов U6 мяРНК генома человека показал, что 33% их представлены частями химер сходного строения, т.е. они фланкированы прямыми повторами, несут поли(А)-участок и последовательность ТТАААА. При этом на 5' конце всегда располагалась полная копия U6, а на 3'-конце - укороченные копии L1. Однако же входящие в состав химер фрагменты L1 значительно отличались как по длине, так и по нуклеотидной последовательности, и относились по крайней мере к 10 разным семействам L1. Это свидетельствует о том, что химеры создавались не последовательным внедрением копий какой-либо одной предковой последовательности, а каждый раз независимо. Сравнение значений дивергенции от соответствующих консенсусных последовательностей, проведенное для левых и правых частей химер, выявило существование линейной корреляции, что говорит об одновременной интеграции обеих частей химер в геномную ДНК.

После этого предприняли расширенный поиск химерных РЭ в геномной ДНК человека, в ходе которого проанализировали около 800 различных наиболее часто встречающихся псевдогенов. Оказалось, что значительному числу типов таких псевдогенов соответствуют химерные элементы, фланкированные прямыми повторами и несущие поли(А)-последовательности (Рис. 1Б). Интересно, что З'-концы химер образованы не только элементами L1, но в некоторых случаях и копиями 3'-концевых фрагментов кДНК различных белок-кодирующих генов человека, а также относящимися к SINE элементами Alu. 5'-концевые части были копиями малых ядерных РНК U3, U5 и U6, а также 7SL РНК, 5S рибосомной РНК и

5

Alu. Всего обнаружен 81 химерный ретроген человека, что, конечно же, меньше, чем в действительности, поскольку поиск химер проводился лишь для ограниченного набора псеадогеков.

А

3'- концевая

часть т п^л,/"

ил^мН»-

107 п. н. 1324 г. н^ 40 п. н.18 п. н.

Прямой повтор

U6-L1;

56 поеледоаательностей

Л'- концевая прямой

часть L1__погмчдо./ "^"Р

U3-L1;

7 последовательностей

U5-L1:

1 последовательность

3'- концевая Щ часть L1

3'- концевая

U5 часть L1 --- .....

U6-Alu;

4 последовательности

5S pPHK-L1; 1 последовательность

U6 Alu

---V

3'- концевая 5S рРНК часть L1

—' :. .....

5» pPHK-Alu; 2 последовательности

SSpPHK Alu

- W f> .

?Si PHK-Alu;

1 последовательность

AIlj-MPHK;

2 последователь пост» мРНК рибосомного белка L31

-Sf

Alu

3'- концевая часть мРНК

иб-мРНК; частГ^РНК

Ё последовательностеи: r^jü^

мРНК рибоссмного балка L31 кератина, гамма- актина, натисюнового хромосомного белка, ламйниноаого рецептора мРНК Т41250

113-мРНК;

1 последовательность мРНК мембранного белка, ассоциированного с рибосомами

Рис 1, Схематичное изображение двойных химерных РЭ, идентифицированных в геномных базах данных человека.

(А) - Химерный РЭ иб-1Д.

(Б) - Все типы химерных РЭ, идентифицированных в геномных базах данных.

С целью определения времени интеграции химерных элементов, мы провели серию локус-специфических ПЦР на матрицах геномных ДНК приматов (человекообразных обезьян (шимпанзе, горилла, гиббон, орангутан), обезьян Старого и Нового света) с уникальными праймерами к последовательностям генома, фланкирующим участки внедрения РЭ (Рис 2). Присутствию интеграции соответствовали выявляемые электрофорезом продукты ПЦР большей длины, тогда как «короткие» продукты отражали отсутствие химерного элемента в исследуемом локусе.

3' концевая часть (, мРНК кератина 19 пп

ff ff///

"1,5 т.п.н. -1 т.п.н.

сгг

820 п.

•500 п.н.

410 п.

AluY

# i

vi» &

/ / / # /

<

Gîr

Гибридизация с зондом на U6

Гибридизация с зондом на ген SS рРМК

Гибридизация с зондом на иРНК

Гибридизация с soi

п реинтеграционную последовательность

Ж на

Гибридизация с зондом на Alu

Гибридизация с зондом на л ре интеграционную п осле д о в ат ел ь н ость

Рис 2. Результаты анализа двух химерных ретроэлементов.

(А): Схема локуса I6q22 (I), ПП- прямой повтор. Электрофореграмма продуктов ПЦР- амплификации данного локуса с использованием праймсров, фланкирующих участки внедрения химеры (Gif и Gl г) (2), и результаты Саузерн-блот гибридизации продуктов ПЦР-амплификации с зондами на псевдоген U6 мяРНК (3), псевдоген мРНК кератина 19 (4) и преинтеграциокную геномную последовательность, не содержащую РЭ (5).

(Б): схема локуса Xq 13 (1), ПП-прямой повтор. Электрофореграмма продуктов ПЦР- амплификации данного локуса с использованием праймеров, фланкирующих участки внедрения химеры {G2f и G2r) (2) и результаты Саузерн-блот гибридизации продуктов ПЦР-амплификации с зондами на псевдоген 5S рРНК (3). ретропозон Alu (4) и преинтеграционную геномную последовательность (5).

После переноса на мембраны и гибридизации с зондами, специфичными для «левых» и «правых» частей химер, оказалось, что во всех случаях присутствие или отсутствие вставок обеих частей было абсолютно сцепленным, что подтверждает гипотезу об одновременной интеграции обеих частей химерных ретрогенов.

Полученные данные свидетельствуют о постоянном образовании химер на протяжении эволюции приматов, а также о том, что этот процесс активен в геноме человека и поныне, поскольку некоторые элементы специфичны для ДНК человека и даже полиморфны в человеческих популяциях (Рис. 3).

Время, млн. лет

113-мРНК; АС005410 Q^S^ 5°_ 45-

U3-LI; АС060225 40.

U6-MPHK; AL359552 U6-MPHK; АС021034 35-

5S pPHK-Alu; AL158069 30-

U6-MPHK; АС009131 U6-MPHK; AL591050 Alu-мРНК; АС016712 2S"

2015-

U6-L1; AC010R94 U3-LJ; ЛС069417 ц)-

5-

TJ6-L1:Z98950 U3-L1; AP004289

Человек

Рис. 3. Результаты анализа времени интеграции 12 химерных элементов. Время интеграции определяли по присутствию или отсутствию внедрения исследуемой химеры в ДНК различных видов приматов.

Вслед за идентификацией химерных элементов человека, мы провели поиск химерных псевдогенов, созданных мяРНК U6, U5, и U3, рибосомной 5S РНК, а также 7SL РНК, в базах данных геномных ДНК других животных: млекопитающих Mus musculus и Rattus norvegicus; земноводного Xenopus laevis; рыб Danio rerio и Takifugu rubripes; беспозвоночных Drosophila melanogaster, Anopheles gambiae и

. Обезьяны Нового Света

k Обезьяны Старого Света

Гиббон

Орангутан

Горилла Шимпанзе

Caenorhabditis elegans. Поиск химерных элементов среди нуклеотидных последовательностей выявленных 1800 псевдогенов, мало- или средне дивергировавших (< 10%) от консенсусных последовательностей, проводился по следующим критериям: 1) 5'-и 3'-концевые части химер должны быть соединены непосредственно, 2) располагаться в одинаковой ориентации; 3) химеры должны быть фланкированы прямыми повторами длиной 8-25 п.н., а также 4) нести поли(А)-последовательность на 3'-конце.

Обладающие этими структурными особенностями химеры не были обнаружены в геномах беспозвоночных, рыб и амфибий, в то же время все исследованные геномы млекопитающих содержали химерные ретрогены. Все найденные элементы содержали вблизи 5'-конца предпочтительно узнаваемую эндонуклеазой L1 последовательность Т2А4 либо её производные с одно- или двунуклеотидными заменами. В соответствии с ранее полученными данными для химерных РЭ человека, 5'- части химер являлись ДНК-копиями РНК, имеющих ядерную локализацию, тогда как 3'-части были сформированы цитоплазматическими РНК: мРНК клеточных генов или ретроэлементов. Обе части химер близки по эволюционному возрасту: чем более молодой (т.е. менее дивергировавшей от консенсусной последовательности) является 5'-часть, тем моложе соответствующая ей 3'-часть химеры. Эти данные говорят о том, что 3'- и 5'- концевые части химер внедрялись в геномную ДНК одновременно, в составе единой последовательности.

Всего было идентифицировано 82, 116 и 66 химер в геномах человека, мыши и крысы соответственно (таблица1). З'-Концевые части химер являлись, как правило, ретроэлементами L1, но в 20, 12 и 18% случаев для ДНК человека, мыши и крысы соответственно, это были либо псевдогены различных клеточных мРНК (11, 8 и 8%), либо относящиеся к SINE ретропозоны (9, 4 и 10%). В то же время 5'-частями химер являются псевдогены мяРНК - U6 (82, 95 и 92%), U3 (10, 2 и 1%) и U5 (1, 0 и 0%,); либо также последовательности, относящиеся к SINE (2, 0 и 0%), 7SL РНК (1, 0 и 0%), или 5S рРНК (4, 3 и 6%). Количество химер в геномах мыши и крысы (116 и 66 соответственно), по-видимому, недооценено,

9

поскольку 3'-концевые части предполагаемых химер были часто прерваны брешами в сборке геномной последовательности, что делало невозможным обнаружение прямых повторов в этих случаях.

Таблица 1. Сопоставление 5'- и 3'- концевых частей химер с известными последовательностями РНК

Название Число представителей Функция РНК Локализация РНК

транскриптов и их доля (%) в клетке в клетке

Человек Мышь Крыса

5' концевые последовательности химер

U6 66 (82) 111 61 (92) мяРНК, сплайсинг Ядро

(95)

U5 1 (1) 0 0 мяРНК, сплайсинг Ядро

из 8(10) 2(2) 1 (1) мяРНК, сплайсинг Ядро

5S рРНК 3(4) 3(3) 4(6) Рибосомная РНК Цитоплазма, ядро

7 SL 1(1) 0 0 Сортинг белков Цитоплазма, ядро

Alu 2(2) 0 0 Эгоистическая РНК Цитоплазма, ядро

3' концевые последовательности химер

L1 65 (80) 103 54 (82) Эгоистическая Цитоплазма, ядро

(88) мРНК

МРНК 9(11) 9(8) 5(8) мРНК гена Цитоплазма

Alu 7(9) 0 0 Эгоистическая РНК Цитоплазма, ядро

B1 Mm 0 2(2) 0 Эгоистическая РНК Цитоплазма, ядро

В2 Мш1 0 1 (1) 0 Эгоистическая РНК Цитоплазма, ядро

В2 Мт2 0 1(1) KD Эгоистическая РНК Цитоплазма, ядро

ID Rn 0 0 5(8) Эгоистическая РНК Цитоплазма, ядро

4,5S РНК 0 0 KD Эгоистическая РНК Цитоплазма, ядро

Интересно, что доля включенных в химеры псевдогенов U6 значительно выше у грызунов, нежели у Homo sapiens. 33% всех псевдогенов U6 человека являются частями химер, в сравнении с 69% у мыши Для генома крысы это значение может быть найдено лишь приблизительно, вместе с предполагаемыми химерами оно составляет 64%. Учитывая, что практически все псевдогены U6 (как химеры, так и не химеры), по-видимому, были созданы ретропозиционным аппаратом L1, можно предположить, что комплексы L1 грызунов сменяют матрицу в ходе обратной транскрипции вдвое чаще, чем LINE человека.

Таким образом, механизм образования химер появился по крайней мере 75 млн. лет назад, до эволюционного расхождения предковых линий приматов и грызунов, и остается активным по сей день. Для более точного датирования возникновения механизма "химеризации"

10

необходимо определение последовательности нуклеотидов геномов других позвоночных. ОТ (обратная транскрипция)-Г1ЦР анализ химерных элементов человека, а также скрининг баз данных экспреесирующихся последовательностей геномов человека, мыши и крысы выявил, что многие химеры млекопитающих транскрибируются, причем некоторые из них - тканеспецифично.

Важным результатом, полученным в ходе выполнения настоящей работы, является обнаружение химер, состоящих из трех компонентов (тройные химеры). Два таких химерных элемента были найдены в ДНК мыши, еще два - в геноме человека (рис 4).

ТТЛАЛЛ Alu Y U6__LIPAS Поли (A)

Человек

ттлаал Alu Sx U6

L1PA7

AC00J0Î7

AU33286

Мышь

ACO90495 fil

Рис.4 Схематическое изображение обнаруженных тройных химер.

Б2 Mml U6

Li MM

Структурная организация всех четырех тройных химерных элементов совпадает: они фланкированы прямыми повторами, содержат на 5'-конце последовательность Т^А^ и несут ро!у(А)-хвост на З'-конце. 5'-Концевые части тройных химер сформированы представителями SINE: AIuY или AluSx для ДНК человека и B2_Mml для ДНК мыши. В середине тройные химеры всегда содержали копии U6 мяРНК, а 3'-концевые части представляли собой последовательности LINE: L1РА5 или LIРА7 у человека, и L1_MM или Ll_Md-F_2_3 у мыши. Обнаружение таких регротранскриптов говорит о том, что in vivo при обратной транскрипции происходят не только однократные, но и двукратные смены матрицы L1.

П

J. Связывание SINE, LI или клеточной мРНК белками, кодируемыми LI

Цитоплазма

2. Транспорт рибонуклеопротеина в ядро

/ 3. Обратная

Ядро транскрипция

\

4Б. Смена матриц

4А. Интеграция кДНК

5А, Интеграция химерной кДНК

5Б. Дополнительная

смена матриц с

формированием

тройных

химер

\

Рве 5. Предполагаемый механизм формирования двойных и тройных химер.

(1) - л реинтеграционный комплекс LI связывается в цитоплазме с мРНК клеточного гена, LI или Alu. (2) - сформированный рябонуклеопротеин транспортируется в ядро, (3) — обратная транскрипция связанной с комплексом мРНК, при которой в качестве прайм ера выступает образованный в результате одноцепочечного разрыва в геномной последовательности ТТТТАА фрагмент ДНК. (4А) - успешная интеграция синтезированной копии кДНК в геномную ДНК. (4Б) - смена матрицы на другую РНК нрх обратной транскрипции. (5А) - интеграция образованной двойкой химеры в геномную ДНК, (5Б) - вторая смена матрицы при обратной транскрипции с последующей интеграцией в геном обусловливает формирование тройных химер.

Совокупность полученных данных позволила предложить механизм,

объясняющий образование подобных химер (рис 5). На первом этапе

белковый комплекс, участвующий в ретротранспозиции Ь1, в цитоплазме

котрансляционно связывается с мРНК этого РЭ или с другими

12

цитоплазматическими РНК (мРНК генов или РНК представителей SINE). Затем образовавшийся рибонуклеопротеидный комплекс транспортируется в ядро, где согласно классической модели ретропозиции L1 начинается сопряженная обратная транскрипция/интеграция с использованием разрывов внутри последовательности ТТАААА в составе геномной ДНК. На следующем этапе ретропозиционный комплекс, не успевший полностью провести обратную транскрипцию связанной РНК, может «перескочить» на матрицу оказавшейся «поблизости» ядерной РНК, что при продолжении работы комплекса приводит к формированию двойного химерного элемента. Если же происходит еще одна смена матрицы, то образуются гораздо более редкие тройные ретрогены.

В 2005 году в паразитическом грибе Magnaporthe grísea было найдено семейство химерных элементов, состоящих из ДНК-копии WEIRD РНК (РНК с неизвестной функцией, для которой был показан высокий уровень транскрипции на всех стадиях жизненного цикла М. grísea), непосредственно соединенной с 3'-концевой частью РЭ MGL, принадлежащего к LINE-ретротранспозонам (Fudal et al, 2005). Такие элементы были названы MINEs (от Mixed Interspersed Nuclear Elements) и было показано, что в геноме Magnaporthe grísea присутствует по крайней мере 30 таких элементов. Структурные характеристики найденных химерных элементов, также как и в случае химер млекопитающих, позволяют предположить вовлеченность энзиматического аппарата ретротранспозона MGL в их формирование.

Мы провели компьютерный анализ всех MGL ретроэлементов М grísea и обнаружили, что по крайней мере 23% этих ретротранспозонов (31 элемент) входят в состав химер с WEIRD РНК (точное количество химерных элементов установить невозможно из-за недостаточной собранности генома М. grisea\ в 17% случаев контиг прерывался внутри последовательности MGL). Кроме того, был найден один химерный элемент, состоящий из WEIRD РНК и ретропозона Mg-SINE, а также одна тройная химера WEIRD-MgSINE-MGL. Методом ОТ -ПЦР мы показали, что, как и в случае млекопитающих, некоторые химерные элементы М

grísea транксрибируются, причем специфически на разных стадиях жизненного цикла гриба.

Полученные в работе результаты показывают, что LINE-опосредованные РНК-рекомбинации являются эволюционно консервативным механизмом перераспределения генетической информации. Они в конечном итоге приводят к объединению двух или трех транскрибируемых компонентов генома и к интеграции образованных химер в новые участки ДНК. Транскрипционная активность некоторых химерных элементов позволяет предположить их вовлеченность в функционирование клетки.

II. Изучение влияния человек-специфических РЭ HERV-K (HML-2) на транскрипцию близлежащих генов.

Подсемейство HML-2 - одно из наиболее полно исследованных среди эндогенных ретровирусов семейства HERV-K. В геноме человека присутствуют около 150 полноразмерных HERV-K (HML-2) и примерно 1.500-2.000 одиночных длинных концевых повторов (LTR). Около 10% от общего количества интеграций подсемейства HML-2 представляют собой человек-специфические внедрения.

LTR эндогенных ретровирусов представляют собой участки, содержащие большое количество регуляторных элементов, таких как промотор, энхансер, сайт полиаденилирования, а также последовательности, потенциально способные к взаимодействию с рецепторами гормонов (глюкокортикоидного и прогестеронового) и факторами транскрипции (NF-кВ, YY1 и др.) Благодаря этому LTR эндогенных ретровирусов могут оказывать существенное влияние на регуляцию транскрипции близлежащих генов.

Возможно, что помимо промоторной и энхансерной активности, LTR могут принимать участие в регуляции генов антисмысловыми транскриптами по механизму РНК-интерференции. Исследованию такой возможности посвящена данная часть диссертационной работы.

На первом этапе работы в базе данных геномной ДНК человека были проанализированы все человек-специфические ретроэлементы НЕЯУ-К (НМЕ-2) и для дальнейшего анализа были отобраны все ЬТЯ (13 индивидуальных РЭ), расположенные в интронах известных генов человека в противоположной направлению транскрипции данного гена ориентации и удаленные от ближайшего экзона не более, чем на 5 т.п.н.

Рис 6. Схематическое изображение геномных локусов, отобранных для дальнейшего анализа и расположение праймеров, использованных в работе.

Для каждого из исследуемых локусов были дизайнированы праймеры на экзоны, фланкирующие LTR {Gfor и Grev), а также праймер на 3'- и 5' - концевую часть LTR. Праймеры Gfor+Grev применяли для определения уровня транскрипции гена, a Gfor+LTRfor и Gfor+LTRfor2 -для определения уровня транскрипции LTR, расположенного в интроне анализируемого гена. В качестве матрицы для ПЦР использовали первые цепи кДНК, синтезированные с помощью олиго(с1Т)-праймера на суммарной РНК нормальной паренхимы яичка человека и герминогенной опухоли - семиномы.

Методом ОТ-ПЦР с праймерами Gfor+Grev и Gfor+LTRfor был определен уровень транскрипции исследуемых генов, а также уровень транскрипции LTR, находящегося в интроне. В результате было отобрано 9 LTR, для которых было показано, что они транскрибируются в исследуемых тканях. Однако, для того, чтобы понять, действительно ли транскрипция начинается внутри LTR, необходимо было найти 5'-конец образующейся РНК. Для этого был применен метод 5'- RACE (Rapid Amplification of cDNA ends). Для двух из девяти проанализированных случаев было показано, что транскрипция начинается внутри LTR на границе R и U5 областей (826 нуклеотид консенсусной последовательности человек-специфического LTR), что совпадает с

опубликованными нами ранее данными о точке начала транскрипции LTR семейства HERV-K (Kovalskaya et al, 2006). Таким образом, было показано, что из 13 человек-специфических LTR, расположенных в интронах известных генов в противоположной направлению транскрипции гена ориентации и удаленных от ближайшего экзона не более, чем на 5 т.п.н., только 2 служат промоторами для транскриптов, перекрывающихся с экзонами клеточного гена. Это LTR, расположенные между 23 и 24 экзонами гена SLB (selective LIM binding factor, rat homolog; AC074117) и между 5 и 6 экзонами гена SLC (solute carrier family 4; АС027750). В дальнейшем проводился анализ только данных локусов.

Для более полной характеристики этих двух случаев методом ОТ-ПЦР был определен уровень транскрипции генов SLB и SLC, а также находящихся в них LTR для еще десяти тканей человека: скелетной мышцы, печени, сердца, легкого (нормы и опухоли), гиппокампа и эмбриональных тканей мозга (лобной доли, затылочной коры, базальных ядер и гипоталамуса) (таблица 2). Транскрипционная активность LTR, находящегося в интроне гена SLC, была показана только для нормальной паренхимы яичка, семиномы и эмбриональных затылочной коры, гипоталамуса и лобной доли. Причем во всех случаях уровень транскрипции LTR был ниже уровня транскрипции гена, содержащего анализируемый РЭ.

Транскрипт LTR, находящегося между 23 и 24 экзонами гена SLB, был найден во всех проанализированных тканях кроме нормальной ткани легкого. В большинстве случаев, как и для LTR в гене SLC, уровень транскрипции LTR оказался в 4-8 раз ниже уровня транскрипции гена (эмбриональные лобная доля и гипоталамус, печень, лёгкое (опухоль) и гиппокамп). В случае эмбриональных базальных ядер и затылочной коры LTR.h ген транскрибируются на одном уровне. Для скелетной мышцы, сердца, паренхимы и семиномы был показан более высокий уровень транскрипции LTR по сравнению с геном. Особого интереса заслуживает нормальная паренхима яичка, в которой LTR транскрибируется в 16 раз интенсивнее гена.

Для доказательства того, что во всех случаях мы имеем дело именно с транскриптами, комплементарными РНК гена, был проведен синтез первых цепей кДНК с праймером, избирательно связывающимся с антисмысловыми к гену РНК.

Таблица 2. Результаты анализа уровня транскрипции генов человека БЬВ и 5ХС, а также ЬТИ, расположенных в интронах этих генов, (цифры обозначают цикл ОТ-ПЦР, на котором появлялся

ткань вьв вьс

Ой)г+ Ой>г+ Сй)г+

Огеу ЬТ1Шг ЬТ1Шг2 йгеу ЬТРНог 1ЛЖог2

паренхима 35 31 37 31 36 -

семинома 32 31 39 30 36 -

эмбриональные базальные ядра 36 36 - 34 - -

эмбриональная затылочная 32 33 33 30 32 35

кора

эмбриональный гипоталамус 33 35 36 30 33 36

эмбриональная лобная доля 33 35 36 31 35 39

печень 34 36 - 36 - -

легкие(норма) 33 - - 33 - -

легкие (опухоль) 31 35 - 36 - -

сердце 34-35 33 - - - -

гиппокамп 33 36 36 28 - -

После этого был поставлен ОТ-ПЦР с праймерами ЬТ11&>г и вйг. Во

всех случаях ПЦР-продукт получался на тех же циклах, как и при

амплификации кДНК, синтезированной с оНдо(<1Т)-праймером.

Следовательно, найденные нами ранее транскрипты ЬТЯ действительно

являются антисмысловыми к гену. А для доказательства того, что

транскрипция антисмысловых РНК начинается внутри ЬТЯ, были

поставлены ОТ-ПЦР с праймерами на 5'- конец ЬТЯ (ЬТ1Шг2) и на экзон

анализируемого гена (вГог). Как видно из таблицы 2, в большинстве

случаев продукт не детектировался или же появлялся на значительно

более поздних циклах, из чего следует, что промотором для

антисмысловых транскриптов в этих случаях действительно служит 3'-

17

концевая часть ЬТЯ, Однако при анализе кДНК четырех тканей в случае гена (гиппокамп и эмбриональные затылочная кора, гипоталамус и лобная доля) продукты ОТ-ПЦР с праймерами 1.Т11й>г2+С1:ог и ЬТКРогЮГозг появлялись практически на одинаковых циклах. Можно предположить, что в этих тканях присутствует дополнительный промотор, расположенный в 5'-концевой части ЬТЯ или вышележащий Относительно ЬТЯ и инициирующий транскрипцию в том же направлении, что и ЬТЯ.

После этого была предпринята попытка определить З'-конец транскриптов, начинающихся в 1.ТК, расположенных в интронах генов и С помощью метода З'-И-АСЕ получить необходимые

результаты не удалось, поэтому были проведены ОТ-ПЦР с праймером на З'-конец ЬТО и серией праймеров, постепенно удаляющихся от ЬТЯ. В результате было показано, что в случае гена 5ХЙ существует, по крайней мере, 2 типа транскриптов: один включает в себя только экзон 23 (транскрипт 1), а второй - экзоны 23 и 22 (транскрипт 2) (рис 7). Интересно отметить, что «длинный» транскрипт был найден только в нормальной паренхиме яичка, для которой была показана значительно большая активность ЬТК по сравнению с геном. В случае гена 5ЛС З'-конец транскрипта найден не был, но было определено, что весь экзон 5 входит в его состав (транскрипт 3).

-э^эон -Р'ШЩШ:^— —зюон 6 -^—^Гэюон 5 -—'■■'■

транскрипт 1----------транскрипт 3 ■------— -

транскрипт 2---------

Рис 7. Схематическое изображение транскрипционно активных ЬТИ в интронах генов и $ЬС н тнпы тракскрипток, образующихся с промотора ЦТИ.

На следующем этапе работы необходимо было определить, могут ли найденные транскрипты оказывать влияние на экспрессию соответствующих клеточных генов. Для этого предполагалось получить клеточные линии, стабильно экспрессирующие изучаемые транскрипты, и

посмотреть, изменяется ли в этих клетках уровень экспрессии генов и 8ЬС.

Нами был проведен скрининг 8 клеточных линий человека и для дальнейшего анализа были отобраны линии Тега-1 и ЫйР 127, для которых был показан наиболее высокий уровень транскрипции генов 5ЬВ и 51 С.

3'конец Ш?

Гигром и ни и

Плазмида!

ЗЧ'Омси

ад

Гигромицин ■

Плазмида2

Трансфекция клеточных линий ¡\IGP127 и Тега-1

ПлазмидаЗ

Плазмида4

- Гигромицин

Рис 8. Схематическое изображение илазмид, использованных для трансфекций клеточных линии МСР127 и Тега-1.

Фрагмент ДНК, соответствующий анализируемому транскрипту, был помещен в плазмиду рсОКА 3.1 между промотором цитомегаловируса (Рсму) и

сигналом полиаденилировання гена бычьего гормона роста (ВОНрА). Стрелками внутри экзонов показано направление транскрипции генов 5Ш (плазмиды 1 и 2) и 8¿С (плазмяда 3). В случае успешной интеграция ппизмиды 1 в ДНК ^Р!27/Тега-1 получалась клеточная линия, стабильно экспрессирующая траскрипт 1 (см рис7); интеграция плазмиды 2 приводила к стабильной экспрессии транскрипта 2, а плазмиды 3 - к стабильной экспрессии транскринта 3. Плазмяда 4 - контрольная конструкция, не содержащая вставки. Траисформанты отбирались на среде с гигромицином.

На основе плазмиды рсПЫАЗЛ Ну§го- были созданы три конструкции, каждая из которых содержала под контролем СМ\' промотора участок ДНК, соответствующий найденным в работе ЬТИ.-транскриптам (Рис 8), Этими конструкциями были трансфецированы

19

клетки Тега-1 и КЮР127 и в результате получены клеточные линии, стабильно экспрессирующие интересующие нас транскрипты. Для каждой клеточной' линии было проведено четыре трансфекций: 3 опытные (пл'азмидами, содержащими вставку соответствующего транскрипта) и 1 контрольная (плазмидой без вставки).

Важно отметить, что клетки, трансфецированные плазмидами со вставкой, оказались значительно менее жизнеспособными, чем контрольные. В случае линии Тега-1 нам так и не удалось получить клетки, стабильно экспрессирующие транскрипты 2 и 3. Таким образом, можно сделать вывод о негативном влиянии анализируемых транскриптов на жизнеспособность или пролиферативную активность клеток.

В результате опытов по трансфекции, мы получили 4 линии клеток ЫОР127 (N0? 127-1 - клетки, стабильно экспрессирующие транскрипт 1, КЮР127-2 - стабильно экспрессирующие транскрипт 2, КОР127-3 -стабильно экспрессирющие транскрипт 3 и ЫОР127-К - контрольные клетки, транфецированные плазмидой без вставки) и 2 линии клеток Тега-1 (Тега1-1 - стабильно экспрессирующие транскрипт 1) и Тега1-К (контрольные клетки). Из всех полученных клеточных линий была выделена РНК и проведена ОТ -ПЦР в реальном времени для определения уровня транскрипции генов 5/.В и БЬС. Результаты ПЦР представлены в таблице 3. В случае линии Тега-1 было показано уменьшение количества РНК ЗЬВ в клетках, экспрессирующих транскрипт 1 (транскрипт, включающий только экзон 23 гена 5ЪВ) в 2.6 раза по сравнению с контрольными клетками. Нежизнеспособность клеток, экспрессирующих транскрипты 2 и 3, не позволяет количественно оценить влияние этих РНК на транскрипцию соответствующих генов, однако позволяет сделать вывод об их функциональной значимости для жизнедеятельности клетки. В случае же клеточной линии ЫвР не было выявлено изменение уровня транскрипции генов БЬВ и 5ХС в опытных клетках по сравнению с контрольными, Таким образом, можно сделать вывод о том, что в данных клетках антисмысловые РНК, образованные с промотора ЬТЯ не регулируют транскрипцию соответствующих клеточных генов. Возможно, это связано с нарушением процессов РНК-интерференции в данной

клеточной линии. Несмотря на отсутствие влияния антисмысловых РНК на транскрипцию соответствующих генов, для клеток МОР127, также как и для Тега-1, было отмечено снижение выживаемости опытных клеток по сравнению с контрольными.

Таблица 3. Уровень экспрессии генов БЬВ и БЬС в клеточных линиях ^Р127 и Тега1, стабильно экспрессирующих

Клеточная линия Уровень транскрипции генов БЬВ и БЬС относительно р-актина, % х10'4

^Р127 РНК)

ШР127-1 8.39±6.2

N0? 127-2 2.785±0.46

ШР127-К 3.86±2.6

^Р127 (^¿СРНК)

ЫОР127-3 6.74±2.95

КСР127-К 3.55±0.68

Тега! (5ХЯ РНК)

Тега1-1 2.13±0.28

Тега 1-К 5.53±2.14

Таким образом, можно сделать вывод о том, что антисмысловые РНК, образованные с промотора ЬТ11, в случае клеток Тега-1 могут уменьшать уровень транскрипции соответствующего гена, предположительно по механизму РНК-интерференции. Кроме того, они способны влиять на жизнеспособность клеток, не нарушая транскрипции комплементарной РНК (как в случае трансфецированных клеток ^Р127). На основании проведенного нами биоинформатического анализа транскриптов, образованных с промотора 1ЛИ, можно предположить несколько способов их влияния на клетку:

- связываясь с комплементарной РНК, они могут не приводить к её деградации, но нарушать трансляцию соответствующего белка;

- образовавшиеся РНК могут сами служить матрицей для синтеза коротких пептидов, токсичных для клетки;

- образовавшиеся РНК могут быть предшественниками микроРНК, блокирующих трансляцию других клеточных генов.

В будущем планируется подробно рассмотреть и экспериментально

проверить эти гипотезы.

ВЫВОДЫ:

1. С целью установления межвидовой распространенности экспериментально выявленных нами химерных РЭ, образующихся путем смены матрицы при обратной транскрипции L1, проведен анализ геномных баз данных различных видов эукариот. Показано, что:

а) образование химерных РЭ является эволюционно консервативным механизмом, распространенным не только у млекопитающих, но и у грибов;

б) смена матрицы в процессе ретротранспозиции LINE элементов Mus musculus и Rattus norvégiens происходит вдвое чаще, чем в случае L1 РЭ человека;

в) в ходе обратной транскрипции LINE-ретротранспозонов могут происходить не только однократные, но и двукратные смены матрицы, приводя, таким образом, к образованию химер, состоящих из трех компонентов.

2. Экспериментально установлено, что LTR, расположенные в интронах генов SLB и SLC, являются транскрипционно активными. Транскрипты, начинающиеся в LTR, являются антисмысловыми по отношению к соответствующему гену и комплементарны, по крайней мере, близлежащему экзону.

3. Показано, что антисмысловые транскрипты, начинающиеся в LTR, могут оказывать влияние как на уровень транскрипции соответствующего гена (предположительно за счет РНК-интерференции), так и на общую жизнеспособность клеток.

4. Таким образом, установлено, что активность РЭ семейств L1 и HERV-K (HML-2) может вызывать как структурные изменения генома, так и влиять на активность близлежащих генов.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ ДИССЕРТАЦИИ ИЗЛОЖЕНЫ В СЛЕДУЮЩИХ РАБОТАХ:

Публикации в научных журналах:

1. Е. Kovalskaya, A. Buzdin, Е. Gogvadze, Т. Vinogradova, Е. Sverdlov. Functional human endogenous retroviral LTR transcription start sites are located between the R and U5 regions. Virology, 2006, Mar 15; 346(2):373-8

2. E.B. Гогвадзе, A.A. Буздин. Новый механизм образования ретрогенов в геномах млекопитающих: рекомбинация in vivo при обратной транскрипции РНК. Молекулярная Биология, 2005, том 39, №3, с364-373 (Обзор)

3. Е.В.Гогвадзе, А.А. Буздин, Е.Д. Свердлов. Смена матриц при LINE-опосредованной обратной транскрипции — наиболее вероятный механизм формирования двойных и тройных химерных ретроэлементов млекопитающих. Биоорганическая ХимияД005, том 31, №1, с. 82-89

4. Buzdin A, Gogvadze Е, Kovalskaya Е, Volchkov Р, Ustyugova S, Illarionova A, Fushan A, Vinogradova Т, Sverdlov Е. The human genome contains many types of chimeric retrogenes generated through in vivo RNA recombination. Nucleic Acids Res. 2003 Aug l;31(15):4385-90

5. Buzdin A., Ustugova S., Gogvadze E., Lebedev Y., Vinogradova Т., Sverdlov E. A new family of chimeric retrotranscripts formed by a full copy of U6 snRNA fused to the 3' terminus of LI. Genomics 2002 Oct; 80(4): 402-406

Материалы российских и международных научных конференций:

1. Е. Gogvadze, Е. Kovalskaya, A. Buzdin, Т. Vinogradova, Е. Sverdlov Mapping of transcriptional start site within solitary and proviral HER V-K LTRs. 20th IUBMB International congress of biochemistry and molecular biology and 11th FAOBMB congress, 2006, Kyoto, Japan; стр 753

2. A.A. Buzdin, E.V. Gogvadze, E.A. Kovalskaya, T.V. Vinogradova, Y.B.Lebedev, E.D. Sverdlov.Template switches during LI directed reverse transcription produce double and triple chimeric retroelements in mammals. FASEB summer research conferences "Mammalian Mobile Elements". 2005, Tuscon, Arizona; стр 34

3. A.A. Buzdin, E.V. Gogvadze, E.D. Sverdlov. Multiple template switches during LINE directed reverse transcription is the most probable mechanism of the double and triple chimeric retroelement formation in mammals. Mobile DNA und Transposition: Evolution, Mechanismen und Anwendungen, 2005, Wittenberg, Germany; стр 12

4. E. Gogvadze, A. Buzdin, E. Kovalskaya, P. Volchkov, S. Ustyugova, A. Illarionova, A. Fushan, T. Vinogradova, E. Sverdlov. Multiple template switches during LINE-directed reverse transcription is a general mechanism of the chimeric retroetement formation in mammals. 29th Meeting of the Federation of European Biochemical Societies, 2004, Warsaw, Poland; crp 31

5. Buzdin A., Gogvadze E., Ustyugova S., Kovalskaya E., Volchkov P., Vinogradova T., Lebedev Y., Sverdlov E. The human genome contains many types of chimeric retrogenes generated by recombination of different transcribed sequences. 2nd International Workshop. Retrotransposons and Genome Evolution, 2003, Sochy, Russia; crp 11

6. A. Buzdin, E.Gogvadze, S. Ustyugova, E. Kovalskaya, P.Volchkov, T. Vinogradova, Y. Lebedev, E. Sverdlov. Human genome contains many types of chimeric retrogenes generated by recombination of different transcribed sequences. EMBO Lecture Course on New Developments in Genomics for Biomedicine, 2003, Slovenia; crp 41

Принято к исполнению 27/02/2007 Исполнено 28/02/2007

Заказ № 145 Тираж: 100 экз.

Типография «11-й ФОРМАТ» ИНН 7726330900 115230, Москва, Варшавское ш., 36 (495) 975-78-56 www.autoreferat.ru

Содержание диссертации, кандидата биологических наук, Гогвадзе, Елена Владимировна

СПИСОК СОКРАЩЕНИЙ.

ВВЕДЕНИЕ. 4 ОБЗОР ЛИТЕРАТУРЫ.

Глава I. Ретроэлементы и их влияние на реорганизацию генома и функционирование клетки.

I. Краткая характеристика ретроэлементов 5 ЬШЕ-ретротранспозоны. 7 БШЕ-ретротранспозоны. 1 Процессированные псевдогены. 8 ЬТЯ-ретротранспозоны и эндогенные ретровирусы. 8 Интроны группы II (ретроинтроны). 9 Реперок - подобные элементы.

II. Роль мобильных элементов в реорганизации генома и клеточном функционировании.

1. Интеграция ретротранспозонов в геном и её роль в возникновении новых химерных элементов.

2. Образование новых клеточных белков при использовании промоторов, сигнала полиаденилирования, а также сайтов сплайсинга ретроэлементов. 13 Образование альтернативных транскриптов при использовании промоторов ретроэлементов. 14 Терминация транскрипции на сигнале полиаденилирования ретроэлементов и ее роль в образовании новых форм клеточных белков.

Образование химерных генов за счет альтернативного сплайсинга.

3. Повторяющиеся элементы и рекомбинация.

4. Ы-трансдукция.

5. Активность антисмыслового промотора.

6. Псевдогены и образование химерных элементов.

7. Смена матриц при обратной транскрипции (на примере ретровирусов).

8. Влияние кодируемых автономными ретроэлементами белков на функционирование клетки.

Глава II. Регуляция экспрессии клеточных генов посредством РНК-интерференции и применение данного метода в научных исследованиях.

I. Посттранскрипционная регуляция генной активности. 33 Образование коротких дцРНК. 34 Сборка активного RISC. 37 Функционирование образовавшегося активного RISC.

II. Регуляция активности генов на уровне ДНК. 41 РНК-опосредованное метилирование ДНК. 41 РНК-опосредованное формирование гетерохроматина. 43 Удаление участков ДНК в процессе формирования макронуклеуса ресничных простейших.

Инактивация неспаренной в ходе мейоза ДНК.

III. Применение РНК-интерференции в молекулярно-генетических исследованиях. 48 ЭКСПЕРИМЕНТАЛЬНАЯ ЧАСТЬ.

Обоснование работы и поставленные задачи.

Материалы и методы.

Результаты и их обсуждение.

Поиск химерных ретрогенов, образующихся за счет смены матрицы при обратной транскрипции ретроэлементов LI, в геномах эукариот.

Изучение влияния человек-специфических ретроэлементов

HERV-K (HML-2) на транскрипцию близлежащих генов.

ВЫВОДЫ.

Введение Диссертация по биологии, на тему "Влияние человек-специфических ретроэлементов семейств L1 и HERV-K(HML-2) на структуру генома и функционирование близлежащих генов"

Мобильные элементы - это фрагменты ДНК, способные размножаться и перемещаться в геноме. С момента их открытия Барбарой МакКлинток в геноме кукурузы прошло уже более 50 лет. За это время отношение учёных к данному классу последовательностей ДНК менялось от отрицания их функциональной значимости и отнесения их к «клеточному мусору» до приписывания мобильным элементам важной роли в эволюции организмов и, в том числе, даже в формировании вида Homo sapiens. В настоящее время, когда известно, что мобильные элементы составляют значительную часть практически всех изученных геномов и описано множество примеров их влияния на функционирование организма, трудно продолжать считать их всего лишь «ненужным балластом клетки».

Большинство мобильных элементов млекопитающих образуется в результате обратной транскрипции своей РНК и последующей интеграции кДНК-копии в геном (ретроэлементы). Ретроэлементы могут играть существенную роль в изменчивости и эволюции геномов путём взаимодействий с окружающими их последовательностями и близлежащими генами. Они могут служить мишенями рекомбинации, предоставлять новые промоторы, энхансеры и сайты терминации транскрипции, становиться частью кодирующей белок последовательности, играть важную роль в «перетасовке» экзонов, выполнять структурную функцию. Внедрения ретроэлементов в новые позиции генома могут наносить организму непоправимый вред и приводить к развитию различных заболеваний, однако также они могут приводить к появлению новых фенотипических признаков, являющихся предметом естественного отбора, способствуя, таким образом, эволюционным процессам.

Данная работа посвящена анализу новых механизмов возникновения геномных перестроек за счет активности ретроэлементов, а также изучению возможности влияния ретротанспозонов на функционирование клетки путем регуляции активности близлежащих генов.

ОБЗОР ЛИТЕРАТУРЫ. Глава I. Ретроэлементы и их влияние на реорганизацию генома и функционирование клетки.

Геном эукариот представляет собой очень сложную и динамичную структуру. Только небольшая часть генома человека (3-5%) является белок кодирующими последовательностями, в то время как до 50% ДНК представлено мобильными элементами. Мобильные элементы представляют собой повторяющиеся последовательности ДНК, способные менять свое местоположение в геноме [1]. Впервые они были описаны Барбарой МакКлинток в геноме кукурузы [2]. С тех пор мобильные элементы были обнаружены в геномах практически всех организмов. Так, например, они составляют более 50% ДНК кукурузы (Zea mays) [3, 4], 22% генома Drosophila [5] и 42% ДНК человека [6]. Долгое время эту часть генома считали «мусором», ненужным балластом, называли эгоистичной ДНК. Однако в последнее время многие склоняются к мысли, что мобильные элементы могут играть существенную роль в изменчивости и эволюции геномов [7]

Различают два основных класса мобильных элементов. Класс I представляет собой ретроэлементы - мобильные элементы, размножающиеся посредством РНК-копий своего генома. Для транспозиции они используют фермент РНК-зависимую ДНК-полимеразу (альтернативные названия этого фермента: обратная транскриптаза (reverse transcriptase -RT), ревертаза), которая осуществляет синтез ДНК на матрице РНК. Класс II включает в себя элементы, которые перемещаются непосредственно с помощью своих ДНК-копий (так называемые ДНК-транспозоны). Их транспозиция осуществляется путем вырезания и реинтеграции в новое место генома.

Данная часть обзора посвящена ретроэлементам, их характеристике и возможной роли в функционировании геномов эукариот.

I. Краткая характеристика ретроэлементов.

Термин "ретроэлементы" относится к обширному классу последовательностей нуклеиновых кислот, появление и/или поддержание которых в клеточном геноме так или иначе связано с процессом переноса генетической информации от РНК к ДНК, называемым обратной транскрипцией. Все ретроэлементы, как правило, разделяют на содержащие длинные концевые повторы (long terminal repeats, LTRs) - эндогенные ретровирусы; и не содержащие их (non-LTR) - длинные диспергированные повторы (Long Interspersed Nuclear Elements, LINEs), короткие диспергированные повторы (Short Interspersed Nuclear Elements, SINEs) и процессированные псевдогены (Рис1). Эндогенные ретровирусы и LINE относят к автономным элементам (ретро/и/?а«спозонам), поскольку они содержат последовательности, кодирующие белки, необходимые для обратной транскрипции и последующей интеграции кДНК-копии ретроэлемента в геном. SINEs и процессированные псевдогены являются неавтономными элементами (ретропозоны), так как они не имеют собственных функциональных генов и перемещаются по геному пассивно [8]. Предполагается, что для перемещения по геному эти элементы используют аппарат транспозиции LINE [9]. В состав мобильных ретроэлементов включают ещё стоящую особняком группу - ретроинтроны (мобильные интроны группы II), а также открытые недавно в геноме Drosophila virilis Penelope- подобные элементы [10].

РГ vp

HERV t> ltr >с i i r~ltr~» gag po! env

Pr

Одиночный LTR [>| ltr >c>

Pr

LINE t>-—' '-AAAAO

5'UTR ORF1 ORF2 3'UTR

SINE

Pr

-AAAAO

Ретропсевдоген [> i i i i AAAAO exonl exon2 ехопЗ exon4

Рисунок 1. Схема строения различных ретроэлементов. белые треугольники обозначают дупликации сайта мишени, образовавшиеся в результате интеграции RE).

Основная гипотеза происхождения ретроэлементов была предложена Теминым [11]. Она заключается в следующем: ретроэлементы могли эволюционировать вместе с геном обратной транскриптазы, т.е. происходила последовательная специализация РНК-зависимой ДНК-полимеразы. Предполагаемый путь эволюции шёл от гена обратной транскриптазы, через LTR-несодержащие ретротранспозоны, к LTR-содержащим ретротранспозонам и ретровирусам. Анализ структуры различных классов ретроэлементов, представленных в геномах эукариот, показывает постепенное приобретение предшественниками эндогенных ретровирусов (ERV, англ. endogenous retrovirus) дополнительных ферментативных активностей - РНКазы Н, интегразы (IN), протеазы (PR), а также некоторых регуляторных белков. Одновременно происходила успешная ассоциация этого предшественника с последовательностями, влияющими на его регуляторный потенциал (такими как LTR). Есть некоторые подтверждения этой гипотезы. Филогенетический анализ последовательностей гена обратной транскриптазы показал, что ретроинтроны и LINE (ретротранспозоны, не содержащие LTR) являются более древней формой, чем ретро вирусы [8].

LINE - ретротранспозоны.

LINE элементы (Long Interspersed Nuclear Elements) имеют длину 4-8 т.п.о. и содержат, как правило, 5'-нетранслируемую область (Untranslated region, UTR), две открытые рамки считывания (ORF - Open Reading Frame), 3' UTR и поли A последовательность на 3' конце [12]. В их геномных копиях часто недопредставлены 5'-концевые области, что, по-видимому, объясняется абортивной обратной транскрипцией, в ходе которой обратная транскриптаза отделяется от матрицы РНК, не успев осуществить синтез полной копии кДНК. 5'-UTR содержит внутренний промотор для РНК-полимеразы II. ORF1 кодирует РНК-связывающий белок р40, a ORF2 - эндонуклеазу и обратную транскриптазу, необходимые для размножения LINE ретроэлементов в геноме. По краям LINE имеются короткие прямые повторы (SDRs - Short Direct Repeats) длиной 7-20 п. о., представляющие собой дупликацию сайта мишени (TSD - Target Site Duplication). Реакция обратной транскрипции РНК LINE элементов происходит в ядре по типу TPRT (Target Primed Reverse Transcription), в ходе которой на РНК матрице синтезируется цепь кДНК в месте её будущей интеграции. Таким образом, этот класс элементов считается автономным, поскольку необходимые для ретротранспозиции белки кодируются нуклеотидной последовательностью самого элемента.

LINE-ретротранспозоны широко распространены в геномах эукариот. Они были найдены в ДНК грибов, растений, беспозвоночных и позвоночных животных и составляют около 17% генома человека [6]. Более 75% генов человека содержат по крайней мере одну инсерцию ретроэлемента LI (LINE-1), в большинстве случаев в интроне, 3' или 5' нетранслируемой области [12].

SINE-ретроэлементы.

SINE (Short Interspersed Nuclear Elements) - короткие диспергированные повторы составляют около 13-14 % человеческого генома. Этот класс ретроэлементов включает в себя неавтономные ретротранспозоны длиной менее 500 п. о. В отличие от LINE, они не содержат кодирующих последовательностей и, следовательно, при транспозиции должны использовать обратную транскриптазу из других источников. Предполагается, что в качестве таких «доноров» выступают как раз LINE элементы [13]. Последовательность SINE обычно заканчивается олиго (А) -трактом, реже - блоком другого (обычно А-богатого) микросателлита [14]. В человеческом геноме, как и в геноме других приматов, SINE представлены в основном двумя семействами: MIR (Mammalian-wide Interspersed Repeats) (тРНК-подобные SINE; 2% генома человека) и Alu (7SL-PHK подобные SINE; 10% генома человека) [6]. Считается, что приблизительно одно из 200 рождений сопровождается новым внедрением Alu-элемента [15].

Процессированные псевдогены.

Псевдогенами называют транскрипционно неактивные последовательности ДНК, гомологичные известным клеточным генам. Большинство псевдогенов возникло в результате обратной транскрипции РНК различных генов и интеграции образовавшейся копии ДНК в геном. Эти элементы, как правило, не содержат интронов, имеют на 3'-конце поли(А)- последовательность и окружены прямыми повторами. Такие псевдогены носят название процессированных (от англ. processed pseudogenes) [16]. Учитывая структуру самих псевдогенов, а также ДНК, окружающей внедрение, наиболее вероятным источником обратной транскриптазы считаются LINE.

LTR-ретротранспозоны и эндогенные ретровирусы.

LTR-ретротранспозоны - достаточно разнородная группа повторяющихся элементов, объединяемых наличием LTR (Long Terminal Repeats; Длинные Концевые Повторы), указывающего на ретровирусное происхождение. Длина этих элементов варьирует от 4 до 12 т.п.н. Протяженность LTR составляет у разных семейств от 77 до 3600 п.н. Эти структуры обнаруживаются только у ДНК-копий элементов, они имеют сложное строение, содержат множество регуляторных последовательностей и их появление является следствием использования особого способа синтеза кДНК. Все LTR ретропозоны составляют около 8 % человеческого генома и представлены 450 тысячами копий [17].

Эндогенные ретровирусы (HERVs-Human Endogenous Retroviruses) - это повторяющиеся мобильные генетические элементы геномов млекопитающих, сходные по структуре с интегрированной формой экзогенных ретровирусов. По современным представлениям HERV являются отпечатками древних экзогенных ретровирусов, заразивших клетки линии зародышевого пути и закрепившихся в геноме [18]. Типичный полноразмерный HERV имеет длину 3.3 - 10 тысяч пар оснований и содержит гомологи основных ретровирусных генов gag, pol, иногда prt и env, которые фланкированы длинными концевыми повторами на 5' и 3' концах. LTR содержат набор регуляторных последовательностей и состоят из 3-х частей, называемых U3 (3' уникальный район), R (повторяющийся участок) и U5 (5' уникальный район). Большинство регуляторных элементов - промотор, энхансер и рецепторы транскрипционных факторов -сосредоточены в U3 области, за исключением сигнала полиаденилирования в R области и негативного регуляторного элемента в U5 области [19, 20]. Все провирусы и одиночные LTR фланкированы в геноме короткими прямыми повторами (обычно 3-6 пар оснований), представляющими собой дупликацию сайта интеграции.

Помимо полноразмерных провирусов, число которых, как правило, незначительно (от 1 до нескольких десятков элементов для каждого семейства), в геноме встречается большое количество копий, содержащих обширные делеции, в основном в областях env и gag, а также одиночные LTR. [21]. Считается, что одиночные LTR возникали благодаря рекомбинации между двумя LTR полноразмерного провируса с вырезанием кодирующей части. У подавляющего большинства HERV кодирующие части повреждены терминирующими кодонами, делениями и мутациями, сдвигающими рамку считывания. Поэтому лишь немногие из них транскрипционно активны и проявляют способность к экспрессии генов белков, формирующих вирус-подобные частицы.

Интроны группы II (ретроинтроны).

Старейшей среди LTR-несодержащих ретротранспозонов считают группу ретроинтронов, или интронов группы II. Это один из двух классов самосплайсирующихся интронов, которые находятся в геномах прокариот или органелл эукариот [22, 23]. В геноме интронов группы II содержится одна открытая рамка считывания (ORF), которая кодирует белок, содержащий 3 домена: домен обратной транскриптазы (RT), домен эндонуклеазы (Zn домен) и домен, функция которого пока не установлена (X домен). Кроме того, РНК ретроинтронов обладает рибозимной активностью, в результате которой осуществляется самосплайсинг РНК интронов группы II из пре-мРНК содержащих их генов. По всей видимости, интроны группы II являются предками ретротранспозонов, не содержащих LTR, т.е. LINE. Об этом свидетельствуют данные филогенетического анализа последовательностей домена RT различных ретроэлементов. Кроме того, вероятно, именно от ретроинтронов произошли некоторые малые ядерные РНК, осуществляющие сплайсинг пре-мРНК эукариот.

Penelope - подобные элементы.

Penelope - подобные элементы представляют собой необычный класс ретротранспозонов, отличающихся как от LTR-содержащих, так и от не содержащих LTR ретроэлементов [10]. Penelope были впервые обнаружены в геноме Drosophila virilis как элементы, играющие основную роль в процессе гибридного дисгенеза данного вида мух (гибридный дисгенез, в данном случае, - явление, наблюдающееся при скрещивании самок, не несущих Penelope, с самцами, геном которых содержит несколько копий активного ретроэлемента, и проявляется в повышенном уровне инсерций мобильных элементов и стерильности потомства F1). После этого Penelope - подобные элементы были найдены в геномных базах данных многих эукариот, включая ракообразных, червей, коловраток, рыб, амфибий и пресмыкающихся. Эти транспозоны содержат одну ORF, кодирующую обратную транскриптазу и эндонуклеазу, которые отличаются от соответствующих белков LTR-содержащих и non-LTR ретроэлементов. Эндонуклеаза Penelope - подобных элементов относится к семейству URI, которое также включает GIY-YIG эндонуклеазу интронов группы I и бактериальный белок UvrC, участвующий в эксцизионной репарации. Обратная транскриптаза данных ретротранспозонов больше всего напоминает RT-домен теломеразы. Оба кодируемых Penelope - подобными элементами белка являются функционально активными, однако механизм перемещения данных ретротранспозонов в геноме пока остается невыясненным [24].

Ретроэлементы оказывают существенное влияние на функционирование и эволюцию генома эукариот. Их интеграции в различные участки геномной ДНК могли придавать организму либо определённые преимущества по отношению к другим, либо же, наоборот, могли снижать жизненный статус организма и приводить к его гибели. Показано, что внедрения транспозонов могут изменять регуляторные участки генов, вызывать хромосомные перестройки и изменения структуры хроматина, могут даже участвовать в процессе удлинения теломер, а также в репарации ДНК [1, 3, 4, 25-27]. Биоинформатический анализ генов человека выявил преимущественную представленность мобильных элементов в мРНК быстро эволюционирующих генов, таких как гены иммунного ответа, а также реакции на стресс и внешние стимулы [28]. Этот факт отражает активную роль мобильных элементов в изменении и развитии генных семейств и, таким образом, в эволюции человека.

В следующей части данного обзора рассматривается участие ретротранспозонов в образовании мобильных элементов, возникновении новых химерных генов, а также регуляции экспрессии уже существующих. Кроме того, отдельное внимание уделяется влиянию белков ретротранспозонов на функционирование клетки.

II. Роль мобильных элементов в реорганизации генома и клеточном функционировании.

Заключение Диссертация по теме "Молекулярная биология", Гогвадзе, Елена Владимировна

ВЫВОДЫ:

1. С целью установления межвидовой распространенности экспериментально выявленных нами химерных ретроэлементов, образующихся путем смены матрицы при обратной транскрипции L1, проведен анализ геномных баз данных различных эукариот. Показано, что: а) образование химерных ретроэлементов является эволюционно консервативным механизмом, распространенным не только у млекопитающих, но и у грибов; б) смена матрицы в процессе ретротранспозиции LINE элементов Mus musculus и Rattus norvegicus происходит вдвое чаще, чем в случае L1 ретроэлементов человека; в) в ходе обратной транскрипции LINE-ретротранспозонов могут происходить не только однократные, но и двукратные смены матрицы, приводя, таким образом, к образованию химер, состоящих из трех компонентов.

2. Экспериментально установлено, что LTR, расположенные в интронах генов SLB и SLC, являются транскрипционно активными. Транскрипты, начинающиеся в LTR, являются антисмысловыми по отношению к соответствующему гену и комплементарны, по крайней мере, близлежащему экзону.

3. Показано, что антисмысловые транскрипты, начинающиеся в LTR, могут оказывать влияние как на уровень транскрипции соответствующего гена (предположительно за счет РНК-интерференции), так и на общую жизнеспособность клеток.

4. Таким образом, установлено, что активность ретроэлементов семейств L1 и HERV-K (HML-2) может вызывать как структурные изменения генома, так и влиять на активность близлежащих генов.

Библиография Диссертация по биологии, кандидата биологических наук, Гогвадзе, Елена Владимировна, Москва

1. Kazazian HH, Jr.: Mobile elements: drivers of genome evolution. Science 2004, 303(5664):1626-1632.

2. McClintock B: Controlling elements and the gene. Cold Spring Harb Symp Quant Biol 1956,21:197-216.

3. Kidwell MG, Lisch D: Transposable elements as sources of variation in animals and plants. Proc Natl AcadSci USA 1997,94(15):7704-7711.

4. Wessler SR: Transposable elements and the evolution of gene expression. Symp Soc Exp Biol 1998,51:115-122.

5. Kapitonov VV, Jurka J: Molecular paleontology of transposable elements in the Drosophila melanogaster genome. Proc Natl Acad Sci USA 2003,100(11):6569-6574.

6. Lander ES, Linton LM, Birren B, Nusbaum C, Zody MC, Baldwin J, Devon K, Dewar K, Doyle M, FitzHugh W et al: Initial sequencing and analysis of the human genome. Nature 2001,409(6822):860-921.

7. Makalowski W: Genomic scrap yard: how genomes utilize all that junk. Gene 2000, 259(l-2):61-67.

8. Leib-Mosch C, Seifarth W: Evolution and biological significance of human retroelements. Virus Genes 1995,11(2-3):133-145.

9. Ohshima K, Hamada M, Terai Y, Okada N: The 3' ends of tRNA-derived short interspersed repetitive elements are derived from the 3' ends of long interspersed repetitive elements. Mol Cell Biol 1996,16(7):3756-3764.

10. Evgen'ev MB, Arkhipova IR: Penelope-like elements--a new class of retroelements: distribution, function and possible evolutionary significance. Cytogenet Genome Res 2005,110(l-4):510-521.

11. Temin HM: Retrovirus variation and reverse transcription: abnormal strand transfers result in retrovirus genetic variation. Proc Natl Acad Sci USA 1993,90(15):6900-6903.

12. Han JS, Boeke JD: LINE-1 retrotransposons: modulators of quantity and quality of mammalian gene expression? Bioessays 2005,27(8):775-784.

13. Eickbush TH: Transposing without ends: the non-LTR retrotransposable elements. New Biol 1992,4(5):430-440.

14. Nadir E, Margalit H, Gallily T, Ben-Sasson SA: Microsatellite spreading in the human genome: evolutionary mechanisms and structural implications. Proc Natl Acad Sci U SA 1996,93(13):6470-6475.

15. Deininger PL, Batzer MA: Alu repeats and human disease. Mol Genet Metab 1999, 67(3):183-193.

16. Weiner AM, Deininger PL, Efstratiadis A: Nonviral retroposons: genes, pseudogenes, and transposable elements generated by the reverse flow of genetic information. Annu RevBiochem 1986,55:631-661.

17. Li WH, Gu Z, Wang H, Nekrutenko A: Evolutionary analyses of the human genome. Nature 2001,409(6822):847-849.

18. Sverdlov ED: Perpetually mobile footprints of ancient infections in human genome. FEBSLett 1998,428(1-2): 1-6.

19. Domansky AN, Kopantzev EP, Snezhkov EV, Lebedev YB, Leib-Mosch C, Sverdlov ED: Solitary HERV-K LTRs possess bi-directional promoter activity and contain a negative regulatory element in the U5 region. FEBSLett 2000,472(2-3): 191-195.

20. Schon U, Seifarth W, Baust C, Hohenadl C, Erfle V, Leib-Mosch C: Cell type-specific expression and promoter activity of human endogenous retroviral long terminal repeats. Virology 2001,279(1):280-291.

21. Mager DaM, P: Retroviral Repeat Sequences. In: Encyclopedia of the Human Genome. Nature Publishing Group; 2002.

22. Martinez-Abarca F, Toro N: Group II introns in the bacterial world. Mol Microbiol 2000, 38(5):917-926.

23. Zimmerly S, Hausner G, Wu X: Phylogenetic relationships among group II intron ORFs. Nucleic Acids Res 2001,29(5): 1238-1250.

24. Pyatkov KI, Arkhipova IR, Malkova NV, Finnegan DJ, Evgen'ev MB: Reverse transcriptase and endonuclease activities encoded by Penelope-like retroelements. Proc Natl Acad Sci USA 2004,101(41):14719-14724.

25. Jurka J: Repeats in genomic DNA: mining and meaning. Curr Opin Struct Biol 1998, 8(3):333-337.

26. Smit AF: Interspersed repeats and other mementos of transposable elements in mammalian genomes. Curr Opin Genet Dev 1999, 9(6):657-663.

27. Malik HS, Eickbush TH: Phylogenetic analysis of ribonuclease H domains suggests a late, chimeric origin of LTR retrotransposable elements and retroviruses. Genome Res 2001,11(7):1187-1197.

28. Gilbert N, Labuda D: CORE-SINEs: eukaryotic short interspersed retroposing elements with common sequence motifs. Proc Natl Acad Sci USA 1999, 96(6):2869-2874.

29. Kramerov DA, Vassetzky NS: Structure and origin of a novel dimeric retroposon Bl-diD. J Mol Evol 2001,52(2):137-143.

30. Bannert N, Kurth R: Retroelements and the human genome: new perspectives on an old relation. Proc Natl Acad Sci USA 2004,101 Suppl 2:14572-14579.

31. Babushok DV, Ostertag EM, Kazazian HH, Jr.: Current topics in genome evolution: Molecular mechanisms of new gene formation. Cell Mol Life Sci 2007,64(5):542-554.

32. Hamdi HK, Nishio H, Tavis J, Zielinski R, Dugaiczyk A: Alu-mediated phylogenetic novelties in gene regulation and development. J Mol Biol 2000,299(4):931-939.

33. Medstrand P, Landry JR, Mager DL: Long terminal repeats are used as alternative promoters for the endothelin B receptor and apolipoprotein C-I genes in humans. J Biol Chem 2001,276(3): 1896-1903.

34. Murnane JP, Morales JF: Use of a mammalian interspersed repetitive (MIR) element in the coding and processing sequences of mammalian genes. Nucleic Acids Res 1995, 23(15):2837-2839.

35. Nekrutenko A, Li WH: Transposable elements are found in a large number of human protein-coding genes. Trends Genet 2001,17(11):619-621.

36. Romanish MT, Lock WM, de Lagemaat LN, Dunn CA, Mager DL: Repeated Recruitment of LTR Retrotransposons as Promoters by the Anti-Apoptotic Locus NAIP during Mammalian Evolution. PLoS Genet 2007,3(l):el0.

37. Buzdin A, Kovalskaya-Alexandrova E, Gogvadze E, Sverdlov E: GREM, a technique for genome-wide isolation and quantitative analysis of promoter active repeats. Nucleic Acids Res 2006,34(9):e67.

38. Buzdin A, Kovalskaya-Alexandrova E, Gogvadze E, Sverdlov E: At least 50% of human-specific HERV-K (HML-2) long terminal repeats serve in vivo as active promoters for host nonrepetitive DNA transcription. J Virol 2006, 80(21):10752-10762.

39. Tang W, Gunn TM, McLaughlin DF, Barsh GS, Schlossman SF, Duke-Cohan JS: Secreted and membrane attractin result from alternative splicing of the human ATRN gene. Proc Natl Acad Sci USA 2000, 97(11):6025-6030.

40. Wheelan SJ, Aizawa Y, Han JS, Boeke JD: Gene-breaking: a new paradigm for human retrotransposon-mediated gene evolution. Genome Res 2005,15(8):1073-1078.

41. Baust C, Seifarth W, Germaier H, Hehlmann R, Leib-Mosch C: HERV-K-T47D-Related long terminal repeats mediate polyadenylation of cellular transcripts. Genomics 2000, 66(1):98-103.

42. Mager DL, Hunter DG, Schertzer M, Freeman JD: Endogenous retroviruses provide the primary polyadenylation signal for two new human genes (HHLA2 and HHLA3). Genomics 1999,59(3):255-263.

43. Brosius J: RNAs from all categories generate retrosequences that may be exapted as novel genes or regulatory elements. Gene 1999,238(1):115-134.

44. Sorek R, Ast G, Graur D: Alu-containing exons are alternatively spliced. Genome Res 2002,12(7): 1060-1067.

45. Hasler J, Strub K: Alu elements as regulators of gene expression. Nucleic Acids Res 2006,34(19):5491-5497.

46. Ganguly A, Dunbar T, Chen P, Godmilow L, Ganguly T: Exon skipping caused by an intronic insertion of a young Alu Yb9 element leads to severe hemophilia A. Hum Genet 2003,113(4):348-352.

47. Meischl C, Boer M, Ahlin A, Roos D: A new exon created by intronic insertion of a rearranged LINE-1 element as the cause of chronic granulomatous disease. Eur J Hum Genet 2000, 8(9):697-703.

48. Shimamura M, Nikaido M, Ohshima K, Okada N: A SINE that acquired a role in signal transduction during evolution. Mol Biol Evol 1998,15(7):923-925.

49. Caras IW, Davitz MA, Rhee L, Weddell G, Martin DW, Jr., Nussenzweig V: Cloning of decay-accelerating factor suggests novel use of splicing to generate two proteins. Nature 1987,325(6104):545-549.

50. Barnett TR, Drake L, Pickle W, 2nd: Human biliary glycoprotein gene: characterization of a family of novel alternatively spliced RNAs and their expressed proteins. Mol Cell Biol 1993,13(2): 1273-1282.

51. Lindeskog M, Medstrand P, Cunningham AA, Blomberg J: Coamplification and dispersion of adjacent human endogenous retroviral HERV-H and HERV-E elements; presence of spliced hybrid transcripts in normal leukocytes. Virology 1998,244(1):219-229.

52. Kolomietz E, Meyn MS, Pandita A, Squire JA: The role of Alu repeat clusters as mediators of recurrent chromosomal aberrations in tumors. Genes Chromosomes Cancer 2002,35(2):97-l 12.

53. Burwinkel B, Kilimann MW: Unequal homologous recombination between LINE-1 elements as a mutational mechanism in human genetic disease. J Mol Biol 1998, 277(3):513-517.

54. Segal Y, Peissel B, Renieri A, de Marchi M, Ballabio A, Pei Y, Zhou J: LINE-1 elements at the sites of molecular rearrangements in Alport syndrome-diffuse leiomyomatosis. Am J Hum Genet 1999,64(l):62-69.

55. Morrish TA, Gilbert N, Myers JS, Vincent BJ, Stamato TD, Taccioli GE, Batzer MA, Moran JV: DNA repair mediated by endonuclease-independent LINE-1 retrotransposition. Nat Genet 2002,31 (2): 159-165.

56. Hayakawa T, Satta Y, Gagneux P, Varki A, Takahata N: Alu-mediated inactivation of the human CMP- N-acetylneuraminic acid hydroxylase gene. Proc Natl Acad Sci USA 2001,98(20): 11399-11404.

57. Kamp C, Hirschmann P, Voss H, Huellen K, Vogt PH: Two long homologous retroviral sequence blocks in proximal Yql 1 cause AZFa microdeletions as a result of intrachromosomal recombination events. Hum Mol Genet 2000,9(17):2563-2572.

58. Ostertag EM, Kazazian HH, Jr.: Biology of mammalian LI retrotransposons. Annu Rev Genet 2001,35:501-538.

59. Holmes SE, Dombroski BA, Krebs CM, Boehm CD, Kazazian HH, Jr.: A new retrotransposable human LI element from the LRE2 locus on chromosome lq produces a chimaeric insertion. Nat Genet 1994, 7(2): 143-148.

60. Martin SL: Characterization of a LINE-1 cDNA that originated from RNA present in ribonucleoprotein particles: implications for the structure of an active mouse LINE-1. Gene 1995,153(2):261-266.

61. Rozmahel R, Heng HH, Duncan AM, Shi XM, Rommens JM, Tsui LC: Amplification of CFTR exon 9 sequences to multiple locations in the human genome. Genomics 1997, 45(3):554-561.

62. Goodier JL, Ostertag EM, Kazazian HH, Jr.: Transduction of 3'-flanking sequences is common in LI retrotransposition. Hum Mol Genet 2000,9(4):653-657.

63. Pickeral OK, Makalowski W, Boguski MS, Boeke JD: Frequent human genomic DNA transduction driven by LINE-1 retrotransposition. Genome Res 2000,10(4):411-415.

64. Moran JV, DeBerardinis RJ, Kazazian HH, Jr.: Exon shuffling by LI retrotransposition. Science 1999,283(5407): 1530-1534.

65. Long M: Evolution of novel genes. Curr Opin Genet Dev 2001,11(6):673-680.

66. Speek M: Antisense promoter of human LI retrotransposon drives transcription of adjacent cellular genes. Mol Cell Biol 2001,21(6):1973-1985.

67. Matlik K, Redik K, Speek M: LI antisense promoter drives tissue-specific transcription of human genes. J Biomed Biotechnol 2006,2006(1):71753.

68. Dunn CA, Romanish MT, Gutierrez LE, van de Lagemaat LN, Mager DL: Transcription of two human genes from a bidirectional endogenous retrovirus promoter. Gene 2006, 366(2):335-342.

69. Zaiss DM, Kloetzel PM: A second gene encoding the mouse proteasome activator PA28beta subunit is part of a LINE1 element and is driven by a LINE1 promoter. J Mol Biol 1999,287(5):829-835.

70. Long M, Wang W, Zhang J: Origin of new genes and source for N-terminal domain of the chimerical gene, jingwei, in Drosophila. Gene 1999,238(1): 135-141.

71. Long M, Langley CH: Natural selection and the origin of jingwei, a chimeric processed functional gene in Drosophila. Science 1993,260(5104):91 -95.

72. Hu WS, Rhodes T, Dang Q, Pathak V: Retroviral recombination: review of genetic analyses. Front Biosci 2003, 8:d 143-155.

73. Negroni M, Buc H: Copy-choice recombination by reverse transcriptases: reshuffling of genetic markers mediated by RNA chaperones. Proc Natl Acad Sci U SA 2000, 97(12):6385-6390.

74. Swanstrom R, Parker RC, Varmus HE, Bishop JM: Transduction of a cellular oncogene: the genesis of Rous sarcoma virus. Proc Natl Acad Sci USA 1983, 80(9):2519-2523.

75. Giles KE, Caputi M, Beemon KL: Packaging and reverse transcription of snRNAs by retroviruses may generate pseudogenes. Rna 2004,10(2):299-307.

76. Jamain S, Girondot M, Leroy P, Clergue M, Quach H, Fellous M, Bourgeron T: Transduction of the human gene FAM8A1 by endogenous retrovirus during primate evolution. Genomics 2001,78(l-2):38-45.

77. Nishihara H, Smit AF, Okada N: Functional noncoding sequences derived from SINEs in the mammalian genome. Genome Res 2006,16(7):864-874.

78. Kapitonov VV, Jurka J: A novel class of SINE elements derived from 5S rRNA. Mol Biol Evol 2003,20(5):694-702.

79. Karlsson H, Bachmann S, Schroder J, McArthur J, Torrey EF, Yolken RH: Retroviral RNA identified in the cerebrospinal fluids and brains of individuals with schizophrenia. Proc Natl Acad Sci USA 2001,98(8):4634-4639.

80. Frendo JL, Olivier D, Cheynet V, Blond JL, Bouton O, Vidaud M, Rabreau M, Evain-Brion D, Mallet F: Direct involvement of HERV-W Env glycoprotein in human trophoblast cell fusion and differentiation. Mol Cell Biol 2003,23(10):3566-3574.

81. Spencer TE, Mura M, Gray CA, Griebel PJ, Palmarini M: Receptor usage and fetal expression of ovine endogenous betaretroviruses: implications for coevolution of endogenous and exogenous retroviruses. J Virol 2003,77(l):749-753.

82. Best S, Le Tissier P, Towers G, Stoye JP: Positional cloning of the mouse retrovirus restriction gene Fvl. Nature 1996, 382(6594):826-829.

83. Savitsky M, Kwon D, Georgiev P, Kalmykova A, Gvozdev V: Telomere elongation is under the control of the RNAi-based mechanism in the Drosophila germline. Genes Dev 2006,20(3):345-354.

84. Soifer HS, Rossi JJ: Small interfering RNAs to the rescue: blocking LI retrotransposition. Nat Struct Mol Biol 2006,13(9):758-759.

85. Vagin VV, Klenov MS, Kalmykova AI, Stolyarenko AD, Kotelnikov RN, Gvozdev VA: The RNA interference proteins and vasa locus are involved in the silencing of retrotransposons in the female germline of Drosophila melanogaster. RNA Biol 2004, l(l):54-58.

86. Guo S, Kemphues KJ: par-1, a gene required for establishing polarity in C. elegans embryos, encodes a putative Ser/Thr kinase that is asymmetrically distributed. Cell 1995, 81(4):611-620.

87. Fire A, Xu S, Montgomery MK, Kostas SA, Driver SE, Mello CC: Potent and specific genetic interference by double-stranded RNA in Caenorhabditis elegans. Nature 1998, 391(6669):806-811.

88. Tomari Y, Zamore PD: Perspective: machines for RNAi. Genes Dev 2005,19(5):517-529.

89. Hammond SM: Dicing and slicing: the core machinery of the RNA interference pathway. FEBSLett 2005, 579(26):5822-5829.

90. Hamilton AJ, Baulcombe DC: A species of small antisense RNA in posttranscriptional gene silencing in plants. Science 1999,286(5441):950-952.

91. Hammond SM, Bernstein E, Beach D, Hannon GJ: An RNA-directed nuclease mediates post-transcriptional gene silencing in Drosophila cells. Nature 2000,404(6775):293-296.

92. Bernstein E, Caudy AA, Hammond SM, Hannon GJ: Role for a bidentate ribonuclease in the initiation step of RNA interference. Nature 2001,409(6818):363-366.

93. Tijsterman M, Ketting RF, Plasterk RH: The genetics of RNA silencing. Annu Rev Genet 2002,36:489-519.

94. Matzke MA, Birchler JA: RNAi-mediated pathways in the nucleus. Nat Rev Genet 2005, 6(l):24-35.

95. He L, Hannon GJ: MicroRNAs: small RNAs with a big role in gene regulation. Nat Rev Genet 2004, 5(7):522-531.

96. Haley B, Zamore PD: Kinetic analysis of the RNAi enzyme complex. Nat Struct Mol Biol im, ll(7):599-606.

97. Matzke M, Aufsatz W, Kanno T, Daxinger L, Papp I, Mette MF, Matzke AJ: Genetic analysis of RNA-mediated transcriptional gene silencing. Biochim Biophys Acta 2004, 1677(1-3): 129-141.

98. Schwarz DS, Hutvagner G, Du T, Xu Z, Aronin N, Zamore PD: Asymmetry in the assembly of the RNAi enzyme complex. Cell 2003,115(2): 199-208.

99. Tomari Y, Du T, Haley B, Schwarz DS, Bennett R, Cook HA, Koppetsch BS, Theurkauf WE, Zamore PD: RISC assembly defects in the Drosophila RNAi mutant armitage. Cell 2004,116(6):831-841.

100. Tomari Y, Matranga C, Haley B, Martinez N, Zamore PD: A protein sensor for siRNA asymmetry. Science 2004,306(5700): 1377-1380.

101. Montgomery MK, Xu S, Fire A: RNA as a target of double-stranded RNA-mediated genetic interference in Caenorhabditis elegans. Proc Natl Acad Sei USA 1998, 95(26): 15502-15507.

102. Bohmert K, Camus I, Bellini C, Bouchez D, Caboche M, Benning C: AGOl defines a novel locus of Arabidopsis controlling leaf development. Embo J \ 998,17(I);170-180.

103. Rivas FV, Tolia NH, Song JJ, Aragon JP, Liu J, Hannon GJ, Joshua-Tor L: Purified Argonaute2 and an siRNA form recombinant human RISC. Nat Struct Mol Biol 2005, 12(4):340-349.

104. Meister G, Landthaler M, Patkaniowska A, Dorsett Y, Teng G, Tuschl T: Human Argonaute2 mediates RNA cleavage targeted by miRNAs and siRNAs. Mol Cell 2004, 15(2):185-197.

105. Hall TM: Structure and function of argonaute proteins. Structure 2005,13(10):1403-1408.

106. Elbashir SM, Harborth J, Lendeckel W, Yalcin A, Weber K, Tuschl T: Duplexes of 21-nucleotide RNAs mediate RNA interference in cultured mammalian cells. Nature 2001, 411(6836):494-498.

107. Lai EC: Micro RNAs are complementary to 3' UTR sequence motifs that mediate negative post-transcriptional regulation. Nat Genet 2002,30(4):363-364.

108. Pillai RS, Bhattacharyya SN, Artus CG, Zoller T, Cougot N, Basyuk E, Bertrand E, Filipowicz W: Inhibition of translational initiation by Let-7 MicroRNA in human cells. Science 2005,309(5740):!573-1576.

109. Wassenegger M, Heimes S, Riedel L, Sanger HL: RNA-directed de novo methylation of genomic sequences in plants. Cell 1994,76(3):567-576.

110. Jones AL, Thomas CL, Maule AJ: De novo methylation and co-suppression induced by a cytoplasmically replicating plant RNA virus. Embo J1998,17(21):6385-6393.

111. Mette MF, Aufsatz W, van der Winden J, Matzke MA, Matzke AJ: Transcriptional silencing and promoter methylation triggered by double-stranded RNA. Embo J2000, 19( 19): 5194-5201.

112. Aufsatz W, Mette MF, van der Winden J, Matzke AJ, Matzke M: RNA-directed DNA methylation in Arabidopsis. Proc Natl Acad Sei USA 2002, 99 Suppl 4:16499-16506.

113. Svoboda P, Stein P, Filipowicz W, Schultz RM: Lack of homologous sequence-specific DNA methylation in response to stable dsRNA expression in mouse oocytes. Nucleic Acids Res 2004, 32(12):3601-3606.

114. Kawasaki H, Taira K: Induction of DNA methylation and gene silencing by short interfering RNAs in human cells. Nature 2004,431(7005):211-217.

115. Morris KV, Chan SW, Jacobsen SE, Looney DJ: Small interfering RNA-induced transcriptional gene silencing in human cells. Science 2004,305(5688):1289-1292.

116. Volpe TA, Kidner C, Hall IM, Teng G, Grewal SI, Martienssen RA: Regulation of heterochromatic silencing and histone H3 lysine-9 methylation by RNAi. Science 2002, 297(5588):1833-1837.

117. Hall IM, Shankaranarayana GD, Noma K, Ayoub N, Cohen A, Grewal SI: Establishment and maintenance of a heterochromatin domain. Science 2002,297(5590):2232-2237.

118. Verdel A, Jia S, Gerber S, Sugiyama T, Gygi S, Grewal SI, Moazed D: RNAi-mediated targeting of heterochromatin by the RITS complex. Science 2004, 303(5658):672-676.

119. Aravin AA, Naumova NM, Tulin AV, Vagin VV, Rozovsky YM, Gvozdev VA: Double-stranded RNA-mediated silencing of genomic tandem repeats and transposable elements in the D. melanogaster germline. Curr Biol 2001,11(13): 1017-1027.

120. Pal-Bhadra M, Leibovitch BA, Gandhi SG, Rao M, Bhadra U, Birchler JA, Elgin SC: Heterochromatic silencing and HP1 localization in Drosophila are dependent on the RNAi machinery. Science 2004,303(5658):669-672.

121. Fukagawa T, Nogami M, Yoshikawa M, Ikeno M, Okazaki T, Takami Y, Nakayama T, Oshimura M: Dicer is essential for formation of the heterochromatin structure in vertebrate cells. Nat Cell Biol 2004,6(8):784-791.

122. Pal-Bhadra M, Bhadra U, Birchler JA: RNAi related mechanisms affect both transcriptional and posttranscriptional transgene silencing in Drosophila. Mol Cell 2002, 9(2):315-327.

123. Mochizuki K, Gorovsky MA: Small RNAs in genome rearrangement in Tetrahymena. Curr Opin Genet Dev 2004,14(2): 181-187.

124. Chalker DL, Yao MC: Nongenic, bidirectional transcription precedes and may promote developmental DNA deletion in Tetrahymena thermophila. Genes Dev 2001, 15(10):1287-1298.

125. Meyer E, Gamier 0: Non-Mendelian inheritance and homology-dependent effects in ciliates. Adv Genet 2002,46:305-337.

126. Yao MC, Fuller P, Xi X: Programmed DNA deletion as an RNA-guided system of genome defense. Science 2003,300(5625):1581-1584.

127. Mochizuki K, Fine NA, Fujisawa T, Gorovsky MA: Analysis of a piwi-related gene implicates small RNAs in genome rearrangement in tetrahymena. Cell 2002,110(6):689-699.

128. Liu Y, Mochizuki K, Gorovsky MA: Histone H3 lysine 9 methylation is required for DNA elimination in developing macronuclei in Tetrahymena. Proc Natl Acad Sci USA 2004,101 (6): 1679-1684.

129. Shiu PK, Raju NB, Zickler D, Metzenberg RL: Meiotic silencing by unpaired DNA. Cell 2001,107(7):905-916.

130. Lee DW, Pratt RJ, McLaughlin M, Aramayo R: An argonaute-like protein is required for meiotic silencing. Genetics 2003,164(2):821-828.

131. Lee DW, Seong KY, Pratt RJ, Baker K, Aramayo R: Properties of unpaired DNA required for efficient silencing in Neurospora crassa. Genetics 2004,167(1): 131-150.

132. Silva J, Chang K, Hannon GJ, Rivas FV: RNA-interference-based functional genomics in mammalian cells: reverse genetics coming of age. Oncogene 2004,23(51):8401-8409.

133. Tabara H, Grishok A, Mello CC: RNAi in C. elegans: soaking in the genome sequence. Science 1998,282(5388):430-431.

134. Timmons L, Fire A: Specific interference by ingested dsRNA. Nature 1998, 395(6705):854.

135. Hannon GJ, Rossi JJ: Unlocking the potential of the human genome with RNA interference. Nature 2004,431(7006):371-378.

136. McCaffrey AP, Meuse L, Pham TT, Conklin DS, Hannon GJ, Kay MA: RNA interference in adult mice. Nature 2002,418(6893):38-39.

137. Ito M, Kawano K, Miyagishi M, Taira K: Genome-wide application of RNAi to the discovery of potential drug targets. FEBS Lett 2005, 579(26):5988-5995.

138. Aza-Blanc P, Cooper CL, Wagner K, Batalov S, Deveraux QL, Cooke MP: Identification of modulators of TRAIL-induced apoptosis via RNAi-based phenotypic screening. Mol Cell 2003,12(3):627-637.

139. MacKeigan JP, Murphy LO, Blenis J: Sensitized RNAi screen of human kinases and phosphatases identifies new regulators of apoptosis and chemoresistance. Nat Cell Biol 2005,7(6):591-600.

140. Brummelkamp TR, Nijman SM, Dirac AM, Bernards R: Loss of the cylindromatosis tumour suppressor inhibits apoptosis by activating NF-kappaB. Nature 2003, 424(6950):797-801.

141. Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ: Basic local alignment search tool. JMol Biol 1990,215(3):403-410.

142. Chenna R, Sugawara H, Koike T, Lopez R, Gibson TJ, Higgins DG, Thompson JD: Multiple sequence alignment with the Clustal series of programs. Nucleic Acids Res 2003,31(13):3497-3500.

143. Brouha B, Schustak J, Badge RM, Lutz-Prigge S, Farley AH, Moran JV, Kazazian HH, Jr.: Hot Lis account for the bulk of retrotransposition in the human population. Proc Natl AcadSci USA 2003,100(9):5280-5285.

144. Wei W, Gilbert N, Ooi SL, Lawler JF, Ostertag EM, Kazazian HH, Boeke JD, Moran JV: Human LI retrotransposition: cis preference versus trans complementation. Mol Cell Biol 2001,21(4): 1429-1439.

145. Goodier JL, Ostertag EM, Engleka KA, Seleme MC, Kazazian HH, Jr.: A potential role for the nucleolus in LI retrotransposition. Hum Mol Genet 2004,13(10):1041-1048.

146. Fudal I, Bohnert HU, Tharreau D, Lebrun MH: Transposition of MINE, a composite retrotransposon, in the avirulence gene ACE1 of the rice blast fungus Magnaporthe grisea. Fungal Genet Biol 2005,42(9):761-772.

147. Gilbert N, Lutz S, Morrish TA, Moran JV: Multiple fates of LI retrotransposition intermediates in cultured human cells. Mol Cell Biol 2005,25(17):7780-7795.

148. Babushok DV, Ostertag EM, Courtney CE, Choi JM, Kazazian HH, Jr.: LI integration in a transgenic mouse model. Genome Res 2006,16(2):240-250.

149. Furano AV: The biological properties and evolutionary dynamics of mammalian LINE-1 retrotransposons. Prog Nucleic Acid Res Mol Biol 2000,64:255-294.

150. Bibillo A, Eickbush TH: The reverse transcriptase of the R2 non-LTR retrotransposon: continuous synthesis of cDNA on non-continuous RNA templates. JMol Biol 2002, 316(3):459-473.

151. Matz MV, Alieva NO, Chenchik A, Lukyanov S: Amplification of cDNA ends using PCR suppression effect and step-out PCR. Methods Mol Biol 2003,221:41-49.

152. Matz MV: Amplification of representative cDNA pools from microscopic amounts of animal tissue. Methods Mol Biol 2003,221:103-116.