Бесплатный автореферат и диссертация по биологии на тему
Картирование регуляторных последовательностей в составе ретротранспозонов HERV-K (HML-2) и L1
ВАК РФ 03.01.03, Молекулярная биология

Автореферат диссертации по теме "Картирование регуляторных последовательностей в составе ретротранспозонов HERV-K (HML-2) и L1"

Федеральное государственное бюджетное учреждение науки ИНСТИТУТ БИООРГАНИЧЕСКОЙ ХИМИИ

им. академиков М.М. Шемякина и Ю.А. Овчинникова РАН

На правах рукописи

Александрова Елена Александровна

Картирование регуляторных последовательностей в составе ретротранспозонов НЕКУ-К (НМЬ-2) и Ы.

Специальность - 03.01.03 - молекулярная биология

Автореферат

диссертации на соискание ученой степени кандидата биологических наук

1 7" ОК Г 2013

005535029

Москва, 2013

005535029

Работа выполнена в группе геномного анализа сигнальных систем клетки Федерального государственного бюджетного учреяедения науки Института биоорганической химии им. академиков М.М.Шемякина и Ю.А.Овчинникова Российской академии наук

Научный руководитель:

Доктор биологических наук Буздин Антон Александрович Официальные оппоненты:

Доктор биологических наук, профессор Крамеров Дмитрий Александрович, Федеральное государственное бюджетное учреждение науки Институт молекулярной биологии Российской академии наук, зав. Лабораторией эволюции геномов эукариот

Доктор биологических наук Калмыкова Алла Ивановна, Федеральное государственное бюджетное учреждение науки Институт молекулярной генетики Российской академии наук, зав. Лабораторией исследования геномных повторов эукариот

Ведущая организация:

Федеральное государственное бюджетное учреждение Федеральный научно-клинический центр детской гематологии, онкологии и иммунологии им. Д. Рогачева

Защита состоится «30» октября 2013 года в II00 часов на заседании диссертационного ученого совета Д.002.019.01 при Федеральном государственном бюджетном учреждении науки Институте биоорганической химии им. академиков М.М.Шемякина и Ю.А. Овчинникова Российской академии наук по адресу: 117997 ГСП-7 г. Москва, В-437, ул. Миклухо-Маклая, 16/10.

С диссертацией можно ознакомиться в библиотеке Федерального государственного бюджетного учреждения науки Института биоорганической химии им. академиков М.М.Шемякина и Ю.А. Овчинникова Российской академии наук.

Автореферат разослан «30» сентября 2013 г.

Учёный секретарь

диссертационного совета,

доктор физико-математических наук

В.А. Олейников

Актуальность проблемы

Понимание молекулярных механизмов регуляции экспрессии генов является одной из главных задач молекулярной биологии. Несмотря на то, что на сегодняшний день существует широкий спектр молекулярно-биологических, в т.ч. широкомасштабных, методов исследования транскрипции генов, структура многих промоторов и механизмы, лежащие в основе тканеспецифичности их экспрессии так и остаются невыясненными.

Мобильные генетические элементы (МГЭ), богатые регуляторными последовательностями, представляют собой чрезвычайно интересные и важные объекты в исследованиях регуляции транскрипции. Они были обнаружены во всех изученных к настоящему времени геномах эукариот, к которым относится и геном человека, примерно половина которого состоит из последовательностей, произошедших в результате активности т.н. «прыгающих» генов. МГЭ являются мощным источником генетической нестабильности за счет своей способности к инсерционному мутагенезу, эктопической рекомбинации, трансдукции 5' и 3'-фланкирующих последовательностей, образованию псевдогенов или даже новых функциональных копий генов, разрушению ранее существовавших экзон-интронных структур и изменению эпигенетической регуляции генов. Интеграция МГЭ в последовательности важных генов, таких как, например, кодирующие онкосупрессоры гены, может привести к нарушению механизмов контроля деления, роста и дифференцировки клеток, что в свою очередь способно привести к возникновению некоторых форм рака. Надо отметить, что наибольшую опасность для целостности генома представляет собой повышение активности МГЭ в клетках терминальной линии, поскольку в данном случае нарушения генома могут быть переданы потомкам. Однако не всегда активность МГЭ приводит лишь к негативным результатам. К настоящему времени известны примеры позитивного влияния активности МГЭ на функционирование организма в целом. Так, например, ДНК человека содержит одомашненные элементы, имеющие наиважнейшие функции, такие как активирующие рекомбинацию гены RAG, лежащие в основе V(D)J рекомбинации нашей иммунной системы, а также ген ERVWE1, играющий важную роль в развитии плаценты.

Данная работа посвящена изучению структур промоторов эндогенных ретрови-русов человека (ЭРВч) семейства HERV-K (HML-2) и элемента LI, являющегося представителем группы длинных диспергированных повторов или LINE (от англ. Long Interspersed Nuclear Elements). Для человек-специфичных длинных концевых повторов ЭРВч семейства HERV-K (HML-2) (далее в тексте они будут обозначаться LTR_hs от англ. Long Terminal Repeats - длинные концевые повторы), было продемонстрировано, что они способны инициировать транскрипцию не только генов провируса, но и фланкирующих LTR областей генома, причем профили экспрессии этих мРНК могли в значительной степени различаться между нормальной и соответствующей ей раковой

тканями. В случае ретротранспозона Ы человека, было проведено изучение структуры и механизма регуляции его внутреннего промотора, расположенного в 5'-нетранслируемой области (5' НТО) элемента.

Цели и задачи исследования

Целями настоящей работы являлись (1) изучение промоторной активности 1ЛТ1_118 в контексте геномного окружения, а также (2) детальный анализ 5' НТО Ы с целью выявления функционально значимых областей промотора Ы для обеспечения эффективной инициации транскрипции ретротранспозона. Были поставлены следующие задачи:

1. с использованием разработанного в лаборатории метода полногеномного поиска транскрипционно-активных промоторов повторяющихся элементов, определить профили экспрессии транскрипционно-активных ЬТЯ_Ь8 для двух тканей - семи-номы и нормальной паренхимы яичка человека.

2. проанализировать зависимость транскрипционной активности от геномного окружения и от типа ткани (норма или опухоль).

3. определить местоположение сайта инициации транскрипции человек-специфичных ЦП* НЕЯУ-К (НМЬ-2).

4. идентифицировать наиболее важные для обеспечения транскрипционной активности участки 5' НТО Ь1.

5. определить влияние делеции «минимального промотора» Ы на положение точки начала транскрипции на примере экзогенной конструкции, содержащей 5' НТО Ы.

Научная новизна и практическая ценность работы.

Впервые на полногеномном уровне было осуществлено определение уровней экспрессии промоторно-активных ЦШ семейства НЕЫУ-К (НМЬ-2), специфичных для генома человека. В результате сравнительного анализа экспрессии ЬТЯ_Ья в нормальной и опухолевой тканях клеток зародышевого пути, было обнаружено 14 дифферен-циально-экспрессирующихся мРНК, промотором которых служат одиночные или 3'-провирусные 1Л'Я_Ь8 и которые потенциально способны служить молекулярно-генетическими маркерами семиномы яичка человека.

Впервые проведено картирование точки начала транскрипции одиночных 1ЛП_Ь8, а также показано её преимущественное использование в ходе транскрипции генов провирусов, экспрессирующихся с 5'-концевого ЬТЯ НЕЯУ-К (НМЬ-2).

Впервые было продемонстрировано, что инициация транскрипции с 5' НТО Ы как экзогенного, так и эндогенного происхождения, способна происходить не только в самом начале 5'-НТО ретротранспозона, но также и в её внутренней области. Кроме того, было показано, что в результате делеции «минимального промотора» в 5' НТО экзогенного происхождения, происходит смещение точек начала транскрипции в 3'-концевую область 5' НТО или же в самое начало ОРС1 Ь1. 2

Полученные данные открывают ряд возможностей для дальнейших исследований как самих ретротранспозонов НЕЛУ-К (НМЬ-2) и Ы, так и для изучения системы клеточного контроля регуляции их транскрипции и перемещений в геноме человека.

Апробация диссертации

Основные положения диссертации доложены и обсуждены на III международной конференции, посвященной Н.В. Тимофееву-Ресовскому «Современные проблемы генетики, радиобиологии, радиоэкологии и эволюции» (Украина, Алушта, 9-14 октября 2010 г.).

Публикации:

По теме диссертации опубликовано 4 статьи, 2 тезиса докладов на конференциях, кроме того, результаты проведенных экспериментов были использованы при написании главы в книге.

Структура и объем диссертации.

Диссертационная работа изложена на 103 страницах машинописного текста, содержащих 21 рисунок, и состоит из следующих разделов: введения, обзора литературы, экспериментальной части, изложения результатов и их обсуждения, выводов и списка цитируемой литературы, включающего 221 ссылку.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ. I. Определение профиля экспрессии промоторно-активных ЬТК семейства НЕЯУ-К (НМЬ-2'). специфичных для генома человека.

ЭРВч занимают около 8% генома человека, и представлены в нем множеством различных семейств, каждое из которых произошло в результате заражения клеток зародышевой линии различными экзогенными ретровирусами. Большинство присутствующих в геноме эндогенных ретровирусов утратили свою активность в результате накопления нонсенс-мутаций, протяженных внутренних делеций, или превращения в так называемые одиночные длинные концевые повторы, образующиеся в результате гомологичной рекомбинации по последовательностям ЬТЯ. В составе ЬТЯ провирусов содержатся промоторы и регуляторные последовательности, способные инициировать транскрипцию как провирусных генов, так и находящихся по соседству генов клетки-хозяина. Интересно, что поскольку элементы семейства НЕЯУ-К (НМЬ-2) являются наиболее эволюционно молодыми ЭРВч (их интеграция в геном человека произошла в промежутке между 200.000 и 5 млн. лет назад), в геноме человека присутствует нескольких полиморфных локусов НМЬ-2, возникших в результате недавней активности ретровирусов этого семейства.

Несмотря на многообразие исследований, целью которых является выяснение роли HERV-K (HML-2) в возникновении различных патологий, к настоящему времени остается не совсем ясным, как и почему гены ЭРВч семейства HML-2 экспрессируются, а также какой механизм лежит в основе этого процесса. Кроме того, хотя тот факт, что общая экспрессия HERV-K (HML-2) в значительной степени повышена в раковых тканях зародышевого пути человека, и является хорошо известным, пока недостаточно информации доступно о том, транскрипция каких из содержащих HML-2 локусов активируется ходе развития этой патологии, что, несомненно, важно для понимания механизмов образования опухолей этого типа.

Ранее, в нашей лаборатории была обнаружена группа LTR семейства HERV-K (HML-2), состоящая из -150 элементов, характеризующихся значительной гомологией последовательности (в среднем - 98,1%) (Buzdin et al., 2003а). Эта группа LTR была названа человек-специфичной (LTR_hs, от англ. human-specific), поскольку около 90% из входящих в нее LTR являются специфичными для генома человека. Именно она была выбрана для проведения дальнейших исследований, описанных ниже.

1.1. Идентификация промоторно-активных LTR hs.

Для полногеномного картирования транскрипционно-активных LTR_hs, был применен метод полногеномного поиска промоторно-активных повторяющихся последовательностей GREM (GREM - Genomic Repeat Expression Monitor), разработанный в нашей лаборатории (Рис.1). В основе этого метода лежит гибридизация суммарного пула 5'-концевых фрагментов кДНК с полногеномным пулом последовательностей, фланкирующих исследуемую группу повторяющихся элементов. В результате селективной амплификации образованных в результате гибридизации гетеродуплексов «геномная ДНК - кДНК», получают библиотеки гибридных молекул, названных нами ELT тэгами, от англ. ELT - expressed LTR tag. Каждый из этих тэгов содержит 3'-концевой фрагмент LTR, участок геномной ДНК, фланкирующий LTR с З'-конца, и последовательность искусственно введённого олигонуклеотидного адаптера. Для определения профиля экспрессии LTR_hs, нами было проведено клонирование и секвениро-вание полученных библиотек ELT тэгов. Надо отметить, что данный поход комбинирует преимущества методов 5'RACE и гибридизации нуклеиновых кислот, а также использует тот факт, что в случае, когда ретроэлемент является промотором, инициация транскрипции происходит внутри его последовательности и, следовательно, такие транскрипты должны содержать фрагмент последовательности ретроэлемента на 5' конце.

мРНК

LTR -ігромотор

Геномная ДНК

<> І XоПР0ВИРУс, _ TD Одиночный LTR ■^АААААА 5'LTR .. 3'LTR

Синтез к ДНК, фр агментир ов ание

1JBb-—'—^

Фр агментир ов ание к ДНК, цитирование адаптеров, селективная амплификация 3' фланков LTR, обработка нуклеазой ЕхоШ

V

ELT

Смешивание, денатурация, гибридизация

| ПДР амплификация

Клонирование и секвенирование ПЦР-продуктов

Рис. 1. Схематическое изображение метода GREM. Метод состоит из трех основных стадий: (1) получения последовательностей кДНК, соответствующих 5'-концевым областям полноразмерных мРНК исследуемой ткани. (2) получения последовательностей геномной ДНК, фланкирующих LTR HERV-K (HML-2) с З'-конца. (3) гибридизации геномной ДНК и кДНК с последующей ПЦР-амплификацией гетеродуплексов «геномная ДНК -кДНК», названных ELT тэгами, каждый из которых содержит З'-концевой фрагмент LTR HERV-K (HML-2) и участок уникальной геномной ДНК, фланкирующий LTR с З'-конца.

В данном исследовании, метод GREM был применен для полногеномной идентификации и количественной оценки уровня экспрессии промоторно-активных LTR_hs, характеризующихся высокой идентичностью нуклеотидных-последовательностей. Для исследования были выбраны два типа ткани, взятые у одного и того же пациента: паренхима яичка и семинома, представляющие собой нормальную ткань и соответствующее ей злокачественное новообразование. Обе ткани содержат клетки зародышевого пути человека.

Из полученных библиотек ELT было отсеквенировано по 500 клонов для каждой ткани, из которых для дальнейшего анализа были взяты 395 и 419 ELT клонов для паренхимы и семиномы соответственно (часть клонов содержала плазмидные перестройки или была плохо отсеквенирована). В результате картирования последовательностей ELT, было показано, что из -150 представителей LTR_hs, около половины (78 элементов) являются промоторно-активными хотя бы в одной из тканей.

Надо отметить, что в отсеквенированных библиотеках ELT однозначное картирование транскрипционно-активных LTR было возможно лишь в случае транскрипции с одиночных или З'-провирусных LTR. Это связано с тем, что с 5'-провирусных LTR транскрибируются высокогомологичные между собой гены провирусов, картирование которых невозможно ввиду присутствия в геноме человека большого количества их копий.

С целью подтверждения применимости метода GREM для количественной оценки транскрипционной активности LTR HERV-K (HML-2), нами было проведено сравнение уровней транскрипции 20ти LTR_hs, определенных с помощью метода ОТ-ПЦР, с частотой встречаемости соответствующих ELT тэгов в библиотеках GREM. Для ПЦР-амплификации были использованы следующие пары праймеров: праймер, специфичный к З'-концевой последовательности LTR и направленный в окружающую его область генома, и праймеры, комплементарные к фланкирующим LTR уникальным геномным последовательностям, располагающиеся на расстоянии от 70 до 300 п.о. от 3' конца LTR, и направленные в сторону LTR. Уровень транскрипции был измерен относительно транскрипционной активности гена домашнего хозяйства АСТВ, кодирующего белок бета-актин. Мы показали, что для выбранных LTR HERV-K (HML-2), частота встречаемости ELT тэгов линейно коррелирует с уровнем транскрипции соответствующих LTR с коэффициентами корреляции 0,91 и 0,89 для библиотек GREM из паренхимы и семиномы соответственно. Эти результаты позволили сделать вывод о том, что метод GREM применим как для качественной, так и для количественной оценки промоторной активности LTR_hs.

1.2. Анализ промоторной-активности LTR hs.

Идентификация LTRJts, дифференциально экспрессирующихся в семиноме относительно нормальной паренхимы яичка человека.

В результате анализа отсеквенированных библиотек ELT, нами было обнаружено, что количественное содержание ELT некоторых отдельно взятых LTR_hs в разы отличается между нормальной и опухолевой тканями. На основании полученных результатов, 15 LTR были классифицированы как дифференциально экспрессирующиеся (рис. 2), поскольку их транскрипционная активность была повышена более чем в 2 раза в одной из тканей и они были представлены как минимум 4мя ELT (что составляет около 1% от общего количества отсеквенированных ELT для каждой из тканей). 5' провирусные LTR_hs и четыре одиночных LTR (97, 116, 152 и 155) проявляли повышенный уровень транскрипции в семиноме, тогда как транскрипция десяти LTR (79, 81, 99, 106, 120, 129, 139, 142, 147 и 149) была повышена в паренхиме яичка. Повышенная экспрессия восьми из этих LTR (81, 99, 129, 139, 149, 152, 155), а также 5'- прови-

I ZlLTR 152

1 11 TR 116

1 ILTR 155

1 Ц LTR 97

IZZ15 провирусный

LTR

L i к иидн

I.TR79ÍH

LTR 142ЩШ

LTR 149

LTR 147 Ш^Н

1Л'к икНШН

LTR 120 ^НШН

LTR

LTR 81

-20 -15 -10 -5 0 5 10 15 20

Кратность изменения уровня экспрессии LTR_hs

Рис 2. Диаграмма, отражающая кратность изменений уровней транскрипции дифференциально экспрес-сирующихся ЬТИ Ьв в се-миноме относительно нормальной паренхимы яичка. Положительное значение кратности изменения уровня экспрессии ЬТИ соответствует повышенному уровню транскрипции в семиноме (столбцы белого цвета), отрицательное - пониженному уровню транскрипции

(столбцы черного цвета).

русных LTR в соответствующих тканях была подтверждена с помощью ОТ ПЦР на матрицах кДНК паренхимы яичка и семиномы. Полученные нами результаты подтверждаются опубликованными ранее экспериментальными доказательствами того факта, что экспрессия генов провирусов, промотором которых служит 5'-провирусный LTR, происходит предпочтительно в опухолевых тканях клеток зародышевой линии.

Анализ промоторной активности LTRJis в зависимости от геномного окружения.

Дальнейший анализ библиотек ELT показал, что как минимум половина всех представителей человек-специфичного семейства LTR HERV-K (HML-2) являются функциональными промоторами in vivo по крайней мере в одной из тканей. Кроме того, для оценки промоторной-активности LTR_hs в зависимости от геномного окружения, нами были картированы в геноме все LTR_hs и разделены на 4 группы в зависимости от их положения относительно соседних генов (Таблица 1). В результате подсчета доли промоторно-активных LTR_hs каждой группы хотя бы в одной из тканей, мы обнаружили, что LTR, проявляющие наиболее высокую транскрипционную активность, расположены в экзонах генов. Доля промоторно-активных элементов, находящихся на некотором удалении от генов (от 5 до 35 т.п.о.), а также в непосредственной близости от них (не далее 5 т.п.о.) или же в их интронах, немного меньше и в среднем составляет около 65% от общего количества элементов, находящихся в таком положении

Таблица 1. Промоторная активность ЬТИ_Ь5 в зависимости от положения в геноме.

Группа ЬТИ Положение относительно генов Количество элементов в группе Доля элементов, промоторно-активных хотя бы в одной из тканей Доля элементов, промоторно-активных в обеих тканях

1 Расстояние от ЬТЯ до соседнего гена -более 35 т.п.о. 80 33.8 ± 3.5 10.0 + 1.2

2 Расстояние от ЬТК до соседнего гена -от 5 до 35 т.п.о. 24 62.5 ± 13.0 29.2 + 6.1

3 ЬТЛ расположен в интроне гена или на расстоянии не более 5 т.п.о. 40 67.5 ± 10.8 20.0 + 3.2

4 ЬТЯ. расположен в экзоне кДНК п 75.0 + 22.5 66.7 + 20.0

(группы 2 и 3). Согласно результатам анализа относительного количества ЬТЯ каждой группы, функционирующих в качестве промоторов в обоих типах тканей - как в паренхиме, так и в семиноме, также было обнаружено, что ЬТЛ, расположенные в экзонах генов, наиболее транскрипционно активны, по сравнению со всеми остальными группами ЬТЫ (Таблица 1).

На основании приведенных выше результатов можно заключить, что по сравнению с ЬТ^Ьб, расположенными на удалении от транскрипционно-активных областей генома, ЬТЫ, находящиеся в ген-богатых областях генома, проявляют повышенную транскрипционную активность, которая максимальна для частично или полностью транскрибирующихся в составе генов.

Кроме того, такие ШИ. наиболее часто служат промотором для инициации синтеза мРНК в обоих типах тканей - паренхиме и семиноме. Возможно, этот результат можно объяснить менее компактной структурой хроматина в этих участках генома и, следовательно, лучшей доступностью кодирующих эти элементы последовательностей ДНК для активаторов транскрипции.

Анализ корреляции промоторной активности ЬТЛ_/гх с транскрипционной активностью соседних генов.

Для того, чтобы понять, существует ли корреляция между промоторной активностью расположенных вблизи генов и транскрипционной актив-

ностью этих генов, нами при помощи метода ОТ-ПЦР было проведено опреде-

I

ление транскрипционного статуса 16 генов, расположенных вблизи от случайно выбранных LTR семейства HERV-K (HML-2). На Рис. 3. схематически изображены взаимные расположения проанализированных в работе LTR_hs и соседних с ними генов. В результате, для восьми LTR была обнаружена корреляция их уровней транскрипции с промоторной активностью следующих, расположенных поблизости, генов: ген DOCK2, вовлеченный в перестройки цитоскелета, необходимые для миграции лимфоцитов в ответ на стимуляцию хемокинами; ген C9orf39, имеющий неизвестную функцию; ген RPL8 кодирующий белок 80S субъединицы рибосомы L8; ген ТА-РР2С, кодирующий фосфатазу белков 2С; ген SLC25A16, кодирующий белок, ответственный за быстрый транспорт и обмен молекулами между цитозолью и митохондриальным матриксом; ген AND-16, кодирующий ядерно-цитоплазматический ДНК-связывающий белок неизвестной функции; ген IFT172, кодирующий белок интрафлагеллярного транспорта 172; и ген CEBPZ, кодирующий ССАТ-энхансер-связывающий белок дзэ-та. С другой стороны, для гена SLC4A8, кодирующего белок-переносчик раствора бикарбоната натрия, и транскрибирующийся на одном и том же уровне в обеих исследованных тканях, был показано, что находящийся в его пятом ин-троне LTR (LTR 129) транскрибируется на значительно более высоком уровне в семиноме по сравнению с паренхимой, т.е корреляции между экспрессией гена и LTR не наблюдается. Анализ геномного окружения другого LTR - 3'-провирусного LTR 99, в совокупности являющегося источником около 33% всех ELT и экспрессирующегося на очень высоком уровне в паренхиме и на уровне в 6 раз ниже (однако все еще достаточно высоком) в семиноме, показал, что содержащий его провирус расположен между двумя генами человека, а именно -на 7 т.п.о. выше гена LIPH1, кодирующего связанный с мембраной предшественник липазы, и на 12 т.п.о. выше гена SENP2, кодирующего SUM01-специфичную протеазу (SUMO - сокр. от англ. small ubiquitin-like modifier - малый убиквинтин-подобный модификатор) (Рис.4). ОТ-ПЦР-анализ показал, что SENP2 транскрибируется в обеих тканях на относительно высоком уровне, составляющем -0.4% от уровня транскрипции бета-актина, тогда как LIPH1 транскрибируется на повышенном уровне в паренхиме яичка и на пониженном уровне - в семиноме (0.2 и 0.02% от уровня активности бета-актина соответственно). Такая повышенная промоторная активность З'-провирусного LTR может быть обусловлена присутствием регуляторных элементов обоих генов. SENP2 по идее может обеспечивать высокий уровень базальной экспрессии, тогда как LIPH1 мог бы быть ответственным за обеспечение тканеспецифичности экспрессии. Или же человек-специфичный провирус 99 и ген LIPH1 могут быть расположены вместе в одном и том же хроматиновом домене, отличном от содержащего ген SENP2. С другой стороны, измеренные нами профили транс-

3)

7)

S)

DOCK2

Ш И5 J

Как I Паренхиме, так н I Сиянии«;:-0.05 № от ур синя ij> анскрнпцнн п •>I1 аКТХОВ

Паренхима; 02£%

Сичнмюв: 024% от •).",п»-1 (■ чнстта ELT

i,I K 94 8тш) Г

Как кШренпо^такнх

Севшмюш: Д05%

от >р о хнл транскрипции п

BICD1 бета-актит -►

1Ьфаш«ан Семнмича: ELT не &хлк обнару»Е№1

SLC4A»

Парардма: ~ L5 % а: ~1А%

LTR 129 .

от уроисттранофнпцнн х бпа^акиов

Параоооха: 0% Сачнмнта: 3.61% огобшего чжла ELT

C9wß9

LT R Ш

Парасома; -0.02% Сошшт: 0% от }роширанофнпцнн I бета-акша

Парвоииа: 0^% Свчшюма; 0% от обнято mm ELT

г cm ш

GPR 74 ——

Паренхима: 0%

от о 1ня хр акскрнгщнн i бпа-акшв

Щроониан Семнмнта: ELT не

шл

Парасогаа; -14.8 %

I LT» 154

от jpoiim транскрипции i бета-актнка

IXapoixHvia: 0. 5%

Свяююма;

ОТ обнято 4HEJB ELT

iLTRllÖ

кипа -►

Паренхимга: ~а01% ~0ЛЗ%

от уровнятранскрншшн 1 бета-актнга

Паренхнча; 0% Сяшпви: 0.48% от общего 1НГИ ELT

ТЛ-РР2С

I LT К 112

Kai: х ГЬренхнкк^ та»; н в Couhmh>E: -0-3 'у от уровня транскрипции и бела-актина

Парасоюа: 0j5%

Сфшюо: 0.48% от обнято шита ELT

Рис. 3. Уровень транскрипции и взаимное расположение LTR_hs и соседних с ними генов. Под и над схематическими изображениями содержащих LTR_hs областей генома, приведены значения уровней экспрессии LTR и клеточных генов для двух типов тканей, соответственно. Количественные значения уровней экспрессии генов были определены с

ш>

11}

13)

М)

15)

щ

ILTR 14«

МЛ Ш4 -►

Как £ ГЬренхотЕ, так и к в: "0.02%

от ур огня транскрипции i бета-актина

Параогаган Сфяофш: ЕЪТне iViiiHо&опр^гены

I LTR 145

SLC2SAM

Паралича: "0.03 %

Саишмниа: -0Й1 %

от ур о ьня тр анскрнпцнн i

'"-'II IfltUCi

Параоома: 2.79% Сеыннюж 1.68% от оби^го ruf Li ELT

C&rißn

-4

Urs I i?

Паисаиа: "0.09 % Семнмнга:

от уроЕнятранскрилцнн 1 6ета-акткна

Парвсмча: 0.25%^ ( ■мш1г>п: 0%

от общего iH' Li ELT

A.ND-1

I LTR 131

11 apai мг-i t: "0.1% Сечнмита: "0.6% от уровишранофнпцнн j бета-актниа

Параомча: 0 % Смивмц 0.24% от о5п»*го iHcra ELT

IFT172

I Uli 122

Пареонча:

Свчнмита ~0Д4%

огг jpокиятранскрипции I

бета-актнна

Парвшфта: 0% Сиинмтаи! 0.24% от обнято числа ELT

ZNF432

Параоснма: "0.06 % С"0Я2%

I н а U9

отурокнятранскрнпцнн I бета-актина

Парошпа: 0% Сачимнцв: 0Д4% от ойп*л1(> xiiCLi ELT

гызиш^

Это л LTR 109

Парасхича: "0.1% Семнмниа: -0.2% от ¿рохэсягранскрнпцнн J бега-актина

Параскиуган Свикшфп: ELT не &шн об)вру]*Е№т

CEBPif

I LTR 105

Парешама; -0.01 % Сячшьг-ш: "0.16% от урохнятранскрнгащн I бета-актэоа

Парасхкча: 0% Сашмиш 0Д4% огг обнято числа ELT

Рис. 3 (продолжение), применением метода ОТ-ПЦР и нормированы на уровень активности гена бета-актина. Значения, отражающие уровни экспрессии LTR_hs представлены в виде доли ELT, соответствующих данному LTR_hs, в общем количестве отсеквенирован-ных ELT для данной ткани.

f

11

LIPHJ

7 т.п. о. "}

л ЧС элемент

& 99

SENP2

Паренхима: ~0.20% С'едпшома: 0.02% от уровня транскрипции гена бета-актина

3' LTR: Паренхима: -2.92% Семинома: -0.45% от уровня транскрипции гена бета-актина

Как в Паренхиме, так и в Семиноме: -0.40% от уровня транскрипции гена бета-актина

Рис. 4. Схематическое изображение расположения человек-специфичного провируса 99 семейства HERV-K (HML-2) (ЧС элемент 99) относительно соседних с ним генов L1PH1 и SENP2. На рисунке представлены количественные значения уровней транскрипции генов LIP HI и SENP2 и 3'-концевого LTR провируса 99 в тканях паренхимы и семи-номы человека, определенные так же, как это было описано в легенде к рисунку 3.

крипции генов SENP2 и LIPH1 могут быть в значительной мере подвержены влиянию регуляторных последовательностей, содержащихся в провирусе 99.

Таким образом, на основании изложенных выше результатов, мы пришли к заключению, что существует большое количество иногда противоречащих друг другу сценариев, которые могли бы быть осуществлены в процессе регуляции транскрипции элементов семейства HERV-K (HML-2), а также - что четко выраженная корреляция между транскрипционной активностью генов и расположенных поблизости LTR отсутствует.

1.3. Картирование точки начала транскрипции в составе LTR hs.

Помимо определения профилей транскрипции LTR HERV-K (HML-2) в двух тканях, нами было проведено картирование точек начала транскрипции (ТНТ) для пяти одиночных LTR, являющихся промоторно-активными в нормальной паренхиме яичка человека согласно результатам GREM. Положение этих ТНТ было определено при помощи метода 5' RACE, позволяющего однозначно картировать положение +1 нуклеотида кДНК и последующей амплификации фланкирующих LTR с З'-конца областей генома с использованием уникальных геномных праймеров (Рис.5А). Как и ожидалось, во всех случаях транскрипция LTR была обусловлена собственной промоторной активностью LTR, а не являлась следствием транскрипции, инициированной с вышележащего промотора и обеспечивающей "сквозное прочтение" последовательности LTR. Идентифицированные точки начала транскрипции совпали для всех пяти проанализированных элементов' и находились в положении 816 консенсусной последовательности LTR HERV-K (HML-2), опубликованной Буздиным A.A. и др (Buzdin et al., 2003а, 2003b). В соответствующих положениях от найденной ТНТ были обнаружены две предполагаемых коровых регуляторных последователь-

/V Од1шочный Уникальная

LTR __ геномная ДНК

-1 L TR Щ---М 1 2 3 4 5

_ ОТ-ПЦР 500 П.О.-

кднк ........................~ нанф- 250 и.о.-

-CS

Б

в I I Ш НИ

ШШШЬШт

5' 11(1 и ни р. ( hi. [|( Ген ретровируса

LTR I-► Gag

LTR' __21 24 27 30 33 36

LTR Gag

! ГогЗ ОТ-ПЦР

—► ^ •»— «ишяф-

Гог4 i Gag

Рис. 5. Картирование точки начала транскрипции в последовательнсти LTR HERV-K(HML-2). (А) 5' концевые последовательности кДНК для каждого из 5ти LTR были получены в результате ПЦР-амплификации с праймером CS на 5' конец кДНК и уникальными геномными праймерами G. Картирование проводилось на консенсусную последовательность LTR_hs, опубликованную в (Buzdin et al.2003а, 2003b) (Б) Определение точки начала транскрипции 5'-провирусного LTR, проведенное с помощью метода ОТ-ПЦР, схема которого изображена на рисунке. Для проведения ПЦР-амплификации были использованы праймеры на последовательность LTR_hs, располагающиеся выше (LTRfor4) и ниже (LTRfor3) предполагаемой точки начала транскрипции (обозначена вертикальной пунктирной линией) в паре с праймером на последовательность вирусного гена gag (Gag).

ности, типичные для промоторов эукариот: (1) последовательность ААТАААТ, напоминающая ТАТА-бокс (консенсусная последовательность

ТАТА(А/Т)А(А/Т)) и расположенная в положении -20 от точки начала транскрипции и (2) инициаторная последовательность CTCA(+1)GA,расположенная в точке начала транскрипции (консенсусная последовательность YYCA(+1)RR).

Как известно, граница области U3 и R определяется точкой начала транскрипции мРНК ретровирусных генов. Однако, картированная нами точка начала транскрипции располагалась на значительном удалении от ранее теоретически предсказанной границы раздела областей U3 и R (Опо,1986). В связи с этим, нам стало интересно узнать, используется ли она для транскрипции генов про-вируса HERV-K, инициирующейся на 5' концевых LTR и обуславливающей экспрессию вирусных генов? Для прояснения этого вопроса, нами были сконструированы праймеры на последовательность LTR, расположенные на минимально возможном расстоянии выше и ниже картированной точки начала транскрипции (LTRfor4 и LTRfor3 соответственно). Эти праймеры в паре с праймером на последовательность вирусного гена gag (праймер Gag) были использованы для ОТ-ПЦР на образцах кДНК, синтезированных на матрице РНК из нормальной паренхимы яичка с использованием случайных гексамерных

праймеров в качестве затравки (Рис.5 Б). После электрофореза в агарозном геле продуктов ОТ-ПЦР, отобранных по истечении разного количества циклов реакции (21, 24, 27, 30, 33, 36 циклов), были видны полосы, соответствующие ПЦР-продуктам ожидаемой длины, причем в случае ОТ-ПЦР с праймером, лежащим ниже точки начала транскрипции, ПЦР-продукт появлялся на 6 циклов раньше. Эти результаты позволили предположить, что с найденной для одиночных LTR точки начала транскрипции также происходит и экспрессия провирусных генов, причем эта ТНТ используется в -64 раза чаще других.

Надо заметить, что впоследствии для образцов мРНК из клеточных линий человека НЕК293 (эмбриональная почка), GH (линия, выведенная из опухоли клеток зародышевого пути), MeWo и Ме1-С9 (обе - меланома), также были проведены картирования ТНТ 5'-провирусных LTR HERV-K (HML-2) (Fuchs et al.,2011; Katoh et al.,2011). Было показано, что для линий, известных повышенным уровнем экспресссии HERV-K (HML-2) (MeWo, Mel-C9 и GH), ТНТ мРНК провирусных генов находятся вблизи от найденной нами ТНТ (в области с 783 по 827 нт.), однако, надо отметить, что роль пионерского исследования в этой области принадлежит именно нашей работе (Kovalskaya et al.,2006), опубликованной на несколько лет раньше остальных.

1.4. Заключение.

С помощью разработанного ранее в нашей лаборатории метода GREM, было проведено определение профилей экспрессии LTR_hs для двух типов тканей - нормальной паренхимы яичка человека и семиномы. Анализ библиотек ELT показал, что по крайней мере половина из них являются промоторно-активными хотя бы в одной их двух исследованных тканей - нормальной ткани или соответствующей ей раковой. 15 LTR HERV-K (HML-2), к которым относятся и все 5'-провирусные LTR_hs, были классифицированы как дифференциально экспрессирующиеся. Кроме того, было обнаружено, что LTR, расположенные в экзонах генов, обладают наиболее высокой промоторной активностью по сравнению с LTR, расположенными в других областях генома. В результате сравнения промоторной активности 16ти случайно выбранных LTR семейства HERV-K (HML-2) и транскрипционного статуса генов, расположенных вблизи от этих LTR, четко выраженной корреляции уровней экспрессии генов с транскрипционной активностью LTR_hs найдено не было.

Наконец, для 5ти случайно выбранных промоторно-активных одиночных LTR_hs, с применением метода 5'RACE, нами было проведено картирование точек начала транскрипции. Оказалось, что во всех случаях ТНТ совпадали и находились в положении 816 консенсусной последовательности LTR. Кроме того, было показано, что инициация транскрипции генов провирусов семейства 14

HERV-K (HML-2), также происходит предпочтительно с содержащей найденную ТНТ области LTR.

Результаты картирования и анализа ELT, информация по структуре и функциональному статусу LTR_hs содержатся в таблице, доступной по адресу в Интернет:

http://www.thescientificworld.com/supplements/2007.270/Buzdin_031307_SuppTabl el.xls

II. Роль «минимального промотора» и внутренней области 5' НТО рет-ротранспозона L1 в инициации транскрипции.

Считается, что семейство L1 является единственным до сих пор активным семейством автономных мобильных элементов в геноме человека. Как и ЭРВч, элементы L1 способны влиять на структуру и функции генома-хозяина с помощью широкого спектра различных механизмов, которые уже были перечислены выше.

Транскрипция ретротранспозона L1 человека управляется необычным внутренним промотором РНК-полимеразы II, расположенным в его длиной 5' НТО и присутствие которого чрезвычайно важно для обеспечения успешной ретротранспозиции L1 элементов. Промотор L1 обуславливает транскрипцию полноразмерных мРНК L1, которые в результате преобразования в кДНК и интеграции в новое место генома могут дать начало новым активным копиям ретротранспозона.

Классическая модель промотора РНК-полимеразы II эукариот содержит несколько канонических регуляторных последовательностей, таких как ТАТА-бокс, расположенный -30 п.о. выше содержащего ТНТ инициаторного элемента. Однако, в настоящее время появляется все больше и больше экспериментальных данных, свидетельствующих о том, что механизм ТАТА-бокс-зависимой инициации транскрипции является скорее исключением из правила. Так, например, при помощи количественной характеристики промоторов млекопитающих, было показано, что примерно у 80-90% промоторов отсутствует функциональный ТАТА-бокс. Уникальные внутренние промоторы ретротранспозонов LINE принадлежат к группе не зависящих от присутствия TATA бокса промоторов, механизм действия которых до сих пор остается плохо охарактеризованным.

Несмотря на то, что в механизме функционирования промотора L1 и остается много неясных моментов, однако, к настоящему времени уже были выяснены некоторые его структурные и функциональные особенности. Так, было показано, что для обеспечения промоторной активности L1 человека наиболее важным фрагментом его 5' НТО являются первые 668 п.о. Эта область содержит сайты связывания факторов транскрипции, способных регулировать экспрессию

15

ы различными способами. Согласно экспериментам, проведенным в 1990 году, делеция 5'-концевого участка длиной -100 п.о. приводит к полной потере про-моторной активности 5' НТО (8\уе^о1с1,1990). На основании этих результатов было сделано предположение о том, что внутренний промотор Ы расположен в первых 100 п.о. его 5' НТО. Обнаружение же функциональных сайтов связывания факторов транскрипции УУ1 и ШЖХЗ в положениях +13...+21 и +83...+101 соответственно, подтвердили правоту этих наблюдений и позволили назвать 5'-концевую область 5' НТО 1Л «минимальным промотором».

Однако, также были опубликованы и некоторые противоречащие этим результатам данные, позволяющие предположить, что 5'-концевой сайт связывания УУ1 сам по себе не является необходимым для эффективной транскрипции и что остальная часть 5' НТО также способна значительно повлиять на общую промоторную активность. Важно заметить, что внутренняя область 5' НТО человеческого 1Л (область с +100 по +668 п.о.), также содержит многочисленные сайты связывания таких факторов транскрипции, действующих в качестве активаторов транскрипции. Кроме того, было показано, что внутренняя область 5' НТО Ь1 человека содержит антисмысловой промотор, направление транскрипции с которого противоположно обычному направлению транскрипции мРНК Ы.

Недавно, нашими коллегами было продемонстрировано, что 5' НТО Ы человека в отсутствие 5'-концевых -100 п.о., все еще способна обеспечивать эффективную транскрипцию репортерного гена во временно трансфецирован-ных клетках человека. Эти результаты не согласуются с общепринятой концепцией «минимального промотора», хотя они и могут рассматриваться лишь как предварительные, поскольку, во-первых, в проведенном исследовании уровень экспрессии репортерного гена был измерен только на основании изменений количества репортерного белка и, во-вторых, использованные для трансфекции конструкции содержали чужеродный регуляторный элемент (нижележащий эн-хансер 8У40) помимо последовательностей, источником которых является 5' НТО Ы. Хорошо известно, что пост-транскрипционный процессинг мРНК может значительно повлиять на уровень экспрессии репортерного гена, расположенного ниже Ы. Таким образом, определение концентраций мРНК, синтезируемых с соответствующих генетических конструкций, является более адекватным способом анализа силы промотора. Не менее важным в проведении такого рода экспериментов является исключение потенциального влияния чужеродного энхансера на экспрессию мРНК.

Тем не менее, результаты Оловникова и соавторов подняли вопрос о возможном существовании смысловых транскриптов, имеющих альтернативную точку начала транскрипции, расположенную во внутренней части 5' НТО Ы че-

ловека или же о возможном присутствии какого-либо внутреннего энхансера в этой области. Эти предположения и послужили основанием к проведению описанного ниже исследования.

II.1. Влияние делеций 5' НТО L1 человека на промоторную активность этой области по результатам измерений количества репортерного белка.

Для исследования промоторной активности 5' НТО L1 человека in vitro, С.Е. Дмитриевым (ИФХМБ им. Белозерского) нам был любезно предоставлен набор генетических конструкций, содержащих различные делеционные варианты 5' НТО. Эти конструкции были созданы на основании коммерческой плазми-ды pGL3 и непосредственно за последовательностями 5' НТО L1 с делециями, содержали репортерный ген люциферазу светлячка (Рис. 6). Все конструкции также содержали первые 45 п.о. ОРС1 непосредственно перед кодирующей областью гена люциферазы с целью сохранения естественного контекста сайта инициации трансляции. Клеточные линии НЕК 293 и NTera2/Dl были временно трансфецированы вышеупомянутыми конструкциями в паре с вектором pCMV-lacZ содержащим репортерный ген бета-галактозидазу под контролем промотора цитомегаловируса и необходимый для нормализации эффективности транс-фекции. По истечении 48 часов после трансфекции, нами были проведены измерения уровня люминисценци люциферазы и анализ активности бета-галактозидазы. После нормализации полученных для люциферазы значений, уровни экспрессии репортерного белка, полученные для конструкций с делециями, были нормированы на уровень экспрессии конструкции, содержащей-полноразмерную 5' НТО L1. Клеточная линия NTera2/Dl была выбрана нами для проведения экспериментов, поскольку ранее она уже была успешно исполь-

Рис. 6. Влияние делеций 5' НТО L1 человека на уровень экспрессии репортерного гена (по результатам измерений количественного содержания репортерного белка). А — Схематический вид конструкции Llwt, содержащей полноразмерную 5' НТО L1. Б — Изображение полученных на базе Llwt конструкций (слева), для каждой из которых показаны результаты измерений уровня активности люциферазы в ли-2затах трансфецированных ' клеток (справа). За единицу был принят уровень активности полноразмерной 5' НТО.

Luc/Gal □ HEK293 ■ NTera2/Dl

зована для функциональных тестов по изучению 5' НТО Lia также в ней экс-прессируются эндогенные L1. Клетки этой линии были получены из эмбриональной тератокарциномы человека и представляют собой трансформированные клетки зародышевой линии. В качестве альтернативной клеточной линии, нами были выбраны клетки НЕК293, поскольку считается, что экспрессия эндогенных L1 в них незначительна.

Как оказалось, делеция первых 98 п.о. 5' НТО L1, заключающих в себе «минимальный промотор», приводит лишь к 1.3- и 2.4-кратному снижению промоторной активности 5' НТО L1 в клетках НЕК293 и NTera2/Dl соответственно (Рис. 6Б). В свою очередь, транскрипционная активность отдельно взятого «минимального промотора» (конструкция LlA(133-887)) была достаточно низкой и составила лишь 24 и 30% от промоторной активности полноразмерной 5' НТО в клетках NTera2/Dl и НЕК293 соответственно.

К удивлению, среди конструкций, содержащих сравнительно короткие (менее 400 n.o.J делеции 5' НТО, наиболее сильное снижение промоторной активности наблюдалось для конструкции с делецией внутренней области 390-526 (LlA(390-526)): промоторная сила этого производного 5' НТО L1 составила 29 и 28% от активности полноразмерной 5' НТО в клеточных линиях NTera2Dl и НЕК293 соответственно (что соответствует снижению эффективности транскрипции в -3.5 раза). Кроме того, активность репортерного гена люциферазы для конструкции LlA(l-386) была в 11 и 8.5 раз выше по сравнению с активностью, наблюдаемой для конструкции LlA(l-664) в клетках NTera2/Dl и НЕК293 соответственно. Этот результат также свидетельствует о важности области 5' НТО, находящейся между +390 и +526 нуклеотидами. Промоторная активность конструкции LlA(557-662) составила 83 и 62% от активности полноразмерной 5' НТО в линиях NTera2/Dl и НЕК293 соответственно. И, наконец, эффективность транскрипции в результате делециии области (667-887) была снижена и составила 50 и 42% в тех же клеточных линиях.

II.2. Влияние делений 5' НТО L1 человека на промоторную активность этой области по результатам измерений количества мРНК репортерного гена.

Для подтверждения достоверности результатов, полученных на основании измерения активности репортерного белка, был проведен анализ уровней экспрессии мРНК кодирующего люциферазу гена с помощью метода ОТ-ПЦР в реальном времени. Аналогично предыдущему исследованию, уровень экспрессии мРНК гена люциферазы был нормализован на уровень экспрессии мРНК бета-галактозидазы, а значение для полноразмерной 5' НТО было принято за 100%. В общем и целом, полученные с помощью количественного ОТ-ПЦР результаты (Рис.7) аналогичны полученным в предыдущем эксперименте (Рис. 6). Так, на-

Рис. 7. Влияние делений 5' 5 НТО 1.1 1 . , т , .

Вектор ______________________| I НТО Ы на экспрессию ре-

1ли1 ___. ^-„«л портерного гена (по резуль-

*"" " " |— татам измерений количест-

Ь1Л(1-98) —--^мац,,:»—^ ' КОННОГО содержания мРНК

1ДД(103-386)________Цмм-1 реиортерного гена). В левой

I части рисунка изображены 1,1Д(390-52б) —.——,конструкции, содержащие

ИД(527-662)-„.--------—--—I производные 5' НТО Ы.

ыД(бб7-887) _____■ Справа приведены результаты

* ] —1 ' измерений концентраций

ыД(Ш-887) —и-------------------1 ■—I-^ мРНК репортерного гена лю-

о 0,2 0,4 0,6 0,8 циферазы для трансфециро-

Ьис/Ся1 ванных клеток НЕК293 и

□НЕК293 яотега ИТега2/01. За единицу принят уровень активности полноразмерной 5' НТО.

пример, как и ранее, собственная активность «минимального промотора» в обеих клеточных линиях была невысокой (38 и 23% для клеток НЕК293 и МТега2Я)1 соответственно). Делеция «минимального промотора» привела к 3.8 и 2.2-кратному снижению транскрипционной активности в клетках НЕК293 и ЫТега2Ю1 соответственно. И, наконец, конструкции, у которых отсутствовала внутренняя область (390-526), обнаружили 4.8 и 5.5-кратное снижение промо-торной активности для тех же клеточных линий соответственно. Надо отметить, что различия активности одних и тех же производных 5' НТО, наблюдаемые для использованных в работе клеточных линий, могут быть объяснены тканеспеци-фичностью регуляции промотора Ь1.

Все эти результаты свидетельствуют в пользу того, что внутренняя область 5' НТО (390-526) играет важную роль в функционировании промотора Ы человека и противоречат сложившемуся на сегодняшний день мнению о решающей роли содержащей «минимальный промотор» 5'-концевой области. Как известно, наблюдаемые для конструкций с делециями изменения уровней экспрессии мРНК и белка могут быть следствием не только различной эффективности инициации транскрипции, но также, в какой-то степени и других клеточных процессов (например, сплайсинга транскрибируемых мРНК, что было ранее показано для некоторых репортерных конструкций, содержащих фрагменты Ы 5' НТО), однако надо подчеркнуть, что в проведенных экспериментах, уровни экспрессии мРНК и белка коррелировали практически для всех конструкций (см. Рис.6 и Рис.7). Этот факт позволяет нам сделать вывод о том, что в данном случае способность этих процессов повлиять на уровень экспрессии белка незначительна.

II.3. Картирование точек начала транскрипции в 5' НТО L1 человека для экзогенных конструкций, содержащих полноразмерную 5' НТО L1 и 5' НТО с делецией «минимального промотора».

Поскольку в результате делеции первых 98 п.о. 5' НТО утрачивает каноническую точку начала транскрипции, располагающуюся в положении +1 5' НТО L1, нам стало интересно узнать, где же тогда в этом случае происходит инициация транскрипции? Для ответа на этот вопрос был применен метод, позволяющий амплифицировать 5'-концы полноразмерных кэпированных мРНК, и называющийся 5' RLM-RACE (англ. 5' RNA Ligase Mediated Rapid Amplification of cDNA Ends - метод быстрой амплификации 5'-концов кДНК, опосредованный лигированием РНК).

Итак, клетки были трансфецированы конструкциями, содержащими полноразмерную 5' НТО LI (Llwt) и 5' НТО с делецией первых 98 п.о. (LlA(l-98)), контролирующих экспрессию репортерного белка люциферазы. Затем было проведено выделение тотальной РНК и определение с помощью метода 5'-RLM-RACE ТНТ мРНК, кодирующих репортерный белок. Для обеих клеточных линий, полученные ампликоны были клонированы и отсеквенированы. Конечной стадией стало картирование последовательностей клонов на 5'-концевую область L1 человека, что и позволило определить точки начала транскрипции.

ТНТ конструкции LlA(l-98) имели различное положение в последовательности L1 для двух протестированных клеточных линий (Рис. 8А,Б). Так, в клетках линии НЕК293, было обнаружено присутствие двух ТНТ LlA(l-98), находящихся вблизи друг от друга в положениях +922 и +926 и представленных одинаковым количеством клонов. Нуклеотиды +922 и +926 располагаются не в 5' НТО L1, а в присутствующем во всех использованных в работе конструкциях 5'-концевом фрагменте ОРС1 L1 в положениях 12 п.о. и 16 п.о. ниже старт ко-дона ATG соответственно. В случае же клеточной линии NTera2/Dl, для всех отсеквенированных клонов была обнаружена лишь одна ТНТ ИД(1-98) (Рис.8 А,Б), расположенная в положении +786 З'-концевой части 5' НТО L1.

Для полноразмерной 5' НТО L1, неожиданным открытием стало обнаружение укороченных мРНК, имеющих альтернативные ТНТ и присутствующих в пуле транскриптов L1 наравне с мРНК, имеющими каноническую ТНТ вблизи самого 5' конца ретротранспозона. Эти укороченные мРНК присутствовали в обеих протестированных клеточных линиях, причем на электрофореграмме ПЦР-продуктов, получаемых в результате применения 5' RACE, эти ТНТ формировали наиболее интенсивно окрашенные полосы и, как оказалось, находились в положениях +525 и +570 для НЕК293 и NTera2/Dl соответственно (Рис. 8А,Б). Различия в местоположении точек инициации транскрипции между использованными клеточными линиями, возможно, отражают тканеспецифич-

А

НЕК293, L1WT

Уш

THT эндогенных геномных Li v

HEK293, NTera2/Dl,

LMa-98) 1.1 WT

Б

i Ii #

t w

^ ^

LI 5' НТО ? *r < «Г tf

t. tt ф.ф

THT экзогенных конструкций

OliilacTb(.WO...S2ftr'c> *

V'>

ШНП СМЫСЛОВОЮ npos

-Минимальный Области (378...431) и (480...497),

промотор" богягше THT антнсмысловых мРНК LI

Рис. 8. Картирование точек начала транскрипции в 5' НТО 1Л. (А) Электрофоре-граммы в агарозном геле ПЦР-продуктов, полученных в результате применения метода 5'КЬМ-ЯАСЕ для образцов РНК из клеток линий НЕК293 и 1ЧТега2Л)1, трансфециро-ванных содержащей полноразмерную 5' НТО Ы векторной конструкцией (Ы \УТ), или же конструкцией, содержащей 5' НТО Ы с делецией первых 98 п.о. (Ь1Д(1-98)) соответственно. Стрелками указаны отсеквенированные ПЦР-продукты. На всех электрофоро-граммах с левой стороны нанесен маркер длин 100 п.о. (В) Картирование ТНТ эндогенных Ы (выше горизонтальной линии) и экзогенных конструкций Ы^а и ЫД(1-98) (ниже горизонтальной линии). Горизонтальной линией схематически изображена 5' НТО Ы, на которой вертикальными чертами показаны положения каждого сотого нуклеотида последовательности. Местоположения картированных ТНТ показаны стрелками и снабжены следующими примечаниями: положение ТНТ в 5' НТО Ы; последовательность нуклеотидов, заключающая в себе ТНТ (вверху); клеточная линия, тип использованной для трансфекции конструкции; количество прочтений последовательности.

ность состава факторов транскрипции в использованных клетках. Надо заметить, что, за единственным исключением, ранее не было сделано попыток тщательного анализа локализации ТНТ для плюс-нити полноразмерной 5' НТО Внимание авторов было сфокусировано на самом начале 5' НТО и прилегающих к ней, расположенных выше +1 нт. последовательностях, в связи с чем, анализ ТНТ был проведен лишь для 5'-концевой области плюс-нити длиной -100-550 п.о., а также - для картирования ТНТ на комплементарной нити, являющихся результатом действия антисмыслового промотора Таким образом,

обнаруженные нами альтернативные ТНТ, расположенные во внутренней области 5' НТО, могли остаться незамеченными в более ранних исследованиях.

11.3. Картирование точек начала транскрипции эндогенных L1 человека.

Обнаружение укороченных мРНК, транскрипция которых инициирована во внутренней области 5' НТО L1 конструкции Llwt, подняло вопрос о том, не являются ли эти новые транскрипты артефактами, появляющимися вследствие использования кодирующего ретротранспозон вектора? Или же они представляют собой нативные сайты инициации транскрипции, характерные также и для хромосомных копий L1? Известно что, хотя модельные системы, аналогичные использованной в работе, и широко применимы для изучения структуры промоторов, однако в некоторых случаях клонированные в них промоторы способны проявлять несколько другие свойства, нежели их эндогенные прародители. К тому же, насколько нам известно, к настоящему времени еще не было проведено экспериментов, в которых метод 5' RACE был бы применен к эндогенным транскриптам L1. Таким образом, нами было проведено картирование точек начала транскрипции пула мРНК L1, инициированных с хромосомных копий этих ретротранспозонов в клетках НЕК293 и NTera2/Dl. Для этого был применен метод 5' RLM-RACE, в ходе которого были использованы праймеры на последовательность ОРС1 человек-специфичного L1, отсутствующую в вышеупомянутых конструкциях, содержащих репортерный ген люциферазу. Все полученные клоны содержали последовательности L1, источником которых являются молодые подсемейства L1PA2 и L1PA3, которые, как известно, в доминирующем количестве представлены в транскриптоме клеток человека. Нами было обнаружено, что в обеих клеточных линиях ТНТ эндогенных L1 имели высокую гетерогенность. Часть их представляла собой «аутентичные» ТНТ, расположенные в самом начале 5' НТО (14% и 60% клонов для НЕК293 и NTera2/Dl соответственно), тогда как остальные были картированы на внутренний участок 5' НТО, главным образом на область 100 п.о. ниже фрагмента (390-526) (Рис. 8Б). Эти результаты хорошо согласуются с полученными ранее результатами картирования ТНТ для мРНК, транскрибирующихся с трансфецированной конструкции Llwt и позволяют предположить, что местоположения ТНТ L1 человека могут варьировать в пределах 5' НТО как в случае экзогенного, так и в случае эндогенного происхождения промотора L1. Важно отметить, что в обоих случаях точки начала транскрипции располагались либо на самом 5' конце 5' НТО L1, либо -100 п.о. ниже области (390-526).

11.4. Заключение.

Согласно полученным результатам, наиболее важной областью 5' НТО L1 человека для обеспечения транскрипционной активности 5' НТО L1, является 22

область (390-526), делеция которой приводит к максимальному снижению про-моторной активности, как по результатам измерений уровня экспрессии белка, так и мРНК в клетках линий НЕК293 и ОТега2Ю1. Делеция же области «минимального промотора» приводит к менее ярко выраженному снижению промо-торной активности 5' НТО. Транскрипционная активность отдельно взятого «минимального промотора» сравнительно низка и составляет -30% от уровня активности полноразмерного 5' НТО. Эти результаты ставят под сомнение общепринятое мнение о ключевой роли «минимального промотора» Ы.

Кроме того, нами было показано, что помимо инициации транскрипции в самом начале 5' НТО экзогенного происхождения, в пуле мРНК присутствуют транскрипты, инициированные во внутренней области 5' НТО. Делеция же «минимального промотора» приводит к смещению ТНТ в З'-конец 5'-НТО или даже в самое начало кодирующей последовательности Ы. В подтверждение полученным для экзогенных конструкций результатам, нами было показано, что с внутренней области хромосомных копий Ы также происходит инициация транскрипции.

Таким образом, на основании всех полученных результатов, можно предположить, что основная функция «минимального промотора» заключается в точном позиционировании инициирующего транскрипцию комплекса в самое начало 5'-конца элемента, а не в эффективном привлечении факторов транскрипции.

ВЫВОДЫ

1. Для двух типов тканей - паренхимы яичка и семиномы был определен профиль экспрессии человек-специфичных ЬТЯ семейства НЕЯУ-К (НМЬ-2), в результате чего было показано, что более половины ЬТ^Ья обладают промоторной активностью в тканях зародышевого пути человека.

2. Среди промоторно-активных были идентифицированы 14 одиночных и З'-провирусных ЬТЯ, дифференциально экспрессирующихся в опухолевой ткани по сравнению с нормальной.

3. В результате анализа промоторной активности ЬТЯ_Ь8 в зависимости от геномного окружения, было показано, что наиболее богатыми промоторно-активными ЬТЫ областями генома являются экзоны известных генов.

4. В результате сравнительного анализа промоторной активности 16ти ЬТЬМ« и уровней экспрессии соседних с ними генов, было показано, что корреляция между этими значениями отсутствует.

5. Было проведено картирование точки начала транскрипции для одиночных ЬТЯ_Ь8 и продемонстрировано, что инициация транскрипции генов провируса также преимущественно происходит с области ЬТЯ, расположенной вблизи от этой ТНТ.

6. С применением метода делеционного картирования было показано, что наиболее важной областью, ответственной за промоторную силу 5'НТО L1, является внутренний участок +390. ..+526, а не «минимальный промотор» L1, как считалось ранее.

7. Было продемонстрировано, что инициация транскрипции с 5' НТО L1 как экзогенного, так и эндогенного происхождения, помимо самого начала L1 происходит также и с внутренней области ретротранспозона, расположенной между 525 и 621 нт.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ ДИССЕРТАЦИИ ИЗЛОЖЕНЫ В СЛЕДУЮЩИХ РАБОТАХ:

Публикации в научных журналах:

1. Alexandrova Е., Olovnikov I., Malakhova G., Zabolotneva A., Suntsova M., Dmitriev S., Buzdin A. Sense transcripts originated from an internal part of the human retrotransposon LINE-1 5' UTR. Gene 2012 Dec 10; 511(l):46-53

2. A. Buzdin, E. Kovalskaya-AIeksandrova, E. Gogvadze, E. Sverdlov. At least 50% of human-specific HERV-K (HML-2) long terminal repeats serve in vivo as active promoters for host nonrepetitive DNA. J Virol, 2006, Nov; 80(21): 10752-62

3. A. Buzdin, E. Kovalskaya-AIxandrova, E. Gogvadze, E. Sverdlov. GREM, a technique for genome-wide isolation and quantitative analysis of promoter active repeats. Nucleic Acids Res. 2006 May 12; 34(9):e67

4. E. Kovalskaya, A. Buzdin, E. Gogvadze, T. Vinogradova, E. Sverdlov. Functional human endogenous retroviral LTR transcription start sites Eire located between the R and U5 regions. Virology, 2006, Mar 15; 346(2):373-8

Публикации в научных книгах: A. Buzdin, М. Suntsova, О. Bantysh, Е. Aleksandrova, A. Zabolotneva, Е. Gogvadze, and N. Gaifullin. Chapter №23 «Recent Inserts of Transposable Elements Affect Structure and Functions of Human Genome» в книге «Radiobiology and environmental security», eds. C.E. Mothersill, V. Korogodina and C.B. Seymour. Springer, 2012 ISBN 978-94-007-1999-6 (PB) ISBN 978-94-007-1938-5 (Print) ISBN 978-94-007-1939-2 (Online) DOI 10.1007/978-94-007-1939-2

Материалы российских и международных научных конференций:

1. Е. Aleksandrova, S. Dmitriev, A Buzdin. Functional characterization of the transcriptional regulatory elements in human retrotransposons HERV-K (HML-2) and LI. in International conference "Modern problems of genetics, radiobiology, radioecology and evolution", 2010, Alushta, Ukraine.

2. E. Gogvadze, E. Kovalskaya, A. Buzdin, T. Vinogradova, E. Sverdlov. Mapping of transcriptional start site within solitary and proviral HERV-K LTRs. 20th IUBMB International congress of biochemistry and molecular biology and 11th FAOBMB congress, 2006, Kyoto, Japan

Заказ № 12-а/10/2013 Подписано в печать 27.09.2013 Тираж 70 экз. Усл. п.л. 1.2

ООО "Цифровичок", тел. (495) 649-83-30 www.cfr.ru; е-таП:zak@cfr.ru

Текст научной работыДиссертация по биологии, кандидата биологических наук, Александрова, Елена Александровна, Москва

Федеральное государственное бюджетное учреждение науки ИНСТИТУТ БИООРГАНИЧЕСКОЙ ХИМИИ им. академиков М.М. Шемякина и Ю.А. Овчинникова Российской академии наук

На правах рукописи

04201362060

АЛЕКСАНДРОВА ЕЛЕНА АЛЕКСАНДРОВНА

КАРТИРОВАНИЕ РЕГУЛЯТОРНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ В СОСТАВЕ РЕТРОТРАНСПОЗОНОВ НЕКУ-К (НМЬ-2) И Ь1.

03.01.03 - Молекулярная биология

ДИССЕРТАЦИЯ

на соискание учёной степени кандидата биологических наук

Научный руководитель: доктор биологических наук, Буздин А.А.

Москва, 2013

ОГЛАВЛЕНИЕ.

СПИСОК СОКРАЩЕНИЙ........................................................................................................4

ВВЕДЕНИЕ...................................................................................................................................5

ОБЗОР ЛИТЕРАТУРЫ..............................................................................................................6

Глава I. Характеристика мобильных элементов.........................................................6

1.1 Ретроэлементы класса LINE..........................................................................................7

1.2 Ретроэлементы класса SINE..........................................................................................9

1.3 Ретропозоны SVA.............................................................................................................9

1.4 Процессированные псевдогены.....................................................................................10

1.5 LTR-ретротранспозоны и эндогенные ретровирусы.................................................10

1.6 Интроны группы II (ретроинтроны)...........................................................................11

1.7 Penelope - подобные элементы.....................................................................................12

Глава II. Роль антисмысловых промоторов ретроэлементов в геномах эукариот.................................................................................................................................14

II. 1 Антисмысловые промоторы ретроэлементов в качестве альтернативных промоторов генов................................................................................................................16

11.2 Модель «Разбивания генов».........................................................................................22

11.3 Изменение уровня экспрессии генов в результате эпигенетических механизмов, обусловленных активностью АСП....................................................................................23

11.4 Регуляция уровня экспрессии ретроэлементов по механизму РНК-интерференции, опосредованной активностью содержащихся в них АСП.................29

ЭКСПЕРИМЕНТАЛЬНАЯ ЧАСТЬ.......................................................................................35

Обоснование работы и поставленные задачи............................................................35

Материалы и методы..........................................................................................................36

1. Материалы.......................................................................................................................36

2. Методы............................................................................................................................40

Результаты и их обсуждение...........................................................................................50

I. Полногеномная идентификация и анализ промоторной активности транскрипционно-активных человек-специфичных LTR HERV-K (HML-2)..................50

II. Роль «минимального промотора» и внутренней области 5' НТО ретротранспозона L1 в инициации транскрипции..........................................................70

ВЫВОДЫ....................................................................................................................................85

СПИСОК ЛИТЕРАТУРЫ.......................................................................................................86

ПРИЛОЖЕНИЕ.......................................................................................................................101

СПИСОК СОКРАЩЕНИЙ.

МГЭ - мобильные генетические элементы; РЭ - ретроэлементы;

LINE (Long Interspersed Nuclear Elements) - длинные диспергированные повторы;

SINE (Short Interspersed Nuclear Elements) - короткие диспергированные повторы;

LTR (Long Terminal Repeat) - длинный концевой повтор;

ЭРВ - эндогенный ретровирус человека;

5' (3') НТО - 5' (3') нетранслируемая область;

ОРС - открытая рамка считывания;

TPRT (Target Primed Reverse Transcription) - механизм ретротранспозиции LINE элементов;

ПЦР - Полимеразная Цепная Реакция; ОТ - обратная транскрипция;

RACE (Rapid Amplification of cDNA Ends ) - метод быстрой амплификации концов кДНК;

п.н. - пары нуклеотидов;

т.п.н. - тысяч пар нуклеотидов;

АСП - антисмысловой промотор;

дцРНК - двуцепочечная РНК;

киРНК - короткие интерферирующие РНК;

piPHK - короткие РНК, взаимодействующие с белками семейства PIWI;

RISC (RNA-induced silencing complex) - комплекс, осуществляющий РНК-

интерференцию;

ТНТ - точка начала транскрипции; TR (Terminal Repeat) - концевой повтор; ФТ - фактор транскрипции;

GREM (Genomic Repeat Expression Monitor) - метод полногеномной идентификации транскрипционно-активных повторов.

ВВЕДЕНИЕ

Мобильные генетические элементы (МГЭ), богатые регуляторными последовательностями, представляют собой чрезвычайно интересные и важные объекты в исследованиях регуляции транскрипции. Они были обнаружены во всех изученных к настоящему времени геномах эукариот, к которым относится и геном человека, примерно половина которого состоит из последовательностей, произошедших в результате активности т.н. «прыгающих» генов. МГЭ являются мощным источником генетической нестабильности за счет своей способности к инсерционному мутагенезу, эктопической рекомбинации, трансдукции 5' и 3'-фланкирующих последовательностей, образованию псевдогенов или даже новых функциональных копий генов, разрушению ранее существовавших экзон-интронных структур и изменению эпигенетической регуляции генов. Интеграция МГЭ в последовательности важных генов, таких как, например, кодирующие онкосупрессоры гены, может привести к нарушению механизмов контроля деления, роста и дифференцировки клеток, что в свою очередь способно привести к возникновению некоторых форм рака. Надо отметить, что наибольшую опасность для целостности генома представляет собой повышение активности МГЭ в клетках терминальной линии, поскольку в данном случае нарушения генома могут быть переданы потомкам. Однако не всегда активность МГЭ приводит лишь к негативным результатам. К настоящему времени известны примеры позитивного влияния активности МГЭ на функционирование организма в целом. Так, например, ДНК человека содержит одомашненные элементы, имеющие наиважнейшие функции, такие как активирующие рекомбинацию гены RAG, лежащие в основе V(D)J рекомбинации нашей иммунной системы, а также ген ERVWE1, играющий важную роль в развитии плаценты.

Данная работа посвящена изучению структур смысловых промоторов ретротранспозонов человека, активность которых способна оказывать значительное влияние на функционирование генома клетки-хозяина.

ОБЗОР ЛИТЕРАТУРЫ. Глава I. Характеристика мобильных элементов.

МГЭ присутствуют в геномах широкого спектра живых организмов, что было показано в результате полногеномного секвенирования и сравнительного анализа геномов человека [1], шимпанзе [2], мыши [3], дрозофилы [4] и других геномов. Как оказалось, образованные в результате активности МГЭ последовательности могут составлять значительную часть ДНК. Так, например, -45% генома человека [1] и -80% генома кукурузы [5] состоят из таких последовательностей (включая фрагменты транспозонов или «мертвые» элементы, инактивированные мутациями). Такое обилие МГЭ резко контрастирует с небольшим процентным содержанием последовательностей, кодирующих клеточные белки (<2% в геноме человека [1]). Интересно, что доля занимаемой повторяющимися элементами ДНК, значительно варьирует в геномах различных организмов. Например, по сравнению с геномами человека и кукурузы, геномы дрозофилы и дрожжей имеют невысокое содержание МГЭ и большее в процентном соотношении количество генов [4, 6].

Существует много различных типов мобильных элементов. В зависимости от природы молекулы-посредника, используемого для мобилизации, их делят на два класса: МЭ класса I, или ретроэлементы (РЭ) и МГЭ класса II, или ДНК-транспозоны. РЭ перемещаются в геномах с помощью РНК-посредника по механизму, который часто называют «копирование-вставка» («сору&ра$1е»). Согласно нему, с материнского РЭ происходит синтез мРНК, на матрице которой при помощи фермента РНК-зависимой ДНК-полимеразы (альтернативные названия этого фермента - обратная транскриптаза или ревертаза) затем происходит синтез кДНК-копии материнского элемента. ДНК-транспозоны перемещаются в геномах по механизму, называемому «вырезание-вставка» («с1Н&ра$1е») и заключающемуся в вырезании мобильного элемента и его реинтеграции в новое место генома.

РЭ являются единственным классом МЭ, не утратившим способность к транспозиции в геномах млекопитающих [4]. На основании присутствия или отсутствия в последовательностях ретроэлементов длинных концевых повторов, фланкирующих основную часть элемента, их принято делить на две группы: 1) ЬТЯ-содержащие («ЬТЫ-ретротранспозоны», также их называют ретровирус-подобными мобильными элементами) и 2) ЬТЯ-не-содержащие (или «поп-ЬТЯ-ретротранспозоны»). Помимо различий в присутствии или отсутствии длинных концевых повторов, ЬТЯ-содержащие и ЬТК-не-содержащие ретроэлементы имеют

совершенно разные механизмы пролиферации. LTR-содержащие ретроэлементы представлены в геномах эндогенными ретровирусами (ЭРВ), LTR ретротранспозонами и тирозин-рекомбиназными ретротранспозонами. К LTR-не содержащим ретроэлементам относят следующие типы ретроэлементов: длинные диспергированные повторы или LINE, короткие диспергированные повторы или SINE (SINE - Short Interspersed Nuclear Elements), процессированные псевдогены и ретротранспозоны SVA (Рис.1). Поскольку эндогенные ретровирусы и LINE-элементы кодируют белки, необходимые для обратной транскрипции мРНК ретроэлемента и интеграции новосинтезированной кДНК в новое место генома, их называют автономными ретроэлементами или ретротранспозонами. SINE- и SVA-элементы, а также процессированные псевдогены являются неавтономными элементами или ретропозонами, поскольку они не содержат генов, кодирующих необходимые для ретротранспозиции белки [7]. Считается, что перемещение ретропозонов в геноме происходит за счет ретротранспозиционной машины LINE [8, 9].

1.1 Ретроэлементы класса LINE.

Ретротранспозоны LINE широко распространены в геномах эукариот и были найдены в ДНК грибов, растений, беспозвоночных и позвоночных животных. В геномах млекопитающих присутствуют три семейства LENE-элементов: LINE1, LINE2 и CR1/LINE3. Элементы LENE, принадлежащие к семействам LINE2 и CR1/LENE3, являются древними и исчезающими и составляют -3% и 0,38% (LENE2), и 0,3% и 0,05% (LENE3) геномов человека и мыши соответственно [10]. С другой стороны, элементы семейства LINE1 (или L1) занимают значительную часть генома человека (-17%) и представлены в нем более чем 500 000 копиями [1]. Хотя бы одна инсерция L1 присутствует в более 75% генов человека. В большинстве случаев эти инсерции расположены в интронах, 3' или 5' НТО генов [11]. Такая многочисленность этих элементов является результатом их постоянной активности в течение последних 150 млн. лет [1]. В настоящее время лишь 80-100 копий L1 не утратили способности к ретротранспозиции, тогда как остальные элементы представлены в геноме человека в виде усеченных с 5'-конца копий, утративших эту способность [12].

LINE Ц5' НТО

OPC1

I

3' НТО

[ХшшІ

' (A) I

| Левый мономер А-богатый зшытер Правый мономер Поїш і (А)

SVA

|j(CCCTCl)N Alu VNTR SINE-R/HERV-K Щ

Процессированный псевдоген

M Экзон X ЭкзонХ+1 1

ЭРВ

LTR GAG POL ENV LTR

РепеЬре-подобные у — | — I элементы п--1--Г

Рис. 1. Схематическое строение ретроэлементов. Черными треугольниками обозначены короткие прямые повторы или сайты-мишени дупликации, НТО - нетранслируемая область, ОРС - открытая рамка считывания, LTR - длинный концевой повтор, RT - обратная транскриптаза, env - ген белка оболочки вируса, gag - ген капсидных белков вируса, EN -эндонуклеаза.

I

RT

EN

LINE имеют длину 4-8 т.п.о. и состоят из 5' нетранслируемой области (НТО), содержащей внутренний промотор для РНК-полимеразы II [13], двух открытых рамок считывания (ОРС), содержащей сигнал полиаденилирования 3' НТО, и поли А хвоста вариабельной длины (Рис.1) [14]. По краям LINE имеются короткие прямые повторы длиной 7-20 п. о., представляющие собой дупликацию сайта мишени. ОРС1 LINE кодирует РНК-связывающий белок р40, тогда как белок, кодируемый ОРС2 имеет эндонуклеазную и обратно-транскриптазную активности, необходимые для пролиферации LINE в геноме [15]. Процесс ретротранспозиции происходит следующим образом: синтезированная РНК-полимеразой II РНК экспортируется из ядра в цитоплазму, где происходит трансляция белков с открытых рамок считывания ОРС1 и ОРС2. Далее, поскольку оба белка проявляют ярко выраженное цис-предпочтение [16], они связываются с РНК LINE, с которой происходила их трансляция и образуют рибонуклеопротеиновую частицу. Эта частица экспортируется обратно в ядро, где происходит обратная транскрипция и интеграция LINE в геном. Реакция обратной транскрипции РНК LINE элементов происходит по типу TPRT (Target Primed Reverse Transcription), в ходе которой на РНК матрице синтезируется

цепь кДНК в месте её будущей интеграции [17, 18]. Поскольку необходимые для ретротранспозиции белки закодированы в последовательности самих LINE, этот класс мобильных элементов считается автономным.

1.2 Ретроэлементы класса SINE

Ретроэлементы класса SINE, так же как и элементы LINE, широко распространены в геномах эукариот. Они составляют -12% генома человека и представлены в нем двумя семействами: Alu (~10%) и MIR (-2%). Alu элементы имеют наибольшее количество копий в геноме человека (>1 ООО ООО) [1], что связано с их активностью в течение последних 65 млн. лет [19]. Кроме того, SINE представлены огромным количеством семейств как в геномах млекопитающих, так и в геномах других эукариот [20, 21].

SINE представляют собой неавтономные ретропозоны длиной не более 500 п.о. Большинство SINE млекопитающих на 3' конце содержат последовательность олиго (А) или же блоки других (А-богатых) микросателлитов, необходимых для ретротранспозиции [22]. SINE содержат внутренние промоторы РНК-полимеразы III (они находятся в 5' областях), но не содержат внутренних сайтов терминации транскрипции. Вместо этого РНК-полимераза использует сайты терминации транскрипции (последовательность четырех или более нуклеотидов Т), расположенные на различных расстояниях в нижележащих областях ДНК, в результате чего транскрипты SINE обычно гетерогенны по размеру. Поскольку SINE обычно имеют небольшую длину и не кодируют белков, то для ретротранспозиции они нуждаются в экзогенной обратной транскриптазе. Несмотря на то, что белки ORF1 и ORF2 LI имеют строгое цис-предпочтение [16], принято считать, что для своего распространения SINE «заимствуют» обратную транскриптазу у LINE [10], поэтому их иногда называют «паразитами паразитов» [23].

1.3 Ретропозоны SVA

Ретропозоны SVA, так же как и Alu-элементы, являются неавтономными ретроэлементами, активными в геноме человека и используют ретротранспозиционный аппарат LINE1 для своей мобилизации [24]. SVA представляет собой составной элемент, образованный в результате слияния элемента SINE-R, последовательности с варьирующим числом тандемных повторов, или VNTR (VNTR - Variable Number of Tandem Repeats) и Alu-элемента [24] (Рис.1). Собственно говоря, исходя из состава этих элементов и произошло их название: SINE-R, VNTR, Alu - SVA, а его образование, судя по всему, произошло в результате колокализации нескольких повторяющихся элементов в одном и том же участке хромосомы [25]. С 5' и 3'концов SVA

фланкированы прямыми повторами, а область БУА У1ЧТЯ может иметь длину от 48 до 2300 п.о. [26]. В геноме человека присутствует -2700 копий БУА, средняя длина которых составляет 2000 п.н. Семейство БУА до сих пор активно, поскольку известно по крайней мере 7 примеров наследственных заболеваний человека, вызванных интеграциями БУА [27].

Транскрипция БУА, как принято считать, происходит с участием РНК-полимеразы II, однако ее внутренний промотор не был найден. Известно, что по крайней мере в некоторых случаях транскрипция БУА может быть обусловлена промоторной активностью 5'-фланкирующих элемент областей генома, а точка начала транскрипции может находиться выше последовательности элемента [24, 26]. Кроме того, несмотря на то, что на З'-конце элемента БУА расположен канонический сигнал полиаденилирования ААТААА, в некоторых случаях терминация транскрипции на нем не происходит, в результате чего синтезируется способная к интеграции мРНК-копия элемента, содержащая фланкирующую с 3'-конца область генома [28], что свидетельствует о способности БУА к трансдукациии 3'- и 5'- фланкирующих последовательностей.

1.4 Процессированные псевдогены

В геноме человека на каждый ген приходится от 1 до 10 (иногда до 100) процессированных псевдогенов, также известных как ретропсевдогены [29]. Процессированные псевдогены - это обратно транскрибированные и интегрированные в геном копии клеточных мРНК [30]. Иными словами, псевдогены являются последовательностями ДНК, гомологичными копиям клеточных генов. Как и последовательноти мРНК, псевдогены обычно содержат последовательности олиго (А) на 3' конце и не содержат интронов, а также функциональных промоторов и других регуляторных элементов (Рис.1). Считается, что основная масса процессированных псевдогенов появилась, в результате ретротранспозиционой активности Ы [30], хотя есть и исключения [31]. Псевдогены являются важными источниками информации для эволюционной и сравнительной геномики, т.к. они предоставляют собой молекулярные записи древних генов, существ�