Бесплатный автореферат и диссертация по биологии на тему
Полногеномные подходы к функциональному анализу повторяющихся элементов
ВАК РФ 03.00.03, Молекулярная биология

Автореферат диссертации по теме "Полногеномные подходы к функциональному анализу повторяющихся элементов"

РОССИЙСКАЯ АКАДЕМИЯ НАУК

Институт биоорганической химии им М М Шемякина и Ю А Овчинникова

На правах рукописи УДК 577 152

БУЗДИН Антон Александрович

ПОЛНОГЕНОМНЫЕПОДХОДЫ К ФУНКЦИОНАЛЬНОМУ АНАЛИЗУ ПОВТОРЯЮЩИХСЯ ЭЛЕМЕНТОВ

03 00 03 - Молекулярная биология

АВТОРЕФЕРАТ

диссертации на соискание ученой степени доктора биологических наук

003445Э2Э

04 Ай Г ' ¿ььд

Москва - 2008

003445929

Работа выполнена в лаборатории структуры и функций генов человека Института биоорганической химии им М М Шемякина и Ю А Овчинникова РАН

Официальные оппоненты

Доктор биол наук М Б Евгеньев Доктор биол наук К А Лукьянов Член-корреспондент РАН, доктор биол наук профессор Н В Томилин

Научный консультант

Академик РАН, доктор биол наук профессор Е Д Свердлов

Ведущая организация

Институт молекулярной биологии РАН

Защита состоится "24" сентября, 2008 г в часов на заседании Специализированного совета при Институте биоорганической химии им ММ ШемякинаиЮА Овчинникова РАН по адресу 117997, г Москва, ул Миклухо-Маклая 16/10

С текстом диссертации можно ознакомиться в библиотеке Института биоорганической химии им М М Шемякина и Ю А Овчинникова РАН

Автореферат разослан " "_ 2008 г

Ученый секретарь Специализированного совета

доктор химических наук В А ОЛЕЙНИКОВ

Актуальность темы.

Выход молекулярной генетики на качественно новый уровень - уровень исследования и сопоставления структуры и функций целых геномов - возможен лишь при развитии арсенала соответствующих экспериментальных подходов Первым этапом могло бы являться получение исчерпывающих структурных данных, вторым - расшифровка на их основе функциональной роли тех либо иных участков генома Возможно, наилучшим из имеющихся структурных подходов с точки зрения полноты охвата проблемы является тотальное секвенирование геномной ДНК и библиотек транскриптов различных тканей исследуемого организма Вместе с тем, регуляторные участки генома таким способом выявить невозможно Кроме того, подход очень дорог и требует огромного напряжения усилий множества ученых Применение технологии микрочипов не может быть полноценной заменой полного секвенирования, так как не позволяет различать слабодивергировавших представителей мультигенных семейств, а также те последовательности, в состав которых входят повторяющиеся элементы

Изменения в структуре ДНК, прямо или косвенно связанные с изменением количества копий геномных повторов, являются одним из важнейших факторов эволюции геномов и, соответственно, видообразования Мобильные элементы обладают значительным регуляторным потенциалом, обеспечивающим контроль экспрессии их собственных генов В то же время, известно, что активность многих уникальных функциональных участков генома, например, многих генов, модулируется располагающимися по соседству вставками мобильных элементов

Кроме того, изучение геномных повторов, в особенности - мобильных элементов и их фракции, активной у позвоночных, ретроэлементов - может дать исследователям новые полиморфные маркеры, которые могут быть использованы как для филогенетических, так и для медико- и популяционно-генетических исследований Поэтому сравнение распределения ретроэлементов между геномами представляется одной из важнейших задач молекулярной генетики

Применяемые для решения этой задачи большинством исследователей экспериментальные подходы не дают возможности проводить анализ на уровне целых геномов Казалось бы, наилучшим выходом могла бы стать тотальная идентификация геномных повторов в базах данных Однако этот подход имеет важный недостаток все

данные о наличии повторов в различных локусах генома берутся из баз данных и, учитывая, что для всех крупных проектов секвенируют ДНК лишь небольшого количества представителей исследуемого вида, подавляющее большинство информации о полиморфных в популяции повторах теряется Кроме того, прицентромерные и прителомерные участки с трудом поддаются анализу и недопредставлены во всех опубликованных последовательностях ДНК эукариот со сложным геномом Таким образом, базы данных содержат неполную информацию К тому же, таким способом можно исследовать только те объекты, геномная последовательность которых частично или же почти полностью установлена

Поэтому актуальной представляется задача создания экспериментальных методов, позволяющих проводить полногеномное сравнение распределения повторяющихся элементов между организмами и их функциональной характеристики независимо от информации, содержащейся в базах данных

Цель работы

Основной целью настоящей работы являлась разработка экспериментальных подходов, позволяющих проводить полногеномное сравнение распределения геномных повторов в ДНК представителей разных видов или между различными особями одного вида Разработанные методики предполагалось применить для идентификации и структурно-функциональной полногеномной характеристики ретроэлементов, специфичных для генома человека Такие ретроэлеменгы присутствуют только в ДНК человека, но не в геномах других наиболее родственных видов (шимпанзе Pan paniscus u Pan tioglodytes) и других организмов На основе обнаруженных функционально активных человек-специфичных ретроэлементов планировалось выявить потенциальные регуляторы активности известных генов, которые могли выступать как важные факторы в ходе молекулярной эволюции генома человека

Научная новизна и практическая ценность В ходе выполнения работы были разработаны методы прямого экспериментального сравнения участков интеграции геномных повторов между ДНК близкородственных видов Методы являются уникальными и не имеют аналогов в опубликованной литературе Первый метод, TGDA (англ Targeted Genomic Di/fei enees Analysis), основан на вычитающей гибридизации геномных последовательностей, фланкирующих повторы, а второй, Difflr (ангч Di fíe] enees т the integration sites of low and medium eopy number interspened repeats technique) — на дифференциальной гибридиазации фланкирующих участков генома на фильтре

В ходе разработки вышеуказанных методов оказалось, что неспецифическая гибридизация нуклеиновых кислот в значительной мере осложняет создание и анализ получаемых клонотек Для повышения специфичности отбора совершенных дуплексов при гибридизации нами был разработан новый методический подход, названный MDR (ami Mispaired DNA Rejection), основанный на селективной энзиматической деградации некорректно спаренных ДНК-дуплексов MDR потенциально применим для повышения специфичности целого семейства методов, основанных на гибридизации нуклеиновых кислот в растворе с последующей ПЦР-амплификацией, например, вычитающей гибридизации и метода клонирования совпадений

Для функциональной характеристики геномных повторов мы разработали новый экспериментальный подход, впервые позволяющий проводить полногеномные исследования промоторной активности геномных повторов как на качественном, так и на количественном уровне Этот подход, названный GREM (англ Genomic Repeat Expression Monitor), основан на гибридизации геномных последовательностей, фланкирующих повторы, с 5'-концевыми фрагментами кДНК

Разработанные подходы были успешно применены для полногеномной идентификации специфичных для генома человека представителей ретроэлементов семейств HERV-K (HML-2) u LI Был проведен детальный структурный анализ человек-специфичных ретроэлементов В составе последовательности длинных концевых повторов элементов группы HERV-K (HML-2) найдена ранее неизвестная точка начала транскрипции, расположенная на границе областей R и U5 - в участке, отличающемся от канонического для экзогенных ретровирусов (граница областей U3 и R) По-видимому, появление новой точки начала транскрипции связано с адаптивной эволюцией данного семейства эндогенных ретровирусов человека Также было установлено, что человек-специфичные представители HERV-K (HML-2) обладают

значительным сходством нуклеотидной последовательности и для них была выведена консенсусная последовательность

Было обнаружено новое семейство ретроэлементов, состоящее из химерных последовательностей, образованных при однократной или двукратной смене матрицы в ходе обратной транскрипции Представители нового семейства были найдены в геномах млекопитающих и у нитчатого гриба Magnaporthe grísea Это позволяет сделать вывод о высокой эволюционной консервативности обнаруженного явления

Кроме того, в интронах двух генов человека - SLC u SLB - выявлены человек-специфичные представители HERV-K (HML-2), инициирующие транскрипцию антисмысловых РНК, перекрывающихся с последовательностями экзонов этих генов В системе т \itro показано, что экспрессия этих антисмысловых транскриптов на физиологическом уровне, наблюдаемом для эмбриональных и герминогенных тканей, приводит к 2-3 -кратному снижению концентрации мРНК соответствующих генов Таким образом, обнаружены первые два случая человек-специфичной регуляции экспрессии генов за счет антисмысловой транскрипции, регулируемой ретроэлементами

1 Повышение специфичности гибридизации в растворе

Работа была проведена Е В Гогвадзе, Т В Чалой, Е Д Свердловым и А А Буздиным

Хорошо известный недостаток гибридизации сложных смесей ДНК - побочная гибридизация ДНК геномных повторов, присутствующих в сравниваемых образцах В результате такого «неспецифического» отжига, итоговые клонотеки изобилуют химерными последовательностями, получившимися при гибридизации повторяющихся частей из неортологичных локусов (Рис 1) Такие химеры абсолютно бесполезны при анализе клонотек и даже вредны, поскольку для того, чтобы понять, является ли последовательность химерой или же целевым продуктом гибридизации, приходится проводить достаточно трудоемкий анализ каждой последовательности поотдельности Химеры в среднем могут занимать 40-60% библиотек ДНК Хотя ситуация может быть несколько улучшена при добавлении к гибридизационной смеси конкурирующей фракции геномной ДНК, обогащенной последовательностями повторов, количество нежелательных химерных клонов в библиотеках всё же остается высоким (см ниже) Для того, чтобы улучшить создавшуюся ситуацию, нашей группой был разработан метод, названный Mispaired DNA Rejection (MDR), позволяющий свести к минимуму содержание химер в конечных библиотеках Метод основан на том, что подавляющее

большинство взаимно-отжигающихся геномных повторов, хотя и содержат значительную гомологию нуклеотидной последовательности, но все же не полностью идентичны друг другу Поэтому их ДНК-дуплексы не являются совершенными и содержат протяженные или же короткие участки неспаренных нуклеотидов Это могут быть как одиночные нуклеотиды, так и значительные по длине выпетливания Все такие структурные отклонения от нормы, то есть совершенных ДНК-дуплексов, могут узнаваться и расщепляться особыми нуклеазами, названными здесь мисмэтч-специфическими нуклеазами (МСН) МСН служат ¡n vivo как участники репарации геномной ДНК или в ходе прохождения жизненного цикла вирусов В настоящее время МСН широко применяются для поиска и детекции мутаций (детально рассмотрено в литературном обзоре) В настоящем разделе речь пойдет об использовании МСН для селективного расщепления химерных дуплексов в гибридизационных смесях, что позволяет снизить число побочных химерных клонов с 44-60 до 0-4%

Продуты тбрцдшацни ДНК а

ЧС

в

Заполнение концов, ПЦР с праимерачи А+В

Рисунок 1 Образование химерных клонов в гибридизационных библиотеках

1 1 Метод МОИ селективная деградация неправильно спаренных гетеродуплексов

Для тестирования эффективности МОЯ была разработана тест-система (Рис 2), включающая (1) расщепление геномной ДНК частощепящей рестриктазой, (2) лигирование различных олигонуклеотидных супрессионных адапторов, (3) денатурацию-гибридизацию двух порций ДНК, содержащих разные супрессионные адапторы, (4) заполнение концов дуплексов ДНК-полимеразой, (5) обработка МСН и (6) ПЦР-амплификацию (с использованием эффекта ПЦР супрессии, детально описан в

литературном обзоре) тех гетеродуплексов, которые не были расщеплены на предыдущей стадии Nested ПЦР с праймерами А2 и В2 повышает специфичность процедуры так, что в результате амплифицируется исключительно ДНК гетеродуплексов Контрольные эксперименты содержали все те же самые стадии, помимо этапа (5), то есть обработки гибридов нуклеазами

(I) Рестрикция геномной ДНК Образец! Обралец2

ч-,по повтор повтор

-I I 11 I _»

| (II) Литрование супрессионных Г адаптеров А и В

в

I (JIT) Смешение, дашурация, ' гибрцдшацня

^ (IV) Заполнение концов

□•.-•.'.-.гп—1 [ 1

| (V) Обработка МСН

(VI) ПЦР с праймерами А+В

Супрессия ПЦР

Успешная амплификация ,

Нет амплификации

Рисунок 2 Схема метода МОЯ, использованная для тестирования эффективности обработки гетерогибридов МСН

Для того, чтобы исследовать эффект от применения конкурирующей фракции ДНК, обогащенной геномными повторами, на процесс гибридизации и на качество итоговых библиотек, в некоторых экспериментах на стадии гибридизации добавляли 100-кратный избыток быстро реассоциирующей фракции геномной ДНК человека C0tA, сильно обогащенной геномными повторами На стадии (5) использовались две МСН нуклеаза Surveyor, расщепляющая неспаренные участки в составе гетеродуплексов, а также нуклеаза Mung Bean, расщепляющая участки одноцепочечной ДНК, и, следовательно, способная атаковать петлевые структуры в составе химерных гибридов Эксперименты проводили на ДНК млекопитающих, поскольку они относятся к одним из наиболее сложных геномов эукариот и дают чрезвычайно сложные гибридизационные смеси, гораздо более сложные, чем, например, ампликоны кДНК Поэтому, в случае успеха для геномных ДНК млекопитающих, можно быть уверенными в применимости метода для более простых смесей (кДНК или геномы меньшей сложности) Проводили шесть различных гибридизаций при следующих условиях (HI), две порции геномной ДНК человека гибридизовали при 65°С (Т65) без добавления фракции C0tA (C0tA-) и без расщепления МСН (N-), (Н2), ДНК человека и шимпанзе гибридизовали при Т65, C0tA-, N-, (НЗ), ДНК человека, Т65, CntA+. N-, (Н4), ДНК человека, 185, C„tA+. N-, (Н5), ДНК человека и шимпанзе, Т65, C0tA-, с добавлением нуклеазы Surveyor, (Н6), ДНК человека, Т65, C0tA+, с добавлением нуклеазы Mung bean

Получившиеся библиотеки клонировали в Е coli, и из каждой из них отсеквенировали по 50 вставок (всего 300 последовательностей) Для определения химерных клонов мы использовали следующие критерии вся последовательность целиком не должна иметь гомологов в геномных базах данных, а ее 5'- и 3'- концевые фрагменты должны идеально соответствовать геномным последовательностям На рисунке 3 приведены результаты анализа полученных шести библиотек Видно, что добавление фракции C0tA и повышение гибридизационной температуры с 65 до 85°С практически не оказывают никакого эффекта на количество химерных клонов, в отличие от действия МСН Как Mung bean, так и Surveyor показали мощный антихимерный эффект, выразившийся в снижении их количества с 44-60% до 0-4% клонов

•>о- Доля химерных клонов в библиотеках

80- 65 °С 85°С 65"С

"70- QtA - СМ + СМ СМ

60% я

60 56% 56%

50- 44% •2 Ь д

-»•.'" {(;- Ь ¡г В к * 5 = а ь 1 5 - £

20" 0% 4%

I«»- HI Н2 НЗ Н4 Н5 Н6

Б юо- Даля клонов, содержащих повторы 93%

90- 88% 87%

81»" 76% 78% ■■

■7«-

60-

50" 44%

• ■!" Г

ЗО-

20-

10- HI Н2 НЗ Н4 Н5 Н6

Рисунок 3. Сравнение шести библиотек ДНК, полученных при разных условиях гибридизации без и с использованием МСН. HI, гибридизация ДНК человек-человек, 65°С (Т65), без конкурентной фракции C0tA (C0tA-), без добавления МСН (N-); Н2, ДНК человек-шимпанзе, Т65, С01А-, N-; НЗ, ДНК человек-человек, Т65, C0tA добавлена (C0tA+), N-; Н4, ДНК человек-человек, ТВ5, C0tA+, N-; Н5, ДНК человек-шимпанзе, Т65, C0t А-, добавлена нуклеаза Surveyor; Н6, ДНК человек-человек, Т65, C0tA+, добавлена нуклеаза Mung bean. (А) Высота цветных столбцов соответствует доле химерных клонов в полученных библиотеках. (Б) Высота столбцов соответствует доле клонов, содержащих последовательности геномных повторов.

Многие отсеквенированные вставки содержали геномные повторы, что неудивительно, поскольку повторы занимают порядка 50% ДНК млекопитающих. Повторяющиеся последовательности со 100% идентичностью могут соответствовать

нескольким геномным локусам в ДНК хозяина, что существенно осложняет задачу их картирования Поэтому часто встает задача минимизации содержания последовательностей повторов в библиотеках В наших экспериментах получилось, что доля повторов значительно различалась в разных библиотеках C„tA- библиотеки содержали много повторяющихся последовательностей независимо от добавления МСН (87-93% всех отсеквенированных клонов), C0tA+/N- библиотеки—несколько меньшую долю повторов (76-78%), тогда как C0tA+/N+библиотека (Н6, с добавлением иуклеазы Mung bean) содержала всего 44% вставок с повторяющейся ДНК Результаты свидетельствуют, что наилучшие результаты могут быть получены при конструировании библиотек с одновременным использованием МСН и конкурентных фракций вроде C0tA

1.2 Приложение MDR для поиска эволюционио консервативных последовательностей в геномах человека и обезьян

Нами было проведено исследование применимости метода MDR для межвидовой ДНК-гибридизации Для этого, в двух гибридизационных экспериментах (Н2 и Н5) гибридизовались ДНК человека и шимпанзе Геномы человека и шимпанзе являются наиболее близкородственными и показывают 98% идентичность нуклеотидной последовательности Получилось, что использование MDR снизило количество химерных последовательностей с 44% практически до нуля Все отсеквенированные вставки из библиотеки, обработанной нуклеазой Surveyor (Н5), содержали последовательности, высоко консервативные для этих двух геномов (средняя идентичность 98 3%) Некоторые вставки содержали участки, эволюционио консервативные для всех отсеквенированных на тот момент (ноябрь 2004) геномов млекопитающих - человека, шимпанзе, мыши и крысы Из этого следовало, что MDR можно применять для поиска эволюционио консервативных последовательностей в различных геномах Для исследования этого предположения, мы провели еще одну межвидовую гибридизацию (Н7), между геномами человека и обезьяны Нового света мармозеткой Calhthrix pygmaea, при 65°С, с обработкой нуклеазой Surveyor Геном мармозетки гораздо сильнее дивергировал от генома человека, чем ДНК шимпанзе [предковые линии гоминид и обезьян Нового света разошлись около 45 миллионов лет назад], дивергенция в среднем составляет 20% последовательности ДНК 71% вставок библиотеки содержал умеренно (14%) дивергировавшие повторяющиеся элементы,

присутствующие как в геноме мармозетки, так и у человека Оставшиеся 29% представляли уникальные последовательности

Десять из них были консервативны среди геномов человека, шимпанзе, мыши и крысы, а три других были консервативны между ДНК человека и шимпанзе Для того, чтобы подтвердить высокую степень консервативности этих последовательностей между человеком и мармозеткой экспериментально, была проведена ПЦР-амплификация и секвенирование соответствующих локусов для трех таких последовательностей Оказалось, что действительно все отсеквенированные локусы показывали высокую степень консервативности между геномами со средним значением межвидовой гомологии 95%, что говорит о примерно 4-кратном понижении средней скорости мутирования для этих локусов

Представленные результаты убедительно свидетельствуют о том, что метод MDR может быть полезен для улучшения качества самых разных библиотек, получаемых при реассоциации ДНК, включая вычтенные или нормализованные геномные и кДНК-библиотеки Хотя в наших экспериментах нуклеаза Surveyor оказалась более эффективной, чем Mung Bean, в других случаях последняя может быть также весьма полезна В частности, обработка Mung Bean может помочь при гибридизации кДНК, когда образуется значительное количество несовершенных дуплексов при отжиге друг на друга в целом негомологичных последовательностей с похожими нуклеотидными мотивами Поэтому, для рутинного применения можно рекомендовать смесь обеих нуклеаз Метод также может значительно упростить решение задачи экспериментального поиска эволюционно консервативных последовательностей в несеквенированных геномах Указанные особенности позволяют надеяться на широкую применимость метода для нужд молекулярной генетики

2 Метод TGDA вычитающая гибридизация участков, фланкирующих геномные повторы

Метод TGDA (от англ Targeted Genomic Differences Analysis) разрабатывался совместно с Е Д Свердловым, Ю Б Лебедевым, С В Устюговой, К В Ходосевичем и И 3 Мамедовым TGDA позволяет проводить полногеномный сравнительный анализ геномных повторов в ДНК изучаемых организмов

Принцип метода TGDA состоит из трех основных стадий

(1) Селективная амплификация последовательностей ДНК, фланкирующих повторяющиеся элементы в сравниваемых геномах, с использованием универсального праймера к последовательности повтора и при помощи эффекта "ПЦР-супрессии"

(2) Обработка полученных ампликонов экзонуклеазой ЕхоШ для получения 5'-выступающих концов (эта стадия критична для всего процесса, она призвана убрать из ампликонов, полученных после (1) стадии, остающиеся в них последовательности мобильных элементов

(3) Основанная на ПЦР вычитающая гибридизация (ВГ) обработанных ампликонов Для вычитания один из ампликонов (так называемый драйвер, англ driver) берется в значительном избытке над другим, называемым трейсер, англ tracer ВГ (подробно описана в литературном обзоре) позволяет напрямую идентифицировать последовательности (назовем их мишени), присутствующие в трейсере, но отсутствующие в драйвере

Мы применили TGDA для поиска вставок мобильных элементов, специфичных для генома человека Сейчас известны 5 таких семейств мобильных элементов, все они относятся к ретроэлементам Это некоторые представители эндогенных ретровирусов HERV-K (HML-2), и ретропозонов LINE LI, Alu, SINE-R и SVA Для проведения экспериментов мы выбрали два семейства ретротранспозонов HERV-K (HML-2) и LI, которые, в отличие от остальных трех семейств, обладают гораздо более сложной структурой и большим спектром потенциальных воздействий на функционирование генома В качестве трейсера использовались ампликоны, полученные из ДНК человека, а в качестве драйвера - ампликоны, полученные из ДНК шимпанзе

Для того, чтобы количественно охарактеризовать эффективность метода, мы нашли экспериментальное значение обогащения результирующей смеси по фланкам человек-специфичного (чс) LTR определяли концентрацию фланкирующей последовательности известного 4CLTR из локуса 19ql3 2 (258) в исходном трейсере и в смеси, полученной в ходе ВГ При этом, если метод TGDA работает, должно было происходить обогащение смеси по этой последовательности

Действительно, в случае использования матрицы смеси после вычитания, видимый чс ПЦР продукт появлялся на 4 цикла раньше, чем в случае использования исходного трейсера, что свидетельствует о -16-кратном обогащении вычтенной библиотеки

фланками hcLTR Это значение хорошо согласуется с теоретически ожидаемым (-20-кратное обогащение), что свидетельствует о высокой эффективности метода

Высокая специфичность селекции на первой стадии TGDA продемонстрирована определением первичной структуры вставок в случайно выбранных клонах полученной библиотеки Все вставки содержали ожидаемые фрагменты LTR

Выводы о наличии или отсутствии индивидуальных LTR, выявленных с помощью TAGDA в соответствующих геномных локусах, делали на основании результатов ПЦР со специфическими праймерами, фланкирующими исследуемое внедрение ретроэлемента При этом ДНК, содержащая LTR в соответствующем локусе, должна давать продукт примерно на 970 пн длиннее, чем продукт, полученный с матрицы, не содержащей LTR

Всего нами быю найдено в библиотеке 25 чс LTR, 23 из та были идентифицированы впервые Почученная с помощью TGDA бибюотека содержала 60% клонов, несущих вставки, специфичные дчя генома чеювека

3. Метод Diffir. дифференциальная гибридизация фланков геномных повторов на фильтре

Альтернативный метод, названный «Differences in the integration sites of low and medium copy number interspersed repeats technique » (DifftR), был разработан для тех же целей, что и TGDA Его отличием является возможность исследовать специфичность интеграции повторов в формате чипа, в ходе гибридизации иммобилизованных на твердофазном носителе фланков исследуемого типа геномных повторов со сравниваемыми геномными ДНК Метод был применен для того же объекта -семейства эндогенных ретровирусов человека HERV-K (HML-2), для поиска специфичных для генома человека интеграции этих ретроэлементов Метод можно использовать для идентификации любых дифференциальных внедрений геномных повторов при сравнении близкородственных геномов Принцип DifflR -комбинирование селективной амплификации геномных фрагментов, фланкирующих исследуемую группу повторов, и дифференциальной гибридизации клонов полученных библиотек (метод детально описан в тексте диссертации)

При этом стадия селективной амплификации, включающая в себя фрагментацию геномной ДНК частощепящей эндонуклеазой рестрикции, лигирование супрессионных адаптеров и nested ПЦР, идентична первому этапу TGDA Получающиеся ампликоны клонируют в плазмидный вектор и анализируют при помощи дифференциальной

гибридизации Зондами для гибридизации служат те же ампликомы фланков геномных повторов, но полученные с использованием других супрессионных адапторов Например, при поиске повторов, специфичных для генома человека, ДНК клонов, несущих вставки амплифицированных фланков повторов человека наносят на фильтр, а гибридизуют их с меченными ампликонами фланков человека и шимпанзе Эти последние ампликоны получают с использованием других супрессионных адапторов -для того, чтобы одинаковые адапторные последовательности не вызывали «неспецифической» кросс-гибридизации клонов и зонда Дифференциально гибридизующиеся клоны секвенируют и каким-либо независимым способом проверяют, действительно ли они уникальны для того или иного генома (например, при помощи локус-специфической ПЦР, как описано в предыдущем разделе)

В ходе модельного эксперимента была проанализирована лишь небольшая часть библиотеки При этом отсеквенировали 40 как дифференциальных, так и недифференциальных клонов Все они содержали ожидаемые фрагменты адапторов и действительно являлись фланками эндогенных ретровирусов исследуемого семейства 22 из отсеквенированных 40 клонов были дифференциальными и гибридизовались с зондами на фланки ЭРВ человека, но не шимпанзе Локус-специфическая ПЦР показала, что 16 из этих 22 клонов действительно соответствовали человек-специфичным ЭРВ Таким образом, специфичность дифференциальной гибридизации была оценена как 73% Наличие ложно-дифференциальных клонов (6 из 22) может быть связано с появлением или исчезновением рестриктных сайтов в одном из сравниваемых геномов (для фрагментации геномной ДНК используются рестриктазы) и, соответственно, с артефактной недопредставленностью некоторых локусов в анализируемых ампликонах

4. Приложение методов TGDA и Diffir для молекулярной генетики человека

Работа выполнялась коллективом авторов, включавшим С В Устюгову, Е В Гогвадзе, К В Ходосевича, Ю Б Лебедева, Е А Ковальскую, Е Д Свердлова и А А Буздина Химерные ретроэлементы грибов исследовались в сотрудничестве с Марк-Анри Лебраном и Кристель Барбизан из совместной лаборатории CNRS и фирмы Bayer (Лион, Франция)

4 1 Идентификация человек-специфичных инсерций эндогенных ретровирусов

Структурный анатз известных чс LTR Проанализировав последовательности человек-специфичных LTR, найденные нами и другими авторами (всего 41 последовательность), мы обратили внимание, что все они, за исключением одного LTR, обладают значительной структурной гомологией и формируют один кластер на филогенетическом древе

Основываясь на 40 последовательностях высоко гомологичных чс LTR, мы создали консенсусную последовательность (HS консенсус) для эволюционно молодого семейства HS Эта последовательность содержит 9 характеристических нуклеотидных позиций (приведены в тексте диссертации) Проведенный поиск выявил в геномных базах данных 142 индивидуальные полноразмерные (длиной -970 пн) последовательности, от 100 до 97% идентичные HS консенсусу (приведены в Табл 1 раздела Supplementary Material на web сайте http //humgen siobe ras ru) Мы выбрали этот диапозон идентичности, поскольку степень взаимной идентичности среди 40 LTR, использованных для создания консенсуса, варьировала от 99 8 до 97 6% со средним значением 98 1% Единственный чс LTR из контига АС022567, который не мог быть отнесен к семейству HS (см выше), не имел высокоподобных (более 97% идентичности) последовательностей в геномных базах данных

Для того, чтобы найти частоты встречаемости характеристических нуклеотидных позиций HS консенсуса во всех членах HS семейства, а также в LTR, не являющихся членами группы HS, мы сделали множественное выравнивание найденных в этой работе 142 HS и 89 известных не-HS LTR (выравнивание помещено в разделе Supplementary Material на сайте http //humgen siobc ras ru) Результаты показали, что 8 диагностических позиций консенсусной последовательности действительно являются уникальными характеристиками семейства HS

Дальнейший анализ последовательностей представителей семейства HS позволил выделить в его составе два подсемейства, названные нами HS-a и HS-b, представленные, соответственно, 63% и 37% последовательностями LTR Подсемейство HS-a высоко гомологично консенсусной последовательности HS и характеризуется внутригрупповой дивергенцией 1 5%, что соответствует возрасту 5 8 миллионов лет Все LTR семейства HS-a, для которых это известно, являются специфичными для генома человека Представители подсемейства HS-b несут 5 характеристических сцепленных однонуклеотидных замен в положениях 907, 909, 912, 921 и 950 консенсусной последовательности HS (дана в тексте диссертации)

Подсемейство HS-b эволюционно старше, чем HS-a, для него значение внутригруиповой дивергенции составляет 2.6%, соответственно, возраст 10.3 миллиона лет. По крайней мере 3 члена подсемейства HS-b не являются человек-специфичными, а присутствуют также в геноме шимпанзе.

По всей вероятности, материнские последовательности HS семейства возникли в геноме общего предка линий гориллы, шимпанзе и человека около 10.7 миллионов лет назад, дав группу HS-b. Эта группа, оставаясь активной, 5.8 миллионов лет назад, то есть примерно во время расхождения предковых линий человека и шимпанзе, в свою очередь, дала начало группе HS-a, которая на настоящий момент составляет большую часть (63%) всего семейства HS, по-видимому, в силу большей ретропозиционной активности. Интересно, что группа HS-a оказалась наиболее активной также и в геноме шимпанзе, как следует из результатов недавно проведённого группой Скотта Девина (Scott Devine) анализа шимпанзе-специфичных элементов.

Анализ чс LTR HERV-K (HML-2), картированных в интронах генов. С помощью сервера UCSC Browser (http://genome.ucsc.edu/cgi-bin/hgGateway), мы обнаружили 30 представителей семейства в интронах известных человеческих генов (Рис. 4).

Распределение 4cL.TR в интронах генов человека

*

Рисунок 4 Распределение вставок человек-специфичных LTR в интронах генов Гены сгруппированы согласно функции своих продуктов (данные о представленности генов в различных группах для генома человека взяты с сайта http //www geneontoloev ore/ компании Celera)

Было установлено, что LTR в интронах генов имеют неслучайную ориентацию в 29 из 30 генов LTR направлен в сторону, противоположную направлению транскрипции гена Это может быть объяснено тем, что внедрение LTR, обладающих сильным сигналом терминации транскрипции, в интроны генов в прямой ориентации вызывало бы преждевременную терминацию транскрипции этих генов, и, как следствие, приводило бы к их инактивации Поэтому аллели, несущие в интронах LTR в прямой ориентации, должны были неизбежно отбрасываться в ходе эволюции генома человека Сохранение аллеля, содержащего LTR в прямой ориентации в интроне одного гена, возможно, связано с инактивацией терминатора этого LTR Из рисунка 4 видно, что вставки 4cLTR имеют тенденцию к избыточной представленности в интронах генов, кодирующих белки, участвующие во внутриклеточной передаче сигнала, а также среди генов белков, обладающих ферментативной активностью (-2-кратное отклонение от среднестатистического распределения) Такая «избирательность» эволюционно недавних внедрений LTR в интроны некоторых групп генов на настоящий момент остается необъясненной Избыточное содержание вставок в генах - участниках систем передачи сигнала может быть связано с регуляторной ролью этих систем и согласуется с моделью эволюции геномов, выдвинутой Кингом и Уилсоном, согласно которой основной движущей силой фенотипических изменений являются прежде всего изменения регулеторных систем организма Также возможно, что наблюдаемая предпочтительность интеграции связана с наиболее активным функциональным статусом именно этих ipynn генов и, как следствие, с большей открытостью хроматина в соответствующих локусах

4 2 Идентификация человек-специфичных вставок ретроэлементов LI

Следующим объектом, для которого был применен метод TGDA, стало семейство ретротранспозонов LI, содержащее чс элементы, а также около 50 до сих пор активных представителей в геноме человека Как и в случае HERV-K(HML-2), искали чс интеграции ретроэлементов Работа проводилась в 2002-2003 годах, когда в базах

данных не содержалось информации по геному шимпанзе, и единственным способом поиска чс элементов являлся экспериментальный анализ

Продукты ВГ клонировали в Е cob, затем секвенировали последовательности вставок из случайно отобранных клонов Все вставки содержали ожидаемые фрагменты L1 семейств L1PA2 и LIHs, что, как и в случае LTR HERV-K (HML-2), демонстрировало высокую селективность метода Как и в случае LTR HERV-K(HML-2), с целью определения специфичности данных L1 для генома человека, проводился ПЦР-анализ со специфичными геномными праймерами, фланкирующими интеграцию ретроэлеменга Из 29 отобранных клонов видоспецифичность интеграции определили для 26 последовательностей, 24 из них были чс, а 2 клона содержались также в геноме шимпанзе Это говорит о том, что чс (целевые) последовательности содержатся приблизительно в 92% клонов библиотеки

Все найденные в данной работе чс L1 принадлежали к группам L1PA2 и LIHs Лишь небольшая часть (26%) этих чс L1 принадлежала к группе Та, которая известна как единственная транспозиционно активная в настоящее время группа L1 В этой работе нами было найдено внедрение LI, принадлежащего к группе L1PA2, которое является полиморфным в человеческой популяции Следовательно, (i) по крайней мере два семейства L1 были активны в предковой линии человека после расхождения ее с предковой линией шимпанзе и (и) при поиске полиморфных интеграции L! не следует ограничивать поиск группой L1 Та Один чс L1 являлся представителем открытого в данной работе химерного семейства ретроэлементов U6-L1, детально описанного в заключительном разделе К сожалению, количество найденных в интронах генов чс L1 было мало, что не дало возможности проанализировать распределение вставок по функциональным группам генов

5 Анализ транскрипционной активности геномных повторов

Работа по этому проекту выполнялась группой, включающей Е В Гогвадзе, Е А Ковальскую-Александрову, Т В Чалую, Е Д Свердлова, А А Буздина

В нашей группе был разработан метод, названный GREM (Genomic Repeat Expression Monitor), основанный на гибридизации тотальных пулов 5'-концевых частей кДНК с полногеномными пулами ДНК, фланкирующей повторяющиеся элементы, с последующей селективной ПЦР амплификацией получающихся гибридных дуплексов геномной ДНК и кДНК Библиотека гибридных молекул кДНК\геномной ДНК, полученная таким образом, может использоваться как набор маркеров для

индивидуальных транскрипционно активных повторов Метод является как качественным, так и количественным, поскольку частота встречаемости тех или иных маркеров пропорциональна промоторным активностям соответствующих им повторяющихся элементов

Мы применили GREM для полногеномной идентификации промоторно-активных эндогенных ретровирусов, специфичных для ДНК человека (чсЭРВ) Как указано выше, HERV-K (HML-2) - единственное семейство эндогенных ретровирусов, содержащее членов, уникальных для генома человека Основная часть ЭРВ претерпела гомологичную рекомбинацию по последовательностям своих LTR, так что в настоящее время это семейство представлено, в основном, одиночными LTR LTR обладают значительным сходством первичной структуры и образуют отдельное семейство (названное HS) Ниже дано описание метода GREM и результатов, полученных при помощи этого экспериментального подхода для характеристики транскрипционной активности чсЭРВ in vivo

5 1 Метод GREM. полногеномный поиск промоторно-активных повторов

Особенности метода GREM GREM (Genomic Repeat Expression Monitor) является единственным на сегодняшний день полно-транскриптомным подходом, позволяющим детально исследовать собственную про моторную активность повторяющихся элементов и отбросить фон «сквозной» транскрипции через последовательность повтора Получаемая при помощи GREM клонотека может использоваться как набор маркеров индивидуальных транскрипционно активных повторяющихся элементов GREM объединяет преимущества метода 5' RACE и гибридизации нуклеиновых кислот Метод основан на том, что промоторно-активные геномные повторы инициируют транскрипцию со своих собственных внутренних последовательностей, так что соответствующие транскрипты содержат фрагмент последовательности повтора на своих 5'-концах Это выполняется для всех основных классов ретроэлементов LTR-содержащих, LINE и SINE Поэтому мы старались специфично выделить фракцию транскриптов, содержащих последовательность повтора на 5' конце Было показано, что количество индивидуальных маркеров в библиотеке пропорционально содержанию мРНК, считываемой с соответствующего промоторно активного повтора В наших модельных экспериментах, GREM использовался для полногеномного исследования особенностей транскрипционной активности LTR семейства HS в клетках зародышевого пути человека (паренхима яичка) и в соответствующем злокачественном новообразовании (семинома)

Транскрипция ЦТЯ полноразмерного провируса может приводить к образованию двух видов продуктов РНК вирусных генов (если инициируется на 5' ЬТЯ, см Рис 5), либо, в случае промоторной активности 3' ЬТЯ, РНК уникальных не-вирусных последовательностей, которые фланкируют провирус с 3' конца

Gag Pol Env

Solitary LTR \ 5'LTR Ptovirus 3'LTR Non repetitive genomic DNA

Рис 5 Схема транскрипционной активности одиночных (слева) и провирусных (справа) ЬТЯ Транскрипция с провирусного 5' ЬТИ. дает РНК вирусных генов, тогда как экспрессия одиночных или 3' провирусных ЬТЯ приводит к транскрипции геномных последовательностей хозяина, фланкирующих У конец ретроэлемента

Метод GREM, детально описанный в тексте диссертации, состоит из трех основных стадий (/) синтез полноразмерной библиотеки кДНК, молекулы которой несут специфическую маркеную последовательность, введенную на 5' конец кДНК, (2) селективная ПЦР-амплификация геномных последовательностей, фланкирующих повтор, и (5) гибридизация кДНК и фрагментов, фланкирующих повторы, с последующей ПЦР-амплнфикацией гетеродуплексов геномной ДНК\кДНК

Первая стадия GREM нацелена на амплификацию полноразмерных молекул кДНК, маркированных с 5' конца введенной последовательностью адапторного олигонуклеотида Такое мечение достигается благодаря применению эффекта "cap-switch" в ходе синтеза кДНК Достигнув 5' конца мРНК-матрицы, олиго(йТ)-праймированная ревертаза нематрично добавляет несколько добавочных дезоксицитидиновых нуклеотидов на 3' конец кДНК При этом олигонуклеотид, содержащий олиго-рибо(О) последовательность на 3' конце, гибридизуется на дезоксицитидиновый трэк, что образует праймер, позволяющий ревертазе сменить матрицу и дополнительно досинтезировать на 3' конец первой цепи кДНК последовательность адаптора Этот подход позволяет достаточно точно помечать 5'-концы кДНК, соответствующие точкам старта транскрипции (Рис 6) Затем на матрице первых цепей получают вторые цепи кДНК

На второй стадии проводилась селективная ПЦР-амплификация геномных локусов, фланкирующих 3' концы HS LTR Гибридизация кДНК с получаемым ампликоном используется для селекции именно тех молекул кДНК, которые содержат последовательность HS LTRs на 5' конце Амплификация геномных фланков - это критически важный шаг, обеспечивающий специфичность всей процедуры в целом

На последней стадии, кДНК гибридизуется с З'-геномными фланками LTR Для того, чтобы селективно амшшфицировать гетеродуплексы, содержащие как геномные фланки LTR, так и 5' концевые фрагменты кДНК, образованных благодаря промоторной активности LTR, мы проводили ПДР с праймером на 5'маркерную последовательность в составе кДНК и праймер, специфичный для адаптора, лигированного к геномной ДНК В результате амплифицировались только целевые гетеродуплексы Полученные в ходе последней амплификации гетеродуплексы, названные Expressed LTR Tags (ELT), далее клонировали и секвенировали Каждый ELT содержал 3'-концевой фрагмент HS LTR, участок 3' -фланкирующей геномной ДНК, а также адапторную последовательность

Детекция промоторной активности HS LTR при помощи GREM Анализ последовательностей ELT позволял однозначно картировать соответствующие им одиночные и 3' провирусные LTR Однако же, картирование невозможно в случае провирусных 5' LTR, поскольку транскрибируемые с них провирусные последовательности многократно повторены в геноме и обладают высокой степенью идентичности (Рис 5) Результаты анализа библиотек ELT, полученные для двух тканей паренхимы яичка и семиномы, а также созданная на их основе первая в мире карта промоторно активных геномных повторов семейства HS LTR, представлены в следующем разделе Для пяти случайно отобранных одиночных LTR, обладающих промоторной активностью согласно данным GREM, нам удалось при помощи метода 5'RACE с точностью до нуклеотида картировать точку начала транскрипции (Рис 6) Во всех случаях, транскрипция инициировалась с одного и того же неканонического промотора, расположенного на границе участков R и U5 последовательности HS LTR

ПотещштмыиТЛПоои: ICAIT-tUTl. fin CTCAGA

.Одиночный LTR

ùidCATCC

IpancivpiinuiiH

L

Прод> кты ОТ-ПЦР .

5 Провирусный LTR

I "3

ОТ-ПЦР 21 24 27 30 33 36 циклыr................. ■»

Картировишая точка начала транскрипции

I

Вирусный reu Gag

«'Gog

LTRfo(4 >_

-x=

•^Gog

В

Фрагмент LTR, достаточный для инициации транскрипции |

Пет амтификации

Рисунок б Картирование точки начала транскрипции в составе последовательнсти LTR А), картирование 5'-концевых частей кДНК, полученных в ходе ПЦР с праймером CS на 5' конец кДНК и с уникальными геномными праймерами G, на консенсусной последовательности семейства HS группы LTR HERV-K (HML-2) Последовательности потенциальных регуляторных участков даны курсивом Б), схема ОТ-ПЦР-подхода к определению провирусной точки инициации транскрипции в составе LTR transcription LTRfor3 и LTRfor4 -это LTR-специфичные праймеры на участки ниже и выше картированной точки начала транскрипции у одиночных LTR, соответственно Gag -праймер, специфичный для вирусного гена gag В), выравнивание фрагмента LTR длиной -300 пн, который обладал промоторной активностью в экспериментах с экспрессией репортерного гена, и консенсусной последовательности HS HERV-K LTR

Транскрипционный уровень LTR щнейно коррелирует с представленностью соответствующих ELT Для исследования зависимости между представленностью ELT в библиотеках и транскрипционной активностью LTR, проводили ОТ-ПЦР с парами праймеров, один из которых, направленный наружу от LTR, был специфичным к 3' концевому участку LTR, а второй - к уникальному геномному локусу, лежащему ниже 3'-конца LTR Уровень транскрипции измеряли относительно гена бета-актина Для выборки из 20 протестированных HS LTR, частоты встречаемости ELT в

библиотеках линейно коррелировали с уровнем соответствующих им транскриптов, измеренным при помощи ОТ-ПЦР для обеих тканей, со значениями коэффициента корреляции 0 91 и 0 89 для паренхимы яичка и семиномы, соответственно Это свидетельствует об адекватности метода GREM задаче одновременного качественного и количественного анализа промоторной активности исследуемой группы повторов

5 2. Приложение GREM для поиска промоторно-активных эндогенных ретровирусов, специфичных для ДНК человека

Метод GREM использовали для создания библиотек ELT нормальной паренхимы яичка и соответствующей опухоли, семиномы Биологические образцы брались от одного и того же пациента, так что распределение ELT между библиотеками отражает ткане- и опухоль-специфичность экспрессии чсЭРВ Для каждой ткани было отсеквенировано 500 клонов ELT За вычетом плазмидных перестроек и плохо отсеквенированных последовательностей, осталось 395 и 419 ELT для паренхимы и семиномы, соответственно Анализ ELT позволил нам однозначно картировать промоторно активные одиночные и З'-провирусиые LTR

Впервые было проведено полногеномное сравнение in vivo-промоторной активности специфичных для генома человека эндогенных ретровирусов в нормальной и опухолевой тканях Оказалось, что по крайней мере 50% HS элементов обладают промоторной активностью Индивидуальные LTR экспрессировались на уровне от ~0 001 до ~3% относительно транскрипции гена бета-актина (Рис 7) Не наблюдалось связи между особенностями первичной структуры HS элементов и их транскрипционной активностью И наоборот, функциональный статус LTR (одиночный, 5' или 3' провирусный) был одним из важнейших факторов промоторные силы одиночных и 3' провирусных LTR были почти идентичны в обеих тканях, тогда как 5' провирусные LTR показали более сильную промоторную активность (вдвое и впятеро для паренхимы и семиномы, соответственно, Рис 8) Это свидетельствует о наличии в провирусной последовательности некоторых пока не известных регуляторных элементов

Гены

Паренхима яичка

ыж

Вети--Актпп

.41. СШ ГА-РГ2С. .4Е№.2

ирш

АЫП-1.11.121816 СбофИ

тпз2 теш. ооск2

Ии~25А1Г> .41В. СЕВР2. ММР21 киш1. СИа/39

Семмпоми

Гены иге

Сетч--Актин

ОТ. 99 ,1% ОТ8|.

Сумма провирусных 5' ! 'П'.

ОТ 145 ОТ 129. 149

80, 108. 113. 139

■0.1%

дгш АМ>-1

жм>2. ГЛ-РР2С 1''и21Я/6. Sl.fi СВ1Р1. СбогПП

ОТ 155 [Л* 115, 138 -М1% ЬТК 131,141 --ОТ 140. 152

ОТ 62

В1СЛ/. ООСК2 К1ЯВ1, 0)чфЧ 1.1РН1. ММР2±М.С25А16

¿№^32. ПРИ И

- Щ0%

Сумма провирусных 5' ЦГК ,,,, ЬТК 152

ОТ 99

ОТ 145 1"™155 ОТ 80, 113 % 1-ТЯ 81

— ига 139, 140

1.ТЯ 129, 149 ОТ 115 ц% ОТ 62. 108. 131, I

— ОТ 100

Рисунок 7. Сравнение относительных уровней транскрипции некоторых генов человека и ЬТЯ. Относительные уровни транскрипции определяли при помощи ОТ-ГЩР, относительно уровня гена бета-актина (обозначен как 100%). А, паренхима яичка; Б, семинома.

Кроме того, важнейший фактор, влияющий на промоторную активность ЬТИ - это расстояние от генов. Относительное содержание промоторно активных ЬТИ. в ген-богатых локусах значительно выше, чем в локусах, обеднённых генами.

Данные также свидетельствуют в пользу селективного подавления транскрипции 3' провирусных ЬТИ, расположенных в интронах генов. Такая транскрипционная супрессия может быть нацелена на подавление активности провирусных генов, расположенных вблизи генов хозяина. Также в паренхиме яичка наблюдалось существенное понижение промоторной силы одиночных ЬТЯ в интронах генов. Это может свидетельствовать о существовании пока неустановленных механизмов подавления активности "лишних" промоторов, созданных мутациями или вирусными вставками, и расположенными вблизи генов или в интронах. Такой механизм может минимизировать деструктивный эффект «незапланированных» транскриптов - например, образование антисмысловых РНК. Многие транскрипционно компетентные ЬТЯ были картированы вблизи известных генов, и 86-90% этих генов транскрибируются в яичках. При этом не было выявлено никакой корреляции между уровнем транскрипции генов и соответствующих им ЬТЯ.

□ Паренхима в Семинома

Рисунок В. Сравнение относительной промоторной силы одиночных, 5' провирусных и 3' провирусных LTR (на один LTR). Серые и чёрные столбцы представляют относительные промоторные силы LTR указанных типов в паренхиме яичка и в семиноме, соответственно.

Таким образом, было проведено первое исчерпывающее качественное и количественное исследование промоторов человека, предоставленных небольшой группой эндогенных ретровирусов. Конечно, подавляющее большинство ретровирусных последовательностей, занимающих около 8% генома человека, ещё только предстоит исследовать. Но оптимизм внушает то, что разработанная методология вполне позволяет это сделать при наличии необходимых (достаточно скромных) временных и материальных ресурсов.

Детальные результаты картирования и анализа ELT, а также вся имеющаяся на сегодняшний день (31.12.2007) информация по структуре и функциональному статусу соответствующих HS LTR, содержатся в сводной таблице, доступной в Интернет по адресу;

http://www.thescientificworld.com/supplements/2007.270/Buzdin_03 i307 SuppTablel .xls

5.3. Антисмысловая регуляция экспрессии генов молекулами РНК, транскрибируемыми с промоторов чс эндогенных ретровирусов

Работа проводилась Е.В.Гогвадзе, Е.А.Стукачёвой, Е.Д.Свердловым и А.Буздиным.

На первом этапе работы были проанализированы все человек-специфические ретроэлементы HERV-K. (HML-2) и для дальнейшего анализа были отобраны все LTR (13 индивидуальных ретроэлементов), расположенные в нитронах известных генов

человека в противоположном направлению транскрипции данного гена ориентации и удаленные от ближайшего экзона не более, чем на 5 т п н (рис 9)

до 5 тпн

вГог "

Г*

LTR5 Hs

•С

LTRfor LTRfor2

árev

Рисунок 9 Схематическое изображение геномных локусов, отобранных для дальнейшего анализа, и расположение праймеров, использованных в работе

Для каждого из исследуемых локусов были дизайнировапы праймеры на экзоны, фланкирующие LTR (Gfor и Grev, рис 9), а также праймер на 3'- и 5' - концевую часть LTR Праймеры Gfor+Grev применяли для определения уровня транскрипции гена, а Gfor+LTRfor и Gfor+LTRfor2 - для определения уровня транскрипции LTR, расположенного в нитроне анализируемого гена В качестве матрицы для ПЦР использовали первые цепи кДНК, синтезированные с помощью олиго(0Т)-ираймера на суммарной РНК нормальной паренхимы яичка человека и герминогенной опухоли -семиномы Методом ОТ-ПЦР с праймерами Gfor+Grev и Gfor+LTRfor был определен уровень транскрипции исследуемых генов, а также уровень транскрипции LTR, находящегося в интроне В результате было отобрано 9 LTR, для которых было показано, что они транскрибируются в исследуемых тканях

Однако для того, чтобы понять, действительно ли транскрипция начинается внутри LTR, необходимо было найти 5'-конец образующейся РНК Для этого был применен метод 5'- RACE (Rapid Amplification of cDNA ends) Схема метода и полученные результаты представлены на рисунке 10

Для всех LTR, транскрибирующихся в нормальной паренхиме и семиноме, было проведено два раунда ПЦР с праймерами на 5'- адапторную последовательность кДНК и на ближайший к LTR экзон В результате продукт был получен только в случае LTR, расположенного между 23 и 24 экзонами гена SLB (selective LIM binding tactor, rat homolog, AC074117) и между 5 и 6 экзонами гена SLC (solute carrier family 4, АС027750) Эти продукты были отсеквенированы и оказалось, что точка начала транскрипции находится внутри LTR на границе R и U5 областей (826 нуклеотид консенсусной последовательности человек-специфического LTR), что совпадает с полученными нами ранее данными о точке начала транскрипции LTR семейства HERV-К Таким образом, было показано, что из 13 человек-специфических LTR,

расположенных в интронах известных генов в противоположной направлению транскрипции гена ориентации и удаленных от ближайшего экзона не более чем на 5 т.п.н., только 2 служат промоторами для транскриптов, перекрывающихся с экзонами клеточного гена. В дальнейшем проводился анализ только двух данных локусов.

А.

[транскрипция

синтез первых цепей кДИК

1 с. ис-пепьзатшш cap-swiScb э&фимта

ПЦР с npaiiMepwt A1 CSS - Glorl

втдрмшдйия вА.СЕ

ПЦР с праймерамн /\ ПЦР с лраймером m ч А2 «■—)* Gloi"2 / (отрицательный контроль)

SLB

ЗЮпн-

пеовая стадия RACE

ПЦР с лраймвраш ITRtat- C-fa I {положительный контроль)

SLC

/ ////

Секзенирование полученного продукта

Рис 10. Поиск точки начала транскрипции внутри изучаемых LTR.

(А) Схема метода 5'-RACE. В качестве матрицы используются первые цепи кДНК, синтезированные с использованием «cap-switch» эффекта. На первой стадии проводят ПЦР с супресснонным адаптером А1. внутренняя часть которого комплементарна олигонуклеотиду, использованному при синтезе кДНК, и праймером на известную последовательность гена (Gforl) (в данном случае, на последовательность близлежащего к LTR экзона); положительный контроль проводят для проверки работы праймера на кДНК. Во втором раунде ПЦР используется супрессионный адаптер А2, внутренняя часть которого комплементарна внешней части праймера А1, и заглубленный праймер на экзон (Gfor2); отрицательный контроль проводится с использованием только праймера А2 для проверки качества работы супрессионных адаптеров.

(Б) Результаты 5'-RACE для LTR, расположенных в интронах генов SLB и SLC.

Для более полной характеристики этих двух случаев был определен уровень транскрипции генов £¿5 и 5¿С, а также находящихся в них ЬТЯ для еще десяти тканей человека скелетной мышцы, печени, сердца, легкого (нормы и опухоли), гиппокампа и эмбриональных тканей мозга (лобной доли, затылочной коры, базальных ядер и гипоталамуса) Транскрипционная активность ЬТИ, находящегося в интроне гена 5/.С, была показана только для нормальной паренхимы яичка, семиномы и эмбриональных затылочной коры, гипоталамуса и лобной доли Причем во всех случаях уровень транскрипции ЬТЯ был ниже уровня транскрипции гена

Транскрипт ЬТЯ, находящегося между 23 и 24 экзонами гена SZ.fi, был найден во всех проанализированных тканях кроме нормальной ткани легкого В большинстве случаев, как и для ЬТЯ в гене , уровень транскрипции ЬТЯ оказался в 4-8 раз ниже уровня транскрипции гена (эмбриональные лобная доля и гипоталамус, печень, тсгкое (опухоль) и гиппокамп) В случае эмбриональных базальных ядер и затылочной коры ЬТЯ и ген транскрибируются на одном уровне Для скелетной мышцы, сердца, паренхимы яичка и семиномы был показан более высокий уровень транскрипции ЬТЯ по сравнению с геном Особого интереса заслуживает нормальная паренхима яичка, в которой иГИ. транскрибируется в 16 раз интенсивнее гена

Для доказательства того, что во всех случаях мы имеем дело именно с транскриптами, комплементарными РНК гена, был проведен синтез первых цепей кДНК с праймером, избирательно связывающимся с антисмысловыми к гену РНК После этого была поставлена ОТ-ПЦР с праймерами ЬТ1Ког и б!ог Во всех случаях ПЦР-продукт получался на тех же циклах, как и при амплификации кДНК, синтезированной с о1^о(ёТ)-праймером Следовательно, найденные нами ранее транскрипты ЬТЯ действительно являются антисмысловыми к гену А для доказательства того, что транскрипция антисмысловых РНК начинается внутри ЬТК, были поставлены ОТ-ПЦР с праймерами на 5'- конец ЬТЯ (ЬТК1ог2) и на экзон анализируемого гена (б1"ог) В большинстве случаев продукт не детектировался или же появлялся на значительно более поздних циклах, из чего следует, что промотором для антисмысловых транскриптов в этих случаях действительно служит 3'-конец ЬТЯ

После этого была предпринята попытка определить З'-конец транскриптов, начинающихся в 1ЛТ1, расположенных в нитронах генов -5X5 и 51С Нам не удалось получить необходимые результаты с помощью метода З'-ЯАСЕ, поэтому мы решили

провести ОТ-ПЦР с праймером на З'-конец ЬТЯ и серией праймеров, постепенно удаляющихся от ЬТЯ

В результате серии ОТ-ПЦР было показано, что в случае гена £¿5 существует, по крайней мере, 2 типа транскриптов один включает в себя только экзон 23 (транскрипт I), а второй - экзоны 23 и 22 (транскрипт 2) (рис 11) Интересно отметить, что «длинный» транскрипт был найден только в нормальной паренхиме яичка, для которой была показана значительно большая активность ЬТЛ по сравнению с геном В случае гена 51С З'-конец транскрипта найден не был, но было определено, что весь экзон 5 входит в его состав (транскрипт 3)

Б1В БШ

'Скзон 24-, Цв_>-23- экзон 22 - -лиопв -ШВ_>~

транскрипт 1 - - — - транскрипт 3 —

транскрипт 2 ~— ~ ---

Рисунок 11 Схематическое изображение транскрипционно активных ЬТ11 в интронах генов 5ЬВ и БЬС и типы транскриптов, образующихся с промотора ЬТЯ

На следующем этапе работы необходимо было определить, могут ли найденные транскрипты оказывать влияние на экспрессию соответствующих клеточных генов Для этого предполагалось получить клеточные линии, стабильно экспрессируюшие изучаемые транскрипты, и посмотреть, изменяется ли в этих клетках уровень транскрипции генов £¿8 и 5£0

Нами был проведен скрининг 8 клеточных линий человека и для дальнейшего анализа были отобраны линии Тега-1 и ^Р127, для которых был показан наиболее высокий уровень транскрипции генов и 51С

На основе плазмиды рсОМАЗ 1 Ну§го- были созданы три конструкции, каждая из которых содержала под контролем конститутивного цитомегаловирусного промотора (Решу) участок ДНК, соответствующий найденным в работе ЬТЯ-транскриптам (рис 12) Этими конструкциями были трансфицированы клетки Тега-1 и ЫОР127 и в результате получены клеточные линии, стабильно экспрессирующие интересующие нас транскрипты Для каждой клеточной линии было проведено четыре трансфекции 3

опытные (плазмидами, содержащими вставку соответствующего транскрипта) и I контрольная (плазмидой без вставки)

3 конец ьта

3 конец ПК

П 1азмидл1

Пилзмилл2

Трапсфекция ктеточны\ 1штиЬЮР127 и Те/а-1

П 1а!мидлЗ

Плл1мидл4

1 КОНЩ

ПК

Гигромицин

ЭКЗОН ^

Рисунок 12. Схематическое изображение плазмид, использованных для трансфекции клеточных линий ЫОР127 и Тега-1

Фрагмент ДНК, соответствующий анализируемому транскрипту, был помещен в плазмиду рсЭКА 3 1 Hygro- между промотором цитомегаловируса (РСМУ) и сигналом полиаденилирования гена бычьего гормона роста (ВОНрА) Стрелками внутри экзонов показано направление транскрипции генов (плазмиды 1 и 2) и ¿'¿С (плазмида 3) В случае успешной интеграции плазмиды 1 в ДНК КСР127/Тега-1 получалась клеточная линия, стабильно экспрессирующая траскрипт 1 (см рис25), интеграция плазмиды 2 приводила к стабильной экспрессии транскрипта 2, а плазмиды 3 - к стабильной экспрессии транскрипта 3 Плазмида 4 - контрольная конструкция, не содержащая вставки Трансформанты отбирались на среде с антибиотиком гигромицином

В результате опытов по трансфекции, мы получили 4 линии клеток ЫОР127 (КвР 127-1 - клетки, стабильно экспрессирующие транскрипт 1, ИйР 127-2 - стабильно экспрессирующие транскрипт 2,1\ЮР 127-3 - стабильно экспрессирющие транскрипт 3 и ЫОР127-К - контрольные клетки, транфицированные плазмидой без вставки) и 4 линии клеток Тега-1 (Тега1-1-3 - стабильно экспрессирующие транскрипты 1-3, соответственно) и Тега 1-К (контрольные клетки) Из всех клеточных линий была выделена РНК, методом ОТ-ПЦР показана эксперессия изучаемых ЬТЯ-транскриптов в

полученных линиях клеток и определен ее уровень, после чего проводили ОТ-ПЦР в реальном времени для определения уровня экспрессии генов 5ЬВ и 51С Результаты ПЦР представлены в таблице ]

Таблица 1 Уровень транскрипции генов ИВ и ЛХС в клеточных линиях Г\'СР127 и Тега1, стабильно экспрессирующих антисмысловые к гену транскрипты.

Клеточная линия Уровень транскрипции генов 51В и ££С относительно (¡-актина, % х!04

Тега! (5/.В РНК)

Тега 1 -3 1,31±0 37

Тега!-К 3,74±0 56

Тега! (5ХВ РНК)

ТегаЫ 2 21±0 24

Тега 1-2 1,50±0 48

Тега!-К 5 75±1 39

В случае клеточной линии ЫйР не было выявлено статистически достоверного изменения уровня транскрипции ¡енов SL.II и БЬС в опытных клетках по сравнению с контрольными В данных клетках антисмысловые РНК, образованные с промотора ЬТЯ не регулируют транскрипцию соответствующих клеточных генов Возможно, это связано с нарушением процессов РНК-интерференции в данной клеточной линии В случае же линии Тега1 было показано уменьшение количества РНК 8ЬВ в клетках, экспрессирующих транскрипт 1 (транскрипт, включающий только экзон 23 гена ¿ХВ) в 2,6 раза по сравнению с контрольными клетками (Руа1ие<0,01), а также снижение уровня мРНК гена 51С в клетках, экспрессирующих транскрипты 2 и 3, в 2,5 и в 2,9 раз, соответственно

Таким образом, можно сделать вывод, что антисмысловые РНК, образованные с промотора ЬТЯ, могут уменьшать уровень транскрипции соответствующего клеточного гена (как было показано для клеток Тега-1)

6 Новое семейство химерных ретроэлементов эукарнот

Неожиданным результатом анализа библиотеки чс внедрений LI стало открытие нового семейства ретроэлементов, образованных при происходящей in vivo РНК-рекомбинации в ходе обратной транскрипции Упомянутый механизм образования ретроэлементов впервые предложен в ходе данной работы

В ходе анализа полученной с помощью TGDA библиотеки чс LI-фланкирующих последовательностей, был найден клон, соответствовавший внедрению ретроэлемента необычной структуры Последовательность вставки была гомологична геномной ДНК человека хромосомного локуса 10р13 (код доступа в GenBank AL138764) Ретроэлемент представлял собой химеру полной копии U6 малой ядерной (мя) РНК с 3'-концевой частью LI Ее 5'-часть является полноразмерной последовательностью U6 мяРНК длиной 107 пн, 100% идентичная консенсусной последовательности человеческой U6 (взята из базы данных RepBase Update, http //www ginnst org/server/RepBase/) Сразу за U6 следует 3'- концевая последовательность элемента LI семейства LIHs в прямой ориентации длиной 1324 пн На своем 3'- конце эта последовательность несет полн-А "хвост" длиной 40 пн Химерный ретротранскрипт фланкирован прямыми повторами длиной 20 пн Гексануклеотид ТТАААА, расположенный на 22 пн выше сайта интеграции U6-L1, идентичен последовательности Т2А4 которую предпочтительно узнает эндонуклеаза LI (L1-EN), инициирующая интеграцию LI копий в соответствующие сайты генома

Предпринятый поиск в геномных базах данных человека выявил 56 химерных ретротранскрипта, сходных с вышеупомянутым Все химеры U6-3'-Ll фланкированы прямыми повторами длиной 11-21 пн, что свидетельствует об интеграции химеры как единой последовательности Все они имели рядом со своими 5'- концами либо гексануклеотид ТТАААА, либо его производные с однонуклеотидными заменами A/G либо Т/С Перечисленные выше особенности сайтов интеграции химер свидетельствуют о том, что их внедрения в геном были произведены интеграционным аппаратом ретротранспозонов LI

Образование химер происходило вплоть до самого недавнего времени в эволюционной истории человека, поскольку некоторые интеграции U6-L1 уникальны для генома человека Кроме того, по крайней мере одна интеграция химеры U6-L1 является полиморфной в человеческой популяции

Другие химерные ретроэчементы Для того, чтобы понять, является ли случай U6-L1 уникальным примером, мы провели анализ геномных баз данных с целью поиска новых химер, образованных фрагментами других псевдогенов Для этого в геноме человека были идентифицированы 735 псевдогенов наиболее часто встречающихся типов, дивергировавшие от своих консенсусных последовательностей от 0 до 10%, и для них был проведен детальный структурный анализ

Было установлено, что химерные ретротранскрипты, напоминающие U6-L1, могут обраювываться и из других транскрибируемых компонентов генома Затем поиск химерных ретроэлементов провели для всех опубликованных геномных последовательностей При этом двухчастные структуры, аналогичные вышеописанным (Рис 13), обнаружили во всех геномах млекопитающих, а также в геноме одного паразитического нитчатого гриба в сумме в ДНК человека, мыши, крысы и гриба Magnaporthe grísea нашли 82, 116, 66 и 31 химеру, соответственно (Табл 2) Химеры состоят из ДНК копий клеточных транскриптов, либо непосредственно объединенных друг с другом, либо, чаще, объединенных с З'-концевой частью ретроэлементов, относящихся к LINE (например, LI) Клеточные транскрипты, соответствующие химерам, относятся к мРНК белок-кодирующих генов, рибосомным РНК, малым ядерным РНК, а также 7SL RNA (Табл 2)

_ . , Прямые повторы _

i г \a.\a

-vaaaaää*»-

-^- Pol} (Л)

5 часть 3 часть -

РНК WEIRD РНК 5 укороченного MGL LINE,

мяРНК РНК 5 укороченного!,! LINE

Hi РНК 5 укороченных MpfIK

ГСНОВ ХОЗЯИН!

5S рРНК 4Л^рпк

7д™ в."sine

b2sinf

m sime

Рисунок 13 Схема двухчастных химерных ретроэлементов, найденных в геномах эукариот Вставки в геномах млекопитающих расположены ниже мотива ТТАААА Вставки в геномах млекопитающих и гриба содержат поли (А) последовательность или А-богатый микросателлит и фланкированы прямыми повторами геномной ДНК длиной 10-25 пар нуклеотидов

Таблица 2 Сопоставление 5'- и З'-концевых частей химерных ретроэлементов

млекопитающих с известными последовательностями РНК

Тип* Количества и доляь Функция' Локализация

Человек Мышь Крыса РНК"

5' —концевые части

U6 66(82%) 111 (95%) 61 (93%) мяРНК, сплайсинг Ядрышко, ядро

U5 1 (1%) 0 0 мяРНК, сплайсинг Ядрышко, ядро

из 8 (10%) 2 (2%) 1 (1%) мяРНК, процессинг рРНК Ядрышко

5S рРНК 3 (4%) 3 (3%) 4 (6%) Рибосомная РНК Ядрышко, цитоплазма

7SL 1 (1%) 0 0 SRP, сортинг белков Ядрышко, цитоплазма

Alu 2 (2%) 0 0 Эгоистичная РНК Ядрышко, ядро, цитоплазма

3' -концевые части

L1 65 103 54 Эгоистичная Цитоплазма,

(80%) (88%) (82%) мРНК ядро

мРНК 9(11%) 9 (8%) 5 (8%) мРНК генов Цитоплазма

Alu 7 (9%) 0 0 Эгоистичная РНК Цитоплазма,

ядро, ядрышко

В1 Mm 0 2 (2%) 0 Эгоистичная РНК Цитоплазма,

ядро

В2 Mml 0 1 (1%) 0 Эгоистичная РНК Цитоплазма,

ядро

B2_Mm2 0 1 (1%) 1 (1%) Эгоистичная РНК Цитоплазма,

ядро

IDRn 0 0 5 (8%) Эгоистичная РНК Цитоплазма,

ядро

4,5 S РНК 0 0 1 (1%) Рибосомная РНК Цитоплазма,

ядро

'Названия клеточных транскриптов, соответствующих данной части химеры Компоненты химер из генома гриба М grísea не указаны, поскольку функция и локализация РНК WEIRD остаются неизвестными 'Количество и доля последовательностей данного типа среди химер "Функция соответствующих РНК в клетке

Для химер характерны следующие общие свойства (1) их 5'-концевые части являются полноразмерными копиями клеточных РНК, (2) 3'-части химер - это 5'-укороченные копии соответствующих РНК (в основном LINE), (3) обе части объединены в одной и той же ориентации относительно направления транскрипции, (4) химеры несут поли (А) хвост или A-богатый микросателлит на 3' конце, (5) химеры

фланкированы короткими прямыми повторами геномной ДНК пре-интеграционного сайта

Последняя особенность подчеркивает, что эти элементы внедрялись в геном уже в виде двухчастных ДНК-копий Все химеры млекопитающих несли выше 5' конца гексануклеотид Т2А4 или его варианты, что соответствует последовательности Т2А4 Одновременность интеграции обеих частей химер была затем подтверждена в ходе экспериментов, основанных на исследовании эволюционного инсерционного полиморфизма

Важно отметить, что создающий химеры механизм часто объединяет функциональные копии клеточных транскриптов, часто не имеющих ничего общего с мобильными элементами Многие химеры можно рассматривать как новые гены, поскольку они транскрибируются, причем некоторые из них - тканеспецифически

По-видимому, все химерные ретроэлементы были созданы по механизму, включающему смену матрицы при обратной транскрипции Хотя основной энзиматической активностью обратной транскриптазы (ОТ) является синтез кДНК на неизменной матрице РНК, ОТ также способна к смене матриц в ходе обратной транскрипции Например, известно, что «прыжки» ОТ ретровирусов с одного сайта матричной РНК на другой необходимы для образования LTR

Вцелом, данные анализа геномов, эволюционных исследований, а также экспериментальные доказательства, убедительно свидетельствуют, что смена РНК-матриц может проходить в ходе обратной транскрипции LINE Нам удалось найти соответствующие химеры во всех геномах млекопитающих, но не в ДНК амфибий, рыб и беспозвоночных Однако же, химерные элементы были найдены в геноме гриба-паразита риса Magnaporthe grísea, что говорит о консервативности этого механизма среди представителей царств животных и грибов Некоторые особенности химерныхретроэлемептов грибов

Семейство химерных ретроэлементов MINE было найдено в геноме гриба Magnaporthe grísea 5'-концевые части MINE соответствуют полноразмерной копии некодирующего транскрипта неизвестной функции длиной 1 1 тпн, называемого WEIRD 3' -концевая часть MINE соответствует 5'-укороченым копиям MGL LINE грибов Инсерция одной копии MINE произошла буквально на глазах у исследователей, так что механизм образования химер у грибов активен и в настоящее время Систематический анализ геномных баз данных выявил для М grísea 31 такой химерный ретроэлемент

Функция РНК WEIRD пока остается неизвестной В серии экспериментов по гибридизации in situ с зондами, специфичными для WEIRD, внутриклеточную локализацию WEIRD установить нам не удалось из-за чрезвычайно низкой проницаемости клеточной стенки М grísea При этом при помощи количественной ОТ-ПЦР был показан высокий уровень экспрессии WEIRD относительно двух генов домашнего хозяйства на всех стадиях жизненного цикла гриба Содержание WEIRD в клетках сравнимо с РНК гена домашнего хозяйства 11\5 (35, 20 и 61% от уровня транскрипции Ilv5 на различных стадиях) WEIRD экспрессируется дифференциально, причем повышенный уровень ее содержания показан при инфекции гриба в растение (2-кратное превышение относительно содержания WEIRD в мицелии) В то же время, ретротранспозон MGL транскрипцнонно более активен в спорах гриба

Биоинформатический анализ показал, что WEIRD не является мобильным элементом, поскольку все геномные копии этой РНК были объединены с MGL LINE в составе химерных ретроэлементов Одиночных копий WEIRD найдено не было Отсутствие исходного гена WEIRD в базах данных, по-видимому, связано с незавершенностью проекта по секвенированию генома М grísea В других геномах также не было найдено последовательностей, гомологичных WEIRD

Таким образом, WEIRD (1) не является мобильным элементом, (2) экспрессируется на всех стадиях жизненного цикла и (3) не кодирует белок Это позволяет предположить, что WEIRD может являться функциональной конститутивной некодирующей РНК

Помимо 31 MINE, в геноме М grísea был найден также новый двухчастный химерный элемент, состоящий из копии WEIRD, объединенной с 5'-укороченным ретротранспозоном Mg-SINE Химера WEIRD-MgSINE фланкирована прямыми повторами длиной 12 пар нуклеотидов Mg-SINE - это неавтономный ретроэлемент, относящийся к группе SINE Для размножения в геноме он использует стратегию "молекулярной мимикрии" относительно последовательности MGL 3' конец Mg-SINE гомологичен 3' концевому фрагменту MGL, который используется для праймирования обратной транскрипции По-видимому, это свойство Mg-SINE обуславливает его узнавание ретропозиционным аппаратом MGL

Кроме того, нам удалось обнаружить химерный элемент, состоящий из трех частей (Рис 14) На 5' конце располагалась полноразмерная копия WEIRD, объединенная с 5'-укороченным Mg-SINE, который, в свою очередь, был объединен с

5'-укороченным MGL Химера фланкирована прямыми повторами длиной 14 пар нуклеотидов, что доказывает одновременную интеграцию в геном всех ее компонентов

В серии ОТ-ПЦР экспериментов мы показали, что многие химерные элементы грибов транскрибируются, причем некоторые - тканеспецифично Дифференциальная транскрипционная активность химер может отражать выполнение ими какой-либо функциональной нагрузки в клетках гриба

Пожалуй, наиболее интересным результатом анализа химер грибов оказалось то, что смена матрицы проходит только по специфическим нуклеотидным позициям в составе исходной РНК 3' концевые части химер, как правило, сформированы фрагментами MGL LINE Длина этих фрагментов варьирует от 230 до 5461 3'-концевых нуклеотидов MGL Анализ последовательностей 33 химер позволил картировать 28 различных точек химеризации в составе последовательности MGL В шести случаях, одна и та же точка использовалась при образовании двух различных элементов То есть, смена матриц осуществлялась по одной и той же нуклеотидной позиции РНК-матрицы в ходе формирования шести пар химер Анализ 28 точек химеризации показал, что они расположены не случайным образом в составе РНК MGL (таблица 3)

Точки смены матрицы соответствовали особому мотиву нуклеотидной последовательности, который присутствовал также и в точках химеризации в составе Mg-SINE Всем им соответствовала консенсусная последовательность GCC*A/U, где * обозначает участок возможной смены матрицы Обратная транскриптаза MGL копирует матрицу до нуклеотида A/U в составе мотива, где она может «перепрыгнуть» на другую РНК перед триплетом GCC

РНК полноразмерного MGL имеет 87 мотивов GCC(A/U) и гораздо больше -участков с однонуклеотидными заменами, тогда как только лишь небольшая их часть используется при химеризации in vivo Учитывая, что шесть таких сайтов являются "горячими точками" РНК рекомбинации, очевидно, что наличие мотива необходимо, но не достаточно для смены матрицы Мы постулировали, что точки химеризации расположены в структурированных участках РНК-матрицы Такие участки могут быть труднопроходимы для ОТ Похожая ситуация наблюдается для химер млекопитающих, где многие точки химеризации примерно соответствуют наблюдаемым участкам паузы ОТ В согласии с выдвинутой гипотезой, In silico вокруг точек химеризации в геноме гриба были предсказаны участки выраженной вторичной структуры РНК (Предсказанные структуры размещены в Интернет по адресу

http //www biomedcentral com/content/supplementary/1471-2164-8-360-s2 doc Таблица 3. Репрезентативные топки химеризации, найденные в геноме Л/ grísea

№ химеры* РНК- Вышележащая Нижележащая

матрнцль посл-тьс посл-ть*1

34 MGL CGCAGC ATTCG

24 MGL TATGCT ATATT

23 MGL AGCGCC TCCGG

4 MGL GGGGTC ITAGA

15 MGL GGGGTC TTAGA

14 MGL TGGGCC TTTCT

13 MGL GGAGCC CGAGG

12 MGL GGAGCC CGAGG

9 MGL TTGGCC ATGAG

8 MGL TTGGCC ATGAG

6 MGL ATAGCC ACCAA

5 MGL ATAGCC ACCAA

2 MGL ACTGCC TTTTC

1 MGL GCCGTC AGACG

7 MGL CAAGCT TCGGG

16 MGL TGGGCC GCTTT

32 MgSINE GCCGTC AGACG

33 MgSINE CCCGCC TGTGC

Консенсус Все типы —GCC A/T—

посл-ть

аДеталыюе описание химер дано в тексте диссертации ьТип РНК-матрицы

'Вышележащая нуклеотидная последовательность относительно участка смены матрицы

''Нижележащая нуклеотидная последовательность относительно участка смены матрицы

Остается неясным, почему ОТ диссоциирует непосредственно перед триплетом ОСС Для многих ОТ известно, что их процессивность зависит от нуклеотидного состава РНК-матрицы Можно предположить, что мотив 6СС, в особенности

находящийся в составе шпильки, является труднопроходимым местом для ОТ MGL, что может приводить к временной остановке фермента в этом месте или же к диссоциации и смене матрицы

В заключение следует упомянуть, что вышеуказанный механизм химеризации не включает какого-либо специфического спаривания нуклеотидов между новосинтезированной кДНК и второй РНК-матрицей, поскольку никаких участков микро- или протяженных гомологий между ними обнаружено не было

Тройные химеры и уточнение схемы образования химерных элементов

Обнаруженный в нашей работе тройной элемент грибов (Рис 14) доказывает, что в ходе LINE-опосредованной РНК рекомбинации т vivo может происходить более чем один акт смены матрицы Наиболее вероятным механизмом образования тройных химер является двойная смена матрицы при ретротранспозиции LINE (Рис 15) Скопировав 3'-концевые 4369 нуклеотидов MGL LINE (полная длина MGL составляет ~6 т п н ), ретропозиционный комплекс переключается на другую РНК и добавляет к кДНК -350-нуклеотидный З'-концевой фрагмент элемента Mg-SINE Затем, не закончив синтез комплементарной цепи Mg-SINE, ОТ меняет матрицу во второй раз и прибавляет к двухчастной кДНК еще и полноразмерную копию WEIRD (1113 нуклеотидов) После лигирования химеры и репарации геномной ДНК, элемент оказывается фланкирован 14-нуклеотидными прямыми повторами - дупликациями преинтеграционного сайта (Рис 14)

Ранее в геноме человека были найдены два тройных элемента (Рис 14) Один из них интегрирован в протяженный микросателлитный локус, другой - в АТ-богатую последовательность Поэтому идентифицировать прямые повторы для них не удалось

Однако же, в геноме мыши были обнаружены два новых тройных химерных ретроэлемента, фланкированных 15- и 16-нуклеотидными прямыми повторами (Рис 14) Химеры состояли из блоков В2 SINE, U6 мяРНК и LI LINE Тройные химеры в геномах таких эволюционно отдаленных организмов, как млекопитающие и нитчатые грибы свидетельствуют, что двойные акты смены матрицы в ходе обратной транскрипции LINE, возможно, являются не исключением, а консервативным механизмом перестройки эукариотической ДНК

Mg-SINE Magnaporthe grisea

ЛЛСШ2000185

WEIRD \ MGL

Dl

TTTCACCATCAAGT

ТТГСАССАТСААСТ

Человек

Alu У U6 L1PA5 AC005037

СТЛГГАЛЛЛЛТАЛЛ | ^ >| "У ГГТЛЛПТЛЛАА

Alu Sx U6 L1PA7 AL 133286

GTGAGAAGACAGCrí ^HAGAAGAAGAAGAG

ACAAAGTTCTGGGAGA

i >1

[ U6 i LIMd-F 2 3 ¡

А Я >

Мышь

ac090495

TGAGACAGGGTCTCCC

Прямые повторы

ACAAAGTTCTGGGAGC

'(А) АС0841Й2

TGAGACAGGGTCTCrC

Рисунок 14 Схема обнаруженных тройных элементов из геномов Мgrísea (А), человека (Б) и мыши (В) Только элементы гриба и мыши фланкированы прямыми повторами и, соответственно, могут, рассматриваться как тройные химеры

Многие химеры экспрессируются у млекопитающих и у гриба Мgrísea, некоторые из них - тканеспецифично Возможно, некоторые химерные ретротранскрипты, являющиеся продуктами «перетасовки» последовательностей функциональных генов, могут быть каким-то образом вовлечены в функционирование клетки Некоторые химеры, по-видимому, дали качало новым группам ретроэлементов Вместе с тем, подавляющее большинство таких элементов являются нефункциональными побочным продуктами ретротранспозиции представителей семейства LINE

1) Связывание SINE, LINE или клеточной мРНК LINE-кодируемыми белками

Цитоплазма ^

Рисунок 15 Механизм образования химер при помощи энзиматического аппарата LINE (1) преинтеграционный комплекс LINE связывает РНК LINE, SINE или другую РНК в цитоплазме (2) Рибонуклеопротеид транспортируется в ядро (3) Обратная транскрипция связанной РНК, праймированная одноцепочечным разрывом в геномной ДНК (target site primed reverse transcription) (4A) Успешная интеграция кДНК в геномную ДНК (4В) Смена матрицы на другую РНК в ходе обратной транскрипции (5А) Интеграция двойной химеры в геномную ДНК (5В) Вторая смена матрицы на другую РНК с последующей репарацией ДНК приводит к образованию интеграции тройного химерного ретроэлемента, фланкированной прямыми повторами Нормальная последовательность событий при ретротранспозиции LINE (1)- (2)- (3)- (4А)

Выводы

Разработан метод, названный MDR (англ Mispaired DNA Rejection), позволяющий значительно повышать специфичность отбора совершенных дуплексов при гибридизации Метод также применим для поиска эволюционно консервативных последовательностей

Разработаны новые экспериментальные методы поиска дифференциальных геномных повторов Первый метод, TGDA (англ Targeted Genomic Differences Analysis), основан на вычитающей гибридизации геномных последовательностей, а второй, Diffir (англ Differences in the integration sites of low and medium copy number interspersed repeats technique) - на дифференциальной гибридиазации участков генома на фильтре

Разработанные подходы были успешно применены для полногеномной идентификации специфичных для генома человека представителей ретроэлементов семейств HERV-K (HML-2) и Ы На основании полученных данных, проведен детальный структурный анализ человек-специфичных ретроэлементов HERV-K (HML-2) u LI Для человек-специфичных представителей группы HERV-K (HML-2), обладающих общностью гомологии нуклеотидной последовательности, была создана консенсусная последовательность

Разработан новый экспериментальный методический подход, впервые позволяющий проводить полногеномные исследования промоторной активности геномных повторов как на качественном, так и на количественном уровне Этот подход, названный GREM (англ Genomic Repeat Expression Monitor), основан на гибридизации геномных последовательностей, фланкирующих повторы, с 5'-концевыми фрагментами кДНК Подход был применен для полногеномного исследования промоторной активности человек-специфичных эндогенных ретровирусов HERV-K (HML-2) в нормальной и раковой тканях В составе последовательности длинных концевых повторов представителей семейства HERV-K (HML-2) найдена точка начала транскрипции, отличающаяся от канонической для экзогенных ретровирусов Появление новой точки начала транскрипции может быть связано с адаптивной эволюцией геномов эндогенных ретровирусов

6) В интронах двух генов человека - SLC u SLB - выявлены человек-специфичные эндогенные ретровирусы HERV-K (HML-2) , инициирующие транскрипцию антисмысловых РНК, перекрывающихся с последовательностями экзонов этих генов В системе in vitro показано, что экспрессия этих антисмысловых транскриптов на физиологическом уровне, наблюдаемом для эмбриональных и герминогенных тканей, приводит к 2-3 -кратному снижению концентрации мРНК соответствующих генов Обнаружены первые два случая человек-специфичной регуляции экспрессии генов

7) Было обнаружено новое семейство ретроэлементов, состоящее из химерных последовательностей, образованных при однократной или двукратной смене матрицы в ходе обратной транскрипции Представители семейства были найдены в геномах млекопитающих и у нитчатого гриба Magnaporthe grisea

ОСНОВНЫЕ РЕЗУЛЬТАТЫ ДИССЕРТАЦИИ ОПУБЛИКОВАНЫ В СЛЕДУЮЩИХ РАБОТАХ.

ИССЛЕДОВАТЕЛЬСКИЕ СТАТЬИ

1)Е Gogvadze, С Barbisan, М-Н LebrunandA Buzdin (2007) Tripartite chimeric pseudogene from the genome of rice blast fungus Magnaporthe grisea suggests double template jumps during long interspersed nuclear element (LINE) reverse transcription BMC Genomics, 8(1) 360

2) I Kholodenko, R Kholodenko, V Sorokin, A Tolmazova, О Sazonova, A Buzdin (2007) Anti-apoptotic effect of retinoic acid on retinal progenitor cells mediated by a protein kinase A-dependent mechanism Cell Research, 17(2)151-62

3) Buzdin A, Kovalskaya-Alexandrova E , Gogvadze E , Sverdlov E (2006) At Least 50% of Human-Specific HERV-K (HML-2) Long Terminal Repeats Serve In Vivo as Active Promoters for Host nonrepetitive DNA Transcription J Virol, 80(21) 10752-62

4) A Buzdin, E Kovalskaya-Alexandrova, E Gogvadze, E Sverdlov (2006) GREM, a technique for genome-wide isolation and quantitative analysis of promoter active repeats Nucleic Acids Res , 34(9) e67

5) И В Холоденко, А А Буздин, Р В Холоденко, Ю А Байбикова, В Ф Сорокин, В Н Ярыгин, Е Д Свердлов (2006) Сокультивирование клеток-предшественников сетчатки (КПС) мыши с культурой клеток пигментного эпителия влияет на особенности дифференцировки КПС Биохимия 71(7) 767-74

6) Kovalskaya, E , Buzdin, A, Gogvadze, E, Vinogradova, T, Sverdlov, E D (2006) Functional human endogenous retroviral LTR transcription start sites are located between the R and U5 regions Virology, Mar 15, 346(2) 373-378

7) Гогвадзе, E , Буздин, A , Свердлов, E (2005) Множественные акты смены матрицы в ходе LINE-опосредованной обратной транскрипции являются общим механизмом образования химерных ретроэлементов у млекопитающих Биоорганическая химия, 31(1) 82-89

8) Chalaya Т , Gogvadze Е , Buzdin А , Kovalskaya Е , Sverdlov Е D (2004) Improving specificity of DNA hybridization-based methods Nucleic Acids Res, 32(16) el30

9) Buzdin, A, Gogvadze, E , Kovalskaya, E , Volchkov, P , Ustyugova, S , Illarionova, A, Fushan, A, Vinogradova, T, Sverdlov, E (2003) The human genome contains many types of chimeric retrogenes generated through in vivo RNA recombination Nucleic Acids Res , 31(15) 4385-4390

10) Буздин, A , Лебедев, Ю, Свердлов, E (2003) Человек-специфичные вставки LTR HERV-K в нитронах генов имеют неслучайную ориентацию и, возможно, участвуют в антисмысловой регуляции экспрессии генов Биоорганическая химия, 29(1) 103-106

11) Buzdin, А, Ustyugova, S , Khodosevich, К, Mamedov, I, Lebedev, Y, Hunsmann, G , Sverdlov, E (2003) Human-specific subfamilies of HERV-K (HML-2) long terminal repeats three master genes were active simultaneously during branching of hommoid lineages Genomics, 81(2) 149-156

12) Buzdin, A, Ustyugova, S , Gogvadze, E , Lebedev, Y , Hunsmann, G , Sverdlov, E (2003) Genome-wide targeted search for human specific and polymorphic LI integrations Human Genetics, 112(5-6) 527-533

13) Buzdin, A , Ustyugova, S , Gogvadze, E , Vinogradova, T , Lebedev, Y , Sverdlov, E (2002) A new family of chimeric retrotranscripts formed by a full copy of U6 small nuclear RNA fused to the 3' terminus of LI Genomics, 80(4) 402-406

14) Mamedov, I, Batrak, A , Buzdin, A , Arzumanyan, E , Lebedev, Y , Sverdlov, E (2002) Genome-wide comparison of differences m the integration sites of interspersed repeats between closely related genomes Nucleic Acids Res , 30(14) e71

15) Буздин, A, Ревина, JI, Костина, Л , Залунин, И, Честухина, Г (2002) Взаимодействие белков молекулярной массы 65- и 62-кДа из апикальных мембран эпителия кишечника личинок Aedes aegyph с эндотоксинами Bacillus ihunngiensis Сгу4В и Cryl 1А Биохимия, 67(5) 540-546

16) Buzdin, A., Khodosevich, К, Mamedov, I, Vinogradova, T , Lebedev, Y , Hunsmann, G , Sverdlov, E (2002) A technique for genome-wide identification of differences in the interspersed repeats integrations between closely related genomes and its application to detection of human-specific integrations of HERV-K LTRs Genomics, 79(3) 413-422

ОБЗОРНЫЕ СТАТЬИ

17) A Buzdin (2007) Human specific endogenous retroviruses TheScientificWorldJournal, 7 1848-1868

18) Buzdin A, Gogvadze E, Lebrun MH (2007) Chimeric retrogenes suggest a role for the nucleolus in LINE amplification FEBS Lett ,581(16) 2877-82 Epub 2007 May 25

19) Buzdin, A. (2006) Transposable elements and their use for target site specific gene delivery Current Pharmacogenomics, March, 4(1) 1-8

20) Гогвадзе, E, Буздин, A (2005) Новый механизм образования ретрогенов в геномах млекопитающих рекомбинация m vivo в ходе обратной транскрипции РНК Молекулярная биология, 39(3) 364-373

21) Buzdm, А, Vinogradova, Т, Lebedev, Y, Sverdlov, E (2005) Genome-wide experimental identification and functional analysis of human specific retroelements Cytogenet Genome Res ,110(1-4) 468-474 , in the special issue "Retrotransposable elements and genome evolution"

22) Buzdin, A (2004) Retroelements and formation of chimeric retrogenes CMLS, Cell Mol Life Sci 61(16)2046-2059

МОНОГРАФИИ, ГЛАВЫ В КНИГАХ

23) Книга "Nucleic acids hybridization modern applications" Редакторы Anton Buzdin, Sergey Lukyanov, Springer (2007) ISBN 978-1-4020-6039-7

24) Nucleic acids hybridization potentials and limitations (Anton Buzdin)

глава в книге "Nucleic acids hybridization modern applications" Редакторы Anton Buzdin, Sergey Lukyanov, Springer (2007) ISBN 978-1-4020-6039-7

25) Selective suppression of polymerase chain reaction and its most popular applications (Sergey Lukyanov, Konstantin Lukyanov, Nadezhda Gurskaya, Ekatenna Bogdanova, Anton Buzdin)

глава в книге "Nucleic acids hybridization modern applications" Редакторы Anton Buzdin, Sergey Lukyanov, Springer (2007) ISBN 978-1-4020-6039-7

26) Suppression subtraetive hybridization (Sergey Lukyanov, Denis Rebrikov, Anton Buzdin)

глава в книге "Nucleic acids hybudization modern applications" Редакторы Anton Buzdin, Sergey Lukyanov, Springer (2007) ISBN 978-1-4020-6039-7

27) Stem-loop oligonucleotides as hybridization probes and their practical use in molecular biology and biomedicine (Anton Buzdin, Sergey Lukyanov)

глава в книг e "Nucleic acids hybridization modem applications" Редакторы Anton Buzdin, Sergey Lukyanov, Springer (2007) ISBN 978-1-4020-6039-7

28) Coincidence cloning robust technique for isolation of common sequences (Anton Buzdin)

глава в книге "Nucleic acids hybudization modern applications" Редакторы Anton Buzdin, Sergey Lukyanov, Springer (2007) ISBN 978-1-4020-6039-7

29) DNA hybridization in solution for mutation detection (Anton Buzdin)

глава в книге "Mictoc acids hybridization modern applications" Редакторы Anton Buzdin, Sergey Lukyanov, Springer (2007) ISBN 978-1-4020-6039-7

30) Current attempts to improve the specificity ot nucleic acids hybridization (Anton Buzdin)

глава в книге "Nucleic acids hybridization modern applications" Редакторы Anton Buzdin, Sergey Lukyanov, Springer (2007) ISBN 978-1-4020-6039-7

Результаты работы докладывались на Российских и международных конференциях, симпозиумах и конгрессах на Конгрессе по молекулярной эволюции в Сорренто (Италия) в 2002 г , на Конгрессах ФЕБО (FEBS) в Стамбуле (Турция) в 2003г в Варшаве (Польша) в 2004г, в Будапеште (Венгрия) в 2005 г, на 7й и 8й Международных Энгельгардтовских конференциях в Суздале (2005г) и в Сергиевом Посаде (2006г), на 1-м Европейском симпозиуме «Мобильные элементы ДНК и транспозиция" в Виттенберге (Германия) в 2005 г, на Летних исследовательских конференциях FASEB в 2005 и 2007 гг (Тусон, США), на Международном съезде IUBMB (Киото, Япония, 2006 г ), на 9-м международном Конгрессе по вариабильности генома человека (Ситжес, Испания, 2007г), а также на других конференциях и научных школах Отдельные этапы работы были удостоены Медали Президиума РАН в 2003 году, а также медали Европейской Академии (Academia Ешораеа) в 2006 году

Использованные сокращения:

КИРИЛЛИЦА

ВГ, вычитающая гибридизация кДНК комплементарная ДНК мРНК матричная РНК ОТ обратная транскрипция ПЦР полимеразная цепная реакция

ПА ТИН С КИИ РЕГИСТР

GREM, англ метод genomic repeat expression monitor LTR англ long концевой repeat, длинный концевой повтор MDR метод mispaired DNA rejection

RACE, англ rapid amplification of cDNA ends быстрая амплификация концов кДНК TGDA, метод targeted геномный difference analysis

Заказ № 64/07/08 Подписано в печать 18 07 2008 Тираж 100 экз Уел п п 3

ООО "Цифровичок", тел (495) 797-75-76, (495) 778-22-20 cfr т , е-тш1 т/о@с/г т

Содержание диссертации, доктора биологических наук, Буздин, Антон Александрович

Литературный обзор:

1. Потенциал и границы применения гибридизации нуклеиновых кислот

1.1 Введение

1.2 Клонирование дифференциальных последовательностей: вычитающая гибридизация

1.2.1 Появление метода

1.2.2 Вычитающая гибридизация, основанная на ПЦР амплификации

1.2.3 Первый впечатляющий успех: репрезентативный дифференциальный анализ (RDA)

1.2.4 Дальнейшие усовершенствования: супрессионная вычитающая гибридизация (SSH), эффект супрессии ПЦР и нормализация библиотек кДНК

1.2.5 Другие перспективные подходы к вычитающей гибридизации

1.3 Поиск общих последовательностей: метод клонирования совпадений

1.4 Гибридизация в растворе для поиска геномных полиморфных участков

Введение Диссертация по биологии, на тему "Полногеномные подходы к функциональному анализу повторяющихся элементов"

2.2 Принцип селективной супрессии ПЦР (ССП) 37

2.3 Подготовка образцов ДНК, содержащих инвертированные концевые повторы 39

2.4 Стратегия применения различных вариантов ССП 39

2.5 Семейство методов, основанных на ССП 42

2.5.1 Создание библиотек кДНК с использованием небольших количеств биологического материала 42

2.5.2 Детекция дифференциально экспрессирующихся генов 43

2.5.3 Поиск 5'- и З'-концевых фрагментов кДНК 48

2.5.4 Поиск промоторных участков и модификация метода «прогулки по хромосоме» 49

2.5.5 Клонирование in vitro 50

2.5.6 Мультиплексная ПЦР 50

3. Использование сковородоподобных олигонуклеотидов как гибридизационных проб 53

3.1 Введение 53

3.2 «Молекулярные беконы» 54

3.3 Сковороподобные ДНК-зонды для микрочиповой гибридизации 61

3.4 Заключение 63

4. Нормализация библиотек кДНК 64

4.1 Введение 64

4.1.1 Для чего нужна нормализация библиотек кДНК 64

4.1.2 Оценка эффективности нормализации 65

4.2 Основные подходы к нормализации библиотек кДНК 66 4.2.1 Создание нормализованных библиотек, обогащенных полноразмерными кДНК, с использованием дуплекс-специфичной нуклеазы (ДСН-нормализация) 67

5. Клонирование совпадений: эффективный метод экспериментального выделения общих последовательностей 70

5.1 Введение 70

5.2 Селекция гетеродуплексов на стадии клонирования 74

5.3 Физическое разделение гибридных молекул 75

5.4 Подходы, основанные на ПЦР 77

5.5 Краткое заключение 84

6. Гибридизация ДНК в растворе для детектирования мутаций 85

6.1 Введение 85

6.2 Химические методы 88

6.3 Энзиматические методы 90

6.3.1 Нуклеазное сканирование мутаций 91

6.3.2 Подходы, основанные на аллель-специфической ПЦР 102

6.3.3 Другие энзиматические подходы для сканирования мутаций 104

6.4 Физические методы 107

7. Подходы к повышению специфичности гибридизации нуклеиновых кислот 109

7.1 Введение 109

7.2 Улучшение параметров кинетики гибридизации 112

7.2.1 Упрощение гибридизационных смесей 112

7.2.2 Химические модификации

7.3 Ужесточение требований к селекции совершенных дуплексов

Практическая часть:

1. Методы идентификации новых копий геномных повторов 116

1.1 Введение 116

1.2 Метод TGDA: вычитающая гибридизация участков, фланкирующих геномные повторы 118

1.3 Метод О^Шг: дифференциальная гибридизация фланков геномных повторов на фильтре 126

1.4 Приложение методов ТвОА и Э1Шг для молекулярной генетики человека 130

1.4.1 Идентификация человек-специфичных инсерций эндогенных ретровирусов 130

1.4.2 Идентификация человек-специфичных вставок ретроэлементов Ь1 137

1.4.3 Новое семейство химерных ретроэлементов эукариот 140

2. Анализ транскрипционной активности геномных повторов 163

2.1 Введение 163

2.2 Метод ОКЕМ: полногеномный поиск промоторно-активных повторов 165

2.3 Приложение вЯЕМ для поиска промоторно-активных эндогенных ретровирусов, специфичных для ДНК человека 173

2.4 Антисмысловая регуляция экспрессии генов молекулами РНК, транскрибируемыми с промоторов человек-специфичных эндогенных ретровирусов 181

3. Повышение специфичности гибридизации в растворе 194

3.1 Введение 194

3.2 Метод МБИ.: селективная деградация неправильно спаренных гетеродуплексов 195

3.3 Приложение М1Ж для поиска эволюционно консервативных последовательностей в геномах человека и обезьян 199 МАТЕРИАЛЫ И МЕТОДЫ 201 ИСПОЛЬЗОВАННЫЕ СОКРАЩЕНИЯ 205 ОБЩИХ СПИСОК ПУБЛИКАЦИЙ ДИССЕРТАНТА 207 ВЫВОДЫ 211

Список цитируемых литературных источников213

БЛАГОДАРНОСТИ 226

Эта диссертационная работа посвящена структурно-функциональному анализу мобильных элементов эукариот. Основная часть результатов была получена при применении новых методов, основанных на гибридизации нуклеиновых кислот в растворе. Литературный обзор посвящен именно описанию существующих на настоящий момент экспериментальных подходов к крупномасштабному анализу генома и транскриптома. Биология мобильных элементов рассматривается в литературном обзоре лишь вскользь, поскольку эта тема подробно описывалась в обзоре к диссертации автора на соискание учёной степени кандидата биологических наук. Два фактора: нежелание повторяться, а также то, что методическим подходам, даже новым и оригинальным, как правило, уделяется до обидного мало места в печатных трудах, и сформировали позицию автора относительно структуры настоящей диссертационной работы.

ЛИТЕРАТУРНЫЙ ОБЗОР

Заключение Диссертация по теме "Молекулярная биология", Буздин, Антон Александрович

ЗАКЛЮЧЕНИЕ

Представленные результаты убедительно свидетельствуют о том, что метод MDR может быть полезен для улучшения качества самых разных библиотек, получаемых при реассоциации ДНК, включая вычтенные или нормализованные геномные и кДНК-библиотеки. Хотя в наших экспериментах нуклеаза Surveyor оказалась незначительно более эффективной, чем Mung Bean, в других случаях последняя может быть также весьма полезна. В частности, обработка Mung Bean может помочь при гибридизации кДНК, когда образуется значительное количество несовершенных дуплексов при отжиге друг на друга в целом негомологичных последовательностей с похожими нуклеотидными мотивами. Поэтому, для рутинного применения можно рекомендовать смесь обеих нуклеаз. Метод также может значительно упростить решение задачи экспериментального поиска эволюционно консервативных последовательностей в несеквенированных геномах. Указанные особенности позволяют надеяться на широкую применимость метода для нужд молекулярной генетики.

По материалам работы была опубликована одна статья:

13) Chalaya Т., Gogvadze Е., Buzdin A., Kovalskaya Е., Sverdlov E.D. (2004). Improving specificity of DNA hybridization-based methods. Nucleic Acids Res., 32(16):el30.

Материалы и методы.

4.1. Образцы геномной ДНК. Образцы геномной ДНК, использованные в ходе данной работы, были получены из 20 индивидуальных образцов плаценты человека, 18 проб крови человека, а также проб крови человекообразных обезьян, с использованием реактивов Genomic DNA Purification Kit (Promega, США), либо были получены напрямую из Германского Центра Приматологии от проф. Герхарда Хунсманна (Gerhardt Hunsmann).

4.2. Олигонуклеотиды. Все использованные в данной работе олигонуклеотиды были синтезированы В. К. Потаповым и Н. В. Скапцовой (ЛСФГЧ ИБХ РАН) на ДНК синтезаторе ASM-102U DNA (Биосан, Новосибирск, Россия). Структуры олигонуклеотидов приведены в соответствующих опубликованных статьях или далее в тексте раздела.

4.3. Приготовление ДНК Трейсера и Драйвера для метода TGDA. Рестрикция геномной ДНК человека и шимпанзе, лигирование супрессионных адапторов и ПЦР-амплификация фланкирующих ретроэлементы областей генома была проведена в соответствии с протоколом, опубликованном в (283).

Структура использованных супрессионных адапторов: А1А2, 5'-TGTAGCGTGAA GACGA CA GAAA GGGCGTGGTGCGGAGGGCGGT-3'; al, 5'

ACCGCCCTCCG-3'; AI, 5'-TGTAGCGTGAAGACGACAGAA-У; A2, 5'-AGG GCGTGGTGCGGA GGGCGG T-3'.

Структура LTR-специфичных праймеров, использованных для селективной амплификации: Т1, 5'-GGGCTGGGGGA CGG ТС A GGT-3'; Т2, 5'

GACACAGTAAC(A/G)GTCTGAТСТС-3'; ТЗ, 5'- CCAGCCCGACACCCGTAAA-3'.

Структура LI-специфичных праймеров, использованных для селективной амплификации: Т1, 5'-1TAGTGGGTGCA GCGCA CCA G-3'; Т2, 5'

CATATGTAACTAACCTGCACAATGT-V.

1 нг аликвоты ампликонов человека амплифицировались в соответствии с процедурой 'step-out PCR' с двумя наборами праймеров: А (0.01 рМ А1А2, 0.2 рМ А2, 0.2 рМ Т2) или с набором В (0.01 рМ А2Т2, 0.2 рМ А2, 0.2 рМ AI), программа ПЦР: 15 циклов х (95°С -15", 57°С - 10", 72°С - ГЗО"). Полученные образцы Трейсеров А и Б (по 150 нг в случае фланков как LTR, так и LI), а также образцы Драйвера (начальный ампликон ДНК шимпанзе, 3000 нг для фланков LTR и 4600 нг для фланков LI) обрабатывались нуклеазой ExoIII (Promega, США) по отдельности при 16°С в следующих условиях: фланки LTR. Трейсер А - 20 единиц ЕхоШ,10 минут (удаление 40 концевых нуклеотидов); Трейсер Б - 20 единиц, 12 минут (удаление 60 нуклеотидов); Драйвер, 400 единиц, 10 минут (удаление 40 нуклеотидов); фланки LI. Трейсер А — 20 единиц Ехо1П,12 минут (удаление 60 концевых нуклеотидов); Трейсер Б — 20 единиц, 15 минут (удаление 80 нуклеотидов); Драйвер, 500 единиц, 12 минут (удаление 60 нуклеотидов).

В случае фланков LTR смешали по отдельности по 15 нг обработанных нуклеазой Трейсеров А и Б с 1500 нг обработанного Драйвера. В случае фланков LI смешали отдельно по 12 нг обоих Трейсеров с 2300 нг Драйвера. Полученные образцы ДНК очистили дробной экстракцией фенолом и хлороформом, переосадили этанолом и растворили в 5 мкл (в первом случае) и в 1 мкл (во втором случае) гибридизационного буфера (0.5 MNaCl/50 mM Hepes, pH 8.3/0.2 тМ EDTA).

4.4. Вычитающая гибридизация. Образцы Трейсер А/Драйвер и Трейсер Б/Драйвер смешали, денатурировали ДНК 10 минут при 95°С и гибридизовали 14 часов при 65°С. Конечную гибридизационную смесь разбавили буфером pH 8.3, содержащим 50шМ NaCl/5mM Hepes, 0.2mM EDTA. 1 мкл разбавленной смеси ПЦР-амплифицировали с 0.4 рМ праймером AI при условиях: 1) 72°С в течение 6 минут для заполнения концов образовавшихся ДНК; 2) (95°С -15", 65°С - 10", 72°С - ГЗО"), х15 циклов.

4.5. Создание библиотек и дифференциальный скрининг фланков повторяющихся элементов. Продукты ВГ были клонированы в Е. coli штамма DH5a с использованием набора реактивов "TA-cloning system" (Promega). По 480 индивидуальных клонов из библиотек фланков LTR и LI были упорядочены в 96-луночные плашки.

Дифференциальный скрининг проводился только для библиотеки фланков LTR. ДНК вставок клонов упорядоченной библиотеки амплифицировали с праймером AI и параллельно наносили на два набора нейлоновых мембран Hybond N (Amersham, США). Мембраны гибридизовали с ампликонами фланкирующих последовательностей человека и шимпанзе, радиоактивно помеченных 32Р с использованием "Prime-a-Gene labeling system" (Promega) при 68°C в соответствии со стандартным протоколом.

4.6. Определение первичной структуры клонов. Определение последовательности ДНК проводили с помощью автоматического секвенатора ДНК Applied Biosystems 373 automatic DNA sequencer либо при помощи Центра Коллективного Пользования «Геном».

4.7. Анализ последовательностей ДНК. Поиск гомологий в базах данных GenBank проводился с помощью сервера BLAST at NCBI (http://www.ncbi.nlm.nih.gov/BLAST), картирование последовательностей в геноме человека и анализ генного окружения проводили, используя программное обеспечение UCSC Human Genome Browser (http://genome.ucsc.edu/goldenPath/hgTracks.html). Поиск копий U6 мяРНК и псевдогенов 5S рРНК, 4,5S рРНК, различных тРНК, белков L7, L7A, L23A, LIO, L31, L28, 7SK, 7SL, малых ядрышковых РНК El, Е2, ЕЗ, малых РНК hYl, CYCLO, псевдогенов XBR, XTR, малых ядерных РНК U1, U2, U3, U4, U5 в геноме человека осуществляли с использованием сервера BLAT (http://genome.ucsc.edu/cgi-bin/hgBLAT). Идентификацию геномных повторов в исследуемых последовательностях проводили при помощи программы RepeatMasker (http://ftp.genome.washington.edu/cgi-bin/RepeatMasker; A.F.A. Smit & P. Green, неопубликованные данные). Консенсусные последовательности повторяющихся элементов генома человека брали из базы данных RepBase Update (http://www.girinst.org/server/RepBase/). Выравнивание последовательностей проводили с помощью программ ClustalW (335) и ClustalWin (автор Т. Городенцева, ЛСФГЧ, ИБХ РАН). Филогенетический анализ и построение деревьев автор осуществлял с использованием программ Vector NTÍ, DnaDist, DnaPars и Fitch пакета PHYLIP (336). Визуализация деревьев проводилась с помощью программы TreeView. Также автором использовалась программа GeneRunner для подбора необходимых праймеров.

4.8. ПЦР-анализ. Амплифицировали 40 нг матрицы, в качестве которой выступали геномные ДНК, с использованием уникальных геномных праймеров (концентрация 0,2 мкМ). Стандартными условиями проведения ПЦР являлись: ( 95°С - 15", 60°С - 10", 72°С - 1'30"), X 28 циклов, хотя в некоторых случаях температуру отжига праймеров подбирали индивидуально. Проведение ОТ-ПЦР анализа, в том числе и количественной ОТ-ПЦР, детально описывается нами в соответствующих публикациях (ссылки даются в каждом разделе).

4.9. Гибридизация с зондами на последовательности U6 мяРНК и LI. Зонд на последовательность U6 был получен в ходе геномной ПЦР с 0.2 рМ Uó-специфичными праймерами, прямым S'-TGCTCGCTTCGGCA G С-3 ' и обратным 5 ' -AAA А А ТА TGGAACGCTTCA CG-3 матрица - 40 нг геномной ДНК плаценты человека, условия - (95°С - 15", 65°С - 10", 72°С - 20"), х 28 циклов.

Зонд на последовательность LI получали при геномной ПЦР ДНК человека с 0.2 il M уникальными прямым 5'-GA TT А ТСТААЛ TGA ССТА CTTGCA С-3 ' и обратным 5'-CCAGAAGAAGTATAGCATGTTCAC-3' геномными праймерами, фланкирующими 5'-укороченный элемент семейства L1PA2 длиной 1375 пн (код доступа в GenBank АС037430). Условия ПЦР - (95°С -15", 65°С - 10", 72°С - Г), х 28 циклов.

Зонды метили 32Р с помощью реактивов 'Prime-a-Gene labeling system' (Promega) и гибридизовали при 68°С по стандартному протоколу.

4.10. Образцы кДНК тканей человека (плаценты, зрелой тератомы, семиномы, нормальной паренхимы яичка и двух лимфом) были любезно предоставлены Т. В. Виноградовой (ЛСФГЧ, ИБХ РАН) и проверены с использованием стандартных бета-актиновых праймеров.

4.11. Гибридизация ДНК для метода MDR. Растворяли 800 нг каждого из подготовленных гибридизуемых образцов ДНК в 8 рл 1х гибридизационного буфера, денатурировали образцы при 95°С в течение 10 минут, затем гибридизовали при 65°С или 85°С в течение 50 часов. Гибридизационную смесь разбавляли 80 рл буфера следующего состава: 50 гаМ NaCl, 5 гаМ HEPES, рН 8.3, 0.2 гаМ EDTA. В некоторых экспериментах, к гибридизационной смеси добавляли конкурентную фракцию ДНК C0tA (Gibco BRL).

4.12. Заполнение концов гибридизованной ДНК. 1 единица полчмеразы AmpliTaq DNA polymerase использовалась для достройки концов 1 микрограмма гибридизованной ДНК, инкубация 20 минут при 72°С.

4.13. Обработка нуклеазами, чувствительными к неспаренным нуклеотидам.

100 нг-аликвоты гибридизованной ДНК обрабатывали 1 рл нуклеазы Surveyor (Transgenomic, США) в 20 рл 1х буфера, поставленного производителем фермента, ночная инкубация при 42°С, или обработаны 0.1 ед. нуклеазы Mung bean (Promega) при 37°С в течение 15 мин. ДНК очищали смесью фенол-хлороформ и высаживали этиловым спиртом.

Использованные сокращения:

РУССКИЙ РЕГИСТР

ВГ, вычитающая гибридизация

ИКП, инвертированные концевые повторы кДНК, комплементарная ДНК мРНК, матричная РНК

ОТ, обратная транскрипция

ОТ-ПЦР, reverse transcription polymerase chain reaction ПААГ - полиакриламидный гель ПДРФ, полиморфизм длин рестриктных фрагментов ПЦР, полимеразная цепная реакция ССП, эффект супрессии ПЦР

ЛАТИНСКИЙ РЕГИСТР

ВАС, англ. bacterial artificial chromosome, искусственная бактериальная хромосома СС, англ. coincidence cloning, метод клонирования совпадений CHS, англ. covalently hybridized subtraction

DSN, англ. duplex-specific nuclease, дуплекс-специфичная нуклеаза

DSNP, англ. метод duplex-specific nuclease preference

EST, англ. expressed sequence tag

FRET, англ. fluorescence resonance energy transfer

GREM, англ. метод genomic repeat expression monitor

LTR, англ. long концевой repeat, длинный концевой повтор

MDR, метод mispaired DNA rejection

MOS, англ. метод mirror orientation selection

NGSCC, англ. метод non-methylated genomic sites coincidence cloning ODD, метод упорядоченный дифференциальный дисплей PEER, англ. метод primer extension enrichment reaction

RACE, англ. rapid amplification of cDNA ends, быстрая амплификация концов кДНК RDA, англ. метод representative differences analysis, репрезентативный дифференциальный анализ

SAGE, англ. метод serial analysis of gene expression, серийный анализ генной экспрессии SL, от англ. stem-loop, сковородоподобная структура, содержащая петлю и комплементарно спаренное основание («ручка» сковородки)

SNP, англ. single nucleotide polymorphism, однонуклеотидный полиморфизм SSCP, метод single-strand conformational polymorphism

SSH, англ. suppression subtractive hybridization, супрессионная вычитающая гибридизация

TGDA, метод targeted геномный difference analysis TGDD, метод targeted genomic differential display

YAC, англ. yeast artificial chromosome, дрожжевая искусственная хромосома.

Общий список публикаций диссертанта

ИССЛЕДОВАТЕЛЬСКИЕ СТАТЬИ:

1) Е. Gogvadze, С. Barbisan, М.-Н. Lebrun and A. Buzdin (2007) Tripartite chimeric pseudogene from the genome of rice blast fungus Magnaporthe grisea suggests double template jumps during long interspersed nuclear element (LINE) reverse transcription. BMC Genomics, 8(1):360

2) I. Kholodenko, R. Kholodenko, V. Sorokin, A. Tolmazova, O. Sazonova, A. Biizdin (2007) Anti-apoptotic effect of retinoic acid on retinal progenitor cells mediated by a protein kinase A-dependent mechanism. Cell Research, 17(2):151-62.

3) Buzdin A., Kovalskaya-Alexandrova E., Gogvadze E., Sverdlov E. (2006) At Least 50% of Human-Specific HERV-K (HML-2) Long Terminal Repeats Serve In Vivo as Active Promoters for Host nonrepetitive DNA Transcription. J Virol., 80(21): 10752-62.

4) A. Buzdin, E. Kovalskaya-Alexandrova, E. Gogvadze, E. Sverdlov (2006) GREM, a technique for genome-wide isolation and quantitative analysis of promoter active repeats. Nucleic Acids Res., 34(9): e67.

5) I. V. Kholodenko, A. A. Buzdin, R. V. Kholodenko, J. A. Bibikova, V. F. Sorokin, V. N. Yarygin, and E. D. Sverdlov (2006) Mouse retinal progenitor cell (RPC) cocultivation with retinal pigment epithelial cell culture affects features of RPC differentiation. Biochemistry (Moscow) 71(7):767-74.

6) Kovalskaya, E., Buzdin, A., Gogvadze, E., Vinogradova, Т., Sverdlov, E.D. (2006) Functional human endogenous retroviral LTR transcription start sites are located between the R and U5 regions. Virology, Mar 15; 346(2):373-378.

7) Gogvadze, E., Buzdin, A., Sverdlov, E. (2005) Multiple template switches during LINE directed reverse transcription is a general mechanism of the chimeric retroelement formation in mammals. Russian Journal of Bioorganic Chemistry, 3 l(l):82-89

8) Chalaya Т., Gogvadze E., Buzdin A., Kovalskaya E., Sverdlov E.D. (2004). Improving specificity of DNA hybridization-based methods. Nucleic Acids Res., 32(16):el30.

9) Buzdin, A., Gogvadze, E., Kovalskaya, E., Volchkov, P., Ustyugova, S., Illarionova, A., Fushan, A., Vinogradova, Т., Sverdlov, E. (2003) The human genome contains many types of chimeric retrogenes generated through in vivo RNA recombination. Nucleic Acids Res., 31(15):4385-4390.

10) Buzdin, A., Lebedev, Yu., Sverdlov, E. (2003) Human specific HERV-K LTRs in gene introns have a non-random orientation and, possibly, participate in antisense regulation of the gene expression. Russian Journal of Bioorganic Chemistry, 29(1): 103-106.

11) Buzdin, A., Ustyugova, S., Khodosevich, K., Mamedov, I., Lebedev, Y., Hunsmann, G., Sverdlov, E. (2003) Human-specific subfamilies of HERV-K (HML-2) long terminal repeats: three master genes were active simultaneously during branching of hominoid lineages. Genomics, 81(2):149-156.

12) Buzdin, A., Ustyugova, S., Gogvadze, E., Lebedev, Y., Hunsmann, G., Sverdlov, E. (2003) Genome-wide targeted search for human specific and polymorphic LI integrations. Human Genetics, 112(5-6):527-533.

13) Buzdin, A., Ustyugova, S., Gogvadze, E., Vinogradova, T., Lebedev, Y., Sverdlov, E. (2002) A new family of chimeric retrotranscripts formed by a full copy of U6 small nuclear RNA fused to the 3' terminus of LI. Genomics, 80(4):402-406.

14) Mamedov, I., Batrak, A., Buzdin, A., Arzumanyan, E., Lebedev, Y., Sverdlov, E. (2002) Genome-wide comparison of differences in the integration sites of interspersed repeats between closely related genomes. Nucleic Acids Res., 30(14):e71.

15) Buzdin, A., Revina, L., Kostina, L., Zalunin, I., Chestukhina, G. (2002) Interaction of 65- and 62-, kD proteins from the apical membranes of the Aedes aegypti larvae midgut epithelium with Cry4B and Cryl 1A endotoxins of Bacillus thuringiensis. Biochemistry (Moscow), 67(5):540-546.

16) Buzdin, A., Khodosevich, K., Mamedov, I., Vinogradova, T., Lebedev, Y., Hunsmann, G., Sverdlov, E. (2002) A technique for genome-wide identification of differences in the interspersed repeats integrations between closely related genomes and its application to detection of human-specific integrations of HERV-K LTRs. Genomics, 79(3):413-422.

17) Krieger, I., Revina, L., Kostina, L., Buzdin, A., Zalunin, I., Chestukhina, G., Stepanov, V. (1999) Membrane proteins of Aedes aegypti larvae bind toxins Cry4B and Cryl 1A of Bacillus thuringiensis ssp. israelensis. Biochemistry (Moscow), 64(10):1163-1168.

ОБЗОРНЫЕ СТАТЬИ:

18) A. Buzdin (2007) Human specific endogenous retroviruses. TheScientificWorldJournal, 7: 18481868.

19) Buzdin A, Gogvadze E, Lebrun MH. (2007) Chimeric retrogenes suggest a role for the nucleolus in LINE amplification. FEBS Lett., 581(16):2877-82. Epub 2007 May 25.

20) Buzdin, A. (2006) Transposable elements and their use for target site specific gene delivery. Current Pharmacogenomics, March; 4(1): 1-8.

21) Gogvadze, E., Buzdin, A. (2005) New mechanism of retrogene formation in mammalian genomes: in vivo recombination during RNA reverse transcription. Molecular Biology (Moscow), May-Jun;39(3):364-373.

22) Buzdin, A., Vinogradova, T., Lebedev, Y., Sverdlov, E. (2005) Genome-wide experimental identification and functional analysis of human specific retroelements. Cytogenet. Genome Res.; 110(1-4):468-474., in the special issue: "Retrotransposable elements and genome evolution"

23) Buzdin, A. (2004) Retroelements and formation of chimeric retrogenes. CMLS, Cell. Mol. Life Sci. 61(16):2046-2059

МОНОГРАФИИ, ГЛАВЫ В КНИГАХ:

24) Монография "Nucleic acids hybridization: modern applications". Редакторы: Anton Buzdin и Sergey Lukyanov, Springer (2007) ISBN 978-1-4020-6039-7.

25) Nucleic acids hybridization: potentials and limitations (Anton Buzdin)

глава в книге uNucleic acids hybridization: modern applications". Editors: Anton Buzdin and Sergey Lukyanov, Springer (2007) ISBN 978-1-4020-6039-7.

26) Selective suppression of polymerase chain reaction and its most popular applications (Sergey Lukyanov, Nadezhda Gurskaya, Ekaterina Bogdanova, Anton Buzdin).

глава в книге"Nucleic acids hybridization: modern applications". Editors: Anton Buzdin and Sergey Lukyanov, Springer (2007) ISBN 978-1-4020-6039-7.

27) Suppression subtractive hybridization (Sergey Lukyanov, Denis Rebrikov, Anton Buzdin). глава в книге "Nucleic acids hybridization: modern applications". Editors: Anton Buzdin and Sergey Lukyanov, Springer (2007) ISBN 978-1-4020-6039-7.

28) Stem-loop oligonucleotides as hybridization probes and their practical use in molecular biology and biomedicine (Anton Buzdin, Sergey Lukyanov).

глава в книге "Nucleic acids hybridization: modern applications". Editors: Anton Buzdin and Sergey Lukyanov, Springer (2007) ISBN 978-1 -4020-6039-7.

29) Coincidence cloning: robust technique for isolation of common sequences (Anton Buzdin).

глава в книге "Nucleic acids hybridization: modern applications". Editors: Anton Buzdin and Sergey Lukyanov, Springer (2007) ISBN 978-1-4020-6039-7.

30) DNA hybridization in solution for mutation detection (Anton Buzdin)

глава в книге "Nucleic acids hybridization: modern applications". Editors: Anton Buzdin and Sergey Lukyanov, Springer (2007) ISBN 978-1-4020-6039-7.

31) Current attempts to improve the specificity of nucleic acids hybridization (Anton Buzdin).

глава в книге "Nucleic acids hybridization: modern applications". Editors: Anton Buzdin and Sergey Lukyanov, Springer (2007) ISBN 978-1-4020-6039-7.