Бесплатный автореферат и диссертация по биологии на тему
Исследование влияния LINE1 элементов в интронах генов человека на их транскрипцию
ВАК РФ 03.00.03, Молекулярная биология

Автореферат диссертации по теме "Исследование влияния LINE1 элементов в интронах генов человека на их транскрипцию"

РОССИЙСКАЯ АКАДЕМИЯ

ииоиоооог

Институт биоорганической химии им. академиков М М. ШемЛшмя шЮ. А. Овчинникова

_ удIIГ 7ПП1

На правах рукописи

УСТЮГОВА СВЕТЛАНА ВИКТОРОВНА

ИССЛЕДОВАНИЕ ВЛИЯНИЯ ЬШЕ1 ЭЛЕМЕНТОВ В ИНТРОНАХ ГЕНОВ ЧЕЛОВЕКА НА ИХ ТРАНСКРИПЦИЮ

03.00.03 - Молекулярная биология

АВТОРЕФЕРАТ диссертации на соискание учёной степепи

кандидата биологических наук

Москва - 2007

003068587

Работа выполнена в лаборатории структуры и функции генов человека Института биоорганической химии им. академиков М.М. Шемякина и ЮЛ. Овчинникова РАН

Научный руководитель:

Доктор биологических наук Ю. Б Лебедев

Официальные оппоненты:

доктор биологических наук, профессор С. А. Лимборская доктор биологических наук, профессор Г. Е. Сулимова

Ведущая организация: Центр «Биоинженерия» РАН

Защита состоится " 25 " апреля 2007 г. в 10 часов на заседании Диссертационного совета Д.002.019.011 при Институте биоорганической химии им. академиков М.М. Шемякина и Ю.А. Овчинникова РАН по адресу: 117997, ГСП-7, г. Москва, В-437, ул. Миклухо-Маклая 16/10.

С текстом диссертации можно ознакомиться в библиотеке Института биоорганической химии им. академиков М.М. Шемякина и Ю.А Овчинникова РАН.

Автореферат разослан" 25

Учёный секретарь Диссертационного совета доктор химических наук

" марта 2007 г.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ. Актуальность проблемы.

Около 42% генома человека представлено ретроэлементами, т. е. мобильными элементами генома, увеличение числа копий которых происходит в процессе ретротранспозиции, включающей транскрипцию ДНК ретроэлемента, обратную траснкрипцию и встраивание кДНК копии в новое место генома. Одной из широко представленных в геноме человека групп ретроэлементов являются длинные диспергированные ядерные повторы LINE, и самый многочисленный класс среди них LINE1 илиЫ.

В ходе эволюции L1 элементы участвовали в изменении структуры и функционирования генома приматов разнообразными способами. Само по себе размножение L1 элементов является мощным фактором инсерционного мутагенеза. Более того, ретропозиционный аппарат L1 обеспечивает увеличение копий неавтономных ретроэлементов, например Alu и SVA повторов, и возникновение многочисленных псевдогенов. Большое число L1 повторов делает их мишенью для гомологичной рекомбинации, приводящей к делециям и инверсиям довольно протяжённых участков генома. В процессе, названном 3' Ll-трансдукцией, может происходить перенос геномной последовательности, фланкирующей 3' область L1. По расчетным оценкам фракция трансдуцированной ДНК в геноме человека составляет около 1%, что сравнимо с фракцией экзонов. Предварительный анализ опубликованного генома человека показал, что существенная часть инсерций L1 расположена в непосредственной близости от генов или в их интронах. В таких случаях фрагменты L1 последовательности могут служить дополнительным источником сплайс-сайтов, кодирующих последовательностей, сигналов полиаденилирования, или альтернативных промоторов

Среди L1 ретроэлементов есть несколько эволюционно молодых и, по-видимому, транскрипционно активных семейств, характеризующихся довольно высокой частотой инсерционного полиморфизма. Опубликованные данные о распространенности инсерционных полиморфизмов позволяют предполагать, что ретропозиция L1 ретроэлементов происходит и в наше время, внося существенный вклад в формирование вариабельности генома человека современного вида. Считается, что каждый 50-ый новорожденный имеет новую копию L1 элемента. Кроме того, известен ряд de novo инсерций L1, ассоциированных с отдельными генетическими заболеваниями человека.

Таким образом, изучение роли ретроэлементов, включая L1 повторы, в эволюции и функционировании генома приматов относится к числу наиболее важных проблем современной молекулярной биологии. Опубликованные данные о количестве, распределении

в геноме видоспецифических и полиморфных инсерций L1 и их возможном взаимодействии с генами получены либо с использованием биоинформатических подходов и методов анализа, либо на модельных объектах. В связи с этим проведение полногеномного поиска видоспецифических и полиморфных инсерций L1 ретроэлемента и исследование их влияния на экспрессию генов человека является актуальной задачей функциональной геномики

Пели и задачи работы.

Целью данной работы является изучение влияния полиморфных шпронных интеграции L1 на экспрессию генов человека.

Были поставлены следующие экспериментальные задачи:

- с использованием оригинальных экспериментальных подходов, а также методов биоинформационного анализа, провести полногеномный поиск видоспецифических и полиморфных интеграции L1 элементов и определить их локализацию относительно генов человека;

- на основе идентифицированных полиморфных интеграции L1 с интронной локализацией, сконструировать информативный набор генетических маркеров и провести генотипирование серии опухолевых клеточных линий различного тканевого происхождения;

- провести сравнительный анализ экспрессии аллельных пар генов человека в клеточных линиях, гетерозиготных по интронным инсерциям L1 элементов.

Научная новизна и практическая ценность.

В ходе данной работы впервые была доказана видоспецифичность ряда L1 инсерций, открыто 4 новых полиморфных инсерции L1 элементов и составлен каталог генов человека, содержащих в своих интронах полиморфные L1 инсерции.

Разработан оригинальный подход к изучению функционального влияния ретроэлементов на экспрессию генов человека, основанный на проведении сравнительного анализа транскрипционной активности аллельных вариантов генов в клетках, гетерозиготных по интронным инсерциям L1 элементов. Впервые показано, что инсерции L1 элементов в интрон гена in vivo способны приводить к значительному снижению уровня транскрипции L1-содержащего аллеля. Обнаружено, что выявленный ингибиторный эффект присущ лишь полноразмерным L1 элементам, а проявление эффекта имеет выраженный тканеспецифический характер.

Практическую ценность представляет уникальный набор молекулярно-генетических маркёров, созданный на основе 26 полиморфных интронных L1 инсерций. Предлагаемый набор ПЦР маркёров может быть широко использован для генотипирования

индивидуальных образцов ДНК человека, а также для тестирования генетической стабильности различных клеточных линий человека.

Результаты проведенного функционального анализа полиморфных инсерций 1Л элементов расширяют существующие представления о роли ретроэлементов в функционировании генома человека Полученные новые данные, разработанные методы и созданные молекулярно-генетические маркёры могут найти широкое применение при проведении как фундаментальных исследований в области функциональной геномики, так и медико-генетических исследований и тестирований практической направленности. Структура диссертации

Диссертация изложена на 80 листах машинописного текста и состоит из обзора литературы, результатов и их обсуждения, экспериментальной части, выводов, и списка цитируемой литературы, включающего 145 ссылок.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ.

Несмотря на возрастающее число гипотез о воздействии ретроэлементов на функционирование генома, вопрос о влиянии Ы на экспрессию, и в частности, на транскрипцию генов остаётся мало изученным. Объективную информацию о влиянии внедрения 1Л элемента на экспрессию гена может дать сравнение уровней экспрессии аллелей одного гена, отличающихся друг от друга интронной инсерцией ретроэлемента, в одной клетке и, поэтому, подвергающихся воздействию одинаковых внутренних и внешних факторов. Подходящей системой для проведения подобного сравнения является любая клеточная линия человека, гетерозиготная по интронной инсерции 1Л элемента. Для последующего сравнительного анализа экспрессии аллельных вариантов отдельных генов на первой стадии работы необходимо было идентифицировать полиморфные в геноме человека Ь1 инсерции и определить их генное окружение.

Поиск видоспецифических и полиморфных интеграции Ы элементов и определение их локализации относительно генов человека.

Идентификация эволюционно недавних интеграции Ы элементов и характеристика их геномного окружения.

На первом этапе настоящей работы проводили поиск интеграций Ы элементов, специфичных для генома человека, и анализировали их геномное окружение.

Специфичные для генома человека интеграции 1Л идентифицировали в процессе анализа полногеномной ранжированной клонотеки, обогащенной последовательностями,

фланкирующими специфичные для генома человека 1Л инсерции, как это представлено на Рисунке 1. Анализ клонотеки проводили с помощью дифференциальной гибридизации пар идентичных мембран, содержащих набор иммобилизованных фрагментов ДНК, с двумя гибридизационными зондами, представляющими собой полногеномные фракции фрагментов, фланкирующих Ы, из ДНК человека и шимпанзе. Дальнейший анализ дифференциально гибридизующихся клонов включал определение нуклеотидных последовательностей клонированных фрагментов ДНК и картирование их в геноме человека.

• О • О •

• • • О О

• ООО*

о о • о • о о • о о о о о о •

Определение последовательности вставок дифференциально гибридизующихся

клонов

Картирование полученных последовательностей Филогенетический анализ идентифицированных инсерций Ы Определение их локализации относительно генов

Рис. 1 Общая схема анализа ранжированной клонотеки, обогащенной геномными последовательностями, фланкирующими специфичные для генома человека интеграции 1Л элементов.

Видоспецифичность интеграций картированных Ы элементов подтверждали с помощью ПЦР амплификации ортологичных локусов геномной ДНК человека и шимпанзе, для чего были сконструированы праймеры, комплементарные фланкирующим 1Л последовательностям геномной ДНК человека. Наличие или отсутствие Ы в изучаемых локусах определяли по длине ПЦР продукта, соответствующего либо фрагменту ДНК, содержащего последовательность Ы и фланкирующие его участки ДНК, либо фрагменту

ДНК, содержащему только последовательности геномных фланков сайта интеграции. Стратегия ПЦР анализа 1Л содержащим ло кусов приведена на Рисунке 2а. Амплификацию локусов, содержащих полноразмерные и не ерш и 1Д, составляющие в длину около 6 ООО ¡1,0., проводили параллельно с двумя нарами праймеров: ¡) двумя уникальными, фланкирующими инсерцию, и) уникальным фланкирующим и специфичным к З'НТО консенсуоной последовательности 1ЛНа

(а)

ДНК

шимпанзе , ампликонВ ,

G-for,

G-rev

G-for

ДНК человека

ампликон А

Cl-for

(5-rev1

]

ампликон С ,

СГ"

(Ь)

1 2

1 2

3 4 М

II рай меры C-for/G-rev

П pa и меры Ll-for/G-rev

Рис. 2. а Стратегия ПЦР аЕ1ализа L! содержащих локусов. Черной жирной линией обозначены уникальные последовательности генома; прямоугольником обозначен L1 элемент. Жирными короткими стрелками отмечено положение ПЦР-и рай мер о в (G for и G rev, LI for). Буквы обозначают ПЦР ожидаемые продукты: А - при амплификации ДНК человека е праймерами G for и G rev, С - при амплификации ДНК человека с праймерами L1 for и G rev, В - при амплификации ДНК шимпанзе о праймерами G for и G rev. b. Эдектрофореграмма разделения продуктов ПЦР-амплиф икании локуса ДС022720, содержащего полноразмерный L1 элемент, и оргологичного локуса генома шимпанзе, с праймерами G-for и G-rev (левая часть) н Ll-for/G-rev (правая часть). Источник геномной ДНК, использованной В качестве магрицы, обозначен над соответствующими дорожками (1, 2 - индивидуальные образцы ДНК человека; 3, 4 - индивидуальные образцы ДНК шимпанзе), размеры фрагментов маркера указаны справа от электрофореграммы. Типы продуктов обозначены как на Рис 2а.

Как следует из примера ПЦР-анализа, приведенного на Рис.2Ь, обнаружение С ампликона из ДНК шимпанзе при одновременном обнаружении В (либо В и А) ампликона человека свидетельствует о видоспецифичности интеграции исследуемого Ы элемента. Подобный ПЦР-анализ был проведен для всех локусов, соответствующих дифференциально гибридизующимся клонам.

Табл1. Краткая характеристика некоторых специфичных для генома человека

№" GenBank" CLC Fd Le P* Генное окружение g

1 AL138764 10р13 LIHs 1324 + LOC221044,3', 3 т.п.о. MCM10,3', 6 т.п.0.

2 AL157765 13ql4.2 L1PA2 678 Nd

3 AL772307 9р12 LIHs 267 +

4 AJ271735 Xq28 LIHs 3211 Nd

5 АС020892 15q21.2 LIHs 2293 Nd DMXL2, i

6 АС022720 4q27 LIHs 6032 Nd

7 АС027296 3ql3 LIHs 836 Nd

8 АС121762 12q21.1 LIHs 6033 Nd

9 AL590032 10pl2.32 L1PA2 4387 Nd

10 АС093527 5q23.1 L1PA2 1232 Nd

11 АС023812 3p26.3 Ll-npeTa 1295 Nd TRNT1, i

12 АС079773 2q21.2 L1PA2 1047 Nd GPR39, i

13 AL139115 9p22.2 L1PA2 1087 Nd SH3GL2,1

14 АС074281 Xp22.31 L1PA2 276 Nd

15 АС108516 4q22.1 Ll-Ta 6155 + DHRS8, i

16 AL158058 14ql2 L1PA2 3369 Nd

17 AL162731 9pll.2 L1PA2 498 + AM27E1, 3', 10 т.п.0.

18 AL353751 10q23.31 L1PA2 302 Nd LIPA, i

с хромосомная локализация; " Семейство Ь1; ' Длина Ы, п.н.; ' Полиморфизм в человеческой популяции, «+» если обнаружен, N<1 - не определён. * Генное окружение инсерции Ы на протяжении 20 т.п.о в 3' и 5' фланкирующих областях. В столбце указано название гена, через запятую указано положение инсерции 1Л относительно гена: I - интронное положение инсерции, 3' -3' фланкирующая область гена, цифрами указано расстояние до инсерции в т.п.о.

В Таблице 1 представлена краткая характеристика 18 инсерций L1, специфичных для генома человека, найденных в результате анализа клонотеки. Специфичные для генома человека инсерции L1 имеют разную хромосомную локализацию и принадлежат к двум семействам: LIHs (от англ. human specific), то есть встречающееся только в геноме человека, и эволюционно более «старому» семейству - L1PA2, представители которого обнаружены и в геноме человека, и в геноме шимпанзе. Некоторые из проанализированных инсерций LIHs удалось более детально классифицировать либо как L1 - Та, либо как L1 пре-Та элементы. Большая часть L1 элементов в геноме человека представлена копиями L1, укороченными с 5' конца. Среди найденных нами специфичных для генома человека инсерций, лишь 19%

представляет собой иолноразмерные копии LI. Интересно отметить, что около 30% проанализированных инсерций L! лежат внутри нитронов различных генов. Из 18 идентифицированных в геноме человека инсерций L1 для четырех был показан инсерционньтй полиморфизм с помощью ПЦР анализа независимых образцов геномных ДНК отдельных индивидов.

Химерныйреюроэлемент U6-L1 Юр13.

В ходе анализа клонотеки, обогащенной фрагментами ДНК, фланкирующими инсерции L.1, специфичные для генома человека был обнаружен химерный элемент, названный U6-L1 1 Op 13 (в связи с его геномной локализацией). В структуру химерного элемента входит полноразмерная последовательность U6 мяРНК длиной 107 лн, идентичная последовательности гена UÓ мяРПК человека (RepBaseUpdate, hi lp://www. giv in st, о г g/serv er/Kc р Base/) и 3' концевая часть L1 элемента семейства LIHs в прямой ориентации длиной 1324 пн, за которой следует поди А последовательность.

С l^pPTTAAAA Г1 г, 1И Л)

: ;-JÍ 6>.rá* кл...I ! ; :>Л А

£рямон t07W повтор

1324 Ь|>

л ¿.V4 \ <v

гТ .¿У аУ -ЙГ i

///Ж'

5_б_М

—200Ü п.о. -1000 и.о. —500 п.о. -250 п.о.

Рис. 3. Схема строения химерного элемента U6-L! Шр13. Структурные элементы инсерции подписаны на рисунке. Даны длины псекдогена U6 3s концевой части Ц, входяших в состав химеры. Положение фланкирующих праймеров G for. G Rev показано стрелками, В нижней части рисунка приведена электрофореграмма разделения в агарозноы геле продуктов ПЦР амплификации индивидуальных образцов ДНК человека и шимпанзе. Длины продуктов, содержащих и несодержащих химерный элемент показаны в левой части рисунка Справа указаны длины фрагментов маркёра.

Химерный ретроэлемепт фланкирован прямыми повторами длиной 20 пн. Гексануклеотид ТТАААА, расположенный на 22 пн аьтше сайта интеграции U6-LI, идентичен последовательности ТТАААА, которую предпочтительно узнаёт эндонуклеаза L1, инициирующая интеграцию И копий я процессе ретротранспозиции. По-видимому,

образование этого элемента произошло в результате in vivo РНК-рекомбинации в ходе обратной транскрипции L1. Найденный элемент является членом целого семейства подобных химерных элементов. Дальнейшее изучение этого семейства проводилось студенткой кафедры молекулярной биологии биологического факультета МГУ Гогвадзе Е.В. и аспирантом ИБХ РАН Буздиным А.А., и выходит за рамки данной работы. В ходе ПЦР анализа ограниченной выборки образцов геномных ДНК человека (см. Рис 3) был выявлен инсерционный полиморфизм химерного элемента U6-L1 Юр 13.

Биоинформатический поиск полиморфных интеграции L1 элементов, расположенных в интронных областях генов человека.

С целью получения репрезентативной выборки интронных полиморфных инсерций L1 был продолжен поиск интеграции L1, с использованием стандартных наборов биоинформатических методов анализа. Был проведён анализ опубликованных данных об L1 инсерциях, полиморфных в человеческих популяциях, и выполнен полногеномный поиск полиморфных интеграций L1 элементов, лежащих в интронных областях генов человека, с помощью интернет-ресурсов расположенных на сайте Университета Калифорнии Санта Круз (http://genome.ucsc.edaO. базы полиморфных ретроэлементов человека flittp://falcon.roswellpark:.org:9090/). Результаты поиска суммированы в Таблице 2.

Таблица 2. Распространение L1 элементов в геноме человека.

Семейство ретроэлемента кол-во копий L1 в геноме человека* полиморфные L1** полиморфные L1 в интронах генов

LINE1 -516000 407 130

L1PA2 -12000 21 9

L1PA1(L1HS) -5000 240 87

* Оценочные количества копий L1 инсерций в геноме человека.

"""Количество L1 инсерций, для которых полиморфизм был экспериментально подтверждён.

Как видно из таблицы, полиморфные инсерции L1 элементов принадлежат к семействам L1PA2 и эволюционно наиболее молодому LlHs (L1PA1). Примерно треть, то есть 87 полиморфных L1 лежат в интронах, а ещё 10 L1 элементов - в экзонах генов, относящихся к разным функциональным группам (см. Таблицы 2 и 3). Нужно отметить, что, несмотря на то, что большая часть L1 инсерций представлена копиями, укороченными с 5' конца, примерно 40% интронных полиморфных инсерций представлены полноразмерными L1 ретроэлементами.

Чтобы ответить на вопрос, существует ли предрасположенность к интеграции полиморфных L1 в определённые геномные локусы, с помощью интернет-ресурса "GeneOntoIogy" ( http У/www.godatabase.org') был проведён анализ генов, содержащих

полиморфные интеграции Ы (Таблица 3). В результате была выявлена тенденция к предпочтительной локализации полиморфных Ы в генах, кодирующих белки, участвующие в межклеточной передаче сигнала и клеточную адгезию.

Таблица 3. Характеристика генов, содержащих полиморфные интронные вставки ЫНв.

Функциональная группа Число Число генов,

генов человека1 генов в группе содержащих полиморфную инсерцию L1

Клеточная адгезия 1006 8 0,8%2

Межклеточная передача 1224 13 1%

сигнала

Клеточный цикл и 4686 1 0,02%

пролиферация

Клеточная смерть 1398 3 0,2%

Организация клетки/биогенез 5491 3 0,05%

Метаболизм белков 11334 7 0,06%

Транскрипция 6851 3 0,04%

Метаболизм РНК 2190 1 0,05%

Другие метаболические 10699 6 0,06%

процессы

Транспорт 11722 11 0,09%

Процессы развития 10456 3 0,03%

Передача внутриклеточного 6320 3 0,05%

сигнала

Ответ на воздействие внешних раздражителей 5860 1 0,02%

Эндоцитоз 684 2 0,3%

'* разделение генов по функциональным группам дано в соответствии с данными виртуальной

базы данных Gene Ontology (www geneontology org) 2 относительное количество генов, содержащих L1 инсерции, в процентах

На момент проведения наших исследований база данных о геноме человека на сайте Университета Калифорнии Санта Круз, с использованием которой проводили определение геномного окружения полиморфных ретроэлементов, была недостаточно аннотирована, поэтому нам удалось определить интронную локализацию для 26 инсерций, полиморфизм которых был экспериментально подтверждён Нами был создан набор из 26 пар праймеров, комплементрных уникальным последовательностям, фланкирующим полиморфные L1 инсерции в геноме человека. В дальнейшем, этот набор праймеров был использован для генотипирования клеточных линий человека.

Таким образом, с помощью экспериментального и биоинформатического подходов были отобраны эволюционно молодые полиморфные инсерции L1, расположенные в интронах различных генов, для создания информативного набора генетических маркеров и

проведения генотипирования серии опухолевых клеточных линий различного тканевого происхождения.

Генотипирование серии опухолевых клеточных линий человека различного тканевого происхождения.

Полиморфные инсерции ретроэлементов обладают целым рядом преимуществ перед другими генетическими маркёрами. Поэтому они находят всё более широкое применение в популяционной генетике для определения генетических отношений между различными человеческими популяциями, в медико-генетических исследованиях и клинической диагностике. Наиболее актуален вопрос о создании информативных наборов генетических маркёров как простых и удобных тестов для генотипирования.

Одним из важнейших инструментов для биотехнологии и исследования функционирования живого организма являются линии клеток человека различного тканевого происхождения. Однако, в процессе создания и длительного культивирования во многих клеточных линиях происходят различные генетические перестройки, изменяющие регуляторные и биохимические процессы, а в некоторых случаях и фенотипические признаки этих клеток. Различные хромосомные аберрации, включая анеуплоидию, перестройки и делеции хромосомных локусов, характерны для генома культивируемых эукариотических клеток, особенно, если это клетки опухолевого происхождения. Таким образом, исследователю, работающему с клеточными линими необходимо отслеживать изменения структуры генома каждой из культур клеток и/или иметь стандартный тест для генотипирования линии клеток.

С целью генетического мониторинга клеточных линий мы разработали метод генотипирования индивидуальных образцов геномной ДНК, основанный на использовании полиморфных интронных инсерций ретроэлементов L1 и Alu. Метод состоит в одновременном проведении 38 локус-специфичных ПЦР, последующем анализе полученных результатов и создании паттерна распределения L1 и Alu инсерций по 38 локусам для каждой тестируемой клеточной линии. Для каждого локуса, содержащего полиморфную инсерцию ретроэлемента, была подобрана пара уникальных праймеров. С каждой парой праймеров проводили ПЦР амплификацию ДНК различных клеточных линий человека. Аллели, содержащие (РЭ+) и несодержащие (РЭ°) инсерцию ретроэлемента, различали по длине ПЦР продукта. Так как большая часть L1 элементов укорочена с 5' конца, то при амплификации локусов, содержащих короткие вставки L1, с праймерами G For/G Rev (Рис 4а.) получали оба типа ПЦР продукта в ходе одной реакции: более длинный ПЦР продукт, соответствующий L1-содержащему аллелю, и более короткий, соответствующий L1-несодержащему аллелю. Аналогично проводили амплификацию локусов, содержащих

полиморфные А1и ж серии и ПЦР амплификация АЗи содержащих покусан была проведена аспиранткой лаборатории сравнительной и функциональной геномики Амосовой А.А, В случае амплификации локусов, содержащих пол пораз мерные [Л или инсерции длиной более 1500 пар оснований, одновременное получение Ь! содержащих и 1.5 песо держащих ПЦР фрагментов оказалось проблематичным.

(а)

4(10 п.о,-300 п.о._ 200 п. о,-

■à ат:*

& 3

300 200

! сю в,ft.

40Û ir.rt. w -----

300 n.o.^j

200

400

200 "

-L1 + -L1-

-L1-

4—5:L1 +

H

___J

Ч-3'LH

Рис.4 Элеюрофореграмма продуктов ПЦР L1-содержащие локусов геиа AUTS2 (Рис. 4а) и гена RPIA (Рис. 4Ь). М-мэркёр ллия. L1 -продукт амплификации Ll-несодержащето ал пел я гена. L!-r, 3'LH^i'L] лродуАты эшлиф hxzujhu L J-содержащего аллеи гена.

В таких случаях образцы ДНК амплифи пировал и параллельно с тремя парами прайм еров: i) G for/O rev; ii) LI for/ О rev, где LI For комплементарен фрагменту 3' ¡¡^транслируемой области L1Ш элемента, и iii) G For/LI Rev, где L) Rev комплементарен фрагменту ретранслируемой области Ll-Ta (Рис 4Ь). Образование ПЦР фрагмента при амплификации ДНК" с парой праймеров G for/G rev говорит об отсутствии L i , а формирование ПЦР продуктов при амплификации ДНК с праймерами LI for/ G rev и G For/Ll Rev свидетельствует о присутствии инсерции L1 в анализируемом локусе, как в случае амплификации L1 содержащего локуеа гена RPIA из ДНК клеточных линий NGP-I27 и RMS-13 (Рис.4Ь)

Разработанный метод ¡снотилирования использован для тестирования опухолевых клеточных линий человека различного тканевого происхождения. Полученные результаты суммированы в Таблице 4 и демонстрируют индивидуальный, характерный для каждой клеточной линии набор аллельных сочетаний, что свидетельствует о высокой

информативности предлагаемого набора маркеров. Кроме того, предложенный метод является быстрым и удобным в использовании. Эти характеристики делают созданный набор ПЦР маркёров пригодным и универсальным как для тестирования генетической стабильности клеточных линии, часто используемых в лабораторных исследованиях, так и для ген оптирования ^ клинике и медицинской генетике.

Таблица ,4, Генотипы клеточных линий человека, полученные на основе присутствия/отсутствия И элемента в нитронах различных генов.

Ли кус РЭ* Клеточные .чин ни

Ген Гога-1 Тега-2 HL-6Ü OsA ttMS HeLa НЕ К 29.1 HTKISO Jutkal

FU21423 74II.ÎÏ LI - - - - - - - - - -

GRJN3a 9q3t.i AU - - - - - - - - 4-/- -

AK0960SS 154Х1.З LI - - + /- - 4-1- - - - -

RPIA 2р>1,2 LI - + /- ' "ТТЛ - - -

SPOCK3 4q32.3 LI - + /- + /- + /- + /- + 1- - - -

SMG1 LI - + /- - + /- +/- + /- - + /- + /.

BPGM 7q33 ALI - - - I!- + /- +/- - 4- + /~

fU2.'3SP Li - ■ Ш - - -

GRID!' A q 21.3 LI __ - - - + /- - . f - i

NF1 I7qll.2 ALl + /- + 1- +■ . 4щ- ■w- + 1- -

ABUM2 4pl6.1 ALI - ¿г. " + /- + + /- " ■¥ 4- + /- -

PCM1 SpI2 ALI +7- + /- + 1- + 1- ■"f. + /- ' . 4- , : + • 4- '

tVRCAAf 743i.( + /- wi + ' ■; 4- ■ + ■ +У-

HSDRS 4q22.1 LI +/- ш -Л ■ ¿'т . +/- 4-t- + 1- •h.-':'

LRP2 24З1.1 LI ... + 7 ' -; é-r- Ы- .+ + + /-

AUTS2 7qlM2 ALI *} '4 • ' + ■■ + /- 1 4- ■ 4-' "' +

EPH A3 îqll.l LI + /- ■ 4т. ' Ar : i ■ . 'f ■■■ + ■■ ■4- ■ 4

LRPIB 2322.2 ALl • ■ Р. ■ ; + i + !- : :. ■ ' 4- .

CBLB 3ql3 II ALI г * ■ Г". + ■ ■

CD38 4p 15.32 LI ■ ,+„ : ■ i.t'-J ' .. 4- . 4- , 4.

FBXL7 SplS.l ll -+ ' ' -f i- Ä' 4-, . ■ + * É

CGI-130 iq22.3t ALI .4' Й " + ■H ■

FU907S4 4q31.3 LI ■ 4-- ■ ■ 4- ■■ + .4 . л ■ . + h

CNTNS llqlï.l LI а, .■ • t—i'" + ■ ■■+:;■ + A- -. 4 v

GBE1 3p]2.2 ALI щ ■ 4 :■ + ■ - + r ■+ + +

ZMF4Q7 18q22.3 ALI ■ f& '4 ■ ■ . : ■ ■ 4- ■ L ■+

Обозначения: "+"- оба алле&Я Содержат LJ янсерцяю; "-" — оба влпе.тя не содержат L1 инссрцню; "+/", один из аллелей содержит L1 ннсериию.

* Символ Л.' обозначает относительно короткую инсерцию Та L1, которую идентифицировали с помощью ПЦР с одной парой праймеров G for/Q iev. Локусы, обозначенные символом "LI" амплифи пировали с двумя дополнительными парами праймеров: С for/LI rev и LI for/G rev (объяснения см. текст).

По результатам ген от и пировани я опухолевых клеточных линий были отобраны локусы, одновременно представленные L1-содержащим (LI4) и И-несодержащим (L1 ) аллелями генов как минимум в двух клеточных линиях, для дальнейшего определения уровни транскрипции аллелей генов.

Определение уровней транскрипции а.гчельных вариантов генов, содержащих полиморфные интролные ннсерции Ы.

Сравнительный анализ экспрессии Ы содержащего и I несо держащего аллелей отобранных генов мы проводили на уровне первичных транскриптов аллелей генов. Предложенный подход включает экстракцию гетерогенной ядерной РНК (гяРНК) из клеточных .яший, построение п^рвыл цепей гя-кДНК и ОТ-ПЦР анализ полученных иепеИ Для ОТ-ПЦР анализа использовали и рай меры, соответствующие интрощым последовательностям анализируемых локусов, что позволяет обнаружить именно первичные транскрипты Ы содержащего и 1Л пееодержащего аллелей генов и оцепить их относительное количество. Использование такого подхода даёт возможность ограничить число этапов экспрессии гена, на которых возможно влияние ХЛ, образованием первичных транскриптов и исключить из рассмотрения воздействие Ы на поздние стадии транскрипции гена и транспорт РНК из ядра в цитоплазму.

(а)

-Ы-¿ГЛ и.уф-

ОТ-ПЦР анализ

i

^S-rev

G-r.iL

—-Ц л! Д 1л чЬ-г

L1' ампликеп

(Ь)

G-foy

1

[

1,1-й^

м 1.1 -1лл 4>-

« «55

ПЦР ангшизЧ,

Да

l.l-rev

убт-п

Ll-rev

2rLl амлликгж

G-rcv

,,. .. C-rcv

1 ЕЛ амплняон

G-rev Li шшяяоп

ЛИК м и 11 .11] 3.1 яд .от н-<1

""S

t'nc.5. ОТ-ПЦР анализ содержания первичных Ы+ и Ll° транскриптов аллелей генов, а Схема анализа транскриптов генов, содержащих короткие инсерции 1,1 элементов. Положение и ориентация G-ior and G-rev прайм еров показаны стрелками, ДЬ! обозначает короткую инсерцию L1 элемента. Пустые треугольники обозначают прямые повторы, фланкирующий инсерцию. AAA обозначает полиА трек И элемента. Внизу схемы приведена электрофореграмма продуктов ОТ-ПЦР анализа транскриптов гена NF1 в клеточной линии Тега-1, Стрелками обозначено положение ампликонов, ДНК - позитивный контроль, М - маркер длин, числа обозначают количество циклоп реакции, Н;0 и -ОТ - негативные контроли, в которых вода и ГйРНК соответственно взяты в качестве матрицы в реакцию. Ь. Схема анализа транскриптов генов, содержащих длинные инсерции L1

элемента. L1 обозначает полноразмерную инсерцию L1 элемента. Позиции и ориентация праймеров G-for, G-rev, LI-rev и LI-for указаны стрелками. Ампликоны, соответствующие 5' (G-for/Ll-rev) и 3' (Ll-for/G-rev) фрагментам Ll+ аллеля обозначены буквами А и В, соответственно. Продукт ПЦР соответствующий L10 аллелю обозначен буквой С. Внизу схемы в качестве примера приведена элекгрофореграмма продуктов ОТ-ПЦР анализа транскриптов аллелей гена SMG1 в клеточной линии NGP-127. Обозначения аналогичны таковым на Рис. 5а.

Стратегия анализа уровня транскрипции аллельных вариантов генов включала параллельную амплификацию ДНК и гя-кДНК из одной клеточной линии с праймерами, соответствующими анализируемому генному локусу. Амплификацию ДНК локусов, содержащих укороченную копию L1, проводили с парой праймеров G-for/G-rev, соответствующих интронным последовательностям, фланкирующим участок интеграции L1. Ll+ и L10 ПЦР продукты различали по длине, соответствующей длине L1 инсерции (Рис. 5а) В случае анализа гя-кДНК аллелей генов, отличающихся инсерцией полноразмерного ретроэлемента L1, для каждого локуса параллельно амплификации с соответствующей парой интронных праймеров G-for/G-rev проводили две дополнительные реакции

Первая пара праймеров включает праймер, комплементарный З'НТО L1, и соответствующий интронный праймер G-rev; вторая - праймер, комплементарный 5'НТО L1 и G-for. С целью наблюдения за динамикой накопления ОТ-ПЦР продукта через каждые три цикла амплификации, начиная с 24, из реакционной смеси отбирали аликвоты для последующего анализа методом электофореза в агарозном геле (см. примеры на Рис.5). Результаты ОТ-ПЦР анализа суммированы в Таблице 5.

Основным критерием оценки относительного количества первичных транскриптов L1 содержащего и L1 несодержащего аллелей гена (или аллельной диспропорции) является сравнение количества циклов амплификации ДНК и гя-кДНК одной и той же клеточной линии необходимое для визуализации ПЦР продуктов соответствующих анализируемым аллелям. Если количество циклов ПЦР необходимое для визуализации ПЦР продукта обозначить символом N, то для каждого типа ПЦР продуктов N будет соответсвенно: 1) Na -количество циклов, необходимое для появления видимого ПЦР продукта "А" при амплификации гя-кДНК с праймерами - G for - LI rev; 2) Nb - необходимое для визуализации продукта "В"; 3) Nc - необходимое для визуализации продукта "С" (Рис. 5Ь).

Таблица 5, Уровень транскрипции LI+ и L10 аллелей генов.

Г'ем L1 ннсешшя Клеточные линииь

длина (ri.o.L op' ПЕК 293 Тега-1 HeLa I1L-60 11ТЮ80 Тега-2 Jurbt OSA RMS NGp-127

AUTS2 151 + >39/>39 >39>39

I.RP2 (ЮЭ2 - >39/-' >3 9/>39

CR1D2 6153 - >39 />39 >3 9/>3 >39!>39

DHSR8 6022 + >39/>3 >39/>39 >39/>39 >391>39 >39/>39 ----

FU2I269 BPGM 3569 + >3 9Г>3

374 + 39/39 11/27 30 /30 36/36

ABUM2 676 + >39/>3 >39/>39 3b/36

NF1 344 - 39/39 36/36 36 !36 33/33 3 9/39 33/33 36/36

РСМ1 841 - 33/33 30/30 30/30 36/36 30/30

SPOCK3 6012 - >3 9/>39 39/39 39/>39 39/>39 33/33 33/33

ЛК096055 3083 i >3 9/39

ЖСАМ 6028 + >39/39 ЯШ 39/39 temiv m

RPIA 3028 ■ тш/зо (33/33у no.

SMGI 5802 + {21 !2Tf ¡27 (33/33)" /30 (36/3(0 <30 (27/27)' /27 WWW <33/33V '3;j

1 Символы "+" and обозначают соответственно прямую и обратную ориентацию L1 элемента относительно направления транскрипции гена; 'г обозначает инверсию внутри L1 инсерции, соответствующую 30 80-3843 и.п. но консенсус ной последовательности LIHs (согласно RepeatMasker at hltpj Н flp.ficnome .wash ington ,edu/).

ь Цифры обозначают количество циклов, необходимое для получения видимого L1* (жирный шрифт) и 1Л°(курсив) ПЦР продукта. В случае наблюдаемой разницы и траскрипции аллелей, соответствующий локус помечен серым цветом. il>39 " обозначает отсутствие видимого ПЦР продукта после 39 циклов реакции.

1 Числа в скобках представляют собой количество циклов амплификации 5'- и 3'- фра г тентов L4 с парами праймеров Ll-rcv/G-for и Ll-for/G-rev соответственно (см. Рнс 5).

нтто

ДНК гя-кДНК

М 74 ¡T » J8 Ж И М 2i 71 3CI J3 3» -НТ гчО

L17L1' = 2И/2Л=1

L17LI =2 /2 = 8

Hela ДНК

гя-кДНК

— - *-■ - - 1111

— te* «•+ W " «м ш а» *>• • «>•• т- ж

-ií'if ^Ji

■М-С

■+В

L1/L1 =2/2 =1

Ll'/Ll* -217/2" =1

Рис. 6. Сравнение ДНК и гя-кДНК аыпликонов. На рисунке приведена злектрофорегрямма продуктов амплификации локуса гене $М01 из клеточной линии НТ1080 (и верхней части) и ЦеЬа (в нижней части). Ампликоиы А, В, С (см. Рис.5Ь) обозначены стрелками. Аллельная диспропорция Ы'/Ы0 для геномной ДНК и гя-хДНК приведены под элекфофорс граммам и. Остальные обозначения как на Рис.5,

Анализ соотношений Ыа/Нц/Ыс для геномной ДНК в гя-кДНК позволяет оценить степень аллеяьной диспропорции в клетках исследуемой линии. Чтобы оценить степень диспропорции мы рассчитывали отношение 2га/2", где т соответствует Кс, а п - Нл или Ыв. В качестве примера такого анализа на Рисунке б приведены электрофореграммы продуктов амплификации фрагмента гена ЗМС] из клеточных линий НТ1080 и НеЬа. При амплификации локуса ЗМ01 на матрице геномной ДНК НТ1080 соотношение МА/Кв/Мс представляет собой 30/30/30, то есть 230/230=1, а при амплификации этого локуса на гя-кДНК - 33/33/30, то есть 233/25П=8, следовательно, содержание 1Л+ транскрипта в клетках этой линии ниже, по сравнению с Ы° - аллелем. Результаты анализа аллеяьных диспропорций представленные в Таблице 6,

Таблица 6, Разница п содержании первичных гран скрипта в 1Л'и 1л° аллелей генои.

Ген Клеточная линия Соотношение количества циклов (Кл/Ив/Кс)1 ьГ/Мп ; ;

8МС! ИТ] 080 ДНК ■30/30/30 1 1

гя-кДНК ■33/33/30 . ......!

,1игка! ДНК 33/33/33 1 !

гя-кДНК 27/27/27 1 1

Д1)К. ЗШЗО/ЗО 1

гл-кД:)К 36/36/30 64

имэ ДНК 30/30/30 !

Ря-кДНК 33/33/30 8

ОкА ДНК 30/30/30 I

гя-кДНК 36/36/30 64

Тега-2 ДНК 27/27/27 1

; гя-кДНК 36/36/30 64

дшс 27/27/27 I

гя-:<ДНК 27/27/27 1

А'ДСШ ]ш'ка! ©НА 30/30/30 1

гя-кДНК 39/>39/33 64 -

ДНК 27/27/27 1

гя-кДНК 33/33/30 8 ■

КР1А ЯМ 5 ДНК 27/27/27 1

гя-кДНК 36/36/30 | 64

З^р ДНК, "27/27/27 ; 1

гя-кДНК 33/33/30 8

АК096055 0$А ДНК 1 27/27 1

а соотношение количества циклов реакции, необходимое для получения видимых ПЦР продуктов. Объяснение в тексте.

ь Соотношение количества аллелеИ объяснения в тексте.

е ЬГ ГЩР продукт (А иди В, Рис, 5Ъ) не был получен, В данном случае мы предполагаем, что количество соответствующего транскрип га настолько низко, что не может быть определено методом ОТ-ПЦР, и составляет менее, чем 1 транскрипт на клетку.

Как следует из данных, приведенных в Таблицах 5 и 6, уровень транскрипции Ы" аллелей, содержащих полноразмерны! и близкие к полноразмерным (>3000 п.н. ) 1А элементы, снижен на 1-2 порядка по сравнению с Ыс аллелем. Это явление характерно дай инсерпий, направление транскрипции которых совпадает с направлением транскрипции соответствующего гена. Единственная полноразмерныЙ элемент, транскрибирующийся в обратном направлении, не вызывает снижение уровня транскрипции соответствующею аллеля. Для статистически верной оценки явления количества проанализированных инсерпий недостаточно, но наши наблюдения не противоречат известным данным о том, что 1/1 инсерции к прямой ориентации реже встречаются в нитронах высоко экспрессируюшхся генов.

Наличие разницы в экспрессии 1Лти 1Л° аллелей каждого из генов зависит от типа клеточной линии. Кроме того, различные клеточные линии отличаются по числу выявленных

диспропорций в транскрипции аллельных пар. Так, в клеточных линиях NGp и RMS разница в уровне транскрипции аллелей была показана для 3-х генов, в OSA - для двух, а в Тега-2, НТ1080, и Jurkat только для одного гена. Возможно, некоторые клеточные факторы, специфичные для отдельного типа клеток, взаимодействуют с длинной L1 инсерцией, тем самым вызывая снижение уровня транскрипции соответствующего аллеля.

В процессе анализа экспрессии аллелей генов было показано, что количество транскрипта Ll+ аллеля гена SMG1 по отношению к количеству транскрипта L10 аллеля того же гена снижено в клеточных линиях NGP-127, NT2/D1, OsA, RMS-I3, тогда как в клеточных линиях HeLa и Jurkat количества 1Л+и L10 аллелей одинаковы. Для того чтобы выяснить, есть ли различия в структуре L1 элемента, лежащего в интроне гена SMG1 в геномах разных клеточных линий, была определена первичная структура L1 инсерции в этом локусе в геномах 4-х клеточных линий: HeLa, Jurkat, в которых содержание транскриптов аллелей гена одинаково, и OsA, NGP-127, в которых содержание транскрипта L14" аллеля снижено. В результате анализа полученных последовательностей никаких отличий в их структуре выявлено не было. Следовательно, различия в степени проявления ингибиторного эффекта L1, наблюдаемые в разных клеточных линиях, не связаны с возможными структурными мутациями исследуемого ретроэлемента.

Таким образом, по результатам сравнительного анализа содержания первичных транскриптов аллельных пар различных генов человека в ряде клеточных линий показано, что:

1) во всех случаях наблюдаемой разницы в уровне транскрипции аллелей генов, относительное количество транскрипта Ll+аллеля снижено;

2) разница в транскрипции аллелей наблюдается только для генов, несущих довольно протяжённую вставку L1 (3000-6000 п о.). Ll+ и L10 аллели генов с короткой инсерцией L1 (300-800 п.о.) транскрибируются на одинаковом уровне;

3) величина диспропорции в уровне транскрипции каждой из аллельных пар генов отличается в клеточных линиях различного тканевого происхождения.

В своей совокупности полученные данные убедительно свидетельствуют о наличии ингибиторного эффекта интронных инсерций полноразмерных Ll-Ta элементов на экспрессию генов человека. Более того, различная степень проявление эффекта в различных типах клеток предполагает явно выраженный тканеспецифический характер обнаруженного явления. Безусловно, для выяснения возможных механизмов взаимодействия L1 элементов с системами регуляции экспрессии генов человека требуется проведение целого ряда детальных функциональных исследований, основой которых могут стать новые данные и методические приемы, полученные в настоящей работе.

Полученные данные представляют интерес с точки зрения изучения аллельной экспрессии генов, не подвергающихся импринтингу. В последнее время накапливаются данные о существующей разнице в уровне экспрессии аллелей генов, не подвергающихся геномному импринтингу, и эта разница наследуется и имеет тканеспецифический характер. В литературе обсуждается гипотеза о существовании генетических элементов, взаимодействие которых с регуляторными системами гена приводит к наблюдаемой разнице в экспрессии аллелей. Анализ данных о транскрипции Ь1+ и 1Л° аллелей генов человека позволяет выдвинуть на роль генетических элементов, обеспечивающих «тонкую» регуляцию относительного уровня экспрессии аллелей генов, не подвергающихся импринтингу, интронные инсерции Ы элементов

выводы.

1) Проведен полномасштабный скрининг уникальных клонотек геномной ДНК человека, обогащенных участками видоспецифических инсерций Ы ретроэлементов Впервые выявлено 18 Ы инсерций, специфичных для генома человека, и охарактеризовано их генное окружение Для четырех из 18 вновь идентифицированных Ы элементов показано явление инсерционного полиморфизма.

2) Обнаружен и структурно охарактеризован новый химерный ретроэлемент, ограниченный короткими прямыми повторами, характерными для 1Л интеграции, и включающий 3'-концевой фрагмент Ы элемента.

3) Проведен исчерпывающий анализ геномных баз данных и составлен каталог полиморфных интеграции Ы элементов, локализованных в интронах известных и предсказанных генов человека. Создана серия новых генетических маркеров, включающая набор из 26 пар уникальных олигонуклеотидных праймеров, которые соответствуют участкам интеграции выявленных полиморфных интеграций Ь1.

4) Разработан оригинальный метод генотипирования клеточных линий, основанный на параллельной ПЦР амплификации 38 локусов генома человека, содержащих полиморфные интеграции ретроэлементов.

5) Предложен новый подход к изучению воздействия ретроэлементов на экспрессию генов человека. Проведен сравнительный анализ содержания первичных транскриптов пар аллельных вариантов генов в 10 клеточных линиях человека, гетерозиготных по 14-ти интронным инсерциям 1Л элементов. Показано, что интеграция Ы элемента снижает уровень транскрипции соответствующего аллеля гена примерно на 2 порядка. Обнаруженный ингибиторный эффект характеризует полноразмерные Ы элементы и имеет выраженный тканеспецифический характер.

Основные результаты диссертации изложены в следующих работах: Статьи:

Buzdin A., Ustyugova S., Gogvadze Е., Lebedev Y., Hunsmann G., Sverdlov E.D. (2003). Genome-wide targeted search for human specific and polymorphic LI integrations. Human Genetics, 112(5-6): 527-33.

Ustyugova S.V., Amosova A.L., Lebedev Y.B., Sverdlov E.D. (2005). Cell line fingerprinting using retroelement insertion polymorphism. BioTechniques, 38 (4): 561-565.

Устюгова C.B., Амосова A.JI., Лебедев Ю.Б., Свердлов Е.Д. (2006) Тканеспецифическое снижение уровня пре-мРНК L1- и Alu- содержащих аллелей генов человека. Биоорганическая Химия, Т. 32, No. 1: стр. 103-106

Ustyugova S.V., Lebedev Y.B., Sverdlov E.D. (2006) LI insertions in human gene introns specifically reduce the content of corresponding primary transcripts. Genetica, 128:261-272.

Buzdin A., Ustyugova S., Gogvadze E., Lebedev Y., Vinogradova Т., Sverdlov E. (2002). A new family of chimeric retrotranscripts formed by a full copy of U6 snRNA fused to the 3' terminus of LI.Genomics, 80(4): 402-406.

Buzdin A., Gogvadze E., Kovalskaya E., Volchkov P., Ustyugova S., IHarionova A., Fushan A., Vinogradova Т., Sverdlov E. (2003). The human genome contains many types of chimeric retrogenes generated through in vivo RNA recombination. Nucleic Acids Research, 31(15): 438590

Опубликованные тезисы конференций:

Устюгова C.B., Амосова А.Л., Лебедев Ю.Б., Свердлов Е.Д. Использование инсерционного полиморфизма ретроэлементов для генотипирования клеточных линий. ХУП зимняя международная молодёжная научная школа "Перспективные направления физико-химической биологии и биотехнологии", Москва, 7-10 февраля 2005 (тезисы докладов стр. 24)

Ustyugova S.V., Buzdin A.A., Gogvadze E.V., Amosova A.L., Lebedev Y.L.,Sverdlov E.D. Differences in LI integrations and their application to cell line genotyping. International Workshop on encoding information in DNA sequences. Okinawa, Japan, 21-27 February 2005 (abstracts p 38)

Устюгова C.B., Амосова А.Л., Лебедев Ю.Б., Свердлов Е.Д. LINEl-длиниые диспергированные повторы: распространение в геноме и возможное влияние на экспрессию генов человека. VIII чтения, посвященные памяти академика Ю.А.Овчинникова, Москва - Пущино, 25-27 октября 2006 (тезисы докладов стр 39)

Принято к исполнению 22/03/2007 Исполнено 23/03/2007

Заказ № 216 Тираж: 100 экз.

Типография «11-й ФОРМАТ» ИНН 7726330900 115230, Москва, Варшавское ш., 36 (495) 975-78-56 www.autoreferat.ru

Содержание диссертации, кандидата биологических наук, Устюгова, Светлана Викторовна

Список сокращений.

I. Введение.

II. ОБЗОР ЛИТЕРАТУРЫ. ТИПЫ РЕТРОЭЛЕМЕНТОВ И ИХ ВЗАИМОДЕЙСТВИЕ С ГЕНОМОМ ЧЕЛОВЕКА.

I. Основные типы ретроэлементов генома человека.

1. Длинные диспергированные ядерные повторы (LINE).

1.1. Класс LINE 1.

1.1.1. Структура.

1.1.2. Классификация и номенклатура.

1.1.3. Размножение LINE 1 в геноме человека в процессе эволюции. 12 1.1.3.1 .Транскрипция и посттранскрипционые модификации РНК LINE1.

1.1.3.2.Трансляция ORF1 и ORF2 и функции ORF1 р и ORF2p.

1.1.3.3.Обратная транскрипция и интеграция в геном. 19 1.1.3.4.0бразование инвертированных и 5' укороченных копий L элементов.

1.2. Классы LINE2, LINE3, HAL1.

2. Короткие диспергированные ядерные повторы (SINE).

2.1. Alu элементы.

2.1.1. Структура.

2.1.2. Номенклатура.

2.1.3. Размножение Alu в геноме человека в процессе эволюции.

2.2. MIR элементы.

3. Ретроэлементы, содержащие длинные концевые повторы.

3.1. LTR-ретротранспозоны - MaLR.

3.2. HERV - эндогенные ретровирусы человека.

3.2.1.1.Структура.

3.2.1.2.Номенклатура.

3.2.1.3.Размножение HERV в геноме человека в процессе эволюции.

4. Химерные элементы.

4.1. SINE-R.

4.2. SVA. 32 II. Взаимодействие ретроэлементов с геномом человека.

5. Белки, кодируемые ретроэлементами, участвуют в некоторых клеточных процессах.

6. Последовательности ретроэлементов входят в состав регуляторных областей различных генов человека

7. Фрагменты последовательности ретроэлементов могут входить в кодирующую последовательность генов человека.

8. Геномные перестройки, ассоциированные с транспозиционной активностью ретроэлементов.

8.1. Инсерциоиный мутагенез.

8.2. Размножение неавтономных ретроэлементов и образование процессированпых псевдогенов.

8.3. L1-опосредованная трансдукция.

8.4. Гомологичная рекомбинация.

8.5. Генная конверсия

9. Инактивация X хромосомы.

10. Способы регуляции активности ретроэлементов в клетке. 47 Заключение.

III. ЭКСПЕРИМЕНТАЛЬНАЯ ЧАСТЬ

Материалы

Методы

IV. РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ

1. Поиск видоспецифических и полиморфных интеграций L1 элементов и определение их локализации относительно генов человека.

2. Биоинформатический поиск полиморфных интеграций L1 элементов, расположенных в интронных областях генов человека.

3. Генотипирование серии опухолевых клеточных линий человека различного тканевого происхождения.

4. Определение уровней транскрипции аллельных вариантов генов, отличающихся полиморфными инсерциями ретроэлемента L1.

5. Создание набора рекомбинантных конструктов для функционального анализа интронных ретроэлементов в системе транзиентной экпрессии репортерного гена.

V. ВЫВОДЫ 94 СПИСОК ЛИТЕРАТУРЫ

СПИСОК СОКРАЩЕНИЙ млн - миллион(ы) н.т. - нуклеотид(ы) п.н. - пара нуклеотидов

ПЦР - полимеразная цепная реакция

ОРФ - открытая рамка считывания

ОТ-ПЦР - полимеразная цепная реакция с обратной транскриптазой т.н. - тысяча нуклеотидов т.п.н. - тысяча пар нуклеотидов

EN (Endonuclease) - эндонуклеаза;

ERV (Endogenous Retrovirus) - эндогенный ретровирус

HERV (Human Endogenous Retrovirus) - эндогенный ретровирус человека

LINE (Long Interspersed Element) - длинный диспергированный повтор

LTR (Long Terminal Repeat) - длинный концевой повтор

MIR (Mammalian Interspersed Repeat) - одно из семейств SINE

ORF (Open Reading Frame) - открытая рамка считывания

PBS (Primer Binding Site) - сайт связывания тРНК-затравки

RT (Reverse transcriptase) - обратная транскриптаза;

SINE (Short Interspersed Element) - короткий диспергированный повтор

TSD (Target Site Duplication) - дупликация сайта интеграции ретроэлемента

U5 (5'Unique) - 5'-специфичный район ретровирусной геномной РНК

U3 (3' Unique) - 3 '-специфичный район ретровирусной геномной РНК

5'UTR (5' UnTranslated Region) - 5' нетранслируемая область

3'UTR (3' UnTranslated Region) - 3' нетранслируемая область

Введение Диссертация по биологии, на тему "Исследование влияния LINE1 элементов в интронах генов человека на их транскрипцию"

Одной из фундаментальных задач молекулярной биологии является изучение регуляторных систем, определяющих транскрипционную активность различных генов. Как один из факторов, способных изменять регуляцию экспрессии генов, современная геномика рассматривает размножение в геноме мобильных элементов, в первую очередь ретропозонов. Внедрение мобильного элемента в последовательность гена может изменить его транскрипционную активность, в зависимости от структурных и функциональных особенностей элемента. Анализ данных, полученных в ходе работы по определению нуклеотидной последовательности генома человека, выявил тот факт, что около 42% генома человека представлено ретроэлементами и одной из наиболее широко представленных в геноме человека групп ретроэлементов являются длинные диспергированные ядерные повторы LINE, и самый многочисленный класс среди них LINE1 или L1 [1]. Среди L1 ретроэлементов есть несколько эволюционно молодых и, по-видимому, транскрипционно активных семейств, характеризующихся довольно высокой частотой инсерционного полиморфизма. Опубликованные данные о распространенности инсерционных полиморфизмов позволяют предполагать, что ретропозиция L1 ретроэлементов происходит и в наше время, внося существенный вклад в формирование вариабельности генома человека современного вида. Считается, что геном каждого 50-ого новорожденного имеет новую копию L1 элемента [2, 3]. Кроме того, известен ряд de novo инсерций L1, ассоциированных с отдельными генетическими заболеваниями человека [4].

Таким образом, изучение роли ретроэлементов, включая L1 повторы, в эволюции и функционировании генома приматов относится к числу наиболее важных проблем современной молекулярной биологии. Опубликованные данные о количестве, распределении в геноме видоспецифических и полиморфных инсерций L1 и их возможном взаимодействии с генами получепы либо с использованием биоинформатических подходов и методов анализа, либо па модельных объектах. В связи с этим проведение полногеномного поиска видоспецифических и полиморфных инсерций L1 ретроэлемента и исследование их влияния на экспрессию генов человека является актуальной задачей функциональной геномики.

Цели и задачи работы.

Целью данной работы является изучение влияния полиморфных интронных интеграций

L1 элементов на экспрессию генов человека.

Были поставлены следующие экспериментальные задачи:

- с использованием оригинальных экспериментальных подходов, а также методов биоинформационного анализа, провести полногеномный поиск видоспецифических и полиморфных интеграций L1 элементов и определить их локализацию относительно генов человека;

- на основе идентифицированных полиморфных интеграций L1 с интронной локализацией, сконструировать информативный набор генетических маркеров и провести генотипирование серии опухолевых клеточных линий различного тканевого происхождения;

- провести сравнительный анализ экспрессии аллельных пар генов человека в клеточных линиях, гетерозиготных по интронным инсерциям L1 элементов.

I. ОСНОВНЫЕ ТИПЫ РЕТРОЭЛЕМЕНТОВ ГЕНОМА ЧЕЛОВЕКА.

Ретроэлементы представляют собой мобильные элементы генома, увеличение числа копий которых происходит в процессе ретротранспозиции, включающей транскрипцию ДНК ретроэлемента, обратную траспкрипцию и встраивание кДНК копии в новое место генома. Ретроэлементы делятся на две группы: неавтономные и автономные ретроэлементы. Неавтономные ретроэлементы или ретропозоны не содержат гены, кодирующие ретропозиционный аппарат, и перемещаются по геному пассивно (к этой группе относятся короткие диспергированные повторы - SINE и процессировапные псевдогены). Автономные ретроэлементы или ретротранспозоны кодируют собственный ретропозиционный аппарат и перемещаются по геному активно (в эту группу входят длинные диспергированные ядерные элементы - LINE и ретроэлементы, содержащие длинные концевые повторы, - LTR-элементы). Представленность различных ретроэлементов в геноме человека показана в Таблице 1.

Таблица 1. Представленность ретроэлементов в геноме человека (цитируется по [1]).

Тип ретроэлемента Число копий в суммарная длина Число в геноме (в % от семейств хЮОО) сиквенированной части генома) (подсемейств)

SINEs 1,558 13,14

Alu 1,090 10,60 1(«20)

MIR 393 2,20 1(1)

MIR3 75 0,34 1(1)

LINEs 868 20,42

LIN EI 516 16,89 1(«55)

LINE2 315 3,22 1(2)

LINE3 37 0,31 1(2)

LTI^eMeHTbi 443 8,29

ERVioiaccl 112 2,89 72(132)

ERVioiacc2 8 0,31 10(20)

ERVioiacc3 83 1,44 21(42)

MaLR 240 3,65 1(31)

ДНК-элементы 294 2,84

Общее количество 44,83 повторов

Заключение Диссертация по теме "Молекулярная биология", Устюгова, Светлана Викторовна

выводы.

1) Проведен полномасштабный скрининг уникальных клонотек геномной ДНК человека, обогащенных участками видоспецифических инсерций L1 ретроэлементов. Впервые выявлено 18 L1 инсерций, специфичных для генома человека, и охарактеризовано их генное окружение. Для четырех из 18 вновь идентифицированных L1 элементов показано явление инсерционного полиморфизма.

2) Обнаружен и структурно охарактеризован новый химерный ретроэлемент, ограниченный короткими прямыми повторами, характерными для L1 интеграции, и включающий З'-концевой фрагмент L1 элемента.

3) Проведен исчерпывающий анализ геномных баз данных и составлен каталог полиморфных интеграций L1 элементов, локализованных в интронах известных и предсказанных генов человека. Создана серия новых генетических маркеров, включающая набор из 26 пар уникальных олигонуклеотидных праймеров, которые соответствуют участкам интеграции выявленных полиморфных интеграций L1.

4) Разработан оригинальный метод генотипирования клеточных линий, основанный на параллельной ПЦР амплификации 38 локусов генома человека, содержащих полиморфные интеграции ретроэлементов.

5) Предложен новый подход к изучению воздействия ретроэлементов на экспрессию генов человека. Проведен сравнительный анализ содержания первичных транскриптов пар аллельных вариантов генов в 10 клеточных линиях человека, гетерозиготных по 14-ти интронным инсерциям L1 элементов. Показано, что интеграция L1 элемента снижает уровень транскрипции соответствующего аллеля гена примерно на 2 порядка. Обнаруженный ингибиторный эффект характеризует полноразмерные L1 элементы и имеет выраженный тканеспецифический характер.

Библиография Диссертация по биологии, кандидата биологических наук, Устюгова, Светлана Викторовна, Москва

1. Lander, E.S., et al. (2001) Initial sequencing and analysis of the human genome. Nature. 409(6822): p. 860-921.

2. Ostertag, E.M., et al. (2002) A mouse model of human LI retrotransposition. Nat Genet. 32(4): p. 655-60.

3. Prak, E.T., et al. (2003) Tracking an embryonic LI retrotransposition event Proc Natl Acad Sci USA. 100(4): p. 1832-7.

4. Chen, J.M., Ferec, C., and Cooper, D.N. (2006) LINE-1 Endonuclease-Dependent Retrotranspositional Events Causing Human Genetic Disease: Mutation Detection Bias and Multiple Mechanisms of Target Gene Disruption. J Biomed Biotechnol. 2006(1): p. 56182.

5. Burton, F.H., et al. (1986) Conservation throughout mammalia and extensive protein-encoding capacity of the highly repeated DNA long interspersed sequence one. J Mol Biol. 187(2): p. 291-304.

6. Smit, A.F. (1996) The origin of interspersed repeats in the human genome. Curr Opin Genet Dev. 6(6): p. 743-8.

7. Scott, A.F., et al. (1987) Origin of the human LI elements: proposed progenitor genes deduced from a consensus DNA sequence. Genomics. 1(2): p. 113-25.

8. Smit, A.F., et al. (1995) Ancestral, mammalian-wide subfamilies of LINE-1 repetitive sequences. J Mol Biol. 246(3): p. 401-417.

9. Khan, H., Smit, A., and Boissinot, S. (2006) Molecular evolution and tempo of amplification of human LINE-1 retrotransposons since the origin of primates. Genome Res. 16(1): p. 78-87.

10. Goodier, J.L., et al. (2001) A novel active LI retrotransposon subfamily in the mouse. Genome Res. 11(10): p. 1677-85.

11. Mears, M.L. and Hutchison, C.A., 3rd. (2001) The evolution of modern lineages of mouse LI elements. JMolEvol. 52(1): p. 51-62.

12. Boissinot, S. and Furano, A.V. (2001) Adaptive evolution in LINE-1 retrotransposons. Mol Biol Evol. 18(12): p. 2186-94.

13. Skowronski, J. and Singer, M.F. (1986) The abundant LINE-1 family of repeated DNA sequences in mammals: genes and pseudogenes. Cold Spring Harb Symp Quant Biol. 51 Pt 1: p. 457-64.

14. Boissinot, S., Chevret, P., and Furano, A.V. (2000) LI (LINE-1) retrotransposon evolution and amplification in recent human history. Mol Biol Evol. 17(6): p. 915-28.

15. Myers, J.S., et al. (2002) A comprehensive analysis of recently integrated human Та LI elements. Am J Hum Genet. 71(2): p. 312-26.

16. Konkel, M.K., et al. (2007) Identification and characterization of novel polymorphic LINE-1 insertions through comparison of two human genome sequence assemblies. Gene. 390(1-2): p. 28-38.

17. Salem, A.H., et al. (2003) LINE-1 preTa elements in the human genome. J Mol Biol. 326(4): p. 1127-46.

18. Swergold, G.D. (1990) Identification, characterization, and cell specificity of a human LINE-1 promoter. Mol Cell Biol. 10(12): p. 6718-29.

19. Singer, M.F., et al. (1993) LINE-1: a human transposable element Gene. 135(1-2): p. 183-8.

20. Lavie, L., et al. (2004) The human LI promoter: variable transcription initiation sites and a major impact of upstream flanking sequence on promoter activity. Genome Res. 14(11): p. 2253-60.

21. Geiduschek, E.P. and Kassavetis, G.A. (2001) The RNA polymerase III transcription apparatus. J Mol Biol. 310(1): p. 1-26.

22. Kurose, K., et al. (1995) RNA polymerase III dependence of the human LI promoter and possible participation of the RNA polymerase II factor YY1 in the RNA polymerase III transcription system. Nucleic Acids Res. 23(18): p. 3704-9.

23. Weis, L. and Reinberg, D. (1992) Transcription by RNA polymerase II: initiator-directed formation of transcription-competent complexes. FasebJ. 6(14): p. 3300-9.

24. Minchiotti, G., Contursi, C., and Di Nocera, P.P. (1997) Multiple downstream promoter modules regulate the transcription of the Drosophila melanogaster I, Doc and F elements. J Mol Biol. 267(1): p. 37-46.25.