Бесплатный автореферат и диссертация по биологии на тему
Идентификация и картирование LTR на 19 хромосоме человека и анализ структуры локусов 19 хромосомы человека, содержащих LTR эндогенного ретровируса HERV-K
ВАК РФ 03.00.03, Молекулярная биология

Текст научной работыДиссертация по биологии, кандидата биологических наук, Лаврентьева, Ирина Валерьевна, Москва

РОССИЙСКАЯ АКАДЕМИЯ НАУК

Институт биоорганической химии им. М.М. Шемякина и Ю. А. Овчинникова

На правах рукописи

ЛАВРЕНТЬЕВА ИРИНА ВАЛЕРЬЕВНА

ИДЕНТИФИКАЦИЯ И КАРТИРОВАНИЕ Ш НА 19 ХРОМОСОМЕ ЧЕЛОВЕКА И АНАЛИЗ СТРУКТУРЫ ЛОКУСОВ 19 ХРОМОСОМЫ ЧЕЛОВЕКА, СОДЕРЖАЩИХ ЬТИ ЭНДОГЕННОГО РЕТРОВИРУСА НЕИУ-К

Специальность- 03.00.03 - Молекулярная биология

ДИССЕРТАЦИЯ

на соискание ученой степени кандидата биологических наук

Научный руководитель:

Кандидат химических наук Лебедев Ю.Б.

Москва-1999

СОДЕРЖАНИЕ

ВВЕДЕНИЕ 5

I. ИНТЕГРАЛЬНЫЕ КАРТЫ ХРОМОСОМ И ЛОКАЛИЗАЦИЯ ФУНКЦИОНАЛЬНЫХ ЭЛЕМЕНТОВ

В ГЕНОМЕ ЧЕЛОВЕКА. (ОБЗОР ЛИТЕРАТУРЫ) 7

1. ПРИНЦИПЫ И МЕТОДИЧЕСКИЕ ПОДХОДЫ

К СОЗДАНИЮ КАРТ ХРОМОСОМ ЧЕЛОВЕКА 10

1.1 ГЕНЕТИЧЕСКИЕ КАРТЫ 12

1.2. ФИЗИЧЕСКИЕ КАРТЫ 16

1.3. ТРАНСКРИПЦИОННЫЕ КАРТЫ 18

2. МАРКЕРЫ, ИСПОЛЬЗУЕМЫЕ ДЛЯ

ПОСТРОЕНИЯ КАРТ 21

2.1. МЕТОДЫ ПОЛУЧЕНИЯ STS И EST МАРКЕРОВ 23

мРНК как источник EST 23

гяРНК как источник EST 24

2.2. МЕТОДЫ КАРТИРОВАНИЯ STS/EST 27

Рестриктные карты 28

FISH-гибридизация 30

3. ГЕНОМНЫЕ КЛОНОТЕКИ.

ПОСТРОЕНИЕ КОНТИГОВ 31

3.1. ИСПОЛЬЗОВАНИЕ ХРОМОСОМНОЙ

МИКРОДИССЕКЦИИ 31

3.2. КЛОНОТЕКИ ГЕНОМА НА ОСНОВЕ YAC 33

3.3. КОСМИДНЫЕ КЛОНОТЕКИ ГЕНОМА 37

3.4. РАДИАЦИОННО-ГИБРИДНОЕ КАРТИРОВАНИЕ 40

3.5. КАРТА 19-Й ХРОМОСОМЫ ЧЕЛОВЕКА 42

4. ЭНДОГЕННЫЕ РЕТРОВИРУСЫ В СОСТАВЕ ГЕНОМА 46

4.1. СТРУКТУРА ЭНДОГЕННЫХ РЕТРОВИРУСОВ

И ИХ КЛАССИФИКАЦИЯ 47

4.2. ТРАНСКРИПЦИОННАЯ АКТИВНОСТЬ

ЭНДОГЕННЫХ РЕТРОВИРУСОВ 49

II. ЭКСПЕРЕМЕНТАЛЬНАЯ ЧАСТЬ 54

1. МАТЕРИАЛЫ 54

2. МЕТОДЫ 59

III. РЕЗУЛЬТАТЫ И ИХ ОБСУЖДЕНИЕ 71

1. Картирование последовательности, гомологичной длинному концевому повтору эндогенного ретровируса. 71

2. Отбор космид, содержащих полноразмерные LTR. 73

3. Картирование LTR на космидах с точностью до

EcoRI фрагмента, гибридизацией по методу Саузерна. 76

4. Локализация изучаемых LTR относительно

известных картированных генов или кДНК. 90

5. Определение первичной структуры картированных LTR. 94

ВЫВОДЫ 108

СПИСОК ЛИТЕРАТУРЫ 110

з

СПИСОК СОКРАЩЕНИЙ.

LTR (long terminal repeat) - длинный концевой повтор

HERV (Human Endogenous Retrovirus) - эндогенный ретровирус человека

PCR - полимеразная цепная реакция

RFLP - полиморфизм длин рестрикционных фрагментов

PFGE - электрофорез в пульсирующем электрическом поле

FISH - флуоресцентная гибридизация in situ

YAC - искусственные хромосомы дрожжей

RH - радиационные гибриды

STS - sequence tagged site

EST - expressed sequence tag

kb - килобаза

Mb - мегобаза

п.о. - пар оснований

т.п.н. - тысяч пар нуклеотидов

ОЕ - оптических единиц

ДНК - дезоксирибонуютеиновая кислота

РНК - рибонуклеиновая кислота

мРНК - матричная РНК

к ДНК - ДНК копия мРНК

гяРНК - гетерогенно-ядерная РНК

гякДНК - гетерогенно-ядерная кДНК

Трис/TRIZMA base - трис/оксиметил/аминометан

SSC - sodium chloride/sodium citrate buffer

ЭДТА - этилендиаминотетраацетат

SDS - sodium dodecyl sulfate

ПЭГ - полиэтиденгликоль

ПААГ - полиакриламидный гель

ТЕМЕД - Ы^К^К'-тетраметилэтилендиамин

BSA - бычий сывороточный альбумин

dNTP - 2'-дезоксирибонуклеозидтрифосфат

ddNTP - 2',3'-дидезоксирибонуклеозид-5'-трифосфат

ВВЕДЕНИЕ.

Настоящая работа является частью исследований, проводимых в лаборатории Структуры и Функций Генов Человека по структурно-функциональному изучению областей 19-й хромосомы человека, содержащей длинные концевые повторы (long terminal repeat - LTR) эндогенного ретровируса человека HERV-K.

Эндогенные ретровирусы и ретровирусоподобные элементы были обнаружены в геномах млекопитающих, включая приматов и человека. Эндогенные ретровирусы человека представляют собой геномные последовательности, сходные по структуре с ДНК-копиями геномов ретровирусов и передающиеся по наследству как стабильные менделевские признаки. Существует более десятка различных семейств эндогенных ретровирусов человека (HERV - Human Endogenous Retrovirus), представленных в геноме человека от одной до десятков тысяч копий и встречающихся практически на всех человеческих хромосомах. Большое число элементов HERV в геноме человека объясняется интеграцией экзогенных ретровирусов в ДНК зародышевых клеток и последующей ретротранспозицией вирусного генома в новые локусы. В целом до 1% генома человека занимают ретровирусы и ретровирусподобные последовательности. Обилие таких элементов и их консервативность, привели к появлению многочисленных предположений об их функциональном значении. Так, например, неоднократно высказывались предположения об участии эндогенных ретровирусов в регуляции экспрессии клеточных генов, существуют также некоторые экспериментальные данные, подтверждающие такие предположения. [Feuchter et al., 1992, Suzuki et al., 1990, Ting et al., 1992].

Одно из наиболее многочисленных семейств - HERV-K -представлено в геноме не только ретровирусподобными элементами, но и

значительно большим количеством одиночных длинных концевых повторов (ЬТЯ). Количество НЕЯУ-К ЬТ11 оценивается до 25 ООО копий на гаплоидный геном. Наличие в структуре ЬТИ целой группы регуляторных элементов, таких как энхансер, промотор, участок связывания кортикоидных гормонов, сигнал полиаденилирования, позволяет предполагать потенциальную способность ЬТЯ модулировать активности генов, в локусах которых они оказались расположены.

Точное картирование ретровирусных элементов могло бы позволить провести анализ их возможных взаимодействий с близлежащими генами, дать более глубокое понимание их роли в эволюции генома. Тем не менее, до настоящего времени не проводилось систематического картирования НЕЯУ элементов на отдельных хромосомах человека. Молекулярные механизмы участия НЕЯУ ЬТЯ в регуляции активности близлежащих генов остаются мало изученными.

I. ИНТЕГРАЛЬНЫЕ КАРТЫ ХРОМОСОМ И ЛОКАЛИЗАЦИЯ ФУНКЦИОНАЛЬНЫХ ЭЛЕМЕНТОВ В ГЕНОМЕ ЧЕЛОВЕКА.

ОБЗОР ЛИТЕРАТУРЫ

Гаплоидный геном человека состоит из 3,5x1п.о. [Bodmer, 1981] и представлен 23 хромосомами. Для него, как и для других эукариотических организмов, характерно не только наличие кодирующих последовательностей, но и нуклеотидных последовательностей, не кодирующих белки. Это нетранслируемые внутригенные последовательности - интроны, регуляторные последовательности, участвующие в транскрипции, репликации, различные семейства повторов (например: семейство Alu-повторов, сателитная ДНК и т.д.).

Общее число генов в геноме человека оценивается на уровне 50.000-100.000 [Antequera and Bird, 1994; Nowak, 1994]. К январю 1998 с помощью различных методов было идентифицировано и картировано около 8.000 генов человека [http:// www.gene.ucl.acuk/ hugol. Их нуклеотидные последовательности были занесены в международную базу данных. Значит, мы имеем достоверные представления лишь о восьми процентах генов человека.

Идентификация генов в геноме, определение положений генов на хромосомах и установление их функций, является главной целью проекта "Геном Человека". Конечная цель проекта -получение полной структурной информации о геноме, о позиции любого гена с помощью сопоставления его генетической, физической и транскрипционной карт. Таким образом, основной задачей проекта "Геном Человека" в настоящее время является создание детальной интегральной карты генома и отдельных хромосом.

К середине 80-х годов бурное развитие молекулярной биологии и генетики человека сделало возможным появление проекта "Геном Человека". Были разработаны методы изучения генов человека, которые и легли в основу этого проекта.

В области молекулярной биологии это были методы быстрого определения первичной структуры ДНК [Sanger et al., 1977], полимеразной цепной реакции (PCR) [Saiki et al., 1988], клонирования протяженных (до нескольких Mb) участков чужеродной ДНК в векторах нового типа, например в искусственных хромосомах дрожжей (YAC) [Burke et al., 1987], разделения больших фрагментов ДНК электрофорезом в пульсирующем электрическом поле (PFGE) [Schwartz and Cantor, 1984].

В области генетики человека были разработаны методы локализации генов с помощью анализа сонаследования признаков с анонимными ДНК-маркерами. Анализ протяженных участков генома по полиморфизму длин рестрикционных фрагментов. (RFLP) оказался настолько удачным, что позволил к 1987 г. получить первую карту генома человека [Donis-Koler, 1987].

Каждая карта требует своей собственной системы координат или системы маркеров. Еще не так давно картирование и клонирование генов человека, связанных с развитием заболеваний было почти невозможно, т.к. маркеров до начала 80-х годов на хромосомах человека было крайне мало. Доступность таких маркеров и появление новых методов молекулярной генетики в настоящее время позволяет картировать и клонировать гены, связанные с развитием многих болезней человека, изучать продукты этих генов и их функционирование. В результате появляется знание о функционировании генома человека в норме и патологии, понимание причин развития заболеваний на молекулярном

уровне, создаются средства диагностики таких заболеваний и, в перспективе, средства их профилактики и лечения.

К маркерам, необходимым для построения карт относят три основные категории: сами гены, анонимные фрагменты ДНК и т.н. STS и EST маркеры. Анонимные маркеры (D-сегменты) - это фрагменты ДНК, локализованные на генетической карте. Для создания маркера не требуется выяснение функции этого фрагмента, необходимо только наличие надежного метода его идентификации, информация о том, с какими другими маркерами он сцеплен и возможно большая гетерозиготность соответствующих локусов в популяции. STS (sequence tagged site) маркер представляет собой пару олигонуклеотидных праймеров, обеспечивающих специфическую амплификацию единственного участка генома с известным положением на хромосоме. Если уникальная последовательность является транскрибирующейся последовательностью, то она называется EST (expressed sequence tag). Всех их используют как в генетическом, так и в физическом картировании генома.

1. ПРИНЦИПЫ И МЕТОДИЧЕСКИЕ ПОДХОДЫ К СОЗДАНИЮ КАРТ ХРОМОСОМ ЧЕЛОВЕКА.

Впервые ген был отнесен к определенной хромосоме в 1911 г., когда E.B.Wilson на основании анализа родословных смог отнести ген дальтонизма к Х-хромосоме.

В последующем, по мере открытия новых генов, встала задача определения не только их хромосомной локализации, но и порядка расположения на хромосоме и расстояния между ними. Такие данные являются первым шагом в изучении не отдельных генов, а всего генома в целом. Решение этой задачи стало возможно после открытия явления генетической рекомбинации. Появилась возможность построения генетических карт.

Генетические карты состоят из последовательности генетических маркеров, упорядоченных на основе взаимных частот рекомбинации. Генетические карты несут информацию о взаимной локализации генных локусов, порядке их расположения и относительных расстояниях между ними. Единицей измерения расстояний при генетическом картировании является один сантиморган (сМ), т.е. такое расстояние, при котором вероятность рекомбинации между генами равна 1%. Наиболее существенным недостатком генетических карт является их неаддитивность (т.к. в разных районах генома рекомбинация происходит с разной частотой) и, кроме того, построение генетических карт человека усложняется невозможностью проводить необходимые скрещивания.

Поэтому для успешного картирования необходимы методы быстрого и надежного анализа большего числа генотипов и/или большого числа клонированных фрагментов генома по большему числу признаков. Таким образом, встает задача построения физических карт генома или его участков, которые в отличие от генетических дают

абсолютные расстояния между генетическими элементами, и позволяют локализовать функционально важные участки генома. Единица измерения расстояний на физических картах - число пар нуклеотидов (bp, п.о.).

Для карт любого типа необходимо иметь набор хорошо охарактеризованных маркеров, перекрывающих весь геном или исследуемую область генома с определенной частотой. Расстановка маркеров с высокой плотностью на карте генома, на расстоянии в среднем около 0.1 сМ или 100 т.п.н., необходима для возможности быстрого перехода от одних методов анализа к другим при поиске генов, в частности от анализа генетического сцепления к физическому картированию и, впоследствии, к секвенированию изучаемых районов.

В качестве маркеров можно использовать либо сами гены, либо охарактеризованные каким-либо образом фрагменты ДНК. Вообще говоря, любая характерная особенность того или иного участка генома, отличающая его от любого другого участка, может быть использована в качестве маркера. Это могут быть сайты узнавания рестриктаз, транскрибирующиеся последовательности, регуляторные элементы и тому подобное. В конечном счете, сама последовательность данного участка ДНК является маркером. Одним из важнейших требований к физическим маркерам является их уникальность, т.е. из числа возможных маркеров должны быть устранены повторяющиеся последовательности. Картированные маркеры дают точки отсчета для локализации любых структурных и/или функциональных последовательностей генома.

Получение различного рода маркеров было существенно упрощено благодаря развитию методов, использующих полимеразную цепную реакцию (PCR). PCR позволяет амплифицировать специфические молекулы ДНК in vitro посредством циклического ферментативного синтеза ДНК. Метод PCR позволяет на ДНК-матрице синтезировать

любой заданный фрагмент ДНК, размеры которого определяются специфичной, комплементарной к матрице парой коротких (около 20 нуклеотидов) синтетических "прайм еров". Это позволяет амплифицировать каждый такой фрагмент в миллиард раз, оставляя при этом остальною часть генома в исходной концентрации [Saiki et al., 1985; Saikietal., 1988].

1.1 ГЕНЕТИЧЕСКИЕ КАРТЫ.

Хотя со времен Моргана методы генетического картирования совершенствовались, но основной принцип оставался неизменным. Карты генетического сцепления строят, основываясь на частоте совместной передачи потомству двух или нескольких признаков -генетических маркеров, различных у отца и матери и приписываемых определенному участку хромосомы.

Ранее в качестве маркеров использовали только гены, экспрессия которых обнаруживалась по их эффекту. Успехи бурно развивающихся молекулярной биологии и молекулярной генетики привели к созданию новых многочисленных маркеров, первыми из которых, в том числе и на хромосомах человека, стали маркеры типа RFLP (полиморфизм длин рестрикционных фрагментов) [Botstein et al. 1980].

RFLP (полиморфизм длин рестрикционных фрагментов) основан на том, что изменения последовательности ДНК, вызываемые различными причинами, могут обуславливать изменения в расположении сайтов рестрикции и значит сказываются на длине рестриктных фрагментов. Это может нарушать биологическую функцию, а может и не иметь никаких биологических последствий; в любом случае измененные локусы наследуются в соответствии с законами Менделя. Эти различия можно определить даже в сложных геномах методом Southern-гибридизации [Southern, 1975]. В 1987 году была опубликована первая карта генома

человека, основанная на "полиморфизме длин рестриктных фрагментов" [Donis-Koler, 1987].

Открытие PCR позволило создать новый класс генетических маркеров, которые обладают высокой вероятностью существования в альтернативных формах в различных образцах генома человека. Эти маркеры основаны на присутствии между парой праймеров короткого (ди-, три-, тетра- ) тандемного повтора нуютеотидов (STR - short tandem repeats) - микросателлитах, которые широко распространены в геноме человека. Особенно частый мотив - это (CA)n- [Weber and May, 1989; Litt and Luty, 1989]. Число мономерных звеньев повтора, присутствующего в одном и том же локусе, может варьировать в индивидуальных гомологичных хромосомах, что позволяет различать их между собой по разнице в длине PCR-продуктов, получаемых от одной и той же пары праймеров. Микросателиты обычно мультиаллельны и поэтому представляют собой высокоинформативные генетические маркеры, гетерозиготность которых очень высока (часто более 70%). В настоящее время микросателлитная ДНК является одним из наиболее широко используемых источников STS [Weber, 1990; Weber and May, 1991; Edwards, 1991; Backmann, 1992; Cohen et al., 1993].

Повторы длиннее микросателлитов, называемые минисателлитами, тоже могут быть использованы в качестве маркеров, хотя они являются менее общими и, следовательно, не так удобны для изучения. Примером таких маркеров могут служить VNTR (variable number of tandem repeat) [Nakamura et al., 1987].

В последнее время, благодаря бурно развивающимся методам секвенирования, стало возможным появление SNP (single nucleotide polymorphisms) - маркеров. SNP - самый часто встречаемый вид полиморфизма, проявляющийся в виде точечных замен, делеций или вставок одного нуклеотида [Cavalli-Sforza, 1998].

Другой возможностью построения генетических карт является "позиционное клонирование" генов. [Collins, 1992]. Позиционное клонирование - это стратегия, созданная в 1980х г.г., для того, чтобы позволить определить биологическую основу многих наследуемых болезней, анализ которых невозможен традиционны