Бесплатный автореферат и диссертация по биологии на тему
Молекулярный анализ полной копии ретротрансозона репейник Drosophila melanogaster
ВАК РФ 03.00.03, Молекулярная биология

Текст научной работыДиссертация по биологии, кандидата биологических наук, Краснов, Алексей Николаевич, Москва

ЧР

п / о П 2

/ /С- /О ^

российская академия наук

институт молекулярной биологии им. в.а. энгельгардта лаборатория организации генома

На правах рукописи УДК 575.577

краснов алексей николаевич

МОЛЕКУЛЯРНЫЙ АНАЛИЗ ПОЛНОЙ КОПИИ РЕТРОТРАНСПОЗОНА РЕПЕЙНИК ОЯО ЗОРИНА МЕЫЫООАЗТШ

03.00.03 - молекулярная биология

Диссертация на соискание ученой степени кандидата биологических наук

Научный руководитель: доктор биологических наук, профессор Н.А. Чуриков

Москва - 1999

стр.

1. Введение. 5

2. Обзор литературы. 6

2.1. Общая характеристика и классификация мобильных элементов. 6

2.2. Молекулярная структура ретротранспозонов. 8

2.2.1. Общее строение. 8

2.2.2. Длинные концевые повторы. 10

2.2.3. Открытые рамки считывания. 12

2.2.4. 5' и 3' некодирующие регионы. 15

2.3. Перемещение ретротранспозонов в геноме. 16

2.3.1. Распределение ретротранспозонов по геному. 16

2.3.2. Механизм транспозиции. 17

2.3.3. Копийность ретротранспозонов. 21

2.3.4. Специфичность сайтов встраивания. 22

2.4. Транскрипция ретротранспозонов. 23

2.5. Взаимодействие ретротранспозонов с близлежащими генами. 26

2.6. Удлинение теломер у Drosophila melanogaster. 28

2.7. Структура и функциональные особенности рибосомных генов. 29

2.8. Копия ретротранспозонарепейник, обнаруженная в локусе cut. 31

3. Материалы и методы. 35

3.1. Объект исследования. 3 5

3.2. Бактериальные штаммы и плазмиды, использованные при 35 клонировании.

3.3. Ферменты и реактивы. 3 5

3.4. Бактериальные среды. 36

3.5. Молекулярно - биологические методы. 3 6

3.5.1. Выделение геномной ДНК. 36

3.5.2. Выделение тотальной РНК. 36

3.5.3. Гель-электрофорез ДНК. 3 7

3.5.4. Гель-электрофорез РНК. 37

3.5.5. Перенос ДНК на фильтр. 3 7

3.5.6. Электроэлюция ДНК из геля. 3 8

3.5.7. Введение радиоактивной метки в ДНК. 3 8

3.5.8. Southern гибридизация. 39

3.5.9. Обработка ДНК рестриктазами. 3 9

3.5.10. Лигирование ДНК. 39

3.5.11. Приготовление компетентных клеток. 3 9

3.5.12. Трансформация. 40

3.5.13. Щелочное выделение плазмидной ДНК. 40

3.5.14. Выделение фаговой ДНК. 41

3.5.15. PCR. 42

3.5.16. Скрининг фаговой библиотеки. 42

3.5.17. Гибридизация с колониями. 42

3.5.18. Рестриктное картирование. 43

3.5.19. Секвенирование. 43

3.5.20. Авторадиография, 44 3.6. Используемое программное обеспечение. 44

4. Результаты. 45

4.1. Геномный блот анализ репейника. 45

4.2. Клонирование разных копий репейника. 45

4.3. Нуклеотидная последовательность полной копии репейника. 46

4.4. Открытые рамки считывания полной копии репейника. 49

4.5. Сравнительный анализ различных копий репейника. 56

4.6. Начало транскрипции мобильного элемента репейник. 57

4.7. Места интеграции различных копий репейника. 58

5. Обсуждение. 63

5.1. Происхождение делегированных копий ретротранспозона 63 репейник.

5.2. Полная копия репейника может способствовать 63 перемещению делегированных копий.

5.3. Промоторная область репейника. 64

5.4. Специфичность мест интеграции репейника. 64

5.5. Интеграция репейника в рибосомные гены. 65

5.6. Эволюционное родство репейника. 66

6. Выводы. 68

7. Список литературы. 70

1. Введение.

Изучение мобильных элементов является важным направлением исследований в области молекулярной генетики и молекулярной эволюции. Доля генома, приходящаяся на мобильные элементы может составлять десятки процентов. Перемещения мобильных элементов могут вызывать мутации и приводить к нарушениям в различных функциональных последовательностях. В геноме дрозофилы мобильные элементы участвуют в сохранении целостности теломер, влияют на экспрессию близлежащих генов и могут принимать участие в 3 '-концевом созревании мРНК. Таким образом, мобильные элементы играют существенную роль в поддержании структурной целостности хромосом, в эволюции генома. Уникальные свойства мобильных элементов позволяет использовать их для решения многих задач биологии. Например, для конструирования векторов и для уточнения эволюционных взаимоотношений близкородственных видов.

Ранее был обнаружен и охарактеризован новый ретротранспозон дрозофилу репейник. Длина первой изученной копии репейника burO составляет 2.5 т.п.н, она содержит длинные концевые повторы длиной 275 п.н. и одну открытую рамку считывания. Открытая рамка считывания копии burO не содержит областей, кодирующих протеазу, ревертазу, РНКазу Н и интегразу, которые необходимы для транспозиций. Между тем наблюдались множественные инсерции данной копии мобильного элемента в локусе cut. Было сделано предположение, что в геноме могут быть полные копии этого ретротранспозона, содержащие все необходимые функциональные домены и обеспечивающие перемещения делегированных копий. Поэтому целью данной работы стало получение и молекулярный анализ полной копии ретротранспозона репейник.

2. Обзор литературы.

2.1. Общая характеристика и классификация мобильных элементов.

Впервые нестабильные, часто мутирующие генетические локусы были обнаружены в геноме кукурузы, многие линии которой проявляют пятнистость (мозаичность), вызванную соматическим мутациям. Основные закономерности этого явления были объяснены в работах Б. МакКлинток в 40-х годах. Она ввела понятие "контролирующие элементы" для обозначения способных к перемещению генетических структур, которые влияют на действие генов, располагаясь в их локусах. Исследования подобных элементов в середине 70-х годов вышли на новую ступень с появлением в молекулярной биологии и генетике принципиально новых методов. Мобильные элементы в геноме эукариот были открыты на молекулярном уровне в 1977 году независимо в лабораториях Георгиева и Гвоздева и в лаборатории Хогнесса. В дальнейшем этот тип элементов получил название "мобильные диспергированные гены" (мдг) и сор!а-Ике элементы, соответственно [2].

Мобильные генетические элементы составляют у ОгояорИПа те1апс^а$1ег до 20% всей геномной ДНК. Мобильный элемент можно определить как ген, имеющий следующие свойства:

1. Множественность: в геноме содержится большое число копий такого гена, рассеянных по разным участкам хромосом, как правило, по одиночной копии.

2. Экспрессия: такой ген может активно транскрибироваться, особенно в культуральных клетках.

3. Варьирующая локализация: расположение копии одного и того же мобильного элемента отличается у разных линий и даже у разных индивидуумов одной линии.

4. Транспозиция: самопроизвольное перемещение в геноме приводит к разнообразным мутациям.

Мобильные элементы дрозофилы можно подразделить по их структуре и механизму транспозиции на 2 класса [3]. Первый из них включает в себя элементы, использующие транспозицию на основе ДНК-структур (вырезание с последующей инсерцией). К данным мобильным элементам дрозофилы относятся Р-элемент, hobo и FB (foldback). Р и hobo элементы содержат короткие инвертированные повторы на концах и одну открытую рамку считывания, кодирующую транспозазу. Эта группа элементов называется транспозодами или ДНК-транспозонами. FB-элемент состоит из прилегающих друг к другу повторов, которые могут быть разделены неповторяющейся последовательностью ДНК. Длинные концевые повторы внешне напоминают сателлитную ДНК. Структура ^-концевых последовательностей необычна, поэтому непонятно, чем обусловлена их способность к транспозициям. Иногда две неидентичные копии /<В-элемента кооперируются и переносят большой сегмент ДНК, расположенный между ними [4].

Во второй класс входят мобильные генетические элементы дрозофилы, сходные по структуре с интегрированными ретровирусами позвоночных (провирусами), и способные перемещаться с помощью механизма обратной транскрипции. Эту группу элементов подразделяют на ретротранспозоны и ретропозоны [16]. Ретротранспозоны содержат на концах длинные концевые повторы - LTR (long terminal répit). Ретропозоны, не имеющие на концах LTR и содержащие на З'-конце поли-А последовательность, сходны с мобильными генетическими элементами млекопитающих типа Line. Несмотря на разную

структурную организацию, ретротранспозоны и ретропозоны имеют одинаковый механизм транспозиции.

2.2. Молекулярная структура ретротранспозонов. 2.2.1. Общее строение.

К настоящему моменту хорошо изучена структура примерно 15 семейств ретротранспозонов дрозофилы, большинство из которых первоначально были обнаружены у Drosophila melanogaster, а затем некоторые из них были найдены у других видов дрозофилы (D. virilis, D. subobscure, D. hydeï). Кроме того, секвенированы и подробно описаны два элемента, отсутствующие у D. melanogaster - Тот (D. ananossa) и Ulysses {D. virilis). В данное время секвенировано около 15 ретротранспозонов дрозофилы. Их основные характеристики приведены в таблице 1 [3]. Подобно ретровирусам позвоночных, ретротранспозоны дрозофилы содержат на концах длинные концевые повторы, которые менее консервативны, чем внутренние области. Копии каждого ретротранспозона несколько отличаются друг от друга по нуклеотидным последовательностям длинных концевых повторов и составляют семейства. Как и в ретровирусах, сразу за 5-LTR ретротранспозонов располагается сайт связывания гомологичной тРНК. Перед З'-LTR находится полипуриновый тракт. Внутренняя область элемента содержит открытые рамки считывания (open reading frame) - ORF. В секвенированных к настоящему моменту ретротранспозонах содержится одна (copia; micropia) [5, 6], две (mdgl, 412, 1731, Ulysses) [7-10] или три {gypsy, 297, 17.6, Тот) [10-12] открытых рамки считывания, которые обычно или слегка перекрываются, или разделяются стоп кодонами. Некоторые ретротранспозоны {412, mdgl) имеют 5' и/или З'-некодирующие области, которые могут содержать короткие рамки

считывания (бОШ7). Возможно, эти последовательности играют важную роль в регуляции экспрессии данных мобильных элементов [6]. Длинные концевые повторы ограничены небольшими инвертированными повторами, которые необходимы для нормального прохождения обратной транскрипции. Ретротранспозоны всегда фланкированы короткими прямыми повторами, образующимися в результате интеграции элемента в ДНК-мишень. Длина прямых повторов характерна для каждого семейства ретротранспозонов. Таблица 1.

Основные характеристики ретротранспозонов дрозофилы.

Общая Длина Инвертированные Длина прямых Сайт

Элемент длина LTR повторы повторов гомолог1

кЬ bp Ьр тРНК

17.6 7,4 512 AgTgaC GcaAtT 4 ser

297 7,0 415 AGTgAC tTtACT 4 ser

412 7,6 481 TGTAgT AtTACA 4 arg

1731 4,6 336 TGTTG CAACA 5 met

В104 8,7 429 TGTtcA TttACA 5

Beagle 7,3 266 AGTTA TAACT 4

blood 7,4 400 TGTAgTA TAtTACA 4 arg

copla 5,2 276 TGTTG CAACA 5 met

gypsy 7,5 479 AgTTA TAAtT 4 lys

mdgl 7,4 442 TGTAGT ACTACA 4 arg

mdg3 5,4 267 TgTAG CTAaA 4 leu

micropia 5,5 504 TGTCC CGACA 4 leu

torn 7,0 475 AGTG TACT 4 ser

Ulysses 10, б 2136 TGTT AACA 4 lys

2.2.2. Длинные концевые повторы.

Д линные концевые повторы ретротранспозонов заметно различаются по длине и структуре между семействами. Их длина от 250 Ьр до 600 Ьр. Необычно длинные LTR обнаружены в Ulysses (2100 pb) [14,15]. Для функциональной активности и способности к транспозиции данных мобильных элементов необходима абсолютная идентичность между двумя LTR одного ретротранспозона. В процессе обратной транскрипции РНК ретротранспозона содержит части одного из длинных концевых повторов на своем 5'-конце (так называемые R и U5 регионы), которые используются как матрицы для реконструкции обоих LTR. К наиболее консервативным регионам длинных концевых повторов относятся: последовательность промотора, сигнал полиаденилирования, а также короткие инвертированные повторы. Основные мотивы, обнаруженные в промоторной области ретротранспозонов дрозофилы, приведены в таблице 2.

Промоторная область эукариот состоит из дистального и проксимального элементов. Дистальный элемент расположен за несколько нуклеотидов до стартовой последовательности РНК и характеризуется как сайт связывания PHK-pol II и белковых факторов транскрипции. Проксимальный элемент играет роль энхансера или сайленсера. Основная особенность промоторной области эукариот - наличие ТАТА-бокса в дистальном элементе. Анализ промоторной области ретротранспозонов показал отсутствие TATA-бокс-подобных последовательностей и наличие последовательности TCAGT в районе инициации транскрипции для ряда ретротранспозонов дрозофилы (mdgl, mdg3, mdg4) [62].

Таблица 2.

Основные мотивы обнаруженные в промоториой области ретротранспозонов дрозофилы.

Ретротранспозон ТАТА 1пг Бсмпз1:геат е1етег±

лгсЗд! - АТАСАСГТА АСАС

412 - АТСАСАС АСАв

дур г у - СТСАСГТ АСАС

17.6 - ТТСАСГС АСАС

297 - ТТТАСГС ССУС

сорха - ссттсттв ССТС

1731 - АТСАСТТТ АСАС

тс1д 3 - СГСАСТС АСАС

Ретротранспозоны, очевидно,, не кодируют собственных транскрипционных факторов, а используют клеточную систему транскрипции РНК-ро1 Ц. Для некоторых из них выявлены и охарактеризованы клеточные регуляторные гены, которые кодируют активаторы или репрессоры транскрипции, связывающиеся с определенными регуляторными участками внутренней области мобильного элемента. Контролирующие последовательности в длинных концевых повторах, в которых начинается и заканчивается синтез РНК, охарактеризованы весьма слабо. Анализ промоторной области т<1%1 показал, что она содержит дистальный и проксимальный элементы, отвечающие, соответственно, за уровень синтеза РНК и за точность инициации транскрипции. Проксимальный элемент расположен непосредственно в районе точке инициации синтеза РНК. Для и mdg4 также характерно близкое расположение точки инициации

синтеза РНК и района, контролирующего инициацию, но в отличие от mdgl, дистальный промоторный элемент для них не обнаруживается. Расположение участков промотора, ответственных за правильную и точную инициацию транскрипции, в районе точки инициации синтеза РНК является весьма необычным для промотора РНК-pol II [7]. Среди ретротранспозонов дрозофилы, инициатор или кэп-сайт консенсус хорошо описан для mdgl, mdg3, mdg4, которые имеют общую последовательность рядом со стартовым сайтом РНК. В отличие от инициаторной области промотора, downstream-элемент имеет строго фиксированное расположение относительно стартового сайта РНК. Для ретротранспозонов дрозофилы это или CGTC

последовательности [3]. Некоторые ретротранспозоны дрозофилы содержат в LTR тандемные повторы, функция которых неизвестна (mdgl, 1731, micropià) [17].

2.2.3. Открытые рамки считывания.

Все ретротранспозоны могут быть разделены на три группы в соответствии со структурой их открытой рамки считывания [6]. ORF (open reading frame) занимают большую часть внутренней области мобильного элемента.

Первая группа ретротранспозонов содержит только одну ORF, кодирующую белок-предшественник, соответствующий gag (белки матрикса, капсида и нуклеокапсида) и pol (обратная транскрштгаза, интеграза и РНКаза Н) белковым продуктам ретровирусов. В данном случае, у ретротранспозонов задействован механизм контроля соотношения между gag и pol продуктами, поскольку последний необходим в значительно меньшем количестве, чем первый. Эту группу ретротранспозонов образуют элементы copia и micropia. В

случае copia, такая регуляция осуществляется за счет синтеза полной РНК, кодирующей gag-pol белок-предшественник и короткой сплайсированной РНК, кодирующей только продукты gag-последовательности [17,18].

Вторую группу ретротранспозонов дрозофилы составляют mdgl, 412, 1731, Ulysses [8, 9, 10]. Они содержат две слегка перекрывающиеся рамки считывания, кодирующие gag и pol продукты. В этом случае ORF2 экспрессируется за счет сдвига рамки считывания в процессе трансляции gag-продукта. Этот механизм также используется ретровирусами для управления соотношением количества gag и pol продуктов [ 22,23].

Третья группа ретротранспозонов содержит три ORF, кодирующие соответственно gag, pol и, возможно, еиу-подобные белки. Данную группу образуют gypsy, 297, 17.6 и torn [11, 7, 21, 14, 20]. Структура этих элементов наиболее похожа на ретровирусную [22, 23]. ORF1 ретротранспозонов важна для образования ретротранспозонами вирусоподобных частиц. Для вирусных gag-белков, несмотря на их весьма высокую дивергенцию можно найти общий мотив (Cys-X2-Cys-X4-His-.X4-Lys) соответствующий структуре "цинкового пальца" [24]. Однако в случае ретротранспозонов такой мотив был найден только для 1731, copia, micropia [5, 10, 6]. Попытки найти какую-либо, общую для всех ретротранспозонов, консенсусную последовательность оказались неудачными, несмотря на то, что многие ретротранспозоны содержат в этой области протяженные блоки локальной гомологии [12, 7]. Возможно, что такая гомология соответствует не функциональной значимости данной области, а только отражает наличие общего генетического предшественника данных ретротранспозонов.

Анализы последовательностей ретротранспозонов дрозофилы показали, что у большинства из них ORF2 экспрессируется посредством образования

gag-pol белка-предшественника, благодаря сдвигу рамки считывания на -1 позицию. Показано, что многие ретротранспозоны (mdgl, 412, gypsy, 17.6, 297) содержат в области перекрывания ORF1 и ORF2 мотив CAACN [8, 7]. Значение этой последовательности неясно, так как анализ области перекрывания, например в mdgl, не позволяет объяснить механизм сдвига рамки считывания с помощью существующих моделей. С другой стороны, в gypsy область перекрывания ORF1 и ORF2 имеет значительное сходство с таковой в ретровирусе ВИЧ, где сдвиг рамки считывания согласуется с основными моделями [19,