Бесплатный автореферат и диссертация по биологии на тему
Организация и хромосомная локализация повторяющихся последовательностей ДНК у обыкновенных полевок рода Microtus
ВАК РФ 03.00.15, Генетика

Автореферат диссертации по теме "Организация и хромосомная локализация повторяющихся последовательностей ДНК у обыкновенных полевок рода Microtus"

со £

^ На правах рукописи

УДК 576.316.2: 577.213.2: 599.323.4

ЕЛИСАФЕНКО Евгений Анатольевич

ОРГАНИЗАЦИЯ И ХРОМОСОМНАЯ ЛОКАЛИЗАЦИЯ ПОВТОРЯЮЩИХСЯ ПОСЛЕДОВАТЕЛЬНОСТЕЙ ДНК У ОБЫКНОВЕННЫХ ПОЛЕВОК РОДА МЮЯОТив

Генетика 03.00.15

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата биологических наук

Новосибирск 1998

Работа выполнена в Институте цитологии и генетики СО РАН г.Новосибирск

Научный руководитель:

доктор биологических наук С.М.Закиян Институт цитологии и генетики СО РАН г.Новосибирск

Официальные оппоненты:

доктор биологических наук, Стегний Владимир Николаевич, Институт биологии и биофизики Томского государственного университета, г. Томск

кандидат биологических наук, Ромащенко Аида Герасимовна, Институт цитологии и генетики СО РАН, г.Новосибирск

Ведущее учреждение: Институт биологии гена, г. Москва

Защита состоится а !Ч" 1998 г. на Ч-^&Щ-и^

заседании диссертационного совета по защите диссертаций на соискание ученой степени доктора наук (Д-002.11.01) в Институте цитологии и генетики СО РАН в конференц-зале Института по адресу: 630090, г.Новосибирск-90, проспект академика Лаврентьева, 10.

С диссертацией можно ознакомиться в библиотеке Института цитологии и генетики СО РАН.

Автореферат разослан "// " 1998 г.

Ученый секретарь диссертационного совета доктор биологических наук

Д.Груздев

Актуальность проблемы. Гетерохроматин (ГХ) составляет существенную часть генома высших эукариот. У некоторых видов на его долю приходится до 80% всей ядерной ДНК. В составе ГХ обнаружены разного рода повторяющиеся последовательности и мобильные элементы различной копийности, степени сложности и организации. Для прицентромерного гетерохроматина показано его участие в процессе расхождения сестринских хроматид. Получены экспериментальные свидетельства связывания ГХ с различными белками (РМа е1 а1., 1990). Однако, многие вопросы, связанные со структурой и функцией ГХ, пока остаются без ответа. Помочь ответить на них, возможно, поможет прямое изучение его структуры. Особенно плодотворным, на наш взгляд, будет сравнительное исследование групп близкородственных видов, у которых процесс появления и развития блоков ГХ, по всей видимости, шел разными путями. В качестве модели для изучения мы выбрали четыре вида обыкновенных полевок рода МюгоЮз.

Интерес к этой группе полевок вызван особенностями расположения и размерами блоков гетерохроматина на половых хромосомах (Магигок е1 а1., 1994, 1995, 1996а, Ь). Если у М.гоззюетепб'юпаИз гетерохроматин занимает приблизительно половину Х-хромосомы и расположен в теломерном районе, то у МАгапвсазр/сиз и М.Мгд'юогит блоки гетерохроматина на Х-хромосо-мах меньше по размеру и находятся в прицентромерном районе. На Х-хромосоме М.ап/аНз не удается выявить даже прицентромерный гетерохроматин.

Исследование молекулярной структуры ГХ у обыкновенных полевок поможет ответить на многие вопросы, связанные с его возникновением, структурой и функцией, в общем. Кроме того, исследование повторяющихся последовательностей ДНК, составляющих основную часть гетерохроматина, интересно само по себе в связи с появляющимися данными о их возможных функциях в геноме и изучение таких последовательностей в геномах полевок рода Мюго^в может дать дополнительную информацию для понимания их роли.

Целью данного исследования является поиск и изучение гетерохроматин- и Х-специфических повторов ДНК у обыкновенных полевок рода МюгоШ.

Конкретными задачами данного исследования были: 1) выделение и клонирование гетерохроматин- и Х-специфических повторов ДНК у полевок группы "ап/аИэ" рода МютЮв] 2) анализ распределения и локализации полученных последовательностей в геномах полевок; 3) определение нуклеотидной последовательности выделенных клонов; 4) контекстный анализ клонированных повторов;

5) сравнительный анализ с другими повторяющимися последовательностями ДНК из баз данных.

Научная новизна. Из геномной ДНК вида M.rossiaemeridionalis выделены и охарактеризованы две повторяющиеся нуклеотидные последовательности условно обозначенные MS3 и MS4, содержащие различные диспергированные мобильные элементы. Выявлена уникальная кластерная локализация повтора MS4 на половых хромосомах у четырех видов обыкновенных полевок рода Microtus: M.rossiaemeridionalis, M.transcaspicus, M.kirgisorum и M.arvalis, преимущественно в гетерохроматиновых районах. Последовательность MS3 также преимущественно локализуется кластерно на половых хромосомах, но у M.kirgisorum и M.arvalis сигнал гибридизации детектируется на аутосомах. Определена полная нуклеотидная последовательность MS3 и MS4 и проведен их компьютерный анализ.

Практическая ценность. Полученные в работе результаты имеют теоретическое значение для дальнейшего изучения организации геномов млекопитающих в общем и гетерохроматина в частности, а также для понимания роли и функций повторяющихся последовательностей ДНК. Нуклеотидные последовательности исследованных повторов зарегистрированы в банке данных EMBL Data Library (регистрационный номер в EMBL банке Z95706 и Z86096)

Апробация работы. Материалы диссертации были представлены на международной конференции памяти академика Д.К.Беляева (Новосибирск, 1997 г.)

Публикации. По теме диссертации опубликовано три работы.

Структура и объем работы. Диссертация включает следующие разделы: введение; обзор литературы; материалы и методы; результаты и их обсуждение; заключение; выводы; список литературы (196 ссылок). Работа изложена на 122 страницах, включая 24 рисунка и 1 таблицу.

МАТЕРИАЛЫ И МЕТОДЫ.

В работе использовали четыре вида полевок рода Microtus: M.arvalis, M.rossiaemeridionalis, M.kirgisorum, M.transcaspicus. Геномная ДНК исследуемых видов полевок была выделена из печени фенольно-детергентным методом.

В качестве векторов использовали плазмиды pUC128 или pUC19 и фаг NM1149. Последний растили для селекции на клетках NM514, а для наработки ДНК - на'К802. Для трансформации в клетки

2

XL1 BlueMRF применяли методику Ханахана (Hanahan et al., 1983). Все микробиологические работы, приготовление упаковочных экстрактов и упаковку ДНК в фаговые частицы проводили по стандартным методикам (Maniatis et al., 1983).

Рестрикцию, лигирование, элюирование ДНК проводили по общепринятым методикам. Мечение ДНК выполняли методом ник-трансляции с использованием -р32-дезоксинуклеозидтрифосфатов фирмы "Amersham". Фаговые бляшки для скрининга переносили на нитроцеллюлозные фильтры "Hybond-C", а ДНК из агарозных гелей для блот-гибридизаций - на найлоновые "Hybond-N" той же фирмы. Гибридизации с фильтрами также выполняли по стандартным методикам (Maniatis et al., 1983) при температуре 63°С.

Секвенирование одноцепочечных матриц выполняли по методу, описанному у Иннеса (Innés et al., 1988), с некоторыми модификациями. Для секвенирования протяженных фрагментов ДНК получали набор клонов с использованием направленных делеций по методу Хеникоффа (Henikoff et al., 1984).

Компьютерный анализ последовательности проводился с помощью пакетов программ BLAST (Altschul et al., 1990), FASTA (Pearson et al., 1988), CONTEXT (Solovyev et al., 1992), Vostorg (Zharkikh et al., 1991), CLUSTAL (Higgins et al., 1988). Поиск гомологичных последовательностей проводился по Базам данных нуклеотидных последовательностей на BLAST-сервере NCBI NIH (USA).

РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ.

Для выделения гетерохроматин- и Х-специфических последовательностей ДНК M.rossiaemeridionalis использовали подход, основанный на том, что у исследуемых близкородственных видов обыкновенных полевок рода Microtus отличия на цитологическом уровне, связанные с наличием или отсутствием блока гетерохроматина на Х-хромосоме, находят свое отражение и на молекулярном. При электрофорезе EcoRI- гидролизатов геномных ДНК и последующем окрашивании бромистым этидием у трех видов M.rossiaemeridionalis, M.transcaspicus и M.kirgisorum, имеющих гетерохроматиновый блок, видны избыточные полосы, отсутствующие у M.a'rvalis (рис.10). Предполагалось, что эти полосы с большой долей вероятности содержат гетерохроматинспецифи-ческие фрагменты ДНК. У исследуемого вида наиболее яркие полосы находятся в районе 1.2, 1.8, 2.2, 3.5, 4.2 т.п.н. С целью дальнейшего изучения и характеристики гетерохроматина более

з

перспективным является исследование высокомолекулярных фрагментов ДНК. В этой связи была получена миниклонотека из полос 2.1, 3.5 и 4.2 т.П:Н. ДНК M.rossiaemeridionalis, гидролизованную рестриктазой EcoR1, фракционировали в 1% агарозе, соответствующие полосы вырезали из геля, элюировали из них фрагменты ДНК и встраивали в фаговый вектор NM1149. Предварительный отбор клонов, содержащих повторяющиеся последовательности, проводили по результатам скрининга миниклонотеки а-Р32-меченной геномной ДНК M.rossiaemeridionalis с удельной активностью 106 cpm/мкг/мин. Всего было получено около 70 таких клонов. Методом перекрестной гибридизации на основании гомологии рекомбинантные фаги были разбиты на группы. Из нескольких таких групп гомологичных клонов случайным образом было отбрано и изучено по одному представителю, условно обозначенные нами как: MS3, MS4, MS5, MS6, MS43. MS5 оказался перестроеным фрагментом LINE и локализуется на хромосомах дисперсно (неопубликованные данные). Секвенирование и гибридизация in situ показали, что MS6 является тандемно организованным повтором с прицентромерной локализацией. Его мономерная единица длиной 47 п.н. гомологична другому тандемному повтору обыкновенных полевок - STR47 (Храпов и др., 1998). MS43 - диспергированный повтор, имеющий сложную организацию и содержащий SINE, MaLR-элементы и микросателлиты (неопубликованные данные). В данной работе более подробно исследуются два наиболее интересные с точки зрения хромосомной локализации последовательности - MS3 и MS4 из полос EcoRI-гидролизата геномной ДНК в районе 3.5 и 4.2 т.п.н. соответственно.

Гибридизационный анализ.

На рис.1А приведены результаты Саузерн блот-гибридизации повтора MS4 с EcoRI-гидролизатами геномных ДНК исследуемых видов обыкновенных полевок рода Microtus (количество гидролизованной геномной ДНК каждого вида, нанесенное на дорожку, одинаково). Зонд MS4 с M.rossiaemeridionalis, M.transcaspicus и M.kirgisorum дает наиболее интенсивную полосу гибридизации в области 4100 п.н., соответствующей размеру клонированного фрагмента. Кроме основной, наблюдается и ряд минорных полос с картиной распределения, отличающейся у разных видов, причем у самца M.transcaspicus число и интенсивность полос больше, чем у самки. Единственная слабая полоса, отсутствующая

4

у остальных видов, выявляется при гибридизации МЭ4 с М.ап/аНз.

Фильтр, который использовался для гибридизациии с МЭ4, был отмыт и повторно гибридизован с зондом М£53 (рис.1 В). Характер гибридизации повтора МБЗ отличается от М34. Наблюдается полоса гибридизации с М.гоэз/'аетегШюпаНз в районе 3.3 кЬ, соответствующей размеру клонированного фрагмента, однако она не является самой интенсивной. Наиболее мощный сигнал гибридизации локализуется в районе 2.2 т.п.н и 1.2 т.п.н. Детектируется также и целый ряд минорных полос. Значительно слабее сигналы гибридизации с остальными тремя видами обыкновенных полевок.

В

MS41 2 3 4 5 6 7 8

kb

12.29.25.14.13.12.01.61.0-

MS3 12 3 4 5 6 7 8

kb

12.29.25.1-

4.13.1-»

2.01.61.0-

Л

Рис1. Саузерн блот гибридизация MS4 (A) and MS3 (В) повтора cEcoRI-гидролизатами геномных ДНК обыкновенных полевок. М jossiaemeridionalis, самец (1) и самка (2); M.transcaspicus, самец (3) и самка (4); M.arvalis, самец (5) и самка (6); M.kirgisorum, самец (7) и самка (8); MS4 и MS3 соответствуют MS4 и MS3 фрагментам клонироанным в плазмиде pUC128.

Единственная слабая полоса детектируется при гибридизации с M.arvalis в районе 4.1 т.п.н. Эта полоса имеется у всех четырех видов. Ряд полос примерно одинаковой интенсивности наблюдается у M.transcaspicus. Некоторые из них совпадают, а некоторые нет, с сигналами гибридизации у других исследуемых видов. В целом можно сказать, что каждый из четырех видов обыкновенных полевок

имеет свою индивидуальную картину гибридизации с повтором MS3.

Локализацию повторов MS3 и MS4 на метафазных хромосомах исследуемых видов проводили методом FISH. MS3 локализуется на половых хромосомах у обыкновенных полевок за исключением вида M.arvalis, который имеет сигнал только на одной паре аутосом. У M.rossiaemeridionalis повтор локализуется на всем гетерохроматиновом блоке Х-хромосомы, занимающем почти половину хромосомы. На Y-хромосоме сигнал гибридизации присутствует как в теломерном, так и центромерном районах, а также интенсивным и узким бэндом в средней части хромосомы, ближе к теломерному району.

У M.transcaspicus он также гибридизуется практически со всем блоком гетерохроматина на Х-хромосоме, а на Y он локализуется ближе к теломере, занимая треть хромосомы за исключением самой теломеры.

У M.kirgisorum повтор MS3 локализуется двумя полосами в прицентромерном гетерохроматине Х-хромосом и в гетерохроматине теломерных районов Y-хромосом. Кроме того, присутствует одиночный сигнал на 13-ой паре аутосом в районе q2.2.

У полевки M.arvalis, не имеющей блока гетерохроматина на X-хромосоме, сигналов гибридизации на половых хромосомах не выявлено. Однако, одиночный сигнал присутствует на 1-ой паре аутосом в районе q2.2.

Необходимо заметить, что 13-ая пара аутосом полевки M.kirgisorum по G-диффиренциальной исчерченности соответствует q-плечу 1-ой пары аутосом полевки M.arvalis. Причем сигнал гибридизации повтора MS3 локализуется в гомологичных районах хромосом 13 и 1. Эта область соответствует району q2.2.

MS4-noBTop, в отличии от MS3, локализуется исключительно в половых хромосомах у всех четырех исследуемых видов. Он занимает почти весь гетерохроматический район на Х-хромосоме M.rossiaemeridionalis. На Y-хромосоме имеется сильный сигнал гибридизации в теломере и узком перицентромерном бэнде, а также неяркую но широкую полосу гибридизации в центральном районе. У других видов MS4 значительно меньше. Две полосы гибридизации наблюдаются в перицентромерном гетерохроматческом блоке X-хромосомы M.kirgisorum, а на Y он локализуется почти по всей длине хромосомы.

Для M.transcaspicus показана его локализация на средней и центромерной частях Y-хромосомы и в виде тонкого бэнда рядом с блоком гетерохроматина Х-хромосомы.

б

У M.arvalis он маркирует гетерохроматин на мелкой Y-хромосоме. На Х-хромосоме он детектируется точечными сигналами, сравнимыми по интенсивности с уникальными последовательностями.

Гибридизация с усилением показала также локализацию MS4 в эухроматиновых районах Х-хромосом M.rossiaemeridionalis и M.kirgisorum.

Сравнительный анализ этих данных с использованием G-бэндинга высокого разрешения показал, что повтор MS4 локализуется в гомологичных районах у всех четырех видов: Xq2.3-4 у- M.transcaspicus; Xq2.3-4 у M.arvalis; Xq2.15-16 у M.rossiaemeridionalis; Xq4.2-3 у M.kirgisorum.

Чтобы изучить рапределение повторов MS3 и MS4, была проведена их совместная гибридизация на метафазные хромосомы методом FISH. Она выявила различия, не выявляемые при раздельной локализации. Оказалось, что МБЗ-повтор более равномерно распределен по гетерохроматиновому блоку на X-хромосоме M.rossiaemeridionalis и распространен дальше. На Y-хромосоме оба повтора перекрываются в теломерном районе за исключением самой теломеры, в которой детектируется только MS4. Локализация MS3 и MS4 на половых хромосомах M.transcaspicus интересна тем, что они нигде не перекрываются, в то время как они совместно локализуются на X и Y-хромосомах M.kirgisorum. У M.arvalis, как и следовало ожидать из предыдущих экспериментов, нет зон перекрывания гибридизаций MS3 и MS4. Характер локализации отличается и между повторами, и между видами и свидетельствует о том, что блоки гетерохроматина на половых хромосомах неодинаковы у разных видов по структурной организации, и их образование произошло после расхождения видов. Вместе с тем, оба повтора являются маркерами гетерохроматина половых хромосом у обыкновенных полевок

Определение нукпеотидной последовательности и компьютерный анализ.

Для определения нуклеотидной последовательности обоих клонов использовали метод Сенгера. Из за насыщенности и MS3, и MS4 повторяющимися мотивами субклоны для секвенирования получали с использованием метода направленных делеций. Полная длина MS3-noBTopa оказалась равной 3332 п.н., а MS4 - 4088 п.н.

Сравнение MS3 с другими последовательностями ДНК полевок выявило высокую гомологию с ранее исследованной

7

последовательностью MS2, причем наибольшая частота различий обнаружена в позициях, содержащих CpG-динуклеотид. Степень гомологии между MS3 и MS2 составляет 94%. Исследование повторяющихся элементов выявило наличие В1 -элемента в позициях с 360 по 490 (рис.2), а также ряд участков, гомологичных фрагментам В1 (2720-2745 в прямой цепи, 1018-931 в комплиментарной цепи) и В2-повторам (1146-1125 и 2528-2469 в комплиментарной цепи). Кроме SINE, в последовательности MS3 также найдены фрагменты других мобильных элементов, в частности MaLR (рис.3). Можно предположить, что такие фрагменты могли возникнуть в результате серии рекомбинационных событий в предковой последовательности, которые характерны для гетерохроматиновых районов у разных видов. Лишь недавно встроившиеся мобильные элементы можно четко определить и точно идентифицировать.

gattggcctggtggtcatggcaggggctttagcaccagcactttagaggcagaagcaggcctgtctg

gccgggcatggtgg----cgcacgc-ctttaatcccagcacttgggaggcagaggcaggc—ggatt

1

2

tgtgctttcaaagccagactgatcaacgtagattgagttt-aggtcaccctataccgtaagatctgcagagaa 1

tctgagttcgaggccagcctggtctacanag—tgagttccaggacagcc---------agggctacagagaa 2

Рис.2 Выравнивание консенсусной последовательности В1 элемента мыши (1) с районом (360-490) последовательности MS3 (2). Совпадаюи|№ нуклеотиды отмечены звездочками.

Исследование потенциальных функциональных сигналов выявило неслучайное сходство района 3080-3071 последовательности MS3 с ядром минисателлита Джеффрейса GGGCAGGARG (Jeffreys et al., 1985). Данный мотив в минисателлите человека является очень консервативным. Предполагается, что он играет ключевую роль в процессах амплификации и рекомбинации сателлитной ДНК. Аналогичные данные были получены при исследовании других гетерохроматиновых последовательностей у полевок. Тандемно организованные повторы STR47 (Храпов и др, 1998) и MS6, характерные для прицентромерного гетерохроматина у полевок группы "arvalis", также содержат коровую часть гипервариабельного района минисателлита Джеффрейса. Наличие именно этого мотива и явилось, по всей видимости,

ключевым моментом в образовании прицентромерных гетерохроматиновых блоков у обыкновенных полевок. Кальшуер с соавторами также отметили наличие большого количества последовательностей, сходных с ядром минисателлита Джеффрейса в вАТА-богатых гетерохроматиновых последовательностях у М.адгезйэ и также предполагают, что он сыграл не последнюю роль в формировании гетерохроматиновых блоков половых хромосом (Ка1зс11еиег е1 а1., 1996). Наличие этого мотива в МЭЗ и в других гетерохроматиновых последовательностях полевок свидетельствует в пользу его важного функционального значения.

А) Структурная организация повтора МБ4

ро1у-А Ма1ЛВ2а В2Ь В2с 1-Х7 Ма1_Р В2с1 В1

В) Структурная организация повтора МБЗ

В1 Ма(_Р!В1 В2 Ма1.И Ма1.Р! В2

4 ЦI ■ ■!

ОИР

М82

Рис-3 Структурная организация МЭ4 (А) и МБЗ (В) повторов

Исследование потенциальных белок-кодирующих районов с помощью программы Сеп\Ле\лг (МНапеэ! е1 а1., 1993) выявило потенциальный белок-кодирующий участок в комплементарной цепи в позициях 1134-1030 последовательности МЭЗ. Для потенциального кодируемого пептида был проведен поиск гомологий и был выявлен сходный пептид, кодируемый геном ЭОМ1

дрожжей (involved in processing СОХИ and stabilizing Cob2p, Supressor of IMP1, GenBank entry name SCE9669, AC U18795). Выявляемое сходство является статистически значимым (программа RSS из пакета FASTA). Наличие сходного белка является аргументом в пользу реальности выявленной кодирующей области. Гомологичная область в MS2 содержит ряд делеций/инсерций, что не позволило выявить данную потенциальную кодирующую область. Аналогичное исследование с помощью программы Grail (Uberbacher, Mural, 1991) выявило три потенциальных белок-кодирующих районов в позициях 1302-1411, 1449-1574 и 1996-2092, для которых не были выявлены сходства с известными белками. Вполне возможно, что данные гомологии являются случайными.

Необходимо еще подчеркнуть, что исследования потенциального гена в MS3 значительно осложнены тем, что большинство, если не все копии этого гена, являются скорее всего псевдогенами (так как неактивны в составе гетерохроматической ДНК) и любые мутации фиксируются нейтрально. Однако некоторые копии гена могут оставаться активными и сохранять свои функции в ходе эволюции. Нам сложно предположить возможную функциональную роль потенциального гена, однако его сходство с белком дрожжей может указывать на его достаточно древнюю функциональную активность. Можно предположить, что последовательность MS3 (исходно являющаяся уникальной последовательностью и не имеющая блочной организации, характерной для сателлитной ДНК) была включена в ходе эволюции в состав гетерохроматической ДНК и амплифицирована. Наличие комбинации определенных мотивов (например, минисателлит Джеффрейса) обеспечило необходимый структурно-функциональный базис этих процессов.

Для повтора MS4 также был проведен компьютерный анализ, который выявил различные повторяющиеся последовательности ДНК (рис.3). В позиции 126-140 и 806-848 выявляются тракты(А)15 и (GT)2o- (А)15-тракт фланкирован прямыми повторами длиной 17 оснований с 1 несовпадением. Отличительной особенностью данной последовательности является насыщенность SINE. Четыре В2-подобных повтора выявляются в позициях 960-868 (В2а), 11791004 (В2Ь), 1369-1185 (В2с) и 2481-2273 (B2d). Выравнивание их приведено на рис. 4.

Первые три повтора имеют тандемную организацию "голова к хвосту" (рис.3). Такая кластерная организация характерна для некоторых типов SINE, например, для С-повторов кролика и Alul

человека (Krain et al., 1991; Шахмурадов и др., 1990). Первый из них - В2а - усечен с 5-конца. Он наиболее сильно дивергировал от консенсуса В2 мыши и, по всей видимости, встроился первым. Еще одной его особенностью является наличие в З'-области протяженного поли(СА)п-тракта, за которым также есть районы, гомологичные В2 мыши. Следом за В2а идут В2Ь и В2с. В отличии

ggctggagagatggctcagtggttaagagcacctga--ctgctctt--ccagaggtcctga 1

***cctgt***********a*a*************t__********__************* 2

*ttc*c**gtgg****g**g**a*g---------------*т****--g**а*а*ст** *» 3

* * * * f * *ag* * * * * аа* * *са* ***gc*t**—****— ********---****»*a**c*g 4

Т* * * *--------ТТ * * ТА* ******* AGT ******А**А** 5

gttcaattcccagcaaccacatggtggctcacaaccatctgtaatgagatctgatgccctc 1

****-с*****т****----*c*********_***********c*********gc****** 2

c****g*******atg***a*"***a*******ttgc*»**t**atag*tcc*a-g*aat 3

* ****** *g* * **а*с** ***** *са* * *gg* *g*tgg* ** *с*ст*с*-----7-----а 4

**»g*g**tgtg*t*c*t*--------**a...g*«****..*.*«t**------*g***- 5

ttctggtgtgtctgaagacagc-tacagtgtactta------------------------ca 1

C***TCC***_***------**A**T*_**G,GGC*------------------------Q* 2

c*gacaccatct*at*aa----ct - *t * * *ggcaatccacaaagacatacggaga 3

***ga*g**ac**---*g**c*tc»**cggccc*»»ratcatgcaggccaaacactaaca** 4

*c»»**gcta*t* 5

tataataaataaataaataaataaatcttaaaaaaaaaaaaaagaaagaa 1

-**gt*gt***c**-******** ************* *r** * *ta***t** 2

tg***a*t*a**********-*tc-*t* 4

Рис. 4. Выравнивание консенсуса B2 (1) с районами 117Э-)004 (2), 1369-121 § (3), 2480-2293 (4), 960-868 (5) последовательности MS4. Совпадающие нуклеотиды заменены звездочками

от В2а оба они фланкированы прямыми повторами (которые часто возникают в результате встройки SINE и LINE повторов (Welner et al., 1986)) и менее перестроены, что может свидетельствовать об их более поздней интеграции. Четвертый В2-элемент - B2d (позиции 2480-2293) - не входит в кластер и расположен в отдалении. Все четыре элемента сильно отличаются друг от друга. Каждый из них более сходен с консенсусом В2 мыши чем с любым В2, найденным в последовательности MS4. Аналогичные результаты получены при сравнении с В2-повторами из другой последовательности полевки -MS43. Либо все четыре В2 относятся к разным подсемействам

и

тРНК-производных SINE, либо имела место сильная дивергенция, характерная для диспергированных повторов в гетерохроматиновых районах также отмеченная другими авторами (Prades et al., 1996).

Кроме того, в позициях 2818-2961 находится В1 -повтор (рис.3), также принадлежащий к классу SINE. Еще один В2-подобный элемент, выявленный в позициях 650-720, представляет собой фрагмент MIR-элемента - его наиболее консервативную коровую часть (рис.3).

1x7 aactna-attttcntttgcgagtggttgtcaattggagataacttcttgattagggatgg

ms4 ggggttgt**gctc*c*c*a**ca*c*a***t*cac*a***g*ca****gc****tg*a*

mml204630 • »♦*g*c****c*tcc*ttt*tct*a*aa**t***c*a****t**t***c***a****a* mmaal6500 c*aga*-*ac***c*c*ctcc*ca*c*a*******cca*c*gt*c-»**gc*****g*** mmconreg *gagac-cccc**c***c*tg*ca*c*aagg****cta***g**cta*a*c*****g*** mmnkrplad ****g*-c*c*c*caa*c*t**ca*cca***gc**tca**g***c*ccaga*gacat*** mau71280 **ggc*-t*g**tc*a*c*ctc*a*—aa**tgact*a*c*t**c**cagcc*t**g***

1x7 ms4

mml204630

mmaal6500

mmconreg

mmnkrplad

mau

gagtntgtgtccanctcctcctttcagcnctgggactccgtctgtgcaggtcccgtgcag *gc*t****g***ct***c*tcc**catgtaaaa-t*tta****gctt*ag*t*c*****

***gt*c****tg** **c*-*c**catg*'

*tct------att*1

*c*-cca*catg*<

♦*c*t*****t**t*

* *c*tca*a** **c* **c*c* ** *c*ata* a*c*cca**c* * *a** *

* *c*g* * *ac* **c* * **c*tcc* *catg*c* * * *t*tt* * * * *gctt*ag*ttc* *t* *

**c*t*tt*****gtttaaa*tt******

* * *-----a*t** gtgcacg* g * cctg* *

* *c*t*tt* ** *a*ctt* *attta*c*c*

* *ac*att*c* **actt*ag*ttt* *a* *

1x7 ms4

mml204630

mmaal6500

mmconreg

mmnkrplad

mau

gccccgtgcgtgctgcctcagtctctgtgagttcacatgtagatcggtcctgttgattca

at*t***ca***a**t*a** ★ ■p + 'j'p^' * * * д* * * * *ttaa* cttt*c**g*gct**t*ct* *ttt*a**gaa****t*a**

,+*+*******g**ct**«

'ctg* ****** * * * *t* * * 'ctg***a**a*******'

*t*tt***gag*' *t*taa*a*ac*'

*atta* *aatggc* * * **t*a**actg*****

r***

'gt*

*gc*c*a*ct* * * ** *gg* * * * —***a*aa****a*ta*** *gc*g*t*c****ccatg*** *gc*g*tcc****c**tgc** *gc*a*t*c* * * *c* *tg*** **c***t*c****a**cg*g*

1x7 i g—agggcattgttttcttggtgtcttcca---tgcctactggctcttacaa------tc

ms4u * *g**aa*ga* *c*gct* * **a* * *aa** *acacca*cgga*a* **ag*t*gatgcaga*

mml204 630 *tg*a*atgc**g**c*****ac«*ac*t*---cca*cta**c**t*g***-------*g

mmaal6500 a*g***atcc**c**c**c*tat**g*t*****cca*ct***t****c**cg------**

mmconreg a*c*-*a**---***gg*-*tac*ta*tg*---ct***tgg**t***c***c------**

mmnkrplad **a*a*a**g*****ca**aca**tg****—-ccatct***a****gcagt------**

mau71280 **g*aat**---«••c****aa**ta****—-caa*ct***a******a**------c*

Рис.5 Выравнивание последовательности LINE LX7 в позициях 483-710 с MS4 в позициях 1564-1801 и с некоторыми последовательностями из нуклеотидных баз данных (см.Таблицу 1).

Сравнение MS4 с последовательностями из баз данных выявило, что район 1580-1781 имеет выраженную гомологию с рядом последовательностей из геномов грызунов. Выравнивание некоторых из них с MS4 приведено на рис.5. Контекстный анализ выявил статистически значимое сходство данного района и гомологичных ему последовательностей с З'-концами LX7 - одного из подсемейств LINE грызунов (Jurka, 1992). Некоторые последовательности, гомологичные и MS4, и LX7 показывают

большее сходство с другими представителями 1_Х-подсемейства грызунов, в частности с 1_Х9. Процент гомологии последовательностей, представленных на рис.5, с 1_Х7 колеблется от 58% до 65%. Примерно такое же сходство наблюдается у них и друг с другом, что, по всей видимости, связано с их сильной дивергенцией. Однако нельзя исключить и того, что район 15801781 МЭ4 и гомологичные ему последовательности являются представителями еще не описанного подсемейства 1-Х.

Таблица 1. Последовательности из баз данных GenBank-EMBL-DDBJ-PDB, гомологичные MS4 в районе 1580-1781.

сокращенное название ло-куса в базе данных Полное название локуса длина после- дова- тель- ности (в п.н.) позиции гомологии в последовательности процент гомологии с LX7 процент гомологии с MS4

ММ1204630 кДНК из 7.4 дневных эмьрионов мыши 392 156-383 62% 62%

ММАА16500 кДНК мыши 567 245-466 60% 65%

MMCONREG контролирующий район Р- глобинового локуса мыши 12600 389-606 58% 58%

MMNKRP1А D ген ЫКЯ-Р1 40 мыши 3145 23942621 59% 59%

MAU7128 ген цитохрома Р450 альдостеронсинте-тазы (СУР11В2) золотистого хомячка 9045 17491600 63% 66%

Несмотря на сходство в локализации на -хромосомах, компьютерный анализ не выявил протяженных гомологий между MS3 и MS4. Однако имеется много фрагментарных гомологий как в районах со сходными мобильными элементами, так и в районах где нет вообще никаких гомологий с последовательностями из баз данных.

Следовательно, последовательности MS3 и MS4 могут быть сильно дивергирванными вариантами гипотетической предковой последовательности. Хотя тот факт, что сигнал гибридизации с MS3, в отличие от MS4, детектируется и на аутосомах, делает это предположение менее вероятным.

В литературе имеются данные о гетерохроматин-специфических повторах у других видов полевок, не входящих в группу arvalis, полученные Modi (Modi, 1992; 1993с). Два повтора

MSAT160 и MSAT2750 по-разному локализуются на метафазных хромосомах у нескольких видов полевок. А у вида M.chrotorrhinus оба они гибридизуются с большим блоком гетерохроматина на X-хромосоме и прицентромерным гетерохроматином некоторых аутосом (Modi, 1993). Необходимо отметить, что если MSAT160 имеет тандемную организацию с единицей повтора 160 п.н., то MSAT2750 не имеет явно выраженной таковой (Modi, 1993). И автор делает вывод о его тандемной организации лишь на основании картины Саузерн блот-гибридизации, хотя в последовательности MSAT2750 явно присутствуют диспергированные элементы, в частности LINE. Это делает его сходным с нашими повторами, содержащими в своем составе дисперсные повторы или их фрагменты.

MS3, MS4 и изученный ранее MS2 (Mayorov et al., 1996) повторы обыкновенных полевок не имеют явно выраженной тандемной структуры, хотя, как правило, протяженные гетерохроматиновые районы состоят из такого типа ДНК. В данной ситуации можно предположить два альтернативных объяснения. В первом случае, длина мономерной единицы может быть больше или равна длине изученных повторов у полевок или мономерная единица сильно вырождена. Ранее было показано наличие повторов такого варианта организации в АЗ-бэнде на Х-хромосоме у мыши LMRS (Decoville et al., 1992), Вер-повторов у Canidae (Potapov et al., 1990) и GATA-богатых гетерохроматинспецифических последовательностей у M.agrestis. Протяженные последовательности ДНК во всех случаях состоят из более или менее сильно вырожденной мономерной единицы. Причем в случае с LMCR произошла инсерция нескольких LINE (Decoville et al., 1992). Авторы предполагают, что такая структура могла возникнуть посредством ряда последовательных дупликаций, чередующиеся сильными внутренними изменениями на молекулярном уровне с последующим встраиванием различных мобильных элементов. Вполне вероятно, что аналогичный вариант организации имеет место и у полевок, хотя мы и не можем это подтвердить основываясь на полученных результатах. И можно лишь предполагать, что произошли очень сильные изменения последовательностей, изменивших до неузнаваемости их первоначально тандемную структуру.

Другое возможное объяснение может состоять в том, что структура ГХ млекопитающих сходна со структурной организацией, характерной для интеркалярного гетерохроматина дрозофилы. Показано, что он состоит из некоторых типов диспергированных элементов, следующих один за другим - так называемые

"смешанные" повторы (Wensink et al., 1979). Сходный тип организации найден также и у цыпленка (Musti et al., 1981). Очень похожий вариант имеют и последовательности MS3, MS4, насыщенные различными типами диспергированных повторов. Многие из них мы, скорей всего, даже не детектируем, - настолько они дивергированы и перестроены. В любом случае, гетерохроматиновые блоки на половых хромосомах у исследуемых видов полевок имеет сложную и, скорее всего, иерархическую структуру. В его составе находятся как минимум пять типов последовательностей: MS1 (Kholodilov et al., 1993), MS2 (Mayorov et al., 1996), MS3, MS4, MS5. Все эти повторы содержат или являются фрагментами диспергированных элементов. В связи с чем более вероятным представляется второй вариант организации гетерохроматина из "смешанных" повторов. В тоже время у другого вида полевок - M.agrestis - в составе гетерохроматина половых хромосом обнаружены повторы как тандемной (MSAT160 и MSAT21), так и дисперсной организации (MSAT2750) (Ivanov et al., 1996). Возможно, что у обыкновенных полевок еще не выявлены тандемно организованные повторы в составе ГХ половых хромосом, и, также как у M.agrestis, гетерохроматин у них состоит и из "смешанных", и из мозаичных повторов.

Окончательно решить вопрос о структуре и происхождении блоков ГХ на половых хромосомах у обыкновенных полевок и роли повторов, подобных MS3 и MS4, помогут дальнейшие детальные исследования более протяженных гетерохроматиновых локусов.

Выводы

1. Из геномной ДНК M.rossiaemeriodianalis выделено, клонировано и охарактеризовано две повторяющиеся гетерохроматинспецифические последовательности, условно обозначенные MS3 и MS4.

2. Изучено распределение повторов в геномах четырех видов обыкновенных полевок рода Microtus методом Southern блот-гибриизации. Показано, что каждый из четырех исследуемых видов имеет свою индивидуальную картину гибридизации как с MS3, так и с MS4.

3. Проведена локализация MS3 и MS4 на метафазных хромосомах методом FISH. Повтор MS3 локализован кластерно на половых хромосомах у видов M.rossiaemeridionalis, M.kirgisorum и

M.transcaspicus, а также одиночными сигналами на хромосомах 1 и 13 у видов M.arvalis и M.kirgisorum соответственно. Повтор MS4 локализован кластерно исключительно на половых хромосомах.

4. Определены первичные нуклеотидные последовательности повторов MS4 и MS3. Длина MS4 составляет 4088 п.н., a MS3 - 3265 п.н.

5. Выполнен контекстный анализ последовательностей. MS3 содержит несколько потенциальных белок-кодирующих районов, полный В1 и фрагменты В1, В2 и MaLR элементов. Последовательность MS4 содержит пять В2-подобных элементов, три из которых организованы кластерно, один В1 и один LINE-подоб-ный элементы.

6. Проведен сравнительный анализ MS3 и MS4 с другими повторяющимися последовательностями ДНК из баз данных, предполагающий два альтернативных варианта организации исследуемых повторов: а) сходный с мозаичными повторами типа LMCR у мыши и Bsp у Canidea; b) по типу интеркалярного ГХ у дрозофилы и курицы, состящих из смешанных повторов.

Список публикаций

1. Еписафенко Е.А., Закиян С.М., Павлова C.B. Клонирование и изучение специфического для гетерохроматина половых хромосом повтора MS4 у полевки Microtus subarvalis II Международная конференция "Современные концепции эволюционной генетики".Новосибирск. 9-12 сентября 1997. тез. докл. С.51.

2. Elisaphenko Е.А., Nesterova Т.В., Duthie M.S., Ruldugina O.V., Rogozin I.В., Brockdorff N.S., Zakian S.M. Repetitive DNA sequences in common vole: cloning, characterization and chromosome localization of two novel complex repeats MS3 and MS4 from the genome of east-european vole Microtus rossiaemeridionalis// Chromosome Research. V6. 1998. in press.

3. Храпов E.A., Елисафенко E.A., Рогозин И.Б., Павлова C.B., Воробьева Н.В., Сердюкова H.A., Саблина О.В., Графодатский A.C., Закиян С.М. Характеристика нового семейства тандемно организованных повторов STR47 у обыкновенных полевок // Молекулярная Биология. Принята в печать.

Текст научной работыДиссертация по биологии, кандидата биологических наук, Елисафенко, Евгений Анатольевич, Новосибирск

* / л** 1

Ы / * Vе «/ "* . "У /■ Л а

. V

РОССИЙСКАЯ АКАДЕМИЯ НАУК СИБИРСКОЕ ОТДЕЛЕНИЕ Институт цитологии и генетики

На правах рукописи

ЕЛИСАФЕНКО ЕВГЕНИИ АНАТОЛЬЕВИЧ

ОРГАНИЗАЦИЯ И ХРОМОСОМНАЯ ЛОКАЛИЗАЦИЯ ПОВТОРЯЮЩИХСЯ ПОСЛЕДОВАТЕЛЬНОСТЕЙ ДНК У ОБЫКНОВЕННЫХ ПОЛЕВОК РОДА МГСКОТШ

Генетика - 03.00.15

Диссертация на соискание ученой степени кандидата биологических наук

Научный руководитель: профессор. С.М.Закиян

Новосибирск - 1998

Работа выполнена в лаборатории биохимической генетики животных Института цитологии и генетики Сибирского Отделения Российской Академии Наук.

Автор глубоко признателен профессору С.М.Закияну за поддержку и помощь, оказанные при выполнении всех этапов настоящего исследования. Автор также благодарит м.н.с. С.В.Павлову , совместно с которой проведена часть исследований. Автор выражает благодарность с.н.с. Т.Б.Нестеровой за выполнение работ по гибридизации in situ; к.б.н И.Б.Рогозина за помо-мощь оказанную при выполнении компьютерного анализа нуклео-тидных последовательностей; н.с. Н.В.Рубцовой С.В.Ермолаеву за ценные замечания, высказанные при прочтении рукописи.

I. ВВЕДЕНИЕ..................................................................................................................................................5

П. ПОВТОРЯЮЩИЕСЯ ПОСЛЕДОВАТЕЛЬНОСТИ ДНК В ГЕНОМАХ МЛЕКОПИТАЮЩИХ. 8

A. Краткая характеристика и классификация повторов ДНК в геномах млекопитающих............8

B. Диспергированные повторы..................................................................................................................9

1. Суперсемейство LINE...........................................................................................................................9

2. Суперсемейство SINE.........................................................................................................................16

3. Суперсемейство MaLR........................................................................................................................29

4. Суперсемейство ДНК транспозонов..................................................................................................31

5. Другие типы диспергированных повторов........................................................................................33

C. тандемные повторы.............................................................................................................................36

D. мини- и микросателлитная ДНК. .....................................................................................................42

E. повторяющиеся последовательности ДНК и гетерохроматин.....................................................44

F. возможные функции повторов...........................................................................................................46

G. повторяющиеся последовательности ДНК у полевок рода microtus.........................................51

Ш. МАТЕРИАЛЫ И МЕТОДЫ..................................................................................................................55

A. ОБЪЕКТ ИССЛЕДОВАНИЯ.................................................................................................................55

B. МИКРОБИОЛОГИЧЕСКИЕ МЕТОДЫ РАБОТЫ...............................................................................55

1. Наработкарекомбинантных фагов...................................................................................................55

2. Приготовление компетентных клеток E.coli...................................................................................56

3. Трансформация..................................................................................................................................57

C. Методы выделения ДНК......................................................................................................................57

1. Выделение и очистка ДНК рекомбинантных фагов.........................................................................57

2. Метод выделения плазмидной ДНК...................................................................................................58

3. Выделение геномной ДНК из печени полевок.....................................................................................58

D. Методики работы с рекомбинантной ДНК........................................................................................59

1. Расщепление ДНК эндонуклеазами рестрикции................................................................................60

2. Электрофорез ДНК в агарозных гелях...............................................................................................60

3. Выделение фрагментов ДНК из гелей................................................................................................60

4. Субклонирование фрагментов ДНК...................................................................................................61

5. Получение направленных делеций.......................................................................................................61

e. Саузернблот-гибридизация.................................................................................................................62

F. Гибридизация in situ..............................................................................................................................63

G. Определение нуклеотидной последовательности ДНК..................................................................64

H. Контекстный анализ последовательности ДНК..............................................................................66

IV. РЕЗУЛЬТАТЫ И ИХ ОБСУЖДЕНИЕ................................................................................................70

A. Клонирование гетегохроматинспецифических последовательностей.......................................70

B. Гибридизационный анализ..................................................................................................................73

C. Определение нуклеотидной последовательности и компьютерный анализ................................80

D. Организация гетерохроматических последовательностей...........................................................93

V. ЗАКЛЮЧЕНИЕ........................................................................................................................................96

VI. ВЫВОДЫ.................................................................................................................................................98

УП. СПИСОК ЛИТЕРАТУРЫ....................................................................................................................99

СПИСОК ПРИНЯТЫХ СОКРАЩЕНИЙ

ГХ - гетерохроматин

т.п.н. - тысяч пар нуклеотидов

п.н. - пар нуклеотидов

dNTP - дезоксинуклеозидгрифосфат

EDTA - ЭДТА (этилендиаминтетраацетат)

LINE - Long Interspersed Nuclear Elements

(длинные рассеянные повторы)

LTR - Long Terminal Repeats (длинные концевые повторы) TIRs - Terminal Inverted Repeats (терминальные инвертированные повторы)

MaLRs - Mammalian apparent LTR-retrotransposons (семейство повторов LTR-ретротранспозонов) MER - Medium Reiterated Repeats (умеренно распространенные повторы)

MIR - Mammalian Interspersed Repeats (рассеянные повторы млекопитающих) ДНК - дезоксирибонуклеиновая кислота РНК - рибонуклеиновая кислота РНП - рибонуклепротеин стДНК - сателлитная ДНК МТ - Mouse Transposon (транспозон мыши) ORF - Open Reading Frame (открытая рамка считывания) ORR - Origin Region Repeat (повторы района начала репликации) PCR - Polymerase Chain Reaction (полимеразная цепная реакция) SINE - Short Interspersed Nuclear Elements (короткие рассеянные повторы)

ТНЕ1 - Transposon-like Human Elements (ретротранспозон-подобные

повторы человека) IAP - интерстициальная А частица ТП - тандемные повторы

scPHK - small cytoplasmic РНК (малые цитоплазматические РНК) SRP - signal recognition particle (сигнал узнающая частица)

I. Введение.

Присутствие в геноме эукариот повторяющихся последовательностей ДНК, гетерогенных по своему составу, с трудом поддается объяснению с точки зрения предписываемых им в настоящее время функций. Не исключено, что часть их может являться "эгоистичной" ДНК (Дулиттл, 1986), часть "неразумной" ДНК, часть действительно функционально значимой. Но из-за отсутствия достаточного количества данных, пока еще не представляется возможным определить роль в функционировании генома даже каждого из типов повторяющихся последовательностей. Можно предполагать структурную функцию некоторых повторов (Earnshau et al

1989), функцию регуляции транскрипции и трансляции ДНК, участие в процесах пролиферации и трансформации клеток. Повто-ряющеся последовательности, по видимому, играют не последнюю роль в эволюции геномов и видов. И если даже некоторые повторы существовали как эгоистичная ДНК, то в процессе эволюции они приобрели (либо приобретают) некие полезные для генома функции (Dau-Yin Chang et al 1994, Glaischenhaus 1987, Wu et al 1990).

Гетерохроматин (ГХ) составляет существенную часть генома высших эукариот. У некоторых видов на его долю приходится до 80% всей ядерной ДНК. В составе ГХ обнаружены разного рода повторяющиеся последовательности и мобильные элементы различной копийности, степени сложности и организации. Для прицен-тромерного гетерохроматина показано его участие в процессе расхождения сестринских хроматид. Получены экспериментальные свидетельства связывания ГХ с различными белками (Pluta et al.,

1990). Однако, многие вопросы, связанные со структурой и функ-

цией ГХ, пока остаются без ответа. Помочь ответить на них, возможно, поможет прямое изучение его структуры. Особенно плодотворным, на наш взгляд, будет сравнительное исследование групп близкородственных видов, у которых процесс появления и развития блоков ГХ, по всей видимости, шел разными путями. В качестве модели для изучения мы выбрали четыре вида обыкновенных полевок рода М1сгой15.

Интерес к этой группе полевок вызван особенностями расположения блоков гетерохроматина на половых хромосомах (Магигок ^ а1. 1994, 1995, 1996а, Ь, Мауогоу et а1. 1996). Если у М.го5з1аетепс1юпаН5 гетерохроматин занимает приблизительно половину Х-хромосомы и расположен в теломерном районе, то у М^гап8сазр1си8 и М.кп^БОгит блоки гетерохроматина на Х-хромо-сомах меньше по размеру и находятся в прицентромерном районе. На Х-хромосоме М.ап/аНэ не удается выявить даже прицентромер-ный гетерохроматин.

Актуальность настоящего исследования заключается в следующем: (1) исследование молекулярной структуры ГХ поможет ответить на многие вопросы связанные с его возникновением, структурой и функцией; (2) Повторяющиеся последовательности ДНК в геномах эукариотических организмов привлекают к себе все большее внимание в связи с появляющимися данными о их возможных функциях в геноме и изучение таких последовательностей в геномах полевок рода ]УПсго1;и8 может дать дополнительную информацию для понимания их роли.

Целью данного исследования является поиск и изучение гетерохроматин- и. Х-специфических повторов ДНК у полевок группы

агуаНз рода Мтсго^.

Исходя из видовых особенностей данной группы полевок, поиск повторяющихся последовательностей ДНК проводили в геноме полевки ГуПсго^б хх^аетепсНопаПБ, имеющей максимальный, среди исследуемых видов, гетерохроматиновый блок на Х-хромосоме.

Конкретными задачами данного исследования были: 1) выделение и клонирование гетерохроматин- и Х-специфических повторов ДНК у полевки М^сго^; гоз51аетепс1юпаН8; 2) анализ распределения и локализации вариантов повторяющейся ДНК в геномах полевок; 3) определение первичной структуры ДНК выделенных клонов; 4) контекстный анализ последовательностей нуклеотидов; 5) сравнительный анализ с другими повторяющимися последовательностями ДНК из баз данных.

Научная новизна. Из геномной ДНК вида М.гт^аетепсПопаНз выделены и охарактеризованы две повторяющиеся нуклеотидные последовательности условно обозначенные МБЗ и МБ4, содержащие различные диспергированные мобильные элементы. Выявлена уникальная кластерная локализация повтора МБ4 на половых-хромосомах у четырех видов обыкновенных полевок рода МжгоЬш: М.го5з1аетеНйюпаИ8, М. Ьгатсазртт, М.ЫгдЬогит и М.агоаХш, преимущественно в гетерохроматиновых районах. Последовательность МБЗ также преимущественно локализуется кластерно на половых хромосомах, но у некоторых видов сигнал гибридизации детектируется на аутосомах. Определена полная нуклеотидная последовательность МЭЗ и МБ4 и проведен их комьютерный анализ.

Практическая ценность. Полученные в работе результаты имеют теоретическое значение для дальнейшего изучения организации гено-

мов млекопитающих в общем и гетерохроматина в частности, а также для понимания роли и функций повторяющихся последовательностей ДНК. Нуклеотидные последовательности исследованных повторов зарегистрированы в банке данных EMBL Data Library (регистрационный номер в EMBL банке Z95706 и Z86096)

II. Повторяющиеся последовательности ДНК в геномах млекопитающих

А. Краткая характеристика и классификация повторов ДНК в геномах млекопитающих

Повторяющиеся последовательности ДНК разделяют на различные семейства по степени повторенности, принципу организации, структуре и локализации в геноме. В ранних классификациях повторов ДНК эукариот, основанных на кинетике реассоциации ДНК (Britten, Kohne, 1968) выделяли 3 типа повторов: 1. высокоповто-ряющиеся последовательности ДНК, представленные в геноме числом копий более чем 105 . Они составляют от 5 до 15% суммарной ДНК генома и представлены, в основном, сателлитными ДНК; 2. умеренноповторяющиеся последовательности, представленные в геноме 10-104 копий. Такие повторы составляют от 1 до 90% генома и представлены различными семействами рассеянных повторов; 3. последовательности, представленные в геноме менее чем 10 копиями относят к уникальным.

По принципу организации повторяющиеся последовательности ДНК разделяют на тандемные повторы и диспергированные повторы. Диспергированные повторы рассеяны по всему геному. Тандем-но-организованные повторы обычно собраны в крупные блоки и

преимущественно локализованы в гетерохроматиновых районах хромосом. Они чаще всего представляют собой сателлитные ДНК.

Диспергированные повторы встречаются как в гетерохромати-не, так и в эухроматине. По предложению Сингера (Singer, 1982) их обычно разделяют на 2 класса: длинные диспергированные повторы (LINE) размером более 1000 пар нуклеотидов и короткие повторы (SINE) длиной менее 500 п.н. Аббревиатуры LINE и SINE, введенные Сингером (Singer, 1982) происходят от соответственно Long Interspersed Nuclear Elements и Short Interspersed Nuclear Elements.

В соответствии с механизмом транспозиции диспергированные повторы разделяют на 2 класса (Fanning, Singer, 1987; Singer, 1990): 1) ретроэлементы, которые распространяются через РНК-посредника и имеют структурное сходство с ретровирусами; 2) транспозиционные элементы, которые распространяются без РНК посредника через ДНК-ДНК транспозицию элементов.

В последние годы в отдельную группу выделяют ретротранс-позоны без длинных концевых повторов Non-LTR-ретротранспозоны (Xiong, Eickbush, 1990). К ним, в частности относят семейства LINE и LINE подобных элементов, которые ранее были отнесены вместе с SINE элементами в группу ретропозонов (Deininger, 1989)

Кроме того, результаты анализа баз данных нуклетидных пои Ü и _

следовательностеи выявили целый ряд семейств повторяющихся последовательностей с неизвестными функциями и не описанные ранее ( Jurka et al., 1993).

В. Диспергированные повторы

1. Суперсемейство LINE

Длинные диспергированные повторяющиеся элементы (LINE) содержатся во всех геномах млекопитающих. Подобно SINE повторам, они относятся к ретропозонным элементам и, вероятнее всего, распространяются по геному с помощью РНК-промежуточного продукта. Локализованы LINE1 элементы в G/Q (Giemsa/Quinacrine) позитивных областях (поздно реплицирующихся, Г-Ц богатые районах) (Korenberg, Rikovski 1988). Длина LINE повторов колеблется от б до 7,5 тыс.п.н. у различных млекопитающих, и большинство копий усечены с 5' конца. Так, например, количество копий LIMd (LINE1 элемент у Mus domesticus) с полной длиной составляет около 10,000 копий на геном, а усеченных около 85,000 (Gebhard et al., 1982).

LINE элементы впервые были описаны как Kpnl семейство повторов у приматов (Adams et al., 1980) и MIF-1 семейство у грызунов (Singer, 1982) и впоследствии были объединены в одно LINE-1 или LI семейство (Voliva et al., 1983). Основанием для такого объединения послужила их внутренняя гомология. Для видового обозначения элементов применяют 2-х буквенные символы, например: LIMd (LINE-1 элемент Mus domesticus), LlHs (LINE-1 элемент Homo sapiens). Структура LI элементов наиболее полно изучена у мышей и у человека (Рис.1).

В структуре LI элементов выделяют следующие основные час-

ти: 5'-нетранслируемую область (5'-UTR), две открытые рамки трансляции (ORF1 и ORF2) и З'-нетранслируемую область. Длина полноразмерных L1 элементов составляет 6-7 т.п.н., однако большинство элементов имеют 5'-концевые делеции (так называемый феномен 5'-концевого усечения). Число копий L1 элементов составляет 10 -105 на гаплоидный геном (Hutchison et al., 1989).

О

1 т.п.н.

(А)„

5'UTR ORF1 i

I I

ORF2

/

3'UTR

l(A)n

Рис.1 Структура консенсусных последовательностей LINE-1 элемент мыпм (LIMd) и человека (LIHs)

5'-нетранслируемая область имеет различную длину (800 п.н. у человека и от 0,3 до 1,3 т.п.н. у мыши) и содержит внутренний промотор для РНК-полимеразы II без TATA бокса (Di Nosera, Sakaki, 1990). Начало 5'-нетранслируемой области L1 элементов отличается высоким содержанием G+C и динуклеотидов CG (Loeb et al., 1986). В 5'-нетранслируемой области L1 элементов у мыши встречается 2 типа тандемных повторов. По наличию таких повторов LIMd относятся либо к A-типу элементов, содержащих 208 п.н. тандемный мотив, либо к F- типу элементов, содержащих 206

п.н. тандемный мотив. Тандемные мотивы А и F не являются гомологичными друг другу и не встречаются в L1 элементах мыши одновременно (Loeb et al., 1986).

ORF1 содержит около 375 кодонов и вариабельна у разных представителей LINE. Показано, что антитела против полипептида, кодируемого ORF1, выявляют в культуре клеток человека эндогенный белок с неизвестными функциями (Leibold et al., 1990). С помощью антител против полипептида кодируемого ORF1 был выявлен белок с молекулярным весом около 42 кДа в составе РНП комлекса в клетках F 9 мышиной эмбриональной карциномы (Martin, 1991). , но функция этого белка неизвестна. Недавно было показано для L1 человека, что белковый продукт ORF1 способен связывать РНК LINE и одновременно имеет мотив для связывания ДНК под названием "лейциновая молния" (Hohjoh and Singer, 1996).

ORF2 содержит около 1300 кодонов и имеет области гомологии с консервативными доменами обратных транскриптаз ретровирусов и ретротранспозонов (Loeb et al., 1986; Hattori et al., 1986). Следующий за ревертазным доменом район ORF2 имеет неизвестные функции, однако в нем выявляются цистеиновые мотив