Бесплатный автореферат и диссертация по биологии на тему
Структурно-функциональная организация гетерохроматических тандемных повторов Y-хромосомы и родственного эухроматического гена у DROSOPHILA MELANOGASTER
ВАК РФ 03.00.03, Молекулярная биология

Автореферат диссертации по теме "Структурно-функциональная организация гетерохроматических тандемных повторов Y-хромосомы и родственного эухроматического гена у DROSOPHILA MELANOGASTER"

г- .ч

■VI

На правах рукописи

#

КАЛМЫКОВА Алла Ивановна

СТРУКТУРНО-ФУНКЦИОНАЛЬНАЯ ОРГАНИЗАЦИЯ ГЕТЕРОХРОМАТИЧЕСКИХ ТАНДЕМНЫХ ПОВТОРОВ У-ХРОМОСОМЫ И РОДСТВЕННОГО ЭУХРОМАТИЧЕСКОГО ГЕНА У ЮНОБОРШЬА МЕЬАКО САЯТЕИ.

03.00.03 - молекулярная биология

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата биологических наук

Москва - 1997

Работа выполнена в Институте молекулярной генетики РАН Научный руководитель: доктор биологических наук, профессор

В.А. Гвоздев

Официальные оппоненты: доктор биологических наук

H.A. Чуриков

кандидат биологических наук И.А. Александров

Ведущая организация: Московский государственный университет им- М.В. Ломоносова

Защита состоится "/Ь " 1997г. в

час. на заседании Диссертационного совета Д 002.79.01 при Институте молекулярной биологии им. Энгельгардта РАН

С диссертацией можно ознакомиться в библиотеке Института молекулярной биологии РАН.

Автореферат разослан " *1 " .¿lü -А._ 1997г.

Актуальность темы. Геном эукариот загадочно разделен на две части: эухроматин, включающий основную часть генов, и конститутивный гетерохроматин, содержащий, в основном, повторяющиеся последовательности. Функциональная значимость гетерохроматических повторов, за исключением кластера рДНК, остается, как правило, невыясненной (или недостаточно выясненной) . Обычно обсуждается роль сателлитной ДНК и мобильных элементов, составляющих основную массу ДНК гетерохроматина. В настоящей работе внимание уделено тем повторяющимся последовательностям ДНК гетерохроматина, которые способны кодировать белки или, по-крайней мере, транскрибироваться с образованием матриц, содержащих открытые рамки трансляции (ОРТ). Эти элементы гетерохроматина были недавно обнаружены, но их роль как в функционировании организма, так и в эволюции генома остается невыясненной.

В гетерохроматине Х-хромосомы обнаружены повторяющиеся гены Stellate (Ste), кодирующие белок, сходный по аминокислотной последовательности с р-субъединицей казеинкинаэы 2. Гены Stellate тканеспецифически экспрессируются в семенниках самцов, лишенных Y-хромосомы. У нормальных XY-самцов транскрипция Stellate генов подавлена благодаря присутствию в гетерохроматической Y-хромосоме тандемных повторов Suppres-sor-of-Stellate (Su(Ste)), гомологичных единицам кластера Stellate. Механизм такой супрессии, обусловленной взаимодействием Su(Ste) повторов Y-хрокосомы и Stellate генов Х-хромосомы, не выяснен. Отсутствие локуса Su(Ste) в Y-xpo-мосоме приводит к стерильности самцов. Таким образом, плодовитость самцов обеспечивается геномным балансом гетерохроматиновых повторов, представленных Ste и Su(Ste) единицами. Причины и способы возникновения в эволюции вида D.melanogas-ter этих гетерохроматических элементов остаются загадкой.

Таким образом, исследование механизма супрессии с участием Su(Ste) повторов представляет интерес в связи с самым общим вопросом , касающимся геномных взаимодействий гетерохроматических повторов у эукариот, обеспечивающих нормальное функционирование организма.

Исследование структурного полиморфизма и транскрипционной активности генов Su(Ste) Y-хромосомы, проведенное в

данной работе, является шагом не только в понимании взаимодействия гетерохроматических генов, но и в исследовании функцинирования Y-хромосомы - полностью гетерохроматизирова-ного элемента генома.

В настоящей работе затронуты также вопросы, касающиеся возникновения в процессе эволюции генома видоспецифических гетерохроматических повторов Ste и Su(Ste). Был обнаружен новый уникальный эухроматический ген, кодирующий вариант (5-субъединицы протеинкиназы, сходный по нуклеотидной последовательности в первую очередь с Su(Ste) повторами. Этот ген, получивший название SSL ( Su(Ste)-like), имеет и D.si-nulans (вид-близнец), лишенный развитой системы амплифициро-ванных гетерохроматических генов Ste и Su(Ste). Полагая, что ген SSL достаточно древний, можно утверждать, что определенные участки гетерохроматина возникли путем амплификации эух-роматинсвых генов, с образованием тандемных повторов. Актуальность исследования далеко не исчерпывается эволюционными рассмотрениями. Обнаружение нового гена, по-видимому, участвующего в образовании специфической протеинкиназы семенников, представляет большой интерес в связи с известной ролью казеинкиназы 2 в регуляции клеточной пролиферации, сигнализации и других важнейших клеточных процессах.

Задачи исследования. Целью работы являлось: 1. Клонирование протяженных фрагментов кластера повторов Su(Ste) в фаге Р1 с целью изучения структурного полиморфизма этих элементов. 2. Изучение транскрипционной активности генов Su(Ste) 3. Структурно-функциональная характеристика нового гена SSL, родственного генам Ste и Su(Ste).

Научная новизна результатов исследования. Не считая транскриптов сателлитной ДНК и рРНК, известно всего два типа последовательностей, транскрибируемых Y-хромосомой - ген ди-неина и гистон-подобные последовательности. В работе показано, что гены Su(Ste) Y-хромосомы D.melanogaster транскрибируются в семенниках . Обнаружено, что транскрибируются различные дивергировавшие копии Su(Ste), что приводит к альтернативному характеру процессинга - использованию различных сигналов сплайсинга, полиаденилирования и, возможно, трансляции. Впервые показано, что единицы тандемного кластера

могут дивергировать, что приводит к образованию транскрилтов различной природы.

Обнаружен новый уникальный эухроматический ген SSL, активный в гаметогенеэе самцов, ОРТ которого высоко гомологична ОРТ регуляторной субъединицы казеинкиназы 2, а экзон-инт-ронная структура и нуклеогидная последовательность сходны с генами Ste и Su(Ste). Молекулярная характеристика этого гена и сравнение его с другими генами, родственными fS-субъединице казеинкиназы 2, позволяют установить между ними эволюционную связь и объяснить происхождение в геноме D.melanogaster кластеров генов Ste и Su(Ste).

Молекулярная характеристика гена SSL позволяет предположить, что это функциональный ген, активный в спермиогене-зе, выполняющий функции, близкие (5-субъединице казеинкиназы 2. Выявлена роль обратной транскрипции в эволюционном происхождении гена SSL. Это один из немногих описанных в литературе примеров появления в геноме высших эукариот нового функционального гена с участием обратной транскрипции.

Практическая ценность. Исследование нового эухромати-ческого гена, а также генов Ste и Su(Ste), экспрессирующихся в спермиогенеэе, позволяет изучать свойства тканеспецифичес-ких промоторов и белковых факторов, регулирующих их активность. Обнаружение гена SSL, участвующего, по-видимому, в образовании нового тканеспецифического варианта протеинкина-эы, позволяет планировать эксперименты, направленные на исследование его функции.

Апробация работы. Результаты работы были представлены на ежегодных научных конференциях ИМГ РАН (Москва, 1995, 1996), 14й Европейской конференции по дрозофиле (Венеция, Италия, 1995), 35, 37, 38 конференциях по дрозофиле (Чикаго, США, 1994, 1997; Сан-Диего, США, 1996).

Объем диссертации. Материал диссертации изложен на 13 0 страницах машинописного текста, содержит 14 рисунков. Список цитированной литературы состоит из 151 работы.

МАТЕРИАЛЫ И МЕТОДЫ

Клонирование в плазмидах, скрининг геномной и кДНК библиотек, введение радиоактивной метки в ДНК, Саузерн- и Но-эерн-гибридизации, определение нуклеотидной последовательности по Сзнджеру, ПЦР и другие традиционные манипуляции с нуклеиновыми кислотами проводились по общепринятым методикам (Sambrook et al., 1989) с модификациями. В работе были использованы геномные библиотеки D.melanogaster в фагах Р1 (Smoller et al., 1991) и космидах рНС79, полученная В.Е. Алаторцевым, библиотека кДНК иэ семенников D.melanogaster в векторе X.ZAPII (Stratagene) (предоставленная д-ром Т. Ха-цельригг).

РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ

1. Структурный полиморфизм повторов кластера Su(Ste).

Гены локуса Suppressor of Stellate ( Su(Ste)) были клонированы ранее ( Balakireva et al., 1992 ). Показано, что они состоят из трех элементов - области гомологии со Ste генами, Y-специфической области и мобильного элемента 1360 (рис.1А). Саузерн-анализ геномных ДНК самок и самцов , расщепленных рестриктаэой Xbal, и гибридиэованных с фрагментом гена Stellate - зондом 1 (рис.1Б ), выявляет 4 основных рестрикта размером 2,8; 2,6; 1,8 и 1,6 т.п.н, обнаруживаемых только у самцов всех изученных линий . Полосы размером 1,25 и 1,15 т.п.н., присутствующие как в самхах так и в самцах, соответствует эу- и гетерохроматических Ste (Livak 1990, Sheve-lyov 1992). фрагменты размером 2,8;2,6;1,8 и 1,6 т.п.н. соответствуют Su(Ste) генам Y-хромосомы. Для изучения внутренней организации кластера генов Su(Ste) был проведен скрининг геномной библиотеки в фаге Р1 на зонд 2 ( рис.1 ), включающий фрагмент Y-специфической области. Были отобраны два фага, Р13 и G12. Каждый фаг содержит геномную последовательность размером 80-100 т.п.н.. Саузерн анализ (Xbal рестрикция и гибридизация с зондом 2) выявляет только Y-специфичес-кие фрагменты размером 2,8 и 2,6 т.п.н. в обоих фагах ( рис.1Б ). При использовании в качестве меченого гибридизаци-

A Su(Stt) -> ...»

Б

I 2 3 4 5 б

1.81.6-

1.25- . Ш 1.15- T,

зонд 1

зонд 2

I

Рис.1. Структурный полиморфизм генов кластера Su(Ste). А. Схема структурных вариантов Su(Ste) генов. Двумя стрелками обозначены гены Su(Ste). Указаны Stellate-гомологичныв и Y-специфические районы. Утолщенные и тонкие стрелки обозначают инвариантный (X) и вариабельный (X*) Xbal сайты. Элемент 1360 указан не в масштабе. Указаны гибридизационные пробы. Инсерция в Y-специфическую область указана (инс.). Б. Саузерн-анализ геномной ДНК и фагов Р1, содержащих часть кластера Su(Ste). 5мкг ДНК самцов линии gtwa (дорожки 1,3) и самок (2,4) и 0.5 мкг Р13 (5) и G12 (б) фаговой ДНК, расщепленных Xbal, прогибридизованы с указанными зондами. Размеры фрагментов даны в тпн.

онного зонда целиком рекомбинантной фаговой ДНК не было выявлено дополнительных фрагментов, кроме вектора. Таким образом, каждый из фагов содержит по 20-30 копий Su(Ste) одного рестриктного варианта (содержащих один сайт Xbal), не прерванных другими последовательностями, причем фаг G12 содержит преимущественно копии размером 2,6 т.п.н.. Ранее были секве-нированы гены Su(Ste) размером 2,8 т.п.н.(Balakireva et al.,1992). Копия размером 2,6 т.п.н. была субклонирована из фага G12 и частично секвенирована. Показано, что гены размером 2,8 т.п.н. отличаются от единиц кластера размером 2,6 т.п.н. инсерцией 165 п.н. в Y-специфической области. Инсер-ция фланкирована повтором ТТААА (рис.1).

Скрининг космидной библиотеки на зонд 2 позволил отобрать космиды, содержаие 1,8 и 1,6 т.п.н. Xbal фрагменты Su(Ste). Фрагмент 1,6 т.п.н. из космиды 4 был субклонирован и частично секвенирован. Показано, что в мобильном элементе 1360 присутствует вариабельный сайт Xbal, который приводит к образованию фрагментов 1,8 и 1,6 т.п.н. из фрагментов 2,8 и 2,6 т.п.н.. Рис. 1А демонстрирует причины рестриктного полиморфизма генов Su(Ste) характерного, как указывалось выше, для всех исследованных лабораторных и природных линий. Поскольку фаги PI3 и G12 содержат только копии Su(Ste),He имеющие вариабельного Xbal сайта, можно сделать вывод о кластеризации в геноме таких копий. Более того, на основе структуры фага G12, содержащего преимущественно копии размером 2,6 т.п.н., можно говорить и о кластеризации копий определенного размера.

Было высказано предположение (МсКее & Satter, 1996), что существуют различные механизмы гомогенизации генов Su(Ste), отличающихся по длине и рестриктной карте. Эти данные были получены на основании рестриктного анализа фрагментов кластера Su(Ste), клонированных в фагах лямбда. Авторы не обнаружили кластеров копий, отличающихся по длине, но продемонстрировали кластеризацию определенных рестриктных вариантов.

Мы провели исследование причин полиморфизма генов Su(Ste) на уровне определения нуклеотидных последовательностей. В результате исследования протяженных геномных фрагментов в фагах PI была показана кластеризация копий размером

2,6 т.п.н., а также ярко продемонстрирована кластеризация рестриктных вариантов. Таким образом, нет необходимости предполагать различные механизмы согласованной эволюции для единиц кластера Su(Ste), отличающихся по длине и первичной последовательности.

2. Транскрипция генов Su(Ste) Y-хроиосомы. Альтернативный характер процессинга транскрнптов Su(Ste).

Для поиска транскриптов генов Su(Ste) была использована библиотека кДНК в фаге лямбда ZAPII (Stratagene), полученная из семенников самцов линии Canton S. Было проанализировано 1000 ООО индивидуальных фагов. В результате скрининга на зонд 2 (рис.1А) с последующей эксцизией in vivo были отобраны 4 клона кДНК в векторе BlueScriptSK", гомологичных Su(Ste). Нуклеотидные последовательности кДНК, обозначенных как pBS13, pBS1512 и pBS511 представлены в GenBank, N L 42286, L42287, L42288. Схематически эти транскрипты изображены на рис.2. кДНК 15 представляет собой 3'-часть транскрипта Su(Ste). Секвенирование показало, что транскрибируется Y-специфическая область, причем во всех транскриптах выявляется характерный для генов Su(Ste) набор нуклеотидных замен и делеций в Ste-гомологичной области. Это позволяет с уверенностью утверждать, что обнаруженные транскрипты считаны с генов хластера Su(Ste). Обнаружены некоторые различия между клонами кДНК Su(Ste) в нуклеотидных последовательностях - небольшие вставки, делеции и замены. Все кДНК образованы с транскриптов различных вариантов последовательностей Su(Ste), отличающихся от ранее описанных вариантов. Уровень полиморфизма между отобранными транскриптами Su(Ste) составляет 6,4% (с учетом точечных замен, дупликаций и небольших вставок/делеций, как единичных событий) и совпадает с процентом дивергенции между ранее описанными геномными копиями ( Balakireva et al., 1992 ). Таким образом, было показано, что не определенный класс, а значительная часть дивергиро-вавших копий кластера Su(Ste) транскрибируется. Скрининг той же библиотеки кДНК на Ste-гомологичный,зонд 1 ( рис.1А) выявляет те же Su(Ste)-гомологичные клоны,и не не выявляет транскриптов генов Ste, что подтверждает наличие супрессии

генов Ste в самцах XY.

изучение нуклеотидной последовательности кДНК позволило определить сайты полиаденилирования и направление транскрипции генов Su(Ste). Транскрипты 13 и 1512 полиаденилированы. Направление транскрипции Su(Ste) совпадает с направлением транскрипции супрессируемых гомологичных Stellate генов Х-хромосомы. Если проводить скрининг той же библиотекй на двунитевой зонд, включающий всю область гомологии Ste и Su(Ste) (зонд 1, рис.1А), то не выявляются ни транскрипты Ste генов, ни какие-либо другие кДНК, кроме приведенных в работе. Норэерн-анализ РНК из семенников с использованием смысловой меченой РНК, гомологичной практически всей транскрибируемой области Stellate гена, также не выявил сигналов, соответствующих антисмысловым Stellate РНК. Таким образом, предположение об антисмысловых взаимодействиях транскриптов Ste и Su(Ste) (Danilevskaya et al., 1991) как механизме супрессии , является малоовероятным.

Все транскрипты Su(Ste) продолжаются в Y-специфическую область, причем сайты полиаденилирования транскриптов 13 и 1512 различаются. Транскрипт 13 продолжается в Y-специфичес-кую область на 62 нуклеотида дальше , чем транскрипт 1512. Т.к. область Ste генов, содержащая сигнал полиаденилирования, замещена в Su(Ste) повторах на Y-специфическую область, по-видимому, в ней появляются и работают в процессинге Su(Ste) транскриптов новые сигналы полиаденилирования, например, в кДНК 13 ( рис.2).

Путем сравнения нуклеотидной последовательности отобранных кДНК с изученными копиями генов Su(Ste), а также со схемой процессинга Ste транскриптов (Livak, 1990) можно вывести экзон-интронную структуру Su(Ste) генов, их кодирующих. Все транскрипты Su(Ste) образуются путем удаления интрона, совпадающего со вторым интроном гена Ste (рис.2). Сайт сплайсинга на 3'-конце первого интрона во всех известных генах Su(Ste) изменен (AG на АС). В кДНК 511 используется альтернативный 3'-сигнал сплайсинга, расположенный на 4 пн- дальше, причем этот сигнал сплайсинга лучше соответствует консенсусу 3'-сайта для малых интронов ( Mount et al.,1992), чем тот.

Su(Ste) I Sttll«e-roMai»nr.»^ w«»»»^ ЩШШШ.У-специфито... rtj.y ~ШШЖ

.Met Val ™

SteMPHK А г? =КЛГ—

¡ctggcaac 1 V ijj 10™ [

кднк5и

v у Met r™" _

кДНК

кДНК 13 - { ■■ ^IBMIIF^ 1 '"

ясаях A

(3'фрагмент)

кДНК 15 Д/"

(З'фрытиент)

Рис 2. Альтернативные пути процессинга Su(Ste) генов. Схема генов Stellate, Su(Ste) и транскриптов SU(Ste). Открытая рамка, совпадающая со Stellate обозначена светлым прямоугольником, фрагменты двух других рамок - заштрихованным и черным прямоугольниками. Делеции обозначены перевернутыми треугольниками, цифра указывает число делетированных нуклео-тидов.

который используется в процессинге транскриптов Ste генов.

транскрипт 1512 позволяет представить другу» картину расположения интронов. Соответствующая копия Su(Ste) инеет новый интрон размером 70 пн в области гомологии со Ste, но отсутствующий в Ste транскриптах. Предполагаемые сайты сплайсинга можно считать каноническими, учитывая транскрипцию дивергентных копий Su(Ste) : например, в кДНК 511 в положении, соответствующем 51-сайгу сплайсинга копии Su(Ste) гена, кодирующей транскрипт 1512, присутствует GT.

Транскрипт 13 выявляет наличие короткого интрона размером 28 пн, имеющего канонический 31-сайт сплайсинга. Предполагаемый 51-сайт сплайсинга в известных копиях Su(Ste) вариабелен, им может служить последовательность AGCTATG, обнаруженная в одной из копий . Случаи исключения из правила , согласно которому последовательность интрона начинается с GT, были описаны. Например, показано использование СТ и GC в генах Gpdh и rudimentary D.melanogaster (Mount et al., 1992), а также GC в гене тнроэиназы мыши (Jackson et al., 1991). Возможно, что данная кДНК считана с неохарактеризованной копии Su(Ste), имеющей, например, подобный неканонический до-норный сайт сплайсинга.

Строго говоря, некоторые делеции в последовательностях кДНК могут отражать делеции в самих Su(Ste) повторах. Однако, во всех до сих пор описанных копиях (пять копий, описанных ранее и две копии, представленные в данной работе) делеции, соответствующие последовательностям гипотетических интронов, отсутствуют. ПЦР анализ фагов Р1 и косиид, содержащих гены Su(Ste), также не выявляет делеций в указанных районах. Это позволяет нам считать, что появление альтернативных сигналов сплайсинга в дивергировавших копиях генов Su(Ste) является причиной полиморфизма обнаруженных нами транскриптов генов Su(Ste).

На основе существования альтернативного характера про-цессинга можно рассмотреть возможность существования различных рамок трансляции Su(Ste) генов по сравнению с рамкой Ste генов (рис.2). Смещение акцепторного с4айта сплайсинга в кДНК 511 приводит к сбою ОРТ Ste, однако, в результате двух единичных делеций, эта рамка скоро восстанавливается. В резуль-

тате появления делеции из 10 п.н., характерной для генов Su(Ste), появляется стоп-кодон уже в области гомологии со Ste. В кДНК 1512 имеется замена G на А (рис.2), что приводит к появлению кодона ATG. Практически полное совпадение последовательности, лежащей непосредственно перед этим кодоном,с последовательностью, предшествующей сайту инициации трансляции в гене Stellate, наводит на мысль о появлении нового инициаторного кодона. Кроме того, нуклеотидные замены, существующие в известных копиях Su(Ste) в районе инициаторного кодона Ste, говорят о том, что здесь нет жесткого давления отбора, что также служит в пользу предположения о возможном альтернативном старте трансляции Su(Ste). Наконец, кДНК 13 имеет наиболее протяженную ОРТ, заканчиваюуюся стоп-кодоном в Y-специфической области.

Итак,показано, что гены локуса Su(Ste) транскрибируются в семенниках самцов D.melanogaster. Не считая транскриптов рРНК и сателлитных последовательностей, до сих пор было известно всего два транскрибирующихся гена Y-хромосомы - это ген динеина (Gepner it Hays, 1993), кодирующий соответствующий белок, и гистоно-подобные гены (скорее всего, нефункциональные) (Russell & Kaiser, 1993).

Различие сигналов сплайсинга и сайтов полиаденилирова-ния, гетерогенность экспрессирующихся копий Su(Ste), отсутствие единой ОРТ для всех транскриптов - все это скорее говорит против возможности образования белкового продукта генами Su(Ste). Скорее, учитывая сходство промоторных зон, супрессия может осуществляться на уровне конкуренции за транскрипционный фактор, что приводит к снижению экспрессии Ste генов в присутствии генов Su(Ste). Однако, нельзя исключить , что отдельные транскрипты могут кодировать белковый продукт. Одним из направлений нашей деятельности будет попытка получения экспрессии клонов кДНК Su(Ste) в E.coli с целью прямого подтверждения этого предположения. Предсказываемые белковые продукты Su(Ste) генов содержат области гомологии с белком Stellate и, так же как и он, имеют сходство с ß-субьединицей казеинкиназы 2. Можно предположить, что супрессия осуществляется на уровне образования протеинкиназного комплекса, где имеет место конкуренция белков - продуктов генов Stella-

te и Su(Ste), как изоформ ß-субъединицы казеинкиназы 2 - за связывание с каталитической субъединицей.

3. обнаружение и структурно-функциональная характеристика нового гена, родственного гену ß-субъединицы казеинкиназы 2.

Для изучения транскрипции локуса Su(Ste) Y-хромосомы была скринирована библиотека кДНК из семенников линии Canton S на зонд, являющийся фрагментом Y-специфической области Su(Ste) повтора (рис.1) Кроме транскриптов Su(Ste) генов, был отобран ряд кДНК (пять из проанализированных 1 ООО ООО фагов), первичная последовательность которых гомологична Su(Ste) лишь на 70%. Секвенирование этих клонов показало, что все они являются независимыми, т.к. различаются по протяженности 5' и 3'-концов, но абсолютно одинаковыми по первичной последовательности. Две кДНК полиаденилированы по одному и тому же сайту, совпадающему с положением такового для охарактеризованного выше транскрипта Su(Ste) 1512 (рис.2). Сайт полиадекилирования локализован в области, гомологичной Y-специфической области Su(Ste). Несмотря на то, что степень полиморфизма копий Su(Ste) кластера достаточно высока - 6.4% (МсКее & Satter, 1996), очевидно, что отобранные нами кДНК не являются транскриптами Su(Ste).

Ген, транскрипты которого были выявлены в семенниках, получил название SSL ( Suppressor-of-Stellate-like). В кДНК SSL выявляется протяженная ОРТ - 219 амк.(рис.з).

Для клонирования гена SSL был проведен скрининг космид-ной библиотеки, приготовленной из линии рп2а ; в качестве зонда был использован 3'-концевой EcoRI фрагмент кДНК 911 (рис.3) размером 0,7 т.п.н.. Из 16000 проанализированных клонов было отобрано 4, содержащих ген SSL. Такая представленность характерна для уникальных последовательностей (однократный геном D.melanogaster содержится в 4000 космидных клонах). BamHI фрагмент размером 2,3 тпн из космиды 9 был субклонирован в вектор pTZ19R и секвенирован (рис.3)-.

Гомология между генами SSL, Ste и Su(Ste) распространяется практически на всю кодирующую область генов SSL и Ste (рис.4). Гомология между SSL и Su(Ste) генами продолжается в

tgqgttaaggtgtatgctgttataagggtatgacctgcctgaagggttcatcagggcagcatcaatgatgtcaatagtggagcaccgcacccttcgtttccccttgagcaactggagcat 120

caqgactacgttctggtcattacaqactitqttttcicqgcctaqqcttccaagaaaqccaqgcttctqqctaqccttgccgatttqacgagtttgaoatctttqtaaaqqqcatcqacitce 240

T

tcqqqcqataaaqqqtttqqaacactqctqccctqtcqcaqccctqacatttqaattqttqtcactqagctgtctgtcattatgaaatagtaqqtctcqtcattTTGCACTGTACTTTTT 360

CATTATATTTTATTCGAGTGAGCATGTCGTGTCCgtaagtaactaggtttttcctataaaaatcatagcaaattacaccaaaatcttttagCAGGAGCATCGAGATACCAGATGGCAGTT 480 M 5 С P RSIEIPDGS

ECORI

ggatcgattggttcctgggaatcaagggccacgaatrctcctgccgggtgcccaatgaatac^^ 600

widwflgikchefscrvpniyiqdkfnltglefdsqtlev

tcttagatccgoagttcgacaacgaggactgggactgcgccoaagagaagaagctgtatggcatgatccatgcacggtacatcgtttcgccgcgtggcattgaagatatgcgattaaagt 720 vldpefdnedwdcaeekklygmiharyivsprgiedmrlk

Bglll

acgaaaggggggacttcggatcgtgtccgagagtcttttgtaagaggcagaaagtcctgccagtgggccttcacgacgtgtgggacaaggcccaagttm<s^rc7attgccctagctgca 9 4 0 yergdfgscprvfckrqkvlpvglhdvwdkaqvkiycpsc

t "rH1

acaacgtctacatcccgctaccccacaatggaatgctggacggagccatgttcgggaccagcttcccgcatatgttcittatgcagctgccg/igccxgataccctctccgcccgtggaga 960 nhvyx plphngmldgamfgts fphmffmqlpsli ps p p v e i

AGTACATCCCCCGgtgagtaattcttcgaatataatccttgttcttttctacacaaagcacttgcacttccagTATCTATGGCTTCCAGTTGCACAAGAAGGCCCTGATGCCGCCCGAAT 1080 ktcipr iygfqlhkka.lmppb

CAGCAGAGTCCCCGCCAATAAAGGTCGAATCCTCGCTCAGCAAGTCCCCCTCCTGGCTAAGC.AATGTCCCGAATTTTTAACTCCACACGAACAAAGCACACAAATGTTGGTTTGGTCTGT 1200 saesppikvessvskspswlrnvpnf ***

1320

TCATTCGAAAAGCAAAqcqtacttqccqttaataataqtaatcaectqqqaatteaaaaatqaaqcaqctttaaacaqcctattcatceaettantattqteaqaeaetqegaqaaaatg 1440

|поли(А) BaaHI

gttggaaagttctgtgcacggtctaaatataattaggatce

Рис.3 Нуклеотидная и аминокислотная последовательности гена и предполагаемого белка SSL. Последовательность наиболее длинной кДНК обозначена большими буквами. Другие сДНК SSL имеют следующую протяженность: нуклеотиды 356-1161, 454-193, 454-1336 плюс поли(А) хвост и 473-1301. Отличия кДНК и геномной последовательности обозначены жирными буквами над (для нуклеотидов) и под (для, аминокислот) геномной последовательностью. Нуклеотиды с 226 по 300, гомологичные 5" нетранскрибируемой области Stellate генов, подчеркнуты. Последовательность, гомологичная Y-специфической области Su(Ste) дважды подчеркнута. Терминирующий кодон обозначен тремя звездочками.

SufSte)

SSL

ОЛт.п.н

/ / ~П\/ 25 kDa fyT

"полиА

Л

tx

Ste

И /

Af

IQ^SkDa |уП~полиА

Рис.4. Схема структуры генов Ste, Su(Ste), SSL и их транскриптов. Области гомологии Ste,Su(Ste) и SSL незаштри-хованы, Y-специфическая область Su(Ste) и гомологичный ей район в SSL - затемнены, заштрихованные участки обозначают Х-специфические районы Ste гена и гомологичные им участки в SSL. Тонкой линией обозначена последовательность гена SSL, не гомологичная ни Stellate, ни Su(Ste) генам. Зонд, использованный для скрининга бибилиотеки кДНК, указан. Мобильный элемент 1360 указан черным треугольником. Размер предполагаемых белковых продуктов указан в кД.

Y-специфическую область и обрывается через 30 пн после сайта полиаденилирования SSL. В 51-области гомология резко обрывается сразу перед инициаторным кодоном гена Stellate. Предполагаемая прокоторная область гена SSL (рис.4; рис.з , подчеркнутая последовательность с 226 по 300 пн) высоко гомологична 5' нетранскрибируемой области Stellate генов, однако расстояние между этим участком и Мет кодоном в Stellate генах больше,чем в SSL. Эта область отсутствует в Su(Ste) повторах. Сравнение последовательностей кДНК SSL и соответствующей геномной выявляет существование двух интронов размером 57 и 60 пн с каноническими сайтами сплайсинга (рис.з). Положение интронов SSL совпадает с таковым для Ste генов. Кроме того, последовательности интронов генов Ste и SSL высоко гомологичны (на 88%).

Коскида 9 была использована для постановки гибридизации in situ с полигенными хромосомами D.melanogaster. Единственный выявляемый сайт гибридизации - эухроматический сайт 60D1.2, в терминальном районе правого плеча второй хромосомы. Гибридизация in situ на хромосомах вида-близнеца D.simu-lans, с субклоном космиды 9, содержащим 2,3 т.п.н. BamHI фрагмент, выявляет тот же район.

Саузерн анализ геномной ДНК линии Батуми, расщепленной рестриктазами BanHI и PstI, не имеющими внутреннего сайта в гене SSL, выявляет единственный фрагмент при гибридизации с кДНК SSL. При расщеплении геномной ДНК рестриктазами EcoRI и Bglll, имеющими сайт внутри гена SSL, и гибридизации с тем же зондом, выявляются два фрагмента. Данные Саузерн анализа указывают на отсутствие где-либо в геноме дополнительных копий гена SSL, а следовательно, на его уникальную представленность. Кроме того, после окраски бромистым этидием BamHI рестриктов космиды 9 интенсивность свечения фрагмента, содержащего ген SSL, была пропорциональна размеру фрагмента, что указывает на отсутствие тандемной организации SSL в геноме. Все сказанное позволяет сделать вывод об уникальности и эухроматиновой природе гена SSL.

С использованием рибопробы, комплементарной кодирующей

цепи Р-субъединицы казеинкиназы 2 (0СК2) было показано, что 0СК2 экспрессируется на всех стадиях развития дрозофилы. Максимального уровня транскрипция |$СК2 достигает на эмбриональной стадии, а также в культуре клеток дрозофилы (рис.5, верхняя часть). Высокий уровень транскрипции у самок обусловлен, вероятнее всего, присутствием тканей яичников и большого количества эмбрионов, где экспрессия fcK2 достигает максимума.

Нозерн-анализ экспрессии гена SSL выявляет его специфическую транскрипцию в семенниках (рис 5 , слабый сигнал в препарате РНК из самцов обусловлен присутствием семенников). В препарате РНК, выделенном из самцов после удаления семенников, также как и в препаратах РНК, выделенных из культуры, эмбрионов, личинок, куколок и взрослых самок транскриптов SSL не выявлено. Размер транскрипта составляет примерно 1000 н, что удовлетворительно соответствует размеру наиболее протяженной кДНК (872 Н без поли(А)).

Разницы в уровне экспрессии SSL в семенниках самцов ХО и XY не выявлено, хотя известно, что экспрессия Ste генов на два порядка выше в сперматоцитах ХО самцов, чем в XY (Livak, 1990). Это подтверждает предположение о различиях в регуля-торных сигналах транскрипции и трансляции этих высоко гомологичных генов.

В транскриптах SSL выявляется протяженная ОРТ, способная кодировать белок с мол. массой 25 кД, идентичный на 45% с аминокислотной последовательностью (5сК2 дрозофилы и на 5 3% с белком - продуктом гена Stellate (рис.6). Несмотря на прерывистость в гомологии, видно, что она прослеживается на протяжении всей аминокислотной последовательности сравниваемых белков, за исключением С-концов SSL и fCK2. С-конец предполагаемого продукта SSL длиннее, чем у Ste белка, на 40 аминокислотных остатков. Именно С-концевой домен |}СК2 отвечает за связывание с (Х-субъединицей, что необходимо для стабилизации четвертичной структуры фермента и повышения его ферментативной активности (Boldyreff et al., 1993). Вторичная структура С-конца $СК2 обеспечивается высоко консервативными остатками пролина, присутствующими также в белке SSL.

Рис.5. Транскрипция генов SSL и 0СК2. Ноэерн анализ РНК, выделенных из культуры клеток D (1), каркаса самцов ХУ после удаления семенников (2), семенников самцов линии дЬи? (3), эмбрионов (4), личинок (5) , куколок (б), самцов (7) и самок (8) той же линии. Гибридизация с однонитевой РНК-пробой, комплементарной кодирующей цепи {ЗСК2 (верхняя часть). Гибридизация того же фильтра с рибопробой, комплементарной плюс-цепи гена SSL (средняя часть). Тот же фильтр гибридизо-ван в пробой гр49 (нижняя часть) для контроля количества нанесенной РНК.

Glu/Asp-богатцй район

Ste PfElflJ^^^SsSSGLLYGDE-------^^S^^^iRSERGLI

p CK2 RYQI QLQ|AANFKMPLR5J?N

ssl IlmppesIesppikvessvskspswlrnvpnf

Рис.6. Сравнение аминокислотных последовательностей SSL, (5-субъединицы каэеинкинаэы 2 и белка Stellate. Позиции идентичных аминокислот заштрихованы. Отмечены районы, обогащенные остатками Asp/Glu, и С-концевой домен. Аминокислотные остатки в составе "мотива", обогащенного остатками цистеина, заключены в прямоугольники. Положения интронов в кодирующей области (ЗсК2 обозначены треугольниками: черными (общие для дрозофилы, нематоды и человека), заштрихованным (общий для дрозофилы и человека) и светлыми (специфичные для дрозофилы) .

Важную роль в негативной регуляции СК2 играет район "кислых" аминокислот - аспарагиновой и глутаминовой, расположенный на расстоянии 55-65 аминокислотных остатков от N-конца (Meggio et al, 1994). Считается, что область "кислых" аминокислот отвечает за негативную регуляцию активности казеинкиназы и субстратную специфичность фермента. В продукте гена Ste отсутствуют 5 из б кислых остатков, поэтому он не способен вызывать те регуляторные эффекты, которые оказывает 0СК2, связываясь с QCK2 (Bozzetti et al., 1995). Напротив, в белке SSL область "кислых" аминокислот высоко консервативна (рис.б). SSL, как и Ste белок, содержит "мотив", обогащенный остатками цистеина (рис.б). Этот участок высоко консервативен у РСК2 из разных видов, он определяет белок-белковые взаимодействия. Таким образом, белок SSL содержит основные регуляторные районы, необходимые для его функционирования как изоформы рек2.

4. эволюционная история и возможная функция гена SSL.

Сравнение экзон-интронной структуры генов SSL и РсК2 позволяет сделать вывод об участии обратной транскриптазы в возникновении гена SSL. Кодирующая область РСК2 гена содержит 5 интронов (рис.6). Первые четыре интрона содержатся в генах, кодирующих 0СК2 у других эукариот (нематоды и человека, рис.б), пятый интрон обнаруживается пока только у D.me-1anogaster. Ген SSL не содержит трех первых ингронов. Удаление этих интронов произошло точно, без нарушения непрерывности гомологии соседних экзонов как на нуклеотидном, так и на аминокислотном уровне (рис.б). Границы четвертого интрона идентичны в генах SSL и (5СК2. Пятый интрон расноложен в 31 части гена рСК2, где уже отсутствует гомология с SSL, поэтому невозможно сделать определенных выводов относительно причин его потери. Точное удаление трех интронов позволяет предположить,что ген SSL возник путем ретропозиции "полупро-цессированного" транскрипта рСК2 либо путем дупликации гена РСК2 с последущей рекомбинацией новой копии (ее центральной части) с кДНК РСК2. В любом случае, точное вырезание трех интронов в гене SSL по сравнению с предковым геном РсК2 указывает на участие обратной транскриптазы в процессе обра-

зования гена SSL.

Является ли вновь возникший ген, родственный 0СК2, функциональный геном? Ряд указаний свидетельствует о тон, что кодирующая способность SSL находится под давлением естественного отбора: 1. SSL активно транскрибируется в спермиоге-незе.Он содержит ОРТ, способную кодировать белок, гомологичный ($СК2 на 45SS. Прерывистость в белковой гомологии генов SSL и РСК2 (рис.6) тем не менее не нарушает непрерывность гомологии этих белков на всем их протяжении. 2. Для генов SSL и $СК2 величина отклонения от случайного использования синонимических кодонов (codon usage bias) (Shields et al., 1988) достаточно заметна. Более того, эта величина достоверно возрастает в 1,6 раза для гена SSL по сравнению с 0СК2. Это указывает на наличие отбора, поддерживающего определенные кодоны, благоприятствующие более активной трансляции гена SSL. 3. Последовательности гена SSL и его кДНК представляют собой аллельные варианты гена из разных линий дрозофилы . Они отличаются двумя синонимическими и одной несинонимической заменами в кодирующей области и одной заменой в 5' нетранслируемой области. Степень такого внутривидового полиморфизма ДНК (около 5 замен на 1000 п.н.) характерна для многих функциональных генов Drosophila (Aquadro, 1992) . 4. Ю.Я.Шевелев оценил величину синонимической дивергенции между генами SSL и (ScK2. Во-первых, она превышает величину несинонимической дивергенции в три раза,- что характерно для генов, находящихся под давлением отбора. Во-вторых, на основании величины синонимической дивергенции можно примерно подсчитать время дивергенции генов, составляющее около 50 млн. лет (время существования вида D.melanogaster составляет около 1.5-2.0 млн.лет (Lachaise et al., 1988)). Следовательно, длительное поддержание последовательности SSL в эволюции геномов дрозофилы с сохранением его кодирующей способности указывает на функциональность этого гена.

Приведенные выше доказательства говорят в пользу того, что SSL является функциональным геном. В отличие от $СК2, экспрессирующейся на всех стадиях развития с максимумом на эмбриональной стадии, SSL экспрессируется только в семенниках. Возможно, что белок SSL, являясь тканеспецифичной изо-

формой 0СК2, модулирует субстратную специфичность или уровень активности СК2 в сперматогенезе Drosophila, процессе, сопряженном со сложными процессами роста и дифференцировок.

5. Эволюционные взаимоотношения семейства родственных генов - B8L, Вte, 8u(Ste) и рскг.

РСК2 является высоко консервативным белком у всех эука-риот, от дрожжей до человека. Ген, кодирующий РСК2, представлен уникальной последовательностью в геномах изученных организмов . Для Drosophila melanogaster также показано существование уникального гена, кодирующего Р субъединицу СК2 (Saxena et al., 1987). Однако, в геноме D.melanogaster существуют гены, имеющие ОРТ, высоко гомологичные РСК2 . Это кластеры гетерохроматических генов Stellate и Su(Ste) в X и У хромосомах. Ste-белок имеет 38% гомологии с РСК2. Более того, он способен образовывать активный комплекс с Д-субь-единицей СК2. Пока неясен вопрос о кодирующей способности транскриптов Su(Ste), однако выявляемые в них ОРТ также содержат районы высокой гомологии с РсК2 . Эволююционное происхождение этих семейств генов неясно.

В данной работе представлена молекулярная характеристика нового гена SSL ( Su(Ste)-like ), транскрибирущегося в семенниках D.melanogaster, открытая рамка трансляции которого высоко гомологична таковой в гене РсК2 . Нуклеотидная последовательность и экзон-интронная структура гена SSL более близка генам кластеров Stellate и Su(Ste) (рис.4). Обнаружение гена SSL позволяет установить эволюционные взаимоотношения в семействе генов, родственных гену РсК2. Очевидно, что гены SSL, Ste и Su(Ste) имели общего предка, который отделился от гена РсК2 и приобрел новые тканеспецифичные регу-ляторные элементы. В дальнейшей произошло отделение предко-вого гена, общего для генов Ste и Su(Ste). Т.к. гены SSL и Ste преимущественно имеют гомологию в 5'-области, a SSL и Su(Ste) - в З'-области (рис.4), можно предположить, что произошло два независимых акта частичной дупликации общего предка Ste/Su(Ste). На относительно недавнем этапе эволюции генома D.melanogaster произошли по крайней мере два акта амплификации генов-предшественников с образованием гетерох-

1.53 (50 Млн.л.)

0.77

(25 Млн.л.) 0.20 (бМлн.л.) /

/ЗСК2

SSL

Su(Ste/

чг ЭУ

Рис.7. Генеалогическое древо для семейства генов, родственных ^СК2. Цифры без скобок обозначают величину синонимической дивергенции для всех указанных пар генов (расчет произведен Ю.Я.Шевелевым), а величина в скобках обозначает оцененное на основе этих величин время дивергенции в миллионах лет. Ste эу обозначает эухроматический тип генов Stellate, а Ste гет - гетерохроматический.

роматических кластеров Ste и Su(Ste) в геноме D.melanogaster и близких видов. Эти взаимоотношения представлены на эволюционном древе (рис.7), построенном с участием Ю.Я. Шевелева на основе оценок величин синонимической дивергенции для пяти родственных генов: |5сК2, SSL, Su(Ste), Ste-reT. (кластер, расположенный в конститутивном гетерохроматине Х-хромосомы) и Ste-эу (кластер из района 12Е, который можно отнести к ин-теркалярному гетерохроматину). Это первый случай , демонстрирующий образование протяженных участков конститутивного гетерохроматина путем амплификации функционирующих эухрома-тических генов.

Хотя эволюционные связи между генами SSI, Stellate, Su(Ste) и ($СК2 прояснены, их функциональные взаимоотношения в геноме требуют дальнейшего изучения.

ВЫВОДЫ

1. В фаге Р1 и космидах клонированы протяженные районы Y-хромосомы, включающие кластер генов Suppressor-of-Stella-te, супрессирующих транскрипцию кластера генов Stellate в Х-хромосоме. Показано, что полиморфизм генов Su(Ste) по длине вызван инсерцией (165 п.н.) с образованием повтора размером 2,8 т.п.н. Показана кластеризация копий Su(Ste) размером 2,6 т.п.н, что указывает на существование механизмов гомогенизации генов кластера Su(Ste).

2. Дивергировавшие гены кластера Su(Ste) Y-хромосомы транскрибируются и процессируются с использованием различных путей сплайсинга и полиаденилирования. Совпадение уровня дивергенции последовательностей ДНК и кДНК (6,4%) показывает, что транскрибируется значительное число дивергировавших копий кластера. Направление транскрипции Su(Ste) генов совпадает с направлением транскрипции супрессируемых гомологичных генов Stellate, что делает маловероятной гипотезу о механизме супрессии с участием антисмысловой Su(Ste) РНК.

3. Обнаружен и охарактеризован новый эухроматический уникальный ген, названный SSL, OPC которого высоко гомологична гену Р-субъедииицы казеинкиназы 2 (f$CK2), а экзон-интронная структура и нуклеотидная последовательность близка к генам Ste и Su(Ste) Х- и Y-хромосом. Ген локализован гибридизацией in situ на политенных хромосомах в сайте 60D1.2 эухроматина второй хромосомы. Нозерн анализ показал специфическую экспрессию гена SSL в семенниках.

4. Сравнение экзон-интронной структуры гена SSL с геном (5-субъединицы казеинкиназы 2 (¡}СК2) позволяет заключить, что ген SSL является ретрогеном, лишенным части интронов гена РСК2, дивергировавшим под селективным давлением. SSL является предком семейств гетерохроматических повторяющихся генов Ste и Su(Ste), образовавшихся в результате амплификации гена SSL.

Список работ, опубликованных по теме диссертации:

1. А.И.Калмыкова, А.А. Добрица, В.А.Гвоздев. Ген PcK2tes кодирует образование тканеспецифичной регуляторной субъединицы казеинкиназы 2 у Drosophila melanogaster. Биохимия, 1997. Т.62, N5, с.535-540.

2. А.И.Калмыкова, А.А. Добрица, В.А.Гвоздев. Экспрессия гена Y-хромосомы Drosophila melanogaster, кодирующего изо-форму регуляторной Р-субъединицы казеинкиназы 2. Молекулярная биология, 1997. Т.31, N 3, с. 462-467.

3. Alia I. Kalmykova, Yury Y. Shevelyov, Anna A. Dobritsa, and Vladimir A. Gvozdev. Acquisition and amplification of a testis expressed autosomal gene, SSL, by the Drosophila Y chromosome. Proc. Natl. Acad. Sci. USA, in press.

4. Gvozdev V.A., Kogan G.L., Tulin A.V., Kalmikova A.I., Kramerova I.A., Rasheva V., Tolchkov E.V. Stellate genes on the X-chromosome and their Y-linked suppressors. 14th European Drosophila Research Conferece, Venecia, Italy, Abstract Book, p. 103, 1995.

5. Kalmikova A.I., Shevelyov Y.Y., Dobritsa A.A., Gvozdev V.A. Autosomal gene and the X- and Y-linked heterochromatic repeats share a high extent of homology between encoded open reading frames. 37th Annual Drosophila Research Conference. San-Diego. 1996. Abstract Book, p. 151.

6. Gvozdev V.A., Kalmikova A.I., Dobritsa A.A. Alternative ways of processing and conceptual translation of RNAs encoded by tandem repeats in a Y-chromosome of Drosophila melanogaster. 37th Annual Drosophila Research Conference. San-Diego. 1996. Abstract Book, p. 10.

7. Shevelyov Yu., Kalmykova A., Dobritsa A., Gvozdev V. Evolutionary relashionship of a newly arised SSL gene to casein kinase 2 P-subunit gene. Stellate and Su(Ste) sequences of Drosophila melanogaster. 38th Annual Drosophila Research Conference. Chicago. 1997. Abstract Book, p.238.