Бесплатный автореферат и диссертация по биологии на тему
Клонирование, экспрессия и анализ экзон-интронной организации гена, кодирующего новый ДНК связывающий белок IRLB человека
ВАК РФ 03.00.03, Молекулярная биология

Автореферат диссертации по теме "Клонирование, экспрессия и анализ экзон-интронной организации гена, кодирующего новый ДНК связывающий белок IRLB человека"

российская академия наук

институт молекулярной биологии п.. НА. эн^ельгардга

Р Г Б На правах рукопися

16 пип г- • удк577.2м

СТАСИВ Юрий Зиновьевич

клонироваще^ч экспрессия и анализ экзон-интронной организации гена, кодирующего новый днк-связывающий -

белок нгьв человека. г \

03.00.03. ' молекулярная биология

АВТОРЕФЕРАТ

диссертации на сонсканне ученой степеяя кандидата биологических наук

москва - 1994

Работа выполнена г. лаборатории молекулярных основ онкогенеза Института молекулярной биологии им.В.А.Энгельгардтс. РАН.

Научный руководитель: доктор биологчческих наук А.В.Иткес.

Официальные оппоненты: доктор биологических наук С .Г .'Бавыкин, кандидат биологических наук Л.Г.Николаев.

Ведущая организация - Институт биологии гена РАН.

Институте молекулярной биологии им.В.А.Энгельгардта РАН по адресу: 117984, Москва, ул.Вавилова, д.32.

С диссертацией можно ознакомиться в библиотеке Института молекулярной биологии им.В.А.Энгельгардта РАН.

J

Зашита диссертации состоится

1995 года

заседании Диссертационного совета 002.79.01 при

Автореферат разослан 199^го

года.

Ученый секретарь Диссертационного совета кандидат химических наук

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Ген с-тус представляет собой клеточный аналог онкогена v-myc вируса миелоцитоматоза птиц. ДНК-сьлзываюший фосфобелок Мус, продукт гена с-тус, играет важную роль в регуляции клеточной пролиферации и дифференцировки (Магси et ai., 1992). Нарушения в структуре 4 гена (амплификация, хромосомные транслокааии, точечные мутации) могут изменять нормальное пролиферативное состояние клеток и вызывать их злокачественное перерождение (Cole, 1986). Регуляция экспрессии гена с-тус осуществляется на разных уровнях - инициации и элонгации транскрипции, стабильности РНК, трансляции, ауторегуляции (Marcu et al., 1992) - с вовлечением ряда клеточных факторов. В настоящее время во многих лабораториях активно изучают транскрипционные фак-торы (ТФ), участвующие в регуляции инициации транскрипции этого гена (Ray & Miller, 1991; Bossone et al.,, 199?; Pyrc et al., 1992; DesJardins & Hay', 1993).

Большой интерес представляет поиск и изучение ТФ, вовлеченных в интерферон(1РН)-зависимую регуляцию экспрессии гена с-тус (Kelly et ai., 1985). Ген с-тус человека содержит четыре ISRE (interferon-¿timuTàted response element) подобных участка (A)exandrova et al., 1990). Эти участки обнаружены в регуляторных областях многих lFN-зависимых генов (Williams, 1991). Консенсус 1SRE имеет структуру GGAAAN(i 3)GAAA. Первый ISRE-подобный участок ¡rlA (JSRE-iike с-тус A site) расположен в 5'-некопирующей области гена и имеет координаты -76/-67 относительно точки инициации транскрипции Р1 (+1), второй участок irlB расположен между основными стартами транскрипции Р1 и Р2 (+100/+110). IFN-зависимая регуляция транскрипции гена с-тус, вероятно, осуществляется через связывание специфических ТФ с этими участками.

Ранее в ядерном экстракте клеток HeLa обнаружены два белка, :вязывающиеся с элементами 1SRE генов с-тус и 6-16 (Turpaev et il., 1991 ).. Одним из них, имевшим одинаковое сродство к _ 1SRE енов с-тус и 6-16, возможно, является какой-либо из известных FN-индуцйбельных чТФ: С (Imam et al., 1990; Pine et ai., ,1990), I1-2 (Rutherford et al., 1988) и/или IRF-2 (Harada et al., 1989).

Тогда как другой белок, константа связывания которого с ISRE гена с-тус превышает таковую для гена 6-16, по-видимому, ранее не был описан.

Естественным продолжением этих исследований (Alexandrova ef а/.,. 1990; Turpaev et а/-.,- 1991) мог бы стать структурно-' функциональный анализ обнаруженного белка. В настоящее время наиболее рациональным подходом к изучению ДНК-связываюших белков служит молекулярное клонирование кодирующих их генов.

Цель и задачи исследования. Основная цель настоящей работы состояла в обнаружении гена, кодирующего новый белок, который связывается с ISRE-повобной последовательностью гена ' с-тус человека.

В ходе исследования предполагалось решение следующих экспериментальных задач:

1. Клонировать кДНК белкового фактора, связывающегося с ISRE-noflofiiHoñ последовательностью гена с-тус человека, установить первичную структуру кДНК и на этой основе - первичную структуру кодируемого ею белка.

2. Изучить влияние интерферонов на экспрессию клонированного

гена.

3. Получить бактериальный штамм-продуцент исследуемого белка.

4. Исследовать специфичность связывания полученного белка с участками ISRE различных интерферон-зависимых генов.

5. Определить участок связывания белка в гене с-тус.

6. Клонировать ген, кодирующий исследуемый белок, установить его первичную структуру и экзон-интронную организацию.

Научная новизна и практическая ценность работы. Клонирована кДНК, кодирующая новый ДНК-связывающий белок JRLB, участок связывания которого находится в промоторной области гена с-шус человека. Установлена первичная структура кДНК 1RLB и соответствующая ей аминокислотная последовательность белка IRLB. В С-концевой области белка обнаружен мотив, называемый "лейциновой застежкой" (leucine- zipper), что позволяет отнести IRLB к соответствующему семейству ДНК-связывающих белков. Получен бактериальный штамм-продуцент 1RLB. В опытах по сдвигу полосы связывания в геле (еleetrophoretic mobi¡ity-shift assay) показано, что сродство продуцируемого в E.coli белка к

двуцепочечным (дц) олигонуклеотидам, содержашим элементы 1SRE различных IFN-завпсимых генов, убывает в следующем порядке: irlB (гек с-тус) > 1SRE (ген 6-16) > ISRE (ген 9-27) > ¡г1А (ген с-тус). Методом защиты от ДНКазы (DNasel footprinting) определен участок связывания, IRLB в промоторной области гена с-тус человека.. Защищаемая область имеет координаты +98/+112 и включает IFb'-индуцийельный элемент friß (+100/+110). Клонирован фрагмент хромосомной ДНК (18,5 тпн), содержащий ген IRLB человека и построена физическая карта локуса IRLB. Определена нуклеотидная последовательность гена IRLB и установлена его экзон-интронная организация. 3 геномах эволюционно удаленных видов животных обнаружены нуклеотидные последовательности, гибридизующиеся в нестрогих условиях с кДНК IRLB. Показано, что в диплоидных' фибробластах человека образуется пять видов мРНК IRLB. Обнаружена стимуляция синтеза мРНК 1RLB интерферонами 7 и а.

Данная работа вносит вклад в изучение IFN-зависимых процессов, контролирующих регуляцию экспрессии- прото-онкогена с-тус, что может быть использовано в поисках рациональных путей терапии некоторых форм злокачественных заболеваний у человека.

Структура и об "ем работы. Диссертация изложена на /зо страницах машинописного текста и включает следующие главы: Роль ' ДИК-свЯзывающих белков в регуляции инициации транскрипции у эукариот (обзор литературы), Материалы и методы, Результаты и их обсуждение. Выводы и Список литературы ( /£еЭ наименований ). Диссертация содержит /-^рисунков и 1 таблицу.

Апробация. Основные, результаты работы докладывались и обсухдались на X Российско-германском симпозиуме "Структура и функция генома" (Суздаль, ,1993); III отчетной конференции ГНТП "Приоритетные направления генетики" (Москва, 1993); V Всероссийской конференции по генетике соматических клеток в культуре (Черноголовка, 1993), IV Всероссийской конференции "Геном человека" (Черноголовка, 1994); международном симпозиуме "Genome Mapping к Sequencing" (Cold Spring Harbor, 1994); международном симпозиуме "Современные тенденции в вирусологии и иммунологии опухолей" (Москва, 1994); конференции Института молекулярной биологии им.В.А.Энгельгардта РАН с участием International Advisory Board (Москва, 1994).

Публикадии. По материалам диссертации опубликовано 3 печатных работы. ...

ОСНОВНОЕ СОДЕРЖАНИЕ'РАБОТЫ

1. Скрининг библиотеки кДНК из фибробластов человека.

Первым этапом исследования был функциональный скрининг экспрессируюией библиотеки кДНК с целью обнаружения в ней клонов, кодирующих белки, связывающиеся с вторым 1811Е-подобным участком гена с-тус человека - 1г1В.

Для скрининга библиотеки кДНК применили дц олигонуклеотид 5" §агсОССО(ЗОЛААААСААС(3(ЗА3', содержаний элемент ¡г1В с фланкирующими нухлеотидами и выступающие 5'-концевые 4-нуклеотид1ше линкеры (обозначены строчными буквами). Дц олигоиуклеотиды олигомеризовали в реакции лигирования. Один из полученных дц олигомеров (гекса-/гУВ)" радиоактивно метили и использовали в качестве зонда для поиска связывавшихся с ним гибридных полипептидов. В результате анализа 3*105 клонов фаговой библиотеки кДЙК из фибробластов человека (С1оп1есЬ) в экспрессируюшем векторе Х§111 отобрали четыре клона,, гибридные полипептиды которых связывали ДНК-зонд.

2. ДНК-связываюшие свойства гибридных полипептидов.

В опытах по сдвигу полосы связывания в геле исследовали

специфичность связывания гибридных полипептидов ' с дц олигонуклеотидом ¡г]В. Оказалось, что белковый продукт только , одного (Адг—Ь/62/4) из четырех клонов, отобранных в результате скрининга, ' способен образовывать комплекс с 1511Е-подобным элементом (Рис.1). Связывание с ¡г!В гибридного полипептида оказалось специфичным. Так, при инкубировании фаголизатов

бактерий, инфицированных фагом xgt-L/62/4, с меченым ¡г1В в присутствии 30-кратного молярного избытка немеченого ¡г¡В интенсивность полосы связывания, . соответствующей специфичному ДНК-белковому : комплексу, ослаблялась (Рис.1). Доказательством того, что ДНК-связывакшая активность в гибридном белке - продукте клона лgt-L/62/4 принадлежит не р-галактозидазе, а слитому с ней. эукариотическому 'полипептиду 1Ш.В, служит отсутствие специфичной

ДНК-связывающей активности в фаголизате бактерий, инфицированных диким типом фага >gtll (Рис.1).

Рис.1. Электрофоретический анализ (5%-ный ПААГ) связывания белков из фаголизатов бактерий, инфицированных фагами Xgt-L/62/4 (fuse) и Agtll (wild), с меченым дц олигонуклеоти-дом irIB в присутствии (+) и отсутствии (-) 30-кратного молярного избытка немеченого irIB. Комплекс рекомбинантного белка из фаголиза-та Agt-L/62/4 с ¡г1В показан стрелкой. Контрольная дорожка (free) -олигонуклеотид без добавления белка.

3. Структура фрагмента клонированной кДНК.

Для определения нуклеотидной последовательности фрагмента EcoRL-£coRI (655 пн) клона Agt-L/62/4 проводили его субклонирование в плазмидном векторе pUC19. Полученную рекомбинантную конструкцию обозначили pUCIRL. Клонированный фрагмент кДНК плазмиды pUCJRL секвенировали по методу Sanger (1977). " " '

Компьютерный анализ клонированной кДНК с помощью пакета программ /PC/GENE показал, что наиболее протяженная открытая рамка считывания (ОРС) состоит из 573 пн. Основная ОРС клонированного фрагмента совпадает с ОРС гена lacZ (Agt11), - свидетельство того, что эта ОРС кодирует полипептид, способный в составе гибридного белка связываться с ¡SRE-подобной последовательностью гена с-тус. В других рамках размеры ОРС не превышают 100 пн. Таким образом, клонированная кДНК может кодировать полипептид, состоящий из 191"аминокислотного остатка. 8 положении 646(574) на холится стоп-кодон ТАА, между ним л З'-кскиом кДНК расположены

fuse wild - + - +

free

та^»

еше два стопч-кодоча - ТАА и TGA . Участок ААТАА,

703(631) 712(640)

подобный сигналу полиаденилирования (ААТААА), расположен з позиции 701(629) (на Рис.3 показан точками).

Первый ATG кодон в ОРС расположен в положении 191(119), однако; он не имеет характерного для инициаторных кодонов эукариотических генов нуклеотидного окружения, называемого консенсусом Козак. Структура минимального консенсуса Козак -9nNANNATQG, где N - любой нуклеотид, а инициаторный кодон подчеркнут (Kozak, 1989). С другой стороны, эукариотические мРНК, как правило, имеют на своем 5'-конце нетранслируемую область, в которой в рамке считывания белкового продукта часто расположены) стоп-кодон(ы). В довольно протяженной 5'-некодирующей области кДНК клона L/62/4~(более 100 пн) нет ни одного терминирующего кодона. Следовательно: либо клонирован фрагмент полноразмерной кДНК, лишенный 5'-концевой области (что довольно часто происходит при конструировании библиотек кДНК), либо кДНК полноразмерна, и синтез белка инициируется с первого или второго AUG. Истиный(е) размер(ы) экспрессируюиейся(ихся) в клетке мРНК можно установить методом Northern-гибридизации, а размер белкового(ых) продукта-(ов), кодируемого данной мРНК - методом трансляции in vitro.

Кодируемый кДНК подчпептид. назван. IRLB (то есть, белок, связывавшийся с участком i г IB гена с-тус человека).

4. Экспрессия гена IRLB.

Экспрессию гена IRLB в диплоидных фибробластах человека изучали методом Northern-гибридизации. Суммарную РНК из клеток человека выделяли по методу Chomczynski & Sacci (1987). Фракционированную в геле РНК иммобилизовали на фильтре Hybond N и гибридизовали с радиоактивным одноцепочечным (оц) антисмысловым РНК-зондом, представлявшим собой продукт транскрипции in vitro некодирующей цепи кДНК IRLB. Оказалось, что в фибробластах человека обнаруживается пять видов мРНК IRLB с размерами 7,2; 5,3; 2,0; 1,2 и 0,7 тно. (Рис.2). Множественность мРНК IRLB может быть ' обусловлена альтернативным сплайсингом пре-мРНК. Наименьшая мРНК (0,7 тно) сопоставима по размеру с клонированной

В ходе исследования исходная кДНК была удлинена с 5'-конца на 72 пн (раздел 5), поэтому начальные координаты различных структурных единиц приводятся в скобках после уточненных.

нами кДНК (0,65 тно), из чего можно предположить, что в этой кДНК отсутствует 5'-концевая часть (в ходе синтеза кДНК было утеряно около 50 нуклеотидов ).

Для изучения влияния интерферонов а и 7 на экспрессию мРНК IRLB в растущую культуру диплоидных фибробластов человека добавляли IFNa до конечной концентрации 500 ед/мл или IFNr (100 ед/мл). Через б часов инкубации с IFNa и через 24 часа в случае ÎFNr (Kelly et al., 1985) выделяли суммарную клеточную РНК. После фракционирования в геле и переноса на .мембрану Hybond N гибридизовали препараты РНК с радиоактивными РНК- или ДНК-зондами. В качестве зондов, помимо описанного выше, использовали зонд MPI, представляющий собой фрагмент +3/+112 первого экзона гена с-тус (гибридизуется только с мРНК, синтезируемой с точки P1J, и зонд МР12 - фрагмент +3/+335 (гибридизуется с PI и Р2 мРНК). Для сопоставления относительных количеств анализируемых препаратов РНК проводили их гибридизацию с меченым фрагментом кДНК (З-актина чеповекг.. Результаты Northern-гибридизации ^представлены на Рис.2.

В обработанных интерферонами фибробластах индуцируется синтез всех видов мРНК IRLS, причем влияние IFNr на экспрессию гена 1RLB сильнее, чем IFNa. Интересно отметить факт стимулирующего влияния ÎFNr на синтез мРНК гена с-тус, инициируемый в точке Р2 (Рис.2). С данного промотора синтезируется 75-50% зрелой мРНК (в 5-7 раз больше, чем с PI) поэтому при использовании меченого зонда МР12, гибридкзующегося с обеими мРНХ гена, г основном происходит детекция экспрессии мРНК, синтезируемой со старта Р2. Индукция интерфероном г синтеза мРНК гена с-тус описана Kelly et al., 1985. Нами же впервые обнаружено стимулирующее воздействие IFNr на транскрипцию с-тус с промотора Р2 (Рис.2). Это наблюдение становится особенно любопытным, если сопоставить его с данными по стимуляции интерфероном г синтеза мРНК IRLS и свойствами полипептида IRLB, участок связывания которого с ДНК гена с-тус имеет координаты -62/—48 относительно старта транскрипции Р2 (см. раздел 10).

Таким образом, экспрессия всех видов мРНК IRLB в диплоидных фибробластах человека индуцируётся интерферонами г и а. Не исключено, что белок IRLB относится к числу IFN-зависимых ТФ и участвует в регуляции инициации транскрипции гена с-тус в точке Р2.

28S -

- a g

IRLB

18S -

c-myc (MP1) c-myc (MP12) q, чф®*» actin

Рис.2. Экспрессия генов IRLB и c-myc в диплоидных фибробластах человека, обработанных интерферонами о иг На дорожки наносили по 10 мкг суммарной РНК, выделенной из: необработанных интерферонами клеток (-), обработанных IFNa (а) и обработанных IFNjr (g). Фракционированную в 1%-ном агарозном геле, содержащем формальдегид, РНК иммобилизовали на мембране Hybond N. В качестве радиоактивно меченных зондов для гибридизации использовали антисмысловую РНК IRLB, фрагметы первого экзона гена с-шус (MPI и МР12) и кДНК- 0-актина (показаны справа). Слева приведены положения 28S и 18S рибосомных РНК.

5. Определение 5"-конца кДНК IRLB.

Для определения 5*-конца кДНК IRLB был применен метод Р.АСЕ . (rapid amplification of ¿DNA ¿nds), описанный Frohman et si.

(1988). Синтез первой цепи кДНК проводили обратной транскрипцией, используя в качестве матрицы поли(АУ*РНК из диплоидных фибробластов человека. С помощью терминальной дезоксирибонуклео-тидилтрансферазы удлиняли 3'-конец путем присоединения к синтезированной оц кДНК поли((Ю)-участка. Проводили 35 циклов ПЦР-амплификации кДНК с использованием в качестве затравок синтетических оц олигонуклеотидов s'agctggatccoccccccccc3 (неспецифичный, отжигается на поли(dG)-трактах всех молекул кДНК) и s'GTGTGCATTCCAGAGAATGTAC3' (специфичный, комплементарен участку 261/282(189/210) некодирующей цепи кДНК IRLB)., ДНК после амплификации расщепляли рестриктазой ВашН! (участки узнавания которой присутствуют в кДНК IRLB - 243(171) и в поли(с)С)-содержашем олигокуклеотиде). ВашН1-гидролизат фракционировалм в 1,5%-ном агарозном геле. Элюировали из геля фракцию фрагментов ДНК, размер которых превышал 200 пн (размер продукта амплификации исходной кДНК с учетом длины олиго((Ю)). Проводили субклонирование пула кДНК Е линеаризованном рестриктазой BamHI плазмидном векторе pUC19. 15 клонов-трансформантов из 400 отобранных для анализа давали положительные сигналы при гибридизации in situ с меченой кДНК IRLB. Анализ первичной структуры клонированных фрагментов кДНК _ показал, что ?ге они содержат ..5'-концевые области, _ отсутствуюиие в исходной кДНК.

В кДНК одной из анализируемых рекомбинантных плазмид (N68) размер новой 5'-концевой области составляет 72 пн (Рис.3, показана курсивом). В удлиненной кДНК IRLB отсутствуют ATG и терминирующие кодокы в ОРС. Мы полагаем, что результаты, полученные с помощью Northern-гибридизации и„ метода RACE, свидетельствуют либо о том, что клонирована кДНК, соответствующая наименьшей изоформе мРНК (около 700 нуклеотидных остатков) гена IRLS. В таком случае 5'-концевой экзон этой мРНК является " общим для всех изоформ, являющихся продуктами альтернативного сплайсинга пре-мРНК IRLB, не затрагивающего 5'-концевую область. Либо у высокомолекулярных мРНК гена в результате альтернативного сплайсингг отсутствует участок -261/282, с которым отжигается один из праймеров, используемых з ПЦР-амплификации, и размер их 5'-концевой области не может быть определен с помощью метода RACE. После ПЦР мы провели Southern-блот гибридизацию

электрофоретически разделенных продуктов амплификации. Оказалось, что размер образующихся фрагментов достигает 2,0 тпн (результат неспецифического отжига поли(dC )-праймера) тогда как размер фрагментов кднк, гибридизующихся с радиоактивно меченой кДНК 1RLB, не превышает 0,3 тпн, что.соответствует размеру фрагмента кДНК в клоне n68.

Удлиненный вариант кДНК 1RLB (717 пн) содержит lSRE-подобный элемент 'ggaaaatgaa18 (Рис.3). Возможно, этот интерферон-индуцибельный элемент является участком связывания IFH-зависимых ТФ, вызывающих стимуляцию синтеза мРНК IRLB в клетках, обработанных ннтерферонами г и а.

6. Определение инициаторного ATG кодона кДНК 1RI.B.

С помощью компьютерной программы PCGENE/SIGNAL провели поиск в ОРС, кодируияей полипептид 1RLB, потенциальных инициаторных ATG-кодонов. "Претенденты" на роль инициирующего трансляцию кодона имеют- координаты 373, 535, 214,. 229, 298. и 394 (расположены по порядку снижения вероятности инициации трансляции в данном месте). С них могут синтезироваться полипептиды с молекулярными массами (в кДа): 10,6; 4,2; 16,9; 16,3; 13,5 и 9,8, соответственно. Как.ой же из перечисленных кодонов (кроме ATG^, с которого может синтезироваться полипептид (4,2 кДа), лишенный ДНК-связывающих мотивов) является инициаторным?

Для ответа на этот вопрос провели трансляцию синтезированной in vitro РНК 1RLB в бесклеточной белоксинтезируюшей системе из ретикулоцитов кролика. Продукты трансляции анализировали

электрофоретически! Оказалось, что с данной РНК in vitro

-

синтезируются 2 полипептида с приблизительными размерами 17 кДа и 14 кДа (данные приведены в диссертации, раздел- 3.6). Синтез полипептидов с такими размерами может инициироваться в положениях 211/217 и 263/269 ОРС, соответственно. Однако, ввиду того, что-участок 263/269 не содержит метиониновых кодонов, и количество синтезируемого in vitro 14 кДа-полипептида меньше, чем его 17 кДа-аналога,лами сделан выгод о неспецифической инициации /л vitro синтеза белка в области 263/269. Напротив, участок 211/217 содержит ATGa<1 с которого может инициироваться синтез полипептида IRLB размером 16,9 кДа (PCGENE/PHYSCHEM). Таким образом, на основании теоретических и экспериментальных данных,

мы полагаем, что синтез белка IRLB инициируется /л v/'trо -со второго метионинового колона ОРС - ATGa<; Отсутствие в позициях -3 и +4 окружения этого кодона консервативных - нуклеотидов консенсуса Козак, повидимому, г?озволяет части рибосом пропускать данный кодон с последующей абортивной инициациёй- с триплетов, 263 или 266.

Однако, если в кДНК IRLB (717 пн) все же отсутствует S'-концевая область, то с помощью трансляции in vitro обнаружена внутренняя инициация (из-за отсутствия первого atg-кодона). В . таком случае данная кДНК кодирует функциональный С-концевой полипептид (домен) ДНК-связываюшего белка IRLB.

7. Структурный анализ белка IRLB. ^

С помощью программы PCGENE/PHYSCHEM установили, что полипептид IRLB имеет молекулярную массу 16,9 кДа и состоит из 144 аминокислотных остатков. Изоэлектрическая точка pi равна 8.8, что согласуется с высоким содержанием в . полипептиде положительно заряженных остатков (Arg - 4,9$, Lys - 8,3%, всего -13,2%). Заряд молекулы белка при pH 7.0 равен +3,3.

Компьютерный анализ обнаружил в IRLB два потенциальных участка фосфорилирования - протеинкиназой С: LWNAH1GKYPM ( однобуквенкые обозначения аминокислот, модифицируемый остаток подчеркнут) и KSMVK£1XMND, а также один участок фосфорилирования казеиноьсй киназой II MECRKXFGEPY. Возможно, регуляция ДНК-связывающей активности IRLB осуществляется посредством его фосфорилирования или дефосфорилирования.

Мы полагаем, что IRLB относится к семейству ДНК-сзязываюших белков b-ZIP (basic leucine zipper proteins), содержащих "лейциновую застежку". В его первичной структуре присутствует характерный для представителей данного семейства белков димеризулщий мотив (L-X6) , где L - лейцин, X - любая аминокислота, п - число повторов (обычно = 4 или 5).

Роль ДНК-связываюшего домена может выполнять богатая остатками Lys и Arg область, расположенная между Lys75 и (Рис.3). Сразу же за ней находится упомянутый димгризуюиий домен, содержащий расположенные через 7 аминокислотных остатков Leu.,, Leu . Ile и.Leu „ (последний отстоит от Не на 14

8S 92 99 113 4 99

---ISRE---

i-agcttattggaaaatgaiggtgatcatgcaata

34 acagtagcagaotttgtggaccatcatccaatt^ttttttggaacctegtatggtatttc

TrpAsnLeuYalTrpTyrPhe

94 agacgtcttgacttgcccagtaacttacctggattgattctttcttctgagcactgtaac " ArgArgLeuftspLeuPro5erAsiü.euProGlyLeuIleLeuSerSerGluHisCysAsn

is« aagtattcaaagattccccgccactgtatgtctgaagata^caaatatgttttaatacaa LysTyrSertysUeProArgHisCysMetSerGluAspSarLysTyfValLeuIleGln

214 ATCTTATGCCACAATATGAAGTTACATCAGGATCCGGGACACCCCTTGTACATTCTCTCG i. MetteuTrpAspAsnüettysLeuHisGlnAspProGlyGlnProLeuTyrl leLeuTrp

274 MTGCACACACCCAAAMTATCCMTGCTCCAriTATTGCAAAAAACTGATAACTCATTT 2i AsnAl&HtsThrGlnLysTyrProMetValHisLeuLeuGlnLysSerAspAsnSerPhe

3 54 AACCAGGAACTGTTGAAAAGTATGGTAAAAAGC ATTAAAATGAATGATGTCTATGGACCA 4i AsnGlnGluteuLeuLysSerMetValLysSerlleLysJtetAsnAspValTyrClyPro

3 94 ATCAGTCAGATTTTAGAGACACTCAATAAGTCTCCACATTTTAAAAGACACAGGAGTTTA

ei MetSerGlnlleLeuGlaThrLeuAsnLysCysProHlsPheLysArnGlnArpSerLeu

♦ + +

454 TACAGAGAAATACTATTTCTCTCACTTGTGGCACTGGGAAGAGAAAACATTGATATAGAT

ei Is^TßGlalleLeviheLeuSerLeuValAlaLeuGlyAreGluAsiiXleAspIleAsp + «»« *•* *

's 14 GCTTTTGATAAAGAGTACAAGATGGCATACGATCGTCTCACACCTAGTCAAGTCAAGAGT i о l AlaPheAspLysGluTyrLystotAlaTyr AspÀrgLeuThrProSerGlnValLysSer

574 AC AC ACAACTCTGATAGACC ACC AAGTAC AGGGCTGATGGAATGTCGAAAMCCTTTGGA l г i ThrHls AsnCysAspArgProPro5erTiirGlyValMetGluCysArgI.ysrhrPheGly

634 GAACCTTATCTTtaagatgtatttgtatgtgtaâàcat'tcaatgtatattgtàtagttag Kl GluProTyrLeu

es« tgtataaaataacacttttagagc-7i7

Рис.3. Первичные структура кЛНК IRLS и кодируемого ею белка IELB. Аминокислотные остатки синезируемого In vitro полипептида IRLB обозначены жирным шрифтом, их нумерация начинается с Н-концевого Met (ATG-214). Аминокислотная последовательность N-концевой части продуцируемого в E.coll полипептида bsIRLB показана (без нумерации) тонким шрифтом. Удлиненная с помощью техники EACH 5'-кониезая область кДНК (1/72) выделена курсивом, 3'-нетранслируемая область (646/717) обозначена строчными буквами. Потенциальный ЯНК-связываюшия мотив белка IBLB подчеркнут, .положительно заряженные остатки- мотива (Arg и Lys.) обозначены "+". Остатки Leu и Не, предположительно участвующие в образовании леишшовоя застежки, показана "•»«". Терминирующие кодоны подчеркнуты. Потенциальная сигнал подиаденилирования показан "....."

остатков). Лейциновая застежка IRLB не является полностью канонической (присутствие Не и неканонического Tyri(w). '

Предсказанная с помощью программы PC/GENE вторичная структура IRLB характеризуется присутствием амфипатической а-спирали между Leu^ и Le'uji3, йеобходимой для образования характерной для димеров белков семейства b-ZIP формы "coiled coil".

Белок IRLB содержит 17 остатков Leu (11,8% от обшего количества аминокислотных остатков в полипептиде). В литературе уже описан подобный Leu-богатый ТФ АР-2 (Williams & Tjian, 1991). Он не относится ни к одному из известных семейств ТФ, и связывается с элементом CCCCAGGC в промоторах многих клеточных и вирусных генов. Гомология между аминокислотными последовательностями IRLB и АР-2 нами не обнаружена. »

В N-концевой части IRLB между Glnio и Рго^ расположена Pro/Gln-богатая область, содержащая по 3 остатка Pro и Gin (Рис.3). Этот участок может выполнять роль активирующего транскрипцию домена. Pro/Gin домены обнаружены в некоторых ДНК-связывающих белках, в частности в белке Мус (Maren et al., 1992). -Таким образом, структрная организация белка 1RLB сходна с таковыми дйя ТФ, принадлежащих к семейству b-ZIP.

'Поиск гомологии аминокислотной последовательности белка IRLB с помощью программы DNA-SUN в базе данных SwissProt (release 30) не привел к обнаружению существенных сходств с первичными структурами уже известных белков.

В случае, если клонированная кДНК неполноразмерна и в ней отсутствует истиный инициаторный ATG-кодон, белок IRLB окажется длиннее, чем 144 остатка. Удлиненная методом RACE кДНК может кодировать полипептид размером 215 аминокислотных остатков. Его молекулярная масса составит не менее 24,4 кДа, изоэлектрическая точха - 8.4, а суммарный заряд при pH 7.0 будет равен +3;7 ( PCGENE/PHYSCHEM ). По физико-химическим свойствам такой белок близок к белку 16,9 кДа.

8. Бактериальный штамм-продуцент белка 1RLB.

Для получения бактериального штамма-продуцента белка IRLB в качестве экспрессируюшего вектора применили плазмиду pC0V2 (Queen, 1983), содержащую температурочувствительный промотор. PR

фага X, участок инициации трансляции фагового гена его и сайт для клонирования фрагментов ДНК, белковые продукты которых необходимо экспрессировать. С учётом того, что в кДНК IRLB может отсутствовать 5'-концевая область, при созданий плазмидной конструкции субклонировали в векторе pCQV2 полноразмерный EcoRI-EcoRI фрагмент (655 пн) ДНК фага Xgt-L/62/4. Полученной, конструкцией (pCOIRL) трансформировали штамм E.coli K802£hptr (лсбезно предоставлен Е.Речинским, ИМБ РАН), в котором изучали экспрессию белкового продукта, обозначенного bsIRLB (bacterialiy-synthesized IRLB). bsIRLB состоит из 195 аминокислотных остатков (Рис.3) и на N-'конце имеет тетрапептид MetAspGlnPhe, кодируемый векторной ДНК. С помощью электрофореза в 10%-ном ПААГ, содержащем 0,1% SDS, определена молекулярная масса белка bsIRLB - 23 кДа, что .согласуется с величиной, предсказанной по аминокислотной последовательности, - 22,6 кДа (Рис.4). Причем, в бесклеточном экстракте бактерий, • трансформированных pCQIRL, но не индуцированных температурным шоком, белок bsIRLB не экспрессируется (Рис.4). Количество продуцируемого в E.coli полипептида bsIRLB составляет около 40% от общего клеточного белка. В опытах по сдвигу полосы ^в геле использовали препараты bsIRLB из бесклеточных экстрактов бактериального штамма-продуцента.

Рис.4. Электрофоретический анализ белков, экспрессируюшихся в

Е.сои/рС01т (10%-ный ПААГ/0,1%-ный 505), индуцированных ( + ) и

неиндуцированных, (-) температурным шоком. Стрелка . указывает белок Ь$^ЕВ. Справа приведены положения маркерных белков: альдолазы (40,0 кДа) и лизоцима (14,4 кДа)^*

s

9. Исследование ДНК-связывающей специфичности белка bsIRLB.

В опытах по сдвигу полосы связывания в геле мы использовали препараты белка bsIRLB и дц 'олигонуклеотиды, воспроизводящие ISRE-подобные элементы различных IFN-зависимых генов (с-тус, 6-16, 9-27) или их слитые химерные комбинации. Олигонуклеотиды irIA, irlB и 6-16 1SRE были любезно предоставлены Б.Черновым (ИМБ РАН), остальные - I.Kerr и G.Stark (Imperial Cancer Research Fund, London). Обозначения и структуры этих олигонуклеотидов

следующие:

¡rlA " - GGGAAAAGAAAAAA

ir IB - GGCGGGAAAAAGAACGGA

6-16 ISRE - GGAAAATGAAACT

6-16 wt - GAGCTGGGAGAGA-GGGGAAAATGAAA-CTGCAGAGTGCAC

9-27 wt - TTTACAAACAGCA-GGAAATAGAAACT-TAAGAGAAATACA

6-9-9 - GAGCTGGGAGAGA-GGAAATAGAAACT-TAAGAGAAATACA

9-6-6 - TTTACAAACAGCA-GGGGAAAATGAAA-CTGCAGAGTGCAC

6-6-9 - GAGCTGGGAGAGA-GGGGAAAATGAAA-TAAGAGAAATACA

Подчеркнут консенсус 15НЕ. Олигонуклеотиды 6-16 ш, 9-27 и их производные состоят из 3-х 13-нуклеотидных участков (длина каждого олигонуклеотида - 39 остатков) - 5'- и 3'-фланкирующих и • центрального "короврго" (собственно 1)•. Гибридные варианты' 6-16 уг, и 9-27 тяг обозначены тремя цифрами, каждая из которых показывает происхождение соответствующего участка. Например, в состав химерного олигонуклеотида 6-9-9 входит 5'-концевой участок олигонуклеотида 6-16 ч/г (6-), а также коровый (-9-) и З'-концевой (-9) участки олигонуклеотида 9-27 и»£.

Связывание белка Ь$1£ЯЕ с дц олигонуклеотидами, воспроизводящими 15ЯЕ-подобные элементы различных ¡РИ-зависимых генов (с-шус, 6-16, 9-27), специфично (Рис.5А и Б). Наибольшее сродство белок проявляет при связывании с дц олигонуклеотидом ¡г 1В. Образование комплекса белка ЬбНЦ-В с олигонуклеотидом ¡г!А удается обнаружить только при конкурентном вытеснении немеченым /г!А, взятым в 30-кратном молярном избытке, меченого 1г1В из комплекса с белхом (Рйс.5А). -Комплексы с участием меченых ¡г1А и 6-16 15ЯЕ обнаружить не удалось (Рис.5А), что' свидетельствует о низком сродстве bsIRLB к этим олигоиуклеотидам. Однако, дц олигонуклеотиды 6-16 и 9-27 и^, а также их гибридные варианты

-

связываются белком, причем специфичность связывания олигонуклеотидов, содержащих элемент гена 6-16, выше, чем у олигонуклеотидов с 151?Е гена 9-27. Это наблюдение свидетельствует о том, что замена в элементе 1БКЕ - А7Т8 (6-16) на Т.Ав (9-27) приводит к, снижению сродства белка ЬбIНЬВ к последовательности-мишени. Связывание белка с длинными (39 пн) олигонуклеотидами, содержащими элементы гена 6-/6 (6-16 чп, 6-6-9, 9-6-6), и отсутствие взаимодействия с коротким олиго:гуклеотидом 6-16 13ЯЕ (13 пн) говорит о важности присутствия в структуре олигонуклеотидов участков, фланкирующих узнаваемую 1)5 ШЬВ "коровую" область (Рис.5А,Б).

А Б.

9-9-9 6-6-6 9-6-6

Рис.5. Электрофоретический анализ (7,5%-ный ПААГ) связывания белка ЬбШЬВ с радиоактивно меченными дц олигонуклеотидами, воспроизводящими элементы 18НЕ различных 1РМ-завискмых генов. (А) (1) ¡г1В, (2) ¡г!В в присутствии 30-кратного молярного избытка немеченого ]г1В, (3) ¡г1В и 30-кратный молярным избыток немеченото ¡г1Л, (4) >г1А и (5) 6-1 б'ШЕ; (Б) (9-9-9) 9-27 на, (6-6-6) 6-16 т, (6-6-9) 6-6-9, (9-6-6) 9-6-6 и (6-9-9) 6-9-9. На дорожках, обозначенных "+", разделялись олигонуклеотиды с белком, а на дорожках олигонуклеотиды без добавления белка. Комплексы белка ЬбШЬВ с олигонуклеотидами показаны стрелками.

Таким образом, нами установлено, что консенсус для

АТ

связываемых белком ЬбИИ-В участков имеет формулу (ХЗАААудОАА. ДНК-связываюшая специфичность белка в опытах по сдвигу полосы

в геле убывает в ряду 18КЕ-подобных участков различных генов: /г 1В -> 6-16 /5ЯЕ -> 9-27 ШЕ -> /г/А.

10. Определение участка связывания белка Ьв1Ш-В в гене с-тус человека.

Для определения участка связывания белка ЬбИШВ в гене с-тус человека применили метод ДНКазного футпринтинга. Поскольку наибольшую специфичность в связывании ^ с анализируемыми 1811Е-подобными олигонуклеотидами полипептид Ья 1КЬВ проявляет при образовании комплекса с интерферон-индуцибельным элементом ¡г¡В гена с-тус, поиск участка связывания белка проводили на фрагменте ХЬо1-Ауа11 (+71/+335) гена, содержащем элемент ¡г!В (+100/+110). Бесклеточный экстракт бактериального штамма-продуцента белка Ь$1Б1.В инкубировали 20 мин с меченным (по участку растепления рестриктазой ХЬоI) фрагментом первого экзона гена с-тус в растворе, содержащем 10 мМ трис-НС1, рН 7.6/ 50 мМ ДОаС1/ 10 мМ при 20°С. Обрабатывали образовавшийся комплекс ДНКазой I (1 мкг/мл) в течение 5 мин в тех же условиях. Продукты расщепления анализировали электрофоретически в денатурирующем ПААГ (Рис.6).

1 2 3

Рис .6. Определение сайта связывания белка ЬбЦЬВ на участке первого экзона (ХЬо1-Ауа\ \, +71/+335) гена с-тус человека (12%-ный ПААГ/ 7 М мочевина). Фрагменты, образующиеся при: пурин-специфическом растеплении анализируемой ДНК (1); обработке ДНКазой I свободного (2) и связанного " с ' белком Ь<»1К1.В (3) фрагмента ХЬо1-Ауа11 гена с-тус. Защищенная от нуклеазы последовательность приведена справа.

Белох bslRLB в комплексе с ДНК защищает участок <9eCGGGAAAAAGAACGG*n2, включающий lSRE-подобный элемент i г 1В (+100/+110). Этот участок перекрывается с участками связывания двух ТФ - E2F и ZF87/MAZ (Yee et а 1., 1989; Bossone ei а 1., 1992; Pyrc et al., 1992), которые вовлечены в регуляцию транскрипции гена с-тус, что подтверждает важность данной области ДНК в регуляции экспрессии онкогена. Однако, ответ на вопрос об участии белка 1RLB в регуляции транскрипции гена с-шус могут дать только дальнейшие исследования.

11. Клонирование гена IRLB и определение его первичной структуры.

Методом Southem-гибридизации EcoRI-гидролизатов геномной ДНК (любезно предоставлены А.Акопяном и Т.Тихомировой, ИМБ РАН) из различных видов животных с меченым фрагментом кДНК IRLB установлено, что в геномах насекомых, земноводных, рыб, птиц и грызунов существуют нуклеотидные последовательности,

гибридизуюшиеся в мягких температурных и солевых условиях (5б°С,

Рис.7. Поиск в геномах различных . . видов . животных /ßlß-подобных нуклеотидных

последовательностей. EcoRI-гидролизаты препаратов хромосомной ДНК человека (1), крысы (2), ~ суслика (3), цыпленка (4), вьюна (5), лягушки (6) и дрозофилы (7) разделяли в 0,8%-ном агарозном геле, иммобилизовали на мембране Hybond N и гибридизовали с радиоактивно меченным зондом - кДНК IRLB. В качестве маркера использовали расиепленнную рестриктазой

HindlH ДНК фага к (размеры образующихся фрагментов в тпн приведены слева).

SSC 6х) с ДНК-зондом (Рис.7).

1 2 3 4 5 6 7

2,3 -2,0 -

гибридизация . выявила в анализируемых геномах последовательности, имеющие нестрогую гомологию со структурой зонда. Эволюционная стабильность последовательностей, подобных IRLB, з сочетании с приведенными выше структурно-функциональными свойствами белка IRLB свидетельствуют о возможной универсальности функций продуктов IRLB-подобных генов различных"организмов.

Установлено, что размер фрагмента хромосомной ДНК человека, содержащего ген ¡RLB, составляет около 13,0 тпн (суммарная длина двух фрагментов EcoRI-EcoRI, гибридизующихся с кДНК IRLB-, Рис.7).

Геномную библиотеку человека сконструировали в фаговом векторе AEMBL3 (Promega). В результате скрининга из 0,8х106 рекомбинантных клоноа выделен один, названный XIRL. Размер клонированного в X IRL фрагмента хромосомной ДНК человека составляет около 18,5 тпн. С помощью расщепления различными ферментами рестрикции построена физическая карта этого фрагмента (Рис.8А). На основании данных о блот-гибридизации гидролизатов я. IRL, полученных после обработки рестриктазами, с меченой к ДНК IRLB установлена локализация гена в клонированном фрагменте ДНК.

Стратегия секвенирования представлена на Рис.8Б. Для определения нуклеотидной последовательности гена IRLB субклонировали в плазмидиом векторе pUC19 • перекрывающиеся- фрагменты- ДНК, полученные при расщеплении ДНК А IRL различными рестриктазами. Клонированные фрагменты секвенировали по двум цепям. После совмещения перекрывающихся участков с помощью программы PCGENE/ASSEMGEL получили нуклеотидную последовательность гена IRLB, включающую 5'- и З'-некодируюшие области, размером 7432 пн (приведена в разделе 3.11 диссертации). При сравнении первичных структур кДНК IRLB и гена IRLB установили экзон-интронную организацию гена (Рис.ЗВ), размер кодирующей части которого составляет 5830 пн. Ген состоит из. 5-ти экзонов и 4-х интронов (Табл.1).

Поиск гомологий нуклеотидной последовательности гена IRLB с помощью программы EMBL/FASTSCAN в базе данных EMBL Database (release 40) не привел к обнаружению существенных сходств с первичными структурами уже известных генов.

В I

ii ш iv ф

у 1 тпн

Рис.8. Структура гена IRLS человека. (А) Физическая карта фрагмента хромосомной ДНК в фаговой клоке A.IRL. Тонкой линией показана ДНК вектора (ЛЕМЕЬЗ), толстой - клонированная ДНК. (Б) Стратегия секвенирования фрагмента HindlI I-£coP.I (7,4 тпн), содержащего ген IRLS. Стрелкам« указаны направления "чтения" нуклеотидных последовательностей по одной из цепей. Полученные субклоны показаны линиями с соблюдением топографии на клонированной ДНК, -сверху приведены их обозначения. Участки расцепления ДНК ферментами рестрикции BamHI, Н/ndIII, EeoRI, КрпI, Pst I, Sail, Sphl обозначены В, H, R, К, Р, SI, S, соответственно. (В) Экзоп-интронная организация гена IRLB человека. 5'- и З'-некодируюшие последовательности обозначены тонкими линиями, интроны - штриховкой, а экзоны - вертикальными прямоугольниками с их порядковыми номерами.

Экзон г Интрон ■ номер, размер, ПН Экзон номер, размер, ПН

■ ■ AGCTTATTGGAAAAT 1 165

TTCAAAGgtatgag 1 1984 aacacagATTCCCCG 2 118

GCACACAgtaagtg AI alli sT-zt 2 622 11 tacägCCCAAAAA гк-hrGl nLys 3 163

AGACAGAGgtaagt ArgG 1 пАг-тв 3 165 cctagGAGTTTATAC 7B-gSerLeuTyr 4 65

GATATAGgtaattt Aspl leA-too 4 2342 tctgcagATGCTTTT too-spAlaPhe 5 206

TAACACTTTTAGAGC 3'-нетранслируеыая область

Таблица 1. Нуклеотидные последовательности участков слияния экзонов и нитронов гена 1RLB человека. Нуклеотиды, входящие в состав экзонов показаны заглавными буквами, интронов - строчными. Аминокислотные остатки синтезируемого in vitro полипептида IRLB, показаны трехбуквенными обозначениями. Рядом с остатками, находящимися в точках сплайсинга, приведены их порядковые номера в полипептидной цепи.

Таким образом, цель настоящего исследования достигнута -обнаружен и клонирован неописанный ранее ген, кодирующий новый ДНК-связывающий белок 1Я1.В, который связывается с 13КЕ-подобной последовательностью гена с-тус человека.

ВЫВОДЫ

1. Клонирована кДНК нового ДНК-связывающего белка I RLE. Установлена первичная структура кДНК и на ее основе - первичная структура полипептида bslRLB.

2. В 5'-концевой области кДНК IHLB (+9/+18) обнаружен lSRE-подобный интерферсн-индуцибельный элемент.

3. Установлено, что в диплоидных фибробластах человека синтезируются несколько видов мРНК IRLB, экспрессия гена IRLB в этих клетках стимулируется иктерферонами г и а. _

4. Получен бактериальный штамм-продуцзнт функционально активного белка IRLB.

5. Продуцируемый в E.coli белок IRLB связывается с

1SRE-подобным элементом irlB гена с-тус человека предпочтительнее, чем с участками ISRE других интерферон-зависимых генов.

6. Определен участок связывания IRLB в промоторной . области гена с-тус человека с координатами +98/+112, включающий интерферон-индуцибельный элемент irlB (+100/+110).

7. В геномах эволюционно удаленных организмов обнаружены нуклеотидные последовательности, гибридизующиеся с кДКК ¡RLB.

8. Клонирован фрагмент хромосомной ДНК (18,5 тпн), ■ содержащий ген -IRLB человека. Построена физическая • карта - локуо-п IRLB. Определена нуклеотидная последовательность гена IRLB и установлена его экзон-интронная организация.

ОСНОВНОЕ СОДЕРЖАНИЕ ДИССЕРТАЦИИ ИЗЛОЖЕНО В СЛЕДУЮЩИХ РАБОТАХ:

1. Mashkova T.D., Stasiv Y.Z. and ltkes A.V. (1991). HSIRLB (H.sapiens IRLB mRNA). EMBL Database. Acc. No. X63417. -

2. Stasiv Y.Z., Mashkova T.D., Chernov E.K., Sokolova I.V.,

1 ltkes A.V. and Kisselev L.L. Cloning of a cDNA encoding a human protein which binds a sequence in the c-myc gene similar to the interferon-stimulated response element. Gene. 1994, 145: 267-272.

3. Stasiv Y.Z. and ltkes A.V. (1994). HSIRLB123, HSIRLB5, HSIRLBEX4, HSIRLB3UR and HSIRLB5UR (H.sapiens IRLB gene). EMBL Database. Acc. Nos. X82333, X82334, X82657, X82658 and X82659.