Бесплатный автореферат и диссертация по биологии на тему
Экзон-интронная организация и регуляторные участки гена триптофанил-тРНК-синтетазы человека
ВАК РФ 03.00.03, Молекулярная биология

Автореферат диссертации по теме "Экзон-интронная организация и регуляторные участки гена триптофанил-тРНК-синтетазы человека"

;

РОССИЙСКАЯ АКАДЕМИЯ НАУК • ИНСТИТУТ МОЛЕКУЛЯРНОЙ БИОЛОГИИ им. В.А.ЭНГЕЛЬГАРДТА

На правах рукописи УДК 577.214.62

Григорьева Арина Юрьевна

ЭКЗОН-ИНТРОННАЯ ОРГАНИЗАЦИЯ И РЕГУЛЯТОРНЫЕ УЧАСТКИ ГЕНА ТРИПТООАНИЛ-тРНК-СИНТЕТА3Ы ЧЕЛОВЕКА

03.00.03 - молекулярная биология

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата биологических наук

МОСКВА - 1993

Работа 'выпосвена в Институте молекулярной биологии им. В.А.Энгельгардта РАН

НАУЧНЫЕ РУКОВОДИТЕЛИ: кандидат биологических наук доктор биологических наук, профессор, чяен-хорр. РАН

Л.П.Фролова

Л.Л.Киселев

ОФИЦИАЛЬНЫЕ ОППОНЕНТЫ: •

доктор биологических наук, профессор

доктор-биологических наух, профессор

О.О.Фавсрова П.М.Рубцов

ВЕДУЩАЯ ОРГАНИЗАЦИЯ: Институт биоорганической химии iiU. М.М.Шемякина и S.A.Овчинникова РАН

Зашита состоится 2.81993 г. в di. часов на заседании специализированного совета Д.002.79.01 при Институте молекулярной биологии им. В.А.Энгельгардта РАН по адресу: 117984, Москва, ул. Вавилова, д. 32

С диссертацией ыокно ознакомиться в библиотеке Институте молекулярной биологии им. В.А.Энгельгардта РАН

Автореферат разослан

Л/^PJS.A: 1993 г.

Ученый секретарь специализированного совета, кандидат хииичесхих наук

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ Актуальность работы. Аминоацил-тРНК-синтетазы (aa£S) являются ключевыми ферментами белок-сиитезируюцгго аппарата хавой клетки. Присоединяя аминокислоту к соответсвуюшей тРНК, aaRS дают возможность лекодировать генетическую информацию, »писанную в ДНК и переписанную в мРНК. При этом устанавливается кодовое соответствие между последовательностью нуклеотидов, в которой записана генетическая информация, и последовательностью аминокислот, из которых синтезируются белки с генетически заданной структурой. Точность реализации генетической информации зазисит и от высокой специфичности узнавания aaRS соответствующих аминохислот и специфических к ним тРНК.

Последние 20 лет интенсивно изучается белок-оштезирушщий аппарат прокариот и низших эукариот (дрожжей) как с точки зрения :труктур его отдельных компонентов, так и с функциональной точки зрения. Изучение белок-синтезируюпего аппарата высотх эукариот :ильно отстает от прокариотического, так как молекулярная :труктура многих его компонентов пока остается нераагафрованной.

Триптофанил-тРНК-синтетаза (TrpRS) среди других aaRS - один 13 наиболее изученных ферментоз с точки зрзния его функций, юэтому особенно необходимо знать его структуру. В нашей 1аборатории клонирована кДНК, специфичная для TrpRS человека, и •асшифрована ее первичная структура. Однако, о структуре генов, :одируюших aaRS высших эукариот, в том числе TrpRS, практически ¡ичего неизвестно. Изучение структуры гена TrpSS человека, ;редставляет интерес с точки зрения познания возмохшсс механизмоз >егуляции его экспрессии, а сопоставление эион-интронной рганизации гена с доменной организацией белка может дать редставление о возможных путях эволюции гена.

В 1991 году независимо в трех лгборатэриах показано, что минокислотная (АК) последовательность одного из белков, активно кспрессируюшихея в различных клетках человека вод действием нтерферонов (IFN), идентична АК последовательности TrpRS еловека и этот белок обладал активностью TrpRS. Езвестно, что rpRS относится к "housekeeping" ферментам, необходимым для иосг.нтеза белков. Необычным является то, что "housekeeping"

фермент индуцируется 1FN, ответственными за антивирусное и антипролифератзжное состояние клеток человека и животных. Механизм индукяии TrpRS 1FN остается не ясным, но можно предположить, что регуляция происходит на уровне транскрипции, как это показано для многих IFN-зависимых генов. Известно, что в 5'-фланкирующей области большинства IFN- зависимых генов находятся IFN-зависмые элементы (ISKE), регулирующие их транскрипцию.

Цель работы. Цель данной работы состояла в клонировании и секвенировании гена TrpRS человека для установления его экзон-интронной организации, а также для изучения структуры 5*-флаш1ируевей области гена и поиска регуляторных участкоь ДНК, которые могут участвовать е ответе клетки на действие ÍFN. Одновременно до пытались выяснить соответствие между дсменной структурой субьсдиницы TrpRS, установлений в напей лаборатории ранее, и лезон-интронной организацией гена TrpRS человека.

Няучная ровизна ц практическая ценность работы. Впервые расшифрована экзон-интронкая оргааизациг гена TrpRS человека. Показана возможность альтернативного сплайсинга в 5'-нетранслиругаой области мРН£, неописанного ранее для aaRS высших эукариот. В 5' фланкирующей области гена TrpKS человеха обнаружены ÍSRE, что коррелирует с фактом стимуляции экспрессии гена TrpRS выезах эукариот IFN. Впервые дана оценка эволюции доменной организации субъед:шицы TrpRS высших эукариот на основе экзон-интроннов структуры гена TrpRS человеха. Подобное сопоставление помогает понять природу концевых удлинений полипептидиых цепей aaRS высших эукариот по сравнению с полипептидными цепями низших эукариот и прокариот.

Апробация работы. Основные научные результаты работы представлены на международной школе "Механизмы регуляции генов эукариот" (о. Спетсай, Греция, 1992), на Российско-Американском симпозиуме по геному человека (С.-Пететбург, 1992), на Всероссийской конференции "Геном человека" (Черноголовка, 1993), на международном симпозиуме по тРНК (Кап Даг, Франция, 1993), на семинарах в Институте молекулярной биологии mi. В.А.Энгельгардта (1993), в Институте молекулярной генетики (Берлин, Германия, 1993), в Институте Жака Моно (Париж, Франция, 1993).

Структура и объем работы. Диссертация состоит из введения.

)бзора литературы "Структура аминоацил-тРНК-синтетаз высших »укариот по данным молекулярного клонирования", экспериментальной tacTii, включакпей главы "Материалы и методы" и "Результата и их Осуждение", выводов и списка цитированной литературы, :одержащего 98 ссылок. Диссертация изложена ка 102 страницах машинописного текста, содержит 12 рисунков и 7 таблиц.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

1. Уточнение структуры N-кониевой области TrpRS человека.

Расчетные величины молекулярных масс субъединиц TrpRS человека (471 АХ) (Frolova et а 1., 1991) н TrpRS быка (475 АК) [Garret et al., 1991) составляют 53027 Да и 53728 Да соответственно, что несколько отличается от величины 58 кДа, полученной в опытах по электрофоретическому разделению субъедкниц TrpRS быка в SDS-полиакриламиднэм геле (Фаворова и др., 1974). Это небольшое несоответствие может быть вызвано пострэнсляцианными модификациями полипептидной цепи TrpRS. Известно, например, что TrpRS быка подвергается фоефэрилированию (Палей и др., 1985; Заргарова и др., 1990; Елизаров и Ковалева, 1990) и гликозилированию (Kovaleva et al., 1992). Однако, не исключено, что некоторое различие между рассчитанном на основании первичной структуры кДНК и полученной экспериментально величинами молекулярных масс моает быть связано с отсутствием 5'-конца в исследованных клонах кДНК. Другими словами. Met в положении 188190 п.н. кДНК TrpRS челозека, в принципе, может быть не первым в открытой рамке считывания (0РС). Прямым секвенлрованием N-конца полип^птидной цепи TrpRS человека данное предположение проверить сложно, т.к. вероятно, N-конец з этом белке блоюгрсван, как и в TrpRS быка. С другой стороны, АК последовательность TrpRS быка, полученная из расшифрованной нуклеотидной последовательности кДНК, почти полностью подтверждена структурным анализом отдельных полипепетидов, при этом не обнаружено дополнительного полипептида в N-кониезой области, что согласуется с данными по структуре кДНК (Garret et а 1., 1991). Кроме того, в 5'-концесой области кДНК TrpRS человека слева от Met (в положении 188-190 п.н.) в одной райке считывания присутствуют два стоп-кодока, что также указывает на маловероятность предположения о том, что исследование клоны кДНК содержат неполные 5'-кониевыз

нухлеотидные последовательности (Garret et al., 1991, Frolova et al., 1991).

Для уточнения структуры N-концевой области TrpRS человека нами проведен скрининг клонотеки кДНК из фибробластов человека, сконструированной в векторе *gt!l (HL1011, Clontech). В качестве пробы для гибридизации использовали меченную вставочную

последовательность кДНК клоиа 9 (878 п.н. ), кодирующую N-концевую часть субьедишщи этого фермента (рис. 1). Клон 9, получен в навей лаборатории Д.П.Фроловой и М.А.Судомойной.

Использованная нами коммерческая клоногека кДНК имела титр

8x19^ фаговых частиц/мл, доля рекомбинантных фагов в клонотеке

составляла 70% от обаего числа жизнеспособных фаговых частиц. В

результате анализа 2x10® клонов кДНК идентифицировано 2 клона,

32

дахжцнх сигналы при гибридизации с меченной Р вставочной последовательность» кДНК клона 9. Отобранным клонам присвоены номера 3 и 4 ( рис. 1 ).

ДИК бахтериофага Agtll отобранных рекомбинантных клонов 3 и

4 выделяли методой, разработанным в нашей лаборатории (Zabarovsky

and Таг i па 1988). Для отделении клонированного фрагмента кДНК от

векторной ДНК, рекомбинантную ДНК каждого клона расщепляли

рестриктазой ЕсоШ и анализировали электрофорезом в 1,5%

агарознсм геле с последующей блот-гибридизацией. В качестве

32

специфической пробы для гибридизации использовали меченную Р вставочную последовательность хДНК клоиа 9. Рекомбинантные клоны 3 и 4 имели вставочные нуклеотидные последовательности размером -бООп.н. и —400 п.н., соответственно. Вставочные последовательности кДНК клонов 3 и 4 перехлонировали по сайтам EcoRI в вектор pBIuescriptSX (Stratagene, США) и секвенированы по методу Сэнгера (Sanger et al., 1977).

Анализ нуклеотндной последовательности этих клонов показал, что вставка клоиа 4 (410 п.н.) полностью соответствует кодирующей области (296-705 п.н.) вставки клона 9 (рис. 1). Нуклеотидная последовательность вставки клона 3 (633 п.н.) содержит инициируюсдий кодон АТС в положении 326-328 п.н., с которого начинается открытая рамка считывания (рис. 2). Кодирующая область вставки клона 3 идентична кодируювей области вставки клона 9 (рис. 1, 2). Однако, 5'-нетранслируемая область вставки клона 3 в положении 1-251 п.н. полностью отличается от нуклеотидной

1

P SAP А

АТС

1 клом 9

'

-133 клом;5 405 ' '

BP XX SP

878

829

1 959

тле

клок 5

1959

993 КАОН 1 1Е00

1 '

296 КА0Н 4 705

I ■ IJ

ис. 1. Рестрикционная карта и стратегия секвенярования клонов ДНК, кодирующих субъединицу TrpRS человека. Номера сверху казывают порядковые номера нухлеотидных остатков, где 1 - первый '-концевой нуклеотид гстазки клока 9. Кодирупсал область нг арте обозначена жирной линией. Указаны инициирующий колон ATG и гриинирухший кодом TAG. Стрглки указывают стратегию и вправление сехзенирования. На карте обозначены сайты рестрикции: - Avail, 3 - BamHI, Р - Psil, S - Sac! и X - Xhol.

CTTGAAGGTCTGCTGTGATCTGCTGTGGAGTAGGCAGTTTTGCTCTTTACACGCCCAGTA клон 3

120

CTTTTGTITAGGGAAGATAATAGAGTACTTCACTGGTTATAACTGCATTTCTTTGTTTCA клон 3

180

GAGTGTAGTATTTGTTAAACAGGTGAATCTACTTCTCTTAACAAAGTCTCAATGTCCTAT клон 3

42

CGAAAAAAGAGGGGAAGAGTATTAAAGACCATTTCTGGCTGG клон 9

240

TTGCAATTTATGTGGTAAACACiGAAGACAATGGTCCTTAACCTTTTGGCArCTCAGCCT клон 3

102

GCAGGGCACTCTCAGCAGCTCAACTGCCCAGCGTGACCAGTGGCCACCTCTGCAGTGTCT клон 9

AsuII 300

CCTIKCMAAGTCnGACTCGTCTGCTGAACAAATCCTCTGACCTCAGGCCGOCTGTGA клен 3

TCCACAACCTGGTCTTGACrCGTCTGCTGAACAAATCCTCTGA клон 9

162

328

ACGTAGTTCCTGAGAGATAGCAAACAIfi клон 3

ACGTAGTTCCTGAGAGATAGCAAACAIQ клон 9

190

Рис. 2. Сравнение нуклеотидных последовательностей 5'-нетран-слируемых областей кДНХ клоноб 3 и 9 гена ТгрЯБ человека. Инициирующий кадон АТС в обеих нуклеотидных последовательностях и сайт рестрикции АвиИ в клоне 3 подчеркнуты. Между идентичными нуклеотидами поставлено двоеточие (:).

последовательности вставки клона 9 з положении 1-113 п.н. (рис. 2). На основании этих данных высказано предположение, что в клетке, вероятно, образуется как минимум два различных типа мРНК ТгрЯБ человека, отличающиеся в 5'-концевой области. Подтверждение этого предположения получено при картировании и расшифровке первичной структуры гена ТгрЯ5 человека.

2л. Картипоаание И расшифровка первичной СТРУКТУРЫ ££Ш 1и>В& человека.

2.1. Скрининг геномной клонотеки д ВЕКТОР? *ЕМ313.

Геномная клонотека, любезно предоставленная А.Гришиным (ИБХ РАН), сконструирована из ДНК спермы человека в векторе ЛЕМВ13

следующим образом: высокомолекулярную геномную ЛНК подвергали частичному расщеплению рестриктизом 5аиЗЛ, фрагменты, подходящего для клонирования размера (15-20 т.п.н. ), отделяли электрофорезом в агарозном геле и лигирозали их с плечами вектора аЕМВЬЗ.

о

расщепленного ВалйП. Клонотека имела титр 5x10 фаговых

частиц/мл. Скрининг неамплифицкрованной клонотеки проводили

32

методом гибридизации с меченными Р специфическими зондами, в

качестве которых использовали вставки кДНК клонов 9 (878 п.н.) и

5 (ИЗО п.н.), представляющие собой 5' и 3' части кДНК ТгрКБ

человека, соответственно (Рго1оуа а а!., 1991). В результате

анализа -1x10*' клонов отобрано 5 клонов, дагаих положительный

32

сигнал при гибридизации с меченной Р вставкой кЛЯ» клона 9. Встазки этих рексми;;нантш.;х клонов содержат участки гена, экзоны которого кодируют К-кокцгвую часть субъединицы ТгрК человека. При гибридизации с меченной вставкой кДНК клона 5, отобрано 3 клона, содержащие часть гена, экзоны которого кодирует С—концевые участки субъедикнцы ТгрйЗ. Один из этих клонов давал положительную гибридизацию с обеими пробаси, т.е. содержал центральную часть гена.

2.2. Анализ геномных клоног ТгрК5.

Для отделения клонированного фрагмент* генокяой ДНК от векторной ДНК ре;:эмбгаант;:ую ДНК кагдого клона ргсжегтляли рестриктазой 5аЮ1 и англизировали электрофорезом в 0,6-1,0% агарозном геле с послсдуюдам переносом на найломогые фильтры. Соответстлне отобранных клонов гену Тгр!?2 подтверждали гибридизацией с меченной Р кДНК кленок 5 и 9- Для физического картирования клонированных фрагментов геномной ДНК к идентификации фрагментов, ссдердачшх экзоны, рекомбпяактсые ДНК расивпля.'.и различными рестриктазами, специфические

последовательности узнавания которых содержались в к1ИК ТгрйБ, а гахжг в полиг.инкере вектора рМиеьсг ¡ргЕл"1", и анализировали электрофореза:.: в 0,8-1,0% агарозно« геле с послсдукаей блот-гибрндизаииэП. Гибридизацию проводили с сэ^тзетствуктсим:! леченными фрагьенгтаи кДЧК - встазками кленов 5 к 9, г также : /шП-ЯсоКУ фрагментом хлона 3 (сайт Есой\г принадлежит юлилинкер'у вектора рВ 1 исбсг¡р1$Кт), содергапям альтернативную, 1с сравнению с клиц-.'М 9, ну:слгот^:дкую последовательность кЛНК.

\

Для дальнейшей работы отобраны клоны А, В, С и 0 (рис. 3), Срагменты геномной ДНК этих клонов, содер^ааме нуклеотидные последовательности экзонов, субклонирозаны в векторы рВ1иеБсг1р1$К* или, в некоторых случаях, в шр18 и шр19, и секьекированы. Границы экзонов и ихтроноз устанавлены в результате сравнения нуклеотидных последовательностей геномных клонов и кДНК ТгрКБ (клоны 3, 9 и 5). Клоны А, В, С и й содержали все представленное в к£НК Тгр!15 экзоны, за исключением фрагмента кДНК размером 120 п.н. (рис. 3) Отсутствующая в геноиных клонах последовательность кДНК идентифицировала методом поликзразноГ: кепкой реакции (ПЦР) с использованием б качестве матрицы тотальной геноашой ДНК.

2.3. КлентиФикгиия отсутствующего в геномчьч: клонах эк.-юиа V методом ПНР.

Для идентификации отсутствующего эхзона (или экзонов) методом ПЦР использовали в качестве матрицы тотальную геномную ДНК из лимфоцитов человека и две олигонуклеотмдные затратен к известным 5' и 3' концевым нуклеотидным последовательностям отсутствующего в геномных кленах фрггмента кДНК. Олигонуклеотиды синтезировании и любезно предоставлении Б. Черновым (ИМБ РАН). Олигонуклеотид А8852 с последовательностью

5*-АбАТАТСААТСАСОТТСТТСАТС-З' соответствовал участку 610-732 п.н. кДНК клона 9. Олигонкулеотид АВ853 с последовательностью 5'-ТТТОТОААаАТЛААТСОААТОАССг-З' комплементарен участку 706-729 п.н. хДНК клока 9. Продукт ПЦР анапизирогали электрофорезом в 2% геле агарозы с последующим переносом на найлоновую мембрану и гибридизацией с меченной " Р кДНК клона 9. В качестзе маркера длин фрагментов ДНК использовали ДНК плазмиды р1!С19, гидролкзочаннгю рестрнктазой М$р1. Идентифицирован единственный фрагмент ДНК размером 120 п.н., гибридизующийся с кДНК клона 9.. Этот фрагмент элюировали из геля агарозы и клонировали по сайту £ша1 в полилинкер вектора рВ1ие$сг1р(£К+. Анализ нуклеотидной последовательности этого фрагмента показал, что он соответствует отсутствуете»} в геномных клонах фрагменту кДНК, и следовательно, представляет собой отдельный экзон.

1а 1Ъ II

ш и V VI га уш к хз

4 | 5 | 6 17(19 Ц0|

Н-доиен-|

Г±

I-

хоровмй фермент.

--1

Б В В ВЛЗсЕсЭ III II 111

елон А

ЗЗсЗсПЯ I II И

Н Н I_I

клон В

1 7.п.н.

5 В ЗсВЗс ВгВ Б I I III II I клон С

ЗХБЛеНХУ

I 11 II II

к дои В

Рис. 3. Экзон-кнтро::ная организация гена ТгрЯБ человека. В верхней части рисук::а показана экзон-кнтроннаь организация гена. Зкзокы показг::н вертикальными линиями и пронумерованы сверху римскими цифра!.:«. Интроны представлены горизочталывеги линиям-'' в масштабе и пронумерованы сверху арабскими цифрам. Разрывы в горизонтальной линии указывают на отсутствующие в геномных ¿слонах участки нитронов. Внизу указано соотношение между экзон-интронной организацией гена и доменной организацией субъелмюгеы ТгрНБ. В нижней части рисунка в нзеатабе показакь; рестриюзгонкые карты грномных кленов А, Е, С и С, содержали* ген Т'рЙК человека и отобранк-,г' для сеивен^рования. Указаны сайты рестрикции А -/.хиП, В - ВаиН!, Ев - В?/];, Н - Шг.сИ I, Р - ЛП, 5 - 5аиЗА, Бс - ££с1, 51 - 5x11 ь X - ХЬо!. Внизу слева укгзан иасптаб.

.2^. Экзон-янтронная организация гена TrpRS человека ■

Ген TrpRS человека состоит по крайней пере из двенадцати экзонов, разделенных одиннадцатью нитронами и ;анимае~ Солее 3S т.п.н. в геноые человека. Экзон-интронная организация гена TrpRS представлена-на рис. 3. Точная длина интрона между экзонами IX и X не известна из-за отсутствия перехрл'ают'лхся геномных клоноз. Также остаются невыиснеными размеры интроноз, фланирующих экзон V, структура которого подтверждена методом ПЦР (см. разд. 2.3).

Полная нуклаотидная последовательность экзоное гена TrpRS человеха и прилагавших к ним областей нитронов показана на рис. 4. По данным гибридизации с кДНК клока 9, первый кетраислируемый экзон 1а (рис. 3, 4) локализован е геномном клоне А. На рис. 2 показано, что клоны 9 и 3, кодируягые Ы-ко:;цгвую часть полипептида, отличаются по нуклеотидной последовательности, начиная с 74 нуклеотида вверх от инициирующего кодони ATG. Существование двух вариантов кДНК, ссдержаних на 5"-кокцах разные нгтранслируечые последовательности, может указ;л?ать на альтернативный сплайсинг в этом районе. Для идентификации альтернативного кетракслируемого экзона !Ь в качестве зонда для гибридизгции с геьомными клонами использовали фрагмент AsuIl-CcoRV к ДНК клопа 3 (сайт EcoRV принадлежит пелилинкеру ьсктора pBluescriptSK+). Этот фрагмент кДНК клона 3 (245 п.и.) содержит полностью отличающуюся от клона 9 нетранслируему» область (рис. 2). Таким образом, в геномном клоке А идентифицирован второй нетранслируемый экзон !Ь, находящийся на расстоянии 519 п.л. ниже экзона 1а (рис. 3, 4).

В экзоне II на расстоянии 73 п.н. от 5'-конца экзона находится инициирующий кодон ATG (рис. 4). Кодирующая область гена TrpRS расположена в экзонах 11-XI. а терминирующий кодон TAG - в экзоне XI на расстоянии 218 п.н. от 5'-конца экзона. Мотивы HXGI1 и KMSAS, характерные для aaKS класса 1, локализованы в экзонах V и IX, соответственно (рис. 4).

Нуклеотиеные последовательности на концах интронов в местах сплайсинга во всех случаях, за исключением З'-хонца интрона 1а, укладываются в консенсус, описанный ранее (Shapiro and Senapathy, 1987): все интроыы начинаются на 5'-конце с GT и заканчиваются на 3'—конце AG (табл. 1).

Началу экзона lb предшествует неканоническая

cccagcgtctgtgaccccagactcctgatctitccactgcactgtgccgcctcggtgaac

1SP.E 1 Spl

agatgcggggaat t tacqpt ttccct11reactçcccacpactacacaaaatcagtcaca et gaegetgagggtggggaacgggaagagggtggggaggt tat t tggaggccagcggggg

CAAT box

gt gaggggt ggctgatgcaf.t gaccagctaat gget egat t с tcaagagggt 11 cjlLLSJI

CAAT box

t etcaacctggccccccaggcaacccacccctgaiü^acagt ct catcaagaaggt tgg tcaagagctczagtgtttctgsgaatctgggtgatitataagaaacccttagctgaatgc

ISRE IJ

agpgtggggagaacpaaagacaaaagcatcttttttcapaagpgaaactqaaaeAAAGAG ТАГА box

GCGAAGAGTATTAAAGACCATTTCTGGCTGGGCAGGGCACTCTCAGCAGCTCAACTCCCC Эк зон

/ GCGTG/.CC AGTGGCCACCTCTGCAGTGTCTTCC ACAACCTGGg t a t g t a t tgccat ct t la t gccKggct tagagettgt tcgtgt t î ttagcaaagt^ctgasaacct tggt:taggggg t caggact tg igtet taggattagggtgttatgeat 11 tacttcttccat tgacccaaag 11caggtgat tcactgctcccatagggaacagagatcctggctgagcagtcgcgggct tg gatccagaaacactcctgggccacattctcttctcagctgctccagaattggctgtcttg Нитрон atgccrcccttccccagattgcagaa»cagcgtgtcctgatctctgtgagatgatt t tga lz tgcaacccaagtct ttateatgttgttetgttaaacaattetatagtcctt tccactcct

CAAT box TATA box

с 3tcccaatacaatacccagt 11 ct t taaglgcctJLiLLatgct cctccaccgcagtgga aact 11cagaatgageacaagat tcaagt tet tcaaaagggggaactgggggt taa1111 сaaeaggct t11 taget ttctcCTTGAAGGTCTGCTGTGATCTGCTGTGGAGTAGGCAGT TTTÖCTCTTTACACGCCCAGTACTTTTGTTTAGGGAAGATAATAGAGTACTTCACTGGTT Экзон ATAACTGCATTTCTTTGTTTCAGAGTGTAGTATTTGTTAAACAGGTC-AATCTACTTCTCT lb TAACAAAG7CTCAATGTCCTATTTGCAATTTATGTGGTAAACACTGAAGACAATGGTCCT TAACCTTTTGGCATCTCAGCCTCCTTTCGAAAGgtsagaaagccaggagsctgct caaaa

....................Интрон lb...............................

gagctcacit tgtct tagngcagctgaccagcagtggaagacatttcctcagcgatatat tagt tatggctacaaaagcccaagaat tcatccccaaggcaat taagalsaaccacaaat

agaggatgggtgccttggctcacacctataatcccaacagaggatcaccigaggtcagaa

gt tcaagaccagcctggccaacatggtgaaaccctccctct actaaaaatacaaaaat tс

gctgggcatggtggcaggcagcctcaggaggctgagacagaagaatcgcttgaaccccag

aggtggaggtTgcagtgagccaagatcacaccattgcactccagcctgggtggcagagcg

agactccaTctcaaaaaaaaaaaaaatcaaatagtaat t tgccaiaagt111 tagcaatg

aactTaggTtcattaaaacacattggtat ttataccctgagcaaacaggagtcctcctgt gttctgggcactgggtgggggcacaggggcatcgaccagatggaaactigatcttgacta ggsgggcccctcctagtcaagtagattcacaccttaagtcagtaaatcctagccactcct ttagtcttcatcactggcatttgatggt 11tcctct tcttcatggccccaaatttct2Bt tctctttt tat tat altatсtat gtcctt tactgtaactcacctcacaacct tteeggaa aaaagEact caatacagg.-aiggaaaaacagccgcnatgt tgtgttaacctctegttttt cctctctctccttccccgcccccaccccagTCTiGÂCTCGTCTGCTGAACAAAÏCCTCTG ACCTCAGC-CCGGCTGTGAACGTAGTTCCTGAGAGATAGCAAACATGCCCAACAGTGAGCC

M P N S E P Экзон CGCATCTCTGCTGGAGCTGTTCAACAGCATCGCCACACAAGGGGAGCTCGTAAGGTCCCT 11

ASLLELFNS IATQGELVRS L CAAAGCGOGAAATGCGTCAAAGgtacatgat111netgggt t ct ccaczaaggcagct ga К A G N A S К

jeeteccaagtctgtagggttgtj;tcctctaga?. ........................

.........................Интрон ?............................

111 cc t с t с :cagGA7GAAATTGATTCTGCAGTAAAGATGTTGGTGTCATTAAAAATGAG DEÎDSAVKMLVSLKMS riACAAAGCTGCCGCC-GGGGA&jATTACAAGGCTGACTGTCCTCCAGGGA/.CCCAGCACC - ,„u YKAAACEDYKADCPPGNPAP Jïf?H rACCAGTAATCATGGCCC^GATGCCACAGAAGCTGAAGAGGATTTTGT&GACCCATGGAC 111 TSNHGPDATEAEEDFVDPWT

AGTACAGACAAGCAGTGCAAAAGGCATAGACTACGATAAGCTCATTGg tacgtccictgc

VQTSSAKG1DYDKLI tttcttcccagaaaaagctgcaacttttagaagtggtcccattgagttgattccattgat

gt 111 taaat11tgaattaatgatanattcagtgaagctt....................

.........................Интрон 2...........................

agaaagtcatc1111 с 1111111 сcagTTCGGTTTGGAAGTAGTAAAATTGACAAAGAGC

VRFGSSX 1 DKE Экзон TAATAAACCGAATAGAGAGAGCCACCGGCCAAAGACCACACCACTTCCTGCGCAGACGCA IV L ! N R 1 ERATGQRPHHFLRSG TCTTCTTCTCACACAGgtcaggggctct t...............................

..........Нитрон 4.........................

AGATATGAATCAGGTTCTTGATGCCTATGAAAATAAGAACCCATTTTATCTGTACACGGG

DMNOVLDAYENKKPFYLYTG Экзон CCGGGGCCCCTCTTCTGAAGCAATGCATGTAGGTCACCTCATTCCATTTATTTTCACAAA V RGPSSEAMKVGHL IFF I F T К

..........................Интрон 5 ........................

cggcagctgcgcccccgtgtttctttñgGTGOCTCCAGGATGTATTTAACGTGCCCTTGG

WLQDVFNVPL TCATCCAGATGACGGATGACGAGAAGTATCTGTGGAAGGACCTGACCCTGGACCAGGCCT VIO M TDDEX Y L W К DLTLD04 Экзон AÏAGCTATGCTGTGGAOAATGCCAAGGACATCATCGCCTC-rGGCTTTGACATCAACAWA VI YSYAVENAXD I IACGFD I N К CTTTCATATTCTCTGACCTGGACTACATGGGgt aagpagaaabcgt с t ggc i get 11 tt с TFIFSDLDYMG

aataggtagaggaggatgtcaagt tgtcatgaccacagctaaattcgaaacsaotgaaat ggtcttaaggcctagtaaatgttct tcttcct t :attaaatgctûtgagtggccagccat ggtcggtcactcctgtaatcccagcactttgggaggccgaggtgggcgggicacgaggtc aggagttcaagaccagcctgaccaacatggtgaaaccccatctctat tgataatacaaaa at tagttgggtgtggtgg^acgcacctataagcccagctactcaggtggctgaagcagga gaatcgcttgaacccaggaggtggaggttacagtgagttgagatcacgccattgcactcc agcctgggcaacagagcgagactccatctcaaaaaggaaaaaaaaatgctatgagci ..

.........................Интрон 6...........................

attctcgttgtctt t gcc sGATGAGCTCaCGTTTCTACAAAAATGTGGTGAAGATTCAAA

MSSGFYKNVVK I О Зкзон AGGATGTTACCTTCAACCAACTGAAAGGCATTTTCGGCTTCACTGACAGCuACTGC ATTG V11 KHVTFNOVKG ! FGFTDSDC I

gtaaggggcccactgctgc tgtggaccactccctgcaccct tcaaaaa............

....................... Интрон 7..........................

с t ca t с i cacgt gt aaaaa tас tttttctcatttt cagGGAAGATCAGTTTTCCTGCCAT

G K 1 S F P A I CCAGGCTGCTCCCTCCTTCAGCAACTCATTCCCACAGATCTTCCGAGACAGCiACGGATAT jf??"

Q A A P S F S N S FPQ 1 FRDRTD! vul CCAGTGCCTTATCCCATGTGCCATTGACCAGgt cagcaggcagaaaagcaaggc t с t с t a OCLIPCAIDQ

agtctggggcattgacagcaggttcctet tac ...........................

.........................Интрон 8 .........................

1111сtggccgccctcatcagggtcct tactctccсcacagGATCCTTACTTTAGAATGA

D P Y F R M

CAAGGGACGTCGCCCCCAGGATCGGCTATCCTAAACCAGCCCTGTTGCACTCCACCTTCT TRDVAPR I GYP KPALLHS T F TCCCAGCCCTGCAGGGCGCCCAGACCAAAATGAGTGCCAGCGACCCAAACTCCTCCATCT FPALQGAQTKMSASDPNSS I TCCTCACCGACACGGCCAAGCAGATCAAAACCAAGgtgagcagtggcccaggccaga... FLTDTAKO IKTK

.........................Интрон 9..........................

etgcagtgagccccacagtagctcacacccccgcctcacaggaagaacagcagtgggt сс cccactggctgtgcgcccccgsccggctgtgcgccttggeetttccctggtccagaatct gacagcactcacacctcîgact tccacacttgggcttctagccagtgtccaggcacagga t gageaggae t gaggageg t gt ctgtgtcctcttcîggt gcagGTCAATAAGCATGCGTT

V N К H A F

Экзон IX

ttctggagggagagacaccatcgaggagcacaggcagtttgggggcaactgtgatgtgga

SGGRDTI ESHRQFGGNCDVD Экзон CGTGTCTTTCATGTACCTGACCT7CTTCCTCGAGGACGACGACAAGCTCGAGCAGATCAG X VSFMYLTFFLEDÖDKLEQIR

GAAC-agigagcagggaaccccaagggcccacagccg ......................

К

.........................Интрон 10 .........................

cccctagcat cggtaggggtgggcactgccctccccat tggccct t tcactgtgagaggc caagtcatggctatcgtcagagcccaggtttctagccgttttaggaaaagtgtagctcaa ggtatajgt tattgt tgtggtaacaacagatctcacttctgagt^ccacccacgtgccag getctgcatgggtggtgagggctgagctggtgcccgaggcaggaaggagccgct caggac atgtggagccatctcicacgtggctgtcctcctccgggcagGATTACACCAGCGGAGCCA

D Y T S G A TCCTCACCGGTGAGCTCAAGAAGGCACTCATAGAGGTTCTGCAGCCCTTGATCGCAGAGC MLTGELKKALIEVLOPLIAE ACCAGGCCCGGCGCAAGGAGGTCACGGATGAGATAGTGAAAGAGTTCATGACTCCCCGGA HQARRXEVTDEIYKEFMTPÄ Эхзон AGCTCTCCTTCGACTTTCAGTAGCACTCGTTTTACATATGCTTATAAAAGAAGTGATC-TA X¡ Г. L S F 0 F O Z

TCAGTAATGTATCAATAATCCCAGCCCAGTCAAAGCACCGCCACCTGTAGGCTTCTGTCT CATGGTAATTACTGGCCCTGGCCTCTGTAAGCCTGTGTATGTTATCAATACTGTTTCTTC CTGTGAGT7CCATTATTTCTA7C rCTTATGGGCAAAGCATTGTGCGTAATTGGTGCTGGC

macattgcatggtcggaíaoagaagtccagctgtgagtctctccccaaagcagccccac agtggagcctttcgctggaagtccatgggccaccctgttcttgtccatggaggactccga

Gf^ttccaagtatactcttaagacccactctgtttaa/.aatatatattctatgtatgcgt ATATGOAATTGAAATGTCATTATTGfAACC.TAGAAAGTjCTTTGAAATATTGATGTGGGC AGGrTTAlTGAGCACAAC-atgtatttcagcccatcccccctcccaaaaagaaattgataa gtaaaagcttcgttatacatttgactaagaaatcacccagctttaaagctgcttttaaca atgaagattcaacagagttcagcaattttgattaaattaagact'fGGGCGTGAAACTTTC cagtttactgaactccagaccatgcatgtagtccactccagaaatcatgctcgcttccct tggcacaccagtgttctcctgccaaatcaccctagaccctctgtcctgcagagtcagggt ggcttttcccctgactgtgtccgatgccaaggaotcctggcctccgcagatgcttcattt tgacccttggctgcagtggvigtcagcacag^gcagtgccctggctgtgtccctggacgg GTGGACTTAGCTAGGGACAAAGTCGAGCACCAGCCCTCGAGGCCCTCACAGATGfCTAGG caggcctcatttcatcacgcagcatgtgcaggcc7ggaagagcaaagccaaatctcaggg aagtccttggttgatgta'fCTGGGTCTCCTCTGGAGCACTCTGCCCTCCTGTCACCCAGT

сигнал полладенилирозания AGAGTAAATAAAC'fTCCTTGGCTCCTGc tcttgtcattgtgctctgtctgggaggtctga ggaggg?.gcagagacccctcccctcaccct tctgtggatgaccttgagtctgctggagtc ?aaat i tggggatgaaagcgcacagtcccaggaaccccatggtgttgtgccacagctccc aggaatgggct tgtgetgggagagcct tagcagcatс

Рис. 4. Нуклеотидная последовательность экзонов и прилегающих участков интронов гена триптофанил-тРНК-синтетазы человека. Нуклеотиды экзонов указаны заглавными букзами, прилегающих участков интронов и 5'- я З'-нетранскрибируемых областей - прописными буквами. ISRE, Spl, СААТ box, TATA box и сигнал полиаденилирования подчеркнуты. Эхзоны пронумерованы римскими цифрами, интроны - арабскими. Кодируемые АК указаны в оанобуквеннсм коде под вторым нуклеотидом кодона. Терминирующий кодон обозначен Z. Мотивы HXGH и KMSAS зьшелены жирным шрифтом. Пунктир обозначает не показанные на рисунке нуклеотидные последовательности гена.

Таблица 1. Интроны гена ТгрК5 человека.

Интроны 5'-конец донор размер (т.п.н. ) 3' -конец акцептор

1а 0.5 •>

1Ь £laagaaa 4.5 сассссаг

2 iiacatga 6.5 г сг с 1 сдх.

3 £1ас£1сс 1-2 МИссд®

4 £lcagggg >5 ?

5 7 •> 11сшг£

6 £1аагЕа£ 6 вд^ссад

7 £xaagggg 4 л 11 1 1 с ££.

8 здеащеа 0.5 сссся£а£

9 >3

10 .ШаЕсае 2.5 ccggeca£

Показаны 8 нуклеотидов донорных 5'-концов и акцепторных 3'-концов интронов. Инвариантные нуклетиды в точке сплайсинга подчеркнуты.

Таблица 2. Экзоны гена ТгрК$ человека.

Экзонь: 5'-конец Размер (п.н.) З'-конец Фаза сплайсинга е кодоне

1а АААйАй 109 АССТСО

1Ь ? .^252 СвААЛО

1! ТСТТбА 172 ТСАААи Б К 0

111 бАТОАА 0 Е 214 АТТС I 1

IV ТТССЮ V К 109 САСАС Н Б 2

V АБАТ Э 12Э АСААА Т К 2

VI ОТОС Ч/ 183 АТССС М С 2

VII бАТС М 101 АТТС I 1

VIII СвААв 0 К 113 ОЛССАС й 0 0

IX бАТССТ 0 Р 174 ЛССА/Л Т К 0

X ОТСААТ V N 141 АОСААС И К ■ 0

XI САТТАС Р У 1247 СТССТС

Указано по 4-6 5'-концевых и З'-хониевых нуклеотидов каждого зкзена. АК в однобуквенном коде указаны под вторым нуклеотидом кодона.

последовательность ТС. В связи с этим можно высказато два предположения. Первое, З'-конец нитрона 1а неизвестен, т.к. кДНК клона 3, с нуклеотидной последовательностью которой сравнивали нуклеотидную последовательность геномного клона А, может быть неполной на 5'-конце. Второе, в интроне 1а расположен старт альтернативной трансхрипции, и сплайсинга между экзонсм !Ь и лежащим выше экзоном не происходит, поэтому сигнал для сплайсинга перед мачалсм экьона !Ь не нуден. Ка рис. 4 граница между нитроном 1а и экзонсм lb указана по S'-концу кДНК клона 3.

Первые пять нуклготидов - CGAAA - на 5'-конце кДНК клона 9 не поддаются выравниванию с нуклеотидной последовательностью геномного хлона А. Кроме того, началу выравненной последовательности эхэона 1а лредиествует каноническая для 3'-конца интрсна последовательность AG. Возможно, что перэые пять нуклготидов кДНК клона 9 принадлежат ems одному, пока не ,чдет 1*.*ициро2ан:гому, леааиему выше экзону. К сожаленсю, до сих пор не обнаружена кДНК, более длинная на 5'-конце, чем кДЧК клона 9.

Сплайсинг между экзснами происходит после первого, второго или третьего нуклеотпда кодона (табл. 2), т. е. встречается фаза сплайсинга типа 1, 2 или 0, соответственно (Sharp, 1981) .

Десять из двенадцати экзонов TrpRS человека имеют размер 109-214 п.н. (табл. 2), как и большинство известных экзонов генов млекопитающих (Dorit et al., 1990). Экзон lb (=252 п.н.) -длиннее среднего размера экзонов, однако, его размер окончательно не установлен. Самый длинный зкзон - XI, 1247 п.н., кроме нуклеотмдкой последовательности, кодирующей С- конец фермента, включает полную нуклеотидную последовательность

3'-нетранслируемой области мРНК, содержащую сигнал полиадекилирования (рис. 3, 4, табл. 2). Размеры интроноз варьируют от 0,5 т.п.н., ка:г, например, между экзонами 1а и lb, VIII и XI, до 6,5 т.п.н. - мезсду экзонами II и III (табл. 1). Размеры интронов между экзонами IV и V (>5 т.п.н. ), V и VI (>0,5 т.п.н.), IX и X (>3 т.п.н.) не установлены из-за отсутствия перекрывающихся геномных клонов (рис. 3. табл. 1)

Нуклеотидная последовательность4--экзонов гена полностью подтверждает структуру кДНК TrpRS человека с точностью до нуклеотида. Существуют различия в перекрывающемся участке кДНК

клонов 5 и 9 по трем нуклеотидам. В геномных клонах присутствует нуклеотидная последовательность кДНК клона 9, но это не исключает предположения авторов (Frolova el al., 1991) о том, что три нуклеотпда, отличающиеся в кДНК клонов 5 и 9, отражают аллельный полиморфизм гена TrpRS человека. Нуклестиднаг последовательность 3'-конца экзоиа XI установлена при псмоши сравнения с нуклеотидной последовательностью З'-конца кДНК гена у2 человека (TrpRS человека) (Fleckner eí al., 1991), отсутствуюаей в кДНК клона 5.

¿L. Регулятопные элементы д 5'-фланкирующей рбластн 7£ца TrpRS человека.

С цель» выявления ' предполагаемых транскрипционных регуляторных элементов, описанных в литературе (см. Турпаев и Васецкий, 1990), проведен компьютерный анализ нуклеотидной последовательности 5'-фланкирующих областей гена TrpRS человека при помощи программы SIGilAL SCAN версия 3.0. Нуклеотисные последовательности типа TATA box, характерные для промоторных областей большинства генов (Savadogo and Roeder, 1935), обнаружены в экзо>:е 1а и в интроие is (рис. 4). 3 опытах по обратной транскрипции тотальной mFHK, полученной из предварительно обработанных IFN-7 культуры клеток HeLa, с использованием в качестве специфической затрэзки для обратной транскрипции олигенуклеоткда, комплел-ентарного участку 138-158 п.н. транслируемой области TrpRS человека, установлено, что точка начала транскрипции находится приблизительно на расстоянии 140 п.н. вверх от инициирующего кодона АТС- (Buvitt eí si., 1992). К сожалению, из данных, полученных в этой работе, не ясно, какой из альтернативных экзонов, 1а или Ib, считан в изученном транскрипте, так как его 5'-конец расположен вьтае точки ветвлания (-74 п.н.). Если в изученном Buwilt eí al. (19S2) транскрипте считан экзон 1а, то TATA box, расположенный ь экзоне 1г. (рис. 4) приблизительно на расстоянии 28 п.н. зверх от старта транскрипции (что согласуется с дамыми литергтуры (Sacadogo and Rrveder, 1985), может служить промотором для альтернативной транскрипции гена TrpRS. Еторой предполагаемой TATA box, рас;.,оло»пнвый в ьнтроне la, может служить промотором для альтернатизкой транскрипции, в ходе которой считываете г. экзон Ib.

3 рассмотренной нами области обнаружено три предполагаемых элемента типа СААТ box, являющегося участком сзязывания транскрипционного фактора NF-1, и элемент Spl - участок связывания транскрипционного фактора Spl (Briggs et al., 1986). Эти элемент часто зстречахггся в чромоторных областях генов, транскрибируемых РНК-полимеразой II, и стимулируют транскрипцию.

4.1 1'ктср(Ьвроч-з^гиси?.х1е регулятоэныг элементу.

Одновременно с расикфровксй АК последовательности TrpRS человека, выведенной из первичной структуры кДНК, специфической для TrpRS (FroioYa et ai., 1991), появились работы в которых и; данных молекулярного клонирования кДНК установлена АК послетвательность белка, индуцируемого в культуре 1мниотических клеток человека интерферон3»1 г (IFN-r) и названного r2 (Fleckner et ai., 1991), и белка SíKct, индукцию которого в культуре фибрсбластов человека вызызали IFN-a и IFM-r (Rubin B.Y. et al., 1991). Несколько позте опубликована АК последовательность белка IFP53, индуцируемого в культуре клеток HeLa I FN—т (Buwitt et al., 1992; Sange et ai., 1992). Все три АК последовательности IFN-индуцибельных белков, полученные на основании молекулярного клонирования и секвеиирозания хДНК, идентичны АК последовательности TrpRS человека, за исключением 1-3 АК замен, отра^аклцих, по- вицимсту, аллельиые вариации. Более того, все эти IFN-ипдуцибельные белки обладали активностью TrpRS.

Если индукция IFN-a h IFN-r происходит на уровне регуляции транскрипции гена TrpRS, то следует ог.идать, что в 5'-фланхируззих областях гена должны присутствовать регуляторные элементы, характерные для IFN-зависимых генов. Изучение промоторных участков различных lFN-зависимых геноз позволило выявить консенсус I FN-зависимого элемента (IRSE)

5*-GGAAAN(N/-)GAAACT (где N мотет быть О, А, Т или С, а означает отсутствие нухлеотида) (см. V/i I liaras 1991; Kerr and Stark 1991), который мы назвали "длинный консенсус". В некоторых IFN-зазисимых генах, например, в гене

(2'-5*)-олигоаденилатсинтетазы человека, два 3"-концевх нуклеотида консенсуса (CT) могут быть заменены другими нуклеотидами. Конценсус типа 5'-GGAAAN(N/-)GAAA мы назвали "коротким консенсусом".

Для выявления ISRE в гене TrpRS человека проведен компьютерный анализ 5'-фланкчруюших областей гена с помощью программы SIGNAL SCAN, всрсия 3.0. Обнаружено два ISRE, локализованных выше экзона la: ISRE I и ISRE 1) (г,ис- 4). 1SRF 11 находится непосредственно перед началом экзона la и соответствует короткому консенсусу. ISRE I расположен выше ISRE 11 на расстоянии 310 п.н. и соответсвует длинному консенсусу в обратной ориентации (ми^ус цепь ДНК). Так как расстояние цегду ISRE невелико, то они могут усиливать актизность друг друга, как это показано для 1SRE гена (2*-5*)-олигоаденилатсинтетазы (Cohen el al., 1938, Rutherford et al., 1988). Да=е единственная копия ISRE мохсет функционировать как I Р(4-андуаибельный элемент, i:sk показано в системе экспрессии в векторе tkCAT (СоЬчп -t ci., 1988, Dzïe et al., 1989). Хотя 14 п.н. ISRE достаточно для индукции интерфероном гетерологичкого промотора, его эффективность существенно зависит от дополнительных регуляторных элементог и флаикирусаих нуклеотидных последовательностей (си:. Williams 1991).

Многие вирусные н клеточные Spl-зависимые промотора нмеит элемент Spl, локализованный внутри или ь непосрепстзенной близости от других регуляторных элементов (Kadonags st al., 1986). Это такие верно и для IFN-3aBHCHMDX генов, в ::отсрых элемент Spl расположен пблизн от ISRE (Rutherford et а.'., 19С8, Porter et al., 1988). Полобная организация обнаружена и ь гене TrpîlS чгловека: потенц:1ь;;ъкый элемент Spl 5GCGCGG-3' в обратной ориентации (минус цепь ДН") примыкает непосредственно к З'-концу ISRE I (рис. 4).

Присутствие I гК-регулмрус:л:х элекентос в 5'-регуляторной области гена TrpRS человека находится в полном соответствии с приселенным;: выше данными по икдуцибельности синтеза TrpRS iFN. Изпестно, что ! SEE отвечают за ик.^укшио ::ак IFN-a, так и IFN-7 (Reiiï et si., 1989). Действительно, синтез TrpRS- человека стимулируется и IFN-a, и I FN-г (Rubin et г./., 1991). Для выяснения функциональной роли кахщого регуляторного элемента, обнаруженного наги з гене TrpRS человека, необходим дзпьнейший делециоьный анализ 5'-флг1;г:::;уещей области гсча.

AaUS ясляются 1:20тье:.1ле:п^мк компонентами клеточного механизма биосинтеза белков, к согсриенио необходимы для

существования живых клеток. Присутствие I FN-зависимых регуляторных элементов в генах, кодирующих aaRS, обнаружено нами впервые. Индуиибельность TrpRS человека IFN-a и I FN—г указывает на то, что TrpRS мояет обладать дополнительными неканоническими функциями, как постулировано ранее (см. Киселев Л.Л., 1990).

ÍU. Взаимосвязь межи у экзон-ннтоонной организацией гена и дак£нн2й структурой Ёхбьеляшиш TrpRS.

Известно, что субьединица TrpRS быка состоит из двух дочеиов: "корэвого" (core) и М-зомсна. "Коровый" домен размером -40 кДа образуется в результате ограниченного протеолиза (Prassolov et al, 1975, Lesaire e: il., \91S). При протеолнзе эластазой или за счет эндогенных протеаз (возможно катепсина, присутствующего в поджелудочной железе) сохранившийся "коровий" домен б составе димера катализировал как Trp-зависимой РР^АТР обмен, так и аминоацилирование тРНК^гР. Второй домен, меньший по размеру, оче.чь чувствителен к протеолизу и расположен на N-конце полипептидной цепи субъединицы TrpRS быка. Так как гомология между аминокислотными последовательностями TrpRS быка и человека составляет более 90$, мы можем предположить, что субъгдиница TrpRS человека тахже состоит из двух аналогичных доменов.

N-концевая последовательность субьединицм TrpRS

млекопитающих отсутствует з субъединице бактериальных TrpRS, в то время как "коровый" домен млекопитающих имеет значительные районы гомологии (>3096) с бактериальными TrpRS. Эти особенности эчолюционно более молодых белков дают основание предполагать, что N-домен появился позднее в результате эволюции TrpRS и не несет канонических энзиматических функций. Структура ныне существующего гена TrpRS млекопитающих, возможно, образована в результате слияния генов или путем генетической рекомбинации.

Субъздиницы бактериальных TrpRS (Escheri chia coli, Bacillus stearothermophilus и Bacillus subtilis) состоят из 334, 323 и 330 AK, соответственно (Hall et al., 1982, Bar s tow et al., 1986, Chow and Wong, 1988). Поскольку субъединицы TrpRS (328 AK) Bacillus stearothermophilus достаточно для осуществления каталитической активноёти в составе димера, то эти две субъединицы составляют минимальную "коровую" структуру. Если из длины полипептидной цепи субъединицы TrpRS быка (475 АК) вычесть "коровый" домен (328 АК),

то оставшиеся 147 АК приходятся на отсутствующий у прокариот N-домеи TrpRS. Очевидно, что эти расчеты совпадают с распределением не гомологичных участков мезду полипептидными цепями TrpRS прокариот и эукариот. Таким образом, граница между N-домеиом и "коровым" доменом, установленная методом ограниченного протеолиза, совпадает с точкой, отделявшей N-домсн от консервативного "корового* домена, необходимого для каталитической активности TrpRS как-эукариот, так и прокариот.

Согласно приведенным подсчетам, граница между N-доменом и "коровым" доменом находится в районе 147 АК. Как показано Lemaire et а/. (1975), N-концевым АК остатком в энзиматичсски активном "коровом" домене субьединнцы TrpRS быка являе1ся Asp. В районе предполагаемой границы между N-доменом и "кооовым" доменом находятся два Asp остатка: Asp-147 и Asp-153 в TrpitS быка (Garret et а 1., 1991) и Asp-142 и Asp-148 в TrpRS человека (Frolova et al., 1991). Только послс расшифровки N-концевой АК последовательности "корового" домена мы можем окончательно установить, какой из остатков Asp служит N-концевым для "корового" домена.

Из первичной структуры гена гена TrpRS человека (рис. 4) видно, что первой АК, кодируемой экзоном V, является Asp-142. Это означает, что экзоны со II no IV кодируют N'-ломен фермента, а "коровый" домен кодируют оставшиеся экзоны V-XI. Таким образом, наблюдается корреляция между экзон-интронной структурой и доменной организацией субъе&иницы TrpRS человека (рис. 3). Ми предполагаем, что гены TrpRS высших эукариот (млекопитающих) представляют собой химеры и состоят из двух элементов: "корового", имеющего общее происхождение для прокариот и эукариет, и N-кпнцевого, присутствующего только у эукариот и выполняющего неизвестные пока функции.

iL. Сравненье структур генов. кодирующих TrpRS и GluProRS человека.

Как показано Cerini et cl., (1991) за функции аминоацилировання tPHKj'u отвечает N-концевая 1/3 часть полплептидной цепи GluProRS. С-концевая 1/3 часть полипептидной цепи GluProRS представляет собой ProRS и отделена от N-концевой части блоком АК повторов. Энзиматичгски активный CluRS-'коровый"

домен GluProRS человека состоит из 340 АК (Thommes et al., 1988), что очень близко к размеру "корового" домена субъединицы TrpRS млекопитающих (—330 АК). Так как эти ферменты катализирухгг однотипные реакции - ацилирование 2*0Н рибозы терминального аденозина акцептэрного стебля тРНК. мы предполагаем, что "коровый* домен aaRS класса I должен иметь приблизительно одинаковый размер - 330-340 АК.

Недавно опубликована неполная экзон-интронная структура гена GluProRS человека (Kaiser et al.,1992), включающая 5'-концевую часть гена, кодирующую GluRS. Сравнение экзонной организации генов TrpRS и GluProRS человека выявляет следующие общие черты: в обоих случаях 10 экзонов гена кодируют 471 АК полип^птидной цепи всей субьединчцы TrpRS и 426 АК N-концевой части GluProRS, отвечающей за аминоацилирования тРНК®'". "Коровые" домены кодируются семью экзонами (с V по XI) в случае TrpRS и восемью экзонами (с IV по XI ) в случае GluProRS. Мотивы, характерные для aaRS класса I, расположены в экзонах V и IX в TrpRS и в экзонах V и VIII в GluProRS. Первые четыре экзона гена TrpRS и первые три экзона гена GluProRS кодируют неконсервативные N-домены, не отвечающие за каталитические функции функции этих белков. Вероятно, ген GluProRS человека в части, кодирующей GluRS, прошел сходную с геном TrpRS человека эволюцию, в ходе которой к экзонам, кодирующим GluRS-'коровый" домен, путем генетической рекомбинации или слияния генов были присоедснены дополнительные экзоны, кодирующие N-домен. К сожалению, отсутствие информации о структуре других генов aaRS млехопитающих не позволяет нам выявить общие закономерности организации этих генов, что остается делом будущего.

ВЫВОДЫ

1. Выявлен и секвенирован клок кДНК TrpRS человека, содержащий альтернативный вариант 5'-нетранслируемой области по сравнению с ранее идентифицированным и секвенированным клоном кДНК TrpRS человека.

2. Идентифицированы, картированы и частично секвенированы геномные клоны, включаюоие участок генома человека длиной —35 т.п.н., содержащий ген TrpRS.

3. Установлена экзон-интронная организация гена TrpRS

человека. Ген состоит из 10 экзонов, кодирующих субъединицу TrpRS, и по крайней мере -двух 5'-концевы* нетранслируеыых экзонов, участвующих в альтернативном сплайсинге.

4. В 5'-фланкирующей области экзона 1а гена TrpRS человека обнаружено два предполагаемых !FN-зависимых элемента (ISRE), встречающихся в промоторных областях многих IFN- зависимых генов и необходимых для регуляции их транскрипции, что согласуется с фактами стимуляции IFN-c и IFH-r синтеза TrpRS человека.

5. Высказано предположение, что "корогь;^" домен субъедиш:цы TrpRS человека, выполняющий каталитические функции и имеющий гомологию с прокариотическими TrpRS, кодируется зкзонами с V по XI, а К-домен, не имеющий гомологии с прокариотическими TrpRS, -экзонами со II по IV.

6. Предложена гипотеза, объясняющая эволюцию TrpRS млекопитающих: предковая TrpRS кодировалась геномными последовательностями, аналогичными эхзонам с V по XI TrpRS человека, а область, кодирующая N-домен, возникла в ходе недавней эволюции путем слияния генов или путем генетической рекомбинации.

ОСНОВНОЕ СОДЕРЖАНИЕ ДИССЕРТАЦИИ ИЗЛОЖЕНО В СЛЕДУЮЩИХ РАБОТАХ:

1. Frolova L.Y., Sudomoina М.А., Grigorieva A.Y., Zirovieva O.L., Kisselev L.L. (1991). Cloning and nucleotide sequence of the structural gene encoding for human tryptophanyl-tRNA synthetase. Gene, vol. 109, pp. 291-296.

2. Frolova L.Y., Grigorieva A.Y., Sudomoina M.A., Kisselev L.L. (1993). The human gene encoding tryptophanyl-tRNA synthetase: interferon-response elements and exon-intron organization. Gene, vol. 128, pp. 237-245.

3. Frolova L.Y., Sudomoina M.A., Grigorieva A.Y., Zinovieva O.L., Kisselev L.L. (1991). EMBL Database under Acc. No. M61715

4. Grigorieva A.Y. Sudomoina M.A. Frolova L.Y. Kissalev L.L. (1992). EMBL Database under Acc. Nos. X67918-X67928.