Бесплатный автореферат и диссертация по биологии на тему
Клонирование кДНК и функциональный анализ нового белка человека СВР1, принадлежащего к классу КН-доменных белков
ВАК РФ 03.00.26, Молекулярная генетика

Текст научной работыДиссертация по биологии, кандидата биологических наук, Лукьянова, Татьяна Ивановна, Москва

. {/; >

ч

российская академия наук институт биологии гена

На правах рукописи удк 577.1+599.323.4

лукьянова татьяна ивановна

клонирование кднк и функциональный анализ нового белка человека СВР1, принадлежащего к классу доменных белков

Специальность 03.00.26 - молекулярная генетика

Научные руководители:

член-корреспондент РАН, доктор биологических наук Н. в. Гнучев

кандидат биологических наук С. л. Киселев

диссертация на соискание ученой степени кандидата биологических наук

москва

1999

ОГЛАВЛЕНИЕ

СПИСОК СОКРАЩЕНИЙ 5

ВВЕДЕНИЕ 6

ОБЗОР ЛИТЕРАТУРЫ 9

I. Полифункциональные белки: связь между транскрипционными 9 и пост-транскрипционными процессами в клетке

II. Особенности структуры ЬпВМР белков 11

1. ЛВВ/ЕРМ/1иЧР-С8 домен 11

2. ЯСС мотив 12

3. К-Ното1(^у домен 14

4. Дополнительные домены 15

III. Пост-транскрипционные и пост-трансляционные 16 модификации

IV. Свойства и функции Ьп1йЧР белков 18

1. Специфичность связывания с нуклеиновыми кислотами 18

2. Роль 1т1№Р белков в упаковке мРНК 20

3. Спаривание цепей РНК 21

4. Взаимодействие с другими белками 25

5. Роль ИпШЧР белков в сплайсинге 26

6. Роль 1тШЧР белков в транспорте зрелой мРНК из ядра

в цитоплазму 28

7. Специфическая экспрессия ЬпККР белков в различных

типах клеток и участие из в развитии заболеваний 32

V. Класс КН-доменных белков 34

1. Связывание ИпИЧР К с нуклеиновыми кислотами 36

2. КН-домен - основной структурный и функциональный

элемент класса КН-доменных белков 38

VI. Заключение 41

МАТЕРИАЛЫ И МЕТОДЫ ИССЛЕДОВАНИЙ 43

Ферменты и реактивы 43

Выделение плазмидной ДНК 43

Агарозный гель-электрофорез ДНК и выделение

фрагментов ДНК из геля 45

Плазмиды и клонирование 46

Определение нуклеотидной последовательности ДНК 49

Культуры клеток 49

Штаммы бактерий 50

Трансформация клеток Е. соИ плазмидной ДНК 50

Выделение тотальной РНК и очистка поли-(А) + РНК 52

Фракционирование РНК в агарозном геле,

содержащем формальдегид 54

Перенос РНК на нейлоновую мембрану НуЬопй 14+ 55

Нозерн-блот гибридизация 55 Радиоактивное мечение ДНК-зонда с

использованием рассеянной затравки 57

Выделение геномной ДНК из клеток человека и

анализ ее по Саузерну 57

Клонирование кДНК СВР1 с помощью стратегии

вычитания 58

Полимеразная цепная реакция 63

Обратная транскрипция 64 Получение делеционных конструкций с

помощью экзонуклеазы BAL31 65

in vitro транскрипция и трансляция 66

Анализ связывания белка СВР1 и его делеционных

вариантов с олиго-й( С ) последовательностью 67

Компьютерная обработка результатов и

использованные базы данных 68

РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЯ 70

Клонирование кДНК нового белка человека СВР1 70 Анализ нуклеотидной последовательности

клонированной кДНК 74

Экспрессия гена СВР1 в различных тканях человека 78

Экспрессия гена СВР1 в различных клеточных

линиях человека 80

Экспрессия белка СВР1 in vitro 82

Изучение копийности гена СВР1 в геноме человека 84

Функциональный анализ белка СВР1 87

Изучение структуры "вариабельного" участка мРНК СВР1 91

Определение функциональной значимости

различных участков белка СВР1 95

ВЫВОДЫ 101

СПИСОК ЛИТЕРАТУРЫ 102

СПИСОК СОКРАЩЕНИЙ

hnRNP - heterogeneous nuclear ribonucleoprotein (complex)

snRNP - small nuclear ribonucleoprotein

TBP - the TATA-binding protein

NLS - nuclear localization sequence

HIV- human immunodefficiency vims

snRNP - small nuclear ribonucleoprotein

SDS - додецил сульфат натрия

TFIIIA - transcription factor IIIA

cpm - counts per minute

ПААГ - полиакриламидный гель

ПЦР - полимеразная цепная реакция

РТ-ПЦР - обратная транскрипция и полимеразная цепная реакция

DMEM - Dulbecco's modified Eagle's medium

FBS - Fetal Bovine Serum

MOPS - 3-[N-morpholino]propane sulfonic acid

ТЛЕ - tris-acetate-EDTA buffer

TBE - tris-borate-EDTA buffer

ВВЕДЕНИЕ

Как показали многочисленные исследования, структурные и функциональные нарушения в регуляторных белках лежат в основе многих заболеваний, таких как рак, атеросклероз, анемия, различные дефекты развития. Ежегодно от этих заболеваний умирают миллионы людей. Поэтому изучение регуляторных молекул стало одним из наиболее приоритетных направлений современных исследований. Недавно было показано, что многие регуляторные белки обладают множественными функциями. Они осуществляют связь между транскрипционными и пост-транскрипционными событиями в клетке.

Одним из известных семейств полифункциональных регуляторных белков являются 1тК№ белки. Изначально считали, что их единственная функция - участие в упаковке первичных транскриптов в рибонуклеопротеиновые комплексы и регуляция их доступности для факторов сплайсинга и ядерно-цитоплазматического транспорта. Впоследствии было показано, что ЬпИ^ЧР белки могут сами осуществлять сплайсинг, а также являются транскрипционными факторами. Многие 1т1ШР белки циркулируют между ядром и цитоплазмой, участвуя в транспорте мРНК. Было также показано участие этих белков в передаче сигналов внутри клетки.

Один из ЬпЯЫР белков, ЬпЯЫР К, дал начало новому классу КН-доменных белков. Белки этого класса объединяет присутствие в молекуле канонических последовательностей - КН-доменов, и основанное на этом функциональное родство. Так, характерной особенностью всех этих белков является способность с высокой специфичностью и аффинностью связываться с поли-(С) последовательностями ДНК и РНК. Были получены многочисленные свидетельства, включая настоящую работу, что именно КН- домены ответственны за эту функцию. В результате изучения КН-доменных белков была выявлена роль многих из них в развитии таких тяжелых заболеваний человека, как рак поджелудочной и молочной желез, мелкоклеточный рак легкого, наследственная умственная отсталость и анемия.

КН-доменные белки были найдены как в высших эукариотах, так и в дрожжах и прокариотах. В этих организмах такие белки участвуют в регуляции клеточного цикла, репарации ДНК и являются рибосомальными белками.

К сожалению, в настоящее время КН-доменные белки еще мало изучены по сравнению с другими регуляторными белками, такими как, например, многие транскрипционные факторы или белки сплайсинга. Однако, основываясь на их полифункциональности, становится ясно, что дальнейшее изучение этих белков откроет новые перспективы для более полного понимания регуляции многих процессов в клетке, таких как процессинг и транспорт

транскриптов, работа сигнальных каскадов, транскрипция и трансляция, регуляция времени жизни молекул. Это, в свою очередь, позволит разработать новые подходы к диагностике и лечению уже известных синдромов, связанных с нарушениями в КН-доменных белках, и, возможно, определить молекулярные основы многих других заболеваний.

ОБЗОР ЛИТЕРАТУРЫ

I. ПОЛИФУНКЦИОНАЛЬНЫЕ БЕЛКИ: СВЯЗЬ МЕЖДУ ТРАНСКРИПЦИОННЫМИ И ПОСТ-ТРАНСКРИПЦИОННЫМИ ПРОЦЕССАМИ В КЛЕТКЕ

Данные, накопленные в результате многолетних исследований, указывают на тесную взаимосвязь между транскрипционными и пост-транскрипционными событиями в клетке. Известно, что специфические промоторы определяют дальнейшую пост-транскрипционную судьбу транскриптов (Neuberger and Williams, 1986; Neuberger and Williams, 1988). Это указывает на взаимосвязь между белковыми комплексами, связанными с ДНК, и первичными транскриптами РНК. Во-вторых, все большее число белков оказываются полифункциональными и участвуют как в транскрипционных, так и в посттранскрипционных событиях.

Классическим примером служит TFIIIA, который необходим как для транскрипции 5S гРНК, так и для укладки ее в рибонуклеопротеиновые комплексы (Pieler and Theunissen, 1993; Shastry, 1996, Hayes and Tullius, 1992). Известно также, что белки, содержащие Y-box связываются с ДНК, активируя или ингибируя транскрипцию, а так же с РНК, участвуя в упаковке мРНК (Goldstein et al., 1990; Jones et al., 1992; Jiang et al., 1997; Graumann and Marahiel, 1996; Sommerville and Ladomery, 1996; Ladomery and

Somerville, 1995; Tafuri and Wolffe, 1992; Sommerville and Ladomery, 1996; Ting, 1994). Супрессор опухолей WT1 вначале также считался типичным транскрипционным фактором. Впоследствии была показана его роль также и в сплайсинге первичных транскриптов (Hastie, 1994; Reddy and Licht, 1996; Larsson, 1995; Wansink et al., 1994; Yuryev et al, 1996; Steinmetz, 1997).

Еще одной большой группой полифункциональных белков являются hnRNP белки. Как известно, первичные транскрипты РНК упакованы в цепи однородных 30S, 20 нм частиц, называемые hnRNP комплексами, которые под электронным микроскопом выглядят как "бусинки на нитке" (Samarina, 1996). Эти частицы содержат hnRNP белки, которых известно как минимум 20 классов в клетках млекопитающих (Choi and Dreyfuss, 1984; Dreyfuss et al., 1993; Matunis et al., 1992). Эти белки были классифицированы по буквенной системе от А до U. Считают, что они необходимы для упаковки пре-мРНК, регулируя ее доступность для факторов сплайсинга и ядерно-цитоплазматического транспорта. Показано, что некоторые hnRNP белки могут сами осуществлять сплайсинг: так, hnRNP Al определяет выбор альтернативных 5'-сплайс-сайтов, конкурируя за них с фактором сплайсинга ASF/SF2 (Yang et al., 1994).

Многие hnRNP белки также способны циркулировать между ядром и цитоплазмой, и, по-видимому, участвуют в транспорте мРНК, в то время как белок hnRNP С локализуется исключительно

в ядре (Siomi et al, 1993; Siomi et al., 1994; Tomonaga and Levens, 1995).

IL ОСОБЕННОСТИ СТРУКТУРЫ hnRNP БЕЛКОВ

Все hnRNP белки содержат один или несколько РНК-связывающих домена совместно с набором других более или менее изученных мотивов (Burd and Dreyfuss, 1994). Всего в настоящее время известно три типа РНК-связывающих доменов (Рис. 1): 1) RBD/RPM/RNP-CS (RNA-binding domain/RNA-recognition motif/RNP-consensus motif); 2) RGG box; 3) K-Homology domain (КН-домен). Необходимо заметить, что эти мотивы найдены не только в hnRNP белках (Burd and Dreyfuss, 1994).

1. RBD/RPM/RNP-CS домен

RBD/RPM/RNP-CS домен является наиболее хорошо охарактеризованным РНК-связывающим доменом. Он состоит из 90 аминокислотных остатков, среди которых выделяются две коротких высоко консервативных последовательности: октапептид и гексапептид, названные, соответственно, RNP1 и RNP2 (Dreyfuss et. al., 1993). В составе RBD/RPM/RNP-CS домена они разделены участком длиной около 30 аминокислот. Была определена 3-мерная структура некоторых RBD доменов (Nagai et al., 1990; Wittekind et al., 1992). В ней элементы вторичной структуры образуют 4-х цепочечный антипараллельный /3-слой и две перпендикулярные друг

другу а-спирали. В этой структуре RNP1 и RNP2 последовательности находятся на центральных /31 и /32 цепях. Предполагается, что именно они осуществляют прямой контакт с РНК. /3-слой создает платформу для связывания РНК, находясь на которой, она доступна для взаимодействий с белками процессинга (Merrill et al., 1988). Специфичность связывания обеспечивается за счет петель, соединяющих Д-слои и N- и С-концевых участков (Burd and Dreyfuss, 1994; Gorlach et. al, 1992).

2. RGG мотив

RGG мотив содержит повторы кластера аминокислот Arg-Gly-Gly (RGG). Между этими повторами находятся чаще всего ароматические аминокислоты. Число и расстояние между RGG повторами различаются у разных белков. В белке hnRNP U RGG мотив является единственным РНК-связывающим элементом (Kiledjian and Dreyfuss, 1992), в то время как в hnRNP Al этот мотив найден в комбинации с другими РНК-связывающими мотивами (Biamonti and Riva, 1994; Ghisolfi et al., 1992). Трехмерная организация RGG мотива до конца неизвестна, однако, предполагается, что она представляет собой /3-спиральную структуру (Ghisolfi et al., 1992). Остается неясным, обеспечивает ли RGG мотив специфичность связывания определенных

последовательностей РНК, но, по-видимому, hnRNP U способен

ШР2

ЯВО/ЯВМ/ЯЫР-СЗ домен

ИИ.

МИР А1 <\ЕЕКЕРВ21Ж врсаньтакк МЯ®> С1/С2 КГОРВ£»1Ж

консенсус

вторичная структура

[ИШЬ п\газ1 оттсиь

-ЗРЕЯТ КЕСГЕ

тотк

ТОО/ ЕОТЕ

-\лэс

имшилгао

«ижзазкк ль-

взгерда

АТОЕЕУПА ССВДЗУПК

КЕРАТОУ МЕНЖИА

М№ЖРИК-гаокжг-

I 0 в В1

йзизлоор I* та у

а1

р2

Явй мотив

ЬпШР и М ВОЗ да— ваз ж? н юз ж воз

ЬгШР А1 в ваз №эз ваз газ юз аз таз

Шс1еоХш в воз -ТОЗ ВОЗ в воз гоз го а*з

консенсус |юз|

(33

КН домен

0

а2

ВУУЕР1ФА НИСЕИЖА ЗУШЩЬА

134

ЬпШР К Г-И >

га® 1 ^

V

консенсус

I ь ОЖШЗА газ коски I

ь ь I Н0Э1ДШ аз УКвАК I

V г I РКИАОБ ПН те сои I

г I V МШМЗЬ ккз ТНОАК I

I 2 V РКЖЛЛЗК газ ЮЯСК1 I

I I Г- К I

ь ь □В квЮ ь

V V V V

гататБ-гаШСТТ-ВНЕЭЗАВ-¡журсзота гакэзш?

i i

ЕЕбЗОРЕВЗЪБШЮ

---РОВССЕНЭПЖУ

—ПЕРЬЕЗаЯШ

-------¡ЭЕРЮТ

--------ЕАЕНЕ

I Е т I в

V [. I 0 в

I г I 1 в

р н I ч О

к N V р 0

Рис. 1. Последовательности трех основных доменов связывания РНК - КВБ/КРМ/ЬиЧР домен, Ш^в мотив и КН домен. Предсказанная вторичная структура ЮШ/ЕРМ/М^Р домена представлена схематически. Консенсусные аминокислоты выделены в рамки.

дискриминировать между различными РНК гомополимерами (Kiledjian and Dreyfuss, 1992).

3. K-HOMOLOGY домен (КН-домен)

КН-домен был впервые идентифицирован в hnRNP К и впоследствии найден в составе многих других белков, связывающих нуклеиновые кислоты, из различных организмов (Siomi et al, 1993а; Siomi et al, 1993b). Он представляет собой участок, состоящий в среднем из 50 аминокислотных остатков. Среди них выделяют "основную" ("core") последовательность фланкированную несколькими разбросанными консервативными аминокислотами. В составе белка hnRNP К имеются три КН-домена, каждый из которых важен для связывания ДНК и РНК in vitro и in vivo. Основной функциональной характеристикой hnRNP К является высоко аффинное и специфичное связывание с поли-(С) последовательностями ДНК и РНК. Как было прояснено впоследствии, именно КН-домены обеспечивают специфичность связывания hnRNP К и других содержащих их белков с поли-(С) последовательностями (Aasheim et al., 1994, LefFers et al. 1995, Bomsztyk et al. 1997). Так же было показано, что КН-домены в составе одной молекулы функционально не являются взаимозаменяемыми (Dejgaard and Leffers, 1996). Трехмерная структура КН-доменов остается пока неизученной.

4. Дополнительные домены

В составе hnRNP белков выделены также и другие мотивы. В отличие от РНК-связывающих доменов, эти последовательности разнообразны, и их классификация поэтому затруднительна. Однако, они содержат детерминанты характерные для определенных биологических активностей. Наиболее хорошо

охарактеризованными являются богатый глицином домен, содержащийся в hnRNP Al и А2/В1 (Biamonti and Riva, 1994). В случае белка hnRNP Al этот домен ответственен за множественные функциональные проявления. Вероятно, с помощью своего богатого глицином домена этот белок связывает РНК (Kumar, 1990), взаимодействует с другими белками и циркулирует между ядром и цитоплазмой (Biamonti and Riva, 1994; Kumar and Wilson, 1990; Pontius and Berg, 1990). Более того, в этом домене найдены сайты пост-трансляционных модификаций (Cobianchi et al., 1993; Idriss et al, 1994).

hnRNP С содержит кислый (acidic) С-концевой домен, который способен связывать другие белки и содержит сайты возможного фосфорилирования (Dreyfuss et al., 1993). Два дополнительных домена hnRNP F содержат несколько повторяющихся коротких элементов - 6 Tyr-Ser дипептидов и 4 Gly-X-Tyr-Asp/Glu тетрапептидов (Matunis et al., 1994). Предполагают, что эти элементы модулируют связывание hnRNP F с другими белками. hnRNP G имеет С-концевой домен, в составе которого

могут быть выделены основный, богатый серином, богатый

аргинином и богатый глицином участки. Этот белок также содержит RGG box и богатую лейцином последовательность (Soulard et al., 1993). В hnRNP К на N-конце содержится кислый домен, а между вторым и третьим КН-доменами расположен "central core", включающий в себя RGG блок и богатый пролином участок (Siomi et al., 1993а). Дополнительный домен hnRNP М обогащен остатками метионина и аргинина, функциональная значимость которых еще не ясна (Datar et al., 1993).

III. ПОСТ-ТРАНСКРИПЦИОННЫЕ И ПОСТ-

ТРАНСЛЯЦИОННЫЕ МОДИФИКАЦИИ

Описанное многообразие семейства hnRNP белков можно дополнить их пост-транскрипционными и пост-трансляционными модификациями. Многие hnRNP белки являются результатом альтернативного сплайсинга общего мРНК предшественника. Например, изоформа hnRNP Al, называемая Al В, несет вставку из 52 аминокислот в "glycine-rich" дополнительном домене (Buvoli, 1990). hnRNP А2 и В1 являются продуктами альтернативного сплайсинга общего транскрипта, a hnRNP С1 и С2 отличаются друг от друга вставкой из 13 аминокислот в последнем (Burd et al., 1989; Biamonti et al., 1994). По 4 изоформы имеют белки hnRNP К и М (Datar et al., 1993; Dejgaard, 1994). hnRNP F и H проявляют иммунологическое родство, указывающее на возможное

существование общего для обоих белков транскрипта (Matunis et al.,

1994).

Три типа пост-трансляционных модификаций были описаны для hnRNP белков: фосфорилирование по остаткам серина и треонина, метилирование по остаткам аргинина и гликозилирование. Было показано, что белки hnRNP А, В, С, К, G и U фосфорилируются in vivo, хотя и в разной степени (Cobianchi et al., 1993; Wilk et al., 1985; Dreyfuss et al., 1993) . Интересно, что фосфорилирование белков группы С зависит от фазы клеточного цикла (Pinol-Roma and Dreyfuss, 1993; Leser and Martin, 1987). hnRNP Al был идентифицирован как специфический субстрат для zeta-изоформы протеин-киназы С как in vitro, так и in vivo (Municio et al., 1995/ Поскольку эта модификация влияет на локализацию белка Al в клетке и степень аффинности связывания его с РНК, предполагают, что ¿eta-изоформа протеинкиназы С регулирует связь между трансмембранными сигнальными каскадами и процессингом РНК с участием белка AI (Municio et al., 1995).

hnRNP белки содержат 65% всех диметилированых аргининов в ядрах клеток человека. Эта модификация была обнаружена в hnRNP Al, А2, В1, В2, Dl, D2, Е, G, H, J, К, Р, Q, R, Т и U белках (Liu and Dreyfuss, 1995). Недавно была выделена метилтрансфераза человека, ответственная за эти модификации (Liu and Dreyfuss,

1995). Однако, функциональный аспект таких модификаций остается неясным