Бесплатный автореферат и диссертация по биологии на тему
Сравнительный структурно-функциональный анализ генов тирозинаминотрансферазы человека и крысы
ВАК РФ 03.00.04, Биохимия

Автореферат диссертации по теме "Сравнительный структурно-функциональный анализ генов тирозинаминотрансферазы человека и крысы"

Российская Академия Наук Сибирское Отделение НОВОСИБИРСКИЙ ИНСТИТУТ БИООРГАНИЧЕСКОЙ ХИМИИ

РГБ О л

на правах рукописи

МОРОЗОВ ИГОРЬ ВЛАДИМИРОВИЧ

"СРАВНИТЕЛЬНЫЙ СТРУКТУРНО-ФУНКЦИОНАЛЬНЫЙ АНАЛИЗ ГЕНОВ ТИРОЗИНАМИНОТРАНСФЕРАЗЫ ЧЕЛОВЕКА И КРЫСЫ."

03.00.04 - биохимия

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата биологических наук

г.Новосибирск, 1998г.

Работа выполнена в Новосибирском институте биоорганической химии СО РАН.

Научный руководитель:

д.б.н., профессор Мертвецов Николай Павлович.

Официальные оппоненты: д.б.н., профессор д.б.н., профессор

Лаврик Ольга Ивановна; Колчанов Николай Александрович.

Ведущая организация:

Институт молекулярной биологии РАН им. В.А.Энгельгардта.

Защита состоится окт-а^р-я 1998 г. в 3° часов

на заседании диссертационного совета К 003.52.01 в Новосибирском инсгшуге биоорганической химии СО РАН по адресу: 630090, Новосибирск-90, проспект академика Лаврентьева 8.

С диссертацией можно ознакомиться в библиотеке Новосибирского института биоорганической химии СО РАН.

Автореферат разослан "28 " семтя£рА_1998 г.

Ученый секретарь диссертационного совета, доктор химических наук

О.С.Федорова

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ Актуальность темы.

Изучение механизмов регуляции экспрессии генов в разных тканях многоклеточного организма является одной из наиболее актуальных задач современной молекулярной биологии. Важное значение для понимания этих механизмов имеет информация о структуре и эволюции некодирующих белок областей геномов, и прежде всего областей, содержащих участки связывания факторов регуляции транскрипции (в частности, 5'-фланкирующих областей генов, а также, по некоторым данным, итронов генов). Определение и сравнительный анализ нуклео-тидных последовательностей генов и прилежащих к ним районов геномов является основным способом получения такой информации.

Одной из наиболее привлекательных моделей дня такого сравнительного анализа являются гены "минорных" белков, экспрессия которых является, как правило, тканеспецифической и находится под контролем различных факторов регуляции транскрипции. Тирозшиминотрансфераза (Ь-тирозшг2-оксоглутарат-аминотрансфераза, К.Ф. 2.6.1.5; далее ТАТ) - пиридоксальфосфат зависимый фермент, катализирующий переаминирование тирозина, является одним из таких белков, механизмы регуляции экспрессии гена которого в организме крысы детально изучены (Boshart et al, 1993; Мертвецов, 1990). Экспрессия гена этого белка является тканеспецифической и происходит в основном в печени, а именно в гепатоцигах. Уровень экспрессии регулируется посредством нескольких путей передачи межклеточных сигналов, в частности глюкокортикоидами и цАМФ. В 5'-фланкирующей области (до -6000 п.н.) гена ТАТ крысы были локализованы три тканеспецифических энхансера транскрипции, два из которых взаимодействуют с комплексом глюкокортикоид-рецептор и фактором тканевой специфичности печени HNF3, а третий - с белком, активирующим цАМФ-зависимые сайты (CREB), и фактором тканевой специфичности печени HNF4, т.е. является цАМФ-зависимым (Shinomiya et al, 1984; Jantzen et al, 1987; Danesh et al, 1987; Grange et al, 1991; Boshart et al, 1993; Espinas et al, 1994). В то время как механизмы регуляции экспрессии гена ТАТ крысы изучены в деталях, для гена ТАТ человека в литературе нет данных о выявлении функционирующих энхансеров, контролирующих экспрессию этого гена. Известны лишь небольшие фрагменты нуклео-тидной последовательности 5'-фланкирующей области гена ТАТ человека (Ret-tenmeier et al, 1990). Знание механизмов регуляции экспрессии гена ТАТ человека имеет, наряду с фундаментальным, важное медицинское значение, поскольку может позволить предотвращать или корректировать нарушения регуляции экспрессии гена ТАТ в процессе онтогенеза, приводящие к тяжелому заболеванию -тирозинемии.

Цели и задачи работы.

Целью настоящей работы являлось выявление функционально значимых участков и эволюционно изменчивых районов гена тирозинамшютрансферазы путем сравнительного анализа нуклеотидных последовательностей генов человека и крысы, включающих все экзоны и итроны гена, а также значительные по длине районы 5'- и 3'-фланкирующих областей. Ранее были определены нуклео-тидные последовательности фрагмента 5'-фланкирующей области от -3500 до -1900 п.н. (Rettenmeier et al, 1990), последовательности экзонов (Rettenmeier et al, 1990) и интронов (Зеленин, Мертвецов, 1994) гена TAT человека; а также нуклео-тидная последовательность кДНК, экзон-шпронная струюура .и карта сайтов эндонуклеаз рестрикции гена TAT крысы (Shinomiya et al, IS84; Grange et al, 1985; Hargrove et al, 1989). Таким образом в настоящей работе необходимо было решить следующие задачи:

- определить неизвестную ранее нуклеогидную последовательность reim TAT крысы;

- определить неизвестную ранее нуклеотидную последовательность района от -1900 до -700 п.н. 5'-фланкирующей области гена TAT человека;

- провести сравнительный анализ полученных нуклеотидных последовательностей с использованием современных средств компьютерного анализа.

Научная новизна работы.

Определена неизвестная ранее нуклеотидная последовательность гена TAT крысы (более 12 000 п.н.). Установлены точные границы экзонов этого гена, в нитронах выявлены повторяющиеся элементы. Определена неизвестная ранее нуклеотидная последовательность 5'-фланкирующей области гена TAT человека от -1900 до -700 ilh. В ней выявлены возможные сайты связывания факторов регуляции транскрипции и повторяющиеся элементы (в частности, повторы семейства Alu). Сравнительным анализом последовательностей генов TAT человека и крысы определена степень консервативности различных районов гена. Научно-практическая ценность работы.

Для определения нуклеотидных последовательностей протяженных районов разработала схема субклонирования и секвенирования фрагментов гидролиза продуктов полимеразной цепной реакции (ПЦР) эндонуклеазами рестрикции, позволяющая выявить и исключить ошибки, вносимые в процессе ПЦР ДНК-полимеразой. Для получения протяженных (более 5000 ilh.) продуктов ПЦР с высоким выходом предложено проведение реакции в присутствии высоких концентраций глицерина. Для очистки и контроля качества олигонуклеотидов-праймеров разработан оригинальный метод электрофореза с непрерывной элюци-ей и спектрофотометрической детекцией.

В процессе работы создан набор молекулярных зондов (клонированных в бактериальных векторах фрагментов генов, продуктов ПЦР и олигонуклеотдов-праймеров для ПЦР) для различных областей генов TAT человека. Такие молекулярные зонды могут служить инструментом для дальнейших исследований, в частности анализа полиморфизма гена TAT в популяциях людей и выявления молекулярных основ тирозинемии. Публикации и апробация работы.

Результаты работы были представлены в виде докладов на Ш Всесоюзном съезде эндокринологов (Ташкент, 1989 г.), первой всесоюзной конференции "Геном человека" (Москва, 1989 г.), 7-м международном конгрессе по изофермен-там (Новосибирск, 7-12 сентября 1992 г.), 5-ой конференции "Геном человека-96" (п. Черноголовка, 15-18 января 1996 г.), 8-ой конференции "Геном человека-98" (п. Черноголовка, 12-15 января 1998 г.) и в виде стендовых сообщений па 10-м двустороннем Советско-французском симпозиуме "Физико-химические основы жизни" (Киев, 4-8 июня 1990 г.) и международной конференции HGM-98 (Турин (Италия), 28-30 марта 1998 г.). По материалам диссертации опубликовано 7 статей, из них 2 в зарубежных изданиях. Структура и объем работы.

Диссертация изложена на ibh страницах, содержит ZO рисунков, 2 таблицу список цитируемой литературы включает 432 cctmteu Диссертационная работа состоит из введения, обзора литературы, описания использованных материалов и методов, обсуждения результатов и выводов.

СОДЕРЖАНИЕ РАБОТЫ

К настоящему времени установлены нуклеотидные последовательности части 5'- регуляторной области (Rettenmeier et al., 1990), экзонов (Rettenmeier et al., 1990) и интронов (Зеленин, Мертвецов, 1994) гена ТАТ человека; 5'- регуляторной области (Grange et al., 1989), кДНК и экзонов гена ТАТ крысы (Shinomiya et al., 1984). Длина этих генов более 11000 пл., они содержат 11 ишронов. Общая длина интронов в 4.6 раз больше, чем дойна мРНК гена. Только 1400 п.н. из 2400 пл. мРНК необходимы для кодирования белка ТАТ весом 52 кДа (Shinomiya et al., 1984). Известны также нуклеотидные последовательности мРНК ТАТ человека (Seralini et al., 1995) и крысы (Grange et al., 1985; Hargrove et al., 1989). Известные ранее и определенные в настоящей работе участей генов ТАТ *фысы и человека схематически представлены на Рис. 1.

Для определения нуклеотидных последовательностей использовали в основном два подхода:

1: отбор клонов, содержащих фрагменты гена ТАТ и прилежащих областей, го геномной библиотеки с последующим картированием сайтов уз1ивания эндонуклеаз рестрикции и секвенированием методами Максама-Гилберта и Сэнгера фрагментов гидролиза этими ферментами, 2: получеше необходимых фрагментов ДНК с помощью ПЦР при использовании в качестве матрицы геномной ДНК.

Второй подход является более предпочтительным, т.к. определяемая последовательность при этом значительно ближе к "оригиналу" - геномной ДНК. Исключаются артефакты (мутации и перестройки), происходящие при создании библиотек и клонировании ДНК в составе векторных молекул. Однако использование ПЦР, как правило, ограничено необходимостью изначальной (хотя бы и небольшой) информации об исследуемой последовательности для выбора олиго-нуклеотидов-праймеров. Кроме того, из-за достаточно значительной вероятности включения Taq ДНК-полимеразой ошибочного нуклеотида (Cha, Thilly, 1993) при клонировании продуктов ПЦР нельзя определять последовательность, используя последовательность одного клона - необходимо производить сопоставление последовательностей нескольких независимых клонов для локализации и исключения внесенных Taq ДНК-полимеразой ошибок.

-3500

5000 10000

d |efghij к li

ЧЕЛОВЕК

RettenmeierR etal, 1990

Rettenmeier R et al, 1990 Зеленин CM, Мертвецов КП., 1994

□ □□ dH □ С

□ □ □ о□□□ □

•10000

-5000

в с

5000

D ,ЕГ G II I J

10000

т

КРЫСА

I-1 Shinomiya Т. etal, 1984

□ Jantzen Н.М. et al, 1987

] Oddos J. et al, 1989 I Boshart M. et al, 1990

Рис. 1. Известные ранее (обозначены белым) и определенные в настоящей работе (обозначены черным) участки нуклеотндных последовательностей генов TAT человека и крысы. Черным также обозначены экзоны генов, крупной нприховкой - интроны и З'-фланкирующие области, мелкой штриховкой - 5'-фланкирующие области.

5000

юооо

ABC

D EF G II I J

I I I I I I I

Ч 4 §§ i Щ %

8 M .S = 5 S S

w ий В w W

праймеры йлл ПЦР

ПЦРна гаишной ДНК

В 0 2 а

я о * °

ш, а w ы

Отбор клонов из библиотеки генов

002

111

V

Гидролиз эндонуклеазами рестрикции

Клонирование в pBlueScript

М/

71

Лереклонирование в М13тр18

111

71

V4.

Секвенирование методом Сэнгера

002 i

Картирование сайтов эндонуклеаз рестрикции

Секвенирование методами Максама-Гилберта и Сэнгера (со специфическими праймерами)

Рис. 2. Стратегия секвенирования гена TAT крысы.

Экзоиы гена обозначены черным, шггроны и фланкирующие районы -штриховкой, последовательности векторов клонирования - точками.

Определение нуклеотидной последовательности гена TAT крысы.

Схематически стратегия сехвенирования гена TAT крысы представлена на Рис. 2. Методами картирования эндонуклеазами рестрикции и молекулярной гибридизации из библиотеки генов крысы, содержащей продукты гидролиза геномной ДНК эндонуклеазой EcoRI, были отобраны клоны 002, 071 и 111, содержавшие фрагменты 3'-области гена TAT (Зеленин и др., 1989). Однако отобрать клоны, содержавшие фрагменты 5'-области гена (экзоны А - Е) не удалось. Для определения нуклеотидной последовательности этой области гена применяли секвенирование продукта ПЦР. Для получения с высоким выходом протяженных (более 5000 п.н.) фрагментов ДНК проводили ПЦР в присутствии глицерина, что позволило значительно увеличить выход и специфичность реакции (Рис. 3). Оли-гонуклеотиды-праймеры для ПЦР очищали с использованием разработанного автором метода электрофореза с непрерывной элюцией и спектрофотометриче-ской детекцией (Рис. 4). В результате секвенирования клонов 002, 071 и 111 из геномной библиотеки крысы, а также продукта ПЦР, включающего экзоны А-Е гена TAT крысы была определена полная пуклеотидная последовательность этого гена, а также значительного участка 3'-фланкирующей области общей длиной 12368 п.н.

S i

з и ~5 3 I

ММ - %¡f

bSV>— S'

M.w.—

jhîz—- «ft

■u24— a 3ÄTV- m

чМ I i il Ml II IM ir'11|

- jwi2 -34ih+31i7

2jî3-1921—

Рис. 3. Анализ продуктов ПЦР участка гена тирозинаминотрансферазы крмеы длиной 5800 п.н. электрофорезом в 0.7% геле агарозы.

А - 18 е.аУмл Taq ДНК полимеразы, 0.27 е.а./мл Vent ДНК полимеразы; В -21 е.а./мл Taq ДНК полимеразы, 0.31 е.а./мл Vent ДНК полимеразы; С - 24 е.а./мл Taq ДНК полимеразы, 0.36 е.а./мл Vent ДНК полимеразы; D - 21 е.а./мл Taq ДНК полимеразы, 0.42 е.а./мл Vent ДНК полимеразы; номерами обозначено число циклов амплификации.

Рис. 4. Результаты электрофореза олигонуклеотида длиной 25 в денатурирующем ПААГ с непрерывной элюцией к спектрофотометрической детекцией. В качестве стандартов длины добавлены олигонуклеотиды длиной 12 и 16.

Определение последовательности района -1990 - -580 п.н. б'-фланкирующей области гена TAT человека.

Двуцепочечную ДНК длиной 1409 п.н., включающую исследуемый район, получали методом ПЦР. Полученную ДНК подвергали гидролизу несколькими эндонуклеазами рестрикции. Фрагменты, получаемые в результате гидролиза, клонировали в плазмиде pBlueScriptSKE и определяли их нуклеотидную последовательность методом Сэнгера. Нуклеотидную последовательность участка 5'-области гена TAT человека реконструировали из полученных последовательностей клонированных фрагментов так, чтобы каждый нуклеотид был представлен не менее чем в 3 независимых клонах, что дает возможность выявить и исключить внесенные Taq ДНК полимеразной ошибки (Рис. 5). В последовательностях субклонов общей длинной 6280 п.н. таких ошибок оказалось 14, что соответствует данным (Cha, Thilly, 1993) об их вероятности. Для определения гуанина в позиции 791 последовательности, который не удавалось определить методом Сэнгера из-за регулярно повторявшихся артефактов, было использовано картирование эндонуклеазами рестрикции. Наличие в позиции 790 сайта эндонуклеазы НаеШ (GGCC) позволило однозначно идентифицировать нуклеотид в позиции 791 как гуанин.

5* primer total(1) total(2)

total(1) total(2) Sau3AHl) Sau3AI{2) Sau3AI(3)

total(1) total(2) Sau3AI{1) Sau3AI(2) Sau3AI(3) Sau3AI{4) EcoRI(1)

total(1) total(2) SauSAI{4) EcoRI(2)

EcoRI(2)

Sau3AI(4) EcoRI(1) EcoRI(2) Sse9I(1) Sse9I(2) Sse9I(3) Sae9I(4)

Sau3AI(4) EcoRI(Î) EcoRI(2) Sse9I(1) Sse9I(2) Sse9I<3) Sse9I{4)

Sau3AI(4) EcoRI(1) Sse9I(1) Sse9I(2) Sse9I(Э) SseSI(4)

EcoRI(1) Sse9I(1) Sse9I(2) Sse9I(3) Sse9I(4) Sau3AI{5) Sau? AI(6)

Sau3AI(5) 3au3AI(6) Sse9I(5) Sse9I(e)

Sau3AI(5) Sau3AI (6) Sse9I(5) Sse9I{6)

1 11 21 31 41 51 61 71

gaggcaaggtctcattctgtcac

gcaaggtct сat t с tgt сacc с aggc tggagt gc aat ggcatgatcacagc t с t с t go agcc t tgacc tcc t gggt t gaggcaaggtc tcnttctgtcacccaggctggagtgcaatggc atgatcacagctc tc tgcagcc t tgacc tcctgggtt

01 91 101 111 121 131 141 151

CAGGrGATCTTCCTACCTCTGCCrCCCAAGTAGCTGGGACTATAGGCtCATGCCACCATGCCTGGCTAGTCTTTGTATCT CAGGT GATC T TCC T ACCTCAGCC ТС С CAAGT AGC T GGGAC T AT AGGO TCAT GCCACCATGCCT GGCT AGT T T T T GTAT С T GATCTTCCT ACCTC AGCCTCCCAAGT AGCTGGGACT AT AGGCTCATGCCACCAt GCCTGGCTAGfT TT IGT ATCT GATC T TCCT AC С TCAGC С T С CC AAG T AGC T GGGAC T AT AGGC TC ATGC С ACCAT GCC T GGC TAGTTTTTGTATCT GAT CTTCCTACC TCAGCC TCC CAAGT AGC T GGGAC T AT AGGC TCATGCCACCATGCCT GGC TAGTTTTTGTATCT

161 171 181 191 201 211 221 231

ttttgtatagacggggtttcactatgttgcccaagctggtcttgaattccttagctcaagtgatccawccaccttggcct t t t t gtatagacggggt t tcac tat gt t gcc сaagc t gg tc t t gaat tcct tagc t caagt gatccatccaccttggcct ttttgtatagacggggtttcactatgttgcccaagctggtcttgaattccttagctcaagtgatc t t t tgt at agacggggt ttcactatgttgcccaagctgctct tgaat tcc ttagc tcaagtgatc t tt tgtat agacggggtttcactat gttgcc caagctggtc t tgaat tcc ttagc tcaagtgatc

gat ccatccacc t tggcct gaattccttagctcaagtgatccatccaccttggcct

241 251 2 61 271 201 2 91 301 311

cccgaaaggctgggattaccâaaggtgtgagccaccatgcccagccccaaaata с с cgaaaggcngggat taccaaaggtgngagccaccat gc cc agc с с с aaaa

cccgaaaggctgggattaccaaaggtgtgagccaccatgcccagccccaaaatattctttaaacatgtaatcatacaaaa cccgaaaggc tgggattaccaaaggtgtgagccaccatgcccagccccaaaatat'l'c tt taaacatgtaatcatacaaaa

с азс с с с aaaa tat т с t t т ааас atgt аат с at ас аааа

321 331 341 351 361 371 381 391

т татат gagata т таат at т с t t t t t t татас taagtc т тсаааас с т gat gtgt at т ттас аас ас атс t т аат т caga т tat a t gagat а tt аат аттсттттгттатас t aagtc t т с аааасс т gat g igt at t t t асаас ас атс t t аат т cata t та та t gagatatt аат at тстттттт tat ac taantc t т с aaannc t gatntgt at t t tac аас ac at с т таат т с а t а

ааттсaga ааттсака aattcaga ааттcaga

401 411 421 431 441 451 461 471

ccagtcacatt tcaagtat tcaacggccact tatgactagtagc tacaatattagacagtgcaactatagaccacgtt та с с agt с ас at t т caagt at tcaacggccact tatgactagtagc tac aat at tagac agt gc aact at agac cacgt t t а с сagt cacat t tcaagtat

ccagtcacat t tcaagtat tcaacggccact tatgactagtagc tacaat att acacagtgcaactatagaccacgttt а ccagtcacat t tcaagtat tcaacggccact tatgactagtagc tacaatat t agac agtgc aact at agaccacgt tt а ccagtcacat ttcaagt att caac ggccacttatgact agt agctacaat at tagacagtgcaactataggccacgt tt а ccagtcacat ttcaagtattcaacggccacttatgactagtagctacaatat t agac agtgc aactat agaccacgt tt а

А

481 491 501 511 521 531 541 551

с tc tccat ttt t t tagcaactcccaaaccagctttatacgtat

ctctccatttttt tagcаас tcc caaaccagct ttatacgtatt gtаатaaacatagaaaacat t t ggaagggtacac aa с tc tccatttt t t tagcaact ccc aaacc agct tt at acgtat tgt aat aaacatagaaaac at tt ggaagggt acac aa ctctccatttttt tagcaact cc caaaccagc tttatacgtattg taataaacat agaaaacat tt ggaagggtacacaa ctctccatttttt t agc aac tcccaaaccagct t t atac gt at t gt aat aaacat agaaaacrt t tggaagggt ac acaa ctctccatttttt tagcaac tcc caaaccagc t t tatacgta г tgtaataaacatagaaaacat t tggaaggg tacacaa

561 571 581 591 601 611 621 631

gaaaggactaÂaaatgatttttгtatataaÂatgagaatgcagggagggaaggtgatcaggttttaattcacgt gaaat gac t aaaaat gat t t t tt t at at aaaat gagaatgcagggagggaaggtgat cagggt t t aat t gaaat gact aaaaa t gat ttttttata t aaaat gagaatgcagggagggaaggtga t cagggkt taat t gaaat gactaaaaa t gat t tt t t tatataaaat gagaayghagggagggaagg tga t с agggt t taatt gaaat gac taaaaat gatwt t t t tat ataaaat gagaatgcagggagggaaggt gat сaggt tt taatt

gatc agggtt taat t с acgtacatc t gatcagggtt taat tсacgtacatct t g

641 651 661 671 601 691 701 711

с t at t tgaat tt at t atataâggatatatcâtatttactaâaaatgtaaaâgagaaat gctt at tc t ttgcaac acagtc с tat ttgaat tt att atataaggatatatcatat t tact aaaaat gt aaaagag aaa tgct tat tc t ttgcaacacagtc aat t ta ttatataagga t a tat catat t tac t aaaaat gtaaaagagaaa tgcttattcttt gcaacacagt с аат t tattat ataaggat atatcat attt actaaaaatgt aaaagagaaatgct tattct t tgc aacacagtc

721 731 741 751 761 771 791 791

с t tgt at agaaa tc t gt с t taaggaaat аат с aaat at gtaaac t aacat t t а t gac aaggat gcccttgsc caagac g t с t t gt at agaaatc t gt с t t aaggaaataat с aaat a tgt aaac t aac a t t t at gac aagga tgcccttgsc с aagac g t с t t gaat agaaatc tgt с t t aaggaaataat caaata tgt aaac t aac at t ta t gac aaggat gc с с t tg эсс aagacgt с t t gt at agaaatc t gt с t taaggaaat аат с aaat atgt aaac t aacat t t at g acaaggat gcc с t t gs cc aagac gt t ggoe(ha*iii)

Sau3AI ( 5 > CAA T AAT T T T T Т С TAGT GTAT С С AT GC T AT AGAC GT T АС С T GC С AT T АС T GT AT AAGAAAAAAC AT AG TGT АС С T AGGGC

3au3Al ( 6 > GAATAATTTTTTCTAGTGTATCCATGCTATAGACGTTACCTGCCATTACTGT AT AAGAAAAAAC AT AGTGTACCTAGGGC

Sae9I<5) GAATAATT

Sse9I(6) GAATAATT

Sse9I<7) AATTTTTTCTAGTGTATCCATGCTATAGACGTTACCTGCCATTACTGTATAAGGAAAAACATIV3TGTACCTAGGGC

Sse9ï ( 8 ) AATT TT T TC TAGTGTATCCATGC TATAGACGT TACC TGCCAT TACTGTATAAGAAAAAACATAGTGTACCTAGGGC

Sau3Al<5) Sau3AI(6) Sse9I(7) Sse9I(8) Sse9I(9) EcoRI<1)

TCAGTACTACCCATGGTTTCAGACATCCATAATTTCAGGCATCCACTGGAGGTCTTGGAGTGTGCTCCCTGTG TCAGTACTACCCATGGTTTCAGACATCCATAATTTCAGGCATCCACTGGAGGTCTTGGAG TCAGTAC TACCCATGGT T TCAGAC ATCCATAAT T T С AG TAC TAC С CAT GGT T T С AGAC A T С С AT AAT T

AATT TC AGGCATCCAC TGGAGGTCT TGGAGTGTGC TCCC TGTGGATAAGG

ctgtggataagg

S3«9I(9) EcoRI(1) EcoRI(2)

Ss«9Z(9) EcoRI(1) EcoRI(2) total(2)

GGGAC TACT GT ATT СААС С С CAO TGGAGGC T T GAC T CCC T GAAAAGTGAA T GGAGAAGAACAAAC T GA T GT GAAAAAT С T GGGAC TACTGT ATTCAACCCCAC TGGAGGCT T GACTCCCTGAAAAGTGAATGGAGAAGAACAAAC TGATGT GAAAAATCT

GAAAAGT GAAT GGAGAAGAACAAAC T GAT GTNAAAAAT С T

1041

1051

1061

10П

1081

1091

1101

1111

T TGTCT TCCAACAAATAAACAGACAGGATC TGAGCCC TGGGGAGATCAC TGAGGCT TC T С TTAACCCT TCAGTGGGTGGT TTGTCTTC СААС AAAT AAAC AGAC AGGA TC T GAGC CC TGGGGAGAT С АС T GAGGC T TC T С T T AAC CC T T CAGT GGGTGGN T TG TCT TCNAACAAAT AAACAGAC AGGATC TGAGCCC T AGGGAGATCAC TGAGGCTTC T С TTAACCC TTCAGTGGGTGGN

CCTTCAGTGGGTGGT

1121 1131 1141 1151 1161 1171 1181 1191

Sse9i (9) ÂttttccatctgctcacaggÂatgttgagatttcggctgtggaccttgtgttttgcttagcaaagttgttttgtgtggat

ecori (1) attttccatctgctcacaggaatgttgagattttngctgtggaccttgtgttttgcttagcaaagttgttttgtgtggat

ecori ( 2 ) attttccatctgctcacaggaatgttgagattttmgctgtggaccttgtgttttgcttagcaaagttgttttgtgtggat

total (2) attttccatctgctcacaggaatgttgagattttggctgtggaccttgtgttttgcttagcaaagttgttttgtgtggat

total (3) tcigctcacaggaatgttgagattttggctgtggaccttgtgttttgcttagcaaagttgttttgtgtggat

total ( 4 ) ccatctgctcacaggaatgttgagattttggctgtggaccttgtgttttgcttagcaaagttgttttgtgtggat

Sse9l(9) EcoRI(1) EcoRI(2) total(2) total(3) total(4) S3e9I(10)

total(2) total{3) total(4) Sse9I(10)

1201 1211 1221 1231 1241 1251 1261 1271

cgcacctgacattttaaatt'

cgcacc tgacat t t t aaat t с t т сс aac aaccataggaggt aaat gaagaat t с с gc асс t gac at t t t aaat t с t t с с aac aacc at aggaggt aaat gaagaat t с

cgcacctgacat t tt aaat tct tcc aac aaccataggaggt aaat gaagaat tcat gcacagt gcaaggataaaactgca cgc ас с t gac at t t t aaa t t с t t cc aac aacc at aggaggtaaat gaagaat t с a t gc ac agt gc aaggat aaaac t gc a с gc ас с t gac at t t t aaat tc t t с с aac aacc at aggagg t aaat gaagaat tcat gc ac agtgc aaggat aaaac t gca

aat t с at gc ac agtgcaagg ataaaac t gc a

1281 1291 1301 1311 1321 1331 1341 1351

caggt t tcagc tgcc ttggac accctgtgct t ttcagc tatttgt tgaatggaac ttaggtgcccaat t tgt tct gactg caggtttcagctgccttggacaccctgtgcttttcagctatttgttgaatggaacttaagtgcccaatttgttctgattg caggtttcagctgccttggacaccctgtgcttttcagc tatttgt tgaatggaac tcaagtgcccaatctgttctgattg caggt t tcagctgcc t tggacaccctgtgc t t ttcagc tat t tgt tgaatggaac t taagtgcccaatt

TA T 1

1361 1371 1381 1391 1401

total ( 2 ) GAGCAAAACTTTGTGGACTGACAAGGATGGGCGTCCAAGATGTA total (3) GAGC AAAAC T T TGT GGAC TGAC AAGGAT GGGC GT CCAAGAT GTAGGAAG total ( 4 ) GAGC AAAAC T T T GTGGAC TGAC AAGGAT GGGC GT CCAAGAT GTAGGAAG 3* primer GGAT GGGC GT CCAAGAT GTAGGAAG

981

Рис. 5. Реконструкция н>ъ:пеотндной последовательности 5'-области гена TAT человека, от -1990 до -580 из последовательностей клонированных фрагментов гидролиза продукта ПЦР эндонуклеазами рестрикции.

5' primer, 3* primer - последовательности олигонуклеотндов, использованных в качестве затравок при проведении ПЦР;

totalO - последовательности ДНК независимых клонов, получешшх при непосредственном клонировании продукта ПЦР;

EcoRI(), Sau3AI(), Sse9I() • последовательности ДНК независимых клонов, полученных при клонировании продуктов гидролиза соответствующими эндонуклеазами рестрикции;

В нижнем раду отмечены нуклеотиды, соответствующие позициям, в которых в одном из клонов была зафиксирована ошибка Taq ДНК полимеразы в процессе ПЦР. Нуклеотид *G' в позиции 791 был установлен методом рестрикцнонного картирования по наличию сайта эндонуклеазы рестрикции HaelII.

Структура гена TAT крысы.

Путем сравнения последовательности гена и известной ранее последовательности мРНК (Grange et al., 1985; Hargrove et al., 1989) удалось установить точные границы экзонов. Ранее они были известны лишь приблизительно по данным электронно-микроскопического анализа гетеродуплексов мРНК - геномная ДНК (Shinomiya et al., 1984). В таблице 6 приведены границы и размеры экзонов и нитронов гена ТАТ крысы.

Таблица 6. Границы и размеры экзонов и нитронов гена TAT крысы.

Экзон Сравнение последовательностей Гетеродуплексный анализ

(Shinomiya et al., 1984)

Ишрон границы, п.н. размер, п.н. границы, П.Н. размер, п.iL

А 1-77 77 1-70 70 ±14

1 78-1187 1110 71-1091 1021 ±99

В 1188-1446 259 1092-1299 207 ±31

2 1447- 1592 146 1230 - 1475 176 ±24

С 1593 - 1697 105 1476-1584 109 ±22

3 1698 - 3884 2187 1585-3831 2247 ±134

D 3885 - 3952 68 3832-3910 79 ±19

4 3953 - 5085 1133 3911 -5062 1152 ±91

Е 5086 - 5244 159 5063 - 5217 155 ±26

5 5245 - 5842 598 5218-5831 614 ±65

F 5843 - 5980 138 5831- 5971 140 ±22

б 5981 -6617 637 5972 - 6603 632 ±72

G 6618-6669 52 6604 - 6685 82 ±21

7 6670 - 7457 788 6686 - 7505 820 ±84

Н 7458 - 7610 153 7506 - 7650 145 ±20

8 7611-8112 502 7651 -8161 511 ±51

I 8113 -8241 129 8162-8297 136 ±25

9 8242 - 8643 402 8298 - 8714 417 ±42

J 8643 - 8727 84 8715-8809 95 ±20

10 8728 - 9417 690 8810-9533 724 ±64

К 9418-9516 99 9534 - 9639 106 ±23

11 9517-9905 389 9640 - 10005 366 ±50

L 9906 - 10944 1038 10006-10995 990 ±47

Из таблицы 6 видно, что, наряду с достаточно точным соответствием большинства данных гетеродуплексного анализа и результатов сравнения последовательностей гена и мРНК, в некоторых случаях (экзоны В, в) отличия значительно превышают заявленную авторами (ЭМпогтуа с1 а!., 1984) погрешность.

ШШШшшШ шшшжт

крыса

человек

ю

крыса

человек

Рис. 7. Результаты сравнительного анализа интронов генов TAT крысы и человека. В -эгсзоны, О -интроны, [1Щ| - повторяющиеся элементы, □ - области интронов с более чем 75% гомологии, щ - области интронов с 50-75% гомологии.

Сравнительный анализ последовательностей генов TAT крысы и человека.

Гомология между последовательностями экзонов гена TAT человека и крысы (считая, что делеции и вставки равны замене одного нуклеотида) составляет в среднем 58.7% в некодирующих белок областях и 87.1% в кодирующей области. Методами компьютерного анализа были выявлены районы высокой гомологии шпронов генов TAT крысы и человека, а также места встраивания повторяющихся элементов. Результаты такого анализа приведены на Рис. 7.

Сравнительный анализ 5'-регуляторных районов генов TAT крысы и человека.

При анализе известных ранее 5'-регуляторной областей генов TAT человека и крысы ранее были обнаружены районы с высокой гомологией (от -400 до +1 п.н.). С помощью фугпршгг-анализа и других методов в промоторной области гена TAT крысы выявлены сайты связывания многих факторов регуляции транскрипции (Becker et al., 1987), в частности не менее пяти сайтов связывания комплекса глюкокортикоид-рецептор (GRE). Однако только два из них - GRE П и GRE Щ (позиция относительно точки инициации транскрипции -2500 ii.it.) функционально активны (Jantzen et al., 1987). В соответствующей области гена TAT человека была обнаружена последовательность, гомологичная GRE П крысы, но консервативный гексануклеотид изменился в результате мутаций TGTTCT -> GATTCG, что, вероятнее всего, привело к потере функциональной активности; гомолог GRE Ш в гене TAT человека полностью заменен Alu—повторами (Ret-tenmeier et al., 1990, Рис. 8). Ген TAT человека также содержит последовательности, гомологичные GRE IV и GRE V гена TAT крысы, которые функционально не активны.

-3094

человзк TGARACTATCCCTCAAATAACAGGATATGCATAAAAGTTCTCTATCAATCATGAATGTAC I I I I I I I I I I I I I I I III I II II II III I I I I I I I I I I I крыса GAAAACTATCCCATAAATAACAGGAA GCCCAAG GTTTAC CAATCTCTGCTGTAC -258Ô

-3018

человэк AAGGAgaTTCCATATGCTTTATTTTTTAT---Alu повтор 1-------------

I I I I I I I I I I I I I I I I I I крыса AGGATGTTÇTAGCTACTTTATTTGCAATAGAAAATCTGAAAGTTTCCCCATGTCCAACA

GRE II -248§

человэк ------------------------Alu повтор 1----------------------

крыса AGACTAGAACAAACAAGTCCTGCGTAGTCGCCTGTCGGTTTCTGGGTGTGGTGGTATAGC GREIII

человек ------------------------------------------------------------

крыса CCTGTAATCCCAGCATTTGGGAAGCTGAGGTGGGAGGATCGGGAGTTCAAGGTCAGCTTG

человек ------------------------Alu повтор 2----------------------

крыса GGCTACTTAGAAAGACCTTGTCTCAAAAGAAGTGGAGGGGGGGTGGTGGTGGTGGTGGTG

крыса

-2402

-------Alu повтор 2---АС GCCCAGCCCAC АСАТTATT AAGAT TTT AAAAAA

II III III II II I I I I GTGGTGTAAAATTGATCTCTTTGTATGATAATGTCCATACAATATATTAATATTGAAAAC

-223Ô

человек AG CAAGCTACACÄACAGCCCTGTCCAATAGACAGAATGCAAGCCACATA GTGACCTCA I I I I I I I I I I I I I I I I I I I II III I I I I I I I I I I I I I крыса AGTCATGCCATASAACAATTTTGTTCAGTAAA TGTACATCACATAAGTAACTTCA GREIV

-2298

человек AATTTCCTAATAGAAATATTTT I II I I II II I I I I I I крыса AATTTTAGAAGGGATA ATTTT

-213Ô

Рис. 8. Гомологичные участки 5'-областей генов тирозинамишлрансферазы человека и крысы в области от -3090 до -2300 гена человека.

GRE I, GRE II, GRE III, GRE IV - ядра возможных сайтов связывания комплекса рецеп-тор-глкжокортикоид, локализованные в 5 '-области гена TAT крысы. Показано, что GRE II и GRE III действительно участвуют в индукции экспресси гена TAT крысы глюкокортикоидами (по данным Jantzen et al., 1987).

Таким образом, регуляторные элементы, ответственные за глюкокортико-идную индукцию гена TAT человека, по-видимому, находятся в другой области. Возможно, они располагаются в более удаленном 5'-регуляторном районе (от -5000 до -6000 п.н.), как в гене TAT крысы (Grange et al., 1989; Rettenmeier et al., 1990), либо в районе от -1200 ii.ii. до -600 п.н. от точки инициации транскрипции. Для проверки последнего предположения мы провели поиск потенциальных сайтов связывания комплекса глюкокортикоид-рецепгор, а также других факторов регуляции транскрипции в определенной в настоящей работе последовательности района от -1120 до -860 н.п. гена TAT человека с использованием программы Matlnspector v.2.1. Результаты поиска схематически представлены на Рис. 9. Наряду с известным (GRE V), но не являющимся функционально активным (Rettenmeier et al., 1990), в области от -1120 до -860 н.п. обнаружено 4 участка, высоко гомологичных обобщенной матрице сайга связывания комплекса глюкокорти-коид-рецептор. Два из них могут быть "недостающими звеньями" регуляции экспрессии гена TAT глюкокортикоидами, если она осуществляется аналогично гену TAT крысы. Один из этих участков (3) находится в непосредственной близости с потенциальным сайтом связывания фактора тканевой специфичности печени HNF3, аналогично функционально активному GRE Ш гена TAT крысы. Определение функциональной активности локализованных потенциальных сайтов потребует, по всей видимости, дополнительных экспериментов. Наряду с двумя обнаруженными ранее в 5'-области гена тирозинаминотрансферазы человека тандемно расположенными Alu-повторами нами обнаружен еще один, находящийся в непосредственной близости (на расстоянии 300 н.п.) от ранее обнаруженных.

-3500

« Я

Sgl

u 8«

-2500

i> i

-1500

-500

крыса

человек

-3500

-2500

-1500

-500

Результаты поиска GRE с использованием Matlnspector 2.1

1

направление гомология ядра GRE общая гомология

1.00 1.00 0.85 0.79

3 4 4

1.00 0.52 0.86 0.77 0.77 050

1.00 058

Рие. 9. Сравнительный анализ 5'-регуляторных областей генов TAT крысы и человека.

Белыми обозначены известные ранее последовательности, серым с белыми точками - определенная в данной работе;

черными прямоугольниками изображены функционально неактивные сайты связывания регулягорных факторов, штриховкой - активные или потенциально активные, а также Alu-повторы.

выводы

1. Определена неизвестная ранее нуклеотидпая последовательность гена тирози-наминотрансферазы крысы длиной 12368 п.н., включающая область гена, кодирующую белок, и 3'-фланкирующий район длиной 1400 п.н.

2. Установлена точная экзон-интропная структура гена тирозинаминотрансфера-зы крысы, известная ранее по данным гетеродуплексного анализа лишь приблизительно (погрешность до 200 п.н.).

3. Проведен сравнительный анализ последовательностей кодирующих, а также 5'- и 3'-фланкирующих областей генов тирозинаминотрансферазы человека и крысы. Выявлены области высокой гомологии, а также значительно отличающиеся области и области встройки повторяющихся элементов.

4. Определена неизвестная ранее нуклеотидная последовательность 5'-фланкирующего района (от -1990 до -580 п.н.) гена тирозинаминотрансферазы человека длиной 1410 п.н.

5. Проведен поиск потенциальных сайтов связывания комплекса клюкокортико-ид-рецепгор в 5'-области гена тирозинаминотрансферазы человека. На основании аналогий с строением 5'-регуляторной области гена тирозинаминотрансферазы крысы выбраны наиболее вероятные потенциальные сайты связывания для дальнейшей проверки их участия в регуляции экспрессии гена тирозинаминотрансферазы человека.

Автор благодарит: своего научного руководителя профессора, дб.н. Мертвецова Н,П. за руководство и всестороннюю (моральную и материальную) поддержку настоящей работы; Смагулову Ф.О. за огромную помощь, без которой данная работа вряд ли была бы завершена; Попову B.C. за постоянную и эффективную техническую поддержку, д.х.н. Тишкова В.И. за плодотворное сотрудничество во время работы на автоматическом секвенаторе ДНК; к.б.н. Мишина B.IL за большое участие в работе; к.х.н. Бондарь A.A. за моральную поддержку и ценные советы при написании диссертации; всех сотрудников лаборатории молекулярной биологии гена НИБХ СО РАН за дружескую атмосферу в отделе, способствующую плодотворной работе.

Основные результаты диссертации опубликованы в следующих работах:

1. Зеленин С.М., Морозов И.В., Тевс Н.Р., Горн В.В., Каргинов В.Л., Мервецов Н.П. Отбор гена тирозинаминотрансферазы из геномной библиотеки крысы с помощью молекулярных зондов, сконструированных на основе бактериофага М13 // Биополимеры и клетка 1989 Т.5 С.93-100.

2. Мертвецов Н.П., Чесноков В.Н., Зеленин С.М., Морозов И.6., Мишин В.П., Вишнивецкий С.Н. Структура и гормональная регуляция экспрессии гена тирозинаминотрансферазы млекопитающих. // Проблемы эндокринологии 1990 Т.36 С.42-51.

3. Морозов И.В., Мишин В.П., Зеленин С.М., Попова B.C., Мертвецов Н.П. Нуклеотидная последовательность EcoRI - фрагмента гена тирозинаминотрансферазы из печени крысы. // Биополимеры и клетка 1990 Т.6 С.95-96.

4. Morozov I.V., Mishin V.P., Zelenin S.M., Popova V.S., Mertvetsov N.P. Nucle-tide sequence of rat liver tyrosine aminotransferase gene fragment. // DNA Sequence 1990 V.l P.151-155.

5. Зеленин C.M., Попова B.C., Морозов И.В., Тишков В.И., Егоров С.М., Мертвецов Н.П. Определение первичной структуры EcoRI-фрагмента N5 гена тирозинаминотрансферазы крысы на автоматическом секвенаторе Applied Biosystems 370А. // Биоорганическая химия 1991 Т.17 С.994-996.

6. Mertvetsov N.P., Zelenin S.M., Morozov I.V., Mishin V.P., Bondar A. A., Kargi-nov V.A., Chesnokov V.N. The structure and regulation of mammalian tyrosine aminotransferase and proopiomelanocortin genes. II In: "Isozymes: Organization and Roles in Evolution, Genetics and Physiology", Ed. by C.L. Markert, J.G. Scandalios, H.A. Lim, O.L. Serov.- World Scientific Publishing Co. Inc., New Jersey.- 1994,- P.-95-105

7. Морозов И.В., Смагулова Ф.О., Мертвецов Н.П. Локализация элементов 5'-области гена тирозинаминотрансферазы человека, предположительно опосредующих регуляцию его экспрессии глюкокортикоидами. // Биоорганическая химия 1998 Т. 24 С. 433-436.

Определенные в настоящей работе нуклеотидные последовательности помещены в банк данных EMBL под номерами AJ000056 (5'-фланкирующая область

гена ТАТ человека) и AJ010709,RN0010709 (ген ТАТ крысы).

Текст научной работыДиссертация по биологии, кандидата биологических наук, Морозов, Игорь Владимирович, Новосибирск

РОССИЙСКАЯ АКАДЕМИЯ НАУК СИБИРСКОЕ ОТДЕЛЕНИЕ

НОВОСИБИРСКИЙ ИНСТИТУТ БИООРГАНИЧЕСКОЙ ХИМИИ

на правах рукописи

Морозов Игорь Владимирович

"СРАВНИТЕЛЬНЫЙ СТРУКТУРНО-ФУНКЦИОНАЛЬНЫЙ АНАЛИЗ ГЕНОВ ТИРОЗИНАМИНОТРАНСФЕРАЗЫ ЧЕЛОВЕКА И КРЫСЫ."

Специальность 03.00.04 - биохимия

Диссертация

на соискание ученой степени кандидата биологических наук

Научный руководитель: д.б.н. Мертвецов Николай Павлович.

г.Новосибирск, 1998 г

СОДЕРЖАНИЕ

стр.

СПИСОК СОКРАЩЕНИЙ 6

ВВЕДЕНИЕ 8

1. ОБЗОР ЛИТЕРАТУРЫ 11

1.1. Регуляция экспрессии генов стероидными гормонами. 11

1.1.1. Структура и функции стероидных гормонов. 11

1.1.2. Строение рецептора глюкокортикоидов 14

1.1.3. Изменение структуры хроматина под действием глюкокортикоидов 19

1.1.4. Участки ДНК, ответственные за связывание с рецептором 21 глюкокортикоидов

1.1.5. Синергичное взаимодействие глюкокортикоидного рецептора с другими 23 транскрипционными факторами

1.2. Ген тирозинаминотрансферазы - модель для изучения молекулярных 25 механизмов регуляции экспрессии генов.

1.2.1. Строение и свойства тирозинаминотрансферазы 26

1.2.2. Структура генов TAT 28

1.2.3. Регуляция экспрессии генов TAT глюкокортикоидами 33

2. МАТЕРИАЛЫ И МЕТОДЫ 38

2.1. Материалы и реактивы, использованные в работе 3 8

2.2. Выделение препаратов ДНК из образцов клеток и тканей 41

2.2.1. Выделение геномной ДНК 41

2.2.1.1. Выделение геномной ДНК из тканей млекопитающих 41

2.2.1.2. Выделение геномной ДНК из крови 42

2.2.1.3. Выделение геномной ДНК из гепатоцитов 43

2.2.2. Выделение ДНК из клеток Е.соИ 44

2.2.2.1. Выделение плазмидной дцДНК с использованием термического лизиса 44

2.2.2.2. Выделение плазмидной дцДНК с использованием щелочного лизиса 46

2.2.2.3. Выделение плазмидной дцДНК с использованием ионообменной 47 хроматографии

2.2.2.4. Выделение оцДНК бактериофага М13 из бактериальных клеток 49

2.3. Получение препаратов ДНК с использованием полимеразной цепной 50 реакции

2.3.1. Использование техники "горячего старта" для повышения специфичности 51 полимеразной цепной реакции

2.3.2. Использование изменяющейся температуры гибридизации для повышения 52 выхода и специфичности реакции

2.3.3. Использование глицерина для понижения температуры плавления дцДНК 56 и стабилизации ДНК-полимеразы

2.3.4. Использование термостабильной ДНК-полимеразы с 3-5' экзонуклеазной 60 активностью для амплификации длинных фрагментов ДНК

2.4. Ферментативная обработка препаратов ДНК 60

2.4.1. Гидролиз ДНК эндонуклеазами рестрикции 61

2.4.2. Гидролиз ДНК МипдВеап нуклеазой 61

2.4.3. Введение радиоактивной метки в ДНК 62

2.4.3.1. С использованием фрагмента Кленова ДНК-полимеразы I Е.соИ 62

2.4.3.2. С использованием полинуклеотидкиназы бактериофага Т4 63

2.4.4. Лигирование фрагментов дцДНК с использованием ДНК-лигазы 64 бактериофага Т4

2.5. Анализ и очистка препаратов ДНК методами гель-электрофореза 65

2.5.1. Электрофорез в гелях агарозы 65

2.5.2. Электрофорез в полиакриламидном геле 66

2.5.3. Разделение цепей дцДНК электрофорезом в полиакриламидном геле 67

2.5.4. Выделение ДНК из гелей электроэлюцией в ячейках фирмы "ISCO" 68

2.5.5. Выделение ДНК из агарозного геля методом сорбции на стекловолокне 69

2.5.6. Выделение ДНК из агарозных гелей сорбцией на DEAE-81 целлюлозу в 73 процессе электрофореза

2.5.7. Очистка олигонуклеотидов в денатурирующем полиакриламидном геле с 73 непрерывной элюцией и спектрофотометрической детекцией

2.6. Клонирование фрагментов ДНК в составе бактериальных векторных ДНК 77

2.7. Определение нуклеотидной последовательности (секвенирование) 78 фрагментов ДНК

2.7.1. Методом химической модификации по Максаму-Гилберту 78

2.7.1.1. В жидкой фазе 78

2.7.1.2. С использованием сорбции на DEAE-81 целлюлозе 80

2.7.1.3. Комбинированным методом 81

2.7.2. Методом специфической терминации полимеризации по Сэнгеру 83

2.7.2.1. Секвенирование оцДНК бактериофага М13 84

2.7.2.2. Секвенирование суперскрученной дцДНК плазмид с использованием 86 щелочной денатурации

2.7.2.3. Секвенирование суперскрученной дцДНК плазмид с использованием 86 денатурации в присутствии гликолей

2.7.2.4. Секвенирование с использованием флюоресцентно меченных праймеров и 87 детекции на автоматическом секвенаторе Applied Biosystems 370А

2.7.2.5. Секвенирование микроколичеств дцДНК с использованием фермента 87 ThermoSequenase

2.7.3. Разделение специфически терминированных фрагментов ДНК 88

электрофорезом в денатурирующем полиакриламидном геле

3. РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ 90

3.1. Определение нуклеотидных последовательностей: 90

3.1.1. Определение последовательности района -1990 - -580 п.н. 5'- 91 фланкирующей области гена TAT человека.

3.1.2. Определение последовательности гена TAT крысы: 95

3.1.2.1. Определение последовательности района 10350 - 12289 п.н. 97

3.1.2.2. Определение последовательности района 9298 - 10355 п.н. 98

3.1.2.3. Определение последовательности района 5622- 9293 п.н. 100

3.1.2.4. Определение последовательности района -19- 5627 п.н. 101

3.2. Структура гена TAT крысы. 104

3.3. Сравнительный анализ нуклеотидных последовательностей генов TAT 106 человека и крысы.

3.4. Поиск потенциальных участков связывания факторов регуляции 106 транскрипции в 5'-фланкирующей области гена TAT человека.

ВЫВОДЫ 111

СПИСОК ЦИТИРУЕМОЙ ЛИТЕРАТУРЫ 112

Приложение 1. Нуклеотидная последовательность гена TAT крысы. 126

сАМР, цАМФ

СНЕ

СПЕВ

ВЕАЕ-

ВМ80

(ШТР

сж

вИЕ йКР

вки

ОТР, АТР, ТТР, СТР

НМР

Н№

НЕЕ

не

Ьэр

ьты

ММТУ МОР8 МР МТР

СПИСОК СОКРАЩЕНИЙ:

цикло-аденозинмонофосфат

сайт связывания регуляторных факторов, активируемых цАМФ

белковый фактор, связывающийся с СКЕ

диэтиламиноэтил-

диметилсульфооксид

дезоксирибонуклеозидтрифосфат

глюкокортикоидный рецептор

участок связывания глюкокортикоидного рецептора

фактор, связывающийся с глюкокортикоидным рецептором

глюкокортикоид зависимый энхансерный модуль

гуанозин-, аденозин-, тимидин-, цитидин-5-трифосфат

фактор тканевой специфичности печени

тканеспецифические ядерные транскрипционные факторы печени

участок связывания рецепторов стероидных гормонов

сайты с высокой чувствительностью к гидролизу эндонуклеазами

рестрикции

белок теплового шока

длинные концевые повторы

вирус молочных желез мыши

- 3-[М-морфолино]пропансульфоновая кислота

ядерные транскрипционные факторы

рибонуклеозидтрифосфат

репликативная форма

X-gal - 5-бромо,4-хлоро,3-индолил-р-0-галактопиранозид

a.o. аминокислотных остатков

БСА бычий сывороточный альбумин

ГлРК комплекс глюкокортикоидного рецептора с глюкокортикоидным

гормоном

ДНК дезоксирибонуклеиновая кислота

ДНКаза дезоксирибонуклеаза

ДСН додецилсульфат натрия

дцДНК двуцепочечная форма ДНК

е.а. единицы активности

ИПТГ изопропил-р-О-тиогалактопиранозид

кДа килодальтон

кДНК комплементарная ДНК

мРНК матричная рибонуклеиновая кислота

оцДНК одноцепочечная форма ДНК

п.н. пар нуклеотидов

ПЦР полимеразная цепная реакция

ПЭГ полиэтиленгликоль

РНК рибонуклеиновая кислота

РНКаза рибонуклеаза

TAT Тирозинаминотрансфераза

ТЕМЕД М,М,М,№тетраметилэтилендиамин

Трис трис-гидроксиметиламинометан

ЭДТА этилендиаминтетрауксусная кислота

ВВЕДЕНИЕ.

В настоящее время одной из наиболее бурно развивающихся отраслей биологии является "геномика" - генетика, дошедшая в своем пути к элементарным носителям генетической информации до уровня последовательностей нуклеотидов, или наука о нуклео-тидных последовательностях. Наряду с грандиозными успехами, достигнутыми при сек-венировании и анализе геномов отдельных организмов (Caenorhabditis elegans (геном 100 ООО ООО п.н. секвенирован полностью); Homo sapiens; некоторые виды патогенных простейших) незаслуженно мало внимания уделяется сравнительному анализу гомологичных участков геномов разных видов. В свое время определение аминокислотной последовательности глобинов разных видов позволило сделать фундаментальные открытия в области эволюции белков. Имеющиеся на сегодняшний день многочисленные данные позволяют утверждать, что наибольшие частота и разнообразие эволюционных событий наблюдается не в кодирующих белок областях генома, на эволюцию которых накладываются жесткие ограничения естественного отбора на уровне белка, а в интронах генов, фланкирующих гены (регуляторных) районах и других "некодирующих" участков геномов. Сравнительный анализ последовательностей подобных районов геномов различных видов позволит выявить пути и механизмы эволюции генов и геномов.

Одной из наиболее привлекательных моделей для такого сравнительного анализа являются гены "минорных" белков, экспрессия которых является, как правило, ткане-специфической и находится под контролем различных факторов регуляции транскрипции. Тирозинаминотрансфераза (ТАТ, Ь-тирозин:2-оксоглутаратаминотрансфераза, К.Ф. 2.6.1.5) - пиридоксальфосфат зависимый фермент, катализирующий переаминирование тирозина, является одним из таких белков, механизмы регуляции экспресси гена которого в организме крысы детально изучены (Boshart et al, 1993; Мертвецов, 1990). Экспрессия

гена этого белка является такнеспецифической и происходит в основном в печени (в гепа-тоцитах). Уровень экспрессии регулируется посредством нескольких путей передачи межклеточных сигналов, в частности глюкокортикоидами и цАМФ. В 5'-фланкирующей области (до -6000 п.н.) гена ТАТ крысы были локализованы три тканеспецифических энхан-сера транскрипции, два из которых взаимодействуют с комлексом гормон - рецептор глю-кокортикоидов и фактором тканевой специфичности печени HNF3, а один - с CREB и HNF4, т.е. является цАМФ-зависимым (Shinomiya et al, 1984; Jantzen et al, 1987; Danesh et al, 1987; Grange et al, 1991; Boshart et al, 1993; Espinas et al, 1994). В то время как механизмы регуляции экспрессии гена ТАТ крысы изучены в деталях, для гена ТАТ человека в литературе нет данных о выявлении функционирующих энхансеров, контролирующих экспрессию этого гена. Известны лишь небольшие фрагменты нуклеотидной последовательности 5'-фланкирующей области гена ТАТ человека (Rettenmeier et al, 1990). Знание механизмов регуляции экспрессии гена ТАТ человека имеет, наряду с фундаментальным, важное медицинское значение, поскольку может позволить предотвращать или корректировать нарушения регуляции экспрессии гена ТАТ в процессе онтогенеза, приводящие к тяжелому заболеванию - тирозинемии.

Целью настоящей работы являлось выявление функционально значимых участков и эволюционно изменчивых райнов гена тирозинаминотрансферазы путем сравнительного анализа нуклеотидных последовательностей генов ТАТ человека и крысы, включающих все экзоны и интроны гена, а также значительные по длине районы 5'- и 3'-фланкирующих областей. Ранее были определены нуклеотидные последовательности фрагмента 5'-фланкирующей области от -3500 до -1900 п.н. (Rettenmeier et al, 1990), последовательности экзонов (Rettenmeier et al, 1990) и интронов (Зеленин, Мертвецов, 1994) гена ТАТ человека; а также нуклеотидная последовательность кДНК, экзон-интронная структура и карта сайтов эндонуклеаз рестрикции гена ТАТ крысы (Shinomiya et al, 1984;

Grange et al, 1985; Hargrove et al, 1989). Задачами работы являлось определение полной нуклеотидной последовательности гена TAT крысы (более 12 ООО п.н.) и района от -1900 до -700 п.н. 5'-фланкирующей области гена TAT человека и сравнительный анализ определенных в работе и ранее известных последовательностей.

1. ОБЗОР ЛИТЕРАТУРЫ.

1.1. Регуляция экспрессии генов стероидными гормонами.

1.1.1. Структура и функции стероидных гормонов.

Стероидные гормоны - производные холестерина (Bloch et al., 1983; Ткачук, 1983; Розен, Смирнов, 1981; Юдаев и др., 1976). Вследствие липофильности и небольшого размера стероиды способны легко проникать через клеточные мембраны и выполнять функции межклеточного переносчика сигналов. Для биосинтеза стероидов требуются АТФ, кислород и цитохром Р-450. Ферменты, ответственные за синтез и метаболизм стероидов, обнаружены у всех эукариот, включая растения, а также у некоторых видов прокариот. Установлена гормональная активность стероидов у беспозвоночных (Feldman et al., 1984). Широкое распространение стероидов дает основание предполагать, что они появились на ранних этапах эволюции и играли важную физиологическую роль, как сигнальные молекулы. Поскольку основные производные холестерина - желчные кислоты участвуют в метаболизме жиров, следовательно, первые стероиды также могли быть продуктами реакций, в которых холестерин играл роль субстрата.

Глюкокортикоиды - стероидные гормоны коры надпочечников. Глюкокортикоиды участвуют в регуляции углеводного метаболизма, стимулируя превращение глюкозы в гликоген. При голодании под действием этих гормонов в организме происходит образование глюкозы из белков, а именно, увеличивается трансаминазная активность в печени. Препараты глюкокортикоидов ослабляют воспалительные реакции посредством подавления синтеза белка в лимфоидной ткани, стабилизации мембран лизосом и усиления распа-

да лимфоцитов (Мецлер, 1980). Кроме того, известно подавление аллергических реакций организма глюкокортикоидами. Известно участие глюкокортикоидных гормонов в эмбриогенезе тканей легких и эпителиальных клеток (Pei, 1996).

Многообразие регулируемых глюкокортикоидами функций организма отражается на молекулярном уровне как обилием гликокортикоид-зависимых генов, так и существованием нескольких механизмов регуляции экспрессии генов глюкокортикоидами:

• первичная позитивная, независимая от синтеза других регуляторных белков. Глюко-кортикоидный гормон попадает в цитоплазму клетки, где связывается с глюкокорти-коидным рецептором. Гормон-рецепторный комплекс (ГлРК) попадает в ядро, где связывается со специфическим участком ДНК (GRE), что приводит к активации транскрипции (по этому типу регулируются гены гормона роста (Slater et al, 1985), металлотионеина ПА человека (Karin et al., 1984), триптофаноксигеназы (Danesh et al, 1987), тирозинаминотрансферазы (Boshart et al, 1993), вируса рака молочных желез мыши (Celender étal., 1987); © первичная негативная. Отличается от первичной позитивной тем, что глюкокорти-коидный рецептор связывается с участком ДНК (nGRE), ответственным за подавление транскрипции, что приводит к ингибированию экспрессии гена (так регулируются гены ß-глобина (Rousseau, 1984), проопиомеланокортина (Picard, 1988.), остео-кальцина (Morrison et al, 1989)); ® вторичная позитивная и негативная, требующая синтеза каких- либо регуляторных белков de novo. Экспрессия белков, являющихся транскрипционными факторами, регулируется глюкокортикоидами (так регулируются гены с^-глобина (Addison et al, 1986), а-фетопротеина (Turotte et al, 1986), кальцитонина (Cote et al., 1986), co-матостатина (Cote et al, 1986)).

Рис. 1 1.2а. Механизм индукции экспрессии генов гл ю кок о рти ко ид а ми. I I - глюкокортикоид;

GR - рецептор пнококортикоидов (красный); HSP90 - белок теплового шока 90 кДа; р59 - белок 59 кДа; Pol II - ДНК-полимераза;

1.1.2. Строение рецептора глюкокортикоидов.

После проникновения через плазматическую мембрану стероидные гормоны связываются со специфическими растворимыми рецепторами в цитоплазме клетки (рис. 1.1.2.а). Глюкокортикоидный рецептор относится к семейству лиганд - зависимых ядерных транскрипционных факторов (Evans et al., 1988). Рецепторы переносят внеклеточные сигналы к генам-мишеням, которые содержат специфические энхансерные последовательности (hormone response elements - HRE) (Yamamoto, 1985).

В отсутствие гормона глюкокортикоидный рецептор находится в цитозоле клеток в виде 9S частиц с молекулярной массой 300 кДа (Denis et al., 1988) и в такой форме не активен. Рецептор состоит из 3 белковых субъединиц: одной молекулы глюкокортикоидного рецептора с молекулярным весом 94 кДа и двух молекул белка теплового шока hsp9Q (Sanchez et al., 1985) с молекулярным весом около 90 кДа. Потеря hsp90 ведет к 10-кратному уменьшению силы связывания рецептора с гормоном, что указывает на важную роль hsp90 при образовании комплекса глюкокортикоидного рецептора с гормоном. Деления 568-616 а.о. глюкокортикоидного рецептора приводит к потере способности связывать hsp90 и исчезновению 9S комплекса. Кроме того, в 9S комплексе присутствует белок весом 59 кДа. Используя антитела к белку р59, обнаружили, что данный белок связывается с hsp90 (Renoir et al., 1990), следовательно, p59, вероятно, является продуктом процес-синга белка hsp90.

После связывания гормона глюкокортикоидный рецептор изменяет конформацию, что приводит к 10-кратному увеличению его сродства к ДНК (Yamamoto, 1974). Активация рецептора in vitro происходит при увеличении температуры (25-37°С) или ионной силы раствора. Активированный глюкокортикоидный рецептор имеет коэффициент седи-

ментации 3.2-4S и молекулярный вес 94 кДа (Rossini, 1987), а также повышенное сродство к ДНК и катионообменным смолам. Вероятно, это происходит в результате изменения конформации и появления положительных зарядов на поверхности молекулы глюкокор-тикоидного рецептора (Vedescis, 1983). Таким образом, при активации глюкокортикоид-ного рецептора происходит диссоциация олигомерного белкового комплекса. При обработке глюкокортикоидного рецептора трипсином образуются фрагменты с молекулярным весами 39 кДа и 16 кДа, которые связывается с молекулой глюкокортикоидного гормона. Кроме т