Бесплатный автореферат и диссертация по биологии на тему
Структура mРНК и экспрессия трансгенов в клетках растений: экспериментальный и компьютерный анализ
ВАК РФ 03.00.15, Генетика

Автореферат диссертации по теме "Структура mРНК и экспрессия трансгенов в клетках растений: экспериментальный и компьютерный анализ"

к

РГ6 од

и у ФЕВ

На правах рукописи

УДК: 577.216.6.7+577.217.52.56

КОЧЕТОВ АЛЕКСЕЙ ВЛАДИМИРОВИЧ

СТРУКТУРА шРНК И ЭКСПРЕССИЯ ТРАНСГЕНОЗ В КЛЕТКАХ РАСТЕНИЙ: ЭКСПЕРИМЕНТАЛЬНЫЙ И КОМПЬЮТЕРНЫЙ АНАЛИЗ

Генетика - 03.00.15.

АВТОРЕФЕРАТ

Диссертации на соискание ученой степени кандидата биологических наук

1 (овосибирск 1997

Работа выполнена в Институте цитологии и генетики СО РАН, г. Новосибирск

Научные руководители:

академик РАН В. К. Шумный Институт цитологии и генетики СО РАН, г. Новосибирск

Официальные оппоненты:

доктор биологических наук М.И.Ривкин

Институт цитологии и генетики СО РАН, г. Новосибирск

доктор биологических наук Г.М. Дымшиц

Институт цитологии и генетики СО РАН, г. Новосибирск

кандидат биологических наук А. Б. Беклемишев Новосибирский институт биоорганической химии

Ведущее учреждение: ВНИИ Молекулярной биологии ГНЦ "Вектор"

Защита состоится " Ч " МЛргт^ 1998 года на утреннем заседании диссертационного совета по защите диссертаций на соискание ученой степени доктора наук (Д-002.11.01) в Институте цитологии и генетики СО РАН в конференц-зале Института по адресу: 630090, г. Новосибирск, проспект академика Лаврентьева, 10.

С диссертацией можно ознакомиться в библиотеке Института цитологии и генетики СО РАН

Автореферат разослан 28 1998 г.

Ученый секретарь диссертационного совета, доктор биологических наук

I с

Л. Д. Груздев

Актуальность проблемы. Создание новых форм растений с помощью генно-инженерных методов является одним из главных направлений развития современной биотехнологии. Однако, недостаточный уровень знаний о механизмах контроля экспрессии генов существенно затрудняет планирование генно-инженерных экспериментов. В частности, одним из больших пробелов является невозможность точной оценки трансляционного поведения mPHK.

Использование для экспрессии трансгенов в растениях оперонных структур, характерных для клеток прокариот, имеет ряд преимуществ перед переносом нескольких генов, каждый из которых помещен под независимое управление. В последнем случае влияние геномной ДНК в месте инсерции (возможно посредством механизмов "замолкания" и транс-инактивации трансгенов (Matzke et al, 1993)) способно изменять транскрипционную активность промоторов. Дисбаланс уровней экспрессии недопустим, если необходима строго координированная экспрессия нескольких генов (например, ферментов одной метаболической цепи). Использование оперонных композиций может предотвратить вариабельность экспрессии на уровне транскрипции, поскольку в онероне белок-кодирующие районы генов расположены под контролем одного промотора. Разработка методов, позволяющих повысить интенсивность трансляции днстальных цистронов полицислронных шРНК может оказаться способом повышения эффективности использования оперонов в трансгенезе и применения их в качестве инструмента для оптимизации экспрессии трансгенов в растениях.

При исследовании свойств mPHK эукариотических генов было обнаружено, что трансляционная активность матриц неодинакова и может варьировать в широком диапазоне (Ray et al., 1983). Было выдвинуто предположение, что трансляционная активность mPHK зависит от структуры 5' нетранслируемой (лидерной)

последовательности, которая может влиять на эффективность взаимодействия mPHK и рибосом (Kozak, 1978, 1986, 1987а; Ray et al., 1983). Дальнейшие исследования показали, что существуют энхансеры трансляционной активности шРНК: 5'НТП mPHK некоторых вирусов растений и животных способны значительно увеличивать интенсивность трансляции гетерологичных шРНК (Gallie, 1987; Jobling and Gehrke, 1987). Структура сигналов и механизмы, лежащие в основе функционирования энхансеров пока остаются малоизученными (обз:

Gallie, 1993; Futterer and Hohn, 1996). v

Вопрос о том, способны ли нуклеотидные последовательности энхансеров трансляции функционировать при их расположении не на 5'-конце тРНК, остается малоисследованным. Также остается неясным, могут ли энхансеры трансляции быть использованы для усиления экспрессии дистальных генов в оперонах, то есть способны ли они функционировать в межцистронных промежутках полицистронной тРНК.

Следует отметить, что молекулярные механизмы экспрессии генов в клетках растений вообще изучены намного меньше, чем процессы, протекающие в клетках животных. Применимость к растительным системам той или иной модели или гипотезы, разработанной с использованием экспериментов на животных, во многих случаях требует дополнительных исследовании. Изучение структурно-функциональных характеристик тРНК, определяющих трансляционную активность матрицы и уровень экспрессии гена в различных клетках и в различных ситуациях, является одной из приоритетных задач молекулярной генетики (и, в частности, молекулярной генетики растений), решение которой необходимо как для понимания интегральной системы контроля экспрессии генов, так и для развития генной инженерии и биотехнологии.

Цели и задачи исследования. Целью настоящей работы является изучение эффективносга экспрессии оперонов в клетках растений и анализ характеристик 5' негранслируемых последовательностей (5'НТП) тРНК генов высших растений.

В рамках работы были поставлены следующие задачи:

1. Создать модельную систему для исследования характеристик экспрессии различных генных композиций в клетках растений.

2. Оценить эффективность экспрессии модельных бицистронных оперонов в клетках растений.

3. Исследовать свойства энхансеров трансляции в качестве усилителей трансляции дистальных цистронов в бицистронных шРНК и оценить перспективность их использования в генно-инженерных экспериментах.

4. Определить общие и трансляционно-значимые характеристики лидерных последовательностей шРНК генов растений.

5. Определить критерии для предсказания трансляционных свойств тРНК генов растений по структуре ее лидерной последовательности.

Научная uomnita н практическая itthhocti». В результате проведенных исследований была разработана модельная система для изучения эффективности экспрессии различных генных композиций в клетках растений. Показано, что ген бета-интерферона человека способен нормально интегрироваться в геном растений табака и экспрессироваться в тканях трансгенных растений. Исследована экспрессия оперонных структур в клетках растений. Показано, что в модельных бицистронных оперонах дисталыше гены экспрессируются неэффективно. Впервые получены данные о функционировании трансляционных энхансеров вируса мозаики люцерны (BMJT) и вируса гравировки табака (ВГТ) при не-5'-терминальной локализации в структуре растительных тРНК.

Проведен компьютерный анализ характеристик 5'НТП тРНК генов растений. Показано, что лидеры тРНК генов двудольных и однодольных растений существенно различаются по нуклеотидному составу и структуре контекста стартового кодона трансляции. Обнаружено, что структура 5'НТП тРНК регуляторных генов растений насыщена сигналами, ингибируюгцнми трансляционную активность матриц.

Сформулированы критерии, позволяющие предсказать трансляционную активность тРНК генов растений по структурным и контекстным характеристикам 5'-нетранслируемой последовательности. Апробация работы. Материалы диссертации были представлены на Всесоюзных конференциях "Новые направления биотехнологии" (Пущино, 1990 и 1991 г.г.); Германской конференции по биоинформатике (Лейпциг, 1996), Международной конференции памяти академика Баева (Москва, 1996 г.), Международной конференции по афобиотехнологии растений и животных (Киев, 1997 г.). Публикации. По теме диссертации опубликовано 6 работ. Структура н объем работы Диссертация включает введение, обзор литературы, материалы и методы, результаты и обсуждение исследований (изложеные в двух главах), выводы и список литературы (157 ссылок). Работа изложена на 140 страницах, включая 16 рисунков и 18 таблиц.

МАТЕРИАЛЫ И МЕТОДЫ

Конструирование и анализ рекомбинантных плазм ид проводили стандартными методами (Маниатис и др., 1984). Для конструирования были использованы следующие плазмиды: pRAJ-275 (Jefferson, 1988), рС27 (Alliotte et al., 1988), pRTIOI (Topfer et al„ 1987), pRTI04 (Topfer et

al., 1987), pTUG (Katsube et al., 1991), pRTL-GUS (Carrington and Freed, 1990), pGSH 160 (Deblaere et al., 1987). Первичную структуру ДНК определяли по методу Сэнгера (Sanger et al., 1977).

Трансформацию растений табака (Nicotiana tabacum SRI) проводили методом агробактериальной трансфекции листовых дисков (Deblaere et al., 1987). Трансформантов, устойчивых к канамицину (100 мг/л среды), переносили в грунт в теплицу. Для анализа использовали растения, достигшие 4-6 недельного возраста. В этой части работы принимали участие сотрудники ИЦиГ Е.В. Дейнеко и МЛ. Комарова.

Геномную ДНК из трансгенных растений табака выделяли по методу, предложенному Деллапорта (Dellaporta et al., 1985) и модифицированному Дрейпером и Скоттом (1991). Блот-гибридизацию ДНК трансгенных растений проводили по Скотту (1991).

Анализ растений на активность неомицинфосфотрансферазы II (НФТН) проводился по Рейсу (Reiss et al., 1984). Определение активности бста-глюкуронидазы (БГ) в тканях трансгенных растений проводили с помощью стандартного флюорометрического метода (Jefferson, 1988).

Транзиентную экспрессию модельных конструкций в протопластах табака проводили по Пролзу (Prols et al., 1988). В выполнении этих экспериментов принимали участие М. И. Ривкин (ИЦиГ) и Ф. МакКлин (Государственный университет пггата Северная Дакота, США). Анализ тканей трансгенных растений на содержание бета-интерферона (БИ) человека проводили методом иммуноблота по Скотту (1991).

Для расчета нукпеотидного состава и контекста AUG кодона нуклеотидных последовательностей была использована программа MGL (Колпаков и Бабенко, 1997). Для оценки достоверности различий между распределениями использовали тест Колмогорова-Смирнова. В выполнении расчетов принимали участие сотрудники ИЦиГ В.Н. Бабенко, Ф.В. Колпаков, Д.Г. Воробьев, М.П. Пономаренко.

РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ

I. Исследование экспрессии опероиов в клетках растений

Для исследования эффективности экспрессии оперонов в клетках растений был создан набор Модельных конструкций. Были сконструированы два варианта бицистронных оперонов. В качестве дистального цистрона был использован ген БГ Е. coli (p-Gluc), широко применяемый в качестве маркера экспрессии в клетках растений (Jefferson, 1988), в том числе и при моделировании трансляционных

процессов (Gallie et al., 1987). В качестве проксимальных цистронов были взяты гены УДФ-глгокозо-шгрофосфорилазы картофеля (УПФ; UPPL) (Katsube et al., 1991) и ген БИ человека (fi-IFn). Конструирование двух вариантов бицистронных оперонов было проведено для того, чтобы избежать возможного воздействия структуры проксимального цистрона на трансляционные свойства шРНК в клетках растений. В моделировании были также использованы трансляционные энхансеры ВМЛ (Jobling and Gehrke, 1987) и ВГТ (Carrington and Freed, 1990). Эти энхансеры были помещены в межцистронных промежутках для того, чтобы оценить их влияние на уровень экспрессии дистального гена. 1. Исследование экспрессии гена бета-иитерферона человека в трансгашых растениях табака. В структуре гена могут содержаться сигналы, способные различным образом влиять на его экспрессию в гетер ологичных системах. Для использования гена P-IFn в модельных конструкциях было необходимо предварительно показать, что этот ген способен нормально интегрироваться в геномную ДНК и экспрессироваться в клетках растений. Для выполнения этой работы на основе вектора pGSH160 была получена модельная конструкция pG21 (рис.1), содержащая ген P-IFn человека под транскрипционным контролем 2' части двунаправленного промотора маннопинсинтазы (MAC), активного в корнях и листьях растений (Teeri et al., 1989). pG21

RB P-IFn pMAS nptll LB

Рис.1. Схема Т-области плазмиды pG21. Обозначения: RB, LB- повторы, окаймляющие Т-область; nptll - ген НФТП Е. coli; ß-IFn - ген БИ человека; pMAS - промотор гена MAC; Н, Bg - сайты рестрикции (Н - Hindlll, Bg -Bglll), использованные при анализе ДНК трансгенных растений (рис. 2А.)

Были получены и проанализированы трансгенные растения табака. Анализ геномной ДНК этих растений гибридизацией по Саузерну показал, что трансген интегрирован в геном растений (рис. 2А; в качестве зонда был использован BglII-фрагмент плазмиды pG21). Анализ тканей трансгенных растений на наличие бета-интерферона методом иммуноблота также показал присутствие этого белка (рис.2Б; были использованы моноклональные антитела мыши). Таким образом, было показано, что ген бета-интерферона человека может служить маркером экспрессии трансгенов в клетках растении.

А)

6/10 7/10 К «/1 6/3

' г" ' -

Б)

21/6 К 21/7 21/8

5.0 4.5

-V . ■*—ß-IFn

2.8

Рис.2. А) Блот-гибридизация HindIII-гидролизатов геномных ДНК трансгенных растений линий 21/6 и 21/7 (маркер - Pstl-гидролизат фага Л. К -нетранстенное растение). Б) Иммуноблот белковых экстрактов из листьев растений линий 21/6, 21/7, 21/8 с антителами на ß-интерферон. 2. Анализ экспрессии модельного бицистронного оперона, скомпонованного из генов бета-интерферона и бета-глюкуронидазы. Схемы Т-областей векторов Pßß, Pßaß и Paß, сконструированных на основе плазмиды РС27, приведены на рис. 3.

Pßß (41:

LB

НИ

ß-Cluc

2' pMAS 1'

Pßaß ("61:

LB

41

ß-Gluc

a ß-IFn 2' pMAS 1' nptll

±

RB

3*

FaßfT):

LB

ß-Gluc

a 2' pMAS l' — ■*-► _

nptll

RB

Рис. 3. Схема Т-областей плазмид Pßß, Pßaß и Paß. Обозначения: см. рис. 1; ß-Gluc - ген БГ Е. coli, a - энхансер BMJI. В плазмиде Pßß под контролем 2' части промотора MAS расположен бицистронный оперон; оперон в плазмиде Pßaß отличается тем, что содержит в межцистронном промежутке нуклеотидную последовательность трансляционного энхансера BMJI. В плазмиде Paß содержится моноцистронный оперон (контроль). Сравнительный анализ

уровней экспрессии гена ß-Gluc в растениях, содержащих конструкции l'ßß и Paß должен показать эффективность экспрессии дистального гена в опероне. Анализ активности БГ в растениях, содержащих конструкции Pßß и Pßaß должен показать влияние трансляционного энхансера на эффективность экспрессии дистального гена в опероне.

Результаты анализа растений-трансформантов приведены на рис.4.

Рис.4. Активность БГ и НФТН в трапсгенных растениях табака. Активность БГ (ось ординат) приведена в иаиомолях 4-метилумбеллиферона (4-MU), наработанного нз метилумбеллкферилппокуроиида (MUG) за 1 минуту реакции экстрактом из листьев табака, содержащим 1 мг белка. Активность НФТИ (ось ординат) приведена в условных единицах. Обозначения: растения, содержащие оперон Ррр - цифрой 4, Рроф - цифрой 6, Pap -цифрой 7; в скобках после цифры, обозначающей оперон, приведен номер растения-трансформшгга. К - контроль, нетрансгеиное растение табака.

Растения были проанализированы на активность БГ и НФТП. Согласно данным, полученным при исследовании свойств двунаправленного промотора MAS (Teeri et al., 1989; Langridge et al., 1989; Leung et al., 1991), интенсивность транскрипции с его Г и 2' частей различается, но регулируется координировано, и уровень экспрессии гена nptll (расположенного под управлением Г части MAS-промотора) отражает транскрипционную активность 2' части. Это дает возможность при сравнении трансгснных растений по уровню экспрессии гена P-Gluc использовать уровень экспрессии генапрШ в качестве критерия уровня транскрипции модельных конструкций.

Согласно полученным результатам, уровень экспрессии дистального гена в бицистронных оперонах низок (<1% от уровня экспрессии моноцистронного контроля) и трансляционный энхансер В МЛ не способен заметно активировать экспрессию. 2. Анализ экспрессии модельного бицистронного оперона, скомпонованного из генов УДФ-глюкозо-пирофосфорилазы и бета-глюкуронидазы. В отличие от модельных конструкций серии р-1Рп~р-01ис, экспрессия модельных конструкций этой серии была проведена в протопластах табака. На рис. 5 приведены схемы фрагментов плазмид РаР-иРРЬ, рЯТЬ-ОШ, рИЛЬ-ТЕУ-СШ и ОТРЬ-ТЕУ-вШ, содержащих модельные опероны с геном ИРРЬ в качестве проксимального цистрона.

РаВ-ЦРРЬ: ЬВ р-С,1ис а ИРРЬ рМАв врШ ИВ

4Н ■ И

цНТЬ-СЦБ: р358 ТЕУ Р-вкс

сНТЬ-ТКУ-СШ: р358 ТЕУ ЦРРЬ р-авс

-=—»—гтг^-зг К

ЦРРЬ-ТЕУ-СШ: р35в иРРЬ ТЕУ р-С1ис

-==±ЧТ-"Т1-| -И

Рис.5. Схема Т-областей плазмид Роф-иРРЬ, рИТЬ-ТЕУ-вШ, рЯТЮШ, иРРЬ-ТЕУ-ОиЭ. Обозначения: см. рис. 1 и 3; ЪРРЬ - ген УПФ картофеля, ТЕУ - энхансер ВГТ.

Модель Рар-иРРЬ представляет собой аналог конструкции Ррар, в которой ген р-1Рп замещен на ген \JPPL. Модельные конструкции рКТЬ-ТЕУ-ОШ и иРРЬ-ТЕУ-ОШ бьши созданы на базе плазмцды рЯТЬ-Оив, которая была использована в качестве моноцистронного контроля. В качестве негативного контроля применяли плазмиду рВ1и$-0113, в которой ген Р-01ис был проклонирован без растительного промотора. Соотвественно, сравнительный анализ экспрессии бета-глюкуронидазы в моделях Рар-иРРЬ/Рар и рИЛЬ-ТЕУ-СиЗ/рНТЬ-ОиЗДЛРРЬ-ТЕУ-ОиБ должен показать эффективность экспрессии гена при размещении его в качестве дистального цистрона в опероне и влияние на этот уровень кэп-зависимого трансляционного энхансера

BMJT (модель Pap-UPPL) и кэп-незавнсимого трансляционного энхансера ВГТ (модель UPPL-TEV-GUS).

Результаты экспериментов показали (рис.6), что экспрессия дисталытых генов в опероиах в клетках растений неэффективна (менее 1 % от уровня экспрессии этого же гена в моноцистронном контроле).

3

a

60

50 -

ж -с 5? s 40

ü Ю £ 30

£ § 20

£ i

§ S а 10 •

i (9

pRTL-GUS

РаЬ

Psb-UPPL

pRTl-TEV-GUS pBIUJ-GUS

UPPL-TEV-GUS

Рис.6. Активность БГ при трагаиентной экспрессии конструкций Paß-UPPL, Paß, pRTL-TEV-OUS, pRTL-OUS, UPPL-TEV-GUS, pBlus-GUS в протопластах табака. (Обозначения- см. рис.4)

Использование кэп-зависимого энхансера ВМЛ или кэп-нсзависимого энхансера ВГТ в структуре оперона (в районе межцистронного сопряжения) не привело к заметному увеличению эффективности экспрессии ди стального гена. По-видимому, специфическая активность трансляционных энхансеров, основанная на высокой аффинности к некоторым факторам инициации трансляции, не проявляется при не-терминальном расположении этих последовательностей. С другой стороны, спектр факторов, с которыми взаимодействуют ' использованные энхансеры (Gallie, 1993), мог оказаться недостаточным для реактивации рибосом на дистальном цистроие.

11. Компьютерный анализ характеристик 5'НТП тРНК генов растений Общепризнанно, что в клетках эукариот взаимодействие тРНК и рибосом в большинстве случаев происходит по схеме, названной "модель сканирования" (Kozak, 1989а). Согласно этой модели, 40S субъединица

рибосомы связывается с кэпом на 5' конце тРНК и движется вдоль матрицы в 3' направлении. В 90-95% шРНК позвоночных стартовым кодоном трансляции основной рамки считывания является ближайший к 5' концу mPHK AUG кодон. Эффективность распознавания AUG кодона 40S субъединицей рибосомы зависит от нуклеотидной последовательности в районе AUG. Считается, что в клетках позвоночных животных основное влияние на уровень трансляции оказывает нуклеотид в "-3" положении перед AUG кодоном. Аденин в этой позиции соответствует оптимальному контексту AUG, гуанин -субоптимальному, а пиримидины - неоптимальному контексту.

Анализ характеристик 5'НТП тРНК генов растений был проведен Йоши в 1987 году (Joshi, 1987) на выборке из 79 лидерных последовательностей, из которых около 40% не были полноразмерными. Мы запланировали определить общие и трансляционно-значимые характеристики лидерных последовательностей тРНК на основе современных данных. С этой целью было разработано программное обеспечение, позволившее выделить лидерные последовательности тРНК генов растений из БД EMBL (выпуск 49). На основе ДНК-карточек была выделена выборка полноразмерных лидеров (обзначенная Dh), содержащая 479 нуклеотидных последовательностей с уровнем сходства <70%. На основе кДНК-карточек была выделена выборка лидеров (обозначенная Rh), содержащая 3410 нуклеотидных последовательностей (длиннее 15 нт) с уровнем сходства <70%. В силу специфики построения кДНК-библиотек лидеры из выборки Rh нельзя считать достоверно полноразмерными. В результате анализа выборок Dh и Rh были определены общие и трансляционно-значимые характеристики тРНК.

1. Длина 5'НТП. Исследование распределения длин 5' лидеров тРНК генов растений было проведено с использованием выборки Dh. Оказалось, что длина лидера варьирует от 11 до 1140 нт, средняя длина составляет 104 нт. В тРНК генов двудольных растений чаще встречаются лидеры длиной до 100 нт (в 69% случаев), у шРНК однодольных растений - от 50 до 150 нт (в 68%) (различия достоверны с уровнем значимости Р<0.05).

2. Нуклеотидный состав 5'НТП тРНК генов растений. Анализ лидерных последовательностей тРНК генов растений (выборка Rh) показал, что нуклеотидный состав лидеров шРНК однодольных и двудольных растений в значительной степени различен (Р<0.001; рис. 7).

70 ■ 60 -so -

S «0 +

С

£ зо-ira

20 10 -

I

О

о

э <

□ двудольные

□ однодольные

Рис. 7. Нуклеотид-нын состав 5'НТП тРНК генов двудольных и однодольных растений.

Соответственно, в представление об обогащенности 5'НТП тРНК генов растений аденином и уридином (Joshi, 1987) должны быть внесены коррективы, поскольку это утверждение верно только для двудольных растений. Что касается лидеров тРНК генов однодольных растений, то их можно охарактеризовать как обогащенные цитидином при близких концентрациях остальных нуклеотидов.

Показано, что стабильная вторичная структура 5'НТП тРНК препятствует продвижению 40S субъединиц рибосом и снижает трансляционную активность матрицы (Pelletier and Sonenberg, 1985; Kozak, 1989в). В качестве критерия самокомплементарности мы использовали отношение концентраций комплементарных нуклеотидов (G/C, A/U). Для сравнения были получены данные по соотношению комплементарных нуклеотидов в нуклеотидных последовательностях другой функциональной принадлежности - З'НТП (была проанализирована выборка из 315 последовательностей). Оказалось, что близкое содержание G и С (G/C в пределах от 0.8 до 1.2) характерно для относительно небольшого числа лидеров (19.3% 5'НТП тРНК генов двудольных, 23.3% 5'НТП тРНК генов однодольных). Близкие концентрации комплементарных нуклеотидов в трейлерах встречаются значительно чаще (в пределах от 0.8 до 1.2: G/C в трейлерах тРНК двудольных растений - в 34.94% последовательностей, у однодольных - в 43.90%). Сходная закономерность обнаружена по соотношению A/U. 3. Контекст A UG кодона в тРНК генов растений. Существуют две точки зрения о роли контекста AUG кодона в тРНК генов растений. Согласно первой, влияние контекста AUG кодона на трансляцию в клетках растений такое же, как и в клетках позвоночных (Taylor et al., 1987; Kozak, 19896; Guerineau et al., 1992; Dinesh-Kumar and Miller, 1993).

Согласно второй точке зрения, нуклеотид в "-3" положении перед AUG не влияет на эффективность трансляции в клетках растений (Lutcke et al., 1987; Kirsi and William, 1990). Результаты анализа нуклеотидной последовательности шРНК генов растений в районе AUG кодона показали, что в "-3" позиции перед AUG в большинстве случаев расположен пурин:

---G-AAAA a u g G С G (mPIIK двудольных) G-GGC-GCG а и g G С G (шРНК однодольных) и позволили уточнить данные, полученные ранее другими авторами (Joshi, 1987; Lutcke et al., 1987; Cavener and Ray, 1991). Близкие концентрации в "-3" положении в шРНК однодольных растений гуанина и аденина (44.3% и 36.6%, соответственно) позволяют предположить, что их функциональная активность, по-видимому, очень близка. В тРНК двудольных растений в "-3" положении перед AUG кодоном аденин встречается в 56.7% случаев, гуанин - в 23.6%. Обращает на себя внимание то, что концентрации пиримидинов в этой позиции в тРНК растений оказались намного выше, чем в тРНК позвоночных (Kozak, 1987). Возможно, эффективность распознавания AUG рибосомами в клетках растений меньше зависит от контекста (как это происходит в дрожжах, в шРНК которых вообще нуклеотид в "-3" положении неактивен (Cigan et al., 1988; Looman and Kuivenhoven, 1993)). Другая возможность - трансляционная значимость позиций в контексте AUG кодона тРНК генов растений может отличаться от таковой у животных. 4. Содержание AUG код опое в составе 5'НТП тРНК генов растений. AUG кодоны в составе лидерной последовательности тРНК служат ложными стартами трансляции и снижают интенсивность трансляции основной рамки считывания (Kozak, 1989а). Негативный эффект AUG кодона зависит от степени оптимальности контекста; считается, что в клетках позвоночных проксимальный AUG кодон в оптимальном контексте способен многократно снизить уровень трансляции (Kozak, 1987, 1989а). Количество растительных шРНК, струшура 5'НТП которых способна негативно влиять на трансляционную активность, неожиданно оказалось велико. В составе выборки Dh 19.4% лидеров содержат AUG, причем в 11% лидеров содержатся миницистроны с оптимальным или су б оптимальным контекстом хотя бы одного AUG кодона. Таким образом, полученные нами значения намного превышают ранее полученные оценки содержания AUG кодонов в 5'НТП (8% (Joshi, 1987); 7% (Kozak, 1991)).

5. Оценка трансляционных характеристик тРНК генов различных функциональных групп. Нами был проведен сравнительный анализ характеристик 5'НТП шРНК растений, принадлежащих 796 генам различных функциональных групп. Результаты представлены в таблице I.

Таблица 1. Характеристики 5'НТП шРНК растений, принадлежащих генам

различных функциональных групп.

Гены (выборка Щ») Кол-во Средняя длина,вт Кол-во 5'НТП, содерж. AUG Вторичная структура*

Гены фотосинтеза (ЯЬсв, Са/Ь) 149 74.7 12 -3.42

Гены высокого уровня экспрессии (актины, тубулины, гистоны н др.) 193 119.7 15 -3.83

Индуцибельные гены «рессорных ответов (ПБР и др.) 105 99.8 11 -3.05

Гены регуляторных факторов (транскр. факт., рецепторы и т. п.) 349 223.1 163 -6.67

* Средняя энергия наиболее стабильной шпильки, ккал/'моль

Можно видеть, что лидерные последовательности тРНК регуляторных генов значительно чаще содержат AUG кодоны и характеризуются более стабильной вторичной структурой по сравнению 5'НТП тРНК генов других исследованных групп.

Выявленная закономерность была проверена на независимых выборках, в качестве которых были использованы 5'НТП тРНК регуляторных и высокоэкспрессирующихся генов другой таксономической принадлежности - млекопитающих. Согласно полученным данным, представленным в таблице 2, в 5'НТП тРНК регуляторных генов млекопитающих AUG кодоны также встречаются с высокой частотой, как это было найдено для 5'НТП тРНК растений.

Таблица 2. Характеристики 5'НТП тРНК млекопитающих, принадлежащих

генам высокого и низкого уровней экспрессии.

Гены млекопитающих Кол-во Средняя длина,нт Кол-во 5'НТП, содерж. AUG Вторичная структура*

Гены высокого уровня экспрессии (актины,гистоны и др.) 114 80.1 13 -3.8

Гены регуляторных факторов (фанскр.факт.,рецепторов и т.п.) 198 203.3 74 -5.3

* Средняя энергия наиболее стабильной шпильки, ккал/моль

Мы провели сравнительный анализ контекстных характеристик 5'НТП тРНК генов двудольных растений для определения расширенного набора критериев, позволяющих дискриминировать тРНК генов высокого и низкого уровней экспрессии. Для этого была использована компьютерная система SITEVIDEO (Kel et al., 1993), позволяющая выявлять факторы, значимые для дискриминации нуклеотидных последовательностей с альтернативными биологическими свойствами. С помощью этой системы были определены параметры 5'НТП (И), по которым выборки тРНК генов высокого и низкого уровней экспрессии оказались достоверно различны. Оказалось, что существует большое количество параметров, по которым имеются различия, такие как длина 5'НТП, контекст стартового AUG кодона, содержание AUG в лидерах, нуклеотидный состав, отношение концентраций комплементарных нуклеотидов, частоты нуклеотидов в различных позициях 5'НТП, концентрации олигонуклеотидов. Это свидетельствует в пользу существовании сложной системы факторов, определяющих эффективность взаимодействия тРНК и рибосом в клетках эукариот. С учетом многофакторного характера различий в структуре 5'НТП тРНК генов высокого и низкого уровней экспрессии, мы провели оценку трансляционной активности (F) контрольной

ы

выборки тРНК по формуле 1: F(seq) = 2Щ**Я). ТО есть в наиболее

1=1

простом случае, когда каждому из использованных для анализа параметров 5'НТП присвоен одинаковый вес. Распределение предсказанной трансляционной активности тРНК приведено на рисунке 8. Заметно, что 5'НТП шРНК большей части генов высокого уровня экспрессии обеспечивают повышенную трансляционную активность, в то время как трансляционные свойства лидеров низкоэкспрессирующихся тРНК варьируют в широком диапазоне.

Р(»еч), предсказанная активность

Рис.8. Распределение предсказанной трансляционной активности тРНК высоко- и низкоэкспрессирующихся генов двудольных растений.

Очевидно, высокий уровень экспрессии генов требует оптимизации всех уровней, включая и максимизацию трансляционной активности mPHK. В то же время, у регуляторных генов с высокой частотой встречаются mPHK, структура 5'НТП которых определяет низкую трансляционную активность (табл. 1 и 2). Вероятно, в клетках эукариот низкая эффективность трансляции используется в качестве фактора, лимитируещего экспрессию и предохраняющего от избыточной продукции регуляторных белков. В тех случаях, когда в лидерах таких mPHK не содержатся негативные сигналы, лимитирование экспрессии может происходить на других уровнях (стабильности mPHK в цитоплазме (Helasco, 1993), стабильности белков (Pähl and Baeuerle, 1996)).

На основе модели многофакторной зависимости эффективности взаимодействия 5'НТП шРНК и рибосом (формула 1) была разработана компьютерная система для предсказания уровня экспрессии генов двудольных растений. Анализ контрольной выборки mPHIC генов высокого и низкого уровней экспрессии показал, что система правильно дискриминирует 84% шРНК генов высокого и 76% mPHK генов низкого уровней экспрессии (Р <0.001). Это означает, что предложенная модель может быть использована для предсказания уровня экспрессии генов растений по структуре 5'НТП их шРНК. Возможность оценки влияния тех или иных модификаций в районе 5'НТП на трансляционную активность шРНК делает эту систему полезной для планирования генно-инженерных экспериментов. Пилотный вариант системы доступен по адресу: http://wwwmgy.bionet.nsc.ru/programs/acts2/dicot.htm .

ВЫВОДЫ

1. Создана модельная система для исследования экспрессии различных генных композиций в клетках растений.

1.1. Показано, что ген бета-интерферона человека способен нормально интегрироваться в геном растений табака и экспрессироваться в тканях трансгенных растений.

1.2. Показано, что в модельных бицнетронных оперонах дисгальные гены экспрессируются неэффективно.

1.3. Исследованы свойства кэп-зависимого трансляционного энхансера РНК4 вируса мозаики люцерны. Показано, что эта трансляционно-мстнвная последовательность не способна увеличивать эффективность экспрессии дистальных цистронов в модельных бицистронных оперонах. Таким образом, энхансер РНК4 BMJI не рекомендуется использовать при иной локализации, нежели на 5'конце mPHK.

1.4. Исследованы свойства кэп-независимого трансляционного

энхансера геномной РНК вируса гравировки табака. Показано, что эта последовательность не способна увеличивать эффективность экспрессии дистальных цистронов в модельных бицистронах. Таким образом, энхансер РНК ВГТ также не рекомендуется использовать при иной локализации, нежели на 5'конце mPHK.

2. Определены характеристики лидерных последовательностей mPHK генов растений.

2.1. Показано, что контексты AUG кодона в mPHK однодольных и двудольных растений различаются по ряду позиций. Выдвинуто предположение об отличиях в функциональных свойствах нуклеотидов в отдельных позициях стартового кодона трансляции mPHK генов однодольных растений, двудольных растений и животных.

2.2. Установлено, что необычно большая часть (45-60%) 5'НТП mPHK регуляторных генов растений содержит негативные сигналы (AUG кодоны, мини-рамки считывания и стабильную вторичную структуру). Показано, что лидеры mPHK регуляторных генов млекопитающих также содержат негативные сигналы намного чаще, чем 5'НТП mPHK высоко-экспрессирующихся конститутивных или индуцибельных генов. Выдвинуто предположение, что низкая трансляционная активность mPHK в клетках эукариот часто используется в качестве фактора, лимитирующего экспрессию регуляторных генов, и этот механизм высококонсервативен.

3. Выработана система критериев для оценки трансляционных свойств mPHK генов растений, основанная на результатах анализа общих (длина и нуклеотидный состав) и трансляционно-значимых (содержание AUG кодонов, структура контекста, вторичная структура) характеристик mPHK генов высокого и низкого уровней экспрессии.

СПИСОК ПУБЛИКАЦИЙ

1. Кочетов А.В., Ривкин М.И., Комарова М.Л., Дсйнеко Е.В., Шумный В.К. Оптимизация трансляции генов в трансгенных растениях: создание модельных бицисгронных оперонов // сб.'Теиешческие основы признаков продуктивности растений" Новосибирск. ИЦиГ. 1992. С.5-11.

2. Ривкин М.И., Дейнеко Е.В., Комарова М.Л., Кочетов А.В., Шумный В.К. Оценка вирусоустойчивости трансгенных растений табака и люцерны, несущих 1'сн бега-интерферона человека II Докл. Акад. Наук. 1993. Т.331. С.652-654.

3. Rivkin М., Deineko Е., Komarova М., Kochetov A., Malyshenko S., Talianskii М., Shumny V. Analysis of virus resistance of tobacco and alfalfa transgenic plants bearing human beta-interferon gene II Biotechnology/Biotech. Equip. 1995. N.l. P.40-44.

4. Кочетов А.В., Лукашева В.В., Комарова M.JI., Пилюгин М.В., Дейносо Е.В., Ривкин М.И., Шумный В.К. Экспрессия модельных, бицистронов о трансгенных растениях II Докл.Акад.Наук. 1996. Т.349. N.4. С.549-552.

5. Ischenko I.V., Kochetov A.V., Kel А.Е., Kisselcv L.L., Kolchanov N.A. Comparative analysis of the local secondary structure of mRNAs encoded by high-and low-expression eukaryotic genes // In: "Proceedings of the German Conference on Bioinformatics (GCB'96)". Leipzig Univ. 1996. P.124-129.

6. Кочетов А.В., Лукашева B.B., Пилюгин M.B., Комарова М.Л., Дейкеко Е.В., Ривкин М.И., МакКлин Ф., Шумный В.К. Оперонная организация транскрипционных едишщ в клетках растений // Цитол. и геиет. 1997. N. 6. С. 17-28

11одписано к печати 25.12.97

Формат бумаги 60x90 1/16. Печ. л. 1. Уч. изд. л. 0.7 Тираж 100 экз. Заказ 110.

Ротапринт Института цитологии и генетики СО РАН 630090, Новосибирск, пр. академика Лаврентьева, 10