Бесплатный автореферат и диссертация по биологии на тему
Влияние регуляторных элементов и структуры кодонов на экспрессию бактериальной формиатдегидрогеназы в клетках E. coli
ВАК РФ 03.00.23, Биотехнология

Текст научной работыДиссертация по биологии, кандидата химических наук, Савицкий, Павел Александрович, Москва

^ ' ^у СТО' / 7 У .£?

МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

им. М.В. ЛОМОНОСОВА

ХИМИЧЕСКИЙ ФАКУЛЬТЕТ

На правах рукописи

САВИЦКИЙ Павел Александрович

ВЛИЯНИЕ РЕГУЛЯТОРНЫХ ЭЛЕМЕНТОВ И СТРУКТУРЫ КОДОНОВ НА ЭКСПРЕССИЮ БАКТЕРИАЛЬНОЙ ФОРМИАТДЕГИДРОГЕНАЗЫ В КЛЕТКАХ Е. COLL

03.00.23 - БИОТЕХНОЛОГИЯ

Диссертация на соискание ученой степени кандидата химических наук

Научный руководитель:

проф., д.х.н. Тишков В.И.

Москва - 1999

ЫАЭН

КАОРН

ФДГ

АТФ

ажр

1РШ

ЭДТА

ДТТ

СПИСОК СОКРАЩЕНИЙ.

никотинамидадениндинуклеотид окисленный

никотинамидадениндинуклеотид восстановленный

никотинамидадениндинуклеотидфосфат окисленный

никотинамидадениндинуклеотидфосфат восстановленный

формиатдегидрогеназа

аденозин-5 -трифосфат

дезоксирибонуклеозид -5 -трифосфат

изопропил-р-О-тиогалактозид

этилендиаминтетрауксусная кислота

дитиотреитол

ОГЛАВЛЕНИЕ

I. ВВЕДЕНИЕ.............................................................................................................4

II. ОБЗОР ЛИТЕРАТУРЫ.........................................................................................6

Глава 1. ЭКСПРЕССИЯ ЧУЖЕРОДНЫХ ГЕНОВ В КЛЕТКАХ Е. coli.............6

1.1. Структура векторов Е. coli, обеспечивающих эффективную экспрессию...................................................................................................7

1.2. Регуляция транскрипции...........................................................................12

1.2.1. Промоторы...........................................................................................12

1.2.2. Терминаторы транскрипции...............................................................16

1.2.3. Антитерминаторы транскрипции.......................................................17

1.2.4. Системы экспрессии со строгой регуляцией промотора...................18

1.3. Регуляция трансляции...............................................................................19

1.3.1. Инициация трансляции мРНК............................................................19

1.3.2. Усилители трансляции........................................................................22

1.3.3. Стабильность мРНК............................................................................25

1.3.4. Терминация трансляции......................................................................27

1.4. Внутриклеточная локализация экспрессируемых белков........................28

1.4.1. Цитоплазматическая локализация......................................................28

1.4.2. Секреция в периплазму.......................................................................33

1.4.3. Секреция в среду культивирования....................................................35

1.5. Частота использования ко донов в чужеродном гене и в клетках Е. coli. 36

1.6. Протеолиз экспрессируемых белков.........................................................38

1.7. Условия культивирования бактерий.........................................................40

Глава 2. СТРУКТУРА ГЕНА ФОРМИАТДЕГИДРОГЕНАЗЫ И

ПРИЛЕГАЮЩИХ К НЕМУ ОБЛАСТЕЙ............................................41

III. ЭКСПЕРИМЕНТАЛЬНАЯ ЧАСТЬ...................................................................47

Глава 3. МАТЕРИАЛЫ И МЕТОДЫ..................................................................47

3.1. Материалы..................................................................................................47

3.2. Методы исследования................................................................................49

IV. РЕЗУЛЬТАТЫ И ИХ ОБСУЖДЕНИЕ.............................................................58

Глава 4. ОПТИМИЗАЦИЯ ЭКСПРЕССИИ ГЕНА

ФОРМИАТДЕГИДРОГЕНАЗЫ............................................................58

4.1. Оптимизация экспрессии в системе TGl/pFDH6.....................................59

4.2. Оптимизация структуры ко донов в гене формиатдегидрогеназы...........62

4.3. Оптимизация рибосомсвязывающего участка.........................................76

4.4. Оптимизация промоторного участка гена формиатдегидрогеназы.........92

4.5. Оптимизация условий культивирования клеток Е. coli BL21(DE3)/plysS/pFDH8............................................................................99

4.6. Увеличение стабильности суперэкспрессирующих формиатдегидрогеназу векторов.............................................................109

4.7. Объединение в одном векторе оптимизированных регуляторных элементов и оптимизированной структуры гена....................................117

V. ВЫВОДЫ..........................................................................................................121

VI. СПИСОК ЛИТЕРАТУРЫ................................................................................123

I. ВВЕДЕНИЕ.

Бурное развитие в последние годы методов генетической инженерии позволило клонировать огромное количество генов различных белков из самых разных источников - от бактерий до млекопитающих. Это позволяет изучать белки на новом уровне, который был недоступен ранее: стало возможным изучение взаимосвязи структуры и функции белков, выявление их механизма действия, выяснение роли отдельных аминокислотных остатков в катализе, получение с помощью направленного мутагенеза мутантных белков. Однако, достаточно часто при попытках экспрессии клонированного гена в клетках Е. coli не удается получить больших количеств целевого белка. Нередки случаи, когда клонированный белок вообще не синтезируется клетками Е. coli. Ограничение уровня экспрессии может происходить на всех стадиях биосинтеза белка: транскрипции гена, трансляции матричной РНК и сворачивания полипептидной цепи в трехмерную структуру (фолдинга).

В нашей лаборатории ведутся работы с NAD-зависимой формиатдегидрогеназой (КФ 1.2.1.2., ФДГ) из метилотрофных бактерий рода Pseudomonas, окисляющей формиат-ион до СО2 и при этом восстанавливающей NAD+ в NADH. Этот фермент интересен как с теоретической, так и с практической точек зрения. С теоретической точки зрения этот фермент интересен тем, что является наиболее простым представителем суперсемейства дегидрогеназ 2-0-гидроксикислот. Реакция, катализируемая

формиатдегидрогеназой, самая простая среди всего семейства дегидрогеназ и может служить модельной при изучении механизма ферментативного переноса гидрид-иона от атома углерода субстрата к С4-атому никотинамидного кольца кофермента. С практической точки зрения формиатдегидрогеназа также чрезвычайно важна, так как является наилучшим ферментом для системы регенерации NADH. Реакция, катализируемая формиатдегидрогеназой, необратима, восстановление NAD+ можно проводить без его выделения из

реакционной среды. Однако, формиатдегидрогеназы из разных источников обладают разной стабильностью и разными кинетическими параметрами. Наиболее высокой удельной активностью и стабильностью среди всех известных к настоящему моменту формиатдегидрогеназ обладает ФДГ из метилотрофных бактерий Pseudomonas sp. 101. В частности, по своей стабильности она поевосходит аналогичные (Ьеоменты из дюожжей минимум в

Л. ' • л- Л- ■ 'JL

1000 раз. Ген этого фермента был клонирован и экспрессирован в клетках Е. coli [1]. Было показано, что в результате отсутствия посттрансляционной модификации в клетках Е. coli рекомбинантная формиатдегидрогеназа по своим кинетическим параметрам превосходит исходный фермент, выделенный из Pseudomonas sp. 101 [2]. В результате направленного мутагенеза был получен фермент, специфичный к NADP+ [3]. Однако, уровень экспрессии формиатдегидрогеназы в клетках Е. coli достаточно низок и не превышает 5-7% даже при использовании высокоэффективных систем на основе промоторов lac и tac [1]. Кроме того, скорость биосинтеза очень низка, примерно в 5 раз ниже, чем для белков из Е. coli. Таким образом актуальной задачей является разработка генноинженерных конструкций, обеспечивающих получение нативной и мутантных форм формиатдегидрогеназы в больших количествах.

II. ОБЗОР ЛИТЕРАТУРЫ. Глава 1.

ЭКСПРЕССИЯ ЧУЖЕРОДНЫХ ГЕНОВ В КЛЕТКАХ Е. coli.

Выбор системы экспрессии для промышленного получения целевого белка зависит от многих факторов, включающих в себя тип организма, синтезирующего целевой белок, необходимый уровень экспрессии, внутриклеточную локализацию белка, его посттрансляционную модификацию, биологическую активность и требуемую степень очистки. Кроме этого, выбор системы экспрессии в каждом конкретном случае зависит еще и от такого фактора, как стоимость процесса в целом, которая включает в себя стоимость химических реактивов, стоимость оборудования и затраченной электроэнергии, а также стоимость очистки целевого белка. Последний фактор играет очень важную роль при производстве пептидов, белков и ферментов, применяемых в медицине. В этом случает простая и дешевая система экспрессии в клетках Escherichia coli в результате последующей очистки целевого продукта оказывается более дорогой, чем система экспрессии в клетках млекопитающих. Дело в том, что все грамм-отрицательные бактерии, к которым принадлежит и Escherichia coli, синтезируют эндотоксин - липосахарид, являющийся компонентом внешней бактериальной мембраны. Эндотоксин является очень токсичным для людей соединением, его допустимая доза составляет 5*10"10 г/кг/час. Существующие в настоящее время системы очистки от эндотоксина дороги, что и приводит к резкому увеличению стоимости полученных в Е. coli фармацевтических препаратов. Однако, в том случае, когда высокая степень очистки целевого белка не требуется, например при производстве ферментов для целей биотехнологии, система экспрессии в Escherichia coli оказывается наиболее приемлемой среди множества остальных.

Несмотря на бурный прогресс в изучении генетики и молекулярной биологии Escherichia coli, попытки экспрессии чужеродного гена в этом организме не всегда приводят к успеху. Это может быть связано с уникальными структурными особенностями последовательности гена, стабильностью мРНК и эффективностью ее трансляции, фолдингом белка, его деградацией под действием клеточных протеаз, различием в частоте использования кодонов в клонированном гене ив Е. coli, а также возможной токсичностью целевого белка для клетки-хозяина. Существует, однако, несколько правил, которыми следует руководствоваться при разработке системы экспрессии целевого белка в Е. coli. Главными чертами Е. coli как штамма-хозяина являются практически полная неспособность осуществлять посттрансляционную модификацию, происходящую в эукариотических клетках, практически полная неспособность секретировать белки в культуральную среду и ограниченная способность образовывать дисульфидные связи. С другой стороны, многие гликозилированные в природе белки сохраняют свою биологическую активность и в негликозилированной форме и, таким образом, могут быть получены в Е. coli. Кроме того, в последнее время достигнут прогресс в создании штаммов Е. coli, способных осуществлять образование дисульфидных связей и секрецию целевого белка в культуральную среду.

Целью настоящего обзора литературы является анализ опубликованных к настоящему времени данных по экспрессии клонированных белков в Е. coli с целью выявления экспериментальных подходов, позволяющих достичь суперпродукции целевого белка.

1.1. Структура векторов Е. coli, обеспечивающих эффективную

экспрессию.

Достижение эффективной экспрессии клонированного гена возможно только при наличии в экспрессирующем векторе определенных структурных

элементов, следующих друг за другом в строго определенном порядке [4-7]. Структура экспрессионного вектора для клеток Е. coli приведена на

Промотор Е. coli, инициирующий синтез мРНК, состоит из двух консервативных гексануклеотидных участков, расположенных в 5' области от точки начала транскрипции за 35 и 10 нуклеотидов соответственно. Эти участки называются -35 областью и -10 областью соответственно и разделены коротким спейсером длинной 17 нуклеотидов. В случае регулируемой экспрессии промотор находится под контролем регуляторного гена, который может присутствовать как в самой плазмиде, так и в бактериальной хромосоме. Белковый продукт этого регуляторного гена "включает" или "выключает" синтез

RBS-

р_»

-35 -10

SD

ген

тт

Amp

Ori

mRNA 5'- UAA6GAGG 16S í-RNA 3'- онAUUCCUCС

стартовый кодон AUG (91%) GUG (8%) UUG (1%)

Рис. 1. Структура бактериального экспрессионного вектора. В качестве примера промотора показан гибридный tac промотор (Р), состоящий из -35 и -10 областей, разделенных участком длиной 17 нуклеотидов. Стрелка показывает направление транскрипции. RBS включает в себя SD последовательность, которая взаимодействует с 3' концом 16S рРНК. Структурная часть гена может начинаться с трех различных стартовых кодонов. Оптимальное расстояние между SD и стартовым кодоном составляет 8 нуклеотидов. Наиболее эффективным сигналом терминации трансляции является тетрануклеотид UAAU. Репрессор, осуществляющий регуляцию активности промотора, кодируется геном R, который может находится как в самой плазмиде, так и в бактериальной хромосоме. Терминатор транскрипции ТТ может функционировать также в качестве элемента, стабилизирующего мРНК. Кроме этого, ген устойчивости к антибиотику (Amp) упрощает селекцию бактерий, содержащих вектор, а элемент Ori определяет копийность вектора в клетке.

мРНК в зависимости от присутствия молекул вещества, называемого индуктором (рисунок 2). Для экспрессии клонированных генов в Е. coli, применялось большое количество различных промоторов. Кроме собственных промоторов Е. coli применялись также промоторы из грамм-положительных бактерий, а также из бактериофагов. Свойства этих промоторов суммированы в таблице 1. Идеальный промотор должен обладать следующими свойствами: 1) он должен быть "сильным", т.е. он должен обеспечивать высокий уровень мРНК в клетке; 2) он должен обеспечивать низкий уровень неиндуцированной экспрессии, т.е. он должен быть строго регулируемым; 3) он должен функционировать во всех штаммах Е. coli, обеспечивая таким образом возможность изучения экспрессии целевого белка в различных штаммах, и, наконец, 4) он должен легко индуцироваться.

Следом за промотором расположен рибосом-связывающий участок (RBS)

Таблица 1. Промоторы, использовавшиеся для экспрессии генов в клетках Е. coli.

Промотор Регуляция Индуктор Ссылка

lac (Е. coli) lacl, lac]4, 1РШ, [14-16]

lacIÇTs), lacFÇTs) тер мо индукция

trp (Е. coli) недостаток Тгр, [17]

индолакриловая к-та

Ipp (Е. coli) ПТС [18]

phoA (E. coli) phoB, phoR недостаток фосфата [19]

recA (E. coli) lex A налидиксовая к-та [20]

araBAD (E. coli) araC Ь-арабиноза [21]

proU (E. coli) осмотический шок [22]

cst-1 (E. coli) недостаток глюкозы [23]

tetA (E. coli) тетрациклин [24]

cadA (E. coli) cadR рН [25]

tac (E. coli) lacl НТО [26]

trc (E. coli) lacl НТО [27]

PL(A.) \clts%51 термоиндукция [28]

cspA (E. coli) понижение температуры [29]

T7 lacl 1РТС [6]

T7-lac (T7) lacl 1РШ [30]

промотор ген реп рессора

1

!

Л

го о. О) с

мРНК репрессора

вР клонированный ген

ДНК

молекулы репрессора

промотор ген репрессора

1

о. о

I-

го о. (0

с:

вй клонированный ген

ДНК

мРНК репрессора

инактивированные молекулы репрессора

транскрипция ^

мРНК клонированного белка

О

О

О

О О

молекулы индуктора

° о0 □□ °

молекулы клонированного белка

Рис. 2. Схема индуцируемой экспрессии. (А) В отсутствие молекул индуктора конститутивный синтез молекул белка-репрессора приводит к подавлению транскрипционной активности промотора в результате связывания молекул репрессора с оператором. (Б) При добавлении в среду культивирования молекул индуктора они связываются с молекулами репрессора и инактивируют его. В результате этого происходит транскрипция клонированного гена и, соответственно, трансляция получившейся мРНК и синтез молекул целевого белка.

длинной около 54 нуклеотидов, роль которого состоит в правильном связывании матричной РНК и рибосомы. Этот участок начинается за 35 (±2) нуклеотидов до ATG ко дона и заканчивается в положении +19 от него [8]. В структуре RBS находится так называемая последовательность Шайна-Дальгарно (SD) [9], взаимодействующая с 3' концом 16S рРНК в процессе инициации трансляции [10]. Расстояние между SD и ATG ко доном может меняться от 5 до 13 нуклеотидов [11]. В 5' и в 3' областях от RBS наблюдается повышенное содержание аденинов [12]. Для эффективной трансляции нуклеотидная последовательность в этом районе не должна образовывать вторичных структур [13].

Следующим необходимым элементом экспрессионного вектора является терминатор транскрипции, расположенный за геном целевого белка. Терминатор транскрипции, представляющий собой протяженный участок вторичной структуры, функционирует одновременно как сигнал остановки транскрипции [31] и как элемент, стабилизирующий мРНК от деградации рибонуклеазами. Такие участки, находящиеся как в 5' области так и в 3' области, увеличивают время жизни мРНК и таким образом увеличивают уровень экспрессии целевого белка [32].

В дополнение к перечисленным элементам, оказывающим прямое влияние на экспрессии целевого белка, вектор экспрессии должен содержать также ген устойчивости к антибиотику, необходимый для поддержания плазмиды в клетке Е. coli. Наиболее часто используемым для этой цели является ген устойчивости к ампициллину (Amp), однако, в последнее время все чаще используются другие антибиотики, такие как тетрациклин (Тс) или канамицин (Km). И, наконец, последним элементом, обязательно присутствующим в любом векторе экспрессии, является так называемый репликон, обозначенный на рисунке 1 как Ori. С этого участка начинается репликация плазмиды и его структура также определяет количество копий плазмиды в клетке. Существуют два основных

типа репликонов, обеспечивающих низкую (примерно 15 копий на клетку) и высокую (до 300-400 копий на клетку) копийность плазмиды. В тоже время существуют специальные репликоны, которые в особых условиях обеспечивают безудержную репликацию плазмиды, приводящую к увеличению копийности до 2000 - 3000 копий на клетку. В ряде случаев использование таки�