Бесплатный автореферат и диссертация по биологии на тему
Молекулярно-генетическое изучение гена эндо-бета-1,4-глюканазы из Micromonospora cellulolyticum: молекулярное клонирование, определение нуклеотидной последовательности и экспрессия в Escherichia coli и Streptomyces lividans
ВАК РФ 03.00.15, Генетика

Автореферат диссертации по теме "Молекулярно-генетическое изучение гена эндо-бета-1,4-глюканазы из Micromonospora cellulolyticum: молекулярное клонирование, определение нуклеотидной последовательности и экспрессия в Escherichia coli и Streptomyces lividans"

Государственный научно-исследовательский институт геннтики и селекции промышленных микроорганизмов

На правах рукописи

ЛИНЬ ФЭН

Молекулярно-генетическое изучение гена эндо-бета-1,4-глюканазы из Micromoriospora cellulolyticum : молекулярное клонирование, определение нуклеотидной последовательности и экспрессия в Escherichia coli и Streptomyces lividans.

03.00.15 - генетика

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата биологических наук

Москва - 1995

Работа выполнена в лаборатории генетики метилотрофных бактерий Государственного научно-исследовательского центра генетики и селекции промышленных микроорганизмов и в институте микробиологии провинции Фуджен (г. Дуджоу, КНР)

Научный руководители: доктор биологических наук,

профессор Ю.Д. Цыганков;

директор института микробиологии провинции Фуджен, профессор Чэн Йэн Рум

(CHENG Yuan Rons') Официальные оппоненты: доктор биологических наук,

профессор А.И. Нетрусов; Кандидат биологических наук A.C. Яненко. Ведущая организация: Институт общей генетики РАН.

фе$, imw Защита состоится "2й" марта 1995г. в_час. на заседании

Специализированного совета12, Ol в Государственном

научно-исследовательском центре генетики и селекции

промышленных микроорганизмов по адресу: 113545, Москва,

1-й Дорожный проезд, д. 1.

С диссертацией можно ознакомится в библиотеке ГНЖГенетика.

Автореферат разослан "IS" февраля 1995 г.

Ученый секретарь Специализированного Совета кандидат биологических наук

В.И. Щербакова

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

1. Актуальность темы

Целлюлоза является одним из наиболее значительных возобновляемых ресурсов земли, составляет 40Х биомассы планеты и играет важную роль в существовании человечества. Гидролиз целлюлозы для получения глюкозы или олигосахаридов интенсивно исследуется уже более 80 лет. Химический и энзиматический гидролиз, дополняемый иногда механическими методами, являются наиболее часто используемыми методами. Химические методы более эффективны, однако они также более дорогие и вредные для окружающей среды. Стремление использовать энзиматические методы гидролиза вместо химических требует поиска эффективных микроорганизмов „с высокой целлюлазной активностью. Результатом поиска явилось значительное количество выделенных штаммов. Однако успех от применения этих микроорганизмов не был достигнут из-за нерастворимости макромолекул целлюлозы и большого разнообразия целлюлозных комплексов.

Новый интерес к изучению целлюлаз все время возрастает по причине сокращения энергетических, пищевых и кормовых ресурсов и проблем с загрязнением окружающей среды. Использование целлюлаз может помочь в обработке зерна и фруктов, производстве этанола и балка одноклеточных, а также в обработке отходов, что представляет большой экономический интерес.

Целлюлаза является комплексом, состоящим ив трех различно функционирующх ферментов, эндо-и-1,4-глюканазн, зкяо-в-глюканазы и п-глкркозидазы. Для выяснения механизмов ферментативного действия на нерастворимую целлюлозу, исследователями выделено и идентифицированно около восьмидесяти различных природных целлюлаз. Разработанные недавно методы работы с ДНК дают возможность получить отдельные компоненты целлюлосомы, добиться чего при помощи обычных биохимических методов крайне затруднительно. Так, почти 100 целлюлазных генов (включая гены различных коиланая) были клонированы и охарактеризованы на молекулярном уровне, что способствовало пониманию механизмов работы ферментов.

Большое разнообразие целлюлосом требует интенсивного их изучения на базе генетических исследований цел.пал аз, входящих в состав комплекса. Относительно изученными являются целлюлосомы из

- а -

Celiulomonas f'imi, Clostridium thermocellm, Trichoderwa reesei, Ruminococcus albjs, Thermomonospora fusca, Clostridium cellulovorans, и другие.

Род MjcromonosLKira, о большим разнообразием термостаоильннх ииллкшая, предложен как перспективный микроорганизм для изучения целлюлозой. В соответствии с этим мы начали работу по клонированию генов андонуклеаз из недавно охарактеризованного штамма Шаттопоз^юга sp. 86W-16, определению их нуклеотидной последовательности и экспрессии в Fznherinhia cob' и Streptomycin? lividans,

Z. Цель и задачи исследования

- выделение и ияучение нового штамма Micromonospora sp. как источника целлюлазных генов;

- клонирование целлюлазных генов из Micromonospora sp.;

- анализ нуклеотидной последовательности клонированных генов и поиск гомологии с ранее клонированными целлюлазными генами;

- предсказание предполагаемых активных участков белков, продуцируемых генами целлюлаз, путем выявления гомологии с другими ферментами;

- исследование экспрессии клонированных генов в Е. coii;

- исследование экспрессии клонированных генов, интегрированных в хромосому Stretomyc.es sp. *,

- использование ДНК клонированных генов в качестве молекулярного зонда для поиска других гомологичных генов в том же и других схожих штаммах.

3. Научная новизна и практическая значимость работы

Более 90 целлюлазных генов были идентифицированы из 41 штамма микроорганизмов, входящих в около 30 родов. В нашей работе впервые в * качестве источника целлюлазных генов ис-польвовачся штамм Micromonospora cellulolyticum 86W-16. Обнаружена значительная гомология между геном, клонированным в настоящей работе и андоглюкавнаой иа MiсгоЫк/юга bisix>ra. Настоящая работа явилась первой попыткой интеграции гетерологичных целлюлазных генов в хромосому Stretomyces sp. и достижение экспрессии в этом

организме.

Данные нашей работы показали наличие инвертированных повторов в нуклеотидной последовательности размером 14 п.н. и 6 строго консервативных аминокислотных остатков (некоторые из которых предположительно входят в активные участки фермента), каждые из которых широко встречаются и в других аналогичных ферментах.

Продукт клонированного гена /леелА из М. се] 1и1о1уЫсит 86№-16 является эндоглюканазой молекулярной массы 46 кДа и обладает широким рабочим диапазоном рН и температуры. Поэтому он несомненно может найти промышленное применение в случае достижения сверхэкспрессии гена тсепА.

4. Структура и объем работы

Диссертация состоит из следующих разделов: часта А (Обзор), часть В (Материалы и методы), часть С (Результаты, 12 разделов), часть Д (Обсуждение), часть Е (Выводы), часть ? (Список литературы, 260 наименований); и содержит 20 рисунков и б таблиц.

5. Апробация работы

Результаты исследования были представлены на 5-ой конференции "Структура генов, регуляция и экспрессия" (Ноябрь 1993 г., Ксиамен, КНР).

РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ 1. Описание вида ШсгопопоБрога эр. 86М-16.

Вид М1сготопо5рога эр. 86№-16 был выделен из озерного ила г.Фучжоу, КНР. Он был такс-ономически идентифицирован как новый штамм М. се1]ц1о1уЫсит. При использовании пробирочного теста М. се71и1о1уЫсит 8бW-l6 гидролизует полоску фильтровальной бумаги.

методом были обнаружены три типа целлюдаз: СМСаза (карбоксиметилцеллюлаза), авицелаза/ФПаза и з-глюкозидаза. Главным компонентом являлась СМСазная активность. Вновь выделенный организм М)сготопогрога был выбран в качестве источника для

клонирования гена эндоглюканазы.

2. Клонирование андоглюканазного гена из библиотеки генома М. celJulo]yticum 86W-16.

Тотальная ДНК М. cellulolyticum 86W-16 была подвергнута частичной рестрикции BamHl рестриктазой. Полученные BamHl фрагменты размером 2-7 т.п.н. были лигированы с ДНК вектора рАТ153 расцепленного по ВатНI-сайту. Этой лигированной смесью были трансформированы компетентные клетки Е. coli НВ101 и высеяны на LB агар с 100 мкг/мл ампициллина. Методом Конго-красный был проведен скрининг около 1000 клонов AprTcs. Среди них был выделен один клон, обозначенный как Клон 72, показавший видимую гидролитическую зону (Рисунок 1). Рестрикция по BamHl плазмиды рССТ72, выделенной

из Клона 72, показала наличие вставки ДНК размером 2.4 т.п.н. Для того, чтобы показать, что вставка 2.4 т.п.н. содержит ген, обозначенный нами mcenA, и кодирующий полную эндоглюканазу или каталитический домен эндоглюканазы, плазмида рССГ/2 была элиминирована из Клона 72 акридином оранжевым в с-убингибирующей концентрации 150 мкг/мл в LB. Три излеченных клона, как и исходная E.coli НВ101, не имели СМСазной активности. Введение плазмид рСС'172 путем трансформации в излеченные клоны восстанавливала их СМСазную активность.

3. Саузерн-гибридизация meenА гена с BamHl рестриктами хромосомной ДНК М. cellulolyticum 86W-16.

Cayзерн-гибридизацией 2.4 т.п.н. фрагмента ДНК и tíamHÍ реотриктов хромосомной ДНК М. cellulolyticum 86W-16 было подтверждено, что источником 2.4 т.п.н. вставки являлся геном М.

Активность СМСазы, определяемая с помощью конго красного в клоне 72. А, клон 72; В, Е. coli НВ101, с. плаамидой рАТ153

Рис.1.

aellulolyticum 86W-16. Очищенная ДНК фрагмента 2.4 т.п.н. и ДНК

оо

Фага Л, растепленная по сайту Pst I, Онли помечены «-~*-Р-ОТР. Фрагменты ДНК в агарозном геле с бромистым этидием (Рисунок ?.. ])

Рис. 2. (JayaepH-гибридизация между геном тсепА и хромосомой M. aellulolyticum 86W-16 и 86W-6, расцепленной по ВатН\, сокращенный бромистым этидием 0.75% агароаный гель; и, Радиоавтограф. Линия А, Стандарты (АДНК/ PstI); В, Фрагменты хромосомы M. aellulolyticum 86W-6 по BamHl; С,Фрагменты хромосомы M.cellulolyticum 86W-16 по BamHl; D, Фрагменты пдавмиды рССТ72 по BamHl.

были перенесены на нейлоновую мембрану. Полоски мембраны, содержащие ДНК фага А, рестрицированную по Pst7, были вырезаны из мембраны и гибридизовались с пробой ДНК /PstI; в то же время, другая мембрана гибридизоватгая с пробой 2.4 т.п.н. ДНК. Три части мембраны были соединены перед началом авторадиографии. На авторадиограмме (Рисунок 2, II) в геноме M. cellulolyticum 86W-16, рестрицированном по BamWI (Рисунок 2, I. С), проявилась единственная полоса 2.4 т.п.н. (Рисунок 2, II. С) согласующаяся с величиной Rf полосы, соответствующей вставке 2.4. т.п.н. как. позитивному контролю (Рисунок. й, D). Яг от результат доказывает, что вставка 2.4 т.п.н., содержащая ген wceriA, происходит из генома M. œliulolyticum 86W-je. Уникальность позитивной полосы свидетельствует о том, что тсепА имеет небольшую гомологию с другими целлмавннми генами M. ce]lulolyticum 86W-16. Рисунок 2 (дорожка В) также показывает, что тселА не имеет гомологии о геномом Ai. cellulolyticum 86W-6 (Oheng Y.R. et. al, 1988).

4. Рестрикционное картирование, субклонирование и экспрессия meenА в E.coli.

Для того, чтобы определить локализацию и ориентацию гена тсепк на фрагменте 2.4 т.п.н., фрагмент был картирован более чем тридцатью различными рестриктазами. Была проведена серия субклонирований (Рисунок 3 и рисунок 4).

Первоначально 2.4 т.п.н. вставка была с-убклонирована плазмиды PCCT72 в ВатНI сайт плазмиды pLIC19. В результате были получены две гибридные плазмиды pGenl и pGen2 с различной ориентацией вставки. pGen2 вызывала СМСазную активность в несколько раз выше, чем pGenl. Учитывая вклад в экспрессию промотора PJac, мы предположили, что транскрипция гена тсепк происходит в направлении от ВатНЦО) кВатН\ {,?.). Делеция около 350 п.н. pGenl по Sml (pGenldSm) не повлияла на экспрессию гена. Это свидетельствует,

CUCase aoti-Tity(balo)

pCCT7Z pGen2 pCenl pGenldSm pGenldSc pGenldNH рСепЗ pGen4

B(o) sm So if в(г) ++

1—r^rPtet • в(г)

B(0) Sm Sa Я +++

1—-л-Р]ао

B(0) Sm So N В(2) +

Plao" ■ )

Sm So N B(8) +

Plto^—Л

So N B(2)

B(0) Sm Plao-—1

Sc N/H +

Wao-*—{ *

Sm So N/Sm +

Sm So N/Sm

L-^.Plao +++

0 0.6 1.0 1.5 —--w Z.0 2.4

maenÁ

Рис. 3. Активность СМСазы (определяемая с помощью конго красного) различных клонов. В, ВатНI; Н, Hindi 11; N, Nru 1; Sc, Sac!; Sm, Smal.

что в составе делегированных 350 п.н. отсутствует промотор-подобная регуляторная последовательность. Однако, деления Sun 1-фрагмента (pßenldSc) абсолютно инактивиповала ген шсепА. Это показало, что стартовая область mcertk расположена между сайтами Smai и SacI, и, кроме того, что SacI сайт расположен внутри области, определяющей каталитический домен. Делеция Nru]-HindUl не снижала каталитической активности. Все полученные плазмидные конструкции, выращенные на среде М9 с IPTG, не индуцировали СМСазную активность.

Далее фрагмент Smal-Wrul (1.3 т.п.н.) был субклонирован в Smai сайт плазмиды pU019. В результате получены плазмиды рбепЗ и pGen4. Как и ожидалось, pGerrà и pGen4 экспрессировали СМСазную активность аналогично гатазмидам pGenl и pGen2. Во всех случаях не было получено доказательств изменения целлюлазной афинности. СМСазные активности Клона 72 и субклонов (включая полученные делецией) приведены на рисунке 3.

5. Определение распределения ферментов в Е. coli TGI, несущей pGenS. Определение целлобиазы.

Е. coli TG3, несущий pGen2, был выбран для изучения локализации продукта гена тселА, МсепА, в клетках Е. coli. Предполагалось, что более 80% СМСазной активности находилось в периплазматической фракции, а менее 20% СМСазной активности были во внеклеточной фракции (<5%) и в клеточной фракции (10-15%). В этих трех фракциях не было обнаружено активности авицелазы, целлобиазы и ß-глюкозидазы. Отсутствие целлобиазной активности в интересующем нас клоне было позднее подтверждено методом с использованием 4-миР-В-0-целлобиопиранозида (MUC), путем инкубации клона pGen2 на LB агаре, содержащем MUC, в течение 3 дней. Эти данные также отражают тот факт, что тселА кодирует только эндоглюканазную активность, что соответствует результатам анализов нуклеотидной последовательности (ниже).

6. Сиквенирование гена.

Стратегия сиквенирования основывалась на данных раздела 4.

Определение нуклеотидной последовательности начиналось от SacI сайта и проводилось в двух направлениях (Рисунок 4).

BamHI Smal Aval SacI Clal Nrul Apal BaaHI

< I I I ■ I I I ¡I 1

■ста TGA

100bp

Рис. 4. Рестрикпионная карта и стратегия оиквенса гена incenk.

Его результаты представлены на рисунке 5. Компьютерный анализ нуклеотидной последовательности предполагаемой области кодирования белка показан наличие единственной протяженной открытой рамки трансляции (позиции 189-1562), которой предшествовала последовательность 5'-AGGAGQ-3', находящаяся на расстоянии 9 нуклеотидов от нее (позиции 174-179) и которая, скорее всего, представляет собой сайт связывания с рибосомой. Следовательно, структурная часть гена шсепк, состоящая из 1374 п.н., кодирует белок с молекулярной массой около 46 742 Да. На одну пару далее стоп-кодона TGA была обнаружена последовательность, которая может образовывать несовершенную шпилечную структуру, имеющую длину стебля 15 п.н. и петлю 2 п.н., сходную с rho-независимыми терминаторами Е. coli.

Другая 14 п.н. несовершенная палиндромная последовательность TGGGAACüCTOCCA (позиции 135-148) была обнаружен на расстоянии 41 п.н. до стартового кодона трансляции гена тселА, GTG. Эта последовательность на одно основание отличается от идентичного инвертированного повтора длиной 14 п.н. (TGGGAQOaCiTCXJCA), оОнаруженного практически во всех целлюлаяных генах Actinomycetes. Было показано, что ятот сайт является сайтом связывания белка, который, как предполагается, регулирует индукцию в Т. fusca. Таким образом, представляется возможным, что большинство целлшаз у

- у -

cccgggaggtgctggcctggtagcgccgtcatgcctggccttcctcccacgcccgcttcg 60

tcgaccgtcgccagattacggggcagtggccgacgttcacatcttggcatcgaagcctgc 120

ctccgttaccgtcgfcgggaacgctcocatgaacttagatacgtctatgtgafccaggagga 180

vjjijjjjjj a_ajlj>_v_t_a_ 17

aacaggacgtшп•atcctctcrrg(юcgccgcaggtca6cggтеatcagcctga«mig 240

v_a_g_l_a.aagvlrvggvagtvs ar? га^^адггстахжпшж зоо

6slyrdpssavvrwvaahpg 57 (wtcwtctaüotküacccmgtrc^astogtccgctgggtcgcx^gmccrasgog 360 dfraavirekiasqpqarwy 77 АСТГСС6Т6(ЖСССетСАТ(Ж6СеААА^5АТ(т;АШ?АШ^А6бах;бСТбаТАС6 420 anfnpst i qsevsaf i gaah 97 еПЛАГГГТСАА(тЖ.ШГ;САШ;АСТта 480

s a q (} i p v l, s v y e i t n r d с g g 117 cg6(^agcagatcccggtgctgtcggtcta(^gatcaotaaccgggactgcggcggcg 540 ahaggapdlnqyqtwvshfa 137 CXXÍACGreGGTGGGHKGrXGGACKTCAAreAGTAt^AGAOTGGGrrfiTaiAACTTCGOCO 600 rglghqtvli iletdslalq 157 6С66СГО'«^АА(ЖАМгаШаЯ6АТСАТСЭТ^ 660

tclstselnarhqals tatq 177 cctgtctgagc АПП agcg agcto a ac^conroaacoaggcgctctxjcacggogacccaga 720 tiksahphakvyldgghstw 197 c^atcaagtcggccaacímjcaacgccaaggtctacctcgacggcggcc actccacctgsa 780 nsawdtanrlraagvqyadg 217 acagcgccaa(maca(xigccmccggct(xjgcgcggccggcgtgcagtacgccgacggct 840 ff tnvsnfhptsseanfgra 237 tcttcaccmcotgtc^amcmfieccara^^ 900

visalhgmgisgkrqvidts 257 tcatctom7ra^caaa3gcatggggatctgcgggaaacggcaggtcatcgacaccagcc 960 rnggaa gdwcaddntdrr i g 277 GKM(U3GOGGAGCGGCCGG<%ACT<5Gra 1020

qypttntgdan i daylwvkp 297 agtaccccac6acgaacac£®gcgacgckmcat(^tgcgtacctctgggtgaagccgc 1080 pgeadgcatrgsfqpdlafs 317 c®gg№aggí:g6acggctgcgctacacgcggctcgttccagc^^ 1140

l a n g v p n p jp _г _t _a jp _p _t _t _n _r _a _d _ 337

1200

d _r _p _p _t _t a _p _p t_t_d_t^_t_t_a_p_p_t_ 357 AC(^(^G(»CACCA«WX^GCO^ACGACraACA(^^GACCACGGCGCCCC£^CCA 1260 T_P_P_PASHSLSASVA I tqwhg 377 ШЖШ;««»ХизетААСБШ'СТСТСС^ 1320

gftasvhvtagsaihgwtvt 397 gmcaccgcogcgtgaacotcacggcmírtcc^atcaatogctggaocctgaccg 1380 valpggaa i tgtwnaqasgt 417 togcgctgcc(u^mgcgc(xk^atcac 1440

sgtvrfthvgyn gqvgagqt 437

1500

tnfgfqgtgtgqgatatcaa * 457 tt^cttcwrttccagggcaeaigcace^ 1560

gacccgtatcgtagtcccgcPEgcccggtacggtacggaacgtcctcggcgcccttccgggl621

Рис. 5. Нуклеотидная последовательность гена тсвпк и соответствующие аминокислоты полипептида МсепА. Подчеркнуты последовательность SD (AGtí4GG), палиндромннй участок, находящийся после 8' концевой области и перед стартовым кодовом (6'Ш) 0RF. Предполагаемый сигнальный и линкерннй участки подчеркнуты прерывистой .линией.

Acíinomycetes используют одинаковый механизм регуляции.

Нами не обнаружено промотороподооннх последовательностей, характерных для Е. noli или соответствующих бео последовательности, на участке длиной 188 п.н.. предшествующему стартовому кодону и на последовательности, элиминированной ранее. Однако, все фрагменты, несущие интактный meeпА ген или потенциальный каталитический домен, могли зкспрессировать СМСазную активность в обеих ориентациях под lac промотором плазмиды PUC18/19 в Е. coli и/или tipA промотором плазмиды pTOl в Streptomyces (ниже). Эти данные наводят на мысль, что определенный промотор Micromonospora может узнаваться системой экспрессии Е. coli, но эта последовательность не похожа на консенсусные последовательности Е. coli. Предполагается, что данная промоторная последовательность Micromonospora работает в Е. coli. Это предположение согласуется с результатами Conway et al.(1987) и Wilson (1992).

Аминокислотная последовательность МсепА, соответствующая последовательности гена /псепА, показана на рисунках S и 6. М-концевая последовательность белка МсепА содержит потенциальную сигнальную последовательность из 23 аминокислотных остатков. Линкерная область, включаюшэя 37 аминокислотных остатков, богатая пролином и серин/треонином, находится в средней части МсепА. Удаление 87(90%) аминокислотных остатков с С-конца МсепА не снижало СМСазную способность к галообразованию. Это показывает, что каталитический и целлюлоза-связыващийся домены расположены с N- и С-концов МсепА, соответственно.

7. Нуилеотвдный состав mcenA.

ORF гена mcenA состоит из 1374 нуклеотидов, из которых 413 (30.06%) - гуанин и 566 (41.19%) - цитозин.. Таким образом, % G+C (71.25%) гена mcenA точно соответствует показателю 70-75(Тш), определенный для хромосомлой ДНК Micromonospora.

8. Встречаемые кодоны гена mcenA

Встречаемые кодоны анализировали на компьютере (табл.1). Выло показано значительное количество 6+С состава (94.82) в третьей

- и -

Таблица 1. Встречаемые кодоны гена глее л А.

аа codon No. aa codon Ho. aa codon No.

Ala А gca 1 "Gly fi GGA 2 Pro P CCA 0

Ala А ест 2 6ly G GGT 5 Pro P ест 0

Ala А GCG 19 Gly G GGG 4 Pro P cog 19

Ala А GCC 47 Gly G GGC 40 Pro P cgc 9

Arg К AGA U His H CAT 0 Ser S " AGI 1

Arg R AG6 1 His H CAC 2 Ser S AGC 11

Arg R csa U lie I ATA U Ser S TCA 1

Arg R CGT 2 Ile I ATT 0 Ser S TCT 1

Arg R CGG 6 Ile I АТС 19 Ser S TCG 10

Arg R CGC 14 Leu L m Ü Ser S TCC 11

Asn H "AAT" Ü Leu L TTG 0 Иг T АСА 1

Asn H AAC 35 Leu L СТА 0 Thr T ACT 0

Asp D «AT 1 Leu L CTT 1 Thr T ACG 14

Asp D gac 19 Leu L CTG 9 Thr T acc 35

"Cys С ttit 1 Leu L ctc 12 TrD W TGG 9

Cys С TGC 4 Lys К Ш 1 Гуг Y u

"Gln'Q" CAA 1 Lys К AAG 4 Tyr Y TAC 9

Gin Q CAG 20 M "ÍTG " 1 Val V GTA 0

Phë F ТГГ 0 Val V GTT 1

Glu Б GAA 1 Phe F TTC 14 Val V ctg 12

Glu E GAG 6 Term & TGÂ" 1 Val V CTC 18

позиции кодона. Высокое содержание GfC также обнаружено в-третьей позиции кодона для генов £2 и Е4 из Г. fusca (93% и S¿% соответственно). Высокое содержание G+C в третьей позиции является типичной характеристикой для большинства видов Ас и потуск tes, на основе чего могла быть предсказана ориентация гена. Это указывает на правильность нуклеотидной последовательности.

9. Гомология полипептида МсепА с другими целлмлазами

Аминокислотную последовательность гена тсепА сначала сравнивали с полипептидом CelA из М. Ыврога. Оонаружено значительное сходство между двумя выравненными аминокислотными последовательностями. Показано, что 70% аминокислот полипептида МсепА и 71% Се]А похожи (45% - идентичны) (Рис.6). Определен гомологии методом »Dot. Mat.rix" такте показывав высокую идентичность (рис.7). в соответствии с этим полипептид МсепА входит с семейство В, предложенное Генриссатом iHenrissal el al 1ияч) Таким образом, семейство В включает полипептид СепА из С "find CelA из М. bispora, Е2 из Т. fusca, CasA ив Streptcmyces

sp KSM-Q, CBHII из Г. reesei, и полипептид МсепА из настоящей

МЬ 1 Мс 1

:* ** *

**::* : :* * * ** * :

МЬ 50 К7АА№РШРетТУ11®Е1ААУРТаЕН?А»ГУ№Р5ТУКАЕУБ&ТУ6/Ш1ДА0ГЛ ****** * * Ж**::** * :**:**;****: *::*** * *

Мс 51 КУААНРСТ)РКАДУ1ККК1А50РвАК>Г?АН?НРЗТ193Е7БДР1СЛАКЗА?Я1

МЬ 102 Р1МУУТАЮ5ЮГОССаР5АеаАРШТАУВАК11)ЕХААС1.ККЕРАУ11ЬЕРПДЬ *:: ** : ****** ***** * * ** * :**** * * Мс 103 НУЬ5УТЕ1ТНВЖ^АНАССАРП1Л9Твт5КЕАЕС1^КСГт.11ЬЕТВ5Г.

МЬ 154 РХНТИСЖЗРБЕ-вАЕУвАБМАТАСЖЕРКААББОАКУТКОАИШАНТРАВЕНА : * *:* *****;* * * **** *:** * * : * Мс 155 АЬОТ-С1.5Т5ЕЬ11АЕНвА-ЬБТАТОТ1КБД1а,ИАКУУШЗС!НБТНН8АН1)ТА

МЬ 205 БНЬВбАтАНБАШЗДЬНУЗНУЕУТЗвЫБУАХвТЬБА!-В-А-БНЬВАУЮ ***:* : *** ****: ** ::: *:**: * : * * *** Ис 205 НКЫгйА0У-аУА1)ЗГ{ТНУЗНКНРТ53ЕАНРСЕАУ1БАХЛааа1Б(ЗКЕ(3710

МЬ 254 ТЗИШНСРЬаЗЕИС—ВРР0КАТвТН5ТТШ'(Л)РА10АгЪИ1К1теЕА1)СС1 Мс 256 ТБКНв-САА5-ВДСАВВНТВКК1СвТ1ТТНТв0АН10АУЬИУКРгаШХЗС-

МЬ 304 АТРСТРТРРВАУДАИНАА-РРГУНРЯРТРБ----ТгаРЯРЯОСТРПЗРБРЗ

****** *: ** *** * * *:*:*:* Мс 305 АТ1Ю5ГОРР1|А^ЗЬАН&УРМРРТТАРРТТМВАРПНРРТТАРРТТРТРТТАРР

ИЪ 351 Е£вРРА(ЗКАСЕАТУАЬУИв»а^В,0АЕ\ГГУКНТв35Р1НЗ>ГГУв>т1Р5вдЗ : **** : *: *; ** *** * * * *: * ****** ** * ис 357 г!1ЕЕАаяйЬ8АЗУА1-таннвевтА8Уну--тАе5А1на»гпт?А1<геадА

МЬ 403 1ТвЬИН01)Ь5ТБв511ГГУВНУЗММвНТРАаЗЗТБ?еЕЪе5аТС<1Ь3551ТСЗА ** **: * : * ** *****:* *** *;**** : ** * Мс 406 ЗТаТНИА0А8аТ5вТУВт1УСТ№0УСАСвГгаЕв?0атеГв«-6АТАТСАД

Рис. 6. Совпадения в аминокислотных последовательностях между зндоглюканазами МЬ и Мс.. Предполагаемые сигнальные и линкерные участки МЬ и Мс подчеркнуты. Идентичные и похожие аминокислотные остатки обозначены "*" и ":" соответственно. МЬ, полипептид Се1А М. Ыврога•, Мс, полипептид Мс-епА М. се11и1о1уЫсит 86«-16.

НСЕЯА

161

241

321'

401"

385

mbcela

Рис. 7. Определение гомологии между белками MbcelA и МсепА методом "Dot Matrix". Длинна с.егмента=6; Минимальная отметка=б5; Масштаб=2; MbcelA 1-456; МсепА 1-45?.

работы. Не было обнаружено строгих гомологии полипептида МсепА с целлшазами из других семейств. Значительное сходство (70%) и идентичность (45%) были обнаружены при сравнении аминокислотных последовательностей МсепА и MbcelA. В дополнение, большое соответствие в строении функциональных участков белка, таких, как сигнальные, линкерные, каталитические домены (рис.6), говорит о общности между полипептидами МсепА и MbcelA.

10. Предсказание активных участков полипептида МсепА

В целях поиска активных участков в полипептиде МсепА, аминокислотные последовательности каталитических доменов тести целлшаз семейства В выравнивали с помощью компьютера (программа "Multiple alignment"). Все пять консервативных участков (Ds в участках 1, 3, 5 и 6; Н в участке 3), которые впервые обнаружены в

PI 184 ----RAWQAASGTDKALL.EXIALTPQAYWVGNWADASBAQAEVAD.YTGKAVAAGKTP

P2 SI----WVAANPGDFRAAVIKEKIASQPQARWYA. NFNPSTIQSK. VSAFIGAANSAQQIF

F3 50 ----HTAAHPHDPETFVIKDKIAATFTGRHFA. HYNPSTVRAE. VDAYVGAAAAAGXIF

F4 47 ----HVRNifPRDPETFVIEDKIASVFQGTHFA. HHNPGQITGQ. VDALMSAAQAAGKIP

P5 86 GVEAWLDAHPGDHKAPLIVEKIGSEPEAYWFAGAYHPGTITQQVAEyTSKRQQPPGQIiP P6 145.....ATAAAAVAKVPSFH .KLDTLTKTPIiMEariiADXRTAHKHGGHYAGaF.......

PI 238 P2 105 P3 104 P4 101 P5 146 P6 191

PI 288 P2 157 P3 158 P4 153 P5 198 P6 250

PI 338 P2 211 P3 211 P4 207 P5 252 P6 310

PI 375 P2 251 P3 248 P4 245 P5 290 P6 370

Motif1

. SHSGGGVSE. SEYARKTOTVAaGIKGNP .¡TV

HOTViLI

HotifZ

LVYYAIPGRDCG LSVYEITHRDCG HWYAMPHRDCG LV7YKAPGRDCG WPYHIPFRDCG Y. YYDLPDRDCAfiLASHGEYSIADGGVAKYKHYIPTIBQiyVEYSDIf

IVILEPDAI

.GAHAGGAPDLHQYQTWVSNFARGLGNQTV^IILETDSl . GPSAGGAFKHTAYRAWIDEIAAGLKNRFAVIILEPDAI . KHSSSGAPSHSAYRSHIDEFAAGLKNRPAYII VEPDLl|£ . NHSGGGAPSFAAYAEWSGLFAAGI^SEFVjVYVLEFDAI

***+

*

LGDGSGQGDRVGF____LKtAAKSbTLKG. AR.

QT. CLSTSEIjNABNQA. LSTATQTICSAH. PH, HTNCMSPSEQAEVQAS.AVGAGKKKAAS. SQ HSSCHQHVQQEVC>E. T. KAYAGKALKAGS. SQ-ID. CtiDHQQKAERtiAA. LAGLAEAVTDAN. PE, LVTNLGTPKCAHAQSAYLECIHYAVTQLHLPHVi

Hotlf3 'IDAG]

;hs

'FDAGHDAl ¡IYFDAGHSA: IVGHSAl 'LPAGHAG1

. - .+++*.*.+.

...SVDTPVHEb.. .. .SAHDTAHBL.. -..PADEKASRL..

---SFQQHASHti..

---APAAIAPTL..,

1WPAHQDPAAQLFAI . . *

. -MQVGF.: .-EAAGV ..BGAD1 ..QQADI . .VEAGI VYXHASSFi

MotlfS

ALNTSHYi: TFTNYSNF. IALNYSHY. IATHTSKY. IATNISNY. LATKYAKY UGHHll

?IDTSKNGNGS.N /IDTSRHGGAA.. ilDTSRHGHGP WJ ITIDTSEHGHGPiG rSRHGHGF.. gllTDQGSSGKgPtrGQQqWGDHC. +.*.+*.*... ____

&...........DSKAYGQ.. .«ISQRLGGKK1

.........SEANFGRAVISALNGMGISGI

.........GLISYAX..-SVLSAIGASHI

i...........DE?AYAK-. -AVLSAIGSPSI

.........DETAYAS...AVIAELG.GGI

PPSYTQGHAVYNEKLYIHAIGPLLAHHGKSHi

*+ .. +......* .

HotlfS_

.. -GEWC.. KPEGRALGEKPVAVHDGSGlUDALLHVIiLFGESDG ...GBWCADDHTDRRIGQYPTTNTGDAKI DAYLW7KFPGEADG .. .SEWC.. DmJRATGTHSrrDTGDPAIlDAFLWIKPFGEADG ..-NEWC..DPSGRAIGTPSTTNTGDPMIDAFLWrKLPGEADG

..TAADLVHTKTVTRC..PG

NVIGTGFGIRPSANTGDSL)

.......+___

DAIXHITCPVTDGG DSFVWVKPGGECDG

PI 424 ..........................................(424)

P2 305 .ATBGSFQPDLAFSLAHGVPN (324)

P3 303 IATPCTFVPDRAYELAMHAAP (323)

P4 289 IAGAGQFVFQAAYEMAIAAGG (319)

P5 333 .DGFV.FSFPK.LQLPRXPAA (350)

P6 437 ...............TSDSSA (432)

Рис.8. Консервативные аминокислотные домены у целжшаз семейства В. Р1, СепА из С. fimi; Р2, МсепА из М. eellulolyticum S6W-16; РЗ, CelA из М. bispora; Р4, F.2 из Т. t\isca; Р5, nasA из Streptomyces sp. KSM-У; Р6, UBH11 из Т. reesei. Участки с шестью идентичными или похожими аминокислотами, а также пятью или четырьмя похожими обозначены символами "*•', "+*• соответственно.

PI, P5 и Рб и предсказанные как активные каталитические центры (рис.8). Аминокислоты D199 (участок 1) и D245 (участок 2) из Рб необходимы для проявления каталитической активности, что доказано с использованием сайт-специфического мутагенеза. Так, два предсказанных активных участка в полипептиде МсепА (Р2), как и другие (Р1, РЗ, Р4 и Р5) должны быть D134 и D152, что следует из анализа гомологии.

11. Субклонирование и экспрессия гена тсеп\ в S. lividans ТК&4

Фрагмент, вырезанный по BamHI-BamHÏ, величиной 2.4 т.п.о. вводили в уникальный BamHl сайт рТ01, получая при этом две конструкции рСС13 и рСС14 с различными ориентациями вставки. Для удаления участка BamHl-Smal (около 350 т.п.н.) и конструкции гена тсепА в рТ01 по BamHl, фрагмент размером 2.1 т.п.о. по Smal-Smal был субклонирован из pGen2 в участок pUC18, получая при этом рСС81 и рОС82. Затем переносили фрагмент 2.1 т.п.н. из рСС81 по BamHl-BamHl в BamHl участок рТ01, получая при этом новые конструкции pCCll и рСС12 (рис.9).

Четыре производных pTOl - pCCll, рСС12, рСС13 и рСС14 были трансформированы в протопласты S. lividans ТК64. Трансформанты отбирали на среде SR6 с 25 jig/ml тиострептона. Было получено большое количество трансформантов, названных, соответственно, SL11, SL12, SL13 и SL14. Инокулировали указанные трансформанты на верхний ММС-агар, содержаний и не содержащей тиострептон. Инкубировали в течение семи дней при 30°С. Активность СМСааы определяли с помощью конго красного. Результаты (рис.10) показывают, что по сравнению со S. iividans ТК64, обладающей небольшой активностью СМСазы, конструкции SL12 и SL14 проявляют большую активность, a SL11 и SL13 чуть меньшую. Различие в экспрессии зависит, по-видимому, от разницы в ориентации вставок ((SL11, SL13) и (SL12, SL14)). Как и ожидалось, конструкция со вставкой 2.4 т.п.н. и укороченная вставка 2.1 т.п.н. имеют близкий уровень экспрессии. Не отмечено разницы в уровнях экспрессии в присутствии или отсутствии индуктора (тиострептон) (данные не показаны).

- 1 р. -

рСС13

рССН

рссгвг

рССН

рСС12

Рис. 9. Клонирование гена шсепА на рТ01 для интеграции в хромосому 5. Цузаапз ТК64.

Рис.10. Активность СМОазы (определяемая с помощью конго красного). 1, 51,11; 2, 51ЛИ; 3, НИЗ; 4» КЬ14; О, к, 1т<1апя ТКВ4.

12. Определение включения гена шсепЛ в хромосому 5. /¿Ис/алз ТК54

Хромосомная ДНК была выделена из трансформанта 31.11 и природного штамма К. Цутс1апз ТК64. Пни были обработаны ВатН1 при Я7°(! два часа и нанесены на агарозный электрофорез, который проводили в течение ночи (рис.11, ]). Далее ДНК переносили из геля

Рис.11.

С'аузерн гибридияация для определения

включения гена тсепА в хромосому 5. ЬЧмсУагк. I. Электрофорез в 1% агарозе; И

Радиоавтограф. А,

Фрагменты по ВатН] хромосомы SL11; В, фрагменты по ВатН\ хромосомы Цу1(]ап5.

- 2.1кЬ

на нейлоновую мембрану и гибридиэовали с 5яа/-5ас/ бйО т.п.н.-фрагментом из гена тсепА, меченным «-3?-Р-С!ТР. Результат (рис.11, 11. А) ясно демонстрирует существование ВатН1-ВатН1 фрагмента, размером 2.1 т. п.н. в хромосоме 5Ш по сравнению с отрицательным результатом для хромосомы .9. JivJdaл5 ТК64 (рис.11, и. В). Эти результаты показывают, что активность СМСазы в SL.11 определяется вставкой гена тсепА в хромосому ЭЫ1. Наши результаты также показывают отсутствие значительной гомологии между геном тсепА и целлмазнмми генами Цу1с1апз.

13. Определение участка включения в хромосому 5. 11У1'{1ап5 ТКВ4

Хромосомные ДНК из ЯШ, .51,12, 51.13 и 51.14 были обработаны %} 11 при 37°С в течение 2 часов. ДНК после обработки были очищены

фенолом и хлороформом, обработаны лигазой Т4 и трансформированы в штамм Е. coli TGI. Было получено от одного до пяти Арг трансформантов. Рестрикционный анализ плазмид pCCllBS, pCC12BS, pCCISBS и pCC14BS, которые были получены субклонированием соответственно из SL11, SL12, SL13 и SL14 полностью подтверждает, что включение происходит между at¿В участком хромосомы S, lividans ТК64 и atfcP участком рТ01. На рисунке 12 показаны участки включения и рестрикционные карты по БатН1 и Psfcl для pCCllBS, pOCJl 2BS, pCCISBS И pCC14BS.

Bgl

в

В Р

в AttBB• Bei

SL ТК64 Chromosome

pCCllBS attP"

pCCIZBS attP'

pCCISBS attP'

pCCHBS attP'

В

В UpA P

P bUT*

В tlpA P

P Ыа

В UpA P

P Ыа

В UpA P

P bla

аюепА

attP attP attP attP

Рис.12. Участки включения и ориентация гена тсепк в хромосоме S. lividanns ТК64. В, BamHl, Bgl, Bglll, Р, Pstl.

В настоящей работе достигнута экспрессия .гена тсепА в Streptomyces sp. Экспрессия одной копии гена тсепА гораздо менее эффективна, чем при использовании многокопийных плазмид pIJ702 или р1Лй85. Увеличение активности СМСазы в трансформантах SL11 и SL13, несущих гены тсепА, но в рааных ориентациях к промотору tiрА, связано о естественным промоторным участком, работающим в S. lividans ТК64. Это подтверждается данными по экспрессии целлюлазного гена £5 из Т. fusca в том же хозяине.

Не достигнута индукция активности СМСазы с использованием IPT6 как на среде М9, так и на ММС, возможно из-за большой концентрации глюкозы (1%) в обоих средах, которая активирует механизм индукции цикло-АМФ, что однако не препятствует транскрипции, даже если щюдукция целлюлаза регулировалась в природном штамме М. ce]lulolyticum 86W-16.

в

в

В целях получения сверхэкспрессии гена rmmiA в основных фомьплленных штаммах, необходимо создать эффективную систему тегуляции или использовать Другие подходящий векторы. 1редпринимаются попытки точного переклонирования открытой рамки считывания из клонированного фрагмента. Это должно привести к зпвданию аффективного генно-инженерного штамма.

ВЫВОДЫ

I. Клонирован целлюлазный ген /песпА из М. œllulolyticum 86W-16. Определена его нуглеотидная последовательность и проведено рестрикционное картирование ; !. Показано на основе анализа гена теспА, что кодируемый им белок входит в семейство целлюлаз, обозначенных Б, имеющих значительную гомологию-<. установлены обширные участки гомологии между аминокислотными

последовательностями иолииептидов МеспА и CelA из M. bispora; I. Показано, что промотор из Micromonospora может узнаваться и функционировать в Е. coli. Впервые ген целлюлазы из Micromonospora sp. был клонирован и экспрессирован в Е. coli и Streptnmyces sp.

i. Достигнута экспрессия целлюлазного гена из M. cellulolyticum 86W-16, интегрированного в хромосому S. Ii vi dans.

СПИСОК РАБОТ, ОПУБЛИКОВАННЫХ ПО ТЕМЕ ДИССЕРТАЦИИ

, Cheng YK, К Lin, 7. Zhang; arid BS Yu(1988). Utilisation of Cellulose by Micrnmonosixjra spp. I. A Newly isolated Micromonospora spp. No. RfiW-fi, RECENT ADVANCES IN BIOTECHNOLOGY AND APPLIED BIOLOGY, Proceedings of 8th International Conference on Global Impacts of Applied Microbiology (August 1-5, 1988, HONG KONG), pp. 451-460. Ed. ST Chang, KY Chan and NYS Woo.

, Lin F, G Marchenko arid YK Cheng(1994). Cloning and sequencing of an endo-йИ ,4-glucanase gene mcenA from Micromonospora cellulolyticum 86W-16. J. Indus. Microbiol. 13:344-350.

, Lin F (1994). Recent advances in biochemistry and molecular

biology of cellulases. Life Sei.(Chinese). 6(l):18-23.

4, Lin F, 6 Marchenko, YD Tsygankov and YR Cheng1 (199ft). Further analysis and expression in Escherichia coli of an endoglncana.se gene from Micmmnnospora cellulolyticum. (to Ix published).

(5, Lin F, YY Lian and Yk Cherig(1995). Expression of an endog)ucanase gene of Micromonospora cellulolyticum in Streptomyces lividans chromosome by introduction of an integrative plasmid. (to be published).