Бесплатный автореферат и диссертация по биологии на тему
Сравнительный анализ аминокислотных последовательностей белков инициации репликации вирусов, бактериофагов и бактерий
ВАК РФ 03.00.03, Молекулярная биология

Автореферат диссертации по теме "Сравнительный анализ аминокислотных последовательностей белков инициации репликации вирусов, бактериофагов и бактерий"

РОССИЙСКАЯ АКАДЕМИЯ МЕДИЦИНСКИХ НАУК НИИ ВИРУСОЛОГИИ имени Д.И.ИВАНОВСКОГО

На правах рукописи

уда

ИЛЬИНА Татьяна Викторовна

СРАВНИТЕЛЬНЫЙ АНАЛИЗ АМИНОКИСЛОТНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ БЕЛКОВ ИНИЦИАЦИИ РЕПЛИКАЦИИ ВИРУСОВ, БАКТЕРИОФАГОВ И БАКТЕРИИ

03.00.03 - Молекулярная биология

Автореферат диссертации на соискание учэпой степени кандидата биологических паук

Москва 1992

:) г

/

Работа выполнена в Институте микробиологии РАН.

НАУЧНЫЙ РУКОВОДИТЕЛЬ -

кандидат биологических наук Е.В.Кунин

ОФИЦИАЛЬНЫЕ ОППОНЕНТЫ -

доктор медицинских наук, профессор член-корреспондент АЕН ГО А.Д.Альтштейн

кандидат биологических наук H.A.Селиванов

ВЕДУЩЕЕ УЧРЕВДЕЖЕ - кафедра вирусологии биологического факультет! МГУ

Защита диссертации состоится " " 1992 г.

в часов на заседании специализированного Совета Д 001.20.01

при НИИ вирусологии им. Д.И.Ивановского РАШ по адресу 1230S8

Москва, улица Гамалеи, 16

Автореферат разослан " " 1992 г.

С ( диссертацией можно ознакомится в библиотеке НИИ им. Д.И.Ивановского РАМН.

Ученый секретарь Специализированного Совета кандидат медицинских наук

А. ¡.¡.Чуковский

Актуальность проблемы

Развитие техники молекулярного клонироввння и быстрого секзе-шфоввнпя нуклеиновых кислот привело к накоплении огромних по объему баз данных, содержащих нуклэотидаые и аминокислотные последовательности десятков тысяч генов и белков. Поскольку биохимическое описание белков осуществлялось прежними темпами, число неоха-рактерпзованных белковых последовательностей неуклонно увеличивалось. В результате в качестве самостоятельной отрасли молекулярной биологш стали развиваться теоретические метода обработки биологической информации. Применение этих методов позволяет делать пред--сказания о функциях белков на основе сравнительного анализа их аминокислотных последовательностей, что значительно ускоряет н облегчает биохимические исследования.

Процесс репликация - один от центральных процессов клеточной гшзнедеятельности, благодаря ому осуществляется передача генетической информации потомству. С момента возникновения молекулярной биологии решшкативвыэ бели - объект ее изучения, В настоящее врем, когда о рештакотивных процессах накоплен значительный объем биохимических данных., настала очередь детальных исследований структурно-функциональных аспектов каталитической активности ропликативных белков, отражающих как общие, так и особенные черты строения и функциональной активности аналогичных белков из разных организмов. Проведение такого рода исследования требует изучения аминокислотных последовательностей учвствущих в репликация белков.

Цель исследования

Основной целью данного исследования было функциональное картирование т. е. установление функций отдельных белков, домо-тов.' или аминокислотных остатков репликативных белков бактерий, фагов и

вирусов с помощью методов сравнительного анализа аминокислотных последовательностей.

Конкретные задачи исследованния сводились к следующему:

1. Провести сравнительный анализ последовательностей праймаз п взаимодействующих с ними хеликаз, в том числе локализовать прай-мазный и хеликазный домены в белке д>4 фага Т7, и прайм^зный домен в бифункциональном белке Ра фага Р4.

2. Провести сравнительный анализ и выявить консервативные мотивы в последовательностях сайт-специфических эндонуклеаз нкосаэдрических бактериофагов, инициирующих репликацию по типу катящегося кольца. Провести поиск описанных мотивов в последовательностях плазмидных п вирусных белков, точно или предположительно принимающих участие в инициации репликации по типу катящегося кольца.

3. Провести сравнительный анализ последовательностей плазмидных, Фаговых и вирусных эндонуклеаз с одноцепочечными вндонуклеазами системы переноса плазмидной ДНК из клетки-хозяина в бактерии и растительные клетки.

4. Предсказать возмокные функции описанных консервативных мотивов. Научная новизна работы

Впервые с помощью сравнительного анализа установлены функций-нально-важные участки и отдельные аминокислоты в последовательностях праймаз бактерий, бактериофагов, вирусов. Идентифицирован! праймазные домены в бифункциональных белках бактериофагов Т7, ТЗ I . Р4. На основе анализа первичной структуры известнь'е на сегодня 2С последовательностей праймаз разделены на 4 различные группы. Взаимодействующие с праймазами хеликазы также составляют 4 группы, по составу соответствующие праймазным.

Описаны консервативные мотивы в последовательностях сайт-спо-цифмческих эндонуклеаз, инициирующих репликацию по типу катящегося

кольца у иносаэдричоских бактериофагов и одноцепочечных плазмид гршдголоаителышх бактерий. Описанные мотивы выявлены в последовательностях белков n31 парвовирусов, аы гегяшивирусов, что позволило картировать домены с эндопуклеазной активностью в этих полифункционалышх белках.

Предсказан способ репликации и идентифицированы участвующие в инициации репликации белки для вируса анемш цыплят, вируса гниения листьев кокоса, плазмид архебактерий п акталошщетоп.

Установление сходства незду последовательностями репликатив-нш белков вирусов, плазгад и бактерий позволяет распарить представления об эволюционных связях этих организмов. Практическая ценность работы

Проведенные исследования по идентификации функционально-вак-ных участков в последовательностях белков, участвующих в инициации репликации, дают основу для детального изучения структурных аспектов каталитической активности указанных белков с помощью экспериментальных методов, в частности путем сайт-специфического мутагенеза.

Предсказание способа репликации для малоизученных вирусных репликонов позволяет исследователям рационально организовать дальнейшие исследования этих объектов. Основные положения, выносимые на защиту:

1. На основе сходства аминокислотных последовательностей известные на сегодняшний день белки с праймазной активностью разделены на 4 группы. Показано, что хеликазы, взаимодействующие с праймазами в процессе репликации, такге образуют 4 группы по составу соответствующие праЯмазным.

2. С помощью сравнительного анализа установлено, что в бифункцио-.' нальных белках а>4 фагов ГЗ и Т7 и Ра фага' Р4 праймазный домен

составляет 244 и 299 аминокислотных остатка с N-конца соответственно. Проведенный анализ последовательностей одаокомпонентных а двукошонэнтшх праймаз/хеликазных систем бактерий и бактериофагов свидетельствует в пользу их общего происхождения.

3. Полученные с помощью теоретического анализа неохарактернзован-ных биохимически аминокислотных последовательностей вируса анемии цыплят САА, вируса гниения листьев кокоса CfDV, вируса спироплазыы SPV4. плазмид архебактерий и вктиномицетов данные свидетельствуют о их возможной репликации по типу катящегося кольца.

4. В результате сравнительного анализа аминокислотных последовательностей сайт-специфических эндонуклеаз, инициирующих репликацию по типу катящегося кольца у икосаэдрических бактериофагов и одно-цепочечных плазмид грамполонителышх бактерий, описаны характерныэ для зтих ферментов мотивы и установлены функционально-вашша аминокислотные остатки. ■

б. Характерные эндонуклеазшв мотивы обнаружены в последовательностях AL1 геминивирусов и NS1 парвовирусов, что позволило картировать домены, участвуйте в инициации репликации вирусного генома. Описанные мотивы такгсэ найдены в последовательностях сайт-специфических ондонуклеь-j, участвущих в переносе ДНК в процасЬа конъюгации бактерий. Апробация работы.

Материалы диссертации были изложены на I советско-германском симпозиуме по структурным аспектам ДНК-белкового взаимодействия (С.-Петербург, 1991), конкурсе научных работ молодых , ученых Института микробиологии РАН (Москва, 1991, 1992). Публикации.

По материалам диссертации опубликовано 3 работы. Объем и структура работы.

Диссертация включает введение, главы "обзор литературы", "материалы и метода", "результаты и юс обсуждение" п вывода. Работа изложена на t17 страницах машинописного токста и содерют 22 рисунка, 2 таблицы и список цитированной литературы из 247 наименований.

Кроткое содеркяние работы: Глава 1. Обзор литературы.

В первой части главы дается краткое введение в методологию сравнительного анализа аминокислотных последовательностей, иллюстрированное примерами применения описываемого метода. Во второй часта приводится характеристика способов инициации репликации. Глава 2. Материалы и методы

Все процедуры, связанные с выравниванием нуклеотидных и аминокислотных последовательностей, поиском сходных последовательностей в банке данных, установлением открытых рамок трансляции, проводились на персональном ког,тьютере типа IBH РО AT с помощью програшы Multalln (Corpet F., Франция), программы optal (Дончен-ко, Новосибирск) и пакета программ GeneBee (НПО "Комби", Москва). Исследуемые аминокислотные последовательности были либо валты из белкового банка, данных swissprot, либо получены трансляцией соответствующих генов, взятых из банка данных нукгэотидных последовательностей EffiL, либо почерпнуты из литературы.' Глава 3. Результаты и их обсуяденке

Так как ДНК-полимэразы не способны к синтезу цепей de novo, начальный этап репликации - инициация - состоит в создании затравки. В качестве затравки могут выступать различные структуры -олпгорибонуклеотиды; терминальные белки, ковалентно связывание первый дезоксимононуклеотид; тРНК; и просто родительская ДНК С' одноцепочечным разрывом.

Во шюгих изученных случаях затравкой слукат олигорибонуклао-гада. В некоторых системах репликации они синтезируются непосредс твэнно ДНК-зависимой РНК-полимеразой, но довольно часто для это; цели существует специальная РШ-полимераза, называемая прайшзоЗ В настоящее время в банках данных содержатся аминокислотные после дозательности праймаз Е.соИ И Salmonella tvphyeurt-m (dnaG) B.eubtilte (dnaS), бактериофагов T4 (gp61), P4 (Pa), ТЗ и T (gp4), ПЛ83ВДД ItSFIOlO ИЗ В. coli H рТР-Р2 ИЗ Tiobaotllu ferroaxlcLcme, ДрогЗЮЙ Saocharomtces cerevleta (pri1 И рг!2), КЫШ

мив mueouiue (prii) и вируса простого человеческого герпеса HSV (UL8 И UL52).

Анализ имепцнхся последовательностей привел к выделение груш белков, со значительным сходством внутри каздой группы.

Первую группу составляют бактериальные (dnaG и dnaE) и фаго ше (gp6i, pa, 6Р4) ферменты, последовательности которых содержа 6 консервативных сегментов.'В ы-конце всех ыолекул консервируете последовательность (Fhe,Тут)-X^-Cys-^-Cys (Н1в) ^^-Суз-З^-Суа характерная для многих Д!:К-связыващих белков. Известно, что эт 40, ашнокислот формирует определенную третичную структуру ьокру иона Zn, так называемый "Zn-finger" домен, который участвует ' связывании ДНК. Биохимические данные, полученные при изучены праймазной активности gp4 Т7 in vitro дают основания предполагат участие последовательности типа "Zn-iinger" в узнавании сягнало праймировакия на матричной цепи ДНК при синтезе отстающей цепи Наличие "Zn-iinger" мотива в последовательностях всех праймаз это группы подтверждает его функциональную значимость и позволяв распространить данное предположение на остальные белки. Кро.ч; указанной последовательности в праймазах первой группы выявлен еще 4 консервативных мотива (рис. 1). Установить достоверно

мотив 1 (Zn-fInger)

t 1 t $

DnaG E.ooli 36 HACCPFHNEKTPS [5] EKQFYHCFGCGAHC

DnaG S.tyh. 36 HACCPFHIiEKTPS 15] EKQFYHCFGCGAHG

DnaG R.prow. 36 VGLCPFHOEKTPS (51 DKQIFHCFGCGAGG

DnaE B.oubt. 34 FGLCPFHGESTPS 15] SKRFFYCFGCKASQ

g61 Г4 34 R—CPVCGDSKTD [12 J NEONIHCYWCNYHA

alpha P4 12 HQPCPVCGCSDRF Ш SDGHTFCYVCEKWT

gp4 T3 11 HAPCENCGSSDGN (31 SDGHEWCFVCEHRV

gp4 T7 31 HIPCDNCGSSDGN [6] GRGTWYCNQCGA-G

МОТИВ 2 мотив 3

DnaG E.ooli 143 ! * X YLEKRGLSHEVIAH 206 FPIRDKRGRVIGF

DnaG S.tyh. 143 YLQKRGLSAEIIQR 206 FPIRDKRGRVIGF

DnaG R.prorr. 134 YLYKRNITETTIKE 197 IPIRNIYNKIYGF

DnaE B.subt. 144 YLLSRGFTKELINE 209 FPIHDHHGAVVAF

g6l T4 139 YVKARCIPKD-KWK 182 IPIYNAKGKAESP

alpha P4 132 YLTRKGFPGRECRM 164 VPLYDDSGELVTtTj

gp4 T3 80 DLTARGISKETCQX 108 YQVADYRDQNGSI

SP4 T7 00 ALTARGrSKETCQK 108 YQVADYRDQHGNI

TraC RP4 376 EGDKKGEKSGFYVG 489 IPAYDADGKQWTii

ГгаС R751 377 EGGKKGALDCFYYG 490 IPAFDAEGKQWTM

Sog ColIb-P9 103 ABDKKGQKSGAYRG 217 IPFSNHNQAIRSY

МОТИВ 4 МОТИВ 5

:: : «* * : : :: * *

DnaG E.coli 260 RLLWEGYHDWAL 303 NVICCYDGDRAGRD

DnaG S.tyh. 260 RLLWEGYHDYYAL 303 NVICCYDGDRAGRD

DnaG R.prow. 251 RSILVEGYFD7IAL 2 93 EIILCLDGDNAGIK

DnaE B.subt. 263 R4VLFECFADTYTA 306 EIILCYDSDKAGYE

g6l T4 230 -VYVLEGPIDSL-- 263 RRVWYLDNEPRHPD

alpha P4 209 RLWIAEGYATAI/FV 254 QIVbAADRDLSG-D

gP4 T3 152 K-WTEGEIDMI/TY 201 QIILiJFDMDEAGRK

SP4 TT 152 JCIWTEGEIDAXTY 201 QIILKFEKDDAGKK

TraU RP4 536 AiVIGEGYATAATV 531 PWIAGDDDRQV-Q

TraC R751 535 A1VISEGYATAAQ7 • 580 PVI IAGDDDRHIr-Y

Sog ColIb-P9 264 VLF-AEGYATAASL ■308 PFIFCADflDIUI-R

Рисунок 1. Консервативные мопша, Еыявлзннне в последовательностях ПраЛМЭЭ бактерий Saohsrtohla coli, Salmonella tvphlmurtun, Bacillus subtlUs, Rtcbettela рготгагеЬtl, фЭГОВ T4, T7. ТЗ. P4 И плазмид Collb-P9. RP4, K751 s.ooи. Цифры указывают номер первого аминокислотного остатка приводимого сегмента, цифры в скобках -число пропущенных остатков в 1 мотиве. Звездочками обозначены инвариантные аминокислотные остатки, двоеточием - хгмичесхи близкие.

сходство между этими мотивами и какими-либо мотивами с известно! функцией, к сожалению, не удается. Однако, функциональная значимость инвариантного остатка глутаминовой кислоты (мотив 4 на рис. 1) была недавно показана в опытах по сайт-специфическому мутагенезу. Замена этого остатка на химически близкий ему остаток глутами-на приводит к потере праймазной активности у Ра фага Р4.

Недавние исследования straok и соавторов показывают, чтс праймазы, кодируемые бактериальными плазмидами и участвующие i достраивании комплементарной цепи ДНК после конъюгативного переноса плазмиды из клетки-реципиента в клетку-донор, проявляют сходство с праймазой Фага F4. Сравнительный анализ последовательвосте! этих праймаз с другими членами описываемой группы подтверждает ш принадлежность к данной группе (рис.1).

Вторую группу составляют праймазы опазмид BSP 101о в.coli i рТР-Г2 Tiobaoiilue /еггоокАт». В последовательностях втих праймаз отсутствует "Zn-finger" мотив, что предполагает другой спосос узнавания сайтов праймирования. Малочисленность группы затрудняв! четкое выделение отдельных консервативных мотивов. Однако, в указанных последовательностях достаточно ярко выделяются 2 участка с консервативными остатками с карбоксильной боковой цепью: дублет остатков аспарагиновой кислоты в гидрофобном окружении и пар£ глутамин/глутаминовая кислота, разделенную одним аминокислотные остатком.

К третьей группе отнесены праймазы эукариотических вирусов: UL52 вируса простого герпеса I типа, праймазная активность которого показана в биохимических эксперимента!, и идентифицированные г процессе сравнительного анализа последовательности gp6 вирусе ветрянки/опоясыващего лишая, SU1 вируса Эпштейн-Барр, UL70 цнто-мегвловируса человека, 0КР7 вируса герпеса лошадей I типа. Е

выделяемых 8 консервативных мотивах, для функциональной интерпретации которых необходимы биохимические исследования, не обнаруживается никакого сходства с мотивами праЕмаз других групп, хотя как п в других последовательностях присутствует пара консервативных остатков аспарагиновой кислоты.

Четвертая груша объединяет праймазы эукаряот. У'эукариоти-чесхих организмов праймаза имеет более сложное стороание и состоит нз двух неодинаковых субъединиц: больиой и малой, которые кодируются разными генами. ■ Согласно биохимических данных, в процесса ' репликации обе праймазные субъедишщы входят в состав ДНК полиме-разы а. В настоящее время установлены аминокислотные последовательности только для ДНК праймазы дрожкей З.сегеу1в1ае (большая п малая субъодиницы) и большой субъедашщы праймазы мыши ииа гтизои1из, их сравнительный апализ кэ позволяет четко описать какие-либо консервативные нотиеы, присущие данному типу ферментов. Однако, в последовательностях больших субъедшшц таюш как и в последовательностях праймаз датах групп консервируется мотив с парой остатков аспарагиновой кислоты.

Известно, что у ДНК-полишразы 1 в.сои связывание нуклеотн-дов и в полкмеразном и в экзонуклеазком доменах происходит в комплексе с кона® металла, которые координируется карбоксильными • группами сближенных остатков 1 лутаг,иловой кислота и глутамата (консервативных у всех сходных с пей полнмораэ). Для зукариотпчос-ких ДНК-полимераз и вирусных РНК-поликераз эту функцию предполагают для сближенных остатков аспарагинозой кислоты в •чгают)" и "они" ттпвах. Вполне вероятно, что в последовательностях ■ пряЯтлаз р. связывании рибонуклеотидов (югут принимать участие сбликешшэ остатки аспарапшовой кислота (аспарагина), кохгсэрвирупзиэся в. последовательностях праймвз всех четырех груш.

Многие биохимические исследования показывают, что существенную роль в процессе синтеза затравки играет праймаз-ассоциирован-ная хеликаза. У бактериофага Т4 в отсутствие хеликазы праймера не синтезируются, а праймаза проявляет лишь слабую синтетическую активность. У бактериофага Т7, по данным экспериментов In vitro, в присутствии хеликаза увеличивается количество синтезированных праймеров, а у б.оон DnaB стимулирует узнавание сайтов прармирования . Анализ последовательностей праймаз-ассоциированных хеликаз герпесвирусов, бактерий, бактериофагов и плазмид, проведенный как в данной работе, так и другими исследователями, показывает, что эти последовательности также составляют несколько групп, со значительным сходством внутри каждой группы. По составу эти группы соответствуют праймазным. В последовательностях хеликаз каадой группы кроме нуклеотид-связываюдего паттерна, найдены дополнительные консерзативные мотивы, по-видимому, участвующие в белок-белковом взаимодействии с праймазами.

Благодаря проведенному сравнительному анализу в бифункциональных белках gp4 фага Т7 и Ра фага Р4 установлены границы прай-ыазного и хеликазного доменов. На рисунке 2 приведена схема, отражающая организацию праймаз/хеликазных систем бактерий и бактериофагов. Оба типа праймаз/хеликазных систем (однокомпонентной у фагов Т7 и Р4 и двухкомпонэнтной у бактерий и фага Т4) со сходными по первичной структуре последовательностями (за исключением хеликазы фага Р4), по-видимому, имеют общее происхождение. А их существование может объясняться либо дупликацией предкового гена, который изначально был бифункционален, либо слиянием двух разных генов-предшественников.

Помимо олигорибонуклеотидов затравкой для ДНК полинвразы ыокет служить 3*-конец разорванной цепи в родительской ДНК. При

праймаза

Бпаа бактерий

1 > 354

301

ербт Т4

праймаза

312 342

Ипа В бактерий gp12 Р22 ¿р41 Т4

хеликаза

®?4 Т7(ТЗ) [

праймаза

245 272

Ра Р4

праймаза

хеликаза

299

492

595

777

Рисунок 2. Схематическое изображение организации праймаз/хе-ликазных систем бактерий и бактериофагов. Заштрихованы области со сходной аминокислотной последовательностью, цифрами обозначены пх границы. Звездочками помечен "гп-г^ег" мотив.

этом в инициации репликации принимает участие лишь один белок -саЗт-спещф1ческая эндонуклеаза. Этот простой способ шшциацзя особенно распространен среди небольших реплнкотов (плазггзд а бактериофагов), у которых шесеше одноцепочечного разрыва в родата ль скую ДНК шшшшруот репликацию по г.ту катящегося кольца ш> стадии превращения двуцепочечной ДНК в одноцепочечную форму.

Представленный в данной работе, сравнительный анализ известных, а также выявленных в ходе исследования аминокислотных последовательностей сайт-специфических вндонуклеаз, привел к описании трех консервативных и, по-видимому, функционально значимых мотивов у нескольких групп белков, выделенных на основе сходства первичной структуры (рис. 3).

В результате поисков в банках данных аминокислотных последовательностей, проявляли! сходство с последовательностями одноце-почечных сайт-специфических эндонуклеаз икосаэдрических бактериофагов фХ174, 313, 04, было найдено 8 последовательностей со значительным уровнем сходства как с А белками бактериофагов, так и между собой. Среди них - последовательности белка агр, необходимого для автономной репликации гибридного фаго-плазмидаого репликона рЬаву1, белка чр2 хламидиального фага СЬр1, на основе сходства размера и организации генома, а также кодируемых им аминокислотных последовательностей отнесенного к семейству фХ174 (Н1сго?1г1(1ае), открытой рамки трансляции огХ4 вируса спироплазмы БРТ4, похокего на икосаэдрические фаги .размером генома и количеством кодируемых белков, и открытые рамки трансляции галобактериалъных критических плязмид раяв1, ршзр в'рнаш.

Указанные последовательности содержат 3 консервативных мотива: Я-концевой мотив с инвариантными остатками треонина и лейцина, второй мотив с парой инвариантных аминокислотных остатков гистиди-на в гидрофобном окружении, и с-концевой мотив с парой ш&ариант-ннх остатков тирозина (рис. 3). По данным биохимических исследований ФХ174 оба остатка тирозина могут принимать участие в ковалентном связывании с образованным в результате разрыва Ъ'-концом ДНК. Исследователи предполагают, что для функциональной активности А белка необлодаш оба остатка: первый участвует в

инициации репликации, а второй - в терминации при циркуляризации ДНК после синтеза полноразмерного генома. Сходство последовательностей указанных белков скорее, всего означает их функциональное сходство, сходство механизмов инициации и терминации репликативно-го процесса. Следовательно, можно предполать способность к репликации по механизму катящегося кольца у биохимически неизученных репликонов: фаго-плазмидного гибрида phasyi, фага Chpi, вируса SPY4, И плазмид pGRB1, pHGN, pEHSP.

Кроме перечисленных последовательностей консервативный мотив с двумя остатками тирозина YVAKY был найден в последовательности vgA фага 186, геном которого, как следует из некоторых экспериментов, реплицируется по механизму катящегося кольца, и в последовательности открытой рамки трансляции бактериального ретропозона (ретрона) ВС67. По данным лаборатории Inouye ретрон ЕС67 кроме последовательностей обратной транскршггазы и dam-метилазы кодирует еще несколько последовательно располокенных открытых рамок трансляции. Более детальное сопоставление vgA 186 с открытыми рамками трансляции ретрона привело к установлению сходства последоватвль-' ности А бежа с двумя следующими друг за другом открытыми рамками трансляции и идентификации всех вышеописанных мотивов.

Согласно недавним исследованиям нескольких лабораторий способ репликации по механизму катящегося кольца широко распространен среди плазмид грамполохительных и некоторых других бактерий. На основании сходства нуклеотидных последовательностей и структурной организации их разделяют на несколько семейств. В настоящее время описано четыре семейства: рТ181, рС194, рЕ194, рЕ5. Внутри кяддого семейства плазмид аминокислотные последовательности репликативных белков проявляют высокую степень сходства ыеаду собой, ютя меаду последовательностями разных семейств значительного сходства

1 phiX174 A 200-390) FDTLTIiAD 53 RLHPHAVHF 70 VGFYVAKYVN

2 04 A 241-431) FDTLTLAD 53 RLHFHAVHP 70 VGFYVAKYVN

3 S13 A 209-399) FDTLTLAD 53 RLHFHAVHL 70 VGFYVAKYVN

4 SPV4 gp2 76-218) FVTLTYSD 50 RPHYHICFF 44 -ANYTARYTT

5 Chpl P5 140-284) VLILTYDN 45 RMHWHMIVF 48 I-FYVARYVQ

6 BP 186 A 319-487) FYTLTAPS 48 TPHWHMLMF 47 TG-YVAKYIS

7 EC67 2/3 (357 400;1-116) FYTITCPS 487TVHWHLMCF 45 TS-YIAKYIS

8 PHASYL ARP 87-249) FLTLTFRD 37 RIHYHLLVA 5b IGRYVGKYIS

9 pHGN1 ORP 103-238) KVTLTAST 54 YAHIHLGVF 58 LGAYLAAYKA

10 pCRB1 ORP 94-226) MVTLTASS 48 YVHIHXGVF 57 LGAYLAAYMA

11 pEHSPN ORP 50-182) KVTLAASS 51 YVHIHLGVF 47 LGAYLAAYUA

12 dBAAI REP 87-226) FLTLTVRN 48 HPHFHVLIP 64 ISKYPVKDTD

13 PPTB14 REP 119-258) FLTLTVRN 48 HPHFHVLLP 63 ISKYPVKDTD

14 pLP1 REP 108-244) FLTLTVKN 49 NQHLHVLLF 56 TAKYEVKSAD

15 PUB110 REP 124-255) FLTLTVKN 49 NQHMfiVLVC 55 TAKYPVKDTD

16 PC194 REP 97-221 ) FLTLTTPN 48 NPHPHVLIA 49 MAKYSGKDSD

17 pLAB1000 REP 106-236) FLTLTAEN 47 HQHMHVLLF 56 TAKYQVKSKD

18 pBC1 REP 31-168) FLTLTVRN 53 HPHFHVLLC 67 VSKYPVKDTD

29 pKYU REP 116-252) FLTLTVRN 46 HPHFHCLLfi 59 TLKY5VKPED

20 pNoet REP 135-262) FVTLTVKN 50 HPHFHVLKJi 49 VIKYSVKESD

21 ABKV AL1 15-110) PLTYPQCS 32 EPHLHVLIQ 36 VKSYIDKDGD

22 BGliY ALI 15-110) FLTYPRCT 32 EPHLHALIQ 36 VKEYIDXDGV

23 TGKY AL1 16-110) PLTYPQCS 32 QPHLHVLIQ 36 VKTYIDKDGD

24 CLV AL1 14-109) FLTYPKCS 32 EPHLHALIQ 36 VKSYLDKDGD

25 BCTV AL1 15-110) PLTYPQCS 32 QPHLFVLLQ 36 VKSYVDKDGD

26 TYLCV AL1 13-108) PLTYPNCS 32 EPHLHVLIQ 36 VKTYVEKDGN

27 USV AL1 18-107) FLTYPKCP 32 SLHLHALLQ 30 VRDYILKEPL

28 WüV AL1 18-113) PLTYPECT 32 SPHLHVIjVQ 37 VRDYITKEVD

29 CS MV A11 42-131 ) PLTYPRCP 32 EPHLHAPVQ 30 TLKYCliKHPE

30 SLCV AL1 15-110) FLTYPRCD 33 SPHLHCLIQ 36 VKNYITKEGD

31 SSV AL1 15-110) FLTYSRCP 32 GYHIHVLAQ 31 VRAYAMKNPV

32 PADB201 REP 12-<118) LLVYPDSA 34 KPHYHIVLA 30 MWRYWTH—K

33 ptfV158 REP 11-128) FLLYPESI 37 KAHYHVLYI 34 MYLYLTHESK

34 pLS1 REP 10-128). FLLYPESI 34 KAHYHVLYI 34 MYLYLTKESK

35 PE194 REP 22.-132) FVLYPESA 32 KEHYHILVk' 30 LVRYL'IH—Ii

36 pWV01 REP 13-147) FLLYPDSI 44 KPHYHVIYI 34 SYEYLTHESK

37 pLB4 REP 32-137) IWYPESL 30 KSHYHLVLN 30 AVRYLTH—II

38 UHV NS1 111-216) GWHCHV-LI 75 IAYYF-LTKK

39 PPV N51 112-216) GYHCHV-LL 75 IAYYF-LNKK

40 HPV NS1 111-216) GWHCHV-LI 75 IAYYF-LSKK

41 CPV NS1 111-217) GWHCHV-LL 75 IAYYF-LTKK

42 ADV N31 140-251) QFHIHCCLG 82 TSIYL-FNKD

43 B19 N31 (63-146) GYHIHV-VT 51 IEtiYL-MKKI

44 AAV NS1 (74-162) YFHHHV-LV 57 IPNYL-LPKT

45 MTV NS1 112-217) GWHCHV-LL 74 IAYYP-LTKK

4b DSV KS1 (40-155) SLHSHA-LL 82 KEEYLSMVQK

47 PIJ101 ORP 62-234) LVTPTARH 78 HPHIHAIVX 69 LAEYIAKTQD

48 PSB24 ORP 62-234) LVTPTARH 76 HPHIHAIVL 71 LGEYIAKTQD

49 IS801 ORP 113-272) HLVPTLPD 50 HPHVHLSVT 83 LGRYLKKPPI

50 7рСНЬ1 0Р2Б (9-Ю8) * РШБРШ. 33 БЗНУНАЪАА 42 ЬгАУСУХНУК

51 ?рСРА1 ОКР (8-112) ИКББЬИЪ 36 РБНУНАТ.АА 42 ЬЗАУвТЮШС

52 7Со1ЕЗ(Е2)ККР (33-131) 1А1ЬАКР1 40 КСНАШЬУА 32 ОУНУБСЫСХ

53 7САА р52 (316-411) РАНТАМ 29 СОВШТЬУР 41 ТАТУАНШРУ

54 7СРВУ р17 ( 25-148) СРБвТЕЗИ 48 РБНУНШО 49 ЕКГУСТЗТЗЯ

Рисунок 3. Характерные эндонуклаазные цотивы, обнаруженные в последовательностях репликативных белков икосаэдрических фагов, одкоцепочечных плазмид бактерий, гвминивирусов, парвовкрусов м некоторых доугих репликонов (подробнее см текст). Цифрами в скобках указаны границы приводимых сегментов, цифры мезду 1,ютиве1!3 означают число разделяющих их аминокислотных остатков.

Е12явлено нэ было.

В ходе данного исследования в последовательностях гер-белсов всех четырех семейств проводился поиск мотивов, выявленных прз анализе фаговых сайт-специфических эндопуклеаз. В результате, искомые мотивы были найдены только в последовательностях бэлкоз рС194 и рЕ194 семейств. Но в третьем мотива у описываемых последовательностей консервируется только один остаток тирозина, причем функциональная значимость этого остатка для ковалентного связывания с ДНК подтверждена в экспериментах по сайт-специфяческому мутагенезу гер-бежа плазмида ркта (семейство рС194). Замена его на остаток фенилаланина полностью ингибировала активность белка в инициации репликащш плазмздной ДНК. По-взщаюму, отсутствий второго консервативного остатка тирозина объясняется другим механизмом тергяшацня репликации. По некоторым зкспврштитальнш/ данным кольцо новосинтезированной ДНК выщепляется в результате сайт-специфической рекомбинации.

В результате дальнейшего поиска в банках данных последовательностей с характерны?® зндонуклеазтши мотивами было выявлено

27 белков.

Среди них - белки АН геминивирусов двудольных и одно долышх растений. Геном гемшшвирусов как и у икосаэдричэскнх фагов представляет собой одноцепочечную кольцевую молекулу ДНК. Стратегия его репликации предполагает некоторое сходство со стратегией репликации генома икосаэдрических бактериофагов. К настоящему времени накоплены биохимические данные, подтвергсдающие подобное предположение, и ряд экспериментаторов склоняется к выводу, что синтез одноцепочечной формы геномной ДНК геминивирусов происходит путем репликации по типу катящегося кольца. Согласно биохимическим и генетическим экспериментам, последовательности, несущие эндонук-леазные мотивы, участвуют в репликации генома геминивирусов. Идентификация характерных эндонуклеазных мотивов в последовательностях репликативных белков геминивирусов подтверждает предположение о наличии стадии репликации по типу катящегося кольца в процессе репродукции вирусного генома. А консервация в третьем мотиве только одного остатка тирозина сближает последовательности репликативных белков геминивирусов с последовательностями гор белков одноце-почечных плазмид грамполокительных бактерий. Найденное меззду этими последовательностями сходство наводит на мысль о прокариотическом происхождении геминивирусов.

В последовательностях неструктурных белков (HS1) парвовирусов были найдены гистидиновый мотив и мотивы с инвариантным остатком тирозина. Известно, что эти вирусы с двуцепочечным линейным ДНК-геномом в процессе репликации использует так называемый самозатравочный механизм инициации, в ходе которого в качестве праймера выступают 3'-концы вирусного генома. Репликация 5'-концов происходит после внесения одноцепочечного разрыва на одной из промежуточных стадий репликации. Согласно экспериментальных данных этот

разрыв вносит мультнфункциональный вирусный белок NS1, который строго необходим для репликации вирусной ДНК, а в процессе репликации ковалентно связан с 5'-концом реплицирующихся молекул. Идентифицированный в последовательностях белков NS1 гистидиновый мотив, по-видимому, является частью эндонуклеазного активного центра, а через один из инвариантных остатков тирозина, могет осуществляться ковалантная связь с ДНК.

Эндонуклеазные мотивы также были найдены в последовательностях открытых рамок трансляции еще двух эукариотических вирусов с одноцепочечным кольцевым ДНК-геномом - вируса анемии цыплят (САА) и вируса гниения листьев кокоса (CFDV). Несмотря на некоторое "размывание" консервативных мотивов и отсутствие каких-либо данных биохимических экспериментов, присутствие стадии репликации по типу катящегося кольца в процессе образования вирусного генома какется довольно вероятным.

Кроме того, ендонуклеазные мотивы били найдены в последовательностях, КОДИруеМЫХ ПЛазМИДаМИ pIJ101 St reptonyoee Hvldane, pSB24.1 Streptomycee cyanogenua, рСНЫ И pCPA1 Chlamydia traohonatle, ColK Ц ColE3 S.ooli И IS-ЭЛЭМеНТОМ . Peaudcmonae eyringae. Это наблюдение вместе с данными биохимических экспериментов дает возможность предполо&ать стадию репликации по типу катящегося кольца у плазмид р1Л01 и pSB24.i. По данным биохимических экспериментов указанная последовательность плазмиды Со1Е2 необходаша для ее репликации, однако, в исследованиях in vitro у нее не было найдено эндонуклеазной активности. И все ко обнарусо-ние в ней характерных эндонуклвазпых мотивов требует дополнительной проверки ое' фермептативной активности. Плазмиды chlamydia trochomotia рСРА1 и рСНЫ биохимически малоизучены, практически пет никаких данных о способе репликации пх ДНК и требующихся для

1 RP4 Irai (19-130) LANYITDEQ 72 HQRISAVHNDT 0 ШШ1Н1А1Ж1Н

2 R751 Tral (19-130) 1YKYITDAQ 72 HQRVSAVHHDT 0 DNIflIHIAINKIH

3 R64 NikB (51-178) LVDYATRLR 89 HQYVSAVHTDT 0 DNIHVHVAVNRVH

4 PS194 Rix (15-114) AINYAEERA 63 YQVAVYTHTDK 0 DHYHNHIIINSVH

5 РС223 Rix (15-114) AINYAEKRA 63 HQVAVYTHNDT 0 DHVHNHIVINSID

6 РС221 Rix (15-114) AINYAEKRA 63 HQVAVYTHTDR 0 DHYHNHIVINSYD

7 РТ1А5 VirD2 (26-147) QLEYLSRKG 84 YNYLTAPHIDR 0 DHPHLHVWNRRE

8 рТ1Аб VirD2 (26-147) QLEYLSRKG 84 YNYLTAYHVDR 0 DHPHUTTWNRRE

9 PR1A4 VirD2 (26-147) QLEYISRKG 84 YNYLTAFHIDR 0 DHPHLHVWNRRE

10 pS0101 Mob (20-135) HADYIAREG 77 YQPA—IHNP- 7 EQPHAHIMFS—E

11 HSP1010 МоЬА (22-131) KADY1QRE0 75 PYLA--IHA— 3 ENPHCHUflSE-R

12 рТР1 HobL (39-169) VHDYT-RKQ 69 AAVA--LHAP- 28 CNWHAHILLSACH

13 R100 Tral (69-170) KGR-PGYDL 56 LYJtALFNHDTS 4 PQIfiTHVYVANVT

14 V Tral (69-170) RHR-PGYDL 56 LYliALTNHDTS 4 PQLHTHAVYANVT

Рисунок 4. Консервативные мотивы, выявленные в последовательностях Селков, участвупцих в конъюгативной мобилизации плазмид RP4, R751, R64, RSP1010, Р, R100 E.ooU, pSC101 Salmonella typhlmurtu», pC221, pC223, PS194 Staphyloooooue aureue, pTF1, pTP-P2 Ttobaotllue /errooxtdaae, рТ1А5, pTii.6 Agrobaotertim tume/aotene, pRlA4 Rtzobtum meUlotl. Цифрами обозначены раССТОЯния между мотивами, цифрами в скобках - границы участков.

этого белках. Возможно, последовательности, несущие эндонуклеазные мотивы, участвуют в репликации, которая, возможно, проходит по типу катящегося кольца.

Кроме репликативных эндонуклеаз известны эндонуклеазы, участвующие в переносе плазмидной ДНК из одной клетки в другую. Переносимая цепь ДНК образуется в результате внесения одноцепочечного разрыва в исходную молекулу плазмиды в определенном месте, называемом ог!Т. С помощью сравнительного анализа последовательностей белков, участвующих в конъюгативной мобилизации плазмид Е.751, №4, Р64, рЗС101, рС221, рС223, КР1010, р5194, рТР1, рТ1А5, рТ1Аб, рК1А4, Н10п и Р. в их ы-концевой части были идентифицированы гистидиновый мотив и мотив с инвариантным остатком тирозина (рис. 4), предположительно составляющие эндонуклеазный активный центр данных белков. Правомочность подобного предположения подтверждает-

ся тем, что экспериментально идентифицированный аминокислотный остаток бежа VirD2 плазмиды pTLA6 A.tume/aoiena, участвупций в ковалентном связывании с 5'-концом плазмидной ДНК во время ее переноса в растительную клетку совпадает с остатком, предсказанным а данной работе.

Маловероятно, чтобы описанные консервативные эндонуклеазше мотивы, локализованные в последовательностях функционально сходных бежов, возникли в процессе эволюции независимо. Скорее всего указанные сайт-специфические эндонуклевзы имеют общее происхождение. Тот факт, что в последовательностях эндонуклеаз системы переноса ДНК мотив с инвариантным остатком тирозина предавствует гистидяновому мотиву, тогда как в последовательностях репликатив-пых эндонуклеаз эти мотивы расположены в обратном порядке (рис. 5), может объясняться происшедшими в ходе эволюции внутригенными перестройками (дивергенция гена-предшественника).

Описанные мотивы входят в состав эндонуклеазного домена, по-видимому, пространственно обособленного от домена, узнающего место внесения разрыва. При этом, очевидно, во всех случаях через консервативный остаток тирозина осуществляется ковалентная связь с ДНК, а сближенные консервативные остатки гистидина, по-видимому, служат лигандами для связывания ионов металла, как в сходных мотивах у карбоангидразы и супероксиддисмутазы, формируя второй элемент активного эндонуклеазного центра.

Как видно из рисунка 5 в указанных последовательностях, кроме эндонуклеазного домена, встречаются домены с хеликазной каталитической активностью (парвовирусы, геминлвирусы двудольных, trai фактора F). Известно, что в репликации икосаэдрическлх бактериофагов принимает участие клеточная хеликаза rep, хелпказная активность с-концевого' домена iisi белков парвовирусов, а такгэ участие

эндонуклеазы бактериофагов ФХ174, S13, G4, 186, Chp1

эндонуклеазы плазмид рС194 и рЕ194 семейств

АЫ геминивирусов однодольных растений

АЫ геминивирусов двудольных растений

ns1 парвовирусов

tfob/ RSP1010

Tral Р

20 1 2 3

1 2 3

1 П Г.! И I

1 2 3

i EI т I

1 2 3 хеликаза

I tvl М ti ЙЗЙЙЙ I

3 1 хеликаза

I ы и

3 1 праймаза

ЕЗШ I

3 1 хеликаза

I О Г:'.1 ЯШМ I

Рисунок 5. Схематическое изображение идентифицированных эндо-нуклеазных мотивов (1 - рьп/г-мотив, 2 - гистидиновый мотив, з -мотив с остатком тирозина) и других энзиматических активностей, идентифицированных в последовательностях указанных белков. О -эндонуклеазые мотивы, - хеликазый домен со сходной первичной структурой у парвовирусов и геминивирусов, - хеликазный домен в последовательности 1га1 плазмиды Р.

этого домена в репликации вирусного генома недавно доказано с помощью биохимических экспериментов. Хеликазная активность указанного домена АЫ геминивирусов двудольных еще не подтверадена экспериментально, хотя по данным сравнительного анализа последовательности этого домена и белков р17 геминивирусов однодольных сходны с последовательностями хеликазного домена n31 парвовирусов. Таким образом, в данном случае как и в случае праймаз и хеликаз бактерий и бактериофагов также можно говорить о двух- и. однокомпо-нентных системах.

Безусловно, все высказанные в данной работе предполозйння нуждаются в экспериментальной проверке.

ВЫВОДУ:

1. Локализованы праймазше домены в бифункциональных белках бактериофагов Т7, ТЗ и Р4. Сравнительный анализ последовательностей однокомпонентных и двукомпонептных праймаз/хеликазных систем у бактерий и фагов свидетельствует об их общем происхождении.

2. На основе сходства аминокислотных последовательностей белки с праймазной активностью классифицированы на 4 группы: первая группа объединяет праймазы бактерий и бактериофагов, вторая - бактериальных плазмид, третья - праймазы эукариот, четвертая - герпесвиру-сов.

3. Предсказан способ репликации и идентифицированы участвующие в инициации репликации белки для архе бактериальных плазмид рНСН1, pGRBi, pEHSP; плаз-гад рИЛ01 и pSB24 актиномицетов, вируса спиро-плазм 5PV4, вируса анемии цыплят CJU, вируса гниения листьев кокоса CTDV. В последовательностях архебактериальных плазмид предположительно локализован сайт ori репликации.

4. С помощью сравнительного анализа установлены функционально, ванные аминокислотные остатки в последовательностях белков-инициаторов репликации по типу катящегося кольца у икосаэдрических фагов, Ьр18б, мелкого репликона phasyl, одноцепочечкых плазмид грамполокителышх бактерий семейств рС194 и рЕ194.

5. В бежах аы геминивирусов и NS1 парвовирусов картированы домены с эндонуклеазной активностью, участвующие в инициации репликации Е'фусного генома. Сходство последовательностей белков AL1

геминивирусов и репликативных оелков одноцепочечных плазмид грам-полокительных бактерий семейства рС194 предполагает прокариотичес-кое происхождении этих эукариотических вирусов. 6. Показано, что сайт-специфические эндонуклеазы, инициирующие репликацию по типу катящегося кольца, и белки с одноцепочечной эндонуклеазной активностью, участвующие в переносе ДНК в процессе конъюгации бактерий, имеют общие структурные мотивы, что может отражать общность их происхождения.

Основные результаты по теме диссертации опубликованы в следупцих работах:

1. T.V.Ilyina, A.E.Gorbalenya, E.V.Koonin "Organization and evolution of baoterlal and bacteriophage primaae-helicaae Byntema"

- Journal of Molecular Evolution 1992 v.34, pp.351-357

2. T.V.Ilyina, E.V.Koonin "Conserved eequenoe motife in the initiator proteins lor rolling oirole DNA replication encoded by diverse replioons from eubaoteria, eukaryoteo and arohaebaoteria"

- Nuoleio Aoids Research 1992, v. 20, pp. 3279-3285

3. Koonin E.V., Ilyina T.V. "Geminivirus replication proteins are related to prooaryotib plasmid rolling oirole- DNA replication initiator proteins" - Journal of General Virology 1992, v. 73, pp. 2763-2766

ИЛЬИНА ТАТЬЯНА ШКГОРОША

СРАВНИТЕЛШНЙ АНАЛИЗ ШШОХИСЛОТШХ ПОСЩОМЕЛЫОСТЕЙ

КЕДКОВ ИНИЦИАЦИИ РЕПЛИКАЦИИ ВКУСОВ, БАКТЕРИОФАГОВ И БАКТЕРИИ

/Автореферат/ Подписано к печати I0.II.S2 Формат 60x90 I/I6 п.л.1,5

Уч.изд.л. 1.3 Титхш 70 Заказ 417 -КП'Таиаит"___

Ротапринт МАСИ /ВТУЗ-ЗИЛ/, 109283, Иаскш, Автозаводская, 16