Бесплатный автореферат и диссертация по биологии на тему
Структура генома бактериофага Т4 в области 79.313-94.900 единиц карты
ВАК РФ 03.00.03, Молекулярная биология
Автореферат диссертации по теме "Структура генома бактериофага Т4 в области 79.313-94.900 единиц карты"
АКАДЕМИЯ МЕДИЦИНСКИХ НАУК СССР ИНСТИТУТ ВИРУСОЛОГИИ имени Д.И.ИВАНОВСКОГО
На правах рукописи
ПРИЛИПОВ Алексей Геннадьевич
СТРУКТУРА ГЕНОМА БАКТЕРИОФАГА Т4 В ОБЛАСТИ 79.313 - 94.900 ЕДИНИЦ КАРТЫ
03.00.03 - молекулярная биология
Автореферат диссертации на соискание учёной степени кандидата биологических наук
МОСКВА 1991
Работа выполнена в Институте Вирусологии имени Д.И. Ивановского АМН СССР
Научный руководитель
доктор биологических наук, профессор Месянжиноо В. В.
Официальные оппоненты: доктор медицинских наук, профессор Ильяшенко Б. Н. кандидат биологических наук Серышева И. И.
Ведущая организация
Институт молекулярной генетики АН СССР
Защита состоится 1991 года на заседании специализированного совета в Институте Вирусологии имени Д. И. Ивановского АМН СССР (Москва, ул. Гамалеи, 16).
С диссертацией можно ознакомиться в библиотеке Института Вирусологии имени Д. И. Ивановского АМН СССР.
Автореферат разослан 1991 г.
Ученый секретарь специализированного Совета кандидат медицинских наук,
старший научный сотрудник Жуковский А. М.
I. ХАРАКТЕРИСТИКА РАБОТЫ.
1.1 Актуальность проблемы. изучение регуляции экспрессии сложных полнинстронных матриц, к числу которых принадлежат многие вирусные мРНК, а также мРНК, кодируемое бактериофагами, является важным направлением современной молекулярной (¡полосни. ОсоЪин интерес нрелстпнляет поучении процессор трши крин иин н трансляции поздних генов бактериофага Т4, колирующих структурные белки вируса.
Хотя в морфология частицы бактериофагл Т4 пзучемл довольно полно, отдельные черты инфекционного процесса остаются неяснь-«II. Правильная сборка частицы фага в клетке возможна только при скоординированном синтезе всех структурных белков вируспсн частицы. Кластерное расположение генов позволяет вирусу, изменяя специфичность узнавания РПК-полимераэой различных промоторов фага, скоординировать процесс транскрипции по времени и уровню копий м-РНК, обходиться сравнительно небольпим количеством единиц транскрипции в геноме. Выяснение особенностей данного механизма регуляции важно для понимания многих фундаментальных процессов, в том числе регуляции и сборки вирусов.
Изучение таких сложных белковых структур, как бизильш.я пластйнка бактериофага Т4, может кисть важное практическое значение. Многие полипептиды, входящие в ее состав, рассматриваются нами в качестве перспективных моделей для белковой инженерии и создания гибридных молекул, содержании антигенные детерминанты вирусов человека.
данная работа была начата в лаборатории 'Молекулярной генг--тнкн" Института вирусологии им. Д.Н.Ивановского в рамках тепы по изучению регуляции фолдинга вирусных белков и научного проекта Всемирной организации Здравоохранения 'Идентификация антигенных детерминант вируса гепатита А и их экспрессия в составе гибридных белков". В качестве векторных молекул для проведения белковой инженерии нами были предложены структурные белки бактериофага Т4. На первом этапе было необходимо определить последовательность ДНХ генов, ходируюиих белки Назальной пластинки и создать эффективные системы их экспрессии.
1.2. Цель н задачи работы. Настоящая работа был» направлена на изучение так называемой поздней области генома бактериофага Т4, кодируюиен гены баэальной пластинки, и создание высокоэффективных систем экспрессии белков - продуктов этих геноа.
для будущего к к использования в качестве векторных молекул при белковой инженерии.
Основными задачами исследования явились.
1. Клонирование и определение полной нуклеотидиую после -дователькость поздних генов 6, 7, 8, 9, 10. 11, 12, wac, Iî. 14, 15 бактериофага Т4.
г.* Создание высокоэффективных систем экспрессии клонированных генов, с целью получения белков в препаративных количествах. '
1.3. Научная новизна и практическая ценность работы. Впервые определена полная нуклеотидная последовательность ДН< генов с 6 по 15 бактериофага Т4, составляющая 15712 пар нукле-отндов.
Обнаружены две большие единицы транскрипции, каждая из которых имеет собственный поздний промотор ТАТЛААТА. Одна из них содержит гены 6, 7, 8 и небольшую открытую рамку считывания после промотора. Вторая единица транскрипции включает 9, 10, il, 12, wac, 13, 14. Характерной особенностью данных областей генома фага Т4 является перекрывание инициирующих и терминирующих колонов соседних генов между генами с б по 8 н с 9 по'йас.
Созданы векторы экспрессии, позволяющие нарлПлтывять в клетках Е. coli продукты генов 9, 10, и, 12 и wac в препаративных количествах.
1 Полученные результаты расоирили представления о регуля-торных механизмах используемых фагом Т4 при репродукции, а также дали информацию о структуре генов двух единиц транскрипции и их белковых продуктах.
Результаты данной работы имеют важное значение для дальнейших исследований по механизмам белкового фолдинга, а также для развития методов белковой инженерии с целью создания гибридных молекул для медицинских целей.
1.4 Апробация работы. Работа бйла доложена на заседании Ученого Совета "молекулярная биология" по предварительной ;)>а-перткэс диссертаций при Институте вирусологии АМН СССР и на VIII Вирусологическом Конгрессе, Берлин, август 1990 г.
t.5 объем и структура работы, диссертация состоит из введения, обзора литературы, методической части, результатов исследований, обсуждения н выводов. Общий объем работы составляет
-3138 стр. машинописного текста. Полученные результаты иллюстрированы t таблицами и 16 рисунками. Список литературы включает 166 нанмешшшшй.
I.6 Положения выносимые на защиту.
1. В районе генома бактериофага Т4 с координатами 79.313 - 94.900 расположены лпе единицы транскрипции, находящиеся пол контролем поздних промоторов ТАТЛАЛТЛ. особенностью исследуемой области является перехрыванне между инициирующими и терминирующими кодонами соседних генов в рамках последовательности ATOA.
2. Векторы экспрессии на основе промотора для РНК-полиме-разы фага Т7 позволяют получать белки, продукты генов 9, ю, И. 12, wac, в препаративных количествах в клетках Е. coli. _
3. Продукты генов 9,11 и wac являются наиболее перспективными для их использования в качестве векторных белков-носителей для проведения белковой инженерии и встраивания антигенных детерминант вирусов человека.
II. ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ.
II.1 Клонирование и секвенироваиие области генома бактериофага Т4, содержащих гены б, 7, 8, 9, ю, п, 12, «ас, 13, 14, 1S. К моменту начала данной работы нуклеотидиая последовательность АНК интересуюоей нас области генома бактериофага 7 4 не была известна. Поэтому, основываясь на задачах нашего исследования, необходимо было провести секвенироваиие генов с 6 по 15, кодируювкх белки баэальной пластинки. Сотрудники лаборатории "Молекулярной генетики" И.В.Неплюев и В.П.Ефимов предоставили мне плазмиды, несушне всю эту область генома бактериофага Т4. рестрикционная карта этой части генома бактериофага Т4, исходно выполнена Е. Каттер (Evergreen State College, USA) н уточнена нами в процессе рестрнкциоииого картирования и секвенирования. Кроме того на карте показаны различные вставки, затем субклонировшшые инею в Плаэмидах.
Для определения генов, клонированных в нлазмнли был прс-веден рекоыбинационний анализ с различными амбер-мутаитами бактериофага Т4, имевшимися в коллекции лаборатории, позволие-вий дохаэать наличне и расположение генов во вставках плазмид.
в соответствии с возможностями метода секвенирования по Сзнгеру в лаборатории достоверно определяется около 350 нукле-
отиаов от прайиера; поэтому оптимальное субклонирование было бы выполнено при размерах вставки в векторах не более ?оо, а как правило содержащие 500 - 510 нуклеоткдов. так как расположение удобных лля клонирования рестрикиионных сайтов не всегда позволяет это сделать, был отработан метод получения прямьх однонаправленных делеций. Таким образом, субклонм,. нспользу;-мыс в дальнейшей работе, были получены двумя способами: клонированием рестрикиионных фрагментов ДНК в различные векторы и конструированием-серий плазмид, несущих делении различного размера в исходной вставке.
Проверка субклонов проводилась по длине встроенного фрагмента. первичнои последовательности или по рекомбинации с аи-бер-мутантами бактериофага Т4.
Полная нуклеотндная последовательность лик области генома бактериофага Т4, содержащей гены с 6 по 15, представлена на рисунке 1. Последовательность содержит 15712 пар нуклеотид!в. характеристика белковых продуктов дана в таблице 1.
II.2 Анализ нуклеотиднон последовательности региона генов 6-15 бактериофага Т4. Первой наиболее »арактернон особенность« данной области генома бактериофага Т4 является почти полное отсутствие неколнруитнх белки последовательностей лик. Второй особенностью можно считать псрек|>ыванне инициирую «их кодонов последующих генов с терминирующими кодонами предшествующих. При зтом можно различить два основных варианта такого . перекрывания. Первый, встречающийся между генами 9-10 н 10-11, представляет собой последовательность TAAT0, в которой триплет ТАА является терминатором трансляции предшествующего гена, а атс кницнаторным кодоном последуовего. Второй вариант встречается между генами 6-7, И -12 и 12-wac и представляет собой перекрывание терминирующего тел н инициирующего ATG кодонов в пределах последовательности атса. остальные гены расположены также плотно, иногда даже с еще большим перекрыванием, например, 7-8. Нужно отметить, что такого рола перекрывания '5ыли описаны ранее для ряда других генов бактериофага Т4 . в то *с время впервые обнаружена система, где таким образом организованы 5 генов подряд (с 9 no wac).
Перед нниииаторными кодонами генов расположены сайты присоединения рибОСОМЫ. МОЖНО ПрСДПОЛОЖИТЬ, ЧТО рН()ОСОИН, 11|ОИДЯ последовательность гена, реинишшрует и начинает считывать следующий. Такой механизм приводил бы к одинаковой копиймости
-51 TC7AGAAAAAí¡AGGGCC7AGAGGGC7AGASG7AAAAC7C7GAAGA7G7G7GGCGCCAA7A 60 61 ACCCAAGG7A7GGCAAAA7AGCCCC7AA7GC7AAA7C7GT7ATTA7CAACGGCG7T77A7 : 20 121 ATAAAAGTATTAAAATCGCAGCTAAAGCTCTTAATATAAATTATAGTíCCTTAAAGGGGC 180 181 GAG77AAAGCGGGG7AT7A7AM7G7CAGGA77AAGT7A7GA7AAG7G7G77ACTGC7GG !40
orf qpX nSGLSYDICCVTAG 241 CCA7GAAGCG7GGCC7CCAACAG77G7GAA7GCTACACAAÍG7AAAG7A77CAC7GGAGG 300
HEAWPP7VVMA7QSKVF7GG 301 AA77GC7G77C7CG7AGCAGGCGA7CCAA77ACAGAACA7ACAGAAA77AAAAAGCCG7A 360
I AVLVAGDP1 TEHTE1 K K P Y 361 7GAAACACA7GGCGGAG7GACACAACC7AGAAC77C7AAG57A7A7G7CAC7GGAAAGAA 120
E7HGGV70PR7SKVYVTGKK 421 AGC7G77CAAATGGC7GA7CCAATATCATGCGGTGATAC7GTGGC7CAGGCArCATC7AA 130
A V 0 M A D P I SCGDTVAQASSK 481 AGTA77CA77AAA7AGGA7T7AAAA7GGCAAATACCCCTG7AAAT7ATCAA7TAACAAGA "540 V F I K *
orf of gt>6 M A N T P V H Y q L T R 541 ACAGCAAA7GC7A77CCCGAGATAT7CG7CGGGGGTACA777GCTGAA,UAAAACAAAAC :C0
TANAIPEIFVGG7FAEIKQN 601 C7CA7TGAATGGC77AA7GGCCAAAA7GAA77777GGA77A7GAT777GAAGGCÍCAAGA 560
l l EULNGQNEFLO YOFEGSR 6S1 T7AAACG77CTG7G7GACC7777AGC77A7AA7ACA77A7ACA77CAGCAG777GG7AA7 '20
LNVLCDLLAYUTLYI QQFGN 721 GC fGC7G7GTA7jWAGC777«7GCS7AC7GC7AAC77ACGAAS7TCAG77G77CAAGCT 7S0
AAVYESFNR7ANLRSSVVQA 701 GCACAAGA7AACGGATAT7TACCTACTÍCAAAATCCGCTGCGCAGACCGAAATTATG77A 340
AQDNGYIP7SKSAAQTEI ML 841 ACATGCAC7GACGCA7TGAATAGGAATTACAT7ACTATTCCTCGCGGAAC7CGC7TT77A 300
TC7DALNRMYI 71 PRG7RFL 901 GCA7A7GCAAAAGA1AC77C7G77AA7CCA7A7AAC77CGT77CrACCGAAGACG77A77 160
AYAKD7SYNPYNF VS7EDV1 961 GC7A77CG7GATAAAAA7AACCAA7A7777CCGCG777AAAA77GGCCCAGGGACG7A7A 1020
AI RDKMNQYFPRLKLADGRI 1021 GTAAGAAC7GAAA7CA777A7GA7AAA77AACACC7A77A7CA7T7A7GA7AAAAA7AT7 1080
VR7EI I YDKLTPi I I YDKHI 1081 GA7AGAAACCAGG7TAAATTA7ACGT1GATGGAGCGGAA7GGA7 T AW.TGGACGAGAAAG l140
DRNQVKLYVOGAEWINWTRK 1141 TCAA7GGT7CATGCTGGTTCAACATCAACGAT77ACTATA7GCGÍGAAAC7A77GATGGA lZOO
SMVHAGS7S7I YVMRET1 OG 1201 AACACTGAAT7C7An7TGGTGAAGGTGAAA7T7C7G77AATGClTCTGAA6GAGC77TG 1260
NTEFYFGEGEI SVNASEGAL 1261 ACCGC7AATTA7A7CGGAGG7C1IAAACC7AC7CAGAAC7C7ACGA77GT7A77GAGTAC 1320
7ANYIGGLKP7QNS7IVIEY 1321 AT7AG7AC7AA7GG7GC7GACGCGAACGGAGCAG7CGGAT777CA7ACGCAGA7ACA77A 1380
I S7NGADANGAVGFSYAD7L 1381 ACAAA7A7AAC7G7CA7CAA7A77AA7GAAAA7CCAAACGA7GA7CCAGA7777G77GGG 1440
7NI7VININENPNDDPDFVG 1441 GCAGA7GGAGGCGG7GA7CCAGAAGA7A77GAGCG7A77CGCGAA77GGG7AC7A77AAA 1500
ADGGGDPE0IERIRELG7I K 1501 CGCGAAACCCAACAACGA7GCG7AAC7GCGAC7GAC7A7GA7ACA77CG77TCAGAGAGA 1560
RE 7QQRCV7A7DYD7FVSER 1561 777GG77C7A77A77CAAGC7G77CAGAC777CAC7GA77C7ACTAAACC7GGG7A7GCA 1620
FGSI1QAY07F7DS7KPGYA 1621 777A77GC7GC7AAACC7AAA7CAGGA77G7A777AAC7ACCG7ACAGCG7GAAGA7A77 1680
F 1 AAKPKSGLYL77VQREDI 1681 AAAAA77A7CTCAAAGAC7A7AA777AGC7CC7A77ACGCCA7CAA77A777C7CC7AA7 1740
KNYLKDYNLAP1 7PSI I S P N 1741 7A7C77777A77AAGAC7AA777AAAAG7CACA7A7GC7T7AAArAAACTGC AAGAATr.C 1800
YLFIK7NLKVTYALNKL0ES 1801 G AAC AG7GGC77GAAGG7CAAA7AAnGAT AAAA77GA7CGC7A17 A7ACCG AAGATG7A 1 ¡360
EQWLEGQI I O K I 0RYY7E0V 1861 GAAATT7TTAAC7CG7CTT7CGC7AAA7CTAAGATGT7GACATATG7AGATGATGCAGAT 1920
El FNSSF AKSKHL TYVOOAO 1921 CA7TCTGTCATTGGTTCATCAGCGACTA7TCAAATGGnCGTGAAGTACAAAAC1TCTAT 1980
HSV1 GSSA71 QHVRE VQ HF Y 1981 AAAACG'CC7GAAGCGGGTA77AAATACAATAA7CAAA7AAAAGA(CG7TCTA7GGAA7CT !040
K7PEAG1KYNNQIK0RSMES 2041 AA7ACG7777CA777AA77C7GGACGAAAGG77G7AAA7CC7GA1AC7GGTTTAGAAGAA »100 H7F SF NSGR KVVNPD7GL E E
-62101 GATGTATTATATGACGTTCGTATAGTATCAACAGACCGAGATTCTAAAGGAATTGGTAAA 2160
D_VI YDVRIVSTDRDSKGI G К
2161 GnÀnATTGGTCCATTTGCTTCTGMGAT^TT^A^AA^TGAAAACjiTTCAGCCGTAT 2220
2221 ACAGGCAACGATTTTAACAAATTAGCAAATTCTGATGGACGCGACAAATACTATGTIATC 2280
2281 MTGAAATAMTTATCCAGCTMTGTGAT7?AT?GGWATCGCT1^TTWTTAACA 2340
GEINYPADVIYMNIAKINIT 23*1 TCTGAAAAATTTGAAGTTCAGACCATTGAATTATATÎCTGACCCAACCGATGATGTTATC 2400
SEKFEyOTIELYSOPTODVI 2401 TTTACTCGCGATGGTTCACTGATTGTATnGAAAAT6ACTTACGTCCACAATACTTAACT 2460
F-TRDGSllVFEHDLRPQYt. T 2461 ATCGATTTGGAGCCTATATCACAATGACAGTAAAAGCACCTTCASTCACTAGTCTCAGAA 2520 IDIEPISQ*
orf of go7 H T V К A P S V T S I ft 1 2521 TTTCCAAGTTATCCGCAAATCAGGTGCAAGTACGCTGGGATGACGTTGGTGCTAA1TTCT 2580
SKLSANQVOVRWDOVGANFY 2581 ACTATTÎTGTAGAMTCGCTGASACAAAAACAAACTCGGGGGAAAA1CTCCCGAGTAATC 2640
YFVEI AETTTN'SGENLPSNC 2641 AATATCGTTGGATTAATTTAGGATATACAGCAAATAATAGTITC7TTTTTGATGATGCTÍ 2700
Y R M I NLGYTANHSFFFDDAD 2701 ATCCATTAACAACAÏACATTATTAGAGTAGCCACAGCTGCGCAAGATTTTGAGCAGTCTG 2760
PITTYIIRVATAAODFEQSD 2761 ATT6GATTTATACC^AMAGTTTGAAÀC7^TT^C7ÇCA^Al|CTTA'IÇCApTCA^AC(\ 2820
2821 TGATTGAAATGCAATTAGCCAATIAATTCATTCAGGAAAAATTTACTCTIAATAATTCTG 5 880
I EHQLANKF I QEKF TLNNSO 2881 ATTATGTTAATTTTAATAATGATAC1ATAATGSCTGCATTGATGMTGAATCATTCCAAT <940
yynfnhdti haalhnesfqf 2941 TCAGCCCATCGTATGTTGMGTITCATCAATAAGTAATTTTAÎTATTGGTGAAAATGAGT 3000
SPSYVDVSSI S N F I (GENEY 3001 ATCATGAAATACAAGGTTCTATTCAGCAAGTATGTAAGGATATTAACCGAGTITATTTGA 3060
HEI OGSI OOVCKDI HRVYLH 3061 TGGAATCAGAAGaAATTCTATATCTnTTGAGCGCTATCAACCTGTAGTTAAAGTATCCA 3120
ESEGILYIFERYQPVVKVSN 3121 ATGATAAAfiGACAAteCTGGAAAGClGTAAAGCTCTICAATGACCGTGTAGGATATCCTT 3160
DKGQTWKAVKLFNORVGYPL 3181 TATCTAAGACAGTATATTACCAAÎCTGCGAACACAACATACGTTCTAGGATACGACAAGA 3240
SKTVYYQSANTTYVIGYDKI 3241 TTTTCTATGGCCGCAAATCTACTGATGTTAGATGGTCAGCCGATGATGTCAGATTTAGTT 3300
F Y G R К S ТО V R W S A DO Y R F S S 3301 CTCAGGATATAACATTTGCTAAACTTGGCGACCAATTACATCTAGGATTTGATGTAGAAA 1360
QD1 TFAKLG0QIHLGF0VE1 3361 TTTTTGCCACTTACGCGACTTTACCAGCGAATfiTATACCGCATTGCAGAAGCTATTACTT 3420
FATYATLPANVYRI A E A 1. T С 3421 GCACCGATGATTACATTTACGTTGTCGCCAGAGACAAAGTTAGATACAÎAAAAAtGAGTA 3480
TOOYI YVVAROKVRYI К T S N 3481 ATGCACTTATAGATTTTGATCCATTATCTCCAACATATTCGGAAAGACTTTTTGAACCÎG Î540
ALIDFOPLSPTYSERIFEPD 3541 ATACCATGACTATAACCGGAAATCCTAAAGCAGTATGCTATAAAATGGATTCTATCTGTG 3600
T M T 1 TGNPKAVCYKMDSI СО 3601 ATAAAGTTTTTGCTCTTATTATTGGTGAAGTTGAAACATTAAATGCTAATCCTAGAACAT 3660
KVFALI 1GEYETIHANPRTS 3651 CAAAAATAATTGAT7CCGCTGATAAAGGAATAWGTTTTAAAÎCATGACGAAAAAACAT 3720
Kl I 0SADKG1 YVLNHDEKTW 3721 GGAAAAGAGTTTTTGGTAATACCGAAGAAGAAAGAAGACGTATTCAACCCGGATATGCGA 3780
KRVFGNTEEERRRI QPGYAN 3781 ATATGÏCAACTGACGGTAAATTAGTTTCTCTGICTTCGAGTAAITTTAAATTTTTAAGTG 3840
HSTDGKIVSLSSSNFKFISO 3841 ATAATGTTGTTAATGACCCTGAAACTGCAGCAAAATATCAGTTAATTGGCGCTGTTAAAT 3900
HVVNDPETAAKYOLl G A V К Y 3901 ATGAATTTCCTCGTGAATGGTTAGCTGATAAGCATTATCATATGATGGCATTTATAGCGG 3960
EFPREWLADKHYHMMAFI АО 3961 ATGAAACATCTGATTGGGAGACTTTTACTCCTCAACCAATGAAATACTACGCAGAACCAT 4020
ETSDVETFTPQPMICYYAEPF 4021 TCTTTAACTGGTCTAAAAAATCTAACACACGTTGTTGGATAAACAACTCTGATAGAGCTG 4080 F NWSKKSNTRCWI KKSDRAV
-74081 7ggtag777a7gc7ga777aaaa7acac7aaag77a7agaaaa7a77ccggaaaca7cac 4140
vvyaoiky7kv1enipe7sp 4141 caga7agat7ag77ca7gaatac7ggga7ga7gg7ga77gcac7a7ag7aa7gccaaa7g 4200
drlvheywdd6dc71 vhpnv 4201 tcaaattcactggatttaaaaaatacgcatcaggaatgct77tctataaagcctccggtg 4260
к f tgfkkyasômlfykasge 4261 aaa7aa777c77ac7a7ga7t77aac7a7cg7g7gagaga7acag7agaaa77a777gga 4320
i i syyqfnyrvr07ve1 1 wk 4321 agccaactgaagtatttttaaaagcatttttacaaaaccaagagcatgacactccttggt 4330
p 7evfik.aflqnqehe7pw5 4381 caccagaagaagagcgtggattagctgaccctgatttaagaccat7aattggcacaatga 4440
peeergiaopolrpli g t h m 4441 7gcc7gat7c77att7gttacäg6a77cgaa7t776ag6catt7tgcgaa6ca7atat1c 4500
pdsyllqdsnfeafceayi q 4501 agtatctttctgatggatatggaactcaatacaataatttacgaaatttaattçgtaacç 4560
yl sdgyg7qynnlrni i rnq 4561 aa7a7ccacgagaagagcacgca7gggaa7a777g7gg7cagaga7a7a7aaaagaaaca 4620
ypreehaweyiwsei y к r n l 4621 t77a7t7aaa7gc7ga7aaacgcga7gc7g77gcgaga7tc777gaa7cacg7agc7a7g 4630
ylnaokrdavarffesrsyd 4681 atttttattctactaaaggaattgaagcatcatacaag7ttctttttaaagttctttata 4740
fys7kgieasykflfkvlyn 4741 a7gaagaag77gaaa77gaaa77gaatc7ggggc7gg7ac7gaa7a7ga7a7aa7cg77c 4800
EEVEIEIESGASTEYD1 IVO 4801 aatc7sa7tc7t7gactgaaga7ttag7aggacaaacga77ta7acggcaacaggaagat 48s0
sositeoivgoti ytatgrc 4851 g7aa7g77act7ata7agaaagaagc7at7c7aatgg7aaat7gcaa7ggaccg7aac7a 4920
n v 7 y i ersysngklqw7v7i 4921 77ca7aa7c7777gggacgattaat7gctggtcaagaag77aaagcagaaagac7ccc7a 4980
hnllgrii agqeykaerlps 4981 g7777gaaggcgaaa77a77cg7gggg7taaa2gaaagga777gc77caaaacaa7a7ag 5040
fegei i rgvkgkoilqnni d 5041 ac7a7a77aa7agaag7agatcatactatg7aatgaaaa77aaatccaa77tacc77c77 5100
yinrsrsYyvhkiksnlpss 5101 cccguggaaa7ctgacg77a77cg7t7tg7lrca7ccagtagga7ttggatttatagcaa 5160
. R W К S D V I RFVHPVGFGF I AI 5161 î7accctt7taacaa7g77ta77aatgttggt77aactc77aaacatacagagac7a7.aa 5220
71l7mf1nvgltlkh7eti i 5221 ttaataaatacaaaaac7ataaatgggaî7c1ggattgcctactgaa7atgccgacagaa 5260
nkykmyxwdsglp7eya0ri 5281 tagc7aaa7taactccaaccggtgaaa7tgagca7ga77cagtaacaggcgaagcaattt >5340
akl7p7geiehdsv7geai y 5341 atgagcctggcccaatggctgg7gtaaaa7a7cc7ct7cc7ga7gac7a7aatgc7gaaa 5400
epgphagvkyplpddynaen 5401 a7aa7aa77caa7a777caagg7caat7gccg7c7gaacgacg7am77aatgag7cc77 5460
nnsifogqlpserrklhspl 5461 7at77ga7gcatcîggaacaacatt7gcgcaa7t7agaga777ag77aa7aaacgtc7aa 5520
fdasg7tfaqfrdivnkrlk 5521 aaga7aa7a7aggaaa7ccaagagaccc7gaaaa7ccaacacagg77aaaatagatgaa7 5580 0 n i gnpr0penp7qvk1 de*
orf of gp 8 И N
5581 ga77caagtg77a7c7a7cgtgcgatagt7act7caaaat77agaacagaaaaaa7g77g 5640
n s s v i y r a i vtskfr7ekhl 5641 aa7t7ttataa77caa7tggaagtggtccggataaaaacac7afctttatcacaingga 5700
nfynstgsgpokntifl tfg 5701 aga7gagaaccg7gg7ca7caaa7gaaaa7gagg7gggct7tgccccacc7tatccaacc 5760
rsepwssnenevgfappyp7 5761 ga77c7g7a77aggcg7aactgacatgtggacgca7atgatgggaacag7aaaagïtc77 5820
0svigv70hmthmhg7vkvl 5821 cca7caa7gc77ga7gc7g77a77cc7cgcagaga77ggggagatac7agata7ccgga7 5800
pshidavi prr0ug07ryp0-5881 cca7acacattta5aa7taacga7attgtagtgtg7aactcagctcc7tacaacgctact 5940
pytfr1nd1 vvcnsapymat 5941 gaatcaggcgctgg7tgg77ag7gta7çg77g777aga7g77cctgataccgg aa(gtgt 6000
esgagwlvyrclovpdtgmc 6001 7caa7agcatc777aac7ga7aaaga7gaa7gcc77aagt7agg7ggaaaatggac7cct 6060 siasltdkdeclklg gktftp 6061 7ctgc7agg7caa7gactccgcctgaagg7cgaggagaîgctgaaggaacaa77gaaccc 6120 sarsm7ppegrgdae g7i ep
6121 GGAG/VCQGQTAIGIGiqggaai AI к IA f i itiaüai ILLücc lfaft)ui«li. ini/wtimun oitiu
GOGYVtíEYIFEIPPDYSl HR 6182 TGCACGAATGAATATATCGTSGTTCCtTGGCCTGAGSWTTAAAAGAAGACCCGACTAGA 62 АО
CT К EVI VVPWPEEIKEDPTR 6241 TGGGGATATGAAGATAÄTCTCACTTGGCAAiAAGATGATTnGGATTAATTTACCGTGTT 6300
V G Y E О N I TWQQOOF Gl 1 Y Ц V
6301 AAGGCAAAIACIATCCGinTAAACCATATlTAGATKAGTnAHTlCClGAAGCIGCA 6360
KA К TI RFKAYIDSV YFPEAA 6361 TTACCAGGAAAÎAAA5GATTTAGACAAATAÎCAATAATCACGAATCCTCT1GAAGCTAAA 6420
IPGNKGFRDI S11TNPLEAK 6421 GCTCATCCAAATGACCCAAACGTTAAAGCTEAAAAGGATTAÎTATGACCCASAAGATTTA 6480
A HPHDPHVKAEKDYYOPEDl 6481 ATGAGGCATTCGGSTGAAATGATTTATATGGAAAATAGSCCACCTATTATTATGGCAATG 6540
« R H S G E И I Y К Е (5 R Р Р I I И А H 6541 GATCmCAGAASAMTCMWTCTGTTTACAÎTTïAAATTAfôGGAGCCCATGGGCTC 6500
D Q T E E I H I L F T F * end of оэ8 6601 CCTTTTTCTTTATAAATACTATAAACTCATAAr.GAAACCGCTATGTÍCATTCMGAACCA 6660
orf of <?эЗ » F I Q E P 6661 AAGAAATTGATTGATACCGGCGAAATTGGTAACGCTÎtTACTGGTGATATCTTATTCGAC 6720
KKIIDTGEIGNASTGDILFD 6721 GGTGGTAATAAAATTAATASTGATTTTAACGCAATTTATAATnCGTTTGGCGATCAGCGT 67 ВО
G G К !C I Ii S 0 F f! A Г Y H A F G D O R 6781 AAAATGGCAGTAGCAMTGGCACTGGAGCAGATGGTCAAAnATCCATGCTACTG3ATAT 6B40
К И A V A К G T G A 0 G О I I И A T G Y 6041 TATCAAAAACACTCTATTACWAGTACGCAACTCCAiiTGAAAGTTGGCACTAGACATûii'f 6900
V О К Fi S I TEYATPVKVGTRHP
6501 ATTGATACCTCTACTGTAGGTGTTAMGTTAKATTGAAAGAGGCGAACTCWCGATI.Г! 6S60
IDTSTVGVKVIIERGEIGDC 6951 GTTGAATTCATTAACTCTAATGGATCAATATCAGTTACTAAICCTTTGACAATTCÂ/.uCT 7020
V E F l H S N G S 1 S V T H P l T l Q .
7021 ATTGATTCAATTAMGGTGTT7CA5GTAATTTAGTAGTAAC7AGCCCATATAGTAi/GTr 7080
IOSIKGVSGHIVVTSPYSKV 7081 ACTTTACGCTGTATTTCATCTGATAATTCTACGTCGûTTTGGAATTATTCTATTGAAAGT 7140
ï L Í! С I SSOHSTSVUNYSI ES 7141 ATGTTTGGACAAAAGGAATCACCAGCTGAAGGTACATGGAATATTTCTACATCÏGGATCA 7200
4KFG0KE5PAEGTUNI S T S G S 7201 GTTGACATTCCATTATTTCATCGTACTGAATACAATATGGCTAAATTGCTAGTTACGÏGC 7260
VDIP1. rURTEYMMAKLLVTC 7261 CAATCGGTAGATGGAAGAAAAATTAAAACAGCAGAAATAAATATTCTTGTGGATACTGTT 7320
Q S V Ü G U 1С 1 К î A E I К I L V U T V 7321 ÄATTCAGAGGTAATTTCTTCTGAATATGCTGTCATGCCAGTTGGGAATGAAACCGAAGAA 73C0
N S E V I S S E Y A V И R V G !! E TEE 7381 GACGAAATCGCTAATATTGCATTTAGTATTAAÍS:VV1ATTATGTAACGGCGAC1ATAAGT 7440
D í 1 A N I A F S I К E I¿ Y V 7 A T ¡ S 74« TCTTCAACTGTCGGTATGAGAGCAGCACTTAAAGTTATCGCTACGCAGAAAATCGGGGTG 7500
S S T V G И Г. A A V К V I A T О К I G V 7501 GCTC^mTGA,UCAAAATATTAATATCGGTMTGTTETAGATGATGGTACCGGTGACT 7560 A Q *
ciolO tt U 0 H I К I G N V V D D G T G 0 Y 7551 »*£CTGCCTAAAP,GTGCTATAAAAATAAATGAATACTTTDATGWCTTTATTATGAACTCG 7620
L R t' G G í К i I! í fi F D E L Y Y F L G 76?.! GTG.MGGTGATGTTCCATATTCAGCCGGTGCClGGAAAACTTAÎAATGCnCATCA'jGAC 76SG
0 G О V P Y S A С Л W К T Y H A S S G (.>
768! AAACATTAACA!£AGAATGGGGAAAATCATACGC1ATTAATACAÎCTTCTGGAAGAGTGA 7740
î L T A t U G К £ Y A 1 lí 1 S S G R v T 7?-à CTATAAATCTTCCA.WGGGTACAGTTAATGATTACAACAAGGTAATTAGAGCTAGAGACG 7800
5 f! L P u G T V II D Y li К V 1 R A Р. О V 75 Oi TATTTGCTACATGGAACGTCAACCCMTTACACTAGTAGCTGCTTCCGGCGATACGATTA 7G50
Г A Г U К V Ii P V T L V A A S G 0 1 ¡ ü 7861 AAGGGTCTGCAGTACCA5TTGAAATTAATGTTCGATTCASCGATTTAGAACTAGTGTATT 7S2 О
G S A V P V E I I! V R F S D L E t. V Y Г 7S21 GTGCCCCAGGACGTTGGGAATATGICAAAAATAAACAAATTGACAAAATTACCAGTICAG 79БС
A P (■ R " E Y V К N К Q I OKI f S $ D 7S31 ACATTAGTAATGTAGCTCGCAAAGAATTTTTAGTTGAAGTTCAAGGACAAACAGACTTTT 60ÍC
1 S H V A R К E F L V E V Ö G 0 T D F t.
8041 TAG ATGTTTTCCGTGGAACTAGTTATAATGT/IAATAACATCAGAGTAAAAC ATCGTGGT A 81 CO D V F R G T S Y M V Ü 13 1 R V К H R G H
-96101 ACGMTTGTATTACGGCGATGTGTTrASCGAAAAC7SC5AT7TTGSCrciCCASGCGAAA 8160
ELYYGQYFSERSOFtíSPSEN 8161 ATGA«GGAGA^CrGGrTCCTCTTGATGGATTTAACATTCGAITi-j:5.XSaCCTTGTAATA C220
EGELVPLDGFHIRLRQ?CNI 6221 TTGGTGACACTGTTCAMTTGAAACATTTATGSATGGTSTATCiX/Sf^SÄAGTTCAT 8230
a D 7 V О I ETFHOGVSOJfRSSY 8281 ATACAAGACGTCAAATTAGATTGTTASATTCAAMTFWCGTCW^JîCnciTTAfiAAG 834Q
T R Я 0 I RILDSKLÏSKT5LEG 8341 GAAGCA7T7ACGT7AC7GA77TA7CAACAA7GAAATCAAncCATTrfCISCTTT7GGAT 84C0
SI YV70LS7HICSI PFS.1FGL 8401 TAAT7CCAGGAGAACCTATlAA7CC7AAC7CTCT7G?,S3TTCGTnTÄ^SSGAT7TTAC 8460
l PGEPl HP«SLE*aF:iGlLg 8461 AGGAA7TGGCTGGC^CA37TGGAATGCCA7TATT7CATTG751TSST5CCSA7TCAGACü 8520
E L AGTVGNPLFHCVSA3SDD 8521 A7GAAGTAGAA7GCTC7G7TTT",GGTGGAACTTGCGAACÄA7CICM.'CCSA77A7TCAG ES 80
EVECSVLGGTUEgSHTOYSV 8581 77GAAACTGA7GAAAACGCCATACCAGAAA7TT7ACA7TTCGATrXCáTAnTGAGCA7G 85',0
ETOENGIPEILHFOSÏFEHG 8541 G7GACA77A7CM7A7CñCC7GGTnAA7AA7GA7TrGSG7ACATT¿nT/lPí;AAAAf.ATG S7C0
01 1 >4 I 7WFHNOLGTLL 7 К D E 8701 AGA77A77GATGAAAC7GA7AA7C7C7A7G7A7CGCA/¿5ACCTSGÍ3T/aATA7TTC7G 8760
î I DETDHLYVSOGPSVDI SG 3761 GÎGÂTjTAAA777AACA5AC7TCGATAAAAT7G57TG£CCAAATGTÎSX*SCAS7TCMT 8820
• О V fl L T 0 F О К I G W P И V E А V g s S921 CT ÍA7C.V-CGC'jCATTTAA7GCTGTT7CAAA7A7C777GA7ACílAITfA7tC7A77GGAA ËSSO
YORAFHAVSfil fD7I f ? I G 7 6881 C7ATA1A7GAAA/£GCIGT7AA1CCAAATASCCC7G7TACAÍAT;,TCSS.MÍCGGCTCA7 8940
I YENAVNPNNPVTYMGFGS« 8941 GGAAA7TAT77GGGCAAGGAAAAG7TTTAGTTGGATGGSATGA,"S5TKmCGGACCCTA SOSO
KLFGQGKVLYGHKEOÏ SOPH S001 AC777GC7CTAAATAACAACGAT77AGAT7CGGGTSGAAATCCTTCiXATACCGCPi;GTG SOSO
F ALNNNDIOSSGHPSHTAGG 906Î GAACAGG7GGTTC7AC7TC7G77ACAT7GGAAAA7CCTAATCTTCCffiCAS£TGAAACAG 9120
TGGS7SV7LEKAÍttPATE7D 9121 A7GAAGAAGT7C7AATA3ÎTGA7GAAAA7GGA7CA3ICATTGTrESTGSSTG7CAA7ACG 9180
.. EEVlIV0Ef)GS*IV6GCqY0 9181 ATCCAGATGMTCCGGTCCiA7TT/£AC7AMTACCGTGA^CTASAIXÄTCTAC7AACT 9240
PQESGPI YTÍCYREASCA5THS 9241 C7AC7CACAC7CCECCAACATCAATAACTAACATTCAf£CATATftTIiCASTriÄTCGTT 9300
T HTPPÎSITKIQPYÏTVYR« 9301 GGA7AAGGA77GCA7AATGA57T7ACTTAATAATAA^CGGGiGTTÄTTTCCCGCT7AGC 9360 IRIA*
orf of coll HSLLKNKAGVISRLA 9361 CGAT77TC77GGT7T7AGACC7AAAAC7GGCGACATT5ATGTMTSASTCSTCMTCAGT 9420
OFLGF RPIC7GDI 0VH:4 3QSV 9421 CGGGTCAG7GACAA7ATC7CAATTAGCGAAAGGATTTTATGA.4XSASCATftGAA7CAGC 9480
GSVT1 SQIAHGFÏEPH1ESA 9481 TATTAA7GACGT7CATMTTT7TC7A7AAAAGACG7TGGCAC/lATTA7TíCTAATAAAAC 9540
I NOVHKF SI К D V G 7 1 I 7NKT 9541 7GGTGTT7CTCC76AGGGTGTTTCTCAAAC7GATTAT7GGGCÂ71TTCTG6AACTG7AAC 9600
GYSPEGVSOTDYWAFSSTVT 9601 AGACGATTCTCTTCCTCCGGGTTCTCCTA7TACGG7AÍTÍG7A7TTSSTCTTCCAGT7TC 9660
DOSLPPGSPITVLVFeiPVS 9661 AGCAACAAC7GGAA7GACGGCAATTGAG7TTGTTGCAAAÍGTTCKfiTÍ£CfiCTACAAGA 9720
AT7GH7AI EFVAKYÍIWALQE 9721 AGCTA77GCG7CA77TAC7GC7A7CAATTCATATAÄASACCATCCMCTEÄIGGTÄG7AA 9780
A1ASFTAINSYK0HPTDGSK 9781 A77AGAAGT7AC77A7TrAGA7AATCAAAAACA7GWTAfiGC«CATAnCIACATATGG 9840
LEVTYIDHQKHVLSTYSTYG 9841 AA7AAC7AT77CCCAAGAAA77ATA7C7GAG7CTAAGCC7GGCTÄTSSTACATGGAAT7T S900
I TI S O E i 1 SESXPGY6TUNL 9901 ATTGGGCGCACAAAC7GTAAC7TTAGATAATCAGCAGAC7CCTACÍffiTATrrTATCATTT 9960
LGAOTVIUDHOOIPIKFYHF 9961 TGAGWSAACAbCAT6AGTAATAATACATATCAACACSTTTCTAA7SAATCTCGTTA7GTA 10020 E R T A *
gol 2 HSNMTYQHV5NESRY V 10O21 AAATTTGATCCTACCGA7ACGAAT7TTCCACCGG^5AT7ACTGATSTTCÍCGC7SCTATA 10080 KFDP TDTNFPPE! T D « 9 Л A I
-1010031 GCASCCATTTCTCaGaGGAGTAAATGG^TCClGMGCATCGKAACAACAMGGGA 1 Ol 40
А А I SPAGVMGVPOASSTTKG 10141 ATTCTATTTATTCCCACTGAACASGAAGTTATAGATGGAACTAATAATACCAAA5CAGTT 10200
I L F I PTEQEVIDGTNNTKAV 10201 ACACCAGCAACGTTGGCAACAAGATTATCTTATCCAAATGCAACTGAAACÎGTTTACGGA 10260
tpatiatrisypnateïvyg 10261 TTAACAAGATATTCAACCAAÎGATGAAGCCATTGCCGGAGTTAATAATGAATCTTCTATA 10320
LTRYSTNDEAI AGVNN.ESSI 10321 ACTCCAGCT AAATTTACTGTCGCCCTTAATAATGCGTTTGAAfiCGCGAGTTfCAACTGAA 10380
TPAKFTVALNNAFETRVSTE 10381 TCCTCAAATGGTGTTATTAAAATTTCAICTCT/XCGCAAGCATTAGCTGGTGCAGAIGAT 10440
sshgvikisslpqaiagado 10441 ACIACIGCAAIGACICCA1ÍAAAAACACAGCAGUWC1AÍ1AAAUAAUGCGCAAAU 10500
TTAMTPLKT QQL Al К L I A g I 10501 GCTCCTTCTGAAACCACAGCTACCGAATCGGACCAAGGTGTTGrtCAAÏTAGCAÂCASTA 10560
APSETTATESO'QGVVgiATV 10561 GCGCAGGTTCGTCAGGGAACTTTAAGAGAASGCTATGCAATTTCÏCCTTfiTACGTTTATG 1.0620
AQVROGTIREGYAI S P Y T F К 10621 MTTCAÎCTTCTACTGAAGAATATAAAGGCGTAATTAAATTASGAACACAATCAGAAGTT 10S80
NSSSTEEYKGVI К L G T 0 S E V 10681 AACTCGAATAATGCTTCTGTTGÇGGTTACTGGCGCAACTCTTAATGGTCGIGGTTCTâCG 10740
NSNNASVAVTGATLNGRGST 10741 ACGTCAATGAGAGGCGTASTTAAATTAACTACAACCGCCGGTTCACAGAGTGGAGGCGAT 1OBOO
TSNRGVVKLTTTAGSQSGGD 10801 GCTTCATCAGCCTTAGCTTGGAATGCTGACGTTATCCACCAAAGAGGTGGTCAAATTATC 10B60
ASS ALAWNADVI HQRGGQI I 10861 TATGGAACACTCCGCATTGAAGACACATTTACAATAGCTAATGGTGGAGCAAATAÏTACG 10920
YGTLRI EDTFTI A N G G A N I T 10921 GGTACCGTCAGAATGACTGGCGGTTATATTCAAGGTAACCGCATCGTAACACAAAATGAA 10980
GTVRMTGGY1 OGNRI V7QNE 10981 ATTCATAGAACTATTCCTGTCGGASCTATTATGATGTGGGCCGCTGATAGTCTTCCTAGT 11040
I DRTI P V G A I HMWAADSLPS 11041 GATGCTTGGCGCTTCTGCCATGGTGGAACTGTTTCAGCGTCAGATTGTCCATTATATGCT 111 00
DAWRFCHGGTVSASDCPLYA 11101 TCTAGAATTGGAACAAGATATGGCGGAAACCCATCAAATCCTGGATTGCCTGACATGCGT 11160
SRI G1RYGGNPSHPGIPDMR 11161 GGTCTTTTTGTTCGTGGTTCTGGTCGTGGTTCTCACTTAACAAATCCAAATGTTAATGGT 11220
GLF VUGSGRGSHS-THPHVHG 11221 AATGACCAATTTGGTAAACCTAGATTAGGTGTAGGTTGTACCGGTGGATATGTTGGTGAA 11280
MDQFGKPRIGVGCTGGYVGE 11281 GTACAGAAACAACAGATGTCTTATCATAAACATGCTGGCGGATTTGGTGAGCATGATGAT 11340
VQKQQHSYHKHAGCFCEHDD 11341 TCTGGGGCATTCGGTAATACCCGTAGATCAAATTTTGTTGGTACACGTAAAGGACTT6AC 11400
SGAFGMTRRSNFVGTRKGLD 11401 TGGGATAACCGT7CATACTTCACCAATGACGGATATGAAATTGACCCAGAATCACAACGA 11460
HOtlRSYFTHDGYEI DPESQR 11461 AATTCCAAATA7ACAT7AAA7CG7CCTGAAT7AATTGGAAATGAAACACGTCCATGGAAC 11520
HSKYTLNRPELI GHETRPWN 11521 ATTTC777AAAC7ACATAA7TAAGGTAAAAGAATGACAGATA7TGTAC7GAATGACTTAC 11580 I SIHX. 11KVKE*
orf of gp vac К T D I V L H D I P 11581 CAT7CGTTGACGGCCCTCCTGCAGAGGGCCAGAGCCGCATTTCCTGGATTAAAAAC6GCG 11640
FVDGPPAEGQSRl SWI KHGE 11641 AAGAAATATÎAGGAGCTGACACACAGTATGGAAGTGAAGGCTCAATGAAÎAGACCTACGG 11700
El LGADTQYGSEGSMNRPTV 11701 TTTCTGTACTAAGAAATGTTGAAGTTCTTGATAAAAACATÎGGAATACTTAAAACATCTT 11760
SVLRMVEVLDKN1GILKTSL 11761 TAGAAACCGCAAATAGTGATATTAAAACAATTCAGGGCATCTTAGATGTATCTGGTGATA 11820
E TAKSDI К 7 I Q G 1 LOVSGDI 11821 T7GAAGC777GGCCCAAA7AGG7ATCAA7AAAÄAGGATA777CTGACC7CAAAACGCTAA 11880
EALAQI Gl N К К D 1 SDLK71 T 11881 CCAGTGAACACACAGAAATATTAAATGGAACTAATAATACGGTTGACAGTAHCTTGCCG 11940
SEHTE1 LNGTNNTVDS1 LAD 11941 ATATTGG7CCATTTAACGCCGAGGCCAAC7CTG7ATACAGAACGA7CAGAAATGATT7AC 12000
1 G PFNAE ANSVYRTI RNDLL 12001 TGTGGATAAAGCGTGAACTTGGACAATACACTGGTCAAGATATTAATGGTCTTCCTGTTG 12060
WIKRELGOYTGQOIHGLPVV 12061 TAGGAAATCCTAGTAGTGGAATGAAGCATCGCATTATTAATAATACTGATGTCATCACTT 12120 GNPSSGHKHR1 I NN TDVI TS
-1112121 CGCAGGG AATACGTTTAAGCGAATTAG AMC AAAArTTATTGAATCTGATGTAGGTTCTT 121 DO
OG1 RLSELE7KF I ESO VGSl 12181 TGACCATTGAAGTTGGTAATCTTCGTGAAGAGCTTSGACCGAAACCACCATCATTTTCAC 12210
TI EVGN IREEL6PKPPSFSQ 12241 AGAACGTTTATAGTCGTTTAAATGAAMTGACACTAAACAGRCAACAGTTGAGTCTGACA 12300
NVYSRLMEIOTKOTTVESDI 12301 TTAGTGC7A77AAGACC7CAA7AGGA7ATCCAGGAAATAATTCGATTATCACGAGTGTTA 12360
SAI KTSI GYPGWHSI 1 TSVN 12361 ATACAAACACTGATAA7ATTGCATC7A7TAA777A6AGC7AAA7CAAAG7GG AGGTATTA 12420
THTDHI ASINLELNOSGGl К 12 421 AAC AGCGTTTAACC6T7 AHGAAACTTCC AT7GGT1CAGATGA7 A77CC77CG AG7 ATTA 12480
QRLTVI ETSIGSDDI PSSI К 12481 AAÖÜTCAAATCAAAGATAATACAACTTCAATCGAATCTCTAAATGGAATCGICGGTGAAA 12540
GQIKD'NTTSIESLHGIVGEN 12541 ACACTTCATCTGGCTTAAGAGCGAATGTTTCATGGTTAAACCAAATTGTTGGAACTGATT 12600
TSSGLRANVSWLNQI VG7DS 12601 CT AGCGGTGG AC AACCTTCTCCTCCTGGGTCTCTTTTWCCG AGTTTCT AC AATTG AAA 12660
SGGQPSPPGSILNRVSTI ET 12661 CTTCTGTTTCAGGCTTGAATAACGATGTTCAAAACCTACAAGTAGAGATTGGTAATAACA 12720
SVSGINNDVQNLQVEI GNUS 12721 GCGCAGGAATTAAAGGGCAAGTTGTAGCGTTAAATACTTTAGTAAATGGAACTAATCCAA 12780
AGIKG0VVALN7LVNGTNPN 12781 ACGGTTCAACTGTTGAAGAGCGCGGATTAACCAATTCAATAAAAGCTAACGAAACTAACA 12840
GSTVEERGITNSI KAUETN1 12841 TTGCATCAGTTACACAAGAASTGAATACAGCTAAAGGCAATATATCTTCTTTACAAGGTG 12900
ASV70EVM7AKGN1 SSLOGO 12901 ATGTTCAAGCTCTCCAAGAASCCGGTTATATTCCTGAAGCTCCAAGAGATGGGCAAGCTT 12950
VQAL-QEAGYI PEAPROGQAY 12961 ACGTTCGTAAAGATGGCGAATGGGTATTGCTTTCTACCTTTTTATCACCAGCATAACATG 13020
VRKDGEliYLLSTFLSPA* 13021 GGGCCGCAAGGCCCCAAAGGAT77TAAATGTCAGGATATAATCCTCAGAATCCAAAGGAA 13080
orf of gpl3 MSGYNPQNPKE 13081 CTCAAAGATGTCATTCTAAGACGTTTAGGGGCTCCAAT7AT7AA7GTTGAGT7AACACCC 13140
LKOVIIRRLGAPI 1 N VEL7P 13141 GATCAAAT7TACGA7TGTATCCAGCGTGCCCTAGAATTATACGGTGAATACCATTTTGAT 13200
,.D OI YDCIQRALELYGEYHFO 13201 GGACTCAATAAAGGTTTTCATGTTTTTTATGTAGGGGATGATGAAGAAAGGTACAAGACC 13260
GLNKGFHVFYVGDDEER YKT 13261 GGAGTCTTCGATTTAAGAGGTTCTAACGTATT7GCAG7AACCCGCATTT7ACGCACAAAT 13320
GVFOLRGSNVFAVTRI LRTN 13321 AT7GGG7CAATAACA7CTATGGATGGAAACGCTACATATCCG7GG777AC7GAC777CT7 13380
IGSI TSMOGNATYPWFTDFL 13381 TTAGGAATGGCTGGTATTAATGGCGGAATGGGAACGTCTTGTAATAGATTTTATGGACCA 13440
L G M A G I NG6HGTSCNRFYGP 13441 AATGCCTTTGGAGCTGATT7AGGA7A777TACCCAGC77ACCAG7TA7A7GGGAA7GATG 13500
NAFGAOLGYFTQITSYMGMH 13501 CAAGATA7GCTC7CTCCTAT7CCAGACTTTTGGTTTAATTCAGCAAATGAACAGC7CAAA 13560
QDHL SPIPDFUFNSANEQIK 13561 GTCATGGGAAACTTCCAAAAATATGATTTAATTATCGTAGAAAGCTGGACÍAAATCATAC 13S20
VMGNFQKYDLI I VESWTKSY 13621 ATTGATACAAACAAAATGGTTGGAAATACAGTAGGATATGGAACAGTCGGTCCACAAGAT 13680
I OTNKMVGNTVGYGTVGPOD 13681 AGCTGGTCATTATCTGAACGATATAATAACCCAGACCACAATTTAGTAGGTCGTGTTGTC 13740
SWSLSERYNNPOHNLVGRVV 137 41 GGCCAAGATCCGAATGTTAAACAGGGTGCTTATAATAATCGTTGGGTGAAAGACTATGCA 13BOO
GQDPNVKOGAYNNRHVKOYA 13801 ACAGCTTTAGCTAAAGAATTGAACGGTCAAATTTTAGCACGCCACCAAGGTA7GA7GCTT 13860
TAIAKELNGQIIARHOGMML 13861 CCGGGCGGÍGTTACAAT7GATGGGCAGCGCTTAATAGAAGAAGCCAGATTAGAAAAAGAA 13920
PGGV7I DGORIIEEARIEKE 13921 GCACTGCGCGAAGAATTATACTTACTTGATCCTCCATTTGGAATTTTGGTAGGTTAATAT 13980 ALREELYILDPPFGIIVG*
orf of qpl4 M
13981 GGCTACTTATGATAAAAATCTTTTTGCTAAATTGGAAAACCGCACAGGTTATTCTCAGAC 14040
ATYDKNLFAKIENRTGYSOT 14041 CAATGAAAC7GAAATA7TAAATCCTTATGTAAATTTCAATCATTATAAAAACAGCCAAAT 14100 NE7EI LNPYVNFNHY KNSQ1
14101 ATTAGC7GATGTATTAGTAGC7GAAAGCATÎCAAATGCGAGGTGTAGAATGCTA7TA7GÎ 14160
l advlvaesiqhrgvecyyv 14161 7ccaagagagta7g777cccc7ga7t7ga7a77cggcgaagac77aaaaaa1aaa7t7ac 14220
preyvspdl1fgedlknkf7 14221 taaagcttggaaatttgctgcatatttaaattcatttîaaggatatgaaggagctaaatc 14280
kawkfaaylnsf-:gyegaks
14281 gttctttagtaactttggtatgcaagtacaagacgaafîtgactttatctattaacccaaa 14340
ffsnfgnqvqdevtlsi npn 14341 tttatttaagcatcaagttaacggaàaaga^cccaagtaaggtgatttcatatattttcc 14400
LFKHQVHGKEP K't G D L l Y F P 14401 7a7gga7aacagct7a7t7gaaa77aac7gggt7gaacca7a7ga7ccat7.77a7caa7t 14460
mohslfelnwvepydppyqt 14461 aagccaaaacgctattcgtaaaattacggcaggtaaattcatttattctîgagaagaaal 14520
g0nairkitagkfiys3ee1 14521 7aatccag7tc7acagaaaaa7gaaggaa7taaca77ccagaat7tagtgaat7agaa7t 14580
npviokneginipefselel 14581 aaatgctgttcgcaatcttaacggtattcatgacattaatattgatcagtatgctgaagt 14640
havrnlngihoihrooyaev 14641 aga7caaa77aa77c7gaagc7aaagaa7acg77gaacct7a7g77f77g7caa7aacag 14700
dol nseakeyvepyvvvnhr 14701 aggcaaatc777cgaaïc7agcccat77gacaa7ga777ca7gga77aa7aaa7at7a7a 14760
gksfesspfohdfmd* 14761 aac7aa77aaagcccgga77aggagaag7ca7gt77gg77at777ta7aa7tcg7c777t 14820
orf of qp!5 MFGYFYMSSF 14821 agacga7atgctacc77ga7gggcgat77g7777caaa7a7ccaaa7caaacg7cag77a 14sïù
rrya7lmgdlf sni 01 KRQL 14881 gaa7c7gg7ga7aagt77a7acg7g7tcc7a77acg7a7gca7caaaggaacac777a7g 14940
esgdkfirvpi7yaskehfm 14941 a7gaaa77gaaîaaatggaca7caa7aaa77cacaagaaga7gtagc7aaag77gaaact " 15000
mklnkvts. i HSQEDVAKVE7 15001 A77CTACC7CGTA7AAA77TACA77TAG77GA7Î77AGC7A7AATGC7CCAT7TAAAACA 15060
ilprinlhlvdfsynapfk7 15061 aaca77t7aaa1cagaa77tac7gcaaaaagg7gcaac77c7gtag7a7cgcag7a7aa7 15120
n1 lnon'llokgatsvvsqyn 15121 cca7c7cctattaaaa7ga7t7a7gaa7igag7atc7t7ac7cgc7a7gaaga7ga7a7g 15180
,.p s p i khi yelsi f7rye0dm 15181 777caaatag77gaacaga77c77cca7a7777caacc7ca7777aaiacaac7a7g7ac 15240
FOI VEQILPYF0PHFN77HY 15241 GAGCAG777GGAAA7GA7A77CCA77IAAAAGGGA7AI7AAAA7TG7AC7GATG7CTGC7 15300
eqfgnoipfkroikiylmsa 15301 gc7a7agacgaagc7a7aga7ggggataa777a7c7cg7cg7agaa7tgaa7gg7ca77a 15360
ai oeai dgonlsrrri ewsl 15361 aca777gaag7aaa7gga7gga7g7atcc7ccag7aga7ga7gcagaaggat7aa77cgt 15420
7fevngwmyppvddaegl1 r 15421 ac7ac7îa7acaga7777cacgccaa7acaagaga77igcc7gacggcgaagg7g7t777 15480
7 7y 70f han7r0l poge g vf • 15481 gaa7c7g7cgatagcgaag77g77cc7cgagata77gacccagaagac7ggga7ggaaca 15540
esvose vvproi 0pedw0g7 15541 g7aaaacaaac77tcac7ag7aa7g7aaatagaccaacaccgccagaacc7cc7ggccca 15600
vk07f7snvhrp7ppeppgp 15601 agaaca7agagg77a77a7ggaagg7c77ga7a7aaacaaactt77aga7a777c7gacc 15660 r 7 *
15661 tccccggaat7gacggggaggaaa7caaag7g7a7gaacc7c7gcaa77aca 15712
Рис.1 Нухлеотидная последовательность генома бактериофага 74 в области 79.313 - 94.900 единиц карты и предсказанные аминокислотные последовательности продуктов генов.
Таблкца i.
КИЛИЧССЧ 11(1 I ммиокпслотиих octihkoli ИМ мо\екулу (¡caví И[)ОЛуКТЫ IXIU1H 6 7 8 9 10 11 12 woe 13 14 15
Ala 42 62 17 20 26 14 44 22 1 5 1 3 0
Gin 27 35 4 9 17 9 21 22 13 1 1 1
lie 62 73 23 3 1 44 16 32 49 17 1 7 !1
Phe 28 55 13 3 23 10 14 5 14 18 8
су s 3 S 5* 3 5 0 3 0 2 1 0
Arg 29 49 37 8 21 5 27 16 15 6 ¡ 4
GlU 41 73 24 18 38 9 24 32 16 25 17
Leu 4! 68 18 10 3ß 15 27 41 29 17 17
Pro 24 42 2S 6 27 10 24 19 14 12 19
Тгр 5 18 9 2 11 2 5 4 5 2 4
Asn 52 68 19 ' 19 50 11 39 47 22 27 17
Gly 40 49 22 24 57 17 56 46 3 4 14. 13
Lys 32 61 H 16 22 10 17 20 12 1 6 1 2
Ser' 41 71 20 29 47 21 45 52 13 1 5 19
туг 39 67 17 9 25 8 13 7 17 1 6 12
Asp 49 69 26 15 45 12 24 26 20 1 4 20
!lis 2 12 3 4 7 4 а 2 4 3 4
M" t Г, 20 13 6 5 3 9 3 1 2 5 9
Til Г 55 69 23 25 45 24 56 40 16 7 19
VaL 4 0 63 19 26 49 19 34 34 19 17 16
Göi'iee 660 1032 334 289 603 219 527 487 3 09 256 272
колнче :СТ30
U г 74,3 119,1 38,0 30,7 66,2 23,7 56,15 51,8 34,7 29,5 ; i,
рк 2,27 2,57 2,37 1 ,91 1 ,95 1 , 67 1 .84 1 ,52 2 , 20 2 ,33 ; ,2
продуктов генов, вовлеченных и такую систему. Кроме того, извести» лэлярность мутаций в районе генов 9-wnc. очевидно, ято связано с тем, что рибосома нг. пройдя предыдущий ген, не кок г ренницичровать н начать трансляцию последующего, а присоединение других рнГосом к последовательности Шайн- \альг<|рно затру нено, в связи с тем, что вторичная структура РНК не разрушена прохождение« рибосомы по последовательности гредыдущего ге ia.
Для предсказания единиц транскрипции, расположенных в этом районе, Был проведен анализ последовате ьностн на на ,ичие поздних промоторов бактериофага Т4, а акже термин iropoe транскрипции.
Последовательность TATАААТТА, близкая по структуре к позднему промотору, расположена перед открытой рамкой < чнтыва -ния, названной ген х. Классический поздний промотор фага т» расположен перед геном 9, кроме того, две последовательноетн его напоминающие: ТААТАЛЛТЛ и ТАТЛЛЛСТАА расположены между генами 14 и 15.
Терминаторы транскрипции Е. coli были найдены: 1г:ред геном X, после гена 8 и в последовательности гена 14.
К настоящему стала известна последовательность, граничащая с геном X, из которой видно, что соседний ген 5 заходит за сайт'рестриктазы Xba I, и кончается примерно через 40 нуклео-тидов (O.Mosig, в печати).
Иэ всего изложенного," можно сделать следующие выводы:
1) белки, кодируемые генами X,- 6, 7 н 8 считываются с обпей м-РНК, транскрибирующейся с позднего промотора фага Т4. расположенного перед геном X, и эаханчиваюяенея в области терминатора, расположенного после гена 8.
2) Вторая единица транскрипции начинается с позднего промотора, расположенного перед геном 9 и включает п себя, как минимум, гены 9, ю, 11, 12 и wac. Эти гены перекрывается ме*-ду собой, как было описано выше, и, вероятно, уропень синтеза кодируемых ими белков примерно одинаков за счет механизма рен-нициации рибосом.
Между генами wac и 13 расположен обратный,повтор, формирующий, вероятно, шпилечную структуру в мрнк . Понятнэ, что это приводит к невозможности реинициашш рибосомы, что должно понижать уровень синтеза белка пг 1з.
He совсем ясна функция терминатора транскрипции в последовательности гена 14. Если это реально функционирующая структура, то продукция иг 14 долхип (шть чреэиычаиио мал», тик кнх функциональный (¡елок может считываться только с тринскрцптов, образованных проскакиванием РНК-полимеразы через терминатор транскрипции.
Вероятнее accru, геи IS считывпстся с собственного промотора, расположенного в конце гена 14.
Основываясь на наших данных ясно, что в области 79.313-94.900 единиц карты имеется три единицы транскрипции: первая включает гены X, б, 7, 8; вторая включает гены 9, 10, 11, 12, wac, 13 и, возможно, 14; третья включает ген 15 и, может быть, последующие гены 16 и 17.
Молекулярные массы белков близки к экспериментальным данным для всех продуктов, кроме пг 10. Предсказанная молекулярная масса примерно на 22 кла меньше массы определенной экспериментально. Это расхождение связано, как установлено недавно в работе т.Г.зурабишвили, с модификацией продукта гена Ю.
К моменту завершения работы К. Барреттом и П.Бергетом была опубликована иуклеотидная последовательность гена 11, которая полностью совпадает с нашими данными .
'Лополннтельнымнданнымн, подтверждавшими правильность нуклеотидных последовательностей и первичных структур предсказанных белковых продуктов явились .определения N-концевых последовательностей продуктов генов 9, 10, 11 я wac, сделаннье недавно Т.Г.зурабишвили совместно с японскими исследователями из группы А.Тцугиты (неопубликованные данные). N-кониевая аминокислотная последовательность пг 12 была сделана ранее в лг-боратории "Молекулярной генетики" ( Н.А.Селиванов). Эти даннье полностью соответствуют концевым последовательностям рассчитанным по данным секвенирования генов.
II.3 Создание векторов экспрессии генов белков базальшй пластинки бактериофага Т4.
. для создания векторов экспрессии была использована система на основе промотора и РНК-полимеразы фага Т7. за исходний вектор, несущий последовательность промотора фага Т7, была взята коммерческая ^лаэмнда pGEM-3Z. Наиболее важным предстаи-лялось создание корректного 5 -конца транскрипта, важного для стабильности мРНК и эффективности инициации трансляции. •
С этой целью был взят Hcol фрагмент ДНК, несущий последовательность генов с 9 по 12 (частично), причем, «бр 1зуюоийся транскрнпт при считывании с T7 промотора незначительно длиннее с 5-конца транскрнпта, счнтываюяегося с позднего промотора бактериофага Т4. Ориентация фрагяента была определена рестрик-ционным анализом и подтверждена секвениропанием. . Г олученнпя плазмида названа рС-З. В результате делетирования из нее фрагмента Pstl получена конструкция po-pstl. Лелеииен фрагмента Bai I-BaciHi с последующей достройкой липких концов i лигирова-нием получена плаэмида pC-Bnll. Аналогично получен;. конструкция pesaul, в которой делетнрован фрагмент Saul-Bar II.
Используя фрагмент Saul-Xbal из плазмиды рТ.-15 и соответствующие сайты в рс-з, была незначительно удлинена последовательность гена 12. Полученная конструкция получала обозначение pO-Xbal.
в плазмнду ро-з вместо фрагмента EcoRV-nindl11 был клонирован фрагмент EcoRV-Hindlll из рТТ-15, нссуинй последовательность бактериофага Т4 примерно до середины гена wac. полученная плаэмида названа pG-12.
Из плазмиды pG-12 был удален фрагмент Xbal-Hindlll и па его место вставлен фрагмент Xbal-Xhol (концы, образованные рестрнктазами HindllI и Xhol были предварительно затуплены фрагментом Кленова). Полученная плазмида названа pG-XhoI.
II.4 Экспрессия клонированных поздних генов белков бактериофага Т4 под контролем промотора фага Т7. для продукции бе \-ков, кодируемых генами, находящимися под контролем промотоза бактериофага Т7, был выбран атаии BL2I (DE3), содержащий в г;~ ноие ген РНК-полнмеразы фага Т7 под контролем lac промотор!, полученныый от W. Studier. Плазмиды, несущие гены белков б зальной пластинки бактериофага Т4, были трансформированы в этот птамм по стандартной методике.
Для подтверждения принадлежности экспрессируемых белк ш бактериофагу Т4 было сделано два нмиуноблотта: с антителами ia белки онриона бактериофага Т4 и с антителами на пг 12. Прои;-дуру проводили по стандартной методике. Полученные результат свидетельствуют о том, что п данных условиях в клетках Е. coli »Орниустся инруссисцифических продуктов ДО ДО'* 111' общего КОЛ1-
чества белка в клетке, причем по мере удаления от промотора синтез заметно не изменяется.
II.5 Анализ продуктов поэышх генов фага Т4 для использовании в качестве белков-носнтелей антигенных детерминант.
В лаборатории "Молекулярной генетики" на протяжении ря/.а лет ведутся работы со структурными белками бактериофага T4. Из продуктов генов, изучаемых в данной работе наиболее хоропо изученными и охарактеризованными следует-назвать пг 12, пг wnc и пг 37. для пг 12 получено больное количество данных, квсаи-ынхея действия на клетку их олигомера - коротких хвостотнс фибрилл фага и методов очистхи. В работе В.П. Ефимова, Б.И. Соболева и И.В. Неплюева пг wac и его олигомер - фнбритин детально охарактеризованы структурно и отработаны методы очистки олигомера, как из клеток, зараженных фагом, так и из продуктов экспрессии в Е. coli.
для того, чтобы сделать вывод о пригодности использования изучаемых я данной работе белков для встраивания чухероднпх эпитопов необходимо сначала оговорить принципы их оценки н критерии по которым они будут анализироваться. С технологической точки зрения необходимо, чтобы кроме правильной конформа-ции встроенной последовательности белок мог быть получен в болыэих количествах, растворим и позволял проводить быструю очистку без потери биологической активности, оценка структур химерного белка, которая зависит не только от свойств бел-ка-ноентеля, но н от места встраивания и структуры чужеродной последовательности, достаточно сложна к здесь рассматриваться не будет. Поэтому, следует отобрать исходный белок, опираясь только на его собственные свойства и возможности дальнейшего манипулирования. Исходя из всего сказанного, мохно предложить следующие критерии отбора:
1. Белковый продукт гена долхен нарабатываться экспрессн-онными системами в большом количестве; \
2. быть растворимым;
3. Быть в иативной, биологически активной конформяции, что дало бы возмохность встраивать в фаговые частицы химерные белки, в случае если при встраивании чухеролной последовательности активность у химерного белка не будет утрачена;
4. желательно, чтобы белок имел фуикшш, не строго необходимые фагу. Это расширило бы возможности по введению дете^-
иииаит непосредственно в внрионы без летальности для фага та ких мутаций;
5. Хелательно, чтобы белок был фибриллярным, а не глобу лярным, что значительно увеличивает количество потенциальны мест встраивания и будет способствовать расширенно возможное тей введения экспонированных наружу антигенных детерминант
' без потери функций белка;
6. Если белок содержится в вирионе в болыаом количссте копий, то это должно увеличивать иммунный ответ и повышаи чувствительность диагиостикумов, созданных на базе бактериофэ га с встроенным химерным белхом.
7. Наличие отработанной системы комплементации белка ji vitro дает болъиие преимуаества для проверки биологической активности продуктов непосредственно после экспрессии, в toi числе позволяет косвенно судить о сохранении исходной структу ры после встраивания чужеродных последовательностей.
Анализируя результаты секвенирования поздних генов фап Т4 мы заключили, что продукты генов с 9 по «ас удовлетворяв двум первый требованиях, для продуктов генов 9,11, и «ас coa даны системы комплементации in vitro, и результаты эксперимеи тов позволяют заключить, что эти белки биологически активнн > ПГ 12, как известно из литературных и данных навей лаборато-
рии, не собирается в нативную структуру без белка -поиоцннкл а создание системы комплементации in vitro для пг ю затруднено тем, что он участвует в процессе сборки базальной пластин» на одной из первых стадий. Ilr wac несушествснен для ннфекцион-ности фаговых частиц. Продухты генов 9 и И - глобулярные белки, а пг «гас - фибриллярный белок. К нксгояаему времени в лаборатории хороно отлажена очистка продуктов экспрессии в 2 coli для белков пг 9, Ю, И, wac. Продукт гена wac содержите: в вирионе в количестве не менее 18 копий, а пг 9 и пг И - ! хопии на вирусную частицу.
Исходя из вышеизложенного можно заключить, что нанболе удобными кандидатами для проведения белковой инженерии являет ся пг «ас, пг 9 и пг 11. Продукты генов 9 и U, вероятно, бу дут удобны также для изучения механизмов белкового фолдинга.
— 19— Выводы.
1. С помощь» рекомбнкационного анализа идентифицированы Уклоны, содержащие поздние гены бактериофага Т4 с б по is, и t тервые определена нуклеотидная последовательность днк, распэ-. >женная в области 79.313 - 94.900 единиц физической карты тема вируса.
2. Результаты анализа последовательности ДНК свидстельсг-'ют о наличии в данной области двух больанх единиц траискрип-111, каждая из которых находится под контролем единственного •зднего промотора фага Т4: первая включает гены б, 7, -8; втэ-1Я - гены 9, ю, 11, 12, wac, 13 и, возможно, ген 14.
3. для каждой из пар соседних геиов 6-7, 11-12, 12-wac ¡нарукено перекрывание терминирующего колона предоествуюиего на с инициирующим кодоном последующего в ранках последова-льности АТС А. Гены 9-Ю, 10-11 перекрываются в последова-аьиостн таato. Подобное перекрывание, по-видииону, способ-■вует реиниииацнн трансляции и обеспечивает синтез белков, днруемых генами одной единицы транскрипции в эквииолярных лнчествзх. Каскадное перекрывание пяти генов -10-1i-12-wac) является уникальным из известных единиц анскрипцин.
4. Идентифицированы открытые рамки считывания, которые ответствуют генам фага с 6 по 15; для продуктов генов 9, 10,' ,12 и wac N-концевые последовательности аминокислот были утверждены з дальнейшем экспериментально. Предсказанные мо-кулярные массы продуктов генов соответствуют экспериненталь-« данным, за исключением белка - продукта гена ю, у которо-
молекуляркая масса зрелого белка на 22 к&а больше расчетной \ичины; этот феномен связан, по-видимому, с постсинтетичес-i модификацией пг Ю.
5. На основе промотора бактериофага Т7 сконструированы сторы экспрессии для продуктов генов 9, Ю, п. 12 и wac. сторы позволяют синтезировать в Е. coli продукты клонировак-< генов на уровне не менее 30% общего количества белков в :тке. продукты генов 9; и н wac продуцируются в растворимой л и биологически активны в системе комплементации in vitro.
6. данные по определению последовательности генов фага , кодирующих структурные белки вирусной частицы, и резулыа-экспрессии позволили нам заключить, что продукты генов 9,
-2011 и vac являются удобными молелями для изучения механизмов белкового фолдннга и проведения белковой инженерии.
Результаты диссертации опубликованы и следующих работах:
1. А.0. Prilipov, N.A. Selivanov, L.I. Nikolaeva, v.v.Mesyanzhinov. Nucleotide und deduced i mino ncijl sequence of bacteriophage T4 gene wac// Nucleic Acid; Research.-1988. -V.16.- N21.- P.10361.
2. N.A. selivanov. л.О. Prilipov, v.v. Mesyanzhinov. Nucleotide and deduced amino acid sequence or bacteriophage 7 4 gene 12// Nucleic Acids Research.-1988. - V 16.- N5.- P.2334.
3. A.G. Prilipov, HlA. Selivanov, v.p. Efimov, E.I. Maru-sich, v.v. Mesyanzhinov. Nucleotide sequences of bacteriophage T4 genes 9, 10 and 11// Nucleic Acids Research.-1989. - v.17.-N8 - P.3303.
4. N.A. Selivanov, A.G. Prilipov, v.y . Mesyanzhino-v. Nucleotide sequences of bacteriophage T4 genes '3, 14 and 15// Nucleic Acids Research.-1989. - V.17.- N9.- P.43«4.
5. v.p. Efimov, A.G. Prilipov, v.v. Mesyanzhinov. Nuclec-tide" sequences of bacteriophage T4 genes 6, 7 and 8// Nucleic Acids Research.-1990. - V.18.- N17,- P.5313.
"6. N.A. Selivanov, A.G. Prilipov, V.p. Efimov. E.I. Maru--sich, V. v. Mesyanzhinov. cascade of overlapping late genes in bacteriophage T4// Biooedical Science,- 1990. - V.i. Pp.55-62.
7. A. Prilipov, N. Selivanov, v. Efimov, V. Mesyanzhinov. The structure of late transcription unit of bacter:ophage T4. II VIII International Congress of virology. - Bcrhn 1990. -W74—002.
Последовательность ДНК всех секвенированных генов фага 14 были представлены нами в EMBL Data Bank, г. Гендельберг, ФРГ.
гены 9, 10, И accession no. XI41?;
ген 12 accession по. Х0672'
ген wac accession по. XI288 t
гены 13. 14, 15 accession по. Х148Л
- Прилипов, Алексей Геннадьевич
- кандидата биологических наук
- Москва, 1991
- ВАК 03.00.03
- Геномика и протеомика литических бактериофагов Pseudomonas aeruginosa
- Бруцеллезные бактериофаги. Оптимизация технологии производства и способов применения в лабораторной диагностике бруцеллеза
- Взаимодействие нелизогенизирующих бактериофагов PSEUDOMONAS AERUGINOSA с клетками бактерий хозяина
- Бактериофаг АР22, лизирующий клинические штаммы Acinetobacter baumannii: выделение и изучение молекулярно-биологических свойств
- Структура ключевых генов прокапсида Т-четных бактериофагов