Бесплатный автореферат и диссертация по биологии на тему
Разработка компьютерных методов сравнительного анализа нуклеотидных последовательностей неограниченной длины
ВАК РФ 03.00.03, Молекулярная биология

Содержание диссертации, кандидата биологических наук, Ресенчук, Сергей Михайлович

Список используемых сокращений.

ВВЕДЕНИЕ.

ГЛАВА I. Обзор литературных данных.

1.1. Ортопоксвирусный геном.

1.2. Состояние проблемы изучения вирусов семейства Рохутс1ае рода ОгШорохупиБ к моменту начала выполнения проекта расшифровки полного генома вируса натуральной оспы (штамм Индия — 1967).;.

1.3. Обзор методов построения выравненных наборов нуклеотидных последовательностей.

1.3.1. Автоматические методы выравнивания последовательностей.„>.

1.3.2. Интерактивные системы выравнивания. Визуализация результатов выравнивания.

1.3.3. Диагональные точечные матрицы сходства последовательностей.

1.4. Методы исследования эволюционных связей.

ГЛАВА II. Предлагаемые методы сравнительного структурного анализа полных геномов.

2.1. Методы реализации.

2.2. Функциональная блок — схема разработанной технологии сравнительного анализа семейства последовательностей

ДНК.:.

2.3. Интерактивная система построения выравненных наборов.

2.3.1. ЛЬкализация областей сходства родственных последовательностей

2.3.2. Построение и использование диагональных матриц сходства.

2.3.3. Автоматическое подвыравнивание фрагментов последовательностей.

2.3.4. Механизм интерактивной коррекции выравнивания

2.4. Поиск потенциальных белок — кодирующих областей.

2.5. Формат* генерация и применение трансляционных карт выравненного набора геномов и отдельных последовательностей ДНК.

2.6. Исследование эволюционной близости последовательностей набора.

2.7. Поиск прямых и инвертированных повторов внутри последовательности.

ГЛАВА III. Результаты и обсуждение.

3.1. Компьютерный анализ данных, полученных при расшифровке нуклеотидных последовательностей полных геномов штаммов вируса натуральной оспы. Сравнительный анализ геномов вирусов рода Orthopoxvirus.

3.1.1. Международный проект по расшифровке и изучению структуры генома вируса натуральной оспы. Систематизация расшифровываемых фрагментов и выявление потенциальных ошибок секвенирования.

3.1.2. Поиск потенциальных генов.

3.1.3. Трансляционная карта выравненного набора ортопоксвирусов.

3.1.4. Топография инвертированных терминальных повторов ортопоксвирусов .'.

3.2. Применение предлагаемых методов в задачах анализа геномов других организмов

3.2.1. Выявление ошибок секвенирования при расшифровке последовательности ДНК линейной хромосомы спирохеты Borrelia burgdorferi

3.2.2. Адаптация и применение разработанных методов в программе "Геном человека"

3.2.2.1. Анализ репрезентативных клонотек хромосом генома человека

3.2.2.2. Систематизация клонотеки мышиного генома

Введение Диссертация по биологии, на тему "Разработка компьютерных методов сравнительного анализа нуклеотидных последовательностей неограниченной длины"

Актуальность проблемы. Ряд исследовательских лабораторий мира занимается картированием и изучением функциональных особенностей большого числа генов вирусов осповакцины и натуральной оспы, используя широкий спектр различных подходов и методов исследований. К настоящему времени определены полные последовательности ДНК целого ряда штаммов этих вирусов, систематические исследования геномной организации которых необходимы для выявления генов, детерминирующих наиболее важные биологические свойства ортопоксвирусов, патогенных для человека, познания эволюционных взаимосвязей между ортопоксвирусами, сравнительного изучения вирусных генов, кодирующих факторы преодоления защитных механизмов организма против вирусной инфекции, детерминирующих круг хозяев вируса, а также других видоспецифичных генов.

С 1977 г. не зарегистрировано ни одного случая заболевания человека натуральной оспой. Однако начиная с 1996 г. Всемирная Организация Здравоохранения отметила вспышку случаев заражения людей вирусом оспы обезьян (близкого родственника вируса натуральной оспы) в районах Центральной и Западной Африки, причем отмечен рост числа случаев распространения вируса от человека к человеку. Есть предположения о том, что окончание программ вакцинации против оспы в начале 80 —х годов привело к увеличению восприимчивости людей к вирусу оспы обезьян, чем объясняются больший размер вспышки, более высокая пропорция пациентов в возрасте До 15 лет и распространение через существенно большее количество передач от человека к человеку. Таким образом, исследование свойств вирусов семейства Poxviridae приобретает еще большее научно — практическое значение.

Компьютерные исследования генетических текстов приобретают всё- большее значение для выяснения механизмов жизнедеятельности различных организмов на основании анализа экспериментально полученных данных (Taubes G., 1996). Для понимания эволюционных взаимоотношений геномов и изучения изменения функций генов на основе информации о структурных различиях соответствующих генов родственных геномов незаменимыми являются методы сравнительного структурного анализа, базирующиеся на выравнивании нуклеотидных и аминокислотных последовательностей некоторого; семейства с целью максимизации перекрывания гомологичных фрагментов для идентификации консервативных районов, которые могут являться структурными доменами с функциями, сходными для всех членов семейства, либо вариабельных районов, которые могут быть ответственны за специфичность функций. Теоретический анализ полной последовательности ДНК позволяет решать задачи поиска и исследования всех потенциальных белков, является единственной возможностью определения и локализации всех прямых и инвертированных повторов внутри генома, дает возможность изучения стратегии генома в целом.

Задачи теоретического анализа полных геномов' ортопоксвирусов имеют свои особенности, связанные с характерными особенностями строения Геномов этих вирусов и большой длиной последовательностей ДНК, что Делает практически невозможным использование в этом случае общепринятых компьютерных методов сравнительного анализа. Таким образом, необходимость теоретических исследований полных геномов ортопоксвирусов влечет за собой необходимость разработки специализированных компьютерных технологий, позволяющих эффективно проводить такие исследования.

Вместе с тем, область применения этих технологий отнюдь не ограничивается семейством поксвирусов. За последнее десятилетие произошло резкое увеличение молекулярно — генетической информации, связанное с появлением высокоэффективных методов расшифровки первичных структур биополимеров. Стремительно пополняется список расшифрованных нуклеотидных последовательностей различных организмов. Сформированы и выполняются международные и национальные проекты расшифровки полных геномов высших организмов, и в первую очередь — человека. Для изучения получаемых экспериментальных данных требуется применение современных информационных и компьютерных технологий, и специализированные методы, разработанные и апробированные на задачах сравнительного структурного анализа полных геномов ортопоксвирусов, с успехом могут быть применены при теоретических исследованиях геномов других вирусных семейств, геномов бактерий и высших организмов.

Цели настоящего исследования заключались в а) создании компьютерных программ, реализующих алгоритмы сравнительного структурного анализа полных геномов; б) компьютерных исследованиях экспериментальных данных, полученных при реализации проектов секвенирования и изучения полных геномов штаммов вируса натуральной оспы с помощью разработанных компьютерных технологий; в) адаптации и применении этих технологий в задачах обработки и анализа последовательностей ДНК геномов и клонотек высших организмов.

Задачи исследования: '

1. Теоретическая разработка принципов компьютерной технологии сравнительного анализа последовательностей ДНК неограниченной длины; разработка новых компьютерных алгоритмов, а также адаптация существующих алгоритмов, в рамках сформулированных технологических принципов.

2. Создание компьютерных программ, реализующих разработанные методы и алгоритмы; создание и реализация принципов и средств визуализации результатов работы основных алгоритмов.

3. Компьютерная обработка экспериментальных данных, получаемых при реализации проектов полномасштабного секвенирования штаммов вируса натуральной оспы Индия—1967 и Гарсия—1966: верификация расшифровываемых фрагментов последовательностей ДНК и поиск возможных ошибок секвенирования.

4. Построение выравненного набора полных последовательностей ДНК известных и вновь расшифрованных геномов* ортопоксвирусов, выявление потенциальных вирусных генов и их гомологов, сравнительный анализ консервативных и вариабельных областей геномов.

5. Адаптация и применение разработанной технологии сравнительного структурного анализа в теоретических исследованиях геномов бактерий, а также в задачах систематизации и анализа репрезентативных клонотек хромосом человека и других высших организмов.

Теоретическая и практическая ценность. 1

Разработанный в настоящей работе комплекс компьютерных программ позволяет проводить сравнительный анализ нуклеотидных/аминокислотных последовательностей неограниченной длины и применим для компьютерных исследований полных геномов вирусов и других организмов.

Разработанные методы позволили осуществить полную информационно—теоретическую поддержку проектов расшифровки полных геномов двух штаммов вируса натуральной оспы, имеющих большое научное и прикладное значение. Полученные результаты анализа геномов ортопоксвирусов могут быть использованы для выявления видоспецифичных генов представителей разных видов ортопоксвирусов, установления эволюционных взаимосвязей внутри семейства поксвирусов, идентификации генов, перспективных для дальнейшего углубленного изучения и использования в медицинской и ветеринарной практике.

В результате анализа набора последовательностей ДНК репрезентативных клонотек 3-й хромосомы генома человека, а также клонотек мышиного генома, получены данные, использующиеся для создания крупномасштабных интегрированных физических и генетических карт соответствующих геномов.

Разработанный в настоящей работе комплекс компьютерных программ сравнительного анализа нуклеотидных/аминокислотных последовательностей использовался в, научных работах ряда научно-исследовательских институтов Новосибирска, Иркутска, Москвы, Санкт-Петербурга, Университета Хельсинки (Финляндия), Центра по изучению раковых заболеваний (¡СИР), Лондон, Англия, биологического отделения Брукхевенской Национальной Лаборатории (США) для проведения теоретических исследований и поддержки практических й экспериментальных работ с широким кругом геномой вирусов и других организмов.

Научная новизна.

Впервые предложены методы сравнительного анализа биополимеров, специализированные для работы с полными геномами неограниченной длины, разработана технология сравнительного анализа, использующая взаимодополняемость и взаимодействие мощных математических алгоритмов и реализующая таким образом комплексный и гибкий подход к решению исследовательских задач самого широкого спектра. На основе разработанных методов создан комплекс компьютерных программ, позволяющий осуществлять всеобъемлющую информационно —теоретическую поддержку проектов расшифровки полных геномов любых организмов и реализующий в отличие от существующих программ многостадийную компьютерную технологию сравнительного анализа.

Разработаны оригинальные средства визуализации результатов анализа, позволяющие создавать высокоинформативные генетические (трансляционные) карты сравниваемой группы геномов, фиксирующие все консервативные и вариабельные районы внутри этой группы.

В результате исследований вновь расшифрованных последовательностей ДНК штаммов вируса натуральной оспы получены новые научные данные по организации генома этого вируса, основанные на результатах сравнительного анализа геномов ортопоксвирусов.

Разработана новая классификация топографических элементов, формирующих области коротких концевые повторов генома ортопоксвирусов. Впервые показана видоспецифичность наборов коротких повторов, присутствующих у различных ортопоксвирусов.

В результате проведенных работ по систематизации и анализу клонотек 3-й хромосомы человека впервые были пбстроены отдельные непрерывные участки физической карты этой хромосомы, сделаны предположения о функциональной роли отдельных локусов. Аналогичные исследования были проведены для систематизации клонотек генома мыши.

Заключение Диссертация по теме "Молекулярная биология", Ресенчук, Сергей Михайлович

Выводы

1. Разработан комплекс методов сравнительного анализа нуклеотидных и аминокислотных последовательностей, функционально ориентированный на работу с полными про— и эукариотическими геномами неограниченной длины. Методы, реализованные в многофункциональном пакете программ Alignment Service, позволяют эффективно и корректно решать задачи поиска консервативных районов анализируемых геномов и подробного анализа вариабельных районов. Программа Alignment Service доступна для пользователей по Internet.

2. Разработан новый высокоинформативный и компактный формат представления результатов сравнительного анализа в виде автоматически генерируемых трансляционных карт, отображающих степень вариабельности последовательностей анализируемой группы геномов и потенциальных рамок трансляции.

3. Выполнена компьютерная поддержка проектов расшифровки полных геномов двух штаммов вируса натуральной оспы. Проведен компьютерный анализ структурной организации геномов различных штаммов вирусов семейства Poxviridae рода Orthopoxvirus, выявлены их пггаммо — и видоспецифичные особенности.

4. Предложена новая классификация топографических элементов, формирующих области коротких концевых повторов ортопоксвирусов. Впервые показана видоспецифичность сформированного набора субфрагментов этих областей.

5. Показано, что разработанная методология может быть применима в задачах выявления ошибок расшифровки ш сравнительного структурного анализа родственных геномов любых организмов. Показана применимость разработанной технологии для анализа клонотек геномов высших организмов. В результате анализа клонотек 3-й хромосомы человека впервые построены отдельны^ непрерывные участки физической карты хромосомы, сделаны предположения о функциональной роли отдельных локусов.

ЗАКЛЮЧЕНИЕ

Стремительное увеличение фактической молекулярно — генетической информации, происходящее в настоящее время, выдвигает на передний план проблему осмысления накапливаемого материала. Превращение разрастающихся банков данных в структурированные, корректные и связные базы знаний становится насущной задачей теоретической молекулярной биологии. Особенно актуальна эта проблема для международных программ расшифровки генома человека, накопивших и продолжающих получать громадные объемы эксперимёнтальных данных, нуждающиеся в систематизации и теоретической интерпретации. Разработанные нами методы и средства сравнительного структурного анализа нуклеотидных и аминокислотных последовательностей являются одним из инструментов, созданных для решения этих задач. Созданные нами компьютерные программы позволяют проводить сравнительный анализ полных первичных структур родственных геномов, . не накладывая ограничений на длины сравниваемых последовательностей. Эта отличительная черта нашего подхода, наряду со специализированным набором алгоритмов и функций, сформированным на основе практического сопровождения экспериментальных работ, предоставляют возможности изучения подробной картины сходства сравниваемых геномов в целом, выявления видоспецифичных генов, установления эволюционных взаимосвязей, идентификации генов, перспективных для дальнейшего углубленного изучения и использования в медицинской и ветеринарной практике.

Применение созданных нами пакетов прикладных программ для многопланового сравнительного анализа геномов большого числа вирусных семейств, эффективное их использование для компьютерной обработки данных при разработках диагностических зондов, возможности упорядочения клонотек и анализа протяженных фрагментов геномов высших организмов демонстрируют широкий спектр приложения этих программ в задачах теоретической молекулярной биологии.

Данные, полученные в результате работ в проектах расшифровки последовательностей ДНК ортопоксвирусов, являются информационным материалом, необходимым для дальнейших экспериментальных и теоретических исследований эволюционных взаимоотношений вирусных геномов, а также процессов изменения функций генов на основе информации о структурных различиях соответствующих генов родственных геномов, что открывает возможности выявления молекулярных факторов вирулентности и познания механизмов преодоления ортопоксвирусами многочисленных защитных барьеров организма — хозяина. '

Методы, разработанные для поиска повторяющихся областей внутри генома, могут быть использованы для формирования новой крупноблочной формы представления первичных структур нуклеотидных последовательностей, выделяя и компактизуя функциональные сайты, общей чертой которых является наличие нескольких копий этих сайтов внутри генома, и создавая таким образом новый уровень информативности молекулярно—биологических данных. Ведущиеся нами в настоящее время разработки такого подхода к

105 структурному анализу геномов различных организмов и, прежде всего, генома человека, финансируются Программой индустриального партнерства (IPP) Министерства энергетики США.

Выполненные теоретические и практические работы в разное время осуществлялись в рамках грантов Российской Академии наук, Российской Академии медицинских наук, Международной программы Всемирной Организации Здравоохранения, Российской государственной научно—технической программы "Геном человека".

Автор выражает искреннюю признательность научным руководителям данной работы за многочисленные плодотворные идеи в процессе формирования и применения разработанных методов анализа, проф. Щелкунову С.Н. за инициацию и активное сопровождение теоретических исследований ортопоксвирусов и предоставление неопубликованных материалов, а также многочисленным сотрудникам ГНЦ ВБ "Вектор" за полезные обсуждения, предложения и тестирование разработанных компьютерных программ.

Библиография Диссертация по биологии, кандидата биологических наук, Ресенчук, Сергей Михайлович, Кольцово

1. Агафонов А.П., Ничеухина С.Н., Патрушев H.A., Денисов С.И., Орловская С.П., Рябчикова Е.И., Блинов В.М., Игнатьев Г.М. Характеризация вируса паротита, изолированного в Сибири. // Вопросы вирусологии. 1997. Т. 42. Стр.222-226.

2. Гельфанд М.С. Компьютерный анализ последовательностей ДНК. // Молекулярная биология. 1998. Т. 32. Стр. 103-120.

3. Миронов A.A. Компьютерный анализ генетических текстов. // Под ред. франк—Каменецкого М.Д. 1990. М.: Наука. Стр. 11 —7/ Мосс Б. Репликация поксвирусов. // В кн. "ВирусЬлогия". 1989. М.: Мир. Т. 3. Стр. 246-286.л

4. Сафронов П.Ф., Петров H.A., Рязанкина О.И., Тотменин A.B., ЩелкуновI

5. С.Н., Сандахчиев Л.С. Гены круга хозяев вируса оспы коров. // Докл. РАН. 1996. Т. 349. Стр. 829-833.

6. Селедцов И.А., Вульф И.И., Макарова К.С. Множественное выравнивание последовательностей биополимеров, основанное на поиске статистически значимых общих сегментов. // Молекулярная биология. 1995. Т. 29. Стр. 1023-1039.

7. Щелкунов С.Н., Блинов В.М., Ресенчук С.М., Денисов С.И., Тотменин А.В., Сандахчиев Л.С. Семейство анкиринподобных белков ортопоксвирусов. // Докл. РАН. 19936. Т. 328. Стр. 256-258.

8. Щелкунов С.Н. Ортопоксвирусный геном. // Молекулярная биология. 1996. Т. 30. Стр. 5-32.

9. Altschul S.F., Erickson B.W. Optimal sequence alignment using affine gap cost. // Bull. Math. Biol. 1986. V. 48. P. 603-616.

10. Altschul S.F., Carrol R.J., Lipman D.J. Weights for data related by a tree. // J. Mol. Biol. 1989. V. 207. P. 647-653.

11. Altschul S.F., Gish W„ Miller W., Myers E.W., Lipman D.J. Basic local alignment search tool. // J. Mol. Biol. 1990. V. 215. P. 403-410.

12. Antoine G., Scheiflinger F., Falkner F.G., Dorner F. The complete genomic sequence of the Modified Vaccinia Ankara (MVA) strain. // Unpublished. 1997.

13. Argos P. A sensitive procedure to compare amino acid sequences. // J. Mol. Biol. 1987. V. 193. P. 385-396.

14. Baltz J.K. Vaccines in the treatment of cancer. // Am. J. Health Syst. Pharm. 1995. V. 52. P. 2574 2585.

15. Barber A.M., Maizel J.V.,Jr. SequenceEditingAligner: a multiple sequence editor and aligner. // Gene. Anal. Techn. Appl. 1990. V. 7. P. 39 4 45.

16. Baroudy B.M., Vankatesan S., Moss B. Incompletely base —paired flip —flop terminal loops link the two DNA strands of the vaccinia virus genome into one uninterrupted polynucleotide chain. // Cell. 1982a. V. 28. P. 315-324.

17. Baroudy B.M., Moss B. Sequence homologies of diverse length tandem repetitions near ends of vaccinia virus genome suggest unequal crossing over. // Nucleic Acids Res. 1982b. V. 10. P. 5673-5679.

18. Barton GJ., Sternberg MJ.E. A strategy for the rapid multiple alignment of protein sequence confidence levels from tertiary structure comparison. // J. Mol. Biol. 1987a. V. 198. P. 327-337.

19. Barton G.J., Sternberg M.J.E. Evaluation and improvements in the automatic alignment of protein sequences. // Protein engineering. 1987b. V. 1. P. 89 — 94.

20. Benson D., Lipman D.J., Ostell J. Genbank. // Nucleic Acids Res. 1993. V. 21. P. 2963-2965.

21. Blinov V.M., Resenchuk S.M., Chirikova G.B., Denisov S.I., Lebedeva T.V.,

22. Petrov N.A., Sosnovtseva S.I., Babkin I.V., Kashuba V.l., Klein G.( Kholodnyuk

23. D., Zakharyev V.M., Domninsky D.A., Bannikov V.M., Gizatullin R., Kisselev

24. L., Zabarovsky E.R. New type of short simple repeats in regulatory elements i ■» and effect of Alu repeats on recombinational events in human chromosome 3.

25. The 1994 Miami Bio/Technology European Symposium. Monaco. November17.20, 19946.

26. Buller R.M., Palumbo G.J. Poxvirus pathogenesis. // Microbiol. Rev. 1991. V. 55. P. 80- 122.

27. Chartier F.L., Keer J.T., Sutcliffe MJ., Henriques D.A., Mileham P., Brown S.D.M. Construction of a mouse yeast artificial chromosome library in a recombination — deficient strain of yeast. // Nature Genet. 1992. V. 1. P. 132 — 136.

28. Chumakov I., Rigault P., Guillou S., Ougen P., Billaut A., Guasconi G., Gervy P., LeGall I., Soularue P., Grinas L. Continuum of overlapping clones spanning the entire human chromosome 22q. // Nature. 1992. V. 359, P. 380-387.

29. Clark S.P. MALIGNED: a multiple sequence alignment editor. // Comput. . Applic. Biosci. 1992. V. 8. P. 535-538.

30. Cook G.C. The smallpox saga and the origin(s) of vaccination. // J. R. Soc. Health. 1996. V. 116. P. 253-255.

31. Courtois P.R., Moncany M.L. A probabilistic algorithm for interactive huge genome comparison. // Comput. Appl. Biosci. 1995. V. 11. P. 657 — 665.

32. Czeluzniak J„ Goodman M., Moncrief N.D., Kehoe S.M. Maximum parsimony approach to construction of evolutionary trees from aligned homologous sequences. // Methods in Enzymology. 1990. V. 183. P. 601-615.

33. Czerny CP., Eis — Hubinger A.M., Mayer A„ Schneweis K.E., Pfeiff B. Animal poxviruses transmitted from cat to man: current event with lethal end. // J. Vet. Med! 1991. V. 38. P. 421-431.

34. Dayhoff M.O., Schwartz R.M., Orcutt B.C. Atlas of protein sequence and structure, V. 5, Suppl. 3 // Dayhoff M.O., ed., Washington: Natl. Biomed. Res. Found. 1978. P. 345-352.r ! i; .

35. Devereaux J., Haeberli P., Page D.C. A comprehensive set of sequence analysisprograms for the VAX. // Nucleic Acids Res. 1984. V.12. P. 387-395.

36. Doolittle R.F., Feng D. — F. Nearest neighbour procedure for relatedji.progressively aligned amino acid sequences. // Methods in Enzymology. 1990. V. 183. P. 659-669.

37. Douglas N.J., Dumbell K.R. DNA sequence variation as a clue to the phylogenesis of orthopoxviruses. // J. Gen. Virol. 1996. V. 77. P. 947 951.

38. Du S., Traktman P. Vaccinia virus DNA replication: two hundred base pairs of telomeric sequence confer optimal replication efficiency on minichromosome templates. // Proc. Natl. Acad. Sci. USA. 1996. V. 93. P. 9693-9698.

39. Earl P.L., Moss B. Vaccinia virus. // In "Locus Maps Complex Genomes". P. 138-218. 1990. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY.

40. Esposito J.J., Knight J.C. Orthopoxvirus DNA: A comparison of restriction profiles and maps. // Virology. 1985. V. 143. P. 230-251.

41. Faulkner D.V., Jurka J. Multiple aligned sequence editor (MASE). // Trends Biochem. Sci. 1988. V. 13. P. 321-322.

42. Felsenstein J. Inferring phylogenies from protein sequences by parsimony, distance, and likelihood methods. // Methods Enzymol. 1996. V. 266. P. 418427.

43. Feng D. —F., Doolittle R.F. Progressive sequence alignment as a prerequisite to correct phylogenetic trees. // J. Mol. Evol. 1987. V. 25. P. 351 360.

44. Fenner F., Wittek R.r Dumbell K.R. The Orthopoxviruses. // Academic Press, San Diego. 1989.

45. Fitch W.M. Locating gaps in amino acid sequences to optimize gomology between proteins. // Biochem. Genet. 1969. V. 3. P. 99-108.

46. Foote S., Vollrath D., Hilton A., Page D. The human Y chromosome: Overlapping DNA clones spanning the euchromatin region. // Science. 1992. V. 258. P. 60-66.

47. Frolov A.S., Pika I.S., Eroshkin A.M. ProMSED: protein multiple sequence editor for Windows 3.11/95. // Comput. Applic. Biosci. 1997. V. 13. P. 243248.

48. Garon C.F., Barbosa E., Moss B. Visualization of an inverted terminal repetition in vaccinia virus DNA. // Proc. Natl. Acad. Sci. USA. 1978. V. 75. P. 48634867.

49. Gashnikov P.V., Blinov V.M., Denisov S.I., Petrov N.A., Shchelkunov S.N.

50. Analysis of the organization of genes encoding homologs of tumor necrosisi >factor receptor of variola, monkeypox, and cowpox viruses. // 10th1.ternational Conference on Poxviruses and Iridoviruses, Banff, Alberta, Canada. April 30 May 5, 1994. P. 162.

51. Gibbs A.J., Mclntyre G.A. The diagram, a method for comparing sequences, its use with amino acid and nucleotide sequences. // Eur. J. Biochem. 1970. V. 16. P. 1-11.

52. Goebel S.J., Johnson G.P., Perkus M.E., Davis S.W., Winslow J.P., Paoletti E. The complete DNA sequence of vaccinia virus. // Virology. 1990. V. 179. P. 247-266.

53. Gotoh O. A weighting system and algorithm for aligning many phylogenetically related sequences. // Comput. Appl. Biosci. 1995. V. 11. P. 543 — 551.

54. Henikoff S.G., Henikoff J.G. Position based sequence weights. // J. Mol. Biol. 1994. V. 243. P. 574-578.

55. Henikoff S., Henikoff J.G., Alford W.J., Pietrokovski S. Automated construction and graphical presentation of protein blocks from unaligned sequences. // Gene. 1995. V. 163. P. GC17-26.

56. Higgins D.G., Thompson J.D., Gibson T.J. Using CLUSTAL for multiple sequence alignments. // Methods Enzymol. 1996. V. 266. P. 383 — 402.

57. Karlin S., Altschul S.F. Methods for assessing the statistical significance of molecular sequence features by using general scoring schemes. // Proc. Natl. Acad. Sci. USA. 1990. V. 87. P. 2264-2268.

58. Krogh A. Maximum entropy weighting of aligned sequences of protein or DNA. // Proc. of 3 —rd international conference on intelligent systems for molecular biology. London, 1995. P. 215-221.

59. Kusumi K., Smith J.S., Segre J.A., Koos D.S., Lander E.S. Construction of a large —insert yeast artificial chromosome library of the mouse genome. // Mamm. Genome. 1993. V. 4. P. 391-392.

60. Larin Z., Monaco A.P., Lehrach H. Yeast artificial chromosome libraries containing large inserts from mouse and human DNA. // Proc. Natl. Acad. Sci. USA. 1991. V. 88. P. 4123-4127.

61. Leong P.M., Morgenthaler S. Random walk and gap plots of DNA sequences. // Comput. Appl. Biosci. 1995. V. 11. P. 503 507.

62. Lux S.E., John K.M., Bennett V. Analysis of cDNA for human erythrocyte ankyrin indicates a repeated structure with homology to tissue — differentiation and cell-cycle control proteins. // Nature. 1990. V. 344. P. 36-42.

63. Mackett M., Archard L.C. Conservation and variation in orthopoxvirus genome structure. // J. Gen. Virol. 1979. V. 45. P. 683-701.

64. Maizel J.V. Jr., Lenk R.P. Enhanced graphic matrix analysis of nucleic acid and protein sequences. // Proc. Natl. Acad. Sci. USA. 1981. V. 78. P. 7665-7669.

65. Marennikova S.S., Shelukhina E.M., Efremova E.V. New outlook on the biology of cowpox virus. // Acta Virol. 1984. V. 28. P. 437-444.

66. Massung R.F., Loparev V.N., Knight J.C., Chizhikov V.E., Parsons J.M., Totmenin A.V., Shchelkunov S.N., Esposito J.J. Variola virus near—terminal DNA sequence variability. //Unpublished. 1994a.

67. Massung R.F., Liu L.I., Qi J., Knight J.C., Yuran T.E., Kerlavage A.R., Parsons J.M., Venter J.C., Esposito J.J. Analysis of the complete genome of smallpox variola major virus strain Bangladesh —1975. // Virology. 1994b. V. 201. P. 215-240.t

68. Massung R.F., Knight J.C., Esposito J.J. Topography of variola smallpox virus inverted terminal repeats. // Virology. 1995. V. 211. P. 350-355.

69. Massung R.F., Loparev V.N., Knight J.C., Totmenin A.V., Chizhikov V.E., Parsons J.M., Safronov P.F., Gutorov V.V., Shchelkunov S.N., Esposito J.J. Terminal region sequence variations in variola virus DNA. // Virology. 1996. V. 221. P. 291-300.

70. McClure M.A., Vasi T.K., Fitch W.M. Comparative analysis Of multiple protein sequence alignment methods. // Mol. Biol. Evol. 1994. V. 11. P. 571-592.

71. McLachlan A.D. Tests for comparing related amino acid sequences. Cytochrome c and cytochrome c551. //J. Mol. Biol. 1971. V. 61. P. 409-424.

72. Mironov A.A., Alexandrov N.N., Bogodarova N.Yu., Grigoijev A., Lebedev V.F., Lunovskaya L.V., Truchan M.E., Pevzner P.A. DNASUN: a package of computer programs for the biotechnology laboratory. // Comput. Appl. Biosci. 1995. V. 11; P. 331-335.

73. Mott R., Grigoriev A., Maier E.r Hoheisel J., Lehrach H. Algorithms and software tools for ordering clone libraries: Application to the mapping of the genome of Schizosaccharomyces pombe. // Nucleic Acids Res. 1993. V. 21. P. 1965-1974.

74. Needleman S.B., Wunsh C.D., A general method applicable to the search for similarities in the amino acid sequences of two poteins. // J. Mol. Biol. 1970. V. 48. P. 443-453.

75. Nei M. Molecular Evolutionary Genetics. // New York: Columbia University Press. 1987. 512P.

76. Notredame C., Higgins D.G. SAGA: sequence alignment by genetic algorithm. // Nucleic Acids Res. 1996. V. 24. P. 1515- 1524.

77. Novotny J. Matrix program to analyze primary structure homology. // Nucleic Acids Res. 1982. V. 10. P. 127- 131.

78. Parry—Smith D.J., Attwood T.K. SOMAP: a novel interactive approach to multiple protein sequences alignment. // Comput. Applic. Biosci. 1991. V. 7. P. 233-235.

79. Parsons B.L., Pickup D.J. Transcription of orthopoxvirus telomeres at late times during infection. // Virology. 1990. V. 175. P. 69-80.

80. Parsons J.D. Improved tools for DNA comparison and clustering. // Comput. Appl. Biosci. 1995. V. 11. P. 603-613. !

81. Pearson W.R., Lipman D.J. Improved tools for biological sequence comparison. // Proc. Natl. Acad. Sci. USA. 1988. V. 85. P. 2444-2448.

82. Peplinski G.R., Tsung K., Meko J.B., Norton J.A. Prevention of murine breast cancer by vaccination with tumor cells modified by cytokine — producing recombinant vaccinia viruses. // Ann. Surg. Oncol. 1996. V. 3. P. 15 — 23.

83. Pfleiderer M., Falkner F.G., Dorner F. A novel vaccinia virus expression system allowing construction of recombinants without the need for selection markers, plasmids and bacterial hosts. // J. Gen. Virol. 1995. V. 76. P. 2957-2962.

84. Pickup D.J., Bastia D.r Stone H.O., Joklik W.K. Sequence of terminal regions of cowpox virus DNA: arrangement of repeated and unique sequence elements. // Proc. Natl. Acad. Sci. U.S.A. 1982. V. 79. P. 7112-7116.

85. Qin H., Chatteijee S.K. Recombinant vaccinia expressinig interleukin — 2 for cancer gene therapy. // Cancer Gene Ther. 1996. V. 3. P. 163- 167.

86. Rechid R., Vingron M., Argos P. A new interactive protein sequence alignment program and comparison of its results with widely used algorithms. // Comput. Appl. Biosci. 1989. V. 5. P. 107-113.

87. Report of the Fifth Meeting of the Committee on Orthopoxvirus Infections. Geneva. 1991.

88. Resenchuk S.M., Blinov V.M. New method providing rapid and efficient comparison with EMBL Data Library of over 2500 clones from human chromosome 3. // The 1994 Miami Bio/Technology European Symposium. Monaco. November 17-20, 1994.

89. Resenchuk S.M., Blinov V.M. ALIGNMENT SERVICE: creation and processing of alignments of sequences of unlimited length. // Comput. Appl. Biosci. 1995. V. 11. P. 7-11.

90. Alberta, Canada. April 30 May 5, 1994. P. 60.

91. Smith T.F., Waterman M.S. Identification of common molecular subsequences. // J. Mol. Biol. 1981. V. 147. P. 195- 197.

92. Smith R.F., Smith T.F. Pattern—induced multy—sequence alignment (PIMA)algorithm employing secondary structure — dependent gap penalties for use' in ./ ' ■ 1 1 comparative protein modeling. // Protein engineering. 1992. V. 5. P. 35 — 41.

93. Sneath P.H.A., Sokal R.R. Numerical taxonomy. // Freeman W.H., ed., San —1. Francisco. 1973.

94. Taubes G. Computational molecular biology. Software matchmakers help make sense of sequences. // Science. 1996. V. 273. P. 588-590.

95. Taylor W.R. Identification of protein sequence homology by consensus template alignment. //J. Mol. Evol. 1986. V. 188. P. 233- 258.

96. Taylor W.R., Multiple sequence alignment by a pairwise algorithm. // Comp. Appl. Biosci. 1987. V. 3. P. 81-87.

97. The Global Eradication of Smallpox. Final Report of the Global Commission for the Certification of Smallpox Eradication. WHO, Geneva. 1980.

98. Thompson J., Higgins D.( Gibson T., CLUSTAL W: improving the sensitivity of progressive multiple sequence alignment through sequence weighting, position — specific gap penalties and weight matrix choice. // Nucl. Acid Res. 1994. V. 22. P. 4673-4680.

99. Vingron M., Argos P. A fast and sensitive multiple sequence alignment algorithm. // CABIOS. 1989. V. 5. P. 115-121.

100. Vingron M., Sibbald P. Weighting in sequence space: a comparison of methods in terms of generalized sequences. // Proc. Natl. Acad. Sci. USA. 1993. V. 90. P. 8777-8781.

101. Vingron M., Waterman M.S. Sequence alignment and penalty choice. Reviews of concepts, case studies and implications. // J. Mol. Biol. 1994. V. 235. P. 1 — 12.

102. Volchkov V.E., Blinov V.M., Netesov S.V. The envelope glycoprotein of Ebola virus contains an immunosuppressive — like domain similar to oncogenic retroviruses. // FEBS Letters. 1992. V. 305. P. 181 -184.

103. Waterman M.S., Perlwitz M.D. line geometry's for sequence comparison. // Bull. Math. Biol. 1984. V. 46. P. 567-577.

104. Waterman M.S. Multiple sequence alignment by consensus. // Nucl. Acids Res. 1986. V. 14. P. 9095-9102.

105. Waterman M.S. Mathematical Methods for DNA Sequences. // Waterman M.S., ed., Boca Raton: CRC Press. 1989. P. 53-92. C

106. Waterman M.S., Jones R. Consensus methods for DNA and protein sequence alignment. // Methods in Enzymology. 1990. V. 183. P. 221- 237.

107. Williams P.L., Fitch W.M. Phylogeny determination using dynamically weighted parsimony methods. // Methods in Enzymology. 1990. V. 183. P. 616-626.

108. Wittek R„ Moss B. Tandem repeats within the inverted terminal repetition of vaccinia virus DNA. // Cell. 1980. V. 21. P. 277-284.118

109. WHO sets date to destroy smallpox stocks. // Public Health Rep. 1996. V. 111. P. 388.

110. Zharkikh A A., Rzhetsky A.Y., Morosov P.S., Sitnikova T.L., Krushkal J.S. VOSTORG: a package of microcomputer program for sequence analysis and construction of phylogenetic trees. // Gene. 1991. V. 101. P. 251— 254.