Бесплатный автореферат и диссертация по биологии на тему
Изучение эволюции ретротранспозонов эукариот новыми компьютерными методами
ВАК РФ 03.00.15, Генетика

Автореферат диссертации по теме "Изучение эволюции ретротранспозонов эукариот новыми компьютерными методами"



На правах рукописи УДК 578.088:(57б. 12+575.24)

^^МАКАРОВА Кира Семеновна

ИЗУЧЕНИЕ ЭВОЛЮЦИИ РЕТРОТРАНСПОЗОНОВ ЭУКАРИОТ НОВЫМИ КОМПЬЮТЕРНЫМИ МЕТОДАМИ.

Специальность 03.00.15 - генетика

Автореферат диссертации на соискание ученой степени кандидата биологических наук

Новосибирск 1996

Работа выполнена в Институте цитолоши и генетики СО РАН, г. Новосибирск

Научный руководитель - профессор, доктор биологических наук:

В.А. Ратнер

Институт цитологии и генетики СО РАН, г. Новосибирск

I

Официальные оппоненты: профессор, доктор биологических наук:

Н.В. Стегний

Институт биологии и биофизики Томского Госуниверситета, г. Томск

кандидат биологических наук, Ю.Г. Матушкин Институт цитологии и генетики СО РАН, г. Новосибирск

Ведущее учреждение - НИИ молекулярной биологии ГНЦ "Вектор", п. Кольцове.

Защита диссертации состоится . ¿Л/ 1996 г.

на ^П Пиле А заседании диссертационного совета по защите диссертаций на соискание ученой степени доктора наук (Д - 002.11.01) в Институте цитологии и генетики СО РАН в конференц-зале Института по адресу:

630090, г. Новосибирск, проспект академика Лаврентьева, 10. С диссертацией можно ознакомиться в библиотеке Института цитологии и генетики СО РАН

Автореферат разослан_^ ^^_

Ученый секретарь

диссертационного совета, ____Д ---

доктор биологических наук А.Д. Груздев

Введение.

Актуальность проблемы. Проблема распознавания функциональных элементов в аминокислотной последовательности, закономерностей их формирования и эволюции является одной из центральных в молекулярной биологии, так как она теснейшим образом связана с такими глобальными проблемами, как взаимосвязь структуры и функции в биологических макромолекулах, происхождение жизни и другими. Интенсивное накопление первичных структур биополимеров в специализированных банках данных стимулирует разработку компьютерных методов анализа биополимеров. Важными характеристиками методов поиска и распознавания функциональных элементов биологических макромолекул являются не только эффективность и точность, но также быстрота и простота их реализации и использования. В частности, такими характеристиками обладают методы, в основе которых лежит использование особенностей олигомерного состава ДНК, РНК или белков. Актуальным является развитие подходов, позволяющих осуществлять поиск и распознавание таких крупных структурно-функциональных элементов, как домены глобулярных белков и полипротеинов.

В настоящее время появилось большое количество полностью расшифрованных геномов вирусов и мобильных элементов, многие из которых имеют одну или несколько рамок считывания, кодирующих полипротеины. Из этих полипротеинов формируются различные вирусные белки. Одними из наиболее интересных и в то же время малоизученных объектов исследования являются ретротранспозоны, в РОЬ-полипротеине которых закодированы все четыре домена, ответственных за транспозиционную активность. Актуальность изучения ретротранспозонов объясняется несколькими причинами. Во-первых, мобильные элементы являются одним из основных факторов, определяющих непостоянство генома. Во-вторых, ретротранспозоны являются представителями широкого класса мобильных элементов, имеющих уникальный фермент - обратную транскриптазу. В-третьих, считается, что ретротранспозоны могли дать начало высокопатогенным вирусам растений и животных, таким как ретро-, гепадна- и каулимовирусам. В-четвертых, открыт вопрос о соотношении в их эволюции вертикального и горизонтального переноса. В-пятых, не решена проблема о времени происхождения и скорости эволюции ретротранспозонов.

Цель и_задачи исследования. Первой целью работы было создание

компьютерного метода изучения аминокислотных последовательностей, основанного на использовании особенностей их олигопептидного состава. На основе такого метода предполагалось разработать подходы к классификации

белков, принадлежащих разным семействам, локализации функциональных сайтов в белках, поиску границ функциональных доменов.

Вторая цель работы заключалась в изучении эволюции LTR-содержаших ретротранспозонов. Для этого предполагалось локализовать границы четырех белковых доменов, ответственных за репликацию и транспозицию, этих ретроэлементов с помощью указанной выше технологии. Затем сделать множественное выравнивание и построить филогенетические деревья для этих доменов. На этом основании изучить общие особенности дендрограмм для Gypsy и Copia-rpynn ретротранспозонов, рассчитать скорости их эволюции и общее время дивергенции.

Няучняя нппнчня И практическая ценность работы. Разработан новый метод анализа аминокислотных последовательностей, основанный на использовании олигопептидных словарей. Проведен глубокий анализ возможностей применения метода. Показано, что его можно эффективно использовать для функциональной классификации глобулярных белков, а также для локализации границ доменов в мультидоменных белках и полипротеинах (причем, в среднем ошибка локализации составляет менее 4% длины домена). Показано, что для распознавания последовательностей определенного семейства достаточно набора всего лишь из 25 олишпептидов, причем для получения этого набора пептидов не требуется предварительного выравнивания последовательностей этого семейства. Разработанньш пакет программ, основанных на использовании олигопептидных словарей, позволяет исследовать выборки аминокислотных последовательностей в достаточно широком спектре их структурно-функционального сходства. Пакет может быть также использован для распознавания функциональных элементов, локализации границ функциональных доменов, построения консенсусов.

Филогенетический анализ доменов POL-района Gypyy-rpyraibi показал, что в ее состав входят две независимых подгруппы: первая состоит из 6 ретротранспозонов насекомых, обладающих общей схемой строения генома, вторая группа состоит из нескольких ретротранспозонов растений и грибов. Впервые были выявлены случаи генетической нестабильности геномов этой группы ретротранспозонов. Найдены свидетельства того, что значительная часть ретротранспозонов данной группы распространялась путем горизонтального переноса. Впервые бьи сделан теоретический расчет скоростей эволюции ретротранспозонов, исходя из различных режимов их эволюции. Показано, что спонтанная ретротранспозиция вносит преобладающий вклад в частоту мутирования. Полученные значения скорости согласуются с результатами филогенетического анализа деревьев

макроэволюции ретротранспозонов. Предложена модель эволюции ретротранспозонов эукариот.

Апробация работы. Основные материалы исследования были представлены на Франко-Российском Симпозиуме по регуляции и экспрессии генов (Новосибирск, июль 1995 года), на1 III Международной Конференции Общества молекулярной биологии и эволюции (Япония, Хайама, август 1995 года) и VI Международной Конференции "Современные проблемы биохимии и молекулярной биологии. Наследие А.Н. Белозерского" (Москва, декабрь 1995 года), а также на отчетной сессии Института Цитологии и Генетики 1993 года.

Структура работы. Работа состоит из введения, трех глав, заключения и выводов. Глава 1 содержит обзор литературы. В главе 2 описаны материалы и методы. Глава 3 посвящена описанию и обсуждению полученных результатов. Список литературы включает 172 источника. Работа изложена на 113 страницах, содержит 27 рисунков и 12 таблиц.

Материалы и методы исследования. Новый метод классификации аминокислотных последовательностей. В диссертационной работе представлен новый метод классификации аминокислотных последовательностей, в основе которого лежит представление о том, что любое белковое семейство может бьпъ охарактеризовано определенным набором пептидов небольшой длины (олигопептвдным словарем). В олигопептидный словарь отбираются статистически значимые для данной обучающей выборки пептиды. Такой словарь можно сравнивать с любыми последовательностями или их фрагментами, используя определенный функционал, отражающий сходство частот пептидов словаря и изучаемой последовательности. Показано, что сравнение ол иго пептидных словарей различных семейств позволяет хорошо отличать эти семейства друг от друга и от случайных последовательностей. Разработаны подходы к применению данного метода для поиска структурно-функцональных сайтов, локализации границ доменов и многие другие. Кроме диссертации (разделы 2.1 и 3.1) метод подробно изложен в соответствующих статьях (Соловьев и Макарова, 1992; Solovyev and Makarova, 1994). Определение границ доменов. Границы 4-х доменов POL-района ретротранспозонов были локализованы методом, основанным на использовании олигопептидных словарей (Solovyev and Makarova, 1993). Выборки соответствующих доменов ретроэлементов, приведенные в статье Дулитла и др. (1989), были использованы в качестве обучающих. Затем, границы доменов были скорректированы по множественному выравниванию.

Множественное выравнивание и построение дендрограмм сходства доменов. Для множественного выравнивания последовательностей использовалась программа, реализующая оригинальный алгоритм, основанный на поиске статистически значимых общих фрагментов и эвристической процедуре последовательного включения таких фрагментов в выравнивание (Селедцов и др., 1995). Алгоритм использует матрицу сходства букв для статистической оценки сходства фрагментов и обобщается для выравнивания пар объектов, состоящих из множества выравненных последовательностей. Дендрограммы сходства строились параллельно с выравниванием, путем кластеризации пар (или множественных пар) последовательностей с максимальным весом выравнивания. Для контроля по матрице расстояний строилось также дерево методом '\yPGMA. Топологии деревьев по всем доменам совпадали при построении обоими методами за исключением единичных отличий на последних шагах кластеризации (в случае, расхождений принималась топология дерева, полученного оригинальным методом).

Расчет времени дивергенции последовательностей ревертаз. По выравниванию рассчитывалось сходство пары последовательностей, выраженное в доле идентичных аминокислотных остатков. По полученной оценке рассчитывалось "истинное" число фиксированных аминокислотных замен из формулы, приведенной в книге Ратнера и сотр. (1985). Скорость эволюции и время с момента дивергенции получалось из соотношения к = т / 2Т, где к - скорость фиксации замен; т - число фиксированных замен, Т - время с момента дивергенции (кит рассчитывались на позицию) (Кимура, 1985). Для расчета времени дивергенции группы усреднялись значения т, полученные для всех межкластерных пар последовательностей, принадлежащих последней паре кластеров.

Расчет скоростей эволюции ретроэлементов. Относительные скорости эволюции доменов РО^района рассчитывались по отношению к ревертазному домену по следующей методике: составлялась такая подвыборка транспозонов, для которой тополопи деревьев сходства, построенных по исследуемому домену и домену ревертазы, совпадала. Для каждой пары транспозонов рассчитывалось "истинное" число аминокислотных различий между последовательностями исследуемого домена и аналогичное значение для ревертаз. Их отношение усреднялось по всем парам последовательностей подвыборки.

Источники последовательностей. Полные нуклеотидные

последовательности геномов 17 ретротранспозонов Суруу-гругшы и 14 -Сор/а-группы были извлечены из банка нуклеотидных последовательностей ЕМВЬ за 1993-1994 годы. Для анализа использовались аминокислотные

последовательности, соответствующие ORF этих транспозонов. Аминокислотная последовательность ревертазного домена ретротранспозона IFG-7 взята из статьи Xiong and Eickbush (1990).

Результаты и обсуждение

Филогенетические деревья, построенные в процессе множественного выравнивания четырех доменов POL-района ретротранспозонов Gypsy-rpynnbi приведены на рисунке 1. Анализ этих деревьев показывает, что топологии дендрограмм для различных доменов отличаются. Однако можно также выявить и ряд общих черт.

Так, в составе этой группы выделяются две больших подгруппы ретротранспозонов. Первой было дано название "истинные Gypsy". В нее входят шесть транспозонов: 17.6, 297, tom, TED и два Gypsy из D. melanogaster и D. virilis. Более того, эту подгруппу объединияет также общее строение генома, высокое сходство LTR (Matsuo et al., 1986) и аминокислотных последовательностей всех трех ORF. При построении деревьев по всем доменам представители этой подгруппы кластеризуются вместе с относительно высоким сходством. Все это позволяет считать их подгруппой близко родственных последовательностей. Следует отметить, что, хотя все хозяева транспозонов этой подгруппы относятся к насекомым, филогения "истинных Gypsy" транспозонов не совпадает с таксономией их хозяев.

Вторая подгруппа представлена ретротранспозонами грибов и растений (del, IFG-7, ТуЗ-2, TF1-107, Cftl). Эта подгруппа заметно более гетерогенна и не обладает устойчивостью топологии внутри подгруппы для разных доменов, в отличие от "истинных Gypsy".

Соответсвие транспозонов выделенных подгрупп определенным таксонам хозяев может бьпъ объяснено тремя способами: неполнотой данных (например, "истинные Gypsy" транспозоны грибов и растений существуют, но не секвенированы); синхронной эволюцией линий транспозонов и видов-хозяев (предки "истинных Gypsy" транспозонов отделились от предков Gypsy-транспозонов грибов и растений в составе геномов их хозяев в то же время, когда происходило разделение эукариот на царства); или существованием общих особенностей "молекулярной экологии" этих подгрупп транспозонов (полученных от общего предка подгруппы), обусловливающих ограничения потенциального спектра хозяев, заселяемых горизонтальным переносом.

Остальные транспозоны Gypsy-rpynnbi представлены парами последовательностей (MDG1/412, MAG/SURL, Dmll/DhmiF2) и одиночными представителями (Ulysses). В деревьях, построенных по всем доменам, сохраняются указанные пары, хотя их взаимное расположение, так же как и

A. REV

IlifN« • • г«м(| •

ш ■...

•«I1... 1МГ2< Tfl-117• crti • mi •

4tl • • irS7* -412 •

•C«pe« D.M.

D.v.

!?.«•" 2*7 • tM-

С PRO

17.*........

297........1

tmm........•

TO........—

D.v.ч ...........—-

crti.......—

тп-t«?....-^—

W.VSSCS • • ---

Ttj-a......—.

мм........—

...........

MCB1........

...........——

01ш1Г2.....—

\ ......J~

E. ORF1

17.4.......—

TtN........

...........—Г""

TCD........—

-Спи« о.и. .i Скрап D.w.•1

В. RNH

DmII.......—1_

.........—•

TV3-2• drl••. ТГ1-1*7«•

crti.

ИЙС • XURI • Ulysses • ••• — Gypsy D.w. Cupty D.ff.•^

TED. • !>.*• 297 • «ОЯ>

D. INT

17.4*•* 297" ♦ • «он*••. TCD*•.• CVPSV О Gypsy D

ме.... SURL.•• D«1 1 * .. DHMIF2• M061 • • ■ 412" • • ULVSSCX ТП-117

crti.•.

DEL----

TV3—2• •

4

В

F. 0RF3

Ент U.V.--I

Ggpiv D.M. • —1 TCD.........

ton....... I

17.*.......I_Г™

297........^^

Рисунок 1. Деревья сходства, построенные по доменам POL-района. ретротранспозонов Оу/му-группы: А. Ревертазных доменов; В. Доменов РНКазы Н; С. Протеазных доменов; D. Эндонукпеазных доменов.; Е. Первой ORF ретротранспозонов подгруппы "истиных" Gypsy; F. Третьей ORF ретротранспозонов подгруппы "истиных" flypsy.; Положение вершины дерева на горизонтальной оси соответствует весу данного выравнивания.

расположение этих пар относительно двух больших подгрупп, может варьировать. Если транспозоны MDG1 и 412 очень сходны между собой по организации их генома, по нуклеотидной последовательности и находятся в одном организме-хозяине, то две другие пары отличаются большим различием этих характеристик. Так, две последовательности Micropia, имея весьма похожие аминокислотные последовательности POL-района, имеют совершенно различные LTR и разную организацию и количество ORF. MAG и SURL, являясь ближайшими родственниками друг друга (вплоть до заметного сходства аналогов GAG, находящихся в отдельной ORF у MAG и в той же, что и POL у SURL), принадлежат совершенно разным группам хозяев (тутовый шелкопряд и морской еж соответственно).

Расчеты относительных скоростей эволюции доменов POL-района в целом коррелируют в данными, приведенными в работах Дулитла и др. (Doolittle et al., 1989; McClure et al., 1988) для ретровирусов. Так же как и для ретровирусов, обратная транскриптаза Gypsy-группы является наиболее консервативным доменом. В отличие от ретровирусов, первичная структура РНКазы Н транспозонов оказалась почти такой же консервативной, как и структура ревертазы. В случае Copia-группы отличия выражены еще в большей степени. Для этой группы ретротранспозонов самым консервативным доменов является ннтеграза, затем РНКаза Н, и только потом ревертаза. Возможно, это свидетельствует об определенных особенностях жизненного цикла ретротранспозонов по сравнению с ' ретровирусами.

Резкие нарушения структуры деревьев обычно объясняют событиями рекомбинации и конверсии (Inouye et al., 1986; McClure et al., 1988). Анализ децдрограмм для различных доменов открытых рамок считывания ретротранспозонов Gypsy-rpymai позволяет выявить по крайней мере два таких выраженных случая. В частности, в статье Inouye et al., (1986) отмечалось поразительное сходство третьих ORF транспозонов 17.6 и 297. Анализ деревьев по всем доменам POL района, а также деревьев для первой и третьей ORF "истинных Gypsy" транспозонов (рис. 1(E,F)) показывает, что это сходство столь велико, что отразилось в дереве изменением взаимного расположения 17.6, 297 й torn. Inouye et al (1986) объясняют это рекомбинацией; аналогичное событие у ретровирусов Дулитл описывает как конверсию (McClure et al, 1988). Другое подобное событие представляет собой обмен положениями в дереве домена РНКазы Н пар Gypsy D.melanogasterlGypsy D.virilis и МДГ1/412. Изменение взаимного расположения ветвей 412 и Gypsy в дереве, построенном по последовательностям РНКазы Н, было отмечено еще Дулитлом (Doolittle et al, 1989), но у него не было достаточно данных, чтобы предполагать рекомбинацию. Поскольку указанные пары меняют места в дереве согласованно, можно предположить, что рекомбинация произошла на уровне общего предка Gypsy D.melanogaster и Gypsy D.virilis, с одной стороны, и МДГ1 и 412 - с другой.

Рекомбинация ретроэлементов, относящихся к разным видам, может происходить в клетках хозяина как между находящимися в геноме копиями, так и в процессе ретротранспозиции с помощью механизма выборочного копирования. Для ретровирусов это явление хорошо изучено и происходит со значительной частотой (Zhang J. and Temin H.M., 1994). В данном случае в пользу гипотезы о рекомбинации и (или) конверсии говорит то, что все виды транспозонов, между которыми могли произойти эти процессы, могли

г"

находится в тот момент в геномах одного вида-хозяина, принадлежащего к роду Drosophila.

Для доменов некоторых транспозонов также можно заметить непостоянство их положения в дереве. Так, например, Ulysses по двум доменам (протеазному и интегразному) тяготеет к группе транспозонов грибов и растений; по домену РНКазы H - скорее родственен транспозонам насекомых, а по ревертазе имеет весьма низкое сходство со всеми прочими транспозонами Gypsy-группы. • Не исключено, что это тоже может бьпъ следствием многочисленных рекомбинационных событий, имевших место в ходе эволюции Ulysses.

Поскольку. эволюция ретротранспозонов Сур^-группы по всей видимости сопровождалась актами рекомбинации и горизонтального переноса ретроэлементов и их отдельных модулей, установление точек отсчета, необходимых для оценки скорости эволюции и времени диаергенции, представляет достаточно сложную задачу. Предполагаемое несовпадение эволюции транспозонов и видов-хозяев делает невозможным использование в качестве точек отсчета датировок дивергенции далека групп организмов (насекомых, грибов и растений). Однако, в рамках Gypsy-группы есть три пары близкородственных элементов (torn D. ananassae - 297 D. melanogaster, Gypsy D. melanogaster - Gypsy D. virilis и Dmll D. melanogaster - DhmiF2 D. hydei), для которых можно предполагать, что дивергенция видов-хозяев и соответствующих ретроэлементов происходила параллельно. Эти пары позволяют оценить скорость фиксации аминокислотных замен в белках ретроэлементов по крайней мере для транспозонов дрозофилы. Поскольку оценки скорости эволюции для ревертазы и РНКазы H приблизительно равны, представляется возможным усреднить полученные оценки. Средняя скорость фиксации аминокислотных замен в ревертазах и РНКазах H близкородст енных ретротранспозонов дрозофилы составляет 1.7x10-9 замен на позицию в . од (табл. 1).

Если предположить, что и на остальных ветвя эволюционного древа скорость эволюции ретротранспозонов Gypj;y-iT>yimbi оставалась приблизительно постоянной, то, используя полученную оценку скорости, можно оценить время дивергенции других представителей группы (рис. 2). Так, ревертазы подгруппы "истинных Gypsy" (различие между последними двумя кластерами 0.73±0.05 фиксированных аминокислотных замен на позицию) дивергировали около 215 млн. лет назад; ревертазы Gypsy-группы в целом (различие между последними двумя кластерами 1.2510.13 фиксированных замен на позицию) разошлись около 370 млн. лет назад. В подгруппе "истинных Gypsy" наиболее таксономически далекие виды-хозяева представлены двукрылыми (Drosophila) и чешуекрылыми (Trichoplusia)

Таблица 1. Оценка скорости фиксации аминокислотных замен в белках транспозонов Сурлу-грулпи.

Пара Белок % Число Время Скорость

транспозонов идентич. фикс. дивергенции фикс, замен

остатков замен на хозяев, на поз. в

позицию млн. лет год

torn - 297 Ревсртаза 88.8 0.12 30 2.0x10-9

РНКазаН 86.8 0.14 2.3х10"9

Gypsy D.m. ■ Gypsy D.v. Ревсртаза 86.4 0.15 60 1.3x10-9

РНКазаН 90.5 0.10 0.8x10-9

Dmll -DhmiF2 Ревсртаза 78.5 0.24 60 2.0x10-9

РНКазаН 83.0 0.19 1.6x10-9

Примечание: Вреих дивергенции видов D. ananassae a D. melanogaster оценено по датам из i (Ashbumer M., 1989, стр. 1174), где приведено врем» образования группы melanogaster, к которой относятся подгруппы melanogaster п ananassae (46 млн. лет назад), в время образованна подгруппы melanogaster (17-20 шш. лет назад). Время дивергенции подродо» Drosophila ф. virilis н D. hydeï) и Sophophora (D. ananassae в D. melanogaster) взято из работы (Spicer G.S., 1988).

Ulysses ■ ■ ■

Foretl ----

MAG......

SURL.....

Dmll -----

DhmlF2----

TF1-107 •■■

Cffl......

ТуЭ......

Del.......

IFG7......

412......

MDG1.....

Gypsy D.m. Gypsy D.v.TED......

17.Б......

297......

tom......

2c

y-

Б0 MYR

1.08 [320 MYR)

—T"

(COO MYR)

60 MYR

1

1.25±0.1Э (370 MYR)

Y

(1000 MYR)

З*

30 MYR

0.73i0.05 [215MYRJ

Y

(285 MYR)

Рисунок 2. Времена дивергенции рстротранспозонов и соответствующих им хозяев для некоторых групп ретротранспозонов Оурэу-группы, рассчитанные с использованием скоростей их эволюции, приведенных в таблице 1. Подробное объяснение в тексте.

отрядами насекомых. По палеонтологическим данным они дивергировали около 285 млн. лет назад ("Историческое развитие класса насекомых" под ред. Родевдорфа Б.Б. и Расшщина А.П. Москва: Наука, 1980. стр. 28); полученная оценка (215 млн. лет) несколько 1шже. Более того, насекомые, грибы и растения дивергировали около 1 млрд. лет назад (Ратнер и др., 1985, стр. 98), что значительно больше оценки времени дивергенции Gypsy-группы в целом (370 млн. лет). Если сделанные предположения о постоянстве скорости фиксации аминокислотных замен в белках этих транспозонов справедливы, это может свидетельствовать о горизонтальном заселении транспозонами видов-хозяев. Аналогичная картина возникает при анализе некоторых отдельных ветвей эволюционного древа транспозонов Gypsy-группы: так, ретротранспозоны MAG Bombyx morí (насекомые) и SURL Tripneustes gratilla (иглокожие), занимающие соседние ветви древа, имеют 1.08 фиксированных различий на позицию, что соответствует примерно 320 млн. лет. Датировка общего предка хозяев составляет около 700 млн. лет (Ратнер и др., 1985, стр. 98).

Полученные оценки времени дивергенции удаленных друг от друга подгрупп транспозонов Gypsy-группы отличаются в меньшую сторону от оценок времени дивергенции хозяев этих транспозонов. Это можно объяснить двумя способами: либо считать, что Gypsy-rpyima ретротранспозонов образовалась много позже обособления таксонов хозяев, и заселение ими геномов представителей разных царств живых организмов происходило при помощи той или иной разновидности горизонтального переноса (трансфекция нуклеиновых кислот у экологически близких видов, вирусная трансдукция, собственные механизмы инфекционное™); либо считать, что на больших эволюционных дистанциях скорость фиксации замен заметно (как минимум в 2-3 раза) меньше, чем следует из данных оценок для близких разновидностей транспозонов. Возможными источниками погрешностей таких оценок могут служить:

• стохастические ошибки определения числа фиксированных аминокислотных замен между сравниваемыми белками;

» несоответствие датировок расхождения близких разновидностей транспозонов и их хозяев;

• неточность датировок расхождения видов рода Drosophila;

• неравномерность скоростей молекулярной эволюции белков ретротранспозонов на больших интервалах времени.

Doolittle et al. (1989), оценивая возможные сценарии эволюции ретроэлемекгов, отметили четыре варианта, каждый из которых имеет свою характерную скорость накопления мутационных замен. В совокупности эти скорости различаются в пределах 8-10 порядков величины. В случае

ретротранспозонов, возможны два пути эволюции: дефектный транспозон, эволюционирующий со скоростью псевдогенов и активный мобильный элемент, время от времени претерпевающий транспозиции, в геноме хозяина.

В общем виде скорость возникновения нуклеотццных замен в геноме ретротранспозона можно выразить следующим образом: Мп = т0 + птг г, ще

т0 =5x10 9 нуклеотидных замен на позицию, на копию ретротранспозона в год - частота спонтанного мутирования при репликации эукариотического генома; скорость возникновения нейтральных замен в псевдогенах ДНК-генома хозяина (Кимура, -1985; Ратнер и др., 1985); тг — 1 х Ю-4 нуклеотидных замен на позицию гена за цикл репликации (т.е. на ретротранспозицто) - скорость мутирования, характерная для репликации ретровирусов (Katz and Skalka, 1990; Richetti and Buc, 1990). т - вероятность транспозционных событий на копию ретротранспозона, на гаплоидный геном, за поколение дрозофилы ( rs — 5.7 х 10~5 - скорость спонтанных транспозиций ретротранспозонов дрозофилы (Ратнер и Васильева, 1992; Harada et al, 1990; Charlesworth and Langley, 1989);. Ti, = 1 x 10~2 - скорость транспозиций ретротранспозонов дрозофилы, индуцированных внешним стрессовым воздействием (тепловым шоком и др.) (Ratner et al, 1992; Ратнер и Васильева, 1992; Ратнер и Васильева, 1994)). Примем также, что в природных условиях популяции дрозофил имеют п = 10 - 15 поколений в год. Скорость фиксации нуклеотидных замен хозяина (Кимура, 1985, Ратнер и др., 1985): Кп = Мп , если все замены нейтральны, и Кп — fnMn , если доля /„ мутационного спектра не детальна, т.е. если действует стабилизирующий отбор. Для консервативных доменов белков ретрорепликационной системы ретротранспозонов можно принять оценку доли нелетальных аминокислотных замен в мутационном спектре белков fn = 0.3, полученную пересчетом оценки fa — 0.1 (Кимура, 1985).

Используя эти параметры и соображения, оценим следующие варианты эволюции ретротранспозонов:

(а). Ретротранспозон стабилен в геноме как псевдоген: Кп=Мп=т0= 5.x 10-9 фиксаций нуклеотидных замен на позицию в год. Этот режим выполняется для немобильных копий ретротранспозонов и эквивалентен варианту (В) Doolitle et al (1989).

1 (b). Ретротранспозон в клетках гаметной линии подвержен спонтанной ретротранспозиции:

Мп = щ + nmr Ts = 6.2 X Ю-8 нуклеотидных замен на позицию в год. Легко видеть, что ' вклад ретротранспозиции в скорость мутирования

примерно на порядок величины выше вклада мутаций, происходящих в геноме. Заметим, что переход к скорости фиксации нейтральных замен в консервативных доменах белков ретрорепликационной системы не изменяет соотношения Вкладов источников изменчивости, а скорость равна

К„ = /пМ„ = 1.9 X Ю-8 фиксаций нуклеотидных замен на позицию в год. Хотя это примерно в 4 раза выше, чем максимальная скорость нейтральной эволюции для ДНК-геномов, неточность оценки некоторых параметров позволяет скорее утверждать, что ожидаемая скорость фиксации нуклеотидных замен' в филогенетических деревьях для сегментов, кодирующих консервативные домены белков ретрорепликационной системы ретротранспозонов, должна быть такого же порядка величины (или несколько выше), как и максимальная скорость нейтральной эволюции, измеренная для немобильных копий этих ретротранспозонов (или псевдогенов) в ДНК-геноме хозяина. Иначе говоря, эти оценки при подсчете трудно различить. Следует, однако, подчеркнуть, что в первом случае (а) весь мутационный спектр нейтрален (/п = 1), а во втором (Ь) имеется заметное ускорение эволюции за счет ретротранспозиции, которое . почти компенсируется потерями за счет стабилизирующего отбора {/„ = 0.3). Этот режим эволюции, вероятно, реализуется для мобильных копий ретротранспозонов в нормальных (нестрессовых) условиях существования популяций (ЯаЩег е1 Л, 1992; Ратнер и Васильева, 1994).

(с). Ретротранспозон в клетках гаметной линии подвержен стресс-индуцированной транспозиции:

Мп — т0 + птг Т1 = 1X Ю-5 нуклеотидных замен на позицию в год. В этом случае вклад индуцированных транспозиций в скорость возникновения мутаций (при всей неточности оценки параметров) на 3-4 порядка величин больше, чем вклад замен, обусловленных репликацией хозяйского генома. Этот режим, вероятно, может возникнуть тоща, когда, стрессовые внешние условия существования популяции хозяина сохраняются многие поколения. В принципе такие условия могут возникнуть при заселении новых ареалов, на границах ареалов, при длительных изменениях климата и т.п. (ДаШег е1 а1, 1992; Ратнер и Васильева, 1992; Ратнер и Васильева, 1994). Переход к скорости фиксации нейтральных замен в консервативных доменах белков ретрорепликационной системы не изменяет соотношения вкладов источников изменчивости, а скорость равна

К„ — /„Мп = 3 X Ю-6 фиксаций нуклеотидных замен на позицию в год. Эта цифра очень велика (Кп »т0 = 5,х 10~9). Такие периоды

эволюции, если они существуют, должны вносить значительные диссонансы в топологию филогенетических деревьев.

Таким образом, ретротранспозиция, как спонтанная, так тем более и индуцированная, является мощным и, возможно, главным источником нухлеотидной изменчивости генов самих ретротранспозонов. По сравнению с немобильными дефектными копиями ретротранспозонов генома они могут приобрести ускорение эволюции от одного до нескольких порядков величины.

Существует ряд публикаций, в которых авторы рассчитывали скорости эволюции ретротранспозонов, исходя из предположения об исключительно "вертикальной" их передаче от общего предка группы сравниваемых-вндсв. Так Matsiio et al. (1986) оцепили скорость дивергенции ретротранспозонов 297 из двух видов дрозофил (D. simulons и D. melanogaster). Их оценка равна 5x10*9 нуклеотидных замен на позицию в год. Springer et al. (1991), сравнив клоны ретротранспозона SURL из разных видов морских ежей, оценили скорость синонимической эволюции в (3.5-6.2)х10"9 нуклеотидных замен в год при отношении частот синонимических и несинонимическим замен в диапазоне 3.2 - 19.1. Mizrokhi and Mazo (1991) отметили, что уровень аминокислотного сходства между ретротранспозонами Gypsy D. virilis и D. melanogaster (76-84% идентичных остатков в гипотетических полштептидах, отвечающих парам разных ORF) примерно такой же, как и для обычных ядерных генов, секвенированных у обоих видов-хозяев. В данной работе (табл. 1) скорость фиксации аминокислотных замен в ORF ретротранспозонов Су/ну-группьг бьша оценена в 1.7x10*9 на позицию в год (пересчет в нуклеотидные замены при /а = 0.1 дает 2.2x10*9 замен на позицию в год).

Иначе говоря, оценки для ORF ретротранспозонов и ядерных псевдогенов действительно достаточно близки к 5x10*9 нуклеотидных замен на позицию в гсд, как п ожидаете ! для • неактивных (а) и спонтанно транспозирующихся активных копий (Ь) ретротранспозонов. Превышающий вклад ретротранспозицни при этом достоверно не выявляется. Это вполне согласуется с приведенными в работе оценками (см. выше).

Никаких значимых указаний на реальное участие сверхбыстрой "стрессовой" эволюции ORF ретротранспозонов в филогенетических деревьях пока не найдено. С общих позиций этот режим эволюции кажется весьма маловероятным. Высокие скорости мутирования (Шг = 1 х Ю-4 на позицию на транспозицию) и транспозиции ( T¡ =1x10 2 на сайт, на гаплоидный геном, за поколение дрозофилы) приводят к возможности двух видимых ограничений эволюции ретротранспозонов, которые принято называть

"катастрофами ошибок и потерь" (Эйген и Шустер, 1982; Ратнер и др., 1985; Ратнер и Васильева, 1994).

Полученные априорные оценки скорости фиксации нуклеотидных замен в консервативных доменах ORF белков ретрорепликационной системы ретротранспозонов заставляют в очередной раз вернуться к проблеме происхождения ретроэлементов и соотношения "вертикального" наследования и "горизонтального" переноса в ходе заселения ретротракспозонами геномов видов-хозяев. Как следует из анализа выравниваний белковых продуктов упомянутых ORF, на уровце удаленных таксономических единиц ретротранспозонов наблюдается расхождение между ' датировками дивергенции таксонов видов-хозяев и соответствующих групп (подгрупп) транспозонов (для транспозонов получаются меньшие времена).

Одним из объяснений может служить составление цепочек, объединяющих экологически близкие виды, между которыми возможен (пусть крайне маловероятный) перенос генетического материала при непосредственном контакте (например цепочка дрозофила - дрожжи -дейтеромицеты - высшие растения).

Второй вариант предусматривает механизм транедукции с использованием природных векторов - вирусов и эндопаразитов (например, транспозон TED из ночной бабочки Trichoplusia ni входит в состав бакуловирусного генома (Friesen and Nissen, 1990).

Наконец, существует возможность периодического приобретения и потери инфекционности, присущей собственно ретротранспозону (Hull, 1992) Известно, что многие ретротранспозоны имеют в своем геноме ORF, подобные генам gag и env ретровирусов (Doolittle et al., 1989). Если верна гипотеза о том. что предковые формы генов, обеспечивающих инфекционность вируса, могут бьггь приобретены в геномах хозяев (Hull, 1992), то не исключено, что этот процесс происходил неоднократно в ходе эволюции ретроэлементов. Поскольку "вирусная" стадия существования ретроэлемеша экологически неустойчива и грозит сравнительно быстрой элиминацией либо хозяина, либо вируса (Doolittle et al., 1989), мы в настоящее время должны наблюдать относительно малое разнообразие независимых ретро- подобных вирусов прн большом разнообразии и фактической убиквитности "геномных" форм ретроэлементов. Это вполне соответствует известной иа сегодняшний день части общей картины. Данная гипотеза объясняет, почему столь редкое событие, как "горизонтальный" перенос генетического материала, происходило неоднократно в течение большого эволюционного интервала. Дополнительным свидетельством в пользу этой гипотезы можно считать наблюдение ретровирус-подобных частиц транспозона Tv-1 в культуре клеток Drosophila virílis (Андрианов, и

др., 1994) и показанную инфекционность аналогичных частиц транспозона

Gypsy Drosophila melanogaster (Семин и Ильин, 1994).

Высады.

1. Разработан комплекс компьютерных программ, основанных на использовании олигопептидных словарей, для широкого спектра задач анализа аминокислотных последовательностей, в том числе - программы для локализации границ функциональных доменов, которые использовались для формирования выборок доменов. POL-полипротеина ретротранспозонов.

2. Предложен метод функциональной классификации глобулярных белков на основе сравнения олигопептидных словарей. Показано, что для распознавания последовательностей определенного семейства может быть достаточно набора всего лншь из 25 дипептидов (что составляет в среднем всего 5-10% от длины домена) и что для получения такого набора не требуется предварительного выравнивания последовательностей этого семейства.

3. Показано, что метод может быть применим для определения основных функциональней детерминант доменов. Так, данный метод позволяет определять локализацию границ функционального домена с точностью 3-4 аминокислотных остатка (т.е. в среднем ошибка локализации составляет менее 4% длины домена).

4. Филогенетический анализ доменов POL-района ретротранспозонов Gypsy-группы, показал, что в ее состав входят предположительно две монофилетических подгруппы: первая состоит из б ретротранспозонов насекомых и обладает высоким сходством строения генома Этта транспозонов, вторая, более гетерогенная, подгруппа состоит га транспозонов растений и грибов.

5. Выявлены случаи генетических обменов геномов ретротранспозонов в ходе их эволюции: конверсия в третьем ORF между ретротранспозонами 17.6 и 297 из Drosophyla melanogaster, рекомбинация в домене РНКазы II между предковыми последовательностями пары ретротранспозонов Gypsy из D.melanogaster и D.virilis и пары MDG1/412\

6. Сделана теоретическая оценка скорости фиксации нуклеотидных замен для наиболее вероятных режимов эволюции ретротранспозонов. Показано, что спонтанная ретротранспознция вносит преобладающий вклад в частоту мутирования, а ожидаемая скорость фиксации нуклеотидных замен составляет порядка 2*10"^ на позицию в год. Эта оценка согласуется с данными, полученными на основании анализа филогенетических деревьев Gypsy-rpyimbi, а также с расчетами, сделанными другими авторами.

7. Время, прошедшее с момента дивергенции ретротранспозонов Gypsy-груплы, вычисленное исходя из выравнивания, оценено в 370 млн. лет., что значительно меньше времени дивергенции их предковых хозяев. Этот факт, по-видимому, свидетельствует о том, что значительная часть ретротранспозонов этой группы распространялась путем горизонтального переноса.

Список работ, опубликованных по теме диссертации

1. Соловьев В.В, Макарова К.С. Поиск границ функциональных доменов и локализация функциональных сайтов на основе олигопептидных словарей // Молекулярная биология. 1992. Т. 26. С.341-353.

2. V.V.Solovyev, K.S.Makarova A novel method of protein sequence classification based on oligopeptide frequency analysis and its application to search for functional sites and to domain localization // Comput.Appl.in Biosci. 1993. V.9. P.17-24.

3. У. Wolf, K. Makarova, V. Rattier Expression level of retrotransposon replication genes determines their molecular evolution rate // Theses of the-French-Russian symposium on regulation of gene expression, Novosibirsk, 1995. P.41.

4. Селедцов И.А., Вулыр Ю.И., Макарова K.C. Множественное выравнивание биополимеров основанное на поиске статистически значимых общих участков // Молекулярная биология. 1995. Т.29. С.1023-1039.

5. К. Makarova, Y. Wolf, V. Ratner The phylogenetic analysis of gypsy-like group of retrotransposons // Theses of The 3-rd International Meeting of the Society for molecular biology and evolution, Hayama. 1995. P.75.

6. Макарова K.C., Вульф Ю.И., Селедцов И.А., Ратнер В.А. Эволюция ретротранспозонов £ур$у-группы: филогенетический анализ доменов, входящих в состав POL-полипротеина // Генетика. 1995. Т.31. С.1614-1629.

7. Вульф Ю.И., Макарова К.С., Ратнер В.А. Сценарии эволюции ретротранспозонов эукариот // Генетика. 1996. Т.32. С.34-40.