Бесплатный автореферат и диссертация по биологии на тему
Эволюция короткого ретропозона В1
ВАК РФ 03.00.03, Молекулярная биология

Автореферат диссертации по теме "Эволюция короткого ретропозона В1"

У)

Российская академия наук Институт молекулярной биологии им. В.Л. Энгельгардта

На правах рукописи

ВЕНИАМИНОВ^ Наталья Александровна Эволюция короткого ретропозона В1

специальность 03.00,03 молекулярная биологин

АВТОРЕФЕРАТ диссертации па соискание ученой степени кандидата биологических наук

Москва - 2007

003160770

Работа выполнена в Лаборатории эволюции геномов эукариот Института молекулярной биологии им. В.А. Энгельгардта РАН

НАУЧНЫЙ РУКОВОДИТЕЛЬ:

Доктор биологических наук, профессор ДА. Крамеров

ОФИЦИАЛЬНЫЕ ОППОНЕНТЫ:

Доктор биологических наук, (Институт молекулярной биологии РАН, Лаборатория подвижности генома) Н.В. Л «обо мирская

Кандидат биологических наук, (Институт биологии гена РАН, Группа эпигенетических механизмов регуляции активности генов) С.В. Тилли5

ВЕДУ 111ДЯ ОР1 Л Е {11 ЗАЦИЯ:

Институт биологии развития им. Н.К. Кольцова РАН

на заседании диссертационного совета Д 002.23 5.01 мри Институте молекулярной Оиолог ни им. В,А. Энгельгардта РАН по адресу: 119991, Москнн, ул. Вавилова, д.32

С диссертацией можно ознакомиться в библиотеке Института молекулярной биологии им. В А. Энгельгардта РАН

г

'Защита диссертации состоится

Автореферат разослан Я?

Ученый секретарь

диссертационного совета

кандидат химических наук

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность проблемы

Мобильные генетические элементы, известные под названием короткие ретропозоны, или SINE (Short Interspersed Elements), представляют собой рассеянные по геномам эукариот повторяющие последовательности длиной от 80 до 400 п н, амплификация которых происходит с помощью обратной транскрипции Первые SINE были описаны более 25 лет назад Все эти годы исследования SINE интенсивно развивались, в результате чего наши знания об этих мобильных генетических элементах значительно расширились Стали в общих чертах известны механизмы их размножения, и выяснилось, что они играют важную роль в эволюции геномов и самих организмов Однако многие вопросы, в частности, связанные с путями и механизмами эволюции самих SINE остаются малоизученными

В геномах млекопитающих одного вида имеется 2-4 семейства коротких ретропозонов, каждое из которых содержит десятки или сотни тысяч копий, чьи нуклеотидные последовательности обычно обладают 65-90%-ным сходством

SINE транскрибируются РНК-полимеразой Ш, благодаря наличию в своей 5 -концевой части промотора РШС-полимеразы Ш, состоящего из двух боксов (А и В), которые разделены последовательностью длиной 30-40 п н Короткие ретропозоны относятся к неавтономным мобильным элементам, поскольку не кодируют собственных ферментов и используют для своего размножения обратную транскриптазу, закодированную в одном из видов длинных ретропозонов, или LINE (Long Interspersed Elements) Большинство SINE млекопитающих размножаются с помощью длинного ретропозонаИ

Наиболее распространены семейства SINE, ведущие свое происхождение от молекул тРНК, поскольку их нуклеотидные последовательности обладают выраженным сходством с тем или иным видом тРНК Однако имеются два класса SINE, чье происхождение связано с другими РНК, синтезирующимися РНК-полимеразой III Один из них включает несколько недавно открытых семейств SINE рыб, произошедших из 5S рРНК (Kapitonov & Jurka 2003, Nishihara et al 2006) Короткие ретропозоны другого класса (Alu приматов и В1 грызунов) были среди первых описанных SINE (Kramerov et al 1979, Krayev et al 1980, Demmger et al 1981, Haynes et al 1981) Они ведут происхождение от цитоплазматической 7SL РНК, имеющей длину 300 нуклеотидов и входящей в состав рибонуклеопротеидных частиц SRJP (signal recognition particles) SRP участвуют в узнавании сигнальных пептидов секретируемых и мембранных белков

В процессе возникновения Alu и В1, произошла потеря центральной части 7SL РНК длиной 144-182 нуклеотидов (рис 1) Alu (300 п н ) состоит из двух таких сходных, но неидентичных последовательностей - левого (L) и правого (R) мономеров Alu были найдены в геномах всех изучавшихся в этом отношении приматов, включая полуобезьян (Prosimiae), что свидетельствует о возникновении Alu у общего предка всех приматов (Zietkiewicz et al 1998, Roos etal 2004) 7SL РНК

бокс А

s;

nzi

pB1 П77Г

SN?ftgiMB 'I

делеция d7, d9 или d10

/ \

pB1d7 или pB1d9 pB1d10

I l—'

XZZZL

кчмщиам \ t==>

B1

MEN

ID

Рис 1. Схема, иллюстрирующая структуру, происхождение и эволюцию элемента В1 и родственных ему SINE у грызунов У общего предка грызунов приматов и тупай произошло образование ретропсевдогена 7SL РНК, несущего делецию 182 п н, что привело к возникновению элемента рВ1 Последующая потеря специфического участка (отмечен черным) длиной 7, 9 или 10 п н привела к образованию новых семейств рВ 1 Тавдемная дупликация участка длиной 29 п н привела к возникновению канонического элемента В1, известного из геномов Mus musculus и Ratüis norvegwui Образование 20-нуклеотидной тавдемной дупликации в элементе pBldlO предшествовало возникновению димерных SINE (Bl-dID и MEN) у предка белок и сонь ID -тРНК-родстенный SINE, образовавший эти димерные SINE путем слияния с В1 Для последовательностей dID характерна делеция дайной 19 п н Косой штриховкой отмечены боксы А и В промотора РНК-полимеразы III Серым цветом и точечной штриховкой помечены участки, входящие в состав тандечных дупликаций

В отличие от Alu, В1-элемент из геномов домовой мыши {Mus musculus) и серой крысы (Ratius norvégiens) представляет собой мономер и имеет длину около 140 пн Однако в эт ом элементе имеется внутренняя тавдемная дупликация с размером повтора 29 п н Наличие делеции длиной 9 п н в центральной части В1 мышей - еще одно отличие В1 от Alu (рис 1) В геномах этих грызунов обнаружено небольшое число копий В1 без такой дупликации и делеции Такие копии, названные рВ1 (proto-Bl), рассматриваются как эволюционные предшественники В1 (Quentin 1994) В геномах мышей и крыс также

обнаружены варианты pBI со специфической делецией длиной 7, 10 или реже 9 пн (pBld7, pBldlO и pBld9 соответственно, рис 1)

Грызуны (Rodentia) образуют самый обширный отряд млекопитающих, состоящий по крайней мере из 30 семейств (Hartenberger 1985, Павлинов 2003) Если В1 у мышей и крыс (сем Mundae) изучены сравнительно хорошо (Krayev et al 1982, Den Dünnen & Schoenmakers 1987, Bains & Temple-Smith 1989), в частности, благодаря секвенированию геномов M musculus (Waterston et al 2002) и R. norvégiens (Gibbs et al 2004), то этот SINE из геномов других грызунов остается очень мало изученным Кроме того, описано два семейства димерных SINE, содержащих в качестве мономеров В1 и ID-родственный элемент (ID известен как самостоятельный SINE грызунов, ведущий происхождение от аланиновой тРНК (Kim et al 1994)) Первый из них, MEN, выделенный из генома белки Menetes berdmorei, имел левый ID-подобный мономер и В1 в качестве правого мономера (Serdobova & Kramerov 1998) Второй SINE, обнаруженный в геномах белок (Sciundae) и сонь (Glindae), имел противоположное расположение мономеров и был назван Bl-dID (Kramerov & Vassetzky 2001) Важно отметить, что В1-мономер из белок и сонь содержал внутреннюю дупликацию длиной 20, а не 29 п н как в В1 мышей и крыс (рис 1)

Недавно, используя гибридизацию с В1-зондом M musculus, в нашей лаборатории было показано наличие 7SL РНК-родственных SINE не только у приматов (Alu), но и у грызунов всех 15 тестированных семейств, но не у представителей других отрядов млекопитающих (Vassetzky et al 2003) (Исключение составляют тупайи - отр Scandentia, несущие в своих геномах небольшое число копий В1-подобных SINE (Nishihara et al 2002, Vassetzky et al 2003)) Предварительные опыты по клонированию и секвенированию геномных фрагментов ДНК подтвердили наличие копий В1 у таких грызунов как тушканчики, мышовки, белки, бобры и морские свинки (Vassetzky et al 2003) Однако подробного систематического исследования В1, включающего большинство семейств грызунов до сих пор не проводилось

Цели и задачи исследования

Целью данной работы было изучение распространенности, структуры, возможных путей и механизмов эволюции короткого ретропозона В1 в отряде грызунов Для чею были поставлены следующие задачи

1 Оценил ь число копий В1 в геномах грызунов различных семейств

2 Клонировать и секвенировать копии В1 из представителей большого числа семейств грызунов

3 Проанализировать установленные нуклеотидные последовательности В1 и выявить их специфические структурные черты Основываясь на этих чертах проанализировать филогению грызунов

4 Построить схему эволюции В1 в отряде грызунов

Научная новизна и практическая значимость

Впервые было оценено число копий В1-элемента в геномах грызунов большинства существующих семейств Показано, что эта величина варьирует от 104 до 10б Клонировано и секвенировано более 300 нуклеотидных последовательностей В1, выделенных из геномов грызунов, относящихся к 22 семействам Обнаружен целый ряд характерных структурных черт, включающих замены, делеции и дупликации в нуклеотидных последовательностях В1 Проведенный анализ позволил систематизировать В1 и разделить их на три категории (I) канонический В1-элемент, содержащий внутреннюю тандемную дупликацию, (И) рВ1, вариант без такой дупликации, рассматриваемый как эволюционный предшественник других В1-элементов, (III) сложные SINE, состоящие из двух мономеров В1(или рВ1) и Ш-родственной последовательности Обнаружено, что у подавляющего большинства анализированных семейств грызунов каноническая В1 содержит специфическую 7-нуклеотидную делецию Впервые подсемейства SINE были использованы в качестве филогенетических маркеров Анализ структурных черт канонических В1-элементов позволил проверить обсуждаемые в настоящее время филогенетические связи между семействами грызунов В частности, были получены свидетельства в пользу базального расположения семейств сонь, белок и аплодонтий на древе грызунов Предложен новый вариант механизма образования внутренней тандемной дупликации длиной 29 п н в составе В1 Разработана схема путей эволюции В1 и родственных ему SINE

Данная работа является первым крупномасштабным исследованием структуры и эволюции короткого ретропозона в одном из отрядов млекопитающих Разработанные подходы могут быть использованы для изучения эволюции как других SINE, так и организмов других систематических групп

Апробация работы

Результаты работы были представлены на Международной Конференции «Генетика в России и в мире» (Москва, 28 июня - 2 июля 2006 г), а также на ежегодных научных конференциях аспирантов ИМБ РАН (2005г, 2006i )

Публикации

По материалам диссертации опубликованы 4 печатные работы, из них 3 статьи

Структура и объем диссертации

Диссертация изложена на страницах, содержит рисункам Л

таблищЦРабота включает следующие разделы введение, обзор литературы, материалы и методы, результаты, обсуждение результатов, выводы, список цитированной литературы, включаю щии //г

источников и приложение

РЕЗУЛЬТАТЫ

Число копий В1 в геномах разных семейств грызунов

Число копий В1-элементов в геномах разных семейств грызунов было определено с помощью дот-гибридизации геномных ДНК разных видов с использованием в качестве меченого зонда В1-элемент Мы.ч тиьсиЫх Радиоавтограф фильтра представлен на рис 2 Видно, что гибридизационный сигнал дают ДНК всех тестированных видов грызунов, хотя его интенсивность довольно сильно варьирует С помощью фосфоримиджера определяли радиоактивность в каждом пятне и, зная число копий В1 в геноме М ттспЬю (955000), которое было установлено в результате полного секвенирования генома этого вида (\Vaterston е! а1 2002), оценивали число копий В1 в геномах других грызунов Большинство семейств грызунов в этом опыте представлено одним видом, однако Мипс1ае (мыши, крысы и песчанки), ОфосЫае (тушканчики) и Зсшпёае (белки) были представлены несколькими видами, относящимися к разным родам Надо отметить, что число копий В1 в пределах семейств несколько варьировало, и отличия достигали 2 0, 4 2 и 5 6 раз у Мипс1ае, ОфосМае и 8сшпс1ае соответственно

В последние годы произошел значительный прогресс в изучении филогенетических связей между семействами грызунов На рис 3 представлено одно из вероятных филогенетических деревьев семейств грызунов, полученных путем компиляции молекулярно-филогенетических данных нескольких статей (НисЬоп е! а1 2002, 81еррап е1 а1 2004, АбЬпв е1 а1 2003, НисЬоп & Боигегу 2001, Ораго 2005) (показаны только семейства, исследованные в данной работе, систематика видов представлена в подписи к рис 2) Оказалось, что очень большим числом копий В1 (6,3-12x105) характеризуются все семейства (Мигк)ае, Спсей()ае, 8ра1аас1ае, Шигош>1с1ае, ¿аросМае и СфосМае) из клады МуосЬШа (рис 3) В кладе Апота1игошофЬа наблюдается значительная разница числа копий В1 у видов из двух семейств, образующих эту кладу 7,2x105 и 1,3x10^ у

Anomaluritiae и Pedetidae соответственно Самое малое число копий В1 (не более 0,13x10 ) обнаруживается у гофера Thomomys boítae (Geomyídae). Большинство анализированных семейств (Thryonomyidae. Dasyproclidae, Hydrochoeridae, Caviidae, Cliinchilidae н Myocastoridae) из клады Hystrícognathi, характеризуется относительно большим числом копни В Í (1,3-4,6*105), хотя для дикобраза Hyxirix indica (IKstricidae) и дегу (icuidim degii (Octodontidae) эти величины составляют лишь 0.39'-* ¡05 и 0.47*10^ соответственно Грызуны, родственные белкам, обнаруживают сравнительно небольшое (Sciuridae и

Aplodontidae) или умеренное (Gliridae) число копий В ¡ н их геномах (рис 3).

['.1С, 2, Дот-гибрид Iis я цвя геномных ДНК разных видов с использованием H i мыши в качестве ЮНда. M un nao. Muri, Mus n ruse и Ins (домовая мышь). Muí ? Haftitv norvégiens (серая крыса) Cricetidnc Cr¡. Microhú social i-i (обществе пиан полевка). Gerbilinae (¡IT. Tolera indica (индийская гододапая песчанка) Spalacidac Spa. Spalax mictophtkalmm (обыkhobckHÍbí слепыш), Rluzonn iduo Rhi Tachyoryctes spkndenx (африканская бамбуковая крыса) Zapodidaç'. 7.ap, Stasia tianshanica (мышонка гянь-шанская) Dipodidae Dipl, Eremodipus ïichtensteini (тушканчик Лихтенштейна): Dip 2, AÏIactodipii.s bàbrinskii ('TA шканчик Бобринскогб); I> 1 p.v Aiacutgulus pygmaeus (-земляной зайчик) Pedetidae. i'cil t'cck'ies capcnsis (капский долгоног). AnomaHuidac: Лпо, Annmniunis sp ' шипохвос: : { ;Ы.П!.|,._ ( lis Castorfiber (обыкновенный бобр). Geomyídae. Ссо. ЧЪототух battetc (гофер ix11i) paviidac: Cav, Cavia porcellus I морская свинка). Hydrochoc riifâtëï ] (yd. Hydmchuents hydrochaens (водосвинка) ibsv proctidae- Das. Myopriicta acouchy (пкушн) ЛпуопопС' idae Thr, Thryononrys gregorianas i малая т|юетпнковая крыса). Octodoritidae: Ort. Octadon degîts (дегу) Ms ocastoridac: ^ 1>ч>. Myocastftr coyptts (нутрия). Hystricidac: Hys. Hrsrrix mdica (mciHHûKWii днкоора*) Gliridao: Gïi. Dryamys niU'ílnia (лесная соня) Sciuridae Seil, Marmoíá Landau (длиннохвостый схрок); Sel2 Spermopliiliis fíüvus (желтый суслик); SciJ. Scuirus caro Ii и ens i s (серая белка): Sc¡4 Tannas asiaricus (азиатский бурундук); Sei?, Mme le s berdnmrei (белка Еердмора) Aplodontidac Api. Apladonria ruin (горный бобр). Primates: Pri. H опт sapiens (человек). Chifichiilidae Chi ' 'hmehiUa tauiger (шиншилла). laftamorpha La«. (Jryciolagus ïunicuhix (кролик) Первые десять «nmtii.i содержат ДНК мыши, причем каждое следующей в два рака больше. ''.'1 предыдущее (or I до 5(ю tit). Гибридизации ДИК человека обусловлена Alu SINE

Варианты нуклеотидных последовательностей В1-элементов грызунов различных семейств

Для выяснения особенностей структуры В1-элементов в ДНК грызунов различных семейств были созданы геномные библиотеки 23 видов, относящихся к 22 семействам отряда Rodentia После скрининга библиотек путем гибридизации колоний с меченым В1-элементом M musculus, плазмиды из клонов, дававших гибридизационный сигнал, секвенировали Таким образом были установлены нуклеотидные последовательности 305 копий В1 Кроме того, некоторое число копий В1 было найдено в базе нуклеотидных данных GenBank/EMBL грызунов после исключения нуклеотидных последовательностей Mus mwtcuhis и Battus norvegicus Большинство нуклеотидных последовательностей копий В1 грызунов семейств Cricetidae, Cavudae и Sciundae были идентифицированы с помощью компьютерного скрининга

Все установленные нуклеотидные последовательности копий В1 анализировали и систематизировали, разделяя их на три категории (I) канонический вариант В1, содержащий внутреннюю тандемную дупликацию, (II) рВ1, вариант без такой дупликации, обычно рассматриваемый как эволюционный предшественник других вариантов, (III) сложные SINEs, в состав которых В1 входит в качестве одного из двух мономеров На рис 3 для каждого семейства грызунов указано число идентифицированных копий В1, относящихся к каждой из трех категорий В большинстве семейств грызунов классический вариант В1 преобладает над рВ1 Однако у Pedetidae, Geomyidae и Hystncidae эти два варианта В1, видимо, представлены в приблизительно равных количествах Более того, у бобра (Castondae) рВ1 встречается в геноме в 8 раз чаще, чем В1 содержащие дупликацию В случае меиготчатого прыгуна (Heteromyidae) из 9 анализированных копий все относились к рВ1, что указывает, по крайней мере, на значительное преобладание рВ1 над В1 в геноме этого грызуна Отметим, что семейства грызунов, у которых не наблюдается преобладания В1 над рВ1, на филогенетическом древе расположены базально относительно большинства других семейств Предположительно еще базальней расположены Glmdae, Sciundae и Aplodontidae У этих грызунов сильно преобладают копии сложного В1-содержащего элемента Bl-dED было найдено только две мономерные копии B1 у Sciundae и три копии рВ1 у Aplodontidae (рис 3)

Структура рВ1 грызунов различных семейств

Копии рВ1-элемента у всех изучавшихся видов сильно дивергированы, но их консенсусы у разных грызунов весьма сходны (рис 4) Большинство наблюдаемых

Число копий В1 в геноме Число анализи рованных копий Копии рВ1 сс110илис(7 анализированные рВ1

рВ1 В1 сложный В1 d10 dT

15/21 4/21 6/15

1/3 1/3

1/1

8 3/4 1/4

10 2/3 1/3

8 18/31 1/31

8/9

1 3/3

2 1/6 4/6 14 1/2 1/2

3 - 3/5 1 - 2/2 1 11/16 2/16

2/3

1 1/3 2/3

4 1/11 10/11 14 - -85

7 2/3

Рис 3 Число копий элемента В1 в геномах представителей различных семейств грызунов

Приведено вероятное филогенетическое древо грызунов, показывающее родственные связи между исследованными семействами В первом столбце показано число копий В1, оцененное с помощью дот-гибрвдизации геномных ДНК грызунов с меченным В1-зондом мыши Семейство Mundae представлено двумя подсемействами - Munnae и Gerbilhnae У видов из сем Heteromyidae чисто копий В1 не определяли (НО) из-за отсутствия достаточных количеств ДНК Указано число копии pBl, В1 и сложных (димерных) SINE (В 1-ГО и ID-B1), ссквенированных или найденных в базах данных в ходе этой работы

различий между консенсусами связано с гипервариабильными (метилируемыми) сайтами CpG Однако существует несколько позиций, проявляющих вариабельность иного характера В позиции 35 7SL РНК и рВ1 находится Т В копиях pBl (pBld7n pBldlO), несущих специфическую делецию длиной 7 или 10 п н , которые были описаны у мышей и крыс (Quentin 1994), этот нуклеотид (Т35) делегирован То же самое наблюдается практически во всех секвенированных нами копиях pBl из грызунов других семейств Однако в нескольких видах pBldlO, в основном, входящих в состав сложных SINEs (1D-pBl Ano, pBl-ID_Ped и pBl-dID_Sci), нуклеотид в этой позиции присутствует (рис 4) В позиции 47 в pBl мыши и крысы стоит Т (Quentin 1994), что также наблюдается у многих других видов, хотя у представителей некоторых семейств грызунов в данной позиции произошла замена на А (надо отметить, чю корреляции этой нуклеотидной замены с положением семейств грызунов на филогенетическом древе обнаружить не удалось) Интересно, что в трех консенсусах (pBlAno, ГО-рВ1_Апо и pBl-ED_Ped)

Muridae

Murinae (Mur) 955000 - 185

Gerbillinae (Ger) 518000 - 24

Cncetidae (Cri) 1157000 1 86

Spalacidae (Spa) 907000 - 15

Rhizomyidae (Rhl) 638000 3 16

Zapodidae (Zap) 634000 - 21

Dipodidae (Dip) 828000 1 23

Anomalundae (Ano) 719000 4 15

Pedetidae (Ped) 127000 3 3

Castondae (Cas) 65000 31 4

Heteromyidae (Het) HO 9 -

Geomyidae (Geo) 13000 3 3

Hystncidae (Hys) 39000 6 5

Thryonomyidae (Thr) 127000 2 4

Dasyproctidae (Das) 295000 5 7

Hydrochoeridae (Hyd)127000 2 6

Cavndae (Cav) 241000 16 46

Chichilidae (Chl) 464000 3 15

Octodontidae (Oct) 47000 3 12

Myocastoridae (Myo) 274000 11 12

Gliridae (Gli) 114000 - -

Sciuridae (Sel) 45000 - 2

Aplodontidae (Apt) 28000 3 -

рВ1

рВ1<17

рВ1<110

рВ1_Сп

рВ1_Агго

И)-рВ1 Апо

рВ1_Рес1

рВ1-т_р©(1

рВ1_НеЬ

рзхсео

рв! Нуе

рВ1 Од,ч

рВ1_ОСЬ

рВ1_С^в

рВ1-хо__са®

рВ1_Муо

рВ1 Сау

рв1 -<ахс_е11:

рВ1-Й10 ЗС1

»ССТЕГАдТСС ЗССФСТАЙТОС КСТСТАйТСС

ЗССчДГАА'ГСС

ЭССТбТТАТСС

ЗССТСТАЛТСС

ЭССТЕТМЙТСС ЗССТСТЛАТСС ЗССПТГААТСС

кстстаатсс ^ОТСТАМСС юстотлмсс ^СТС^ДАТСС

Рис. +. Выравнивание консенсусов нуклеотианыт последовательностей рВ1 из геномов грызунов различных семейств. В

названиях последовательностей даны три первые буквы из названий семейств грызунов (полные названия см на рис. 3) Консенсусы последовательностей дань: только для семейств, в которых было найдено, по крайней мере, три рВ I-элемента Сложные (рВ1-Ш и Ю-рВ1) приведены для пяти видов Верхние три последовательности - консенсусы последовательностей, описанные для мыши и крысы (риетШп 1994) без характерной делении (рВ1) или с лелециен 7 и 10 п. н, (рВ ] с1? ирВЫЮ соответственно).

обнаруживается характерная гексануклеотидная вставка AGAGG(C/G), а также три специфические однонуклеотидые замены, расположенные рядом с этой вставкой (рис 4) Это свидетельствует как о родственности этих вариантов последовательностей рВ1, так и тех видов грызунов, из которых они выделены Таким образом, эти данные подтверждают недавно обнаруженное (Huchon et al 2002) с помощью других молекулярных методов родство семейств Anomalundae и Pedeüdae (Отсутствие упомянутых характерных черт в Ped_pBl, видимо, может объясняться относительной редкостью соответствующего варианта рВ1 в геноме Pedetes capensts, в результате чего он не был проклонирован)

Отдельного рассмотрения заслуживает диагностическая делеция в рВ1 Только 4 из 108 проанализированных последовательностей рВ1 не имеют этой специфической делеции, то есть являются собственно рВ1 В геномах различных семейств грызунов наблюдаются элементы, имеющие в своем составе характерную делецию размером 7 (pBld7) или 10 пн (pBldlO) В геномах одних семейств грызунов наблюдается преобладание pBld7 (например, нутрия Myocastondae), в других - преобладание pBldlO (морские свинки, Cavndae, бобры Castondae) Интересно, что преобладание pBldlO наблюдается в семействах грызунов, имеющих на древе базальное расположение Castondae, Heteromyidae, Geomyidae и Apiodontidae (рис 3) Так, эффективность размножения pBld7 и pBldlO может сильно варьировать внутри отряда грызунов

Структура В1 и филогенетические связи грызунов различных семейств

Оказалось, что, в отличие от рВ1, канонические (те, содержащие внутреннюю тандемную дупликацию) В1 из геномов грызунов разных семейств весьма часто обладают структурными особенностями Были составлены консенсусные последовательности для каждого семейства грызунов На рис 5 представлено выравнивание этих консенсусов, в том числе, полученных для В1-мономеров сложных SINE Семейство Mundae представлено на рисунке четырьмя консенсусными последовательностями Bl_Mus (Mus mmaihis, подсем Munnae) варианты В l_Rat-A и Bl_Rat-B (Rafíus norvégiens, Munnae) и Bl-Ger (подсем Gerbillinae) Семейство Cncetidae также представлено четырьмя консенсусами - три варианта мономерных В1 (В1_Сп-А0, В1_Сп-А2 и В1_Сп-В1) и один вариант входящий в состав димерного SINE (B2-Bl_Cri)

Как уже отмечалось, в последние годы имел место значительный прогресс в изучении родственных отношений между семействами грызунов, основанный на анализе нуклеогидных последовательностей ядерных генов Тем не менее, в этой области все еще

j- ; ' » ri •

Iii + *

ri n >iаш H i I

Si 100 103 103109 111113 lit lit 124

W + H U III

130131

H

B1-dlD_Gfl B1-dlE_Scl 31-dlD_Apl

ЯЫЫЪ ^тгтгттсг^летт тов..

¡sJíS ^S^S'^^iríS'SS^S

F'iic. 5. Выравнивание консенсусов нуклеотидных последовательностен В1 из геномов грызунов различных семейств. В названиях последовательностей даны три первые буквы да названий семейств грызунов (полные названия см на рис. 3). Исключение составляет семейство Muridae. представленное четырьмя консенсусными последовательностями: BI_Mus (Mus mu s eu I us, подсем. Murinae), варианты В1 Rat-A и ВI _Rat-B (Rattus iiorvegicus, Muritiae) п ВI-Ger (подсем, Gerbiilinae). В случае семейства Cricetidae было также получено четыре консенсуса — три варианта моноиерньг.ч BI (В1_Сп-А0, В l_Cri-A2 и В l_Cri-B ) ) и один вариант, входящий в состав д и мерного SINE (В2-ВI Cri) Привезены также последовательности BI, образующие димерные SINE вместе с элементом ID Номера диагностических позиций с казаны сверху (нумерация дана по консенсусу В! мыши). Стрелками внизу указаны 29- и 20-нуклеотидныетавдемные дупликации.

остается ряд нерешенных вопросов На рис 6 представлено филогенетическое древо семейств грызунов, составленное нами на основании молекулярно-филогенетических данных нескольких статей (Adkins et al 2001, Huchon & Douzery 2001, Huchon et al 2002, Adkins et al 2003, Steppan et al 2004, Opazo 2005) (показаны только семейства, исследованные в данной работе)

Сравнение консенсусов В1 позволило выявить 27 синапоморфных признаков (протяженных дупликаций, вставок, делеций и однонуклеотидных замен) На рис 6 на филогенетическом древе грызунов указаны вероятные моменты возникновения 36 состояний этих признаков (состояния признаков, перешедших без изменения от рВ1 к В1 не отмечены)

Рассмотрим некоторые из синапоморфных признаков Наличие дупликации длиной 29 п н (DR29) в В1 у всех грызунов, кроме Glindae, Sciuridae и Aplodontidae (клада I), для которых характерна дупликация длиной 20 п н (DR20), подтверждает родство между кладами II и 1П и указывает на более раннюю дивергенцию клады I от остальных грызунов (рис 6) Деления dlO, характерная для клады I, также подтверждает ее обособленность от клад II и П1, в которых В1 несут делеции d7 или d9 (единственное исключение составляет Castondae с делецией dlO) Монофилия клады I подтверждается также специфическими нуклеотидными заменами в позициях 81, 82 и 88 Клады II и III достаточно дифференцируются друг от друга благодаря различиям в позициях 99, 103 и 118 их В1-элементов (рис 6) Кроме того, все семейства, входящие в группу Hystncognathi, которая вместе с Ctenodactylidae образует кладу И, характеризуются заменами Al 11 и Al 12 В разных семействах клады II В1 весьма сходны между собой, исключение составляет семейство Thryonomyidae, для которого характерны делеция d9 (а не d7 как в других семействах клады П) и замены нуклеотидов в позициях 75, 76, 100, 118 (рис 5) В кладе III и особенно в группе семейств Myodonta ВI-элементы эволюционировали заметно быстрей Монофилия Myodonta подтверждается заменами Т24 и А46 Родственные отношения между Mundae (Munnae + Gerbillinae), Cricetidae, Spalacidae и Rhyzomyidae поддерживаются нуклеотидными позициями Y55 и Т61 О сестринских отношениях между Mundae и Cncetidae свидетельствуют замены нуклеотидов в позициях 109, 121 и 124 на А Большое сходство В] слепышей и бамбуковых крыс и наличие в них специфических нуклеотидных замен (Т108, G109, G121) свидетельствуют о филогенетической близости Spalacidae и Rhyzomyidae В1 тушканчиков (Dipodidae) и мышовок (Zapodidae) содержат вставку А81/82 и пять общих нуклеотидных замен (Т51, ТЮЗ, R118, А130 и С131), что подтверждает родство этих

Рис 6 Филогенетическое древо семейств грызунов и синапоморфиые признаки В1 Отмечены вероятные моменты возникновения замен делеций и дупликаций в последовательности В i Моменты возникновения этих признаков установлены на основе анализа их наличия или отсутствия у разных семейств грызунов Состояния признаков В1, перешедших без изменения от его эвотюционного предшественника - рВ1, не отмечены Наблюдаемое распределение признаков в главных чертах подтверждает топологию данного древа, полученного путем объединения результатов ряда работ (см текст) Сверху обозначены границы клад I, II и III а также групп Myodonta и Н> stncognathi Эти клады соответствуют ранее описанным клада I - The squirrel- and doimouse-related clade, клада II - The Ctenohystnca clade (Ctedactyhdae+Hy stncognathi), клада III - The mouse-related clade (Huchon et al 2002)

семейств Таким образом, большинство черт В1 грызунов различных семейств подтверждает представленное на рис 6 древо

Рис 7 Древо, построенное на основе анализа признаков структуры В1-элементов из грызунов различных семейств (кроме Glindae, Sciundae и Aplodontidae) Быти использованы все значимые признаки последовательностей В1 В названиях В1 испочьзованы три первые буквы из названий семейств грызунов (полные названия см на рис 3) Ктады II и III, а также группа Mjodonta, обведены

Кроме описанной выше проверки филогенетического древа, основанного на анализе ядерных генов, мы предприняли попытку построения самостоятельного филогенетического древа отряда грызунов, используя консенсусные последовательности В1 семейств грызунов Использование стандартных методов построения деревьев (например, maximum likelihood и maximum parsimony) в отношении нуклеотидных последовательностей В1-элементов сталкивается с определенными трудностями, связанными, в частности, с различной выраженностью тех или иных признаков в консенсусах грызунов разных семейств Поэтому мы применили другой метод (continuous characters maximum likelihood), предназначенный для обработки количественных признаков и, тем самым, учитывающий степень выраженности признаков (например,

соотношение между нуклеотидами в данной позиции В1 последовательностей) На рис 7 представлено такое неукорененное древо, построенное для В1-элементов семейств грызунов (В1-мономеры всех сложных SINE были исключены из рассмотрения) Полученное древо ясно подтверждает монофилию клады П и клады Ш, а также группы Myodonta В то же время надо отметить, что расположение ветвей внутри этих клад не всегда совпадает с тем, которое изображено на рис 3 и б Это неудивительно, если принять во внимание небольшую протяженность нуклеотидной последовательности В1

Транскрипция рВ1 in vitro

Так как рВ1 очень древний элемент, его копии подвергнуты сильной мутационной эрозии В связи с этим возникает вопрос способны хотя бы некоторые из них к ретропозиции? Так как у нас не было методической возможности это прямо проверить, мы попытались определить, способны ли копии рВ1 к транскрипции m vitro РНК-полимеразой III (такая способность является необходимым условием для ретропозиционной активности SINE) С этой целью отобрали несколько клонов, содержащих рВ1, с наименьшим количеством мутаций в боксах А и В промотора РНК-полимеразы Ш (Anomalundae, Heteromyidae и два клона Castondae) Они были подвергнуты транскрипции m vitro с помощью ядерного экстракта клеток асцитной карциномы Эрлиха мышей, содержащего РНК-полимеразу III и все необходимые факторы транскрипции Оказалось, что эти копии рВ1 способны к транскрипции Два из четырех тестированных клонов имели низкий уровень транскрипции, другие два - высокий, хотя надо отметить, что он был все же заметно ниже, чем уровень транскрипции канонических В1 (данные не представлены) Это доказывает, что, по крайней мере, некоторые копии рВ 1 потенциально способны к ретропозиции

ОСБУЖДЕНИЕ РЕЗУЛЬТАТОВ Эволюция В1 SINE

В настоящей работе наличие В1-элементов у грызунов всех 22 изучавшихся семейств доказано клонированием и секвенированием Два типа этих последовательностей были обнаружены в большинстве случаев (1) несущие тандемные дупликации длиной 29 или 20 п н, то есть собственно В1 и (2) не имеющие таких дупликаций Элементы последнего типа ранее были описаны для геномов мышей и крыс Quantine (Quentin 1994), который назвал эти элементы рВ1, интерпретировав их как эволюционные предшественники первого (канонического) типа В1 Мы не обнар> жили

pBl среди клонированных последовательностей ДНК только в случае двух семейств -Spalacidae и Zapodidae, а также подсемейства Gerbillinae (рис 2) Это, видимо, связано со значительной девергенцией копий рВ1 и поэтому более слабыми гибридизационными сигналами этих копий по сравнению с более многочисленными копиями канонических В1 элементов в опытах по скринингу геномных библиотек По-видимому, нет особых причин сомневаться, что копии рВ 1 имеются в геномах всех грызунов

Подобно тому как наблюдал Quantme (Quentin 1994) для геномов мышей и крыс, большинство секвенированных нами рВ1 несли специфическую делецию длиной 10 или 7 пн, то есть представляли собой pBldlO- и рВ^7-элементы Это свидетельствует о том, что данные элементы являются более эффективными ретропозонами, чем полноразмерный рВ1

На рисунке 8 представлена вероятная схема эволюции В1, основанная на наших результатах и данных литературы Образование регропозона рВ 1 произошло в эволюции, видимо, лишь один раз — у общего предка грызунов, приматов и тупай (Nishihara et al 2002, Vassetzky et al 2003) Поиск 7SL РНК-родственных ретропозонов с помощью гибридизации не выявил их у млекопитающих других отрядов (Vassetzky et al 2003) В ходе настоящей работы мы осуществили компьютерный поиск таких элементов в полностью секвенированном геноме собаки Оказалось, что среди 42 обнаруженных ретропсевдогенов 7SL РНК собаки не было ни одного, напоминающего рВ1, т е несущего внутреннюю делецию протяженностью 182 пн (одни ретропсевдогены были полноразмерными, другие — укорочены с одного из концов) Молено предположить, что специфическая делеция длиной 182 п н в последовательности ретропсевдогена 7SL РНК произошла у общего предка грызунов, приматов и тупай и была как раз тем ключевым событием, которое предопределило возникновение ретропозонов В1 и Alu

Видимо, следующим событием было образование делеции dlO в pBl у предков грызунов и тупай В пользу первичности pBldlO по отношению pBld7 свидетельствует следующее Во-первых, в соответствие с принципом «экономии» представляется вероятным, что pBld7 образовался не путем делегирования 7 нуклеотидов и последующих замен трех оснований, а в результате тандемной дупликации тринуклеотида CGC в pBldlO Во-вторых, нуклеотидные последовательности только pBldlO, но не pBld7 обнаруживаются в геномах тупай (Nishihara et al 2002, Vassetzky et al 2003) и грызунов клады Gliridae - Sciuridae - Aplodontidae ((Vassetzky et al 2003) и данная работа)

Нужно отметить, что среди pBl встречаются последовательности с делецией 6, 8, 9, или 11 пн, но таких элементов значительно меньше, чем копий pBld7 и/или pBldlO Трудно с уверенностью судить о происхождении делеций такого размера Вероятно, они

возникли из делеций длиной 10 или 7 п н благодаря дополнительным однонуклеотидным делециям или вставкам Однако нельзя исключить, что такие элементы образовались из стандартных (полноразмерных) рВ1, благодаря делециям, соответствующих размеров, с последующими нуклеотидными заменами

7SL РНК

I

деления 182 н

I

pB1 (FLAM)

(грызуны приматы тупайи)

pB1d10-ID ^

(Castoridae Pedetidae)

ID-pB1d10

(Anomaluridae)

делеция 10пн _ . .

i * pB1d10-dlD

▼ Gliridae Sciuridae Aplodontidae)

^ pB1d10 x

""(грызуны, тупайи)4^^

I дупликация 20 пн

ID-pB1d7

(Octodontidae)

B1d7DR29-ID

(Dasyproctidae)

дупликация 3 пн (CGC)

4

pB1d7

^r** (фызуны)

I

дупликация 29 пн i

.. B1d7DR29 ^

(грызуны клад II и III ) I

делеция 2 пн (Тв)

I

B1d9DR29 ^

(Muridae Thryonomyidae)

B1d10DR20 1

B1d10DR20-dlD

(Gliridae Sciuridae Aplodontidae)

ID-B1d7DR29

(Myocastoridae)

ID-B1d9DR29

(Thryonomyidae)

Phc 8 Схема эволюции B1 в отряде грызунов Показано возникновение специфических дешсции и дупликаций, а также образование сложных ID-содержащих SINE В скобках указаны таксоны, в которых были обнаружены различные варианты В1-элечента Согласно этой схеме (I) pBldlO вариант эволюционно более древнии, чем pBld7, (П) 29-нуклеотидная дупликация (DR29) произошла в pBld7 (III) 20-нуклеотидная дупликация (DR20) возникла только в случае pBldlO (IV) характерный для мышей и крыс вариант Bl(d9, DR29) скорее возник из Bl(d7, DR29), чем из pBld9, (V) объединение различных вариантов рВ1 и В1 с ID-элементом привело к образованию целого ряда успешных семейств димерных SINEs

Согласно нашим наблюдениям, в геномах большинства грызунов имеются как pBld7, так и pBldlO, но часто преобладает один из видов этих элементов Так, например, pBldlO явно преобладает у представителен семейств Cavudae, Geomyidae, Heteromyidae, Castoridae, Pedetidae и Anomaluridae Преобладание копий того или иного варианта рВ1, вероятно связано с различной эффективностью master genes (pBld7 и pBldlO) у грызунов разных семейств

Анализ таких делеций в В1, содержащих 29-нуклеотидную тандемную дупликацию, позволил сделать интересное наблюдение Независимо оттого, копии pBld7 или pBldlO преобладают в геноме данного вида, почти все копии В1 содержат делецию длиной 7 п н или у некоторых видов (Мм? mmculus, Rattus norvegicu? и Thryonomys gregoriarrus) - длиной 9 п н Единственное исключение составляет бобр (Castoridae), у которого все 4 клонированные копии В1 имели делецию dlO Можно предположить, что возникновение 29-нуклеотидной дупликации было уникальным или крайне редким событием Вероятно, эта дупликация произошла в одной из копий pBld7 у общего предка грызунов, входящих в клады II и III (рис 6 и 8), и дало начало очень эффективному и успешному варианту В1 в большинстве семейств грызунов этих клад В1, содержащие 9-нуклеотидную делецию (d9), могли возникнуть из такого варианта В1 (то есть с дупликацией 29 п н и делецией 7 п н) благодаря дополнительной делеции 2 нуклеотидов (рис 8) Альтернативно такое подсемейство В1 могло образоваться из pBld9 благодаря независимому возникновению 29-нуклеотидной тандемной дупликации Возможно, образование В1 у бобра результат независимого образования 29-нуклеотидной дупликации в pBldlO Очень вероятно, что высокая копийность и широкое распространение Bld7 по сравнению с BldlO является следствием «успешности» и высокой ретропозиционной активности, связанной со структурно-функциональной активностью первого из них

Еще одним механизмом повышения «успешности» рВ1 и В1 как ретропозонов, вероятно, является их объединение с ID-элементами с образованием димерных SINE (рис 8) Нами был обнаружен целый ряд копий таких SINE (рис 4 и 5) В одних из них В1 элемент был правым мономером, а ГО - левым, в других расположение этих последовательностей было обратным В одних семействах последовательность ГО была мало измененной, тогда как в других она могла содержать специфическую делецию (В1-dlD) или дополнительные последовательности (ГО-В1 из Thryonomys gregonanus) Следует отметить, что среди рассматриваемых димерных SINEs встречаются как содержащие рВ 1, так и В1 В большинстве случаев структура рВ1/В1 мономера в димерных SINEs близка к консенсусу этих одиночных последовательностей из данного семейства грызунов Однако в некоторых случаях они могут обладать некоторыми особенностями Например, 1D-B1 Anomaluridae имеет делецию d8 в отличие от одиночных В1, несущих делецию d7 (рис 5) Ранее в нашей лаборатории была выдвинута гипотеза (Vassetzky et al 2003) о том, что возникновение 29-нуклеотидной дупликации связано с наличием пентануклеотида GCGAG как в начале дуплицированной последовательности, так и после нее, в предшественнике современного В1 элемента Предполагается что при обратной

транскрипции мог произойти «перескок» фермента со второго (левого) такого пентануклеотида на первый (правый) В результате чего произошел повторный синтез 29-нуклеотидного участка с образованием соответствующей тандемной дупликации (Kramerov & Vassetzky 2005) Данная модель была разработана для pBldlO, но как можно видеть из настоящего исследования BldlO встречаются очень редко (главным образом, у Castor fiber) Однако оказалось, что эта модель может быть применена и в случае pBld7 Как мы предполагаем, pBld7 возник из pBldlO путем образования тандемной дупликации тринуклеотида CGC При этом в pBld7 также сохраняется пентануклеотид GCGAG, расположенный в начале дуплицированной последовательности (рис 9) Таким образом, в результате обратной транскрипции, сопровождаемой обратным перескоком фермента, могла бы образоваться копия В1, несущая делецию длиной 7 нуклеотидов и тандемную дупликацию длиной 29 нуклеотидов Последующие однонуклеотидные замены могли привести к образованию разнообразных подсемейств современных В1 элементов (рис 9)

Хотя существование 29-нуклеотидной дупликации в В1 последовательности установлено уже давно (Ullu & Tschudi 1984, Labuda et al 1991) ранее никто не отмечал тот факт, что в результате этой дупликации происходит появление второй копии В-бокса промотора РНК- полимеразы Ш (рис 9) Хотя в результате нуклеотидных замен вторая копия несколько отличается от первой, можно предположить, что наличие двух В-боксов в В1 последовательности каким-то образом обуславливает успешность этого элемента, как ретропозона Надо отметить, что существуют и другие примеры SINE s, содержащих вторую копию В-бокса РНК-полимеразы III (Borodulina & Kramerov 1999)

В целом ряде семейств грызунов В1-последовательности характеризуются значительным количеством специфических особенностей (однонуклеотидные замены, небольшие делеции и вставки) По-видимому, в таких линиях грызунов происходила более быстрая эволюция В1 элементов, чем в других К первым можно отнести семейства, относящиеся к группе Myodonta, а также семейство Thryonomyidae, ко вторым - прочие семейства из клады II Hystricognathi (Рис 5) Наблюдаемые отличия В1 в родственных семействах (например, Zapodidae и Dipodidae или Spalacidae и Rhyzomyidae) свидетельствует о том, что большинство копий В1 амплифицировалась уже после дивергенции пар этих семейств, которая приблизительно датируется 45 и 23 млн лет назад соответственно По-видимому, все представители Cricetidae (включая хомяков Cricetmae и полевок Arvicolinae) характеризуются наличием подсемейств В1, несущих специфический пентануклеотид ССAAA Очевидно, эти подсемейства В1 появились после возникновения Cricetidae, но до разделения этих грызунов на подсемейства С другой стороны у Cricetidae существует подсемейство В1, обозначенное Bl_Cri-Bl, очень

tcGCttgagtccagGAGttctggg <-182 bp-> ccagcctgggcaacataGCGAGac 7SL РНК

' I

делеция 182 пи

tcGCttgagcccagGAGttogaggccagcctgg^aacataGCGAGac pB1

I

делеция 10 пн t

tcGC----------GAGttcgaggccagcctgggcaacataGCGAGac pB1d10

дупликация CGC t

TcGCcGC-------GAGttcgaggccagcctgggcaacataGCGAGac pB1d7

»

дупликация 29 пн ' .,

tcgccGC GÀGttcg^gccagcctgggcaacatÀGCGAGttcga^

I

мутации

f

* * ** *

tcgctgcgagttcgaggccagcctgggctacatagtgagytcaaqgccagcctqaactacatagcgàgac в1 "i i *** * * * ^ * * * * *

tctctGTGAGttcgaggccagcctggtctacakaGTGAGttccaggacagcctgggctacacaGNGARac В1-Ш

Рис 9 Возможный механизм возникновения В1, имеющего 7-нуклеотидную делецию и 29-иуклеотидную дупликацию Пентануклеотидные прямые повторы (отмечены пунктирными стрелками) образовались из нуклеотвдов, показанных жирным шрифтом, после 10-нуклеотидной делецин и 3-нуклеотидной дупликации Предполагается, что обратная транскриптаза при синтезе кДНК на матрице pBld7 РНК могла перескочить с левого 5-нуклеотидного повтора на правый, что привело к повторной обратной транскрипции 29-нуклеотидной последовательности и ее дуплицированию (дуплицированный район отмечен сплошными стрелками) В ходе эволюции в этой последовательности происходили и фиксировались мутации (отмечены звездочками), что привело к потере идентичности между левой и правой копиями повтора Последовательности Bill и В1-Ш содержат нуклеотидные замены, характерные для последовательностей В1 грызунов клады II и клады III соответственно Последовательность бокса В промотора РНК-полимеразы III и сходная с ней последовательность в правом 29-щ клеотидном повторе подчеркнуты

сходное с В1 из песчанок (Bl_Ger) или Rattus norvegicus (Bl_Rat-A) (Рис 5) Это свидетельствует о том, что некоторые подсемейства В1 могут сохраняться в мало измененном виде на протяжении длительных эволюционных периодов - по крайней мере, 22 млн лет

Еще одним примером интенсивной амплификации специфического подсемейства В1 происходившей на относительно поздней стадии дивергенции грызунов, может служить В1, содержащий 9-нуклеотидную делецию, (Bld9) Хотя копии таких В1 в небольшом числе могут быть обнаружены у представителей разных семейств грызунов, в большом числе среди анализированных видов они присутствуют только у Mus muscultis, Ra/lns norvégiens и y '1 hryonomys gregoriamis Возникновение и распространение Bld9 у Т gi ego: /amis, скорее всего, произошло независимо от того, что имело место у Muridae

Интересно, что, если копии Bld9 у R norvégiens составляют лишь треть всех В1 (остальные Bld7), то у Ai musculus они составляют подавляющее большинство, обладая, кроме того, рядом специфических нуклеотидных замен По-видимому, «успешный» вариант Bld9 возник еще до расхождения Raí tus и Mus, но особенно эффективным, очевидно, оказался мышиный подвариант этого элемента

Надо отметить, что в мышином геноме также имеются копии Bld7, но число их невелико, а последовательности очень сильно дивергированы Это подсемейство известное под названием B1F (Quentin 1994) дополнительно подразделяется на два варианта, B1F1 и B1F2, в Repbase Update При сравнении его диагностических позиций с представленными на рис 5 для В1 других грызунов, возникновение В1F можно отнести к периоду началу дивергенции клад II и Ш (данные не приведены) По-видимому, в линии Mus это B1F подсемейство не было очень успешным и более того, давно прекратило свое размножение С этой точки зрения интересно, что во всех семействах грызунов, базально расположенных в кладе II (Hystncidae, Thryonomyidae) и кладе Ш (Pedetidae, Castondae, Heteromyidae, Geomyidae) число копий В1 сравнительно невелико - от 1,3*104 до 1,3*105 (рис 3) В геномах предков этих видов, вероятно, уже присутствовало BlF-подобное семейство, но по каким-то причинам оно не было очень успешным и не породило у этих грызунов других подсемейств Ble очень высокой регропозиционной активностью

Хотя в геномах гоферов (Geomyidae) и мешотчатых прыгунов (Heteromyidae) число копий В1/рВ1 невелико, у них богато представлены копии другого SINE, IDL-Geo (Gogolevsky & Kramerov 2006) Последний факт свидетельствует о том, что у гоферов и мешотчатых прыгунов должен быть весьма активен L1, поскольку активность этого LINE необходима для амплификации не только В1, но и IDL-Geo Можно сделать вывод о том, что низкая копийность В1 в данном случае связана не с инактивацией L1 а скорее с отсутствием эффективных вариантов В1 Также можно предположить наличие конкуренции за факторы, участвующие в ретропозиции, между В1 и IDL-Geo, в которой последний проявил свои преимущества

Мы предположили, что и у других грызунов со сравнительно низким числом копий В1/рВ1 в геноме, могут присутствовать иные высококопийные SINE Для проверки этого, мы специальным образом проскринировали геномную библиотеку бобра (более 4х 104 клонов) но не обнаружили других рассеянных по геному повторяющихся последовательностей, кроме LI, В1 и ID (последний в очень небольшом числе) Хотя, обычно млекопитающие содержат в своих геномах сотни тысяч копий SINE, это, по-видимому, не является строгим правилом геном бобра нормально функционирует при

наличии лишь 65 тыс копий В1 Однако, возможно, что низкая копийность SINE отрицательно сказывается на изменчивости генома и темпах видообразования

В1 и филогения грызунов

Хотя информации, содержащейся в нуклеотидных последовательностях В1, по-видимому, не вполне недостаточно для построения полноценного самостоятельного филогенетического древа отряда грызунов, использование ряда диагностических позиций в последовательностях этого SINE позволяет проверить филогенетические построения, сделанные с помощью других подходов В последние годы имел место значительный прогресс в изучении родственных отношений между семействами грызунов, главным образом, путем анализа нуклеотидных последовательностей ядерных генов (Adkms et al 2001, Huchon & Douzery 2001, Huchon et al 2002, Adkins et al 2003, Steppan et al 2004, Opazo 2005) Использование выводов этих исследований позволило представить вероятные родственные связи, изучавшихся в данной работе семейств грызунов, в виде древа, изображенного на рис 6 Топология некоторых участков этого древа пока не находит однозначных доказательств Так, до сих пор не было полной ясности с базальным расположением клады, состоящей из семейств Glmdae, Sciundae и Aplodontidae Наши данные подтверждают такое положение этой группы семейств, поскольку только для них характерны последовательности В1, с дупликацией 20 п н, тогда как В1 остальных грызунов несут дупликацию длиной 29 п н К плохо доказанному относится положение на древе таких семейств, как Anomaluridae, Pedetidae, Castondae, Geomyidae и Heteromyidae Данные по диагностическим позициям В1 подтверждают, что они входят в ту же кладу (Ш), что и Myodonta, но имеют в ней базальное расположение Обнаруженные нами особенности структуры последовательностей рВ1 подтвердили родственность семейств Anomalundae и Pedetidae Однако надо отметить, что особенности В1 последовательности бобра (наличие делеции dlO и дупликации длиной 29 п н) может служить указанием на несколько иную позицию, чем указана на использованном нами древе (рис 6) возможно Castondae дивергировали несколько раньше, до возникновения Bld7DR29, то есть до дивергениции клад П и Ш Другими результатами проведенного нами анализа диагностических позиций В1 является весьма убедительное подтверждение топологии древа внутри группы семейств Myodonta, а также доказательство монофилии Hystncognathi (клада II) Можно надеяться, что дальнейшие исследования структуры В1 с использованием большего числа их копий и вовлечением других семейств грызунов может дать значительный дополнительный вклад в построение филогении отряда грызунов

выводы

1 Число копий короткого ретропозона (SINE) В1 варьирует в геномах исследованных грызунов от 104 до 106 Низким числом копий В1 характеризуются виды относительно рано возникших семейств грызунов

2 Клонировано и секвенировано более 300 копий В1 из геномов грызунов 22 семейств Все последовательности В1 относились к одной из трех категорий (I) канонические В1, содержащие внутреннюю тандемную дупликацию длиной 29 пн, (II) рВ1, лишенные такой дупликации и рассматриваемые как эволюционные предшественники других вариантов В1, (Ш) сложные SINE, состоящие из двух мономеров В1 (или рВ1) и Ш-родственной последовательности В большинстве семейств канонический В1 преобладает над рВ1, тогда как у рано возникших семейств грызунов рВ1 или сложные SINE доминируют по числу копий над В1

3 Большинство последовательностей рВ1 содержат специфическую делецию длиной 7 или 10 п н (d7, dlO) В1 из геномов большинства грызунов имеют делецию d7 или в более редких случаях (Muridae и Thryonomyidae) - d9 В геномах белок, аплодонтий и сонь последовательности В1 имеют внутреннюю тандемную дупликацию длиной 20 п н, делецию dlO и входят в состав сложного SINE Bl-dID

4 Сравнение В1 из геномов грызунов разных семейств выявило характерные черты - однонуклеотидные замены, вставки, делеции и протяженные дупликации Анализ распространения этих черт В1 среди исследованных семейств свидетельствует в пользу существования трех больших клад грызунов I - семейства, родственные белкам (Sciundae, Aplodontidae и Glmdae), II - Hystncognathi, III - остальные 11 семейств, включая 6 семейств мышеподобных грызунов (Myodonta) На филогенетическом древе клада I расположена базально

5 Предложена схема эволюции короткого ретропозона В1 Образовавшийся из последовательности 7SL PIIK рВ1 приобрел специфическую делецию dlO, затем в результате дупликации тринуклеотида CGC эта делеция превратилась в d7 В результате дупликации 29-нуклеотидного участка внутри pBld7 возник канонический В1-элемент В тех или иных семействах грызунов все эти формы рВ1 и В1, соединяясь с ID-элементом, образовывали новые сложные SIN Е

6 Показана способность некоторых копий рВ1 транскрибироваться РНК-полимеразой 1И m vitro Это указывает на то что такие копии рВ1 могли сохранить способность к ретропозиции до настоящего времени

Список печатных работ, опубликованных по теме диссертации* Статьи

1 N.A Veniaminova, N S Vassetzky, D A Kramerov В1 SINEs in different rodent families// Genomics, 2007, 89, p 678-686

2 H.A. Вениаминова, H С Васецкий, JIА Лавренченко, С В Попов, Д А Крамеров Реконструкция филогении отряда грызунов (Rodentia) по данным структурного анализа короткого ретропозона В1 // Генетика, 2007, том 43, № 7, с 916-929

3 Н.А Вениаминова, К П Гоголевский, Н С Васецкий, Д А Крамеров Сравнительный анализ числа копий коротких ретропозонов Ш и В1 в геномах грызунов // Молекулярная биология, 2007, том 41, с

Тезисы конференций

1 НА. Вениаминова Эволюция короткого ретропозона В1 // Материалы Международной Конференции «Генетика в России и в мире» (Москва, 28 июня - 2 июля 2006 г ), стр 28

Регистрационные номера (GenBank) нуклеотидных последовательностей, установленные автором- EF042308 - EF042578

Содержание диссертации, кандидата биологических наук, Вениаминова, Наталья Александровна

Основные обозначения и сокращения.

Введение.

1. Обзор литературы

Мобильные генетические элементы.

1.1. Ретротранспозоны.

1.2. Длинные ретропозоны (LINE).

1.3. Короткие ретропозоны (SINE).

1.3.1. Структура SINE.

1.3.1.1. «Голова».

1.3.1.2. «Тело».

1.3.1.3. «Хвост».

1.3.1.4. SINE с нетипичной структурой.

1.3.2. Механизм амплификации SINE.

1.3.2.1. Транскрипция.

1.3.2.2. Посттранскрипционная модификация.

1.3.2.3. Транспорт в цитоплазму.

1.3.2.4. Ретропозиция SINE.

1.3.3. SINE, произошедшие из 7SL РНК.

1.3.3.1. Alu SINE.

1.3.3.2. B1 SINE.

1.3.3.3. 7SL РНК-родственные SINE из геномов тупай.

1.3.4. Возможные функции SINE и их роль в эволюции генома.

1.3.4.1. SINE, как источник последовательностей, регулирующих транскрипцию генов.

1.3.4.2. SINE и альтернативный сплайсинг.

1.3.4.3. Alu-элементы и аденозин-инозиновое редактирование.

1.3.4.4. Роль SINE при стрессовых воздействиях.

1.3.4.5. Гены малых РНК, произошедшие от SINE.

1.3.4.6. SINE как филогенетические маркеры.

2. Материалы и методы.

2.1. Материалы, реактивы и приборы, использованные в работе.

2.1.1. Ферменты и наборы.

2.1.2. Плазмидные векторы.

2.1.3. Другие реактивы.

2.1.4. Материалы.

2.1.5. Приборы.

2.2. Выделение геномной ДНК.

2.3. Полимеразная цепная реакция.

2.4. Электрофорез ДНК в агарозном геле.

2.4.1. Выделение ДНК из геля.

2.5. Радиоактивное мечение ДНК.

2.6. Дот-гибридизация.

2.7. Получение компетентных клеток.

2.8. Создание геномных библиотек и их скрининг.

2.9. Выделение плазмидной ДНК.

2.9.1. Метод 1.

2.9.2. МетодН.

2.10. Секвенирование ДНК.

2.11. Компьютерный анализ.

2.12. Выделение ядерного экстракта клеток асцитной карциномы Эрлиха (АКЭ).

2.13. Получение конструкций для транскрипции.

2.14. Транскрипция in vitro.

3. Результаты.

3.1. Число копий В1 в геномах разных семейств грызунов.

3.2. Варианты нуклеотидных последовательностей В1-элементов грызунов различных семейств.

3.3. Структура рВ1 грызунов различных семейств.

3.4. Структура В1 и филогенетические связи грызунов различных семейств.

3.5. Транскрипция рВ1 in vitro.

3.6. Поиск повторяющихся последовательностей в геноме Castor fiber.

4. Обсуждение результатов.

4.1. Эволюция В1 SINE.

4.2. В1 и филогения грызунов.

4.3. Транскрипционная активность рВ1.

Выводы.

Благодарности.

Введение Диссертация по биологии, на тему "Эволюция короткого ретропозона В1"

Мобильные генетические элементы, известные под названием короткие ретропозоны, или SINE (Short Interspersed Elements), представляют собой рассеянные по геномам эукариот повторяющие последовательности длиной от 80 до 400 п.н., амплификация которых происходит с помощью обратной транскрипции. Первые SINE были описаны более 25 лет назад. Все эти годы исследования SINE интенсивно развивались; в результате чего наши знания об этих мобильных генетических элементах значительно расширились. Стали в общих чертах известны механизмы их размножения, и выяснилось, что они играют важную роль в эволюции геномов и самих организмов. Однако многие вопросы, в частности, связанные с путями и механизмами эволюции самих SINE остаются малоизученными.

В геномах млекопитающих одного вида имеется 2-4 семейства коротких ретропозонов, каждое из которых содержит десятки или сотни тысяч копий, чьи нуклеотидные последовательности обычно обладают 65-90%-ным сходством.

SINE транскрибируются РНК-полимеразой III, благодаря наличию в своей 5' -концевой части промотора РНК-полимеразы III, состоящего из двух боксов (А и В), которые разделены последовательностью длиной 30-40 п.н. Короткие ретропозоны относятся к неавтономным мобильным элементам, поскольку не кодируют собственных ферментов и используют для своего размножения обратную транскриптазу, закодированную в одном из видов длинных ретропозонов, или LINE (Long Interspersed Elements). Большинство SINE млекопитающих размножаются с помощью длинного ретропозона L1.

Наиболее распространены семейства SINE, ведущие свое происхождение от молекул тРНК, поскольку их нуклеотидные последовательности обладают выраженным сходством с тем или иным видом тРНК. Однако имеются два класса SINE, чье происхождение связано с другими РНК, синтезирующимися РНК-полимеразой III. Один из них включает несколько недавно открытых семейств SINE рыб, произошедших из 5S рРНК (Kapitonov and Jurka, 2003; Nishihara et al., 2006). Короткие ретропозоны другого класса (Alu приматов и В1 грызунов) были среди первых описанных SINE (Deininger et al., 1981; Haynes et al., 1981; Kramerov et al., 1979; Krayev et al., 1980). Они ведут происхождение от цитоплазматической 7SL РНК, имеющей длину 300 нуклеотидов и входящей в состав рибонуклеопротеидных частиц SRP (signal recognition particles). SRP участвуют в узнавании сигнальных пептидов секретируемых и мембранных белков.

В процессе возникновения Alu и В1, произошла потеря центральной части 7SL РНК длиной 144-182 нуклеотидов. Alu (300 п.н.) состоит из двух таких сходных, но неидентичных последовательностей - левого (L) и правого (R) мономеров. Alu были найдены в геномах всех изучавшихся в этом отношении приматов, включая полуобезьян (Prosimiae), что свидетельствует о возникновении Alu у общего предка всех приматов (Roos et al., 2004; Zietkiewicz et al., 1998). В отличие от Alu, В1-элемент из геномов домовой мыши {Mus musculus) и серой крысы {Rattus norvegicus) представляет собой мономер и имеет длину около 140 п.н.

Грызуны (Rodentia) образуют самый обширный отряд млекопитающих, состоящий, по крайней мере, из 30 семейств (Hartenberger, 1985; Павлинов, 2003). Если В1 у мышей и крыс (сем. Muridae) изучены сравнительно хорошо (Bains and Temple-Smith, 1989; den Dunnen and Schoenmakers, 1987; Krayev et al., 1982), в частности, благодаря секвенированию геномов М. musculus (Waterston et al., 2002) и R. norvegicus (Gibbs et al., 2004), то этот SINE из геномов других грызунов остается очень мало изученным.

Недавно, используя гибридизацию с В1-зондом М. musculus, в нашей лаборатории было показано наличие 7SL РНК-родственных SINE, помимо приматов (Alu), у грызунов всех 15 тестированных семейств, а также у тупай (отр. Scandentia), но не у представителей других отрядов млекопитающих (Vassetzky et al., 2003). Предварительные опыты по клонированию и секвенированию геномных фрагментов ДНК подтвердили наличие копий В1 у таких грызунов как тушканчики, мышовки, белки, бобры и морские свинки (Vassetzky et al., 2003). Однако подробного систематического исследования В1, включающего большинство семейств грызунов до сих пор не проводилось.

Целью данной диссертационной работы было изучение распространенности, структуры, возможных путей и механизмов эволюции короткого ретропозона В1 в отряде грызунов. Для чего были поставлены следующие задачи:

1. Оценить число копий В1 в геномах грызунов различных семейств.

2. Клонировать и секвенировать копии В1 из представителей большого числа семейств грызунов.

3. Проанализировать установленные нуклеотидные последовательности В1 и выявить их специфические структурные черты. Основываясь на этих чертах проанализировать филогению грызунов.

4. Построить схему эволюции В1 в отряде грызунов.

В ходе данной работы было клонировано, секвенировано и проанализировано более 300 копий В1 из геномов грызунов, относящихся к 22 семействам. Еще недавно исследования такого рода были не осуществимы в нашей стране. Однако благодаря тому, что автоматическое секвенирование ДНК стало вполне доступным методом исследования, решение вышеописанных задач оказалось выполнимым.

I, ОБЗОР ЛИТЕРАТУРЫ

МОБИЛЬНЫЕ ГЕНЕТИЧЕСКИЕ ЭЛЕМЕНТЫ

Выделяют два основных класса подвижных (мобильных) элементов эукариот: Д11К-транспозоны и ретротранспозоны. Эта классификация основана на молекулярных механизмах, с помощью которых происходит перемещение таких элементов (Рис. 1). ДНК-транспозоны (или просто транспозоны) перемещаются с участием комплекса белков, обеспечивающего активность фермента транепозазы. которая узнает элемент и переносит его на новое место.

ДНК-транспозон механизм «с lit-and-paste»)

Ретротранспозон механизм «сору-and-paste»)

ДНК-донор транспозаза транспозаза прилегающие последовательности

ДНК-донор

РНК-пол и мепаза

РНК обратная транскриптаза I свободная ДНК-копия

Новые вставки мобильных элементов

Рис. f. Упрощенная схема, иллюстрирующая два механизма появления копий мобильных элементов в новых участках генома.

Транспозоны ограничены с двух сторон так называемыми инвертированными повторами, то есть одинаковыми последовательностями, имеющими противоположную ориентацию (Рис. 2). Инвертированные повторы необходимы для перемещения элемента, которое осуществляется благодаря их сближению друг с другом и узнаванию транспозазой.

ДНК-донор, содержащая ДНК-транс п озш

ДНК-мишень з

З1 3

3' инвертированные аовторы сайт-мишень дупликации ф Транспозаза делает тупые разрывы в донорной ДНК и липкие разрывы в ДНК-мишени 5

3'

3 '<

3'

5'-нес паренные основания Транспозаза лигирует транспозонс

5'-одноцепочечными разрывами донорной ДНК

5' н и б1 Клеточная ДНК-полимераза достраивает 3"-концы сайта-мишени и соединяет их с ДНК-транспозоном

Я—И сайт-мишень дупликации (прямые повторы)

Рис. 2. Схема нерепликативнойтранспозиции ДНК-траиспозонов.

Инвертированные повторы сближаются и точно отрезаются транспозазой от соседних участков ДНК хозяина. Успешному вырезанию элемента способствует дополнительная сверхспирализация двунитеевоЙ спирали ДНК, обеспечивающая изгибы двойной спирали и сближение отдельных ее участков. Вырезанный гранспозон внедряется в район разрыва, вносимого транспозазой, в молекуле-мишени и сшивается с ДНК хозяина в новом месте. Разрыв и сшивание осуществляются транспозазой и вспомогательными белками.

Транспозаза может кодироваться как самим подвижным элементом, который будет перемещаться, так и другой копией элемента, локализованной в том же геноме в отдалении.

ДНК-транспозоны в геноме человека заметно активнее, чем у мыши. В геноме мыши идентифицировано 4 семейства ДНК транспозонов (mariner-элемент MMAR1, hAT-элементы URRI, RMER30 и RCharl), в то время как у человека выделяют 14 семейств таких элементов. Для своего выживания в ходе эволюции ДНК-транспозоны приобрели способность к горизонтальному переносу в геном нового хозяина, используя в качестве вектора вирусы или другие внутриклеточные паразиты. Примером может служить транспозон mariner: в геноме мыши он представлен элементом MMAR1, а у человека -элементом HMAR1, последовательности которых идентичны на 97 процентов (Waterston et al., 2002).

1.1. Ретротранспозоны

Другой большой класс подвижных элементов - это ретротранспозоны, они не вырезаются из хромосомы, как это делают транспозоны (механизм «cut-and-paste»), а амплифицируются, то есть образование их новых копий в геноме не сопряжено с потерей уже существующих («copy-and-paste») (Рис. 1). Механизм такой амплификации основан на открытой в 1970 году Г. Теминым и Д. Балтимором реакции обратной транскрипции -синтеза цепи ДНК на матрице РНК. Обратная транскрипция была обнаружена при изучении ретровирусов, содержащих РНК, которая служит матрицей при образовании ДНК-копии. Фермент, осуществляющий эту реакцию синтеза ДНК на РНК, называют обратной транскриптазой или (в русской литературе) ревертазой. Ревертаза не только ведет синтез нити ДНК на РНК, но и осуществляет синтез второй комплементарной нити ДНК, а РНК-матрица распадается и удаляется. Двухнитевая ДНК синтезируется в цитоплазме, а затем перемещается в ядро и встраивается в геном. Оказавшись в хромосоме, ДНК ретровируса (провирус) стабильно наследуется в ряду клеточных поколений как обычный ген. Большой класс ретротранспозонов по своей структуре очень напоминает провирусы (Arkhipova et al., 1995). По-видимому, многие такие ретротранспозоны ведут прямое происхождение от ретровирусов, хотя, в свою очередь сами ретровирусы, по-видимому, возникли из древних вариантов ретротранспозонов. Ретротранспозоны этого класса, как и провирусы, имеют на концах длинные повторы (Long Terminal Repeat - LTR), благодаря чему их называют LTR-ретротранспозоны (хотя нередко для краткости используется просто термин «ретротранспозоны») (Рис. 3). м- 5-8 тпн -►

LTR (250-600 пн) кодирующий район LTR (250-600 пи)

Рис. 3. Общая схема строения LTR-рефотранспозонов.

LTR-ретротранспозоны, как следует из названия, ограничены с двух сторон левым (51) и правым (3') длинными концевыми повторами и реплицируются подобно ретровирусам. Эти элементы транскрибируются РНК-полимеразой II. с промотора, который находится в 5'-концевом LTR. Кроме того, ретротранспозоны кодируют белки, необходимые для их амплификации. Эти белки закодированы в двух открытых рамках считывания (open reading frames, ORF). Белок gag считываегся с первой рамки - ORF1 . После процессинга полипептидного продукта гена gag образуются структурные белки нуклеокапсиды, связывающейся с РНК ретротранспозона. ORF2 кодирует полипротеин pol, который содержит: (1) домены аспарагиновой протеиназы. необходимой для посттранскрипционного процессинга этого полипептида; (2) обратную транскриптазу и рибонуклеазу Н, которые, образуя бифункциональный полипептид, осуществляют обратную транскрипцию и удаление РНК-матрицы; (3) интегразу. которая «встраивает» новую копию ретротранспозона в геном.

По мере того как происходит накопление данных по определению нуклеотидных последовательностей различных эукариотических геномов, становится ясно, что геномы большинства организмов содержат LTR-ретротранспозоны. Несмотря на то, что практически все эти ретротранспозоны содержат гены gag и pol, указанные гены значительно отличаются своей нуклеотидной последовательностью и геномной организацией в различных элементах. Международным комитетом по таксономии вирусов (ICTV) было предложено разделить LTR-ретротранспозоны в зависимости от порядка расположения в них функциональных доменов в гене pol на группы: Ty3/gypsy (Boeke et al., 2004) и Tyl/copia (Boeke et al., 2002). В элементах группы Tyl/copia в гене pol функциональный домен обратной транскриптазы располагается за интегразой, а у элементов группы Ty3/gypsy функциональный домен интегразы следует за доменом обратной транскриптазы, подобно организации гена pol у ретровирусов позвоночных (Рис. 4). Комитетом ICTV элементы группы Tyl/copia предложено называть исевдовирусами (Psevdoviridae), a Ty3/gypsy - метавирусами (Metaviridae).

5 ltr Кодирующая последовательность 3 ltr

ЕТН-^АР, 'l^T-ftMA.^H-1 1М 1 Ty3/gypsy I Г.ЛП I-Il. ' AW' I IK! I 4-!МАЛД Tyl/copia

Рис. 4. Два типа LTR-ретротранспозонок, отличающихся порядком расположения в них функциональных доменов в гене pol.

Семейство Metaviridae населяет геномы многих эукариот, такие, как грибы (Neuveglise et al., 2002). миксомицеты, растения (Friesen et al., 2001; Marin and Llorens, 2000; Siioniemi et al., 1998) и животные (Bae et al., 2001; Butler et al., 2001; Volff et al., 2001). Metaviridae классифицируют на группы в зависимости от присутствия (Errantiviruses) или отсутствия (Metaviruses) дополнительной третьей рамки считывания, обладающей сходством с геном env настоящих ретровирусов. Группа Chromoviruses (Marin and Llorens, 2000), отличается наличием хромодомена (CD), который располагается на С-конце интегразы и содержит 40-50 аминокислот (Kordis, 2005). Кроме того, выделяют группу Semotiviruses (BEL-ретротранспозоны) (Goodwin and Рои Iter. 2002). Филогенетический анализ Metaviridae показывает наличие 10 клад: Chromovirits, CsRnl, Mdh3, Osvaldo (включая Gmrl и Cigr2 семейства), Athila, Mag, Gypsy, Mdgl, Ccr или Tor клады (Bae et al., 2001; Gorinsek et al., 2004; Malik and Eickbush, 1999; Marin and Llorens, 2000; Volff et al., 2004, Семин и Ильин, 2005). Большинство клад Metaviridae имеют ограниченное распространение и встречаются только в отдельных таксономических группах, такнх как членистоногие (Mdgl, Mdg3 и Gypsy), нематоды (Сег), оболочники (Cigrl и Тог) и растения (Athila). И только клада Chromoviruses широко распространена среди грибов, растений и позвоночных. Psevdoviridae предложено разделить на три группы: Psevdoviruses (идентифицированы в геномах растений), Hemiviruses и Sireviruses (Havecker et al., 2004; Malik et al., 2000).

Наличие гена env не ограничено представителями Errantivirus. Открытая рамка считывания, соответствующая env-подобному гену, обнаружена также в элементах, принадлежащих к представителям отдельных родов семейств Metaviridae (Metaviruses, Semotiviruses) и Psevdoviridae (Sireviruses) (Malik et al., 2000). Например, следующие метавирусы имеют еиг-подобный ген: Boudicca, недавно обнаруженный в геноме паразита человека Schistosoma mansoni (Copeland et al„ 2003), Athila, распространенный в геноме Arabidopsis (Wright and Voytas, 2002) и Baggy-2 ячменя (Vicient et al., 2001). В геномах нематод, дрозофилы и рыбы фугу также тестированы последовательности семотивирусов с дополнительным елу-подобным геном (Bowen and McDonald, 1999; Frame et al., 2001). Кроме того, около трети LTR-ретротранспозонов, относящихся к Sireviruses, имеют эту последовательность в своем составе (Havecker et al., 2004).

В последнее время обнаружено немало LTR-ретротранспозонов, у которых присутствует одна или несколько других дополнительных рамок считывания. Например, в элементах RIRE2 из риса (Ohtsubo et al., 1999) и Grande 1 из кукурузы (Martinez-Izquierdo et al., 1997) дополнительные рамки считывания кодируют антисмысловую РНК к некоторым транскриптам генов хозяйского генома. А ретротранспозон Bsl кукурузы (Bureau et al., 1994; Jin and Bennetzen, 1994) в качестве дополнительной ORF приобрел часть последовательности гена, кодирующего АТФазу. Приобретенные LTR-ретротранспозонами дополнительные ORF могут также находиться и в генах gag и pol (Claypool et al., 2001).

В геномах многих эукариот обнаружены также неавтономные элементы, которые не кодируют необходимые для транспозиции белки и активизируются in trans белками автономных элементов. К таким LTR-ретротранспозонам относятся LARD (large retrotransposon derivatives) (Kalendar et al., 2004), TRIM (terminal repeats in miniature) (Witte et al., 2001) и Morgane (Sabot et al., 2006). LARD-элементы обнаружены в ячмене и пшенице, они содержат протяженные LTR и длинные консервативные внутренние домены, которые не обладают белок-кодирующей способностью. TRIM-элементы имеют укороченные LTR и внутренние домены, содержащие лишь сигналы для обратной транскрипции. Представители этого класса обнаружены в геномах картофеля и арабидопсиса. Morgane-элементы являются промежуточным звеном между автономными и полностью неавтономными элементами и имеют небольшой остаток pol ORF2.

LTR-ретротранспозоны в геномах млекопитающих представлены эндогенными ретровирусами (ERV) и неавтономными их производными (Maksakova et al., 2006). ERV в геноме мыши разделяют на три класса: класс I - мышиный вирус лейкемии (MuLV), класс II - интроцистенальная А-частица (IAP) и MMTV (mouse mammary tumor virus), класс III -MuERV-L. ERV-элементы почти вымерли (потеряли способность к амплификации) в геноме человека, в то время как все три класса в геноме мыши остаются активными и в настоящее время (Waterston et al., 2002).

Элементы класса I у человека встречаются в 4 раза чаще, чем у мыши. У мыши этот класс включает такие активные ERV, как мышиный вирус лейкемии, MuRRS, MuRVY и VL30, у человека - HERVK10, HERBK113.

Копии ретротранспозонов класса II в 10 раз более распространены в геноме мыши, чем человека. У мыши выделяют два основных активных элемента - интроцистернальная А-частица (IAP) и ранние ретротранспозоны (ЕТп).

Класс III самый большой по числу копий, он составляет около 80% всех выявленных ретротранспозонов. Этот класс включает неавтономные MaLR-элементы, которые «успешны» в геноме мыши (MuERV-L, МТ и ORR1) и в настоящее время, но потерявшие активность в линии приматов, ведущей к человеку, около 50 миллионов лег назад.

LTR-ретротранспозоны, являясь неотъемлемой частью геномной ДНК, передаются как менделеевские гены от родителей к потомству, то есть вертикально. Кроме того, существуют доказательства их горизонтального переноса (Jordan et al., 1999). Скорее всего, это происходит в тех случаях, когда ретро в и русы переходят с хозяина одного вида на хозяина другого вида. Затем, вследствие накопления мутаций а провирусах, они теряют инфекционность и превращаются в эндогенные ретровирусы. Дальнейшие изменения в таких провирусах, в частности потеря гена ет>, превращают их в классические ретротранспозоны, которые часто не способны формировать даже внутриклеточные вирионы.

1.2, Длшшые ретропозоны (LINE)

В геномах эукариот широко распространены также другие мобильные элементы, размножающиеся с помощью обратной транскрипции. Один из классов таких элементов -длинные ретропозоны. Они не имеют длинных концевых повторов и поэтому в англоязычной литературе иногда называются «non-LTR-retrotransposons». Другое часто используемое обозначение этих элементов генома - LINE (Long Interspersed Elements). Типичные полноразмерные LINE имеют длину 6-7 т.п.н. и содержат две открытые рамки считывания (ORF1 и ORF2). ORF1 длиной ~ I т.п.н. кодирует РНК-связывающий белок. ORF2 (~ 4 т.п.н.) кодирует полипептид, обладающий определенным сходством с обратной транскриптазой ретровирусов и LTR-ретротранспозонов (Рис. 5).

ORF1 . , >к 1 тпн

ORF2 4 тпн

->1

5'-не транслируемый район кодирующая последовательность З'-нетранслируемый район

Рис. 5. Общая схема строения полноразмерного LINE.

Наиболее распространенный длинный ретропозон в геномах млекопитающих -LINE1, часто обозначаемый как LI (Smit, 1996). Этот ретропозон составляет по массе около 17 % всей ДНК человека, и представлен в геноме 5x105 копиями (Lander et al., 2001). Лишь небольшая их часть - полноразмерные L1, тогда как остальные представляют собой укороченные с 5'-конца копии (то есть они содержат только З'-концевые районы). Несмотря на то, что L1 -элементы рассеяны по всему геному, их концентрация варьирует в зависимости от геномного района. Обычно L1 -элементы сконцентрированы в АТ-богатых районах генома, которые характеризуются низким уровнем рекомбинации и где отсутствуют гены. Например, L1-элементы составляют 89% одного из районов (длиной 100 т.п.н.) хромосомы X, в то время как они практически отсутствуют в кластерах генов, содержащих гомеобоксы (Lander et al., 2001). Относительно «молодые» L1 -элементы нередко обнаруживаются вблизи генов, тогда как многочисленные «старые» копии концентрируются в районах, не содержащих генов (Medstrand et al., 2002). Полагают, что такое распределение L1 объясняется отрицательным их воздействием на работу генов и вследствие этого, отбором, направленным против их сохранения вблизи генов.

Полноразмерный L1 содержит внутренний промотор для РНК-полимеразы II в 5'-нетранслируемом районе (5'UTR), в то время как на З'-конце располагается (А)П/(Т)П последовательность, которую обычно называют поли (А)-хвостом. После транскрипции L1 и транспорта РНК в цитоплазму, ORF1 и ORF2 в ее составе подвергаются трансляции. Полипептид, закодированный в ORF1, представляет собой РНК-связывающий белок р40, для которого in vitro была показана шаперонная активность в отношении нуклеиновых кислот (Kolosha and Martin, 2003; Martin and Bushman, 2001). Роль этого белка в репликации L1-элементов пока не вполне ясна. Белок, закодированный в ORF2, имеет эндонуклеазную (Feng et al., 1996) и ревертазную (Mathias et al., 1991) активности. Белки L1-элементов и их РНК собираются в рибонуклепротеиновые частицы (Martin, 1991), которые в основном находятся в цитоплазме, но, по-видимому, некоторая их часть транспортируется в ядро.

В ядре образуется цепь ДНК на матрице РНК L1 при участии ревертазы L1 в процессе, называемом мишень-затравляемой обратной транскрипцией (TPRT - target-primed reverse transcription). TPRT была впервые обнаружена при изучении ретропозона R2 из генома тутового шелкопряда Bombyx mori (Luan et al., 1993; Yang et al., 1999) и позднее показана также для L1 и других длинных ретропозонов (Cost et al., 2002; Feng et al., 1996). В процессе TPRT домен эндонуклеазы ORF2 разрезает одну из цепей геномной ДНК, оставляя свободную гидроксильную группу на З'-конце. Ревертаза ORF2 использует этот конец цепи ДНК как праймер для обратной транскрипции РНК L1-элемента. Вторая цепь (верхняя) ДНК-мишени также разрезается эндонуклеазой ORF2, но правее (для L1 расстояние между двумя разрывами составляет 4-20 п.н.) и образовавшийся З'-конец используется для синтеза второй цепи ДНК, видимо, клеточной ДНК-полимеразой. В результате образуется новая копия LINK!, фланкированная прямыми повторами длиной 4-20 п.н. (Рис. 6). Надо отметить, что предпочтительными сайтами расщепления ДНК для эндонуклеазы L1 являются последовательности TTJAAAA и TYTN для первого и второго разрывов соответственно.

Геномная ДНК

Сайт-мишень мипипиммттш ТТТТТТП 11 IIII II Till IIIII II HIT т

Первый разрыв I

ДЕЙСТВИЕ ЭНДОНУКЛЕАЗ, ПРАЙМИРОВАНИЕ

РНК LINE 5* II I I I I I I I 1 I гтт

Второй разрыв * I

ОБРАТНАЯ ТРАНСКРИПЦИЯ, ИНТЕГРАЦИЯ

I'lihiMlin

ЕШДШШШДПЕ.

Дупликация сайта-мишени шшшшп

РЕПАРАЦИЯ

Дупликация сайта-ми hi ен и

11IIII1IIIIIIII

Новая копия LP4E

Рис. 6. Схема мишень-затравляемой обратной транскрипцией (TPRT - target-primed reverse transcription).

Прямо или косвенно L1-элементы вовлечены в эволюцию генома. Интеграция LI-элементов в новые сайты генома чаще имеет отрицательные или нейтральные последствия, чем положительные. Вставка L1 в кодирующую последовательность гена обычно инактивирует белок-кодирующую функцию, что было обнаружено, в случае некоторых мутаций в экзоны генов фактора VIII свертываемости крови и дистрофина (Kazazian et al,, 1988; Narita et a]., 1993). С другой стороны известны случаи того, что в результате интеграции участки L1-элемента оказываются составной частью кодирующих последовательностей генов. Интеграция Ll-элементов в интроны может изменять структуру мРНК благодаря появлению в генах новых сайтов сплайсинга (Meischl et al., 2000; Schwahn et al., 1998) и сигналов полиаденилирования (Perepelitsa-Belancio and Deininger, 2003). Вставка копии LI перед геном, может нарушать работу его регуляторных последовательностей. В то же время, привнося свои собственные регуляторные последовательности, L1 может изменять экспрессию гена, что иногда может быть полезным и закрепляться в эволюции.

При транскрипции активных копий L1 происходит считывание З'-фланкирующих последовательностей, в результате чего, РНК L1 часто содержит на своем конце длинные дополнительные последовательности, в частности, экзоны генов. При ретропозиции таких последовательностей в другие гены, последние могут приобретать новые экзоны. Посредством такого механизма, получившего название «перетасовка экзонов» (ехоп shuffling) (Moran et al., 1999), LI-элементы играют важную роль в эволюции генов.

Широкое распространение Ll-элементов в геноме делает их частыми участниками неравного кроссинговера, то есть процесса рекомбинации, который происходит между неаллельными копиями этого длинного ретропозона. Такое явление приводит к образованию протяженных (более 3 тыс.п.н.) дупликаций и делеций (Gilbert et al., 2002; Symer et al., 2002).

Была выдвинута гипотеза о том, что L1-элементы способствуют инактивации одной из X хромосом у самок млекопитающих. В основе этой гипотезы лежит тот факт, что район центра инактивации Х-хромосомы сильно обогащен L1-элементами. Кроме того, инактивация аутосомных транслокаций на Х-хромосому зависит от концентрации Ll-элементов в траснлоцированном фрагменте хромосомы (Lyon, 1998).

Существует также гипотеза о том, что интеграция Ll-элементов в межгенные районы увеличивает расстояние между генами и тем самым увеличивает частоту рекомбинации, то есть уменьшают сцепленность этих генов. Это в свою очередь должно увеличивать эффективность независимого отбора генов и способствовать эволюции организмов (Comeron, 2001).

Идентифицированные в настоящее время LINE можно сгруппировать в 11 различных клад. Все они характеризуются наличием домена обратной транскриптазы (RT), единственного домена, общего для всех LINE-элементов. Клада «CRE» включает SLACS, CZAR, CRE1, CRE2 элементы, которые проявляют сайт-специфичность в отношении мини-экзонов у трипаносом (Aksoy et al., 1990; Gabriel et al., 1990). Клада «R2» широко распространена среди членистоногих (Burke et al., 1987). Элементы R4 и Dong клады «R4» идентифицированы в геномах нематод и членистоногих (аскарида и тутовый шелкопряд) (Burke et al., 1995). 112-элементы сайт-специфичны для генов рРНК, в то время как элементы клады «R4» специфичны как для генов рРНК (R4), так и для простых повторов (Dong). Элементы клады «LI» (Malik et al., 1999) обнаружены в геномах позвоночных, различных растений, водорослей и миксомицетов. Некоторые представители этой клады сайт-специфичны (например, Тх1 у Xenopus и Zepp у Chlorella), другие не обладают специфичностью (Tall арабидопсиса и L1 позвоночных).

В геномах нематод, насекомых и позвоночных обнаружены элементы, относящиеся к кладе «RTE» (Bov-B коровы, JAM1 малярийного комара, RTE1 и RTE2 нематоды С. elegans) (Youngraan et al., 1996). Кроме того, выделяют три сестринские клады «Tadl» (Cambareri et al., 1994), «LOA» (Felger and Hunt, 1992), «Rl» (Xiong and Eickbush, 1988), а также две другие родственные клады: «CR1» (Silva and Burch, 1989) и «Jockey» (Priimagi et al., 1988). Клада Tadl представлена только в геномах грибов (Cgtl 3 из генома Glomerella, Mgr583 из Magnoporthe, Marsl из Ascobulu и Tadl из Neurospora), в то время как представители клад LOA, Jockey, и R1 распространены в геномах членистоногих. LINE клады R1 сайт-специфичны в отношении генов рРНК (Rl, RT1) или - теломерных повторов (TRAS, SAR1). Клада CR1 имеет самое широкое распространение, элементы этой клады идентифицированы в геномах позвоночных, насекомых, нематод и трематод. К этой кладе также относится LINE2 (L2) из генома человека, однако копии этого элемента у плацентарных млекопитающих неактивны и довольно сильно разрушены. И, наконец, последняя клада «I». К этой кладе относятся элементы BGR, I, ingi и LITc, обнаруженные в геномах моллюсков, насекомых и трипаносом.

LINE-элементы стабильные составные части геномов эукариот, которые передаются в ряду поколений (то есть вертикально) и сохраняются на протяжении огромных исторических периодов. Однако известны случаи горизонтального переноса длинных ретропозонов. Так, LINE Bov-B, впервые обнаруженный в геноме быка (Duncan, 1987) (Majewska et al., 1988), и как выяснилось, свойственный всем жвачным (Ruminantia) (Jobse et al., 1995) (Modi et al., 1996), но не другим млекопитающим, оказался характерным и для чешуйчатых рептилий (Squamata) (Kordis and Gubensek, 1997). Единственным объяснением такого распределения LINE Bov-B среди позвоночных может быть только горизонтальный перенос этого ретропозона между рептилиями и жвачными.

Заключение Диссертация по теме "Молекулярная биология", Вениаминова, Наталья Александровна

выводы

1. Число копий короткого ретропозона (SINE) В1 варьирует в геномах исследованных грызунов от 104 до 106. Низким числом копий В1 характеризуются виды относительно рано возникших семейств грызунов.

2. Клонировано и секвенировано более 300 копий В1 из геномов грызунов 22 семейств. Все последовательности В1 относились к одной из трех категорий: (I) канонические В1, содержащие внутреннюю тандемную дупликацию длиной 29 п.н.; (II) pBl, лишенные такой дупликации и рассматриваемые как эволюционные предшественники других вариантов Bl; (III) сложные SINE, состоящие из двух мономеров: В1 (или pBl) и ID-родственной последовательности. В большинстве семейств канонический В1 преобладает над pBl, тогда как у рано возникших семейств грызунов pBl или сложные SINE доминируют по числу копий над В1.

3. Большинство последовательностей pBl содержат специфическую делецию длиной 7 или 10 п.н. (d7, dlO). ВI из геномов большинства грызунов имеют делецию d7 или в более редких случаях (Muridae и Thryonomyidae) - d9. В геномах белок, аплодонтий и сонь последовательности В1 имеют внутреннюю тандемную дупликацию длиной 20 п.н., делецию dlO и входят в состав сложного SINE Bl-dID.

4. Сравнение Bl из геномов грызунов разных семейств выявило характерные черты - однонуклеотидные замены, вставки, делеции и протяженные дупликации. Анализ распространения этих черт В1 среди исследованных семейств свидетельствует в пользу существования трех больших клад грызунов: I - семейства, родственные белкам (Sciuridae, Aplodontidae и Gliridae); II - Hystricognathi; III - остальные 11 семейств, включая 6 семейств мышеподобных грызунов (Myodonta). На филогенетическом древе клада I расположена базально.

5. Предложена схема эволюции короткого ретропозона В1. Образовавшийся из последовательности 7SL РНК pBl приобрел специфическую делецию dlO, затем в результате дупликации тринуклеотида CGC эта делеция превратилась в d7. В результате дупликации 29-нуклеотидного участка внутри pBld7 возник канонический В1-элемент. В тех или иных семействах грызунов все эти формы pBl и В1, соединяясь с ID-элементом, образовывали новые сложные SINE.

6. Показана способность некоторых копий pBl транскрибироваться РНК-полимеразой III in vitro. Это указывает на то, что такие копии pBl могли сохранить способность к ретропозиции до настоящего времени.

Благодарности

Автор выражает искреннюю благодарность своему научному руководителю -Дмитрию Александровичу Крамерову за терпеливое обучение навыкам работы, а также за внимательное и чуткое руководство. Автор благодарит Н.С. Васецкого за помощь и ценные советы в компьютерной обработке данных, а также всех сотрудников лаборатории эволюции геномов эукариот за хорошую творческую атмосферу в лаборатории. Отдельная благодарность всем, кто предоставил образцы тканей и ДНК, которые были использованы в данной работе.

Библиография Диссертация по биологии, кандидата биологических наук, Вениаминова, Наталья Александровна, Москва

1. Adkins, R.M., Gelke, E.L., Rowe, D., and Honeycutt, R.L. (2001). Molecular phylogeny and divergence time estimates for major rodent groups: evidence from multiple genes. Mol Biol Evol 18,777-791.

2. Adkins, R.M., Walton, A.H., and Honeycutt, R.L. (2003). Higher-level systematics of rodents and divergence time estimates based on two congruent nuclear genes. Mol Phylogenet Evol 26,409-420.

3. Aksoy, S., Williams, S., Chang, S., and Richards, F.F. (1990). SLACS retrotransposon from Trypanosoma brucei gambiense is similar to mammalian LINEs. Nucleic Acids Res 18, 785792.

4. Allen, T.A., Von Kaenel, S., Goodrich, J.A., and Kugel, J.F. (2004). The SINE-encoded mouse B2 RNA represses mRNA transcription in response to heat shock. Nature structural & molecular biology 11,816-821.

5. Arkhipova, I.R., Lyubomirskaya, N.V., and Ilyin, Y.V. (1995). Drosophila Retrotransposons (Austin, R.G. Landes Company).

6. Arnaud, P., Yukawa, Y., Lavie, L., Pelissier, Т., Sugiura, M., and Deragon, J.M. (2001). Analysis of the SINE SI Pol III promoter from Brassica; impact of methylation and influence of external sequences. Plant J 26,295-305.

7. Athanasiadis, A., Rich, A., and Maas, S. (2004). Widespread A-to-I RNA editing of AIu-containing mRNAs in the human transcriptome. PLoS biology 2, e391.

8. Babich, V., Aksenov, N., Alexeenko, V., Oei, S.L., Buchlow, G., and Tomilin, N. (1999). Association of some potential hormone response elements in human genes with the Alu family repeats. Gene 239,341-349.

9. Bachvarova, R. (1988). Small B2 RNAs in mouse oocytes, embryos, and somatic tissues. Dev Biol 130,513-523.

10. Bains, W., and Temple-Smith, K. (1989). Similarity and divergence among rodent repetitive DNA sequences. J Mol Evol 28,191-199.

11. Batzer, M.A., and Deininger, P.L. (2002). Alu repeats and human genomic diversity. Nature reviews 3,370-379.

12. Batzer, M.A., Deininger, P.L., Hellmann-Blumberg, U., Jurka, J., Labuda, D., Rubin, C.M., Schmid, C.W., Zietkiewicz, E., and Zuckerkandl, E. (1996). Standardized nomenclature for Alu repeats. J Mol Evol 42,3-6.

13. Batzer, M.A., Kilroy, G.E., Richard, P.E., Shaikh, Т.Н., Desselle, T.D., Hoppens, C.L., and Deininger, P.L. (1990). Structure and variability of recently inserted Alu family members. Nucleic Acids Res 18,6793-6798.

14. Bhattacharya, R., Perumal, K., Sinha, K., Maraia, R., and Reddy, R. (2002). Methylphosphate cap structure in small RNAs reduces the affinity of RNAs to La protein. Gene Expr 10, 243253.

15. Bird, A.P. (1980). DNA methylation and the frequency of CpG in animal DNA. Nucleic Acids Res 8,1499-1504.

16. Boeke, J.D. (1997). LINEs and Alus~the polyA connection. Nat Genet 16,6-7.

17. Boeke, J.D., Eickbush, Т.Н., Sandmeyer, S.B., and Voytas, D.F. (2002). Pseudoviridae. In Virus Taxonomy: Eighth Report of International Committee on Taxonomy of Viruses. Edited by Fauquet C.M. New York: Academic Press.

18. Boeke, J.D., Eickbush, Т.Н., Sandmeyer, S.B., and Voytas, D.F. (2004). Metaviridae. In Virus Taxonomy: Eighth Report of International Committee on Taxonomy of Viruses. Edited by Fauquet C.M. New York: Academic Press.

19. Borchert, G.M., Lanier, W., and Davidson, B.L. (2006). RNA polymerase III transcribes human microRNAs. Nature structural & molecular biology 13,1097-1101.

20. Borodulina, O.R., and Kramerov, D.A. (1999). Wide distribution of short interspersed elements among eukaryotic genomes. FEBS Lett 457,409-413.

21. Borodulina, O.R., and Kramerov, D.A. (2001). Short interspersed elements (SINEs) from insectivores. Two classes of mammalian SINEs distinguished by A-rich tail structure. Mamm Genome 12,779-786.

22. Borodulina, O.R., and Kramerov, D.A. (2005). PCR-based approach to SINE isolation: Simple and complex SINEs. Gene 349,197-205.

23. Bowen, N.J., and McDonald, J.F. (1999). Genomic analysis of Caenorhabditis elegans reveals ancient families of retroviral-like elements. Genome Res 9,924-935.

24. Brini, A.T., Lee, G.M., and Kinet, J.P. (1993). Involvement of Alu sequences in the cell-specific regulation of transcription of the gamma chain of Fc and T cell receptors. J Biol Chem 268,1355-1361.

25. Britten, R.J. (1994). Evidence that most human Alu sequences were inserted in a process that ceased about 30 million years ago. Proc Natl Acad Sci U S A 91,6148-6150.

26. Brookfield, J.F. (2005). The ecology of the genome mobile DNA elements and their hosts. Nature reviews 6,128-136.

27. Bureau, Т.Е., White, S.E., and Wessler, S.R. (1994). Transduction of a cellular gene by a plant retroelement. Cell 77,479-480.

28. Burke, W.D., Calalang, C.C., and Eickbush, Т.Н. (1987). The site-specific ribosomal insertion element type II of Bombyx mori (R2Bm) contains the coding sequence for a reverse transcriptase-like enzyme. Mol Cell Biol 7,2221-2230.

29. Burke, W.D., Muller, F., and Eickbush, Т.Н. (1995). R4, a non-LTR retrotransposon specific to the large subunit rRNA genes of nematodes. Nucleic Acids Res 23,4628-4634.

30. Butler, M., Goodwin, Т., Simpson, M„ Singh, M., and Poulter, R. (2001). Vertebrate LTR retrotransposons of the Tfl/sushi group. J Mol Evol 52,260-274.

31. Cambareri, E.B., Helber, J., and Kinsey, J.A. (1994). Tadl-1, an active LINE-like element of Neurospora crassa. Mol Gen Genet 242,658-665.

32. Carter, A.B., Salem, A.H., Hedges, D.J., Keegan, C.N., Kimball, В., Walker, J.A., Watkins, W.S., Jorde, L.B., and Batzer, M.A. (2004). Genome-wide analysis of the human Alu Yb-lineage. Human genomics 1,167-178.

33. Chesnokov, I., and Schmid, C.W. (1996). Flanking sequences of an Alu source stimulate transcription in vitro by interacting with sequence-specific transcription factors. J Mol Evol 42,30-36.

34. Chu, W.M., Ballard, R., Carpick, B.W., Williams, B.R., and Schmid, C.W. (1998). Potential Alu function: regulation of the activity of double-stranded RNA-activated kinase PKR. Mol Cell Biol 18,58-68.

35. Chu, W.M., Liu, W.M., and Schmid, C.W. (1995). RNA polymerase III promoter and terminator elements affect Alu RNA expression. Nucleic Acids Res 23,1750-1757.

36. Churakov, G., Smit, A.F., Brosius, J., and Schmitz, J. (2005). A Novel Abundant Family of Retroposed Elements (DAS-SINEs) in the Nine-Banded Armadillo (Dasypus novemcinctus). Mol Biol Evol 22,886-893.

37. Claypool, J.A., Malik, H.S., Eickbush, Т.Н., and Sandmeyer, S.B. (2001). Ten-kilodalton domain in Ty3 Gag3-Pol3p between PR and RT is dispensable for Ty3 transposition. J Virol 75,1557-1560.

38. Comeron, J.M. (2001). What controls the length of noncoding DNA? Curr Opin Genet Dev 11,652-659.

39. Cordaux, R., Hedges, D.J., Herke, S.W., and Batzer, M.A. (2006). Estimating the retrotransposition rate of human Alu elements. Gene 373,134-137.

40. Cost, G.J., Feng, Q., Jacquier, A., and Boeke, J.D. (2002). Human LI element target-primed reverse transcription in vitro. Embo J 21,5899-5910.

41. Dagan, Т., Sorek, R., Sharon, E., Ast, G., and Graur, D. (2004). AluGene: a database of Alu elements incorporated within protein-coding genes. Nucleic Acids Res 32, D489-492.

42. Daniels, G.R., and Deininger, P.L. (1983). A second major class of Alu family repeated DNA sequences in a primate genome. Nucleic Acids Res 11,7595-7610.

43. Daniels, G.R., and Deininger, P.L. (1985). Repeat sequence families derived from mammalian tRNA genes. Nature 317, 819-822.

44. Deininger, P.L., and Batzer, M.A. (1999). Alu repeats and human disease. Molecular genetics and metabolism 67, 183-193.

45. Deininger, P.L., Batzer, M.A., Hutchison, C.A., 3rd, and Edgell, M.H. (1992). Master genes in mammalian repetitive DNA amplification. Trends Genet 8,307-311.

46. Dewannieux, M., Esnault, C., and Heidmann, T. (2003). LINE-mediated retrotransposition of marked Alu sequences. Nat Genet 35,41-48.

47. Dewannieux, M., and Heidmann, T. (2005a). LI-mediated retrotransposition of murine BI and B2 SINEs recapitulated in cultured cells. Journal of molecular biology 349,241-247.

48. Dewannieux, M., and Heidmann, T. (2005b). LINEs, SINEs and processed pseudogenes: parasitic strategies for genome modeling. Cytogenetic and genome research 110,35-48.

49. Dewannieux, M., and Heidmann, T. (2005c). Role of poly(A) tail length in Alu retrotransposition. Genomics 86,378-381.

50. Dignam, J.D., Lebovitz, R.M., and Roeder, R.G. (1983). Accurate transcription initiation by RNA polymerase II in a soluble extract from isolated mammalian nuclei. Nucleic Acids Res 11,1475-1489.

51. Doolittle, W.F., and Sapienza, C. (1980). Selfish genes, the phenotype paradigm and genome evolution. Nature 284,601-603.

52. Duncan, C.H. (1987). Novel Alu-type repeat in artiodactyls. Nucleic Acids Res 15,1340.

53. Elder, J.T., Pan, J., Duncan, C.H., and Weissman, S.M. (1981). Transcriptional analysis of interspersed repetitive polymerase III transcription units in human DNA. Nucleic Acids Res 9, 1171-1189.

54. Englert, M., Felis, M., Junker, V., and Beier, H. (2004). Novel upstream and intragenic control elements for the RNA polymerase Ill-dependent transcription of human 7SL RNA genes. Biochimie 86,867-874.

55. Esnault, C., Maestre, J., and Heidmann, T. (2000). Human LINE retrotransposons generate processed pseudogenes. Nat Genet 24,363-367.

56. Espinoza, C.A., Allen, T.A., Hieb, A.R., Kugel, J.F., and Goodrich, J.A. (2004). B2 RNA binds directly to RNA polymerase II to repress transcript synthesis. Nature structural & molecular biology 11,822-829.

57. Felger, I., and Hunt, J.A. (1992). A non-LTR retrotransposon from the Hawaiian Drosophila: the LOA element. Genetica 85,119-130.

58. Felsenstein, J. (1985). Phylogenies from Gene Frequencies: A Statistical Problem. Systematic Zoology 300-311.

59. Felsenstein, J. (1989). PHYLIP Phylogeny Inference Package (Version 3.2). Cladistics 5, 164-166.

60. Feng, Q., Moran, J.V., Kazazian, H.H., Jr., and Boeke, J.D. (1996). Human LI retrotransposon encodes a conserved endonuclease required for retrotransposition. Cell 87, 905-916.

61. Ferrigno, O., Virolle, Т., Djabari, Z., Ortonne, J.P., White, R.J., and Aberdam, D. (2001). Transposable B2 SINE elements can provide mobile RNA polymerase II promoters. Nat Genet 28, 77-81.

62. Fornace, A.J., Jr., and Mitchell, J.B. (1986). Induction of B2 RNA polymerase III transcription by heat shock: enrichment for heat shock induced sequences in rodent cells by hybridization subtraction. Nucleic Acids Res 14,5793-5811.

63. Fornasari, D., Battaglioli, E., Flora, A., Terzano, S., and Clementi, F. (1997). Structural and functional characterization of the human alpha3 nicotinic subunit gene promoter. Molecular pharmacology 51, 250-261.

64. Frame, I.G., Cutfield, J.F., and Poulter, R.T. (2001). New BEL-like LTR-retrotransposons in Fugu rubripes, Caenorhabditis elegans, and Drosophila melanogaster. Gene 263,219-230.

65. Friesen, N., Brandes, A., and Heslop-Harrison, J.S. (2001). Diversity, origin, and distribution of retrotransposons (gypsy and copia) in conifers. Mol Biol Evol 18,1176-1188.

66. Fuhrman, S.A., Deininger, P.L., LaPorte, P., Friedmann, Т., and Geiduschek, E.P. (1981). Analysis of transcription of the human Alu family ubiquitous repeating element by eukaryotic RNA polymerase III. Nucleic Acids Res 9,6439-6456.

67. Gabriel, A., Yen, T.J., Schwartz, D.C., Smith, C.L., Boeke, J.D., Sollner-Webb, В., and Cleveland, D.W. (1990). A rapidly rearranging retrotransposon within the miniexon gene locus of Crithidia fasciculata. Mol Cell Biol 10,615-624.

68. Gilbert, N., and Labuda, D. (1999). CORE-SINEs: eukaryotic short interspersed retroposing elements with common sequence motifs. Proc Natl Acad Sci USA 96,2869-2874.

69. Gilbert, N., Lutz-Prigge, S., and Moran, J.V. (2002). Genomic deletions created upon LINE-1 retrotransposition. Cell 110,315-325.

70. Gogolevskaya, I.K., Koval, A.P., and Kramerov, D.A. (2005). Evolutionary History of 4.5SH RNA. Mol Biol Evol.

71. Gogolevskaya, I.K., and Kramerov, D.A. (2002). Evolutionary history of 4.5SI RNA and indication that it is functional. J Mol Evol 54,354-364.

72. Gogolevsky, K.P., and Kramerov, D.A. (2006). Short interspersed elements (SINEs) of the Geomyoidea superfamily rodents. Gene 373,67-14.

73. Goodier, J.L., and Maraia, R.J. (1998). Terminator-specific recycling of a Bl-Alu transcription complex by RNA polymerase III is mediated by the RNA terminus-binding protein La. J Biol Chem 273,26110-26116.

74. Goodwin, T.J., and Poulter, R.T. (2002). A group of deuterostome ТуЗ/ gypsy-like retrotransposons with Tyl/ copia-like pol-domain orders. Mol Genet Genomics 267,481-491.

75. Gorinsek, В., Gubensek, F., and Kordis, D. (2004). Evolutionary genomics of chromoviruses in eukaryotes. Mol Biol Evol 21,781-798.

76. Hambor, J.E., Mennone, J., Coon, M.E., Hanke, J.H., and Kavathas, P. (1993). Identification and characterization of an Alu-containing, T-cell-specific enhancer located in the last intron of the human CD8 alpha gene. Mol Cell Biol 13, 7056-7070.

77. Hamdi, H.K., Nishio, H., Tavis, J., Zielinski, R., and Dugaiczyk, A. (2000). Alu-mediated phylogenetic novelties in gene regulation and development. Journal of molecular biology 299, 931-939.

78. Han, K., Xing, J., Wang, H., Hedges, D.J., Garber, R.K., Cordaux, R., and Batzer, M.A. (2005). Under the genomic radar: the stealth model of Alu amplification. Genome Res 15, 655-664.

79. Hanke, J.H., Hambor, J.E., and Kavathas, P. (1995). Repetitive Alu elements form a cruciform structure that regulates the function of the human CD8 alpha T cell-specific enhancer. Journal of molecular biology 246,63-73.

80. Hartner, J.C., Schmittwolf, C., Kispert, A., Muller, A.M., Higuchi, M., and Seeburg, P.H. (2004). Liver disintegration in the mouse embryo caused by deficiency in the RNA-editing enzyme ADAR1. J Biol Chem 279,4894-4902.

81. Hasler, J., and Strub, K. (2006). Alu elements as regulators of gene expression. Nucleic Acids Res 34,5491-5497.

82. Havecker, E.R., Gao, X., and Voytas, D.F. (2004). The diversity of LTR retrotransposons. Genome Biol 5,225.

83. Haynes, S.R., and Jelinek, W.R. (1981). Low molecular weight RNAs transcribed in vitro by RNA polymerase III from Alu-type dispersed repeats in Chinese hamster DNA are also found in vivo. Proc Natl Acad Sci USA 78,6130-6134.

84. Hellmann-Blumberg, U., Hintz, M.F., Gatewood, J.M., and Schmid, C.W. (1993). Developmental differences in methylation of human Alu repeats. Mol Cell Biol 13, 45234530.

85. Herrera, R.J., Rojas, D.P., and Terreros, M.C. (2007). Polymorphic Alu insertions among Mayan populations. Journal of human genetics 52,129-142.

86. Huchon, D., Chevret, P., Jordan, U., Kilpatrick, C.W., Ranwez, V., Jenkins, P.D., Brosius, J., and Schmitz, J. (2007). Multiple molecular evidences for a living mammalian fossil. Proc Natl Acad Sci U S A 104,7495-7499.

87. Huchon, D., and Douzery, E.J. (2001). From the Old World to the New World: a molecular chronicle of the phylogeny and biogeography of hystricognath rodents. Mol Phylogenet Evol 20,238-251.

88. Inoue, H., Nojima, H., and Okayama, H. (1990). High efficiency transformation of Escherichia coli with plasmids. Gene 96,23-28.

89. Jagadeeswaran, P., Forget, B.G., and Weissman, S.M. (1981). Short interspersed repetitive DNA elements in eucaryotes: transposable DNA elements generated by reverse transcription of RNA pol III transcripts? Cell 26,141-142.

90. Jin, Y.K., and Bennetzen, J.L. (1994). Integration and nonrandom mutation of a plasma membrane proton ATPase gene fragment within the Bsl retroelement of maize. Plant Cell 6, 1177-1186.

91. Jobse, C., Buntjer, J.B., Haagsma, N., Breukelman, H.J., Beintema, J.J., and Lenstra, J.A. (1995). Evolution and recombination of bovine DNA repeats. J Mol Evol 41,277-283.

92. Jordan, I.K., Matyunina, L.V., and McDonald, J.F. (1999). Evidence for the recent horizontal transfer of long terminal repeat retrotransposon. Proc Natl Acad Sci U S A 96,12621-12625.

93. Jurka, J. (1997). Sequence patterns indicate an enzymatic involvement in integration of mammalian retroposons. Proc Natl Acad Sci USA 94,1872-1877.

94. Jurka, J., and Milosavljevic, A. (1991). Reconstruction and analysis of human Alu genes. J Mol Evol 32,105-121.

95. Jurka, J., and Zuckerkandl, E. (1991). Free left arms as precursor molecules in the evolution of Alu sequences. J Mol Evol 33,49-56.

96. Kajikawa, M., and Okada, N. (2002). LINEs mobilize SINEs in the eel through a shared 3' sequence. Cell 111, 433-444.

97. Kalendar, R., Vicient, C.M., Peleg, 0., Anamthawat-Jonsson, K., Bolshoy, A., and Schulman, A.H. (2004). Large retrotransposon derivatives: abundant, conserved but nonautonomous retroelements of barley and related genomes. Genetics 166,1437-1450.

98. Kapitonov, V., and Jurka, J. (1996). The age of Alu subfamilies. J Mol Evol 42,59-65.

99. Kapitonov, V.V., and Jurka, J. (2003). A Novel Class of SINE Elements Derived from 5S rRNA. Mol Biol Evol 20,694-702.

100. Kazazian, H.H., Jr., Wong, C., Youssoufian, H., Scott, A.F., Phillips, D.G., and Antonarakis, S.E. (1988). Haemophilia A resulting from de novo insertion of LI sequences represents a novel mechanism for mutation in man. Nature 332,164-166.

101. Khitrinskaia, I,, Stepanov, V.A., and Puzyrev, V.P. (2003). Alu repeats in the human genome. Molekuliarnaia biologiia 37,382-391.

102. Kim, D.D., Kim, T.T., Walsh, Т., Kobayashi, Y., Matise, T.C., Buyske, S., and Gabriel, A. (2004). Widespread RNA editing of embedded alu elements in the human transcriptome. Genome Res 14,1719-1725.

103. Kim, J., Martignetti, J.A., Shen, M.R., Brosius, J., and Deininger, P. (1994). Rodent BC1 RNA gene as a master gene for ID element amplification. Proc Natl Acad Sci U S A 91,36073611.

104. Kishore, S., and Stamm, S. (2006). The snoRNA HBII-52 regulates alternative splicing of the serotonin receptor 2C. Science 311,230-232.

105. Knebelmann, В., Forestier, L., Drouot, L., Quinones, S., Chuet, C., Benessy, F., Saus, J., and Antignac, C. (1995). Splice-mediated insertion of an Alu sequence in the COL4A3 mRNA causing autosomal recessive Alport syndrome. Hum Mol Genet 4,675-679.

106. Kobayashi, S., and Anzai, K. (1998). An E-box sequence acts as a transcriptional activator for BC1 RNA expression by RNA polymerase III in the brain. Biochemical and biophysical research communications 245,59-63.

107. Kolosha, V.O., and Martin, S.L. (2003). High-affinity, non-sequence-specific RNA binding by the open reading frame 1 (ORF1) protein from long interspersed nuclear element 1 (LINE-1). J Biol Chem 278,8112-8117.

108. Kordis, D. (2005). A genomic perspective on the chromodomain-containing retrotransposons: Chromoviruses. Gene 347,161-173.

109. Kordis, D., and Gubensek, F. (1997). Bov-B long interspersed repeated DNA (LINE) sequences are present in Vipera ammodytes phospholipase A2 genes and in genomes of Viperidae snakes. Eur J Biochem 246,772-779.

110. Kramerov, D., Vassetzky, N., and Serdobova, I. (1999). The evolutionary position of dormice (Gliridae) in Rodentia determined by a novel short retroposon. Mol Biol Evol, 715-716.

111. Kramerov, D.A., Lekakh, I.V., Samarina, O.P., and Ryskov, A.P. (1982). The sequences homologous to major interspersed repeats BI and B2 of mouse genome are present in mRNA and small cytoplasmic poly(A) + RNA. Nucleic Acids Res 10,7477-7491.

112. Kramerov, D.A., Tillib, S.V., Lekakh, I.V., Ryskov, A.P., and Georgiev, G.P. (1985). Biosynthesis and cytoplasmic distribution of small poly(A)-containing B2 RNA. Biochim Biophys Acta 824,85-98.

113. Kramerov, D.A., Tillib, S.V., Shumyatsky, G.P., and Georgiev, G.P. (1990). The most abundant nascent poly(A) + RNAs are transcribed by RNA polymerase III in murine tumor cells. Nucleic Acids Res 18,4499-4506.

114. Kramerov, D.A., and Vassetzky, N.S. (2001). Structure and origin of a novel dimeric retroposon В 1-diD. J Mol Evol 52,137-143.

115. Kramerov, D.A., and Vassetzky, N.S. (2005). Short retroposons in eukaryotic genomes. International review of cytology 247,165-221.

116. Krayev, A.S., Markusheva, T.V., Kramerov, D.A., Ryskov, A.P., Skryabin, K.G., Bayev, A. A., and Georgiev, G.P. (1982). Ubiquitous transposon-like repeats BI and B2 of the mouse genome: B2 sequencing. Nucleic Acids Res 10,7461-7475.

117. Kriegs, J.O., Churakov, G., Jurka, J., Brosius, J., and Schmitz, J. (2007). Evolutionary history of 7SL RNA-derived SINEs in Supraprimates. Trends Genet 23,158-161.

118. Labuda, D., Sinnett, D., Richer, C., Deragon, J.M., and Striker, G. (1991). Evolution of mouse BI repeats: 7SL RNA folding pattern conserved. J Mol Evol 32,405-414.

119. Labuda, D., and Striker, G. (1989). Sequence conservation in Alu evolution. Nucleic Acids Res 17,2477-2491.

120. Lander, E.S., Linton, L.M., Birren, В., Nusbaum, C., Zody, M.C., Baldwin, J., Devon, K., Dewar, K., Doyle, M., FitzHugh, W., et al. (2001). Initial sequencing and analysis of the human genome. Nature 409,860-921.

121. Laperriere, D., Wang, T.T., White, J.H., and Mader, S. (2007). Widespread Alu repeat-driven expansion of consensus DR2 retinoic acid response elements during primate evolution. BMC genomics 8,23.

122. Lawrence, C.B., McDonnell, D.P., and Ramsey, W.J. (1985). Analysis of repetitive sequence elements containing tRNA-Iike sequences. Nucleic Acids Res 13,4239-4252.

123. Lee, S.Y., and Rasheed, S. (1990). A simple procedure for maximum yield of high-quality plasmid DNA. BioTechniques 9,676-679.

124. Li, Т.Н., and Schmid, C.W. (2001). Differential stress induction of individual Alu loci: implications for transcription and retrotransposition. Gene 276,135-141.

125. Lin, Z., Nomura, O., Hayashi, Т., Wada, Y., and Yasue, H. (2001). Characterization of a SINE species from vicuna and its distribution in animal species including the family Camelidae. Mamm Genome 12,305-308.

126. Liu, W.M., Chu, W.M., Choudary, P.V., and Schmid, C.W. (1995). Cell stress and translational inhibitors transiently increase the abundance of mammalian SINE transcripts. Nucleic Acids Res 23,1758-1765.

127. Liu, W.M., Maraia, R.J., Rubin, C.M., and Schmid, C.W. (1994). Alu transcripts: cytoplasmic localisation and regulation by DNA methylation. Nucleic Acids Res 22,1087-1095.

128. Luan, D.D., Korman, M.H., Jakubczak, J.L., and Eickbush, Т.Н. (1993). Reverse transcription of R2Bm RNA is primed by a nick at the chromosomal target site: a mechanism for non-LTR retrotransposition. Cell 72,595-605.

129. Ludwig, A., Rozhdestvensky, T.S., Kuryshev, V.Y., Schmitz, J., and Brosius, J. (2005). An unusual primate locus that attracted two independent Alu insertions and facilitates their transcription. Journal of molecular biology 350,200-214.

130. Lyon, M.F. (1998). X-chromosome inactivation: a repeat hypothesis. Cytogenet Cell Genet 80,133-137.

131. Majewska, K., Szemraj, J., Plucienniczak, G., Jaworski, J., and Plucienniczak, A. (1988). A new family of dispersed, highly repetitive sequences in bovine genome. Biochim Biophys Acta 949,119-124.

132. Makalowski, W., Mitchell, G.A., and Labuda, D. (1994). Alu sequences in the coding regions of mRNA: a source of protein variability. Trends Genet 10,188-193.

133. Maksakova, I.A., Romanish, M.T., Gagnier, L., Dunn, C.A., van de Lagemaat, L.N., and Mager, D.L. (2006). Retroviral elements and their hosts: insertional mutagenesis in the mouse germ line. PLoS Genet 2, e2.

134. Malik, H.S., Burke, W.D., and Eickbush, Т.Н. (1999). The age and evolution of non-LTR retrotransposable elements. Mol Biol Evol 16,793-805.

135. Malik, H.S., and Eickbush, Т.Н. (1999). Modular evolution of the integrase domain in the Ty3/Gypsy class of LTR retrotransposons. J Virol 73,5186-5190.

136. Malik, H.S., Henikoff, S., and Eickbush, Т.Н. (2000). Poised for contagion: evolutionary origins of the infectious abilities of invertebrate retroviruses. Genome Res 10,1307-1318.

137. Maraia, R.J. (1991). The subset of mouse BI (Alu-equivalent) sequences expressed as small processed cytoplasmic transcripts. Nucleic Acids Res 19,5695-5702.

138. Maraia, R.J. (2001). La protein and the trafficking of nascent RNA polymerase iii transcripts. The Journal of cell biology 153, F13-18.

139. Maraia, R.J., Chang, D.Y., Wolffe, A.P., Vorce, R.L., and Hsu, K. (1992). The RNA polymerase III terminator used by a Bl-Alu element can modulate 3' processing of the intermediate RNA product. Mol Cell Biol 12,1500-1506.

140. Marin, I., and Llorens, C. (2000). Ty3/Gypsy retrotransposons: description of new Arabidopsis thaliana elements and evolutionary perspectives derived from comparative genomic data. Mol Biol Evol 17,1040-1049.

141. Martignetti, J.A., and Brosius, J. (1995). BC1 RNA: transcriptional analysis of a neural cell-specific RNA polymerase III transcript. Mol Cell Biol 15,1642-1650.

142. Martin, S.L. (1991). Ribonucleoprotein particles with LINE-1 RNA in mouse embryonal carcinoma cells. Mol Cell Biol //,4804-4807.

143. Martin, S.L., and Bushman, F.D. (2001). Nucleic acid chaperone activity of the ORF1 protein from the mouse LINE-1 retrotransposon. Mol Cell Biol 21,467-475.

144. Martinez-Izquierdo, J.A., Garcia-Martinez, J., and Vicient, C.M. (1997). What makes Grande 1 retrotransposon different? Genetica 100,15-28.

145. Mathias, S.L., Scott, A.F., Kazazian, H.H., Jr., Boeke, J.D., and Gabriel, A. (1991). Reverse transcriptase encoded by a human transposable element. Science 254,1808-1810.

146. Medstrand, P., van de Lagemaat, L.N., and Mager, D.L. (2002). Retroelement distributions in the human genome: variations associated with age and proximity to genes. Genome Res 12, 1483-1495.

147. Meischl, C., Boer, M., Ahlin, A., and Roos, D. (2000). A new exon created by intronic insertion of a rearranged LINE-1 element as the cause of chronic granulomatous disease. Eur J Hum Genet 8,697-703.

148. Modi, W.S., Gallagher, D.S., and Womack, J.E. (1996). Evolutionary histories of highly repeated DNA families among the Artiodactyla (Mammalia). J Mol Evol 42,337-349.

149. Modrek, В., and Lee, C. (2002). A genomic view of alternative splicing. Nat Genet 30,13-19.

150. Moran, J.V., DeBerardinis, R.J., and Kazazian, H.H., Jr. (1999). Exon shuffling by LI retrotransposition. Science 283,1530-1534.

151. Munclinger, P., Boursot, P., and Dod, B. (2003). Bl insertions as easy markers for mouse population studies. Mamm Genome 14,359-366.

152. Murphy, W.J., Pringle, Т.Н., Crider, T.A., Springer, M.S., and Miller, W. (2007). Using genomic data to unravel the root of the placental mammal phylogeny. Genome Res /7, 413421.

153. Muslimov, I.A., Santi, E„ Homel, P., Perini, S., Higgins, D., and Tiedge, H. (1997). RNA transport in dendrites: a cis-acting targeting element is contained within neuronal BC1 RNA. J Neurosci 17,4722-4733.

154. Nekrutenko, A., and Li, W.H. (2001). Transposable elements are found in a large number of human protein-coding genes. Trends Genet 17,619-621.

155. Neuveglise, C., Feldmann, H., Bon, E., Gaillardin, C., and Casaregola, S. (2002). Genomic evolution of the long terminal repeat retrotransposons in hemiascomycetous yeasts. Genome Res 12,930-943.

156. Nikaido, M., Nishihara, H., Hukumoto, Y., and Okada, N. (2003). Ancient SINEs from African endemic mammals. Mol Biol Evol 20,522-527.

157. Nikaido, M., Piskurek, O., and Okada, N. (2006). Toothed whale monophyly reassessed by SINE insertion analysis: The absence of lineage sorting effects suggests a small population of a common ancestral species. Mol Phylogenet Evol.

158. Nishihara, H., Smit, A.F., and Okada, N. (2006). Functional noncoding sequences derived from SINEs in the mammalian genome. Genome Res 16,864-874.

159. Nishihara, H., Terai, Y., and Okada, N. (2002). Characterization of Novel Alu- and tRNA-Related SINEs from the Tree Shrew and Evolutionary Implications of Their Origins. Mol Biol Evol 19,1964-1972.

160. Novoa, I., and Carrasco, L. (1999). Cleavage of eukaryotic translation initiation factor 4G by exogenously added hybrid proteins containing poliovirus 2Apro in HeLa cells: effects on gene expression. Mol Cell Biol 19,2445-2454.

161. Ogiwara, I., Miya, M„ Ohshima, K., and Okada, N. (2002). V-SINEs: a new superfamily of vertebrate SINEs that are widespread in vertebrate genomes and retain a strongly conserved segment within each repetitive unit. Genome Res 12,316-324.

162. Ohshima, К., Hamada, M., Terai, Y., and Okada, N. (1996). The 3' ends of tRNA-derived short interspersed repetitive elements are derived from the 3' ends of long interspersed repetitive elements. Mol Cell Biol 16,3756-3764.

163. Ohtsubo, H., Kumekawa, N., and Ohtsubo, E. (1999). RIRE2, a novel gypsy-type retrotransposon from rice. Genes Genet Syst 74,83-91.

164. Okada, N., and Hamada, M. (1997). The 3' Ends of tRNA-Derived SINEs Originated from the 3' Ends of LINEs: A New Example from the Bovine Genome. J Mol Evol 44,52-56.

165. Okada, N., and Ohshima, K. (1995). Evolution of tRNA-derived SINEs. In The impact of short interspersed elements (SINEs) on the host genome, R.J. Maraia, ed. (Austin, R.G. Landes), p. 61.

166. Opazo, J.C. (2005). A molecular timescale for caviomorph rodents (Mammalia, Hystricognathi). Mol Phylogenet Evol 37,932-937.

167. Orgel, L.E., and Crick, F.H. (1980). Selfish DNA: the ultimate parasite. Nature 284,604-607.

168. Paul, M.S., and Bass, B.L. (1998). Inosine exists in mRNA at tissue-specific levels and is most abundant in brain mRNA. Embo J 77,1120-1127.

169. Paule, M.R., and White, R.J. (2000). Survey and summary: transcription by RNA polymerases I and III. Nucleic Acids Res 28,1283-1298.

170. Pecon-Slattery, J., Pearks Wilkerson, A.J., Murphy, W.J., and O'Brien, S.J. (2004). Phylogenetic assessment of introns and SINEs within the Y chromosome using the cat family felidae as a species tree. Mol Biol Evol 21,2299-2309.

171. Pelissier, Т., Bousquet-Antonelli, C., Lavie, L., and Deragon, J.M. (2004). Synthesis and processing of tRNA-related SINE transcripts in Arabidopsis thaliana. Nucleic Acids Res 32, 3957-3966.

172. Perepelitsa-Belancio, V., and Deininger, P. (2003). RNA truncation by premature polyadenylation attenuates human mobile element activity. Nat Genet 35, 363-366.

173. Perez-Stable, C., Ayres, T.M., and Shen, C.K. (1984). Distinctive sequence organization and functional programming of an Alu repeat promoter. Proc Natl Acad Sci USA 81,5291-5295.

174. Piedrafita, F.J., Molander, R.B., Vansant, G., Orlova, E.A., Pfahl, M., and Reynolds, W.F. (1996). An Alu element in the myeloperoxidase promoter contains a composite SP1-thyroid hormone-retinoic acid response element. J Biol Chem 271,14412-14420.

175. Priimagi, A.F., Mizrokhi, L.J., and Ilyin, Y.V. (1988). The Drosophila mobile element jockey belongs to LINEs and contains coding sequences homologous to some retroviral proteins. Gene 70,253-262.

176. Quentin, Y. (1989). Successive waves of fixation of BI variants in rodent lineage history. J Mol Evol 28,299-305.

177. Quentin, Y. (1992). Origin of the Alu family: a family of Alu-like monomers gave birth to the left and the right arms of the Alu elements. Nucleic Acids Res 20,3397-3401.

178. Quentin, Y. (1994a). Emergence of master sequences in families of retroposons derived from 7sl RNA. Genetica 93,203-215.

179. Quentin, Y. (1994b). A master sequence related to a free left Alu monomer (FLAM) at the origin of the В1 family in rodent genomes. Nucleic Acids Res 22,2222-2227.

180. Roos, C., Schmitz, J., and Zischler, H. (2004). Primate jumping genes elucidate strepsirrhine phylogeny. Proc Natl Acad Sci U S A101,10650-10654.

181. Rothenburg, S., Eiben, M., Koch-Nolte, F., and Haag, F. (2002). Independent integration of rodent identifier (ID) elements into orthologous sites of some RT6 alleles of Rattus norvegicus and Rattus rattus. J Mol Evol 55,251-259.

182. Roy-Engel, A.M., Carroll, M.L., El-Sawy, M., Salem, A.H., Garber, R.K., Nguyen, S.V., Deininger, P.L., and Batzer, M.A. (2002). Non-traditional Alu evolution and primate genomic diversity. Journal of molecular biology 316,1033-1040.

183. Roy-Engel, A.M., Carroll, M.L., Vogel, E., Garber, R.K., Nguyen, S.V., Salem, A.H., Batzer, M.A., and Deininger, P.L. (2001). Alu insertion polymorphisms for the study of human genomic diversity. Genetics 159,279-290.

184. Roy-Engel, A.M., El-Sawy, M., Farooq, L., Odom, G.L., Perepelitsa-Belancio, V., Bruch, H., Oyeniran, O.O., and Deininger, P.L. (2005). Human retroelements may introduce intragenic polyadenylation signals. Cytogenetic and genome research 110,365-371.

185. Roy, A.M., Carroll, M.L., Nguyen, S.V., Salem, A.H., Oldridge, M., Wilkie, A.O., Batzer, M.A., and Deininger, P.L. (2000). Potential gene conversion and source genes for recently integrated Alu elements. Genome Res 10,1485-1495.

186. Rozhdestvensky, T.S., Kopylov, A.M., Brosius, J., and Huttenhofer, A. (2001). Neuronal BC1 RNA structure: evolutionary conversion of a tRNA(Ala) domain into an extended stem-loop structure. RNA (New York, NY 7,722-730.

187. Rubin, C.M., Kimura, R.H., and Schmid, C.W. (2002). Selective stimulation of translational expression by Alu RNA. Nucleic Acids Res 30,3253-3261.

188. Ryskov, A.P., Ivanov, P.L., Kramerov, D.A., and Georgiev, G.P. (1983). Mouse ubiquitous B2 repeat in polysomal and cytoplasmic poly(A)+RNAs: uniderectional orientation and 3'-end localization. Nucleic Acids Res 11,6541-6558.

189. Sabot, F., Sourdille, P., Chantret, N., and Bernard, M. (2006). Morgane, a new LTR retrotransposon group, and its subfamilies in wheats. Genetica 128,439-447.

190. Sakamoto, K., and Okada, N. (1985). Rodent type 2 Alu family, rat identifier sequence, rabbit С family, and bovine or goat 73-bp repeat may have evolved from tRNA genes. J Mol Evol 22,134-140.

191. Salem, A.H., Ray, D.A., Hedges, D.J., Jurka, J., and Batzer, M.A. (2005). Analysis of the human Alu Ye lineage. BMC evolutionary biology 5,18.

192. Schoeniger, L.O., and Jelinek, W.R. (1986). 4.5S RNA is encoded by hundreds of tandemly linked genes, has a short half-life, and is hydrogen bonded in vivo to poly(A)-terminated RNAs in the cytoplasm of cultured mouse cells. Mol Cell Biol 6,1508-1519.

193. Schramm, L., and Hernandez, N. (2002). Recruitment of RNA polymerase III to its target promoters. Genes Dev 16,2593-2620.

194. Schwahn, U., Lenzner, S., Dong, J., Feil, S., Hinzmann, В., van Duijnhoven, G., Kirschner, R., Hemberger, M., Bergen, A.A., Rosenberg, Т., et al. (1998). Positional cloning of the gene for X-linked retinitis pigmentosa 2. Nat Genet 19,327-332.

195. Serdobova, I.M., and Kramerov, D.A. (1998). Short retroposons of the B2 superfamily: evolution and application for the study of rodent phylogeny. J Mol Evol 46,202-214.

196. Shaikh, Т.Н., and Deininger, P.L. (1996). The role and amplification of the HS Alu subfamily founder gene. J Mol Evol 42,15-21.

197. Shaikh, Т.Н., Roy, A.M., Kim, J., Batzer, M.A., and Deininger, P.L. (1997). eDNAs derived from primary and small cytoplasmic Alu (scAlu) transcripts. Journal of molecular biology 271,222-234.

198. Sharan, C., Hamilton, N.M., Pari, A.K., Singh, P.K., and Chaudhuri, G. (1999). Identification and characterization of a transcriptional silencer upstream of the human BRCA2 gene. Biochemical and biophysical research communications 265,285-290.

199. Shedlock, A.M., and Okada, N. (2000). SINE insertions: powerful tools for molecular systematics. Bioessays 22,148-160.

200. Shimamura, M., Nikaido, M., Ohshima, K., and Okada, N. (1998). A SINE that acquired a role in signal transduction during evolution. Mol Biol Evol 15,923-925.

201. Shimamura, M., Yasue, H., Ohshima, K., Abe, H., Kato, H„ Kishiro, Т., Goto, M., Munechika, I., and Okada, N. (1997). Molecular evidence from retroposons that whales form a clade within even-toed ungulates. Nature 388,666-670.

202. Shimba, S., Buckley, В., Reddy, R., Kiss, Т., and Filipowicz, W. (1992). Cap structure of U3 small nucleolar RNA in animal and plant cells is different. gamma-Monomethyl phosphate cap structure in plant RNA. J Biol Chem 267,13772-13777.

203. Shumyatsky, G., Wright, D., and Reddy, R. (1993). Methylphosphate cap structure increases the stability of 7SK, B2 and U6 small RNAs in Xenopus oocytes. Nucleic Acids Res 21, 4756-4761.

204. Shumyatsky, G.P., Tillib, S.V., and Kramerov, D.A. (1990). B2 RNA and 7SK RNA, RNA polymerase III transcripts, have a cap-like structure at their 5' end. Nucleic Acids Res 18, 6347-6351.

205. Silva, R., and Burch, J.B. (1989). Evidence that chicken CR1 elements represent a novel family of retroposons. Mol Cell Biol 9,3563-3566.

206. Singh, R., and Reddy, R. (1989). Gamma-monomethyl phosphate: a cap structure in spliceosomal U6 small nuclear RNA. Proc Natl Acad Sci USA 86, 8280-8283.

207. Smit, A.F. (1996). The origin of interspersed repeats in the human genome. Curr Opin Genet Dev 6,743-748.

208. Sorek, R., Ast, G., and Graur, D. (2002). Alu-containing exons are alternatively spliced. Genome Res 12,1060-1067.

209. Steppan, S., Adkins, R., and Anderson, J. (2004). Phylogeny and divergence-date estimates of rapid radiations in muroid rodents based on multiple nuclear genes. Syst Biol 53, 533-553.

210. Sun, F.J., Fleurdepine, S., Bousquet-Antonelli, C., Caetano-Anolles, G., and Deragon, J.M. (2007). Common evolutionary trends for SINE RNA structures. Trends Genet 23,26-33.

211. Suoniemi, A., Tanskanen, J., and Schulman, A.H. (1998). Gypsy-like retrotransposons are widespread in the plant kingdom. Plant J13,699-705.

212. Sutcliffe, J.G., Milner, R.J., Bloom, F.E., and Lerner, R.A. (1982). Common 82-nucleotide sequence unique to brain RNA. Proc Natl Acad Sci USA 79,4942-4946.

213. Symer, D.E., Connelly, C., Szak, S.T., Caputo, E.M., Cost, G.J., Parmigiani, G., and Boeke, J.D. (2002). Human 11 retrotransposition is associated with genetic instability in vivo. Cell 110,327-338.

214. Terai, Y., Takahashi, K., Nishida, M., Sato, Т., and Okada, N. (2003). Using SINEs to probe ancient explosive speciation: "hidden" radiation of African cichlids? Mol Biol Evol 20, 924930.

215. Thanaraj, T.A., Clark, F., and Muilu, J. (2003). Conservation of human alternative splice events in mouse. Nucleic Acids Res 31,2544-2552.

216. Tiedge, H., Chen, W., and Brosius, J. (1993), Primary structure, neural-specific expression, and dendritic location of human BC200 RNA. J Neurosci 13,2382-2390.

217. Tomilin, N.V. (1999). Control of genes by mammalian retroposons. International review of cytology 186,1-48.

218. Toyoda, N., Zavacki, A.M., Maia, A.L., Harney, J.W., and Larsen, P.R. (1995). A novel retinoid X receptor-independent thyroid hormone response element is present in the human type 1 deiodinase gene. Mol Cell Biol 15,5100-5112.

219. Ullu, E., and Tschudi, C. (1984). Alu sequences are processed 7SL RNA genes. Nature 312, 171-172.

220. Ullu, E., and Weiner, A.M. (1984). Human genes and pseudogenes for the 7SL RNA component of signal recognition particle. Embo J 3,3303-3310.

221. Vansant, G., and Reynolds, W.F. (1995). The consensus sequence of a major Alu subfamily contains a functional retinoic acid response element. Proc Natl Acad Sci U S A 92, 82298233.

222. Vassetzky, N.S., Ten, O.A., and Kramerov, D.A. (2003). BI and related SINEs in mammalian genomes. Gene 319,149-160.

223. Vervoort, R., Gitzelmann, R., Lissens, W., and Liebaers, I. (1998). A mutation (IVS8+0.6kbdelTC) creating a new donor splice site activates a cryptic exon in an Alu-element in intron 8 of the human beta-glucuronidase gene. Human genetics 103,686-693.

224. Vicient, C.M., Kalendar, R., and Schulman, A.H. (2001). Envelope-class retrovirus-like elements are widespread, transcribed and spliced, and insertionally polymorphic in plants. Genome Res 11, 2041-2049.

225. Volff, J., Korting, C., and Schartl, M. (2001). Ty3/Gypsy retrotransposon fossils in mammalian genomes: did they evolve into new cellular functions? Mol Biol Evol 18, 266270.

226. Volff, J.N., Lehrach, H., Reinhardt, R., and Chourrout, D. (2004). Retroelement dynamics and a novel type of chordate retrovirus-like element in the miniature genome of the tunicate Oikopleura dioica. Mol Biol Evol 21,2022-2033.

227. Wahle, E., and Ruegsegger, U. (1999). З'-End processing of pre-mRNA in eukaryotes. FEMS Microbiol Rev 23,277-295.

228. Walter, P., and Blobel, G. (1983). Disassembly and reconstitution of signal recognition particle. Cell 34,525-533.

229. Wang, H., Iacoangeli, A., Lin, D., Williams, K., Denman, R.B., Hellen, C.U., and Tiedge, H. (2005). Dendritic BC1 RNA in translational control mechanisms. The Journal of cell biology 777,811-821.

230. Waterston, R.H., Lindblad-Toh, K., Birney, E., Rogers, J., Abril, J.F., Agarwal, P., Agarwala, R., Ainscough, R., Alexandersson, M., An, P., et al. (2002). Initial sequencing and comparative analysis of the mouse genome. Nature 420,520-562.

231. Wei, W., Gilbert, N., Ooi, S.L., Lawler, J.F., Ostertag, E.M., Kazazian, H.H., Boeke, J.D., and Moran, J.V. (2001). Human LI retrotransposition: cis preference versus trans complementation. Mol Cell Biol 21,1429-1439.

232. Weil, P.A., Segall, J., Harris, В., Ng, S.Y., and Roeder, R.G. (1979). Faithful transcription of eukaryotic genes by RNA polymerase III in systems reconstituted with purified DNA templates. J Biol Chem 254,6163-6173.

233. Weiner, A.M. (2002). SINEs and LINEs: the art of biting the hand that feeds you. Curr Opin Cell Biol 14,343-350.

234. West, N. Roy-Engel, A.M., Imataka, H., Sonenberg, N., and Deininger, P. (2002). Shared protein components of SINE RNPs. Journal of molecular biology 321,423-432.

235. Wilson, E.T., Condliffe, D.P., and Sprague, K.U. (1988). Transcriptional properties of BmX, a moderately repetitive silkworm gene that is an RNA polymerase III template. Mol Cell Biol 8, 624-631.

236. Witte, C.P., Le, Q.H., Bureau, Т., and Kumar, A. (2001). Terminal-repeat retrotransposons in miniature (TRIM) are involved in restructuring plant genomes. Proc Natl Acad Sci U S A 98, 13778-13783.

237. Wright, D.A., and Voytas, D.F. (2002). Athila4 of Arabidopsis and Calypso of soybean define a lineage of endogenous plant retroviruses. Genome Res 12,122-131.

238. Wu, J., Grindlay, G.J., Bushel, P., Mendelsohn, L., and Allan, M. (1990). Negative regulation of the human epsilon-globin gene by transcriptional interference: role of an Alu repetitive element. Mol Cell Biol 10,1209-1216.

239. Xiong, Y., and Eickbush, Т.Н. (1988). The site-specific ribosomal DNA insertion element RIBm belongs to a class of non-long-terminal-repeat retrotransposons. Mol Cell Biol 8, 114123.

240. Xu, C.F., Chambers, J.A., and Solomon, E. (1997). Complex regulation of the BRCA1 gene. J Biol Chem 272,20994-20997.

241. Yang, J., Malik, H.S., and Eickbush, Т.Н. (1999). Identification of the endonuclease domain encoded by R2 and other site-specific, non-long terminal repeat retrotransposable elements. Proc Natl Acad Sci U S A 96,7847-7852.

242. Youngman, S., van Luenen, H.G., and Plasterk, R.H. (1996). Rte-1, a retrotransposon-like element in Caenorhabditis elegans. FEBS Lett 380,1-7.

243. Zhang, C.Y., Kim, S., Harney, J.W., and Larsen, P.R. (1998). Further characterization of thyroid hormone response elements in the human type 1 iodothyronine deiodinase gene. Endocrinology 139,1156-1163.

244. Zhou, Y.H., Zheng, J.B., Gu, X., Saunders, G.F., and Yung, W.K. (2002). Novel PAX6 binding sites in the human genome and the role of repetitive elements in the evolution of gene regulation. Genome Res 12,1716-1722.

245. Zietkiewicz, E., Richer, C., Sinnett, D., and Labuda, D. (1998). Monophyletic origin of Alu elements in primates. J Mol Evol 47,172-182.

246. Павлинов, И. (2003). Систематика современных млекопитающих. (Москва, Издательство Московского Университета).

247. Семин, Б.В., Ильин, Ю.В. (2005). Многообразие ДКП-ретротранспозонов и механизмы их участия в реорганизации генома. Генетика 41,542-548.

248. XTTTTAfAT^CTTTCATAt^l^ri^yT—gS ----—т т с с т с а т gg "vwy.^r----,ссдсэдДтДтаосталттссАт^Дт--ДД--------gGTGATTGGOgT^gCTT- -gfi

249. ТЭ2ТСАССН<ЗС2стадасщтЛССАТ—ДА tacgtgt?gtctc?ttcagg^*Itgcat—щ --------25jccttatgtggctggac2—аа-AgA^GSTGCAjjATTGTATGigA^AAG—ТА

250. А52ааааааааааааллА'"А^^А: ; ассааааааааааааалаааладдаЕv^pj^jaaaaaa^^assaa!

251. Sral-I3c Sfti-l€b Seal-2 Ob S mi-2lbami-23b AJ71S794 SEHCRYAAl ЛГ438211 ЛМ0399Э4 AJ715794a AF438220 AJ34B061 jJjS®11®1'

252. Тар—04а Тар-04с Тар—05 Твр-08 Тар-09 Тер-16 Т«р-17 T*p-ls» Т«р-25 тер-33 Т»р—40 Тар-44 тар-51 Тар-541. Qncx---GAXTTCTtjaTCT

253. FVGGCGGATC ТСГО TG^TTCAAI ag^cggatglgtgtgagttcaa a g g с? gat стщрз т g ас ттс аа1. ЗОЙАТСТЙТд1. ХЩАААгфЧС tcaaaaagacaaaaaaaaiJaJааааааа '*"*шvryw^AAA^

254. AY247042 TCATAA^jGACTAGAATAC

255. AY247041 ------—---------J

256. AY24 7040 AATTAJ^AAATTAAAAT' AY247039 AAAATA^AAAATCATGA'

257. AY247034 CATTAGGAAGCCTATTAA".

258. BlJUw Лвр-01 Аяр-02 Аир-ОЭ А*р-06 А*р-08 А*р-091. А*р-101. Аяр-11*1. А»р-11Ь1. А*р-11с1. Аар-12»

259. Аяр-12Ь А*р-13 А*р-14 А*р-151.GAG

260. Выравнивание последовательностей В1-элементов шипохвостов (семейство Anomaluridae). Консенсус (В1Апо) дан сверху. Последовательности Asp-nn были клонированы из Anomcilurus sp. (шипохвост) в этой работе.