Бесплатный автореферат и диссертация по биологии на тему
Регуляции экспрессии микроРНК в составе кластеров и пиРНК, индуцированных встраиванием мобильных элементов, у Drosophila melanogaster
ВАК РФ 03.01.03, Молекулярная биология

Автореферат диссертации по теме "Регуляции экспрессии микроРНК в составе кластеров и пиРНК, индуцированных встраиванием мобильных элементов, у Drosophila melanogaster"

На правах рукописи

РЯЗАНСКИЙ СЕРГЕЙ СЕРГЕЕВИЧ

Регуляции экспрессии микроРНК в составе кластеров и пиРНК, индуцированных встраиванием мобильных элементов, у ОгоБорИНа melanogaster

Специальность 03.01.03 - молекулярная биология

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата биологических наук

3 О СКТ 2014

МОСКВА-2014

005553968

Работа выполнена в Лаборатории биохимической генетики животных Отдела молекулярной генетики клетки Федерального государственного бюджетного учреждения науки Института молекулярной генетики Российской академии наук.

Научный руководитель: д.б.н. Алла Ивановна Калмыкова

зав. лаборатории исследования геномных повторов эукариот Федерального государственного бюджетного учреждения науки Института молекулярной генетики Российской академии наук

Научный консультант: д.б.н., академик Владимир Алексеевич Гвоздев

зав. отдела молекулярной генетики клетки Федерального государственного бюджетного учреждения науки Института молекулярной генетики Российской академии наук.

Официальные оппоненты: д.б.н., к.ф-м.н., профессор Михаил Сергеевич

ГЕЛЬФАНД

зам. директора по научным вопросам Федерального государственного бюджетного учреждения науки Института проблема передачи информации им. A.A. Харкевича Российской академии наук

к.б.н. Ольга Борисовна СИМОНОВА зав. лаборатории генетических основ морфогенеза Федерального государственного бюджетного учреждение науки Института биологии развития им. Н.К. Кольцова Российской академии наук

Ведущая организация: Федеральное государственное бюджетное учреждение

науки Институт биологии гена Российской академии наук

Защита состоится 9 декабря 2014 г. в ( 4"часов на заседании диссертационного совета Д 002.235.01 при Федеральном государственном бюджетном учреждении науки Институте молекулярной биологии им. В.А. Энгельгардта Российской академии наук по адресу 119991, Москва, ул. Вавилова, д. 32.

С диссертацией можно ознакомиться в библиотеке Федерального государственного бюджетного учреждения науки Института молекулярной биологии им. В.А. Энгельгардта РАН.

Автореферат разослан [ 7- с у~ ■ 2014 г.

Ученый секретарь диссертационного совета. Кандидат химических наук

Анатолий Михайлович Крицын

Общая характеристика работы

Актуальность темы

В последние несколько лет у животных и растений открыто несколько классов коротких некодирующих РНК, которые принимают активное участие в регуляции и нормальном функционировании большого количества самых разных биологических процессов. Наибольшее внимание привлекают самые представленные короткие РНК в соматических тканях и терминальных гонадах животных — микроРНК (миРНК) и пиРНК (piRNA, Piwi-interacting RNAs), соответственно.

МиРНК имеют размер 21-23 нуклеотида (нт.), найдены у большинства эукариот и характеризуются консервативностью и разнообразием по тканевым профилям экспрессии. Зрелые миРНК образуются в результате многоэтапного созревания, где непосредственным предшественником миРНК является пре-миРНК (pre-miRNA), имеющая размер 60-100 нт. и обладающая характерной шпилько-подобной вторичной структурой. В цитоплазме из стебля шпильки вырезаются зрелые миРНК, причём функциональными являются обе вырезаемые из разных цепей миРНК, но преимущественно стабилизируется только одна из них. Образованные миРНК связываются с белками Argonaute, в комплексе с которыми они могут распознавать комплементарные участки в мРНК-мишени, расположенные преимущественно в З'-нетранслируемой области (НТО). При этом происходит деградация и/или ингибирование инициации трансляции мРНК. Как правило, сайты узнавания для одной миРНК присутствуют в З'НТО многих мРНК, а одна мРНК может являться мишенью для нескольких миРНК, что способствует формированию сложной регуляторной сети (Bartel, 2004; Berezikov, 2011).

Благодаря своей способности подавлять экспрессию генов, миРНК играют важнейшую роль в регуляции клеточной дифференцировки и пролиферации, росте и развитии организмов, а также участвуют в формировании адаптивного клеточного ответа на стрессовые условия. Хотя регуляторный потенциал миРНК общепризнан и активно изучается, механизмы регуляция экспрессии самих миРНК остаются недостаточно исследованными. Значительное количество близко расположенных генов миРНК, кодирующих шпильки пре-миРНК, образуют кластеры, и вопрос регуляции их экспрессии является важным для понимания общих принципов регуляции миРНК. Поскольку часто зрелые миРНК из одного кластера обнаруживаются в одних и тех же тканях, то обычно предполагается, что кластер транскрибируется с образованием единого полицистронного первичного предшественника, который затем процессируется до индивидуальных миРНК.

3

Некоторые экспериментальные данные действительно подтверждают наличие полицистронных предшественников (Altuvia et al., 2005; Biemar et al., 2005). Можно также предполагать, что миРНК, объединяемые в кластеры, способны транскрибироваться независимо друг от друга. Есть пример и того, как эффективность процессинга вырезаемой из полнцистронного транскрипта пре-миРНК let-7 пост-транскрипционно регулируется с участием белка Lin-28, что в результате приводит к её деградации (Newman et al., 2008; Piskounova et al., 2008). Однако в целом, величины вкладов транскрипционных и посттранскрипционных механизмов в регуляцию экспрессии кластерных миРНК остаются неизвестными.

Хотя миРНК активно участвуют в регуляции клеточных процессов как в соматических, так и в герминальных тканях, некоторые данные свидетельствуют о том, что роль миРНК в последних не ограничивается просто подавлением экспрессии генов-мишеней. Так, предположено, что семенник-экспрессирующиеся миРНК млекопитающих могут принимать участие в формировании репродуктивной изоляции видов. В качестве аргумента привлекается свидетельство о повышенной скорости эволюции последовательности семенник-специфичных миРНК по сравнению с «несеменниковыми» миРНК (Zhang et al., 2007), и поэтому эти миРНК с различными последовательностями в разных видах могут иметь разные спектры регулируемых мишеней, которые, помимо других функций, могут принимать участие в механизмах оплодотворения. Остаётся неизвестным, можно ли это наблюдение распространить на другие виды животных. Особенный интерес представляют в этом плане миРНК из кластеров, которые, как предполагается, могут регулировать функционально-связанные мишени, относящиеся, например, к одному и тому же сигнальному пути.

Другой класс коротких РНК — пиРНК (piRNA, от Piwi-interacting small RNAs) экспрессируются в основном в репродуктивных органах животных. Как правило, пиРНК имеют длину 23-29 нт., характеризуются присутствием преимущественно уридина на 5'-конце и существенным разнообразием последовательностей, которое значительно превышает разнообразие миРНК. Большинство пиРНК комплементарны последовательностям мобильных элементов (МЭ) и другим повторяющимся генетическим элементам. Основная функция пиРНК заключается в подавлении экспрессии МЭ, при нарушении которого может происходить мобилизация МЭ, хромосомные перестройки и множественные двухцепочечные разрывы геномной ДНК (Siomi et al., 2011).

У дрозофилы выделяют первичные и вторичные пиРНК, которые образуются из протяжённых одноцепочечных транскриптов (Siomi et al., 2011). Первичные пиРНК

4

экспрессируются в соматических и терминальных клетках репродуктивных органов, в то время как вторичные образуются только в терминальных клетках. Транскрипты-предшественники пиРНК синтезируются в специальных участках генома, обогащенных фрагментами и полноразмерными копиями МЭ. Такие участки получили название «кластеров пиРНК», или «мастер-локусов» (Brennecke et al., 2007). Вопрос о механизме формирования кластеров пиРНК в процессе эволюции и механизмах распознавания соответствующих транскриптов как предшественников пиРНК факторами их биогенеза является предметом горячих дискуссий. Можно предположить, что формирование мастер-локуса начинается с инсерции единичной копии МЭ. Таким образом, необходимо определить, может ли индивидуальная встройка МЭ в геном дрозофилы вызывать образование новых пиРНК.

До недавнего времени считалось, что главная функция пиРНК дрозофилы заключается в подавлении экспрессии МЭ, а подавление экспрессии белок-кодирующих генов является характерной особенностью миРНК. Тем не менее, недавно было показано, что существенная доля пиРНК в соматических клетках яичников дрозофилы продуцируется белок-кодирующими генами. Также получены указания, что пиРНК способны подавлять экспрессию некоторых генов в соматических фолликулярных клетках яичников дрозофилы (Robine et al., 2009; Saito et al., 2009) и нейронах моллюска аплизии (Rajasethupathy et al., 2012). В то же время основным источником пиРНК в репродуктивных органах остаются терминальные клетки яичников, и пока неизвестно, могут ли терминальные пиРНК участвовать в подавлении экспрессии генов.

Цели и задачи работы

Цель данной работы состояла в изучении особенностей регуляции экспрессии, а также определении новых возможных функций кластеров миРНК и пиРНК в репродуктивных органах D. melanogaster. Для этого были поставлены следующие задачи:

1. Оценить вклад транскрипционных и пост-транскрипционных механизмов в регуляции экспрессии кластерных миРНК.

2. Идентифицировать семенник-специфичные кластеры миРНК и определить скорость их эволюции для оценки возможности их участия в репродуктивной изоляции видов.

3. Определить, могут ли индивидуальные, отдельно-расположенные, МЭ вызывать образование пиРНК.

4. Выявить в терминальных тканях самок пиРНК, комплементарные белок-кодирующим генам, и определить, могут ли такие пиРНК подавлять их экспрессию.

Научная новизна и практическая значимость работы

В работе обнаружено, что хотя все кластеры миРНК у D. melanogaster характеризуются транскрипцией с образованием единого полицистронного транскрипта, в четырёх кластерах отдельные миРНК могут подвергаться пост-транскрипционной регуляции. Продемонстрирована относительно высокая скорость эволюции семенник-специфичного кластера miR-959-964, что может указывать на его роль в видообразовании в результате репродуктивной изоляции. Также было показано, что инсерция единичного МЭ в эухроматин генома D. melanogaster может вызывать образование новых терминальных пиРНК. Такие пиРНК образуются как из самих МЭ, так и из прилежащих последовательностей геномного окружения. В некоторых случаях, инсерция МЭ вызывала образование антисмысловых пиРНК в прилежащих генах, которые могут подавлять экспрессию этих генов.

Результаты работы могут быть использованы для определения механизмов регуляции экспрессии кластеров миРНК с клинически важным значением, например, в канцерогенезе и кардиологии, а также для определения роли аномального перемещения МЭ в изменении характера экспрессии генов человека при различного рода внутриклеточных нарушениях при заболеваниях.

Апробация работы

Работа апробировалась на семинарах в Институте молекулярной генетики РАН (г. Москва, Россия), Институте молекулярной биологии им В.А. Энгельгардта РАН (г. Москва, Россия), Европейском институте изучения старения (г. Гронинген, Голландия); работа также была представлена в виде докладов и постеров на российских и международных научных конференциях Keystone symposium (2011, 2012, 2013), RNA society meeting (2011), RNAi Europe (2009) и др.

Объём диссертации

Материал диссертации изложен на 100 страницах машинописного текста, содержит 17 рисунков и 5 таблиц. Список цитированной литературы состоит из 248 работ.

Результаты

Общая характеристика кластеров миРНК Drosophila melanogaster

Используя базу данных miRBase (release 16), мы провели качественное и количественное описание кластеров миРНК. Здесь и далее принимается, что группа из близко расположенных генов миРНК является кластером, если расстояние между ними составляет не более 1 тыс. пар нуклеотидов (т.п.н). В версии 16 базы miRBase описано 176 генов миРНК D. melanogaster, из них одна треть (61) образуют 20 кластеров (Таблица 1).

Учитывая вышеприведённый критерий в 1 т.п.н. как расстояние между соседними миРНК, кластеры 310-313 и 991-992 должны быть отнесены к одному кластеру. Однако, последующий анализ тканевого профиля экспрессии миРНК (см. ниже) показал, что они являются независимыми транскрипционными единицами и более правильно их отнести к разным кластерам. Самый длинный кластер miR-6-309 содержит 8 миРНК, в то время как большинство имеют всего 2-3 миРНК (11 кластеров из 20). В некоторых случаях кластеры содержат несколько представителей одного семейства миРНК с одинаковыми последовательностями как минимум в области т.н. «сида» (от англ. «seed»), имеющего критическое значение для функционирования миРНК, а нередко и по всей длине. Так, кластер 281 состоит из тандема идентичных dme-mir-281-l и dme-mir-281-2; кластер 6-309 содержит идентичные dme-mir-6-l, -6-2, -6-3; кластер 2а-2Ь с dme-mir-2a-l, -2а-2; кластер 983-984 с dme-mir-983-l, -983-2. Такие миРНК с одинаковыми последовательностями неразличимы при измерении экспрессии, поэтому в последующем они учитывались как одна миРНК. В целом, для дальнейшего анализа профилей экспрессии были использованы только 19 кластеров миРНК, без кластера 281.

Корреляция тканевых профили экспрессии миРНК кластеров

Ранее было известно, что некоторые кластеры миРНК у млекопитающих и дрозофилы транскрибируются с образованием одного полицистронного транскрипта, первичного предшественника при-миРНК, который в процессе созревания процессируется до отдельных миРНК. Мы решили проверить, насколько такой способ экспрессии может быть общим для всех кластеров миРНК D. melanogaster.

В основе проверки лежало допущение, что в случае единого полицистронного предшественника у всех миРНК кластера должны совпадать их тканевые профили экспрессии в разных тканях и/или органах. Для оценки сходства профилей миРНК, мы проанализировали находящиеся в открытом доступе библиотеки коротких РНК, полученных в результате глубокого секвенирования (deep sequencing) транскриптома разных органов и

7

Таблица 1. Кластеры мнРНК D. melanogaster. В таблице указано название кластера, его состав и расположение в геноме (сборка генома dm3, UCSC Genome Browser).

Кластер миРНК Расположение кластера

100-125 dme-mir-100, dme-let-7, dme-mir-125 chr2L:l 8471434-18472424:[+];

межгенный спейсер

1002-968 dme-mir-1002, dme-mir-968 chr2L: 13747609-13747839:[-];

межгенный спейсер

13Ь-2с dme-mir-13b-l, dme-mir-13a, dme-mir-2c chr3R:11243130-l 1243567:[-];

межгенный спейсер

2а-2Ь dme-mir-2a-2, dme-mir-2a-l, dme-mir-2b-2, chr2L:19569490-19570264:[-]; интрон

275-305 dme-mir-275, dme-mir-305 chr2L:7425801-7426044:[+];

межгенный спейсер

277-34 dme-mir-277, dme-mir-34 chr3R:5925744- 5926756:[+];

межгенный спейсер

283-12 dme-mir-283, dme-mir-304, dme-mir-12 chrX: 15401989- 15403579:[+];

межгенный спейсер

310-313 dme-mir-310, dme-mir-311, dme-mir-312, dme-mir- chr2R: 16471257-16471765:[-];

313 межгенный спейсер

991-992 dme-mir-991, dme-mir-992 chr2R:16472707- 16472910:[-];

межгенный спейсер

6-309 dme-mir-6-3, dme-mir-6-2, dme-mir-6-1, dme-mir- chr2R:15548221- 15549279:1-];

5, dme-mir-4, dme-mir-286, dme-mir-3, dme-mir- межгенный спейсер

309

9с-9Ь dme-mir-9c, dme-mir-306, dme-mir-79, dme-mir-9b chr2L: 16697924-16698834:[+]; интрон

959-964 dme-mir-959, dme-mir-960, dme-mir-961, dme-mir- chr2L:5640940-5642201:[+]; интрон

962, dme-mir-963, dme-mir-964

972-974 dme-mir-972, dme-mir-973, dme-mir-974 chrX: 19445185-19445 811: [+];

межгенный спейсер

975-977 dme-mir-975, dme-mir-976, dme-mir-977 chrX: 19452786- 19453152:[+];

межгенный спейсер

978-979 dme-mir-978, dme-mir-979 chrX:19455269- 19455964:[+];

межгенный спейсер

982-303 dme-mir-982, dme-mir-303 chrX:4259839- 4260281:[-]; межгенный

спейсер

983-984 dme-mir-983-1, dme-mir-983-2, dme-rair-984 chrX:4262342- 4262768:[-]; нежгенный

спейсер

994-318 dme-mir-994, dme-mir-318 chr3R:6233859-6234091:[+];

межгенный спейсер

998-11 dme-mir-998, dme-mir-11 chr3R:17447601- 17448293:-[+];

интрон

281 dme-mir-281-1, dme-mir-281-1 chr2R:8057658- 8057967:-1;

межгенный спейсер

тканей (эмбрионы разных стадий развития, семенники, яичники, головы и тела самцов и самок, а также культура клеток дрозофилы 82). Определив уровни экспрессии миРНК в каждой ткани, мы попарно сравнили тканевые профили миРНК из одного и того же кластера, разных кластеров, а также миРНК, не относящихся ни к одному из кластеров. В качестве оценки сходства использовался коэффициент корреляции Пирсона, г. Оказалось, что парные коэффициенты корреляции миРНК из одного кластера достоверно выше {Р-х<а1ие < 2е-16, I-тест Стьюдента) по сравнению с миРНК из разных кластеров или некластеризованных миРНК (Рисунок 1). Это свидетельствует о координированной регуляции экспрессии миРНК большинства кластеров и о том, что в основном кластеры действительно транскрибируются с образованием единого предшественника, который процессируется до миРНК во всех тканях.

А

Б

Рисунок 1. Сходство профилей экспрессии кластерных миРНК О. melanogaster. А)

Распределение парных коэффициентов корреляции г тканевых профилей экспрессии при сравнении миРНК из одного и того же кластера (1), миРНК принадлежащих разным кластерам (2), кластеризованных и некластеризованных миРНК (3), некластеризованных миРНК (4); Б) Диаграмма нормализованных частот встречаемости значений коэффициентов корреляции тканевых профилей экспрессии. Высокие значения коэффициентов корреляции характерны только для миРНК из одного и того же кластера (серая стрелка, линия 1). Также видно, что небольшая фракция пар миРНК из одного и того же кластера имеет низкий коэффициент корреляции (чёрная стрелка, линия 1), т.е. некоторые кластеры содержат миРНК, профили экспрессии которых отличаются от профилей экспрессии остальных миРНК того же кластера.

Некоординированная экспрессия миРНК отдельных кластеров

Все миРНК для 14 из 19 кластеров имеют высокий парный коэффициент корреляции сходства тканевых профилей экспрессии миРНК, г>0.6. Однако тщательный анализ выявил, что в пяти оставшихся кластерах присутствуют миРНК, тканевые профили экспрессии которых отличаются от профилей других миРНК из того же кластера, »<0.3 (Рисунок 1Б; Таблица 2). Такие миРНК имеют «нескоординированный» профиль экспрессии по сравнению с профилями экспрессии остального кластера. К примеру, в кластере 283-12 профили экспрессии с1те-гтпг-304 и с!те-гшг-12 коррелируют между собой (/-=0.69), тогда как профиль (1те-1тпг-283 не коррелирует ни с с1те-гтг-304 (»=0.04), ни с с!те-гшг-12 (»=0.02).

Уровни экспрессии некоординированных миРНК достаточно высоки и сходны с

таковыми у коррелированных миРНК (Р-уа1ие=0.27, /-тест Стьюдента); поэтому низкое

значение г не может быть объяснено какой-то случайной флуктуацией их экспрессии. В

случае кластера 13Ь-2с вывод о некоординированности с!те-гшг-13Ь-1 вероятно является

артефактом, связанным с наложением её измеренной экспрессии с экспрессией идентичной

по последовательности некластеризованной с!те-гшг-13Ь-2. Разные профили экспрессии

миРНК в остальных четырёх кластерах можно объяснить, например, независимой

9

транскрипцией генов миРНК с разных промоторов внутри кластера. То есть, в этих случаях кластеры не образуют единого полицистронного транскрипта. Другим объяснением может быть пост-транскрипционная регуляция экспрессии отдельных миРНК, образованных из общего предшественника.

Таблица 2. ми 141 К, профиль экспрессии которых отличается от профилей экспрессии остальных миРНК из того же кластера.

Кластер миРНК

100-125 ате-1шг-100, (1те-1е1-7

13Ь-2с с!те-1шг-13Ь-1

275-305 с!те-т!г-305

283-12 с!те-1шг-283

9с-9Ь_с1те-1тг-30б

Поиск промоторов кластеров миРНК

Чтобы проверить предположение о независимой транскрипции отдельных миРНК внутри кластера, был проведён поиск расположения предполагаемых промоторов РНК полимеразы pol II. Для этого использовали результаты предсказания сайтов инициации транскрипции (transcription start sites, TSS) программой McPromoter (Ohler, 2006; Ohler, 2010), и результаты полногеномного анализа расположения сайтов связывания pol II, полученные с помощью иммунопреципитации хроматина (проект ModEncode, (Celniker et al., 2009)). Перекрывание предсказанных TSS и экспериментально определённых сайтов связывания pol II расценивалось как указание на наличие промотора. Промоторы генов миРНК искались в пределах 5 т.п.н. от начала миРНК. Оказалось, что предсказанные промоторы всех кластеров миРНК, независимо от особенностей профиля экспрессии миРНК, расположены только перед кластером; TSS внутри кластеров не обнаружены (Рисунок 2).

Расстояния между последовательностями пре-миРНК внутри кластера небольшие (средняя расстояний равна 213 нт, медиана - 75 нт.), и отсутствие промоторов может быть объяснено низкой вероятностью их наличия в коротких межгенных спейсерах. Для оценки этой вероятности была определена эмпирическая кумулятивная функция распределения ecdf длин между началом всех миРНК дрозофилы и ближайшим к ним сайтами TSS. Вероятность Р нахождения TSS в районе размером л: нт. может быть измерена как P=ecdf(x). Действительно, оценённые таким образом величины Р для кластеризованных миРНК оказались достаточно низкими (средняя Р=0.1, медиана Р= 0), что подтверждает предположение об отсутствии внутри кластеров промоторов. Это также исключает вероятность того, что отсутствие

А

Св6325 1гр-1В

1 ||| => -а ггог-998 гтг-318

Консервативность 1ВВ1 1 111 ПК Ю МИШ 1. ИИ ПН 1111 ЯШ ¡ШШННИШШ!

ЫпгЗЯ: 6,232,595-6,235,142 0.2 кЬ

_ __ 9Ф

1 1 ■—" я

гп|г-9с П11Г-306 т1г-79 ггог-9Ь

Консервативность

II III 1 1 «шиш III МП НИ ШЕЯ 11 111 ■■■II

сИг21_: 16,696,792-16,698,945 , 0-2 кЬд

Рисунок 2. Примеры расположения кластеров миРНК. А) Кластер 994-318 с координированной экспрессией миРНК. Б) Кластер 9с-9Ь с некоординированной экспрессией <3те-гтг-306. Красные метки означают ТБЗ на смысловой цепи, синие - на антисмысловой.

внутренних Т88 может быть связано только с недостаточной чувствительностью (~70%) программы МсРгото1ег. В целом, представленные данные показывают, что некоординированность экспрессии отдельных миРНК в кластерах 100-125, 275-305, 283-12 и 9с-9Ь не может определяться их независимой транскрипцией.

Корреляции профилей экспрессии миРНК и миРНК*

Созревание миРНК из шпилечного предшественника сопровождается образованием так называемой миРНК*, последовательность которой является антисмысловой по отношении к миРНК, и которая, как правило, накапливается в существенно меньшем количестве. В последнее время в литературе отошли от использования обозначения миРНК*, поскольку иногда (в отдельных тканях, или при определённых условиях) наблюдается существенное превышение количества миРНК* над миРНК. Вместо этого отдаётся предпочтение к использованию обозначений миРНК-5р и миРНК-Зр для миРНК, вырезаемых из 5'- и 3'- плеч стебля шпильки, соответственно. Однако здесь будет использована старая номенклатура, как более удобная по ряду причин.

Как упоминалось выше, некоординированные профили экспрессии отдельных миРНК могут являться результатом пост-транскрипционной регуляции их созревания, включая регуляцию стабильности. Мы предположили, что пост-транскрипционная регуляция только

С?

СокмКеу

Л

Б

, ; Щ I ■

йте-гтнг-Эс 5агт йте-гтж-ЗОб 5агт йте-гт'г-79 Загт дте-т!г-9Ь 5агт dme-mir-9c Загт 6те-т1г-306 Загт йте-ггиг-79 5агт | dme-m¡r-9b Загт

йте-гг«г-283 5агт йте-пж-304 5агт dmв-mir-12 5агт dme-miг-283 Загт йте-ггиг-ЗСМ Загт йте-т!г-12 Загт

« 1 2 3 4 5 6 7

1 2 0.05

3 0.66 0.18 -

4 0.9 -0.02 0.66

5 0.68 0.22 0.82 0.45

6 0.39 0.09 0.4 0.23 0.45

7 0.52 0.24 0.65 0 44 0.75 0.53

8 0.74 0.01 0.83 0.53 0,7 0.57 0.61

» 1 2 3 4 5 6

1 2 0.04

3 0.02 0.69

4 0.17 0.1 0.27

5 0 0.74 0.17 -0.15

6 0.16 0.3 0.67 0 74 0.06

# 1 2 3 4

с1те-т1Г-275 Загт 1

(1те-т|Г-Э05 5агт 2 -0.16 -

<1те-птг-275 5агт 3 045 0.32

| с1те-г™г-305 Загт 4 0 03 0.16 0.57 -

Ш

# 1 2 3 4 5 6

с!те-т1г-100 Загт 1

с1те-|е1-7 5агт 2 0 27 -

дте-.чж-125 5агт 3 0.75 0.81

йте-п-нМОО Загт 4 029 0.49 0.48

с1те-|е1-7 Загт 5 0 35 0.93 0.76 0.53

(1те-т1г-125 Загт 6 0 46 0.83 0.9 0.43 064 -

Рисунок 3. Профили экспрессии миРНК и миРНК*. Тепловые карты экспрессии (слева) и корреляционные таблицы профилей экспрессии (справа) миРНК и миРНК* из кластеров 9с-9Ь (А), 283-12 (Б), 275-305 (В), 100-125 (Г). миРНК* обозначены как *. Уровни экспрессии на тепловых картах были Z-нopмaлизoвaны.

миРНК, но не соответствующей миРНК*, будет приводить к отличию профилей экспрессии миРНК и миРНК*. Действительно, профили миРНК и миРНК* из кластеров с координированной экспрессией миРНК, очень схожи и имеют высокое сходство профилей экспрессии (не показано). В то же время, профили экспрессии нескоординированных миРНК отличаются от профилей их миРНК* и имеют низкий коэффициент корреляции (Рисунок 3). К примеру, профиль экспрессии ёте-гтг-ЗОб* имеет низкий коэффициент корреляции с профилем (Зте-гшг-ЗОб (г=0.09), но высокий - с остальными миРНК из кластера 9с-9Ь.

Таким образом, вышеизложенные наблюдения показывают, что некоординированная экспрессия миРНК в кластерах связана с их пост-транскрипционной регуляцией. В целом, данные демонстрируют две особенности регуляции экспрессии кластеров миРНК: а) все кластеры транскрибируются как единые полицистронные предшественники миРНК; б) экспрессия некоторых кластерных миРНК регулируется на пост-транскрипционном уровне.

Идентификация семенник-специфичных миРНК

Анализируя тканевые профили экспрессии, мы обнаружили, что кластеры 959-964, 972979 и 991-992 экспрессируются преимущественно в репродуктивных органах самцов, семенниках. Из литературных данных известно, что семенники млекопитающих характеризуются особым набором экспрессирующихся миРНК (Яо ег а1., 2007). Мы решили проверить, справедливо ли такое утверждение также для О. mela^юgaster. Для этого мы проанализировали тканевые профили экспрессии остальных миРНК, не относящихся ни к одному из кластеров, используя тот же набор библиотек, что и при анализе профилей кластеров миРНК. В качестве критерия тканеспецифичности использовали пороговое значение >4-х кратного превышения уровня экспрессии миРНК в семенниках по сравнению с любой другой тканью. Данный анализ позволил выявить 22 семенник-специфичных миРНК, включающих помимо 16 миРНК из вышеупомянутых кластеров 959-964, 972-979 и 991-992 ещё и ш1ЯЫА-316, т1Юч[А-375, гш1ША-982, тЯУЧА-983, пп(ША-985, т1КЫА-1004 (Рисунок 4А). Почти все перечисленные миРНК, за исключением гт!ША-375, являются уникальными для Ого$орЬШ(1ае и не встречаются за пределами класса насекомых.

1.0

1 х

ГО О. 0.8 го I В к 0.6

со ^ ^ о Го Ш 0.4

"¡0.2

-г- ^ 1

X о

СС31646

—Н—I—

... .уда

^МЕШИШ-

5рЗр

сЬг2Ь:5640720-5642288

■985-5р ггнг-991-Зр

-316-5р -+- ггнг-375-3р ~ггиг-959-Зр - т1Г-959-5р

-960-5р -.-т1г-961-3р ->*-1таг-961-5р -»-т1г-962-3р

-963-3р - пгаг-963-5р - ггнг-964-Зр -*■ т!г-964-5р

-972-5р -к-т1г-973-3р »- т!Г-974-Зр « т1г-974-5р

г-976-Зр гтаг-976-5р « пмг-977-Зр т!г-977-5р

-978-5р гтг-979-Зр гтнг-982-Зр гл!г-985-Зр

ЬаМат I ~ —

¡г-992-5р

Рисунок 4. Экспрессия миРНК в семенниках. А) Нормализованные тканевые профили экспрессии семенник-специфичных миРНК О. melanogaster. Б) Структура кластера гтЯ-959-964. В) Нозерн-блот анализ профиля экспрессии гшЯ-960 из кластера ггпЯ-959-964 в тканях. гт1ША-Ьап1ат использовали как контроль загрузки.

Эволюция кластера miR-959-964

Известно, что особенностью семенник-специфичных белок-кодирующих генов является их относительно высокая скорость эволюции (Clark et al., 2006). Мы решили проверить, имеет ли кластер miR-959-964 высокую скорость эволюции. Кластер miR-959-964 у D. melanogaster состоит из шести миРНК (miRNA-959, miRNA-960, miRNA-961, miRNA-962, miRNA-963 и miRNA-964) и расположен на нетранскрибируемой цепи интрона гена CG31646 (Рисунок 4Б). Нозерн-блот анализ профиля экспрессии подтвердил семенник-специфичность экспрессии miR-959-964 на примере miR-960 (Рисунок 4В).

А

miR-959 5 miR-960 s

miR-961 ь miR-962 5 miR-963 5

miR-964 5

5p

3p

3guugauaaag. .. 4gawjgcauagc..

;g jcugggacacuuuua .

щjcuggcaaucaaaag. .3 .'tuovjuaccultjcaa 1juauauacotuuguu. ifeuuaaa igccucugsjucuaag.

Ж //

- D. melanogaster г D. sechellia

D. simulans

- D. erecta - D. yakuba

_г D. pseudoobscura

1 D. persimilis

- D. willinstoni

— D. mojavensis

-D. virilis

-D. grimshawi

randfold P-values: fjso.oi О>0-01

ьь

Ш

Олес. о.уак. О.еге. □ тЯ-959~964 р Другие рте-т^Ав

Рисунок 5. Эволюция кластера т!К-959-964. А) Последовательности -5р и -Зр миРНК кластера гшК-959-964. Выделены области «сида». Б) Филогенетическая реконструкция гшК-959-964 в видах ОгояорЫиАае. Серыми блоками изображены пре-миРНК со стабильной вторичной структурой, а белыми - с нестабильной. В) Скорость нуклеотидных замен в пре-миРНК, измеренная оценкой К1тига80. *Р-уа!ие < 0.05 (односторонний /-тест Стьюдента). Разброс значений представлен стандартной ошибкой (вЕ).

Для оценки скорости эволюции пЖ-959-964 мы реконструировали его филогенетическую историю. Как упоминалось выше, часто кластеры содержат одинаковые по последовательностям миРНК, что свидетельствует об их происхождении путём

14

дупликации миРНК. Все миРНК гт!1-959-964 имеют разные последовательности (Рисунок 5А), поэтому миРНК кластера возникали независимо друг от друга. Далее, мы провели множественное выравнивание последовательностей пре-миРНК кластера из разных видов ВговорЪПа, и с помощью метода максимального правдоподобия реконструировали эволюцию кластера (Рисунок 5). Также с помощью программ ШЯА/оЫ и гапс//оШ, была определена стабильность шпилько-подобных вторичных структур пре-миРНК в разных видах, что позволило оценить их способность процессироваться до миРНК. Полученное эволюционное дерево ггиИ-959-964 свидетельствует о достаточной стабильности кластера и напоминает эволюционную историю Ого.чорИШс/ае, что говорит о корректности реконструкции. Однако отметим следующие три особенности кластера гшЯ-959-964. Во-первых, количество генов миРНК в 1шК-959-964 варьирует в видах от 4 до 7 (Рисунок 5Б). Во-вторых, в некоторых видах, в результате мутаций пре-миРНК потеряли свою способность сворачиваться в стабильную шпильку. Например, нам удалось у О. рпеш1поЬхсига и О. регйтПИв обнаружить в составе кластера новую пре-миРНК со стабильной шпилькой; однако гомологичная шпилька в £>. /ие/япо££И/ег утратила способность к сворачиванию (Рисунок 5Б). В-третьих, прямое измерение скорости нуклеотидных замен в пре-миРНК с помощью оценки Клтига80 показало, что она выше для т'|К-959-964 по сравнению со всеми остальными семенник-неспецифичными миРНК (Рисунок 5В). В целом, эти особенности свидетельствуют об относительно быстрой эволюции кластера пцЯ-959-964 у Ого.чоркИа.

Встройка МЭ в эухроматин индуцирует образование коротких РНК

ПиРНК являются другим важным классом коротких РНК. Они закодированы в особых участках генома, обогащенных фрагментами мобильных элементов (МЭ), которые называются кластерами пиРНК (или мастер-локусами). Ранее мы показали, что трансгенные конструкции, содержащие фрагмент ретротранспозона /-элемент, после встраивания в эухроматиновые участки генома становятся мастер-локусами, способными продуцировать новые пиРНК в терминальных клетках яичника дрозофилы (01оуткоу е1 а1., 2013). Также обнаружено, что иногда образование пиРНК распространялось и на соседние с местом встройки участки генома, что, очевидно, связано со сквозной транскрипцией трансгенов (01оушкоу е1 а1., 2013). Мы предположили, что встройка не только трансгенов, но и транскрипционно активных МЭ также может вызывать образование новых пиРНК кластеров, и что продукция пиРНК по сходному с трансгенами механизму может распространяться за пределы МЭ. Если МЭ встроился рядом или внутрь белок-кодирующего гена, то

распространение образования новых пиРНК за пределы МЭ может приводить к подавлению экспрессии этого гена с участием системы пиРНК сайленсинга.

Для проверки этих предположений, мы провели полногеномный поиск МЭ, инициирующих распространение образование пиРНК в соседних участках генома двух линий D. melanogaster, т. е. таких отдельнорасположенных копий МЭ, которые соседствуют с кластерами пиРНК. Для того, чтобы уже существующие пиРНК не мешали идентификации новых пиРНК, индуцированных инсерцией, анализировались только те МЭ, которые локализованы в эухроматине и не относятся ни к одному из известных мастер-локусов (Brennecke et al., 2007).

В рамках международного проекта по секвенированию генома D. melanogaster (геномная сборка dm3, UCSC Genome Browser (Meyer et al., 2013)) была использована линия у; сп bw sp. По нашей оценке в публично доступном геноме dm3 аннотировано -62 тыс. фрагментов и полноразмерных копий МЭ, выявленных ранее с помощью программы RepeatMasker. Среди аннотированных, 6248 МЭ расположены в эухроматине и не относятся ни к одному из известных мастер-локусов (Brennecke et al., 2007). Для определения копий МЭ, которые специфичны только для линии у; сп bw sp, с помощью технологии парно-концевого секвенирования была определена нуклеотидная последовательность генома другой линии D. melanogaster, wK. Анализ структурных вариаций собранного генома линии wK позволил определить отсутствие в нём ряда известных для линии у; сп bw sp сайтов инсерций МЭ, которые, таким образом, являются специфичными для линии у; сп bw sp. Всего было обнаружено 348 полноразмерных и 302 разрушенных копий МЭ, присутствующие в геноме только у; сп bw sp. Для установления корректности процедуры поиска делеции in silico, был проведён подтверждающий ПЦР на геномной ДНК для ряда МЭ с праймерами к фланкирующим к ним областям.

С другой стороны, дополнительный анализ генома линии wA' позволил также выявить 1089 эухроматиновых копий МЭ, которые присутствуют только в линии wK и отсутствуют в линииу; сп bw sp. Степень полноразмерности данных МЭ, в силу особенностей применённой стратегии, достоверно установить нельзя.

Для определения способности МЭ инициировать образование новых пиРНК в месте инсерции, были приготовлены и секвенированы библиотеки коротких РНК (18-29 нт) из репродуктивных органов самок (яичники) D. melanogaster линий у; сп bw sp и wK. Для корректного подсчёта количества новых пиРНК, индуцированных инсерцией МЭ, и исключения вероятности, что МЭ встроился в область, которая по какой-либо причине уже являлась источником коротких РНК (например, эта область представляется собой мастер-

16

локус) учитывались только такие специфичные для линии у; сп Ьи1 хр (или и'*) МЭ, у которых соответствующие фланкирующие последовательности генома в линии \\>к (или, соответственно, у; сп Ь\у ¡р) не образуют значительного количества коротких РНК. В результате было обнаружено, что для 91 полноразмерных и 30 разрушенных копий МЭ специфичных для линии у; сп Ьн> яр «левые» и «правые» фланги (по 1 т.п.о. «слева» и «справа» от МЭ; здесь и далее под «левым» и «правыми» флангами имеются ввиду области, соответственно, «перед» и «после» МЭ независимо от его ориентации в геноме) имеют как минимум 5 прочтений с каждой стороны (всего им соответствует 7200 прочтений коротких РНК). Большинство из них образуются не далее, чем 300-500 нт. от места встройки МЭ. Аналогично, в линии и,А' обнаружено, что фланкирующие последовательности (по 1 т.п.о слева и справа) 96 из 1089 специфичных для неё МЭ генерируют 8797 коротких РНК, отсутствующих в линии у; сп Ъ\\> яр. Таким образом, полученные результаты показывают, что встраивание МЭ в эухроматин может действительно вызывать продукцию коротких РНК в месте встройки.

Характеристика коротких РНК, индуцированных инсерцией МЭ

Большинство коротких РНК из флангов МЭ имеют размер 23-29 нт. и характеризуются наличием преимущественно и на 5' конце, что является отличительной особенностью пиРНК (Рисунок 6А,В). Особенность обнаруженных коротких РНК состояла в чётко выраженной асимметрии их распределения по цепям ДНК: короткие РНК из левых флангов соответсвуют в основном антисмысловой геномной цепи, а РНК из правых флангов — смысловой (Рисунок 6Б,Г). Подчеркнём, что в данном случае под (анти-)смысловыми РНК имеется ввиду их ориентация относительно направления цепей ДНК хромосом, а не относительно ориентации открытых рамок считывания конкретных МЭ. Характер асимметрии не зависел от ориентации самого МЭ.

Более глубокий анализ коротких РНК в месте встройки МЭ позволил сформулировать несколько аргументов в пользу того, что их образование определяется и направляется разнонаправленной или сквозной транскрипцией встроенного МЭ. Во-первых, было обнаружено несколько примеров МЭ, стыки (границы) которых с геномным окружением являются источником коротких РНК размером 23-29 нт. с ассиметричным распределением по цепям (Рисунок 7А). Наличие транскриптов, которые могли бы быть источником таких коротких РНК на стыках, подтверждено экспериментально с помощью ОТ-ПЦР (Рисунок 7Б). Во-вторых, большинство, 91 из 121 (75%) выбранных МЭ с >5 прочтений в каждом из флангов являются полноразмерными, и, следовательно, транскрипционно активными. В-

третьих, на примере нескольких МЭ с уникальными особенностями их последовательностей и имеющих кластеры коротких РНК во флангах, было обнаружено, что они сами являются источником коротких РНК (Рисунок 7В). В целом, эти данные указывают на то, что транскрипция МЭ необходима для образования коротких РНК во флангах. Однако механизм активации такого рода двунаправленной транскрипции, характерной для всех двухнитевых кластеров пиРНК, остаётся неизвестным.

А Левые

оа-|

ш 61%

58 20 22 24 26 28

Размер (пЕ)

I го 2 2« 26 28 Размер (п!)

О 1500 О 1000

Левый Правый

£ 3000 §. 2000 о 1000

£ О

Левый Правый

Цепь: Верхняя Ц Нижняя Р-га/ие: *"510', "<10г.'<0.05

Рисунок 6. Характеристика коротких РНК из флангов МЭ. Распределение длин коротких РНК в линиях у; сп Ьу/ яр (А) и у/- (В) для каждой цепи левых и правых флангах МЭ; также показана доля коротких РНК с и в первой позиции (Ш). (Б) и (Г) — количество коротких РНК для каждой из цепей левых и правых флангов МЭ линий у; сп Ьк яр и и,л, соответственно.

Образование коротких РНК из флангов МЭ зависит от факторов биогенеза пиРНК

В терминальных и соматических (фолликулярных) клетках яичников дрозофилы выделяют два механизма подавления экспрессии МЭ с участием пиРНК. Отличительной особенностью подавления экспрессии МЭ в терминальных клетках является зависимость образования и действия пиРНК от белков AgoЗ и АиЬ, которые вовлечены в амплификацию пиРНК по механизму «пинг-понга». В образовании и поддержании пиРНК в терминальных

тканях также участвуют факторы первичного процессинга, такие как PIWI, Shutdown и РНК-хеликазы Spn-E и Armi. В соматических тканях образование пиРНК зависит только от факторов первичного процессинга P1WI и Shutdown.

F-элемент, Левая граница [chr3L:14260521 ..14260553:+]

TATCiGCACTccttctctacciiacaaatcaagaaaci ATAGACCFGAgga agaga с gg 11 g 111 ag t to 111с

AGACGTGAgga agaga tggttgt _ __GACGTGAggaagagac gg r. r. ge. t tag I. _ ACGTGAggaag ада с gg t tg u 11 aq t.

_CGTGAggaag aga tgg t tgt 11 ag t _ _

GTGAggaagagatggt:tgttt.agt_ _TGAggaagaga tgg!: tgt 11 ag t_ __Gñggaagagatggttgtt ta^t._

chr2L:20.298,558-20,313,912 blood

i» spy

] ping-pong

L_S/L_LTR R_LTR/R_AS

Левый (-) Правый (+)

Рисунок 7. Образование пиРНК зависит от транскрипции МЭ. А) Пример МЭ в линии у; сп bw sp, для которого обнаружены короткие РНК на стыке между последовательностями МЭ и геномным окружением. Указаны ориентация коротких РНК, их размер в нт. (Size) и число прочтений (Reads). Прописными буквами обозначены последовательность геномного окружения, а строчными — МЭ. Б) Демонстрация возможности сквозной транскрипции МЭ на примере МЭ blood (chr2L:20,298,558-20,313,912). Сверху показано расположение праймеров, использованных для ОТ и ПЦР, снизу — результат ПЦР с указанными парами праймеров. Реакция ОТ проводилась с праймерами L_LTR для детекции «левых» антисмысловых транскриптов или R LTR для детекции «правых» смысловых транскриптов. В) МЭ blood, является источником образования новых пиРНК в линии у; сп bw sp, но не в линии w*, а также индуцирует образование пиРНК на своих флангах. Показаны графики плотности распределения смысловых (коричневые пики) и антисмысловых (синие пики) коротких РНК вдоль участка с указанными координатами; по оси ординат указано число прочтений. Также показаны короткие РНК, образующие пинг-понг пары (зелёный и красный пики).

Для проверки, что короткие РНК из флангов МЭ действительно являются пиРНК, были использованы несколько опубликованных библиотек коротких РНК, полученных из яичников D. melanogaster с нокдауном факторов образования пиРНК в соматических или терминальных тканях (Czech et al., 2013; Preall et al., 2012). Нокдаун факторов биогенеза пиРНК осуществлялся с помощью трансгенных конструкций с закодированной shPHK (small hairpin RNA), экспрессия которых индуцировалась за счёт драйверов nanos-Ga/4 в терминальных клетках или tj-Gal4 в соматических клетках (Czech et al., 2013; Preall et al.,

2012). В качестве отрицательного контроля использовалась библиотека коротких РНК из яичников линии, экспрессирующие shPHK к гену white и драйвер nanos-Ga!4 или tj-Gal4. Мы обнаружили в

о

о

о

Нокдаун: white shu piwi white shu piwi white Yb armi gasz spn-E aub del

Левые Правые

» I И —i И

пи

ГЦ

дх

пи ши

□о

150 100 50 О 100 200 300 RPM

chr3R:576,026-585,237

F-element

CG31530

i у; сп bw sp -j

J ] rios-Gal4 > white

I nos-Ga!4 > piwi

| tj-Gal4 > white

i ' ! I ij-Gal4 ' Pi™ ilk,,

2 kb

Цепь: Q Верхняя Щ Нижняя Рисунок 8. Влияние факторов образования пиРНК на короткие РНК из флангов МЭ. А)

Нормализованное количество коротких РНК (reads per million, RPM) для каждой из цепей из левых и правых флангов в яичниках мух с нокдауном факторов образования пиРНК. Б) Графики плотности распределения смысловых (коричневые пики) и антисмысловых (синие пики) коротких РНК вдоль района инсерции F-элемента в линиях с нокдауном генов white (контроль) и piwi в терминальных (rios-Ga/4) и соматических (tj-Ga/4) тканях; по оси ординат указано число прочтений.

линиях у; сп bw sp, nanos-Gal4>white и tj-Gal4>white на основе выявления кластеров пиРНК 14 общих МЭ, которые содержат короткие РНК в своих флангах во всех этих линиях и, таким образом подходят для оценки влияния нокдаунов на образование коротких РНК. Оказалось, что образование коротких РНК из флангов подавляется только при нокдауне Piwi, Shutdown, Spn-E, Armi, GASZ только в терминальных клетках, но не в соматических фолликулярных клетках (Рисунок 8). Таким образом, эти данные подтверждают наше предположение, что данные короткие РНК действительно являются терминальными пиРНК.

МЭ индуцируют образование коротких РНК в близлежащих генах

Анализ расположения МЭ в геноме линии у; сп Ъм> яр, имеющих короткие РНК в своих флангах, показал, что 47% из них расположены в межгенном пространстве, 47% - в интронах, и только 4 копии интегрировали в экзоны белок-кодирующих генов. Некоторые из межгенных и интронных МЭ индуцировали образование пиРНК, распространяющееся на соседние белок-кодирующие гены, причём в отдельных случаях новые пиРНК были антисмысловыми относительно транскрипции генов (напр., Рисунок 8Б, Рисунок 9А,Б). Мы

20

сравнили уровень экспрессии генов СС3894 и Оя1Е12, расположенных рядом с сайтом встраивания С2-элемента (сЬг2Я: 20,651,189-20,653,106), индуцирующего образование коротких РНК в линии

А сИг31_:3,055,908-3.074,201 ПгаЫ

Св 32486 гСвН486

-------

сЬг2Я: 19,415.300-19,426.064 412

у; сп

Св53601 141

11

« £ 1.0 V

и с

щ "

1 ^ 0.5

1 I

1 I 0

О-,

яичники каркасы

О вэ1Е12 □ Сй3894

Рисунок 9. Подавление экспрессии генов под действием пиРНК. А) и Б) — примеры встроек МЭ, индуцирующих образование антисмысловых пиРНК к белок-кодирующим генам. В) Измерение уровней экспрессии генов Ся1Е12 и Св3894 в яичниках и каркасах с помощью ПЦР в реальном времени. Показано отношение уровня экспрессии указанных генов (нормировано на экспрессию гена домашнего хозяйства Яр49) в линии у; сп Ью яр по сравнению с иА.

у; сп Ьм> яр по сравнению с их экспрессией в линии м/к , где инсерция отсутствует. Было обнаружено, что в яичниках самок линии у; сп Ьм> яр экспрессия Сй3894 и Оя1Е12 подавлена (Рисунок 9В). В то же время, в каркасах (тела самок без яичников) подавление экспрессии генов было существенно слабее, что свидетельствует о том, что экспрессия подавляется в основном за счёт действия новообразованных терминальных коротких РНК, а не из-за структурных изменений в геномном окружении в результате встройки МЭ. Мы обнаружили ещё несколько случаев, когда новообразованные короткие РНК, индуцированные встройкой МЭ, потенциально могли бы модулировать экспрессию генов СС5976, Сй35130 и Сй3248б. Однако, нам не удалось выявить заметного подавления экспрессии этих генов в яичниках линии у; сп Ъчч яр по сравнению с (не показано). Это говорит о том, что подавление

21

экспрессии генов с участием коротких РНК, индуцированных встраиванием МЭ, в терминальных тканях является нечастым событием, для осуществления которого требуется, вероятно, наличие определённых условий.

Обсуждение

Регуляция экспрессии отдельных миРНК кластера может происходить как на уровне их процессинга из единого для всего кластера полицистронного транскрипта-предшественника, так и благодаря их индивидуальной транскрипции, независимой от других миРНК из того же кластера,. Экспериментальная проверка природы транскрипта(-ов) кластера миРНК может быть затруднена быстрым процессингом при-миРНК до пре-миРНК. Поэтому для анализа мы применили биоинформатический подход, в основе которого лежит допущение, что зрелые миРНК, образующиеся из единого полицистронного предшественника, экспрессируются в одних и тех же тканях. Действительно, тканевые профили экспрессии миРНК большинства кластеров сходны, что совместно с отсутствием внутрикластерных промоторов свидетельствует в пользу процессинга таких миРНК из единого полицистронного транскрипта при-миРНК (Рисунок 1; Рисунок 2). С другой стороны, тканевые профили отдельных миРНК из кластеров 100-125, 275-305, 283-12 и 9с-9Ь отличаются от остальных миРНК из кластера (Таблица 2; Рисунок 3) Поскольку кластеры с некоординированными миРНК не содержат внутренних промоторов, то скорей всего регуляция экспрессии таких миРНК осуществляется на пост-транскрипционном уровне. Отметим, что представленные результаты (Ryazansky et al., 2011) были независимо подтверждены в ряде недавних работ. Так, было подтверждено высокое сходство тканевых профилей экспрессии миРНК для расширенного набора кластеров D. melanogaster (Marco et al., 2013). Также было показано, что характер экспрессии miR-283 кластера 283-12 действительно отличается от miR-12 и miR-304 у дрозофилы (Nesler et al., 2013) и дафнии Daphnia pulex (Chen et al., 2014). Схожие данные о нескоординированности экспрессии отдельных миРНК в кластерах были получены для планарии Schmidtea mediterráneo (Sasidharan et al., 2013), а также для аномально экспрессирующихся кластеров миРНК в трансгенных линиях D. melanogaster, являющихся модельным объектом для изучения мышечной дистрофии Дюшена (Fernandez-Costa et al., 2013).

Отдельный вопрос заключается в механизме пост-транскрипционной регуляции миРНК кластеров. По аналогии с другими оргранизмами, можно предположить, что для миРНК let-7 из кластера 100-125 (Таблица 2) вероятный механизм пост-транскрипционной регуляции может быть связан с участием белка Lin-28, который у млекопитающих и нематоды

подавляет активность Drosha и Dicer, а также вызывает З'-поли-уридинилирование и последующую деградацию предшественника let-7 (Newman et al., 2008; Piskounova et al., 2011). Для консервативной miR-100 дрозофилы пост-транскрипционным механизмом регуляции может быть A-I редактирование, как это предположено для млекопитающих (Berezikov et al., 2011). Механизмы регуляции для остальных «нескоординированных» миРНК ещё предстоит выяснить.

Мы обнаружили, что последовательность семенник-специфичного кластера miR-959-964 относительно быстро эволюционирует (Рисунок 5). Известно, что быстрая эволюция является особенностью семенник-специфичных белок-кодирующих генов, что, видимо, отражает их участие в репродуктивной изоляции и видообразовании (Swanson and Vacquier, 2002). Поэтому вероятно, что кластер miR-959-964 также может принимать участие в регуляции репродуктивной изоляции и, следовательно, в видообразовании. Одна из предсказанных мишеней miR-959-964, которая возможно вовлечена в этот процесс — ген fdl, кодирующий P-N-ацетилгексозаминидазу. Эта консервативная среди Drosophilidae гликозидаза ассоциирована с мембранной спермиев (Intra et al., 2009) и, по-видимому, участвует в распознавании поверхности яйцеклетки (Cattaneo et al., 2002). Интересно, что здесь прослеживается аналогия с моллюсками Haliotis, у которых видоспецифичность оплодотворения обеспечивается за счет различающихся по последовательностям и, следовательно, по ферментативной активности, белков-гомологов фермента лизина, локализованного в акросоме спермия и отвечающего за распознавание и последующее расщепление гликопротеинов вителлиновой оболочки яйцеклетки (Panhuis et al., 2006). Если допустить, что видоспецифичность оплодотворения достигается благодаря различиям в уровнях экспрессии fdl у разных видов, то механизм барьера межвидовых скрещиваний может заключаться в неспособности спермия с низким уровнем экспрессии fdl из одного вида связаться с оболочкой яйцеклетки другого вида, приспособленной для оплодотворения спермием с высоким содержанием Fdl.

Считается, что основной функцией пиРНК в терминальных клетках является подавление экспрессии МЭ, в то время как подавление экспрессии генов ранее относили к функциям миРНК. Однако ряд недавних работ показал, что в соматических тканях механизм с участием пиРНК может подавлять экспрессию белок-кодирующих генов (Rajasethupathy et al., 2012; Robine et al., 2009; Saito et al., 2009; Sienski et al., 2012). В то же время оставалось неизвестным, может ли система пиРНК-сайленсинга регулировать экспрессию генов в терминальных тканях, которые являются основным типом клеток, продуцирующих пиРНК. Используя сравнительный анализ коротких РНК и геномных последовательностей двух

23

линий дрозофилы —у; сп Ьп> хр и \\>к— нам впервые удалось показать, что экспрессия генов, оказавшихся в составе пиРНК-продуцирующих районов, ингибирована в терминальных тканях О. melanogaster (Рисунок 9). Данный феномен наблюдается при встройке МЭ рядом или в интрон белок-кодирующего гена и обусловлен продукцией коротких РНК в локусе инсерции МЭ. Это явление обнаружено и охарактеризовано впервые в данной работе. Источником образования коротких РНК (пиРНК) в локусе инсерции МЭ является, по-видимому, сквозной, проходящий через последовательности МЭ и геномного окружения, транскрипт, синтез которого может инициироваться промоторами МЭ и/или самого окружения (Рисунок 7). Инициация образования новых коротких РНК в МЭ и распространение этого образования за пределы МЭ в геномное окружение происходит, видимо, при участии уже существующих терминальных пиРНК к данному МЭ. Мы предполагаем, что расщепление данного транскрипта комплексом пиРНК-белок приведёт к дальнейшему однонаправленному процессингу такого транскрипта на пиРНК. При условии, что новообразованные короткие РНК являются антисмысловыми по отношению к рамке близлежащего белок-кодирующего гена, экспрессия гена будет подавляться, по-всей видимости, через комплементарное узнавание и деградацию транскрипта.

Отметим, что только в 6-7 случаях из 121 выявленных нами МЭ, индуцирующих продукцию коротких РНК в месте встройки в линии у; сп Ь\ч ¡р, наблюдалось образование антисмысловых пиРНК к генам. Кроме того, даже если учитывать исключительно герминапьно-экспрессирующиеся гены, только для 2 из 5 проверенных генов наблюдалось заметное изменение уровня экспрессии (<Зз1Е12 и СС3894) (Рисунок 9). Таким образом, подавление экспрессии генов, вызванное инсерцией МЭ с участием индуцированных коротких РНК, представляет собой довольно редкое (<1%) и относительно случайное событие, возникающее только при перемещении МЭ. Однако предполагая, что даже небольшая модуляция экспрессии генов может иметь регуляторное значение, то различное распределение сайтов МЭ может являться одним из источников полиморфизма репродуктивного потенциала разных линий дрозофилы. Более заметные изменения регуляции экспрессии генов в терминальных тканях могли произойти в следствии «транспозиционных взрывов» (одновременное перемещение большого количества МЭ), которые, как считается, могли происходить в прошлом при эволюции видов. В связи с этим было бы интересно проверить, проявляется ли обнаруженный нами эффект в других видах животных, включая млекопитающих и человека.

Явление индукции образования новых пиРНК при инсерции активных МЭ в эухроматин за счёт их сквозной транскрипции может также объяснять механизм

24

формирования новых мастер-локусов в геноме D. melanogaster в процессе эволюции. Для линии у; сп bw sp известно -150 протяженных участков генома, обогащенных МЭ (в среднем 37, в основном разрушенных, копий) и продуцирующих значительное количество пиРНК (Brennecke et al., 2007). Для образования таких кластеров пиРНК необходима последовательная инсерция многих МЭ в одно и то же место генома, поэтому можно предполагать, что образование мастер-локусов зависит прежде всего от уровня активности транспозонов. Дополнительное изучение особенностей скорости эволюции мастер-локусов могло бы помочь оценить возможное влияние других факторов (помимо уровня активности МЭ) на процессы образования и роста мастер-локусов.

Выводы

1. Кластеры генов миРНК D. melanogaster характеризуются сходными тканевыми профилями экспрессии составляющих их миРНК и отсутствием внутренних промоторов, что предполагает их полицистронную транскрипцию.

2. Тканевые профили экспрессии отдельных миРНК в кластерах 100-125, 275-305, 283-12 и 9с-9Ь отличаются от профилей миРНК* и остальных миРНК в данных кластерах, что свидетельствует о пост-транскрипционной регуляции их созревания и/или стабильности.

3. Биоинформатический анализ выявил существование 22 семенник-специфичных миРНК, включая 16 миРНК из кластеров 959-964, 972-979 и 991-992. Обнаружена повышенная скорость нуклеотидных замен последовательности кластера miR-959-964 среди видов Drosophilidae.

4. Обнаружен феномен индукции образования новых коротких РНК в терминальных тканях при инсерции мобильных элементов в эухроматин D. melanogaster. Данные короткие РНК являются в основном пиРНК и их источником являются как сами мобильные элементы, так и их ближайшее геномное окружение

5. В некоторых случаях образование новых коротких РНК, инициированное инсерцией мобильного элемента, распространяется на близлежащие белок-кодирующие гены. Показано, что экспрессия генов GstE12 и CG3894, попавших в подобные транспозон-ассоциированные кластеры коротких РНК, подавляется в терминальных тканях.

Список публикаций

1. Рязанским С.С., Михалева Е.А., Оленкина О.М. 2014. Существенные функции миРНК в

репродуктивных органах животных. Молекулярная биология. 48, 371-385.

2. Shpiz S.*, Ryazansky S.*, Olovnikov I., Abramov Y., Kalmykova A. 2014. Euchromatic

transposon insertions trigger production of novel pi- and endo-siRNAs at the target sites in the Drosophila germline. PLoS Genet. 10, el004138.

3. Пашковский П.П., Рязанский C.C. 2013. Биогенез, эволюция и функция микроРНК

растений. Биохимия. 78, 811-824.

4. Olovnikov I.*, Ryazansky S.*, Shpiz S., Lavrov S., Abramov Y, Vaury C., Jensen S.,

Kalmykova A. 2013. De novo piRNA cluster formation in the Drosophila germ line triggered by transgenes containing a transcribed transposon fragment. Nucleic Acids Res. 41, 5757-68.

5. Ryazansky S.S., Gvozdev VA., Berezikov E. 2011. Evidence for post-transcriptional regulation

of clustered micrornas in Drosophila. BMC Genomics. 12, 371.

6. Пашковский П.П., Рязанский C.C., Радюкина H.JI., Гвоздев В.А., Кузнецов В.В. 2010.

MiR398 и регуляция экспрессии гена цитоплазматической Cu/Zn супероксиддисмутазы в растении Thellungiella halophila. Физиология растений. 57, 756-764.

7. Рязанский С.С., Гвоздев В.А. 2008. Короткие РНК и канцерогенез. Биохимия. 73, 640-655.

8. Klenov M.S., Lavrov S.A., Stolyarenko A.D., Ryazansky S.S., Aravin A.A., Tuschl Т., Gvozdev

VA. 2007. Repeat-associated siRNAs cause chromatin silencing of retrotransposons in the Drosophila melanogaster germline. Nucleic Acids Res. 35, 5430-8.

9. Кленов M., Столяренко А., Рязанский C.C., Соколова О., Константинов И., Гвоздев В.А.

2007. Роль коротких РНК в регуляции экспрессии генов и мобильных элементов в герминативных клетках. Онтогенез. 38, 1-15.

* - равный вклад авторов

Заказ № 41-Р/10/2014 Подписано в печать 09.10.14 Тираж 100 экз. Усл. п.л. 1,2

ООО "Цифровичок", г. Москва, Большой Чудов пер., д.5 тел. (495)649-83-30 www.cfr.ru ; e-mail: zakpark@cfr.ru