Бесплатный автореферат и диссертация по биологии на тему
Структурно-функциональные предпосылки формирования piРНК-продуцирующих локусов у Drosophila melanogaster
ВАК РФ 03.01.03, Молекулярная биология

Автореферат диссертации по теме "Структурно-функциональные предпосылки формирования piРНК-продуцирующих локусов у Drosophila melanogaster"

На правах рукописи

ОЛОВНИКОВ ИВАН АЛЕКСЕЕВИЧ

Структурно-функциональные предпосылки формирования р1РНК-продуцирующих локусов у Т)го$орЫ1и тсктоцахШ

03.01.03 - молекулярная биология

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата биологических наук

31 СП 2013

005536206

Москва 2013

005536206

Работа была выполнена в Лаборатории исследования геномных повторов эукариот Федерального государственного бюджетного учреждения науки Института молекулярной генетики Российской академии наук и частично в Калифорнийском Институте Технологии.

Научный руководитель:

Доктор биологических наук Калмыкова Алла Ивановна,

Научный консультант:

Кандидат биологических наук Аравин Алексей Алексеевич

(Калифорнийский Институт Технологии)

Официальные оппоненты:

Доктор биологических наук Георгиева София Георгиевна

(Федеральное государственное бюджетное учреждение науки Институт молекулярной биологии Российской академии наук)

Кандидат биологических наук Савицкая Екатерина Евгеньевна

(Федеральное государственное бюджетное учреждение науки Институт молекулярной генетики Российской академии наук)

Ведущая организация: Федеральное государственное бюджетное

учреждение науки Институт общей генетики им. Н.И. Вавилова Российской академии наук

Защита состоится » Уо&Л 2013 года в часов на заседании

диссертационного совета Д 002.235.(А по защите кандидатских и докторских диссертаций при Федеральном государственном бюджетном учреждении науки Институте молекулярной биологии им. В.А. Энгельгардта Российской академии наук по адресу 119991, г. Москва, ул. Вавилова, д. 32.

С диссертацией можно ознакомиться в библиотеке Федерального государственного бюджетного учреждения науки Института молекулярной биологии им. В.А. Энгельгардта Российской академии наук.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы

Обнаружение РНК-интерференции (РНКи) является наиболее крупными открытием последних десятилетий в молекулярной биологии в связи с ее биологической и практической значимостью. РНКи заключается в снижении уровня мРНК гена-мишени в присутствии двуцепочечной РНК (дцРНК), комплементарной этой мРНК. Трансфекция клеток или даже инкубация целого организма (например, Caenorhabditis elegans) в растворе, содержащем длинную дцРНК, гомологичную определенному гену, приводит к существенному снижению количества его транскриптов. Простота и универсальность этого метода подавления экспрессии генов сделала РНКи незаменимым инструментом в фундаментальных исследованиях. Очевиден огромный потенциал РНКи для прикладных медицинских исследований. На сегодняшний день описан ряд механизмов, родственных РНКи, и связанных с различными типами коротких РНК. Эти механизмы играют ключевую роль в таких процессах, как борьба с РНК-вирусами и эндогенными ретроэлементами (собственно РНКи), регуляция экспрессии генов (miPHK путь) и подавление активности мобильных элементов (piPHK путь). Однако независимо от функции того или иного пути, их ключевыми компонентами являются белки семейства Аргонавт (Ago) и короткие РНК, с ними ассоциированные.

Анализ коротких РНК из предшественников половых клеток животных, помимо уже известных siPHK (small interfering РНК) и miPHK (micro РНК), обнаружил отдельный класс коротких РНК, которые получили название piPHK (Piwi-interacting RNA). Как видно из их названия, биология piPHK неразрывно связана с белками подсемейства Piwi из семейства Ago. Главной функцией piPHK является защита генома от активности мобильных элементов (МЭ), повышенная экспрессия которых в предшественниках половых клеток может привести к высокой частоте транспозиций и передаче потомству инсерционных мутаций. piPHK позволяют подавлять экспрессию МЭ путем разрезания их мРНК за счет эндонуклеолитической активности белков Piwi, а также за счет процессов сайленсинга на транскрипционном уровне. piPHK путь является высоко-консервативным механизмом регуляции экспрессии генов, обнаруженным у всех изученных животных, включая млекопитающих. Однако ключевые этапы piPHK пути исследуются на модельном объекте Drosophila благодаря огромному арсеналу молекулярно-генетических подходов, разработанных для этого классического объекта,

Биогенез piPHK отличается от биогенеза siPHK и miPHK рядом особенностей. Наиболее важной из них является то, что большая часть piPHK происходит из дискретных

локусов, лишенных генов, но обогащенных фрагментами разрушенных МЭ (Вгеппеске е1 а1., 2007). Эти локусы, называемые р1РНК кластерами, многочисленны (к примеру, ~150 кластеров у дрозофилы) и могут быть протяженными (более 200 т.п.н.). В случае дрозофилы р!РНК кластеры расположены, как правило, в перицентромерных или субтеломерных областях хромосом и суммарно составляют примерно 3.5% генома. р1РНК кластеры являются центральным звеном р1РНК пути, так как мутации, приводящие к нарушению их работы, приводят к остановке всего р1РНК пути и драматической активации МЭ, вызывающей стерильность. Кроме того, р'|РНК кластеры обеспечивают устойчивость организма к внедрению в геном новых МЭ, ибо интеграция МЭ в эти локусы провоцирует синтез новых р1РНК и как следствие подавление активности этих МЭ.

На сегодняшний день остается непонятой не свойственная другим геномным локусам способность транскриптов, генерируемых р1РНК кластерами, продуцировать короткие РНК. Исследование структурно-функциональных особенностей р'|РНК кластеров осложняется их протяженностью и насыщенностью повторами. Целью данной работы является изучение предпосылок формирования р1РНК кластеров с помощью разнообразных трансгенных конструкций, содержащих фрагменты эндогенных р1РНК кластеров или МЭ. С помощью такого подхода была исследована роль геномной локализации и отдельных структурных элементов р1РНК кластеров, необходимых для продукции р!РНК.

Понимание механизмов регуляции генов представляется важнейшей задачей молекулярной биологии. Одним из таких механизмов является р1РНК путь, роль которого состоит в контроле экспрессии МЭ. Исследования работы р1РПК кластеров, центрального компонента р1РНК пути, принципиальны для понимания эволюции геномов животных в контексте борьбы с МЭ, являющимися мощным источником мутагенеза.

Цель и задачи исследования

Целью настоящей работы является изучение свойств р1РНК кластеров /). те1апс>£а51ег, и исследование факторов, необходимых для продукции р"1РНК. Были поставлены следующие задачи:

1. Провести анализ продукции р1РНК трансгенными конструкциями, интегрированными в эндогенные р!РНК кластеры.

2. Выяснить, будут ли активными эндогенные гетерохроматиновые р'|РНК кластеры в составе трансгенных конструкций, расположенных в эухроматине.

3. Провести замену различных областей, в первую очередь промотора, транспозонных piPHK кластеров и генного piPHK кластера Traffic Jam в целях поиска компонентов, определяющих продукцию piPHK.

4. Выяснить причину супрессии активности ретротранспозона /-элемента трансгенными конструкциями, содержащими транскрибируемый участок ретротранспозона I.

Научная новизна работы

В данной работе впервые проведены генетические манипуляции с протяженными эндогенными piPHK кластерами дрозофилы. Мы разработали метод исследования протяженных piPHK кластеров, который позволил сделать важные выводы об их функционировании. Было обнаружено, что типичная перицентромерная локализация кластеров не является предпосылкой процессинга piPHK, ибо при инсерции в эктопические сайты генома трансгенные кластеры имели активность, сходную с их эндогенными копиями. Также мы обнаружили, что собственные промоторы piPHK кластеров не важны для продукции piPHK, так как их замена на искусственный промотор не приводила к остановке процессинга piPHK. Генерация piPHK происходит независимо от места инсерции репортерной кассеты в трансгенный кластер, что говорит о том, что piPHK кластер представляет собой независимый структурно-функциональный локус, фактически любые участки которого способны к генерации piPHK. Исследование трансгена, встроенного в эндогенный piPHK кластер, подтвердило это наблюдение, а также позволило сделать вывод, что транскрипция кластеров имеет сильные отличия от транскрипции генов, так как здесь игнорируются сайты сплайсинга и терминации транскрипции. Эти свойства необходимы для сквозной транскрипции piPHK кластеров в связи с присущей им гетерогенностью последовательности. Помимо их важности для исследования биологии коротких РНК, искусственные piPHK кластеры представляются перспективным инструментом направленного подавления экспрессии генов в терминальных тканях, что может использоваться как в методических, так и в практических целях.

Апробация результатов

Результаты, полученные в данной работе, были представлены на следующих научных семинарах и конференциях: на семинарах Отдела молекулярной генетики клетки ИМГ РАН, на семинарах Биологического факультета Калифорнийского института технологий, на международных конференциях по биологии коротких РНК (Ванкувер, Канада, 2012; Сноуберд, США, 2012; Уистлер, Канада, 2013)

Публикации

По теме диссертации опубликовано 6 статей в международных рецензируемых научных журналах.

Структура

Диссертация изложена на 95 страницах и включает в себя следующие разделы: Введение, Обзор литературы, Материалы и методы, Результаты, Обсуждение, Выводы. Диссертация содержит 4 таблицы, 15 рисунков и 176 ссылок.

СОДЕРЖАНИЕ РАБОТЫ

Биология piPHK кластеров

В яичнике Drosophila piPHK путь присутствует в двух типах тканей: в терминальных и соматических (фолликулярных) клетках. Эти типы клеток сильно различаются по составу белков piPHK пути. В фолликулярных клетках экспрессируется только один из трех белков семейства Piwi (собственно Piwi) и отсутствуют многие факторы, роль которых состоит в амплификации piPHK, комплементарных МЭ, а также поддержании активности терминальных piPHK кластеров. Это делает фолликулярные клетки удобной моделью, так как piPHK путь здесь по-прежнему эффективен. Анализ библиотек коротких РНК из культивируемых соматических клеток яичника, а также ряд других данных показал, что в фолликулярных клетках piPHK картируются в основном на один большой piPHK кластер flamenco, расположенный в перицентромере Х-хромосомы. Интересно, что в данном случае подавляющее большинство piPHK картируется на одну цепь, а разрушенные копии МЭ находятся на цепи, ей противоположной. Таким образом, в данном типе клеток большинство piPHK являются комплементарными МЭ, что необходимо для узнавания и сайленсинга МЭ. Было показано, что основным механизмом piPHK-зависимого сайленсинга здесь является подавление транскрипции, а не разрезание мРНК МЭ.

Помимо flamenco, в фолликулярных клетках обнаруживаются piPHK, происходящие из генов. Одной из интересных особенностей этих piPHK является то, что они в своем большинстве происходят из 3' нетранслируемых областей (НТО) генов. Как и в случае flamenco, piPHK синтезируются только из одной (смысловой) цепи генов. Роль генных piPHK на сегодняшний день не выяснена.

Анализ piPHK из терминальных клеток дрозофилы показал, что здесь piPHK также в своей массе комплементарны МЭ (Li et al., 2009; Malone et al., 2009; Vagin et al., 2006). piPHK кластеры расположены преимущественно в перицентромерных и субтеломерных областях и генерируют большую часть piPHK. Однако, в отличие от локуса flamenco, piPHK происходят из обеих цепей piPHK кластеров, а ориентация МЭ в них не упорядочена. Модель пинг-понга, основанная на анализе piPHK, связанных с каждым из трех белков подсемейства Piwi, объясняет ключевые этапы биогенеза piPHK в терминальных клетках (Brennecke et al., 2007; Gunawardane et al., 2007). Piwi и Aub связываются с piPHK, имеющими преимущественно уридин в первом положении (1U) и комплементарными МЭ, тогда как piPHK, связанные с Ago3, имеют А в 10-ом положении и в основном происходят из смысловых транскриптов МЭ. Согласно модели пинг-понга: 1) первичные piPHK, происходящие непосредственно из транскриптов кластеров (в равной степени из плюс и минус цепей), связываются с белками Aub и Piwi; 2) Aub, заряженный антисмысловыми piPHK, разрезает мРНК МЭ, что является главной целью всего piPHK пути; 3) белок Ago3 связывается с piPHK, образуемой из мРНК МЭ в результате этого разрезания; 4) замыкая цикл, Ago3, заряженный смысловой piPHK, вызывает разрезание комплементарных РНК, антисмысловых по отношению к МЭ и присутствующих среди транскриптов piPHK кластеров, давая начало новым антисмысловым эффекторным piPHK в комплексе с белком Aub. Предпочтения белков к разным цепям остаются необъясненными. Пинг-понг, по всей вероятности, происходит в особой перинуклеарной структуре, называемой nuage. Пинг-понг называется «вторичным» процессингом piPHK, в отличие от первичного процессинга, заключающегося в разрезании транскриптов piPHK кластеров и «созревании» piPHK. Таким образом, в половых клетках присутствует как первичный, так и вторичный процессинг piPHK, тогда как в фолликулярных имеет место только первичный процессинг. Двунитевые терминальные кластеры более пластичны, ибо позволяют синтезировать эффекторные piPHK вне зависимости от ориентации встройки МЭ. Однако для их активности требуется большое количество факторов, роль которых остается во многом загадочной.

Главной особенностью транскриптов piPHK кластеров является то, что, в отличие от большинства других РНК, они должны быть процессированы особым образом. Поэтому должен существовать механизм, отличающий предшественники piPHK от прочих РНК. Для поиска детерминант первичного процессинга piPHK в данной работе мы исследовали инсерцию трансгена в эндогенный кластер, а также создали трансгенные piPHK кластеры.

Свойства коротких РНК, генерируемых трансгеном, встроенным в эндогенный piPHK кластер

Функциональная роль piPHK кластеров состоит в продукции коротких РНК из любых последовательностей, входящих в состав кластера. Однако, станет ли любая последовательность, внедренная в piPHK кластер, его частью, т.е. будут ли образовываться piPHK из этих последовательностей, было неясно. Для того, чтобы изучить свойства piPHK, продуцируемых piPHK кластером после приобретения новой инсерции, мы проанализировали короткие РНК, генерируемые трансгеном Р{1АгВ} (рис. 1А), встроенным в эндогенный субтеломерный piPHK кластер (TAS) на хромосоме X (Roche and Rio, 1998). Для этого была использована библиотека коротких РНК (18-29 нт) из линии Р-1152, содержащей такую инсерцию. Распределение длин коротких РНК, картирующихся на Р{1АгВ}, имеет пик на длине 25 нт и меньший пик на длине 21 нт, что соответствует распределению длин коротких РНК на окружающих последовательностях и подтверждает продукцию этим трансгеном преимущественно piPHK (рис. 1Б). Это дополнительно подкреплено тем фактом, что -64% и ~69% коротких РНК, картирующихся на «+» и «-» цепи Р{1АгВ}, соответственно, имеют уридин в первом положении, характерную черту piPHK (рис. 1В). Схожее предпочтение наблюдалось для коротких РНК, картирующихся на окружающие повторы TAS (рис. 1В). При анализе расстояния между 5'-концами piPHK, картирующихся на противоположные цепи трансгена Р{1АгВ}, обнаруживается пик на 10 нт, что в точности соответствует сигналу пинг-понга (рис. 1Г), характерному как для геномного окружения Р{1АгВ}, так и прочих piPHK кластеров (Brennecke et al., 2007). Таким образом, мы показали, что случайная последовательность, интегрированная в случайный участок активного piPHK кластера, генерирует piPHK со свойствами, не отличимыми от эндогенных piPHK.

Далее, мы обнаружили, что последовательности интронов генов rosy и Adh генерировали piPHK с той же интенсивностью, что и окружающие последовательности (Рис. 1А). В связи с этим наблюдением мы предположили, что сплайсинг транскриптов piPHK кластеров должен быть супрессирован. Мы проверили эту гипотезу с помощью RT-PCR с использованием праймеров, фланкирующих интроны 2 и 3 в гене rosy, и увидели, что более половины транскриптов в каждом из двух случаев были несплайсированы (рис.

1Д).

300 200 I 100

• ♦ цель - цель

iilLiUil

1001 la cZ N Aah

rosy pBL

18 19 20 21 22 23 24 26 26 27 28 29 длина порогом РНК. [ит|

В

У N

2 3

.................... L..............

aaJ -TAS 1А.л

11U

Р{1Аг8)

TAS

•20 -10 0 10 20 30 длима перекрывания [нт]

д

не-спл.-* сп л

не-слл.-»

слл.-»

Рис. I. Продушин piPHK конструкцией Р(1АгВ|. нитрированной ■ субтеломерный piPHK кластер TAS. А - Снизу изображена схема конструкции Р[1АгВ) н предполагаемые транскрипты генов а соответствии с и* 1СНОЫМЫМИ паралотами (/»¿ft и nay) Цифрами оботшчемы нитроны, проанализированные a (Д). Сверху Изображена плотное» 5' кониоа коротких РНК на mito: (шшс оси X) и минус (ниже оси X) шли генома. Учитывались только уникальные короткие РНК. бет аоауска нсспарешшх иуклео1идо» при выравнивании. Абсолютное число коротких РНК. происходящих ю каждого сайта было раиелено на глубину ссквеиирования библиотеки (число миллионов отсемеиировашшх РНК; RPM- read« per million). Б -Распределение длин коротких РНК, изображенных а (А) как фракция от всех коротких РНК, картирующихся на Р(1АгВ) Для сравнения покатано распределение длин коротких РНК. происходящих из окружающего кластера TAS. В - Частота встречаемости коротких РНК с уридином а первом положении для РНК. изображенных а <А> Отдельно проанализированы короткие РНК на плюс и минус цепи конструкции P(IAlB) («+» и «-»). Для сравнения покатано распределение длин коротких РНК. происходящих из окружающего кластера TAS. Г - Степень перекрывания коротких РНК, картирующихся на протикиюложиые цепи Р|1АгВ) или TAS. Показана относительная частота встречаемости перекрывания каждой длины Виден пик на уровне 10 нт, что соответствует синоду пииг-пемна (см. Рис. 2А). Д - Анализ сплайсинга транскриптов гена гагу в линии, содержащей зухроматичсскую иисерцию транс гена Р{1АтВ) (ВС69) и а лнннн P-IIS2 с инсерцией PJIArB). исследованной в (ЛИГ). После обратной транскрипции тотальной РНК. приготовленной из аичникоа соответствующей линии, был проведен 1И|Р с праймероми. фланкирующими нитрон 2 или иктрои 3 гена rosy В линии 8С69 не детсктируегеа несшвйсировшшых

продуктов rosy, тогда как в линии Р-1152 доминирует продукт более высокого молекулярного веса, соответствующий несплайсированной версии гена.

Наконец, анализ piPHK показал, что при экспрессии piPHK кластеров сигналы терминации транскрипции (TTS) также игнорируются, так как мы не наблюдали снижения piPHK плотности после TTS, расположенных после ОРС генов в Р{1АгВ} (Рис.1А). Данные о подавлении сплайсинга и терминации при экспрессии piPHK кластеров говорят о существовании особенностей транскрипции этих локусов, которые, по-видимому, необходимы для включения всего содержимого кластеров в пул piPHK.

Исследование транспозонных piPHK кластеров с использованием трансгенных конструкций

Так как транспозонные piPHK кластеры дрозофилы расположены в перицентромерных и субтеломерных областях хромосом, было предположено, что такая локализация может способствовать распознаванию транскриптов, образующихся из этих областей, для процессинга по piPHK пути. Для того, чтобы проверить, насколько важна для продукции piPHK локализация участка в геноме, мы создали трансгенные линии мух, несущие эухроматиновые инсерции конструкций, содержащих полноразмерные и фрагментированные перицентромерные piPHK кластеры. Если гетерохроматиновый статус перицентромер не принципиален для продукции piPHK, то такие трансгенные конструкции должны генерировать piPHK.

Для того, чтобы отличать эндогенные piPHK от piPHK, образованных из трансгенных конструкций, содержащих копии эндогенных piPHK кластеров в составе ВАС (bacterial artificial chromosome), в них необходимо было ввести искусственную "метку"-нуклеотидную последовательность, отсутствующую в геноме дрозофилы. На Рис. 2. показана схема эксперимента, который включает в себя три стадии: 1) инсерция гетерологичной метки в ВАС, содержащую фрагмент piPHK кластера, за счет рекомбиниринга в бактериях, 2) создание линии Drosophila, несущей трансгенный piPHK кластер в строго определенном эухроматиновом локусе и 3) клонирование и глубокое секвенирование библиотеки коротких РНК из яичников трансгенных мух. В качестве маркера была использована некодирующая последовательность р-галактозидазы (lacZ) Е. coli или GFP и ген устойчивости к канамицину (KanR), необходимый для положительной селекции бактерий, в которых произошла успешная встройка маркерной кассеты в ВАС.

Рис. 2. Схема получения мух, несущих трансгенный piPHK кластер. ВАС, содержащая полноратмсрный или фрагмент piPHK кластера метится уникальной .vu генома дроэофилы последовательностью ia счег рскоибшшрэшга в бактериях £ colt. Модифицированная ВАС может быть испольтована для направленного тршкгепем линии Drmophita. несущей atlP сайт фата pi»C31 • итвестнсхи геномном сайте. Это достигает« та счет необратимой рекомбинации между сайтом atlP и сайтом actB, находящимся в ВАС, с использованием активности рекомбинаты phiOI. закодированной в геноме инъецируемых эмбрионоа. При условии активности традегсиного кластера в аичниках трансгсиных мух можно обнаружить piPIIK, происходящие иг маркера, который уникален для трансгепа

Мы использовали два модельных piPHK кластера: терминальный двунитсвой кластер, расположенный в локусе 38С (псрицентромера хромосомы 2L) н соматический олношиевой кластер flamenco (локус 20А, пери центромера хромосомы X) (Rrcnncckc ct al., 2007). В случае кластера 38С, конструкции содержали полноразмерный кластер (-12 тпо) н фланкирующие геномные области (-3 тпо в обоих направлениях), а меткой являлась кассета lac/-KanR. Из-за большого ратмера локуса flamenco была использована ВАС, содержащая только его 5' коней (-80 тпо. что соответствует -30% всего кластера) и прилежащую геномную область (-30 тпо). В качестве метки была использована кассета cOI'P-KanR. flamenco является однонитевым piPflK кластером; его промотор, по всей вероятности, дискретен и расположен в дистальной области. Для транстенсза в обоих случаях использовалась система фата phiC3l, позволяющая интеграцию транстсна в строго определенное место в геноме за счет сайт-специфической рекомбинации между сайтом auB. находящимся в векторе, и сайтом attP. находящимся в составе прслсущсствующсго картированного трансгена в геноме инъецируемой линии (Vcnkcn el al.. 2009).

Картирование коротких PIIK из яичников мух дикого типа на последовательности laeZ. eCFP и KanR даст минимальный фоновый сигнал. В линиях, солержащих трансгснные конструкции 38С и flamenco были обнаружены piPIIK. специфичные lacZ и eGFP, соответственно. Это означает, что оба трансгеиных кластера активны, а продукция piPHK не зависит от перицентромерното окружения. Как и ожидалось для flamenco, piPIIK картировались практически только на одну из цепей кассеты eCFP-KanR. соотвстсвующую piPHK-продуцируюшей цепи кластера, тогда как для двунитевого piPIIK кластера 38С piPIIK приходят из обеих цепей lac'/.-KanR (рис. ЗА). Короткие РНК, соответствующие этим уникальным участкам, имели характерное распределение длин и

обогащение уридином в первом положении, указывая на то, что это именно piPHK (рис. ЗБ, В).

Сравнение количества piPHK, специфичных flamenco, между мухами дикого типа и трансгенной линией показало 1.3-кратное увеличение для трансгенной линии, содержащей flamenco-CiFP. Учитывая иггсрозиютность линнн в отношении трансгена, это говорит о том, что активность flamenco-GFP находится на уровне, сравнимом с эндогенным кластером. Профиль распределения piPMK в локусе flamenco в трансгенных яичниках был идентичен таковому в диком типе, что говорит о сохранении свойств

lacZ в 38С

1 1Ó0 200 300 4Ó0 500 600 700 пд Ó 300 6Ó0 9Ó0 1200 1500 n o

z

Ql »

ox-upslream ■GFP в flamenco o lacZ в 38C

UJ.

i

длина коротких РНК, [мт]

MU

Рис. 3. Генерация piPHK транс генными кластерами flamenco и 38С. Л - Нормализованная плотность 5' конное коротких РНК нл плюс (выше оси X) и минус (ниже оси X) цгпи инвестированной последовательности GFP. находящейся я транс генном кластере flamenco. Учитывались только уникальные короткие РНК. бет допуска иеспаренных нуклеотидов при виравнивании Видно, что подавляющее большинство piPHK происходит из одной цепи, коллинеариой транскрипции flamenco. Б - То же. что в ГА), для последовательности tocZ, находящейся в траисгсином кластере 38С. Также, как и в эндогенном кластере 38С. продукция piPHK наблюдается с двух цепей. Б - Распределение длин коротких PIIK. изображенных в (А) как фракции от асех коротких PIIK. картирующихся на соответствующие последовательности. Дня сравнения гюкаино распределение .чин коротких РНК. происходящих иг эндогенного одноннтевого кластера X-uputream. И - Частота встречаемости коротких РНК с уридином а первом полохеинн для РНК, изображенных в (А). Для сравнения покатано распределение длин коротких РНК. происходящих in X-uptirram.

трансгсннымн кластерами. Таким образом. трансгенныс кластеры не только способны продуцировать piPIIK. будучи расположены в >у.хроматине, но их активность не отличается от активности эндогенных кластеров. Интересно, что конструкция flamenco содержала лишь 5' фрагмент кластера. Этот результат указывает на то, что детерминанта продукции piPIIK локуса flamenco находится в пределах его 5' фрагмента, а не в 3' участке.

Вышеописанный подход позволяет отвечать и на другие вопросы биологии piPMK кластеров. В частности, мы решили проверить, может ли промотор piPHK кластера определять piPHK-генсрнрующую способность локуса. Для этого мы создали три конструкции, содержащие кластер Х-иригеат (кластер 2, согласно (Brennecke el al.. 2007)), помеченный с помощью кассеты lacZ-KanR. Этот кластер находится в 5' направлении от flamenco и также продуцирует piPIIK только с одной цепи. Х-иригеат активен как в фолликулярных, так и терминальных клетках (Li et al., 2009; Malonc el al.. 2009). Можно предположить, что как и flamenco, кластер X-upstream имеет дискретный промотор в его 5' области. Помимо контрольной конструкции, содержащей 5'-концевую половину кластера, две дополнительные конструкции содержали либо делению 5' области кластера, либо 5' область, замененную на индуцируемый промотор UASP (Рис. 4А). Трансгенныс мухи были скрещены с мухами, содержащими драйвер экспрессии maternal luhul(л-Оа14-VР16, запускающий экспрессию промотора UASP в предшественниках половых клеток. Анализ библиотек коротких РНК, приготовленных из яичников потомков этого скрещивания, показал наличие пика, соответствующего piPIIK. только в случае анализа конструкции с промотором UASP (Рис. 4Б). Из этого следует, что запуск экспрессии кластера с помощью искусственного промотора никак не мешает продукции им piPHK. Более того, сильный промотор гена maternal tubulin, контролирующий экспрессию активатора транскрипции (ial4, вызывал более активную продукцию piPHK. чем нзтивный промотор. Таким образом, можно сделать вывод, что для продукции piPIIK не принципиальна ни геномная локализация, нн природа промотора.

Несмотря на удобство разработанной намн стратегии манипуляции (■одноразмерными транспозоиными класгсрами. генные кластеры дрозофилы представляются более удобными моделями в связи с их малым размером. В следующей части работы мы провели анализ продукции piPIIK генным кластером Traffic Jam.

^ÜáililLj.!

•ÉL

дrama коротких РНК. (m]

РнС. 4. Схемы Н 4НЛЛИ) конструкций, нспальюванных при анализе требований к »нлогенному промотору дли продукции piPHK кластером X-iipirream. А - Схем«, как ta (Рис. 7). л« конструкций X-taptrtam. Видно, что piPHK продуциру ются кластером, полобио flamenco, с одной цепи. Контрольный ВАС содержит 5' часть кластера «ключа* участок, пред/кхюжитглъно содержащий промотор. Во второй конструкции участок, обозначенный как «удаленный фрагмент» был тамснеи на кассету AmpR. В третьей констру кции ■лот участок был таменен на кассету AmpR-UASP. содержащую искусственный индуцируемый промотор. Также обозначено место интеграции маркерной кассеты lacZ-KaaR, одинаковое для всех трех конструкций. Б - Распределение хтин коротких PIIK. картирующихся на инвертированную последовательность hc7„ расположенную * ВАС, описанных а (А). В каждом случае библиотеки коротких РНК сделаны m яичников мух содержащий как трансгенный раРНК кластер, так и драйвер экспрессии Число коротких РНК было нормалитоваио на количество miPHK Iel7 в каждой иг библиотек. Видно, что пик, соответствующий piPHK. присутствует только в случае искусственного промотора.

Исследование свойств генного piPHK кластера Traffic Jam

Ich Traffic Jam (tj) дрозофилы является простейшей моделью piPHK кластера. Как н большинство других генных кластеров, piPIIK продуцируются здесь практически только из 31ITO, причем исключительно из плюс цепи, соответствующей транскрипту (Sailo el al„ 2009). Малый размер гена делает (/удобным объектом для изучения биогенеза piPIIK. tj жспрессируется только в фолликулярных клетках. Наличие культуры клеток OSC, имеющей фолликулярное происхождение и экспрессирующей tj, делает эту модель еще более привлекательной в связи с возможностью обойти стадию создания трансгенных

мух. Из ранее проведенных нами экспериментов мы заключили, что собственные промоторы piPIIK кластеров не детерминнруот продукцию piPHK. Мм решили проверить этот вывод с испол ьзоваиием модели tj за счет замены его промотора на гетерологичный промотор, а также провести пошаговую »мену других участков гена для выявления структурных предпосылок, необходимых для инициации первичного происсснига piPIIK.

Конструкция содержала геномный у>всток длиной -5.7 т.п.о.. включая 2 т.п.о. 5' фланкируюшей области, геи длиной ~3.2 т.«.о. и 500 п.о. 3' фланкирующей области. 3' НТО имеет длину -1.5 т.п.о. Профиль продукции piPIIK в диком типе показывает, что лишь некоторые участки 3' НТО дают обильные piPHK (Рис 5Л) (Robine el al., 2009; Saito el al., 2009). В конструкцию была введена «метка» в виде инвертированной последовательности eGFP в участок, дающий наибольшее число piPIIK. Также были введены уникальные рсстрнкционные сайты для возможности замены отдельных участков гена на гетерологичные последовательности. Для проверки активности конструкции (/-GFP мы провели трансфскнню культуры фолликулярных клеток дрозофилы (OSC). после чего создали библиотеку тотальных коротких РНК, а также piPIIK. связанных с Piwi. Мы обнаружили короткие РНК, продуцируемые инвертированной последовательностью GFP (Рис. 5А). Они имели обогащение урилнном в первом положении, имели типичное для piPHK распределение длин и происходили из плюс цепи трансгсна (Рис. 5). Это говорит о том, что подобно трянспоюнным кластерам, i пенных кластерах продукция piPHK может

f-.

I ita júo rio 4¿o tto «to «¡o»a

> .

Jmc

ofp TJ гогтгггзммагтгя»» длима коротки* РНК. ImtI

Рис. 5. Генерациа р РНК гашии кластером тгапк .'ат-СРР при тринсфскшш в клетки 08С. А - Нишу норчалнюваннлн плотность 5' концов коротких РНК на протяжении гена (/ ■ библиотеке тотальных коротких РНК ит жтраисфсцнросанных клеток ОвС. р!рнк генерируются исключителыю 1п плюс кепи 3' НТО Вставка: акалт коротких РНК №1 клеток ОБС. трансфеиировшшых комструкцней Т]>ОГР. Показана плотность коротких РНК >а протяжении имаертировпшоА последовательности он', интегрирование!! а 3' НТО Б - Слева: частота встречаемости коротких РНК с уридииом а первом положении лла РНК. изображенных • (А) Справа: распределение длин коротких РНК. производимых инкртировалко« последовательностью ОГР а составе 3' НТО 0.

Табл. 1 Продукция piPIIK а клетках OSC ыодифкикрэаанними комструкмиами на оснокс TJ-GFP

I 1 M-g •

1 и

I Tl П1ГТШНГТ1ТПГМ1ТЛ I

«нTP»

1П|мп.щ.п«Дите

I i Н'Р 'I

I Г) OÜOMO.C.O/S НТО I

1МГ0Ч

I Tl fMrffTgtt/LillflJ

'SV

I Tl noo*w>Tc>n/S НТО I

1 '('

JSSSL Ко* «О ми им И G»/МЫ

ьопхьв 1965 2740 1

5119182 522 889 122

4244784 1795 1*67 0i7S

5400265 2304 7195 2 24

5341602 1102 2461 1.60

5803789 1540 6«7П П/4

3953793 1204 169(") Ы»

С) и (") кол-во piPHK. специфичных к фрагментам A->U и U->A. соответственно (157 нт)

происходить из любых последовательностей. Таким образом, конструкция /у-GFP делает возможным картирование необходимых элементов для piPIIK нроцсссинга.

В таблице I представлены полученные модификации конструкции lj-GFP. Для нормализации на эффективность трансакции клетки OSC ко-трансфсцировались вектором с модифицированным кластером t) и вспомогательным вектором //-MS2. который вместо GFP в 31 ПО содержал последовательность из фага MS2, отсутствующую в геноме дрозофилы. Через 3 дня после трансфекции из клеток выделялась тотальная РНК и проводилось клонирование коротких РНК диапазона 23-29 нт. Количество коротких РНК, специфичных к последовательности М!>2, служило для нормировки полученных библиотек.

Первая модификация состояла в замене эндогенного промотора tj на промотор гена actmSC. Картирование коротких РНК на последовательность GFP и нормализация на эффективность трансфекции показала, что уровень GFP-спецнфичных piPIIK для эюй конструкции был приблизительно такой же, как для контрольной конструкции //-GI P (Табл. 1). Это подтверждает вывод, сдслашый для транспозоиных кластеров, о том, что

продукция piPHK не зависит от промотора. Пошаговая замена прочих областей на гетеродогичные привела нас к выводу, что детерминанта продукции piPHK находится в самой 3' НТО гена tj.

Трансген- ассоциированные piPHK кластеры

Отдельной задачей нашей работы являлся поиск простой модельной системы для исследования piPHK кластеров, активных в предшественниках половых клеток. Мы показали, что трансгены, содержащие транскрибируемый фрагмент ретротранспозона, формируют de novo piPHK кластеры, и могут служить удобной модельной системой для изучения свойств piPHK-продуцирующих локусов.

Известно, что гибридный дисгенез является следствием активации определенного класса МЭ у потомков скрещивания, когда эти МЭ наследуется от отца и отсутствуют в геноме матери. Показано, что гибридный дисгенез вызван отсутствием унаследованных от матери piPHK, специфичных к данному классу МЭ (Brennecke et al., 2008). В соответствии с этим, при реципрокном скрещивании гибридный дисгенез не наблюдается, так как его потомки наследуют piPHK, необходимые для защиты от МЭ данного типа, через цитоплазму ооцита. Таким образом, унаследованные piPHK принципиальны для эффективной защиты от МЭ. Ранее было продемонстрировано снижение активности ретротранспозона /-элемента у потомства исходно высоко-чувствительных (реактивных, R) к /-элементу самок, но несущих трансген с транскрибируемым фрагментом /-элемента в любой ориентации (Jensen et al., 1999а, b). Мы предположили, что такие трансгены производят дополнительное количество коротких РНК, что в свою очередь приводит к подавлению активности /-элемента и снижению силы гибридного дисгенеза. Важно отметить, что в случае 1-R дисгенеза даже у реактивных линий присутствуют piPHK, специфичные к /-элементу. Они происходят в основном из разрушенной древней копии /элемента, находящейся в одном из самых больших piPHK кластеров, кластере 42АВ (Brennecke et al., 2008). Однако, этих piPHK недостаточно для защиты от инвазии активного /-элемента. Предсуществующие piPHK могли бы стимулировать синтез piPHK in trans последовательностями трансгена, гомологичными этим piPHK.

1.9.2.1,2Л 2.6.2.10 31.36.39.310 »7-2.1 62 »2

1.9 сЬгЗЯ. 6213409 (*] 2.1 сГи-Л. ЗС70605 (»| 2.3 скгЗ!.: 19440365 [♦) 2.» сЬгЗИ 21473770 [♦)

2.10 сМИ 213171971-1

3.1 ЗК ТАЗ (НЬТКР 1>М) 28$

36 сЬг21 9782344 (♦)

3.9 с1иХ: 793400

3 10 с(и2И: 12181937|<)

42.5.2 сЬгХ: 920733 (+]

67-21 сЬсЗИ: 7394886 И

1ШШ

зван

Д

100-,

? п-

к

100-1

100-1

£ 0

а.

100-1

1001

I п

а.

100-1

100-1

*

а.

юо-1

100-1

1

ос

100-1

: * ¡-то ' • • мГ

• » * 672.1

1 • 1 ( ■ - .1 - 1 - 2.1

ИТ'ГЧ» • » 3.1

110

г» т

»1 »» а и » и

11ЛЛ

Рис. 6. Стру ктуре траисгснов, содержащих Фрагмент (1-ТО) ретротренсгэоэона /-элемента А - структура трансгенов и линии, солсржлшне соответствующие трагкгены. использованные в данной роботе. Структура 1-ТО покатана на панели (В). Промотор гена Н>р70 присутствует а составе конструкции а двух места х -перед 1-ТС и перед геном ттЫЬге. Участки, обозначенные как «Р» соответствуют концевым фрагментам /*•элемента. Б — геномная локализация каждого из использованных трансгепоа. В - нормализованная плотность р«РНК на консссусноА последовательности /-элемента (СепЬалк М14954) а трансгенных линиях. Участок между пунктирных лнннй соответствует 1-ТО. В линиях 3.1 и 3.10 1-ТО инвертирован относительно промотора. Покаганы суммированные сигналы для 30-ит осой. Г - распределение длин коротких РНК, картирующихся на /-элемент в линиях, показанных в (В). Также показаны частоты встречаемости коротких РНК длиной 24-29 га с и в первом положении и А в десятом положении .1« каждой нт цепей Л - Частоты перекрывания 5' частей коротких РНК. картирующихся га противоположные цепи /-элемента. Рассмотрены только короткие РНК диапазона 24-29 нт.

Для проверки этой гипотезы мы создали библиотеки коротких РНК (19-29 нт) из яичников ранее описанных трансгенных линий (Jensen el ■)., 1999а), содержащих фрагмент /- элемента (1-TG) а прямой ориентации по отношению к направлению транскрипции трансгена (1.9, 2.1. 2.3, 2.6 и 2.10), в обратной ориентации (3.1, 3.6, 3.9 и 3.10), а также контрольных линий: I) содержащей I-TO 6« промотора (67.2.1); 2) не содержащей I-TG (62.5.2); 3) исходной реактивной линии (wK), используемой для инъекции всех указанных конструкций. За исключением указанных особенностей, в каждом случае трансгсн имел одинаковую структуру: участок I-TG длиной 2.3 т.п.о. из 5' области /-элемента (содержащий всю первую ОРС, линкер и начало второй ОРС) был клонирован в вектор p\V8 между промотором гена hsp70 и последовательностью, содержащей сигнал полиаденилирования гена acliniC. Также все трансгены содержали рснортерный ген miniwhite (ген white, лишенный большого нитрона), следующий после второго промотора гена hsp70. Схемы конструкций представлены на рнс. 6Л. Сайты встройки каждого траисгена были определены с помощью метода обратного ПЦР и представлены на рис. 6Б. За исключением линии 3.1, где трансген был встроен в эндогенный субтсломерный piPIIK кластер хромосомы 3R. во всех случаях трансгены находились в эухроматических сайтах.

Картирование коротких РНК, специфичных к /-элементу, показало 5-50 кратное увеличение piPHK обеих полярностей на участке, соответствующем I-TG, в трансгенных линиях по сравнению с контрольной линией wK. использован ной для трансгснеза (рис. 6В). Это подтверждает гипотезу о том. что причиной супрессии /-Я дисгснеза является продукция трансгенами дополнительных piPHK. При этом ориентация I-TG не оказывала влияния на эффективность и профиль продукции piPIIK. что коррелирует с ранее продемонстрированной равной эффективностью подавления гибридного дисгснеза конструкциями обоих типов (Jensen et al„ 1999а). Линия 67.2.1. не имеющая промотора, но содержащая такой же фрагмент /-элемента. I-TG, генерирует количество I-TG-специфнчных piPIIK, сравнимое с таковым в линии wK, указывая на то, что транскрипция I-TG необходима для генерации трансгеном дополнительных piPHK. Распределение длин коротких РНК. картируемых на I-TG в трансген них линиях, соответствует таковому для типичных piPIIK кластеров (рис. 6Г). Предпочтения коротких РНК диапазона 24-29 нт к урнднну в первом положении и аденнну в десятом положении также однозначно указывают на то. что это piPIIK (рис. 6Г). Анализ расстояния между 5'-концами piPHK. происходящих из противоположных цепей трансгсна, показывает сильный сигнал на 10 нт (сигн&п пинг-понг амплификации), характерный для терминальных piPl IK (рис. 6Д).

лрмпчго, pAAcii

I /

ш>-га-ч «м> t

1 /

ВЮ1-'—J itM* 1

Длима (Hit

П.» g.«.a.a.

.¡XÎX 18

,S3Î 2 '

mm

»я» 2 3

ч M я » » a Длин (M)

'J

OJ'

Длин* (нг) 1« зс u г« a n

ti *u m

wn 3.1

02i vmn. зв o»w»

-4 ..1 II L.

0.1 ai J il Г ИНГ» WW

il a я а a a Длим [иг)

Рис. 7. Генерация piPlIK транстенами. содержащими транскрибируемый фрагмент /• элемента. А -иормалиюванные числа коротких РНК на протяжении трансгеиных конструкций В левой колонке покатаны тршкгеиы. содержащие l-TG а прямой ориентации, а а правой- а инвертированной ориентации. Покатаны суммированные сигналы дл» 100-нт окон. Ь - распределение длин коротких РНК. картирующихся на трапегеиы. а линиях, покатанных » (А). Ит анализа исключены участки I-TG и tupfO. испольэовалса диалаюн 24-29 ит Также покашкы частоты встречаемости коротких РНК длиной 24-29 ит с U в первом положении и А а десятом положении для каждой ит цепей.

Картирование коротких РНК из яичников трансгснных мух обнаружило продукцию коротких РНК не только из фрагмента 1-TG, но и из остальных участков трансгсна, а именно фрагментов Яолсмснта, гена miniwhite, последовательности, содержащей сигнал полиадснилирования гена acliniC, промоторов hsp70 и линкеров (рис.7А). В то время как последовательности hsp70, I-TG и асНп5С в разной степени продуцируют piPHK в линии wK, это не наблюдалось для гена miniwhtte, а элемент и линкеры вообще отсутствуют в геноме дрозофилы. Однако, в трансгенных линиях все эти участки продуцируют короткие РНК с обеих цепей, что говорит о том, что трансгены целиком стали активными piPIIK кластерами. Анализ предпочтений к IU/IOA для областей /"-элемента, actinSC и mini-white показал, что piPHK обеих полярностей

обогащены урндином в первом положении, но не аденином в десятом положении (рис. 7Б). Это указывает на то, что транскрипты этих последовательностей процессируются только в первичные рИЧ 1К, и в отличие от 1-ТО, не вовлечены в процесс пинг-понг амплификации. Для некоторых трансгенов было замечено, что продукция коротких РНК распространяется за пределы трансгена в прилежащие геномные участки. По-видимому, в этом процессе важна роль геномного или хроматинового окружения трансгенов.

Мы показали, что формирование трансген-ассоциированных р1РНК кластеров является эпигенетическим процессом, зависящим от предсуществующих р1РНК, в данном случае, гомологичных /-элементу. При этом характеристики новообразованных трансгенных кластеров не отличаются от эндогенных транспозонных двунитевых р\РНК кластеров. Таким образом, вопрос о том, какие участки детерминируют продукцию р1РНК данным двунитевым кластером, можно переформулировать в вопрос о происхождении гомологичных коротких РНК, индуцирующих образование каждого конкретного кластера. Необходимо отметить, что в разных участках генома эффективность продукции р1РНК трансгенами сильно отличалась, что указывает на роль геномного контекста и/или хроматинового статуса локуса на продукцию р1РНК трансгенами. Модель трансген-ассоциированных кластеров удобна и перспективна для определения условий, необходимых для инициации р1РНК процессинга.

Заключение

Несмотря на существенный прогресс в понимании работы р'1?НК пути, принципы функционирования р№НК кластеров остаются изученными лишь поверхностно. В данной работе мы исследовали несколько аспектов функционирования р1РНК кластеров, а именно 1) особенности процессинга транскриптов кластеров, 2) роль геномного окружения в продукции р1РНК, 3) необходимость отдельных элементов кластеров для продукции р1РНК, 4) свойства новообразованных кластеров на месте встройки трансгенов с фрагментом МЭ.

Мы показали, что при транскрипции р1РНК кластеров синтез р1РПК возможен фактически из любых областей, так как трансгены, встроенные в случайное место эндогенного или трансгенного рПЧ 1К кластера, генерируют р1РНК по всей своей длине. Также мы обнаружили, что встройка новой последовательности в рП>НК кластер не влияет на общие свойства этого кластера, такие как продукция р1РПК двумя или одной цепями и профиль продукции р1РНК на протяжении каждой цепи. При экспрессии р1РНК кластеров игнорируются сигналы терминации транскрипции и сплайсинга. Таким образом, наши данные подтверждают теоретическое предположение о том, что при

встройке МЭ в любое место активного piPHK кластера, начнется генерация piPHK, специфичных этому МЭ, что обеспечивает адаптивность генома к внедрению новых МЭ.

Интеграция эндогенных piPHK кластеров в эктопические сайты не предотвращает синтез этими кластерами piPHK, что указывает на то, что все детерминанты piPHK процессинга находятся в самих кластерах. Замена промоторов как транспозонных, так и генных кластеров на искусственные также не предотвращала генерацию piPHK.

Мы также показали, что способность трансгенов, содержащих гомологию с МЭ, генерировать piPHK является следствием их узнавания предсуществующими piPHK. Другими словами, piPHK помимо участия в пост-транскрипционном и транскрипционном сайленсинге способны индуцировать формирование de novo piPHK кластеров. Это свойство piPHK обеспечивает дополнительный уровень защиты, превращая геномные локусы, гомологичные предсуществующим piPHK, в дополнительный источник piPHK. Можно предположить, что основным триггером продукции piPHK является эпигенетический процесс, в который вовлечены сами piPHK. Эти данные позволяют пересмотреть многие аспекты функционирования piPHK пути и задать новые вопросы о механизме сайленсинга МЭ в предшественниках половых клеток. Трансгенная система, охарактеризованная в данной работе, является перспективной моделью для дальнейшего исследования участков генома, продуцирующих короткие РНК.

Выводы:

1. Перемещение эндогенных piPHK кластеров (38С и flamenco), расположенных в гетерохроматине, в эухроматиновые участки генома не влияет на их способность производить короткие РНК.

2. Чужеродные последовательности, внедренные в произвольные позиции эндогенных и трансгенных piPHK кластеров, производят короткие РНК, становясь частью piPHK кластера.

3. При экспрессии трансгенной конструкции, расположенной в эндогенном субтеломерном piPHK кластере, наблюдается супрессия сигналов сплайсинга и терминации транскрипции генов, входящих в состав этой конструкции, что указывает на существование особенностей транскрипции piPHK-продуцирующих локусов.

4. Использование искусственных промоторов для запуска транскрипции однонитевых piPHK кластеров (транспозонного X-upstream и генного Traffic Jam), не препятствует продукции piPHK этими кластерами. Таким образом, природа промотора кластера не принципиальна для биогенеза piPHK.

5. Трансгенные конструкции, содержащие транскрибируемый фрагмент ретротранспозона I и расположенные в эухроматиновых участках, становятся активными р1РНК кластерами, способными супрессировать активность /-элемента. При этом образуются короткие РНК обеих полярностей, гомологичные всем участкам трансгена, а не только фрагменту ретроэлемента.

Список публикаций.

Статьи в научных журналах

1) Shpiz S, Olovnikov I, Sergeeva A, Lavrov S, Abramov Y, Savitsky M, Kalmykova A. Mechanism of the piPHK-mediated silencing ofDrosophila telomeric retrotransposons. Nucleic Acids Res. 2011 Nov 1;39(20):8703-11

2) Muerdter* F, Olovnikov* I, Molaro* A, Rozhkov* NV, Czech B, Gordon A, Hanrton GJ, Aravin AA. Production of artificial piPHKs in flies and mice. RNA. 2012 Jan;18(l):42-52.

3) Olovnikov I, Aravin AA, Fejes Toth K. Small RNA in the nucleus: the RNA-chromatin ping-pong. Curr Opin Genet Dev. 2012 Apr;22(2):164-71.

4) Olovnikov* I, Ryazansky* S, Shpiz* S, Lavrov S, Abramov Y, Vaury C, Jensen S, Kalmykova A. De novo piPHK cluster formation in the Drosophila germ line triggered by transgenes containing a transcribed transposon fragment. Nucleic Acids Res 2013 Jun;41(U):5757-68

5) Оловников И, Калмыкова A. piPHK кластеры как основной источник коротких РНК в терминальных тканях животных. Биохимия, 2013 6:747-62

6) Olovnikov I, Le Thomas A, Aravin A. A framework for piPHK cluster manipulation. Methods in Molecular Biology. PlWI-Interacting RNAs: Methods and Protocols 2013, vol.1093, ch.5

* равный вклад авторов Тезисы и презентации

1) I. Olovnikov, F. Muerdter, G. Hannon, A. Aravin (2012) Study of piPHK biogenesis using transgenic piPHK clusters. Keystone Symposium on Gene Silencing by Small RNAs, Vancouver, British Columbia, Canada

2) S. Shpiz, I. Olovnikov, A. Kalmykova (2012) piPHK-mediated silencing ofDrosophila telomeric retroelements. Keystone symposia on Eukaiyotic Transctiption, Snowbird, Utah, USA

3) S. Shpiz, I. Olovnikov, S. Ryazansky, S. Lavrov, Y. Abramov, A. Kalmykova Transgenes containing retrotransposon I fragment form de novo piPHK clusters

in the Drosophila germline. Keystone symposia, RNA silencing, March 19-24 2013, Whistler, Canada.

Заказ № 55-Р/10/2013 Подписано в печать 16.10.13 Тираж 100 экз. Усл. пл. 1,2

ООО "Цифровичок", тел. (495) 797-75-76 www.cfr.ru; е-тай: info@cfr.ru

Текст научной работыДиссертация по биологии, кандидата биологических наук, Оловников, Иван Алексеевич, Москва

Федеральное государственное бюджетное учреждение науки Институт молекулярной генетики Российской академии наук

На правах рукописи

04201363979

ОЛОВНИКОВ Иван Алексеевич

Структурно-функциональные предпосылки формирования р!РНК-продуцирующих локусов у ВгоБоркИа melanogaster

03.01.03 - молекулярная биология

диссертация на соискание ученой степени кандидата биологических наук

Научный руководитель: д.б.н., Калмыкова Алла Ивановна

Москва-2013

Содержание

Введение 4

Список сокращений 5

Обзор литературы 6

I. РНК интерференция. Механизмы регуляции экспрессии с помощью коротких РНК. 6

1а. Биогенез и функция siPHK и miPHK 6

16. Биохимический путь с участием piPHK 10

II. Биология piPHK кластеров 12

IIa. Происхождение piPHK в терминальных тканях Drosophila 12

piPHK кластеры фолликулярных клеток дрозофилы 13

piPHK кластеры в герминальных клетках яичника дрозофилы 16

piPHK кластеры в семенниках дрозофилы 21

116. Факторы, необходимые для активности piPHK кластеров. Структура

хроматина piPHK кластеров 22

IIb. Сравнение piPHK кластеров разных организмов 27

Материалы и методы 32

Результаты 41

I. Свойства коротких РНК, генерируемых трансгеном, встроенным в 41 эндогенный piPHK кластер

II. Исследование транспозонных piPHK кластеров с использованием 44 трансгенных конструкций

III. Исследование свойств генного piPHK кластера Traffic Jam 53

IV. Трансген- ассоциированные piPHK кластеры 59

Обсуждение 67

Выводы 73

Список литературы 74

Благодарности 95

Введение

Короткие РНК, ассоциированные с белками семейства Argonaute (Ago), играют важную роль в регуляции экспрессии генов на всех стадиях развития в большинстве изученных эукариот. Анализ коротких РНК из гонад различных животных, помимо уже известных siPHK (small interfering РНК) и miPHK (micro РНК), обнаружил отдельный класс коротких РНК, которые получили название piPHK (Piwi- interacting РНК) (Senti and Brennecke, 2010; Siomi et al., 2011). Как видно из их названия, биология piPHK неразрывно связана с белками подсемейства Piwi из семейства Ago. Главной функцией piPHK является защита генома от активности мобильных элементов (МЭ), повышенная экспрессия которых в предшественниках половых клеток может привести к высокой частоте транспозиций и передаче потомству инсерционных мутаций. piPHK позволяют подавлять экспрессию МЭ путем разрезания их мРНК за счет эндонуклеолитической активности белков Piwi, а также за счет процессов сайленсинга на транскрипционном уровне (Le Thomas et al., 2013; Shpiz et al., 2011; Sienski et al., 2012; Song et al., 2004).

Биогенез piPHK отличается от биогенеза siPHK и miPHK рядом особенностей. Наиболее важной из них является то, что большая часть piPHK происходит из дискретных локусов, лишенных генов, но обогащенных фрагментами разрушенных МЭ (Brennecke et al., 2007). Эти локусы, называемые piPHK кластерами, многочисленны (к примеру, -150 кластеров у дрозофилы) и могут быть протяженными (более 200 т.п.о.). В случае дрозофилы piPHK кластеры расположены, как правило, в перицентромерных или субтеломерных областях хромосом и суммарно составляют примерно 3.5% генома. piPHK кластеры являются центральным звеном piPHK пути, так как мутации, приводящие к нарушению их работы, приводят к остановке всего piPHK пути и драматическому повышению частоты транспозиции МЭ, вызывающей стерильность (Kalmykova et al., 2005; Klattenhoff et al., 2009; Savitsky et al., 2006; Zhang et al., 2012). Кроме того, piPHK кластеры обеспечивают адаптивность piPHK- ответа при инвазиях новых МЭ, ибо интеграция МЭ в эти локусы провоцирует синтез новых piPHK (Khurana et al., 2011).

На сегодняшний день остается непонятой не свойственная другим геномным локусам способность piPHK кластеров продуцировать короткие РНК. Исследование

структурно-функциональных особенностей piPHK кластеров осложняется их протяженностью и насыщенностью повторами.

Целью данной работы было изучение предпосылок формирования piPHK кластеров у Drosophila с помощью разнообразных трансгенных конструкций, содержащих фрагменты эндогенных piPHK кластеров либо МЭ. С помощью такого подхода была исследована роль геномной локализации и отдельных структурных элементов piPHK кластеров, необходимых для продукции piPHK.

Список Сокращений

Ago- Argonaute Ago3 - Argonaute 3 Armi - Armitage Aub - Aubergine

ВАС - bacterial artificial chromosome HP1 - heterochromatic protein 1 miPHK- micro РНК OSC - ovarian somatic cells piPHK - Piwi- interacting РНК pri-miPHK - primary micro РНК RdRP - RNA dependent RNA polymerase RISC - RNA induced silencing complex

RPM - reads per million (число коротких РНК/суммарная глубина библиотеки) siPHK - short interfering РНК Spn-E - Spindle-E TJ - Traffic Jam

TTS - transcription termination site (сайт терминации транскрипции)

дцРНК - двухцепочечная РНК

кДНК - комплементарная ДНК

МЭ - мобильный элемент

НТО - нетранслируемая область

ОРС - открытая рамка считывания

т.п.о. - тысячи пар оснований

Обзор литературы

I. РНК интерференция и родственные механизмы

1а. Биогенез и функция siPHK и miPHK

Обнаружение РНК-интерференции (РНКи) и родственных механизмов является наиболее крупным открытием в молекулярной биологии на протяжении последних десятилетий в связи с его биологической и практической значимостью (Fire et al., 1998; Hannon, 2002; Meister and Tuschl, 2004; Zamore, 2006). Роль этих механизмов в целом сводится к борьбе с РНК-вирусами и эндогенными ретроэлементами (собственно РНК-интерференция), регуляции экспрессии генов (miPHK путь) и подавлению экспрессии мобильных элементов (piPHK путь) (Aravin et al., 2001; Bartel, 2009; Reinhart et al., 2000; Siomi and Siomi, 2009; Vagin et al., 2006). Существуют также процессы, находящиеся на стыке этих путей, например сайленсинг генов на уровне хроматина у растений и некоторых животных (Castel and Martienssen, 2013; Voinnet, 2009). Однако независимо от функции того или иного пути, центральными компонентами всех них являются белки семейства Argonaute (Ago) и короткие РНК, с ними ассоциированные (Meister, 2013). В связи с тем, что белки семейства Ago имеют долгую эволюционную историю (они присутствуют также у прокариот), механизмы РНК-интерференции у эукариот зачастую очень сложны и многообразны. В этой главе мы рассмотрим собственно РНК-интерференцию у животных и родственный ей путь miPHK.

Явление РНК интерференции заключается в снижении уровня мРНК того или иного гена в присутствии двуцепочечной РНК (дцРНК), комплементарной этой мРНК. Трансфекция клеток или даже инкубация целого организма (например, Caenorhabditis elegans) в растворе, содержащем длинную двунитевую РНК, гомологичную определенному гену, приводит к существенному снижению количества его транскриптов. У некоторых организмов подобный однократный запуск РНК-интерференции способен стимулировать подавление экспрессии гена на протяжении многих поколений, тогда как у млекопитающих этот эффект является временным (Siomi and Siomi, 2009). На сегодняшний день подробно изучены этапы всего РНК-интерференционного пути. После транскрипции

комплементарных цепей определенного геномного локуса и экспорта РНК в цитоплазму, или после внедрения в клетку двунитевой РНК извне (вирусная или искусственная РНК), она подвергается нарезанию на короткие двунитевые РНК с помощью рибонуклеазы Dicer, фермента, родственного прокариотическим дцРНК-специфичным рибонуклеазам III типа (Bernstein et al., 2001; Czech et al., 2008; Ghildiyal et al., 2008). Dicerl дрозофилы способен надрезать дцРНК фактически любой последовательности. Неспецифичность Dicer, а также минимальные требования к последовательности на дальнейших этапах пути, приводят к универсальности РНК-интерференции, то есть позволяют подавлять экспрессию фактически любых генов за счет введения комплементарной им дцРНК (Dietzl et al., 2007; Ni et al., 2008). Короткие РНК длиной 20-24 нуклеотида, получающиеся в результате разрезания двунитевой РНК, имеют 3" выступающие концы длиной 2 нуклеотида на обеих концах (Bernstein et al., 2001). Как и многие другие нуклеазы, Dicer не связывается с субстратом и после надрезания высвобождает его в раствор. Это позволяет искусственно вызывать РНК-интерференцию с помощью трансфекции клеток короткими РНК с вышеуказанными свойствами (Elbashir et al., 2001). Такой способ может быть более эффективен, чем введение длинной двунитевой РНК, так как в некоторых типах клеток экспрессия Dicer находится на относительно низком уровне, что лимитирует продукцию коротких РНК для РНКи (Dietzl et al., 2007). Также, у млекопитающих длинные дцРНК (>50 п.о.) вызывают интерфероновый ответ, и трансфекция короткими РНК позволяет его избежать.

На следующем этапе короткая дцРНК загружается в Ago с помощью так называемого RISC-loading комплекса (RNAi-Induced Silencing Complex- комплекс Ago, короткой РНК и ассоциированных факторов). Ago поддерживается в «открытой» форме (способной вмещать дуплекс) за счет энергии АТР, используемой комплексом Hsc70-Hsp90 (heat shock cognate protein 70 kDa- heat shock protein 90) (Iwasaki et al., 2010). Это происходит до тех пор, пока одна из нитей не высвободится. Выбор нити зависит от термодинамических свойств дуплекса и выбирается та нить, 5' конец которой имеет меньшую температуру плавления (Gu et al., 2011). Детали процесса расплетания дуплекса неизвестны. У дрозофилы процесс выбора цепи, которая попадет в RISC (guide strand) зависит от фактора R2d2 (Liu et al., 2003). Высвобожденные нити (passenger strands) также могут загружаться в Ago. RISC способен вызывать надрезание РНК, комплементарной короткой РНК,

находящейся в нем, - это событие лежит в основе РНКи (Zamore et al., 2000). Узнавание мишени происходит не за счет всей последовательности короткой РНК, а за счет нуклеотидов 2-8 с 5' конца, участка, называемого «seed region». В случае абсолютной комплементарности этих нуклеотидов Piwi домен Ago вызывает эндонуклеолиз мишени между нуклеотидами, комплементарными 8 и 9 нуклеотидам короткой РНК, образуя 5" фосфат и 3" ОН (Bartel, 2009). Интересно, что у человека всего один из четырех Ago (Ago2) имеет каталитически активный Piwi домен, тогда как оба Ago дрозофилы каталитически активны. Также в отличие от дрозофилы, где с siPHK связывается только Ago2, у человека роль Ago вырождена, и все четыре Ago связываются как с siPHK, так и с miPHK. Здесь важно отметить, что несмотря на существование так называемых эндо-siPHK, то есть siPHK, происходящих из эндогенных транскрилтов, мутации генов Drosophila, необходимых для РНКи, не летальны (Lee et al., 2004; Okamura et al., 2004). Известно, однако, что физиологическая роль РНКи состоит в защите от вирусов и эндогенных ретроэлементов (Li et al., 2002). Можно предположить, что эффекты мутаций РНКи, которые сложно уловить в лабораторных условиях, имеют гораздо более серьезные последствия в естественной среде обитания.

miPHK играют принципиально важную роль в развитии и нормальной физиологии большинства высших эукариот (Bartel, 2009). Так, мутации многих компонентов miPHK пути, включая гены miPHK, приводят к ранней остановке развития. В целом механизм биогенеза miPHK похож на вышеописанный механизм РНКи за исключением нескольких принципиальных деталей. В случае пути miPHK субстратом для Dicer являются самокомплементарные рибонуклеиновые шпильки, закодированные в геноме, которые формируют так называемые pri-miPHK (Reinhart et al., 2000). После транскрипции гена miPHK pri-miPHK надрезается эндорибонуклеазой III типа, Drosha, находящейся в ядерном комплексе microprocessor (Denli et al., 2004; Gregory et al., 2004). miPHK, закодированные в интронах (так называемые mirions), не подвергаются действию Drosha, т.к. вырезаются в процессе сплайсинга (Westholm and Lai, 2011). Получившаяся после сплайсинга шпилька экспортируется в цитоплазму, где за счет активности Dicer (в случае дрозофилы в данном случае работает Dicer 1, в отличие от Dicer2, вовлеченного в РНКи) и фактор loquacious (Loqs) она превращается в короткую двунитевую РНК (pre-miPHK) (Hutvagner et al., 2001; Yi et al., 2003). Стоит отметить, что подавляющее большинство двунитевых участков

miPHK имеют неспаренные нуклеотиды, что позволяет избегать разрушения части miPHK за счет эндонуклеолитической активности Ago во время селекции корректной нити. У млекопитающих в процесс выбора корректной нити вовлечен фактор TRBP (Chendrimada et al., 2005). Одна из нитей дуплекса становится miPHK, в то время как комплементарная нить носит название miPHK*. Интересно, что в некоторых случаях обе нити становятся разными miPHK и обнаруживаются в комплексах с Ago, способным к сайленсингу генов. Более того, для ряда генов miPHK показан биогенез miPHK из части, содержащей петлю, соединяющую противоположные цепи ствола miPHK (Bartel, 2009). Во многих организмах Ago, связывающиеся с miPHK, имеют активный каталитический центр, и при абсолютной комплементарности miPHK и мишени способны разрезать мРНК. Однако, в отличие от miPHK в растениях, у животных такие взаимодействия редки. Показано, что каталитическая активность Ago у позвоночных необходима для высвобождения miPHK* из некоторых эндогенных pre-miPHK (Cheloufi et al., 2010; Cifuentes et al., 2010). Загрузка Ago в таком случае происходит автономно и разрезанная miPHK* удаляется, как и в случае siRISC, нуклеазой СЗРО (Liu et al., 2009). miPHK, в отличие от siPHK, как правило имеют уридин на 5' конце, свойство также присущее определенным классам piPHK (см. следующие разделы). Как упоминалось выше, miPHK связываются со всеми четырьмя Ago человека (Dueck et al., 2012).

После загрузки miPHK в Ago (Agol в случае дрозофилы), этот комплекс (miRISC) способен вызывать подавление трансляции определенных мРНК за счет узнавания последовательностей, частично комплементарных miPHK (Bartel, 2009). Эти последовательности, как правило, находятся в 3' нетранслируемой области (НТО), и большинство мРНК в клетке регулируется как минимум несколькими miPHK (Baek et al., 2008). До сих пор нет определенного мнения по поводу конкретного механизма репрессии за счет miPHK: ряд исследований говорит о том, что главную роль в данном процессе играет деаденилирование и последующая деградация мишеней (удаление кэпа и 5"-3' экзонуклеолиз ферментом XRN1), в других работах показано, что RISC супрессирует трансляцию либо на стадии инициации, либо на стадии элонгации (Eulalio et al., 2008; Filipowicz et al., 2008; Huntzinger and Izaurralde, 2011). Для репрессии важна длина polyA хвоста (Moretti et al., 2012). По всей вероятности, miPHK влияет как на стабильность, так и на трансляцию мРНК. В нескольких работах показано, что на одних стадиях развития

доминирует супрессия трансляции, а на последующих- деаденилирование и деградация (Bazzim et al., 2012; Djuranovic et al., 2012). В процессе репрессии с помощью miPHK участвуют белки семейства GW, которые являются платформами для 1) связывания многих молекул Ago и 2) для рекрутирования белков, необходимых для репрессии, таких как РАВРС (poly(A)-binding protein С) и деаденилирующего комплекса CCR4-NOT (Meister, 2013).

16. Биохимический путь с участием piPHK

Как было указано выше, вторым классом белков Argonaute у животных являются белки семейства Piwi, экспрессия которых происходит в гонадах. Мутации Piwi белков приводят к стерильности в большинстве изученных моделей (Siomi et al., 2011). Они участвуют в посттранскрипционных и котранскрипционных механизмах супрессии генов, в первую очередь МЭ. В соответствии с этим при мутациях белков Piwi наблюдается мощное увеличение количества мРНК и белков, закодированных МЭ, и появление двунитевых разрывов в хромосомах, вызванных множественными транспозициями МЭ (Klattenhoff et al., 2007; Theurkauf et al., 2006; Vagin et al., 2006). Помимо тканеспецифичности и эволюционной обособленности белков семейства Piwi, piPHK путь имеет ряд интересных особенностей, как на уровне коротких РНК, связанных с Piwi белками, так и на уровне белковых взаимодействий В частности, у большинства изученных организмов в терминальных клетках экспрессируются несколько белков Piwi со своими уникальными свойствами Как правило, один из белков является ядерным и участвует в котранскрипционном сайленсинге (снижение уровня транскрипции определенных локусов за счет образования репрессирующих гистоновых модификаций) (Aravin et al, 2008; Carmell et al., 2007; Houwmg et al, 2008; Kuramochi-Miyagawa et al., 2008; Le Thomas et al., 2013; Shpiz et al., 2011; Sienski et al., 2012). В то же время другие Piwi белки находятся в цитоплазматической перинуклеарной структуре, называемой nuage (фр. nuage- облако) и участвуют в посттранскрипционном сайленсинге МЭ, а именно разрезании их мРНК за счет слайсерной активности piwi-домена (Aravin et al, 2008, Brennecke et al., 2007; Houwing et al, 2007; Li et al, 2009; Lim and Kai, 2007). Короткие РНК, связанные с белками семейства Piwi и называемые piPHK имеют длину 24-30 нт и

сильные предпочтения к определенным нуклеотидам в определенных позициях (см. следующую главу). piPHK чрезвычайно разнообразны по последовательности: например, при глубоком секвенировании коротких РНК из яичников дрозофилы можно детектировать десятки миллионов уникальных последовательностей. В принципе, siPHK также могут генерироваться из многих последовательностей, однако для endo-siPHK такого большого разнообразия не наблюдается; miPHK исчисляются сотнями у беспозвоночных и тысячами у млекопитающих (Czech et al., 2008; Kozomara and GriffithsJones, 2011; Tam et al., 2008). Картирование piPHK на геном показывает, что они происходят из дискретных локусов, которые, как правило, состоят из разрушенных копий МЭ (Brennecke et al., 2007). Эти локусы называются piPHK кластерами. Интересно, что в некоторых piPHK кластерах piPHK картируются на обе геномные цепи, тогда как в других только на одну. Биология piPHK кластеров детально рассматривается в следующей главе.

В отличие от РНКи и miPHK путей, множество деталей биогенеза piPHK неизвестно. Так, долгое время оставалось загадкой, какая нуклеаза надрезает транскрипты piPHK кластеров. Так как большинство факторов, мутации которых приводят к нарушению биогенеза piPHK, нах