Бесплатный автореферат и диссертация по биологии на тему
Исследование конкуренции между сплайсингом и полиаденилированием у Drosophila melanogaster
ВАК РФ 03.01.07, Молекулярная генетика

Автореферат диссертации по теме "Исследование конкуренции между сплайсингом и полиаденилированием у Drosophila melanogaster"

На правах рукописи

Тихонов Максим Васильевич

ИССЛЕДОВАНИЕ КОНКУРЕНЦИИ МЕЖДУ СПЛАЙСИНГОМ И ПОЛИАДЕНИЛИРОВАНИЕМ У ЭЯОЗОРШЬЛ МЕЬАЖЮАЗТЕК.

Специальность 03.01.07 - молекулярная генетика

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата биологических наук

15 ЯНЗ 2015

Москва 2014

005557493

005557493

Работа выполнена в лаборатории регуляции генетических процессов Федерального государственного бюджетного учреждения науки Института биологии гена Российской академии наук.

Научный руководитель: Максимепко Оксана Геннадьевна, кандидат биологических

наук.

Официальные оппоненты: Евгеньев Михаил Борисович, доктор биологических наук,

профессор, Федеральное государственное бюджетное учреждение науки Институт молекулярной биологии им. В.А. Энгельгардта Российской академии наук (ИМБ РАН), заведующий лабораторией молекулярных механизмов биологической адаптации.

Акопов Сергей Борисович, кандидат биологических наук, Федеральное государственное бюджетное учреждение науки Институт биоорганической химии им. академиков М.М. Шемякина и Ю.А. Овчинникова Российской академии наук (ИБХ РАН), старший научный сотрудник, лаборатория структуры и функций генов человека. Ведущая организация: Федеральное государственное бюджетное учреждение науки

Институт биологии развития им. Н.К.Кольцова Российской академии наук (ИБР РАН).

Зашита состоится «10» февраля 2015 года на утреннем заседании диссертационного совета Д 002.037.01 при Федеральном государственном бюджетном учреждении науки Институте биологии гена Российской академии наук по адресу: 119334, г. Москва, ул. Вавилова, д. 34/5.

С диссертацией можно ознакомиться в библиотеке и на сайте Федерального государственного бюджетного учреждения науки Института биологии гена Российской академии наук по адресу: КИг)://еепеЫо1оау.т/(И55е11а11оп/сИ5-5'ТЛ1ог10У-(1!?5еИа110п.рс1Г.

Автореферат разослан: «23.» декабря 2014 года.

Ученый секретарь диссертационного совета,

кандидат фармацевтических наук ГРабовская Л-С-

У

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность работы. Транскрипция - важнейший процесс в жизнедеятельности организмов. По мере изучения и накопления данных приходило понимание того, что это не просто ферментативный процесс синтеза РНК-посредника, а ключевой этап в регуляции этапов реализации генетического материала. Транскрипция представляет собой последовательность процессов, которые сменяют и влияют друг на друга: инициация, элонгация, термннация. Во время синтеза РНК подвергается ко-транскрипционным изменениям, в результате которых получается подготовленная для экспорта и трансляции молекула. В процессе созревания мРНК эукариот подвергаются копированию, сплайсированию и полиаденилированию. Молекулярные механизмы, ответственные за эти изменения, связаны друг с другом и с транскрипционным аппаратом.

Отличительной особенностью генов высших эукариот является наличие большого количества изоформ, разнообразие которых обеспечивается альтернативными инициацией, сплайсингом и расщеплением/полиаденилированием. Это свойство эукариотического генома значительно увеличивает генное разнообразие, но и добавляет трудности для корректной реализации генепгческого материала. Поэтому процесс транскрипции должен представлять строгую последовательность действий, при которой каждый этап должен запускаться строго по определенной команде. По всей видимости, в качестве таких пусковых сигналов выступают завершающие стадии предыдущих этапов. Так, успешная инициация транскрипции запускает копирование, добавление кэпа способствует преобразованию полимеразного комплекса в элонгационный, сплайсинг одного интрона стимулирует прохождение сплайсинга следующего, расщепление/полиаденилирование меняет статус полимеразного комплекса, способствуя его замедлению и остановке, что, в конечном итоге, приводит к терминации, и, наконец, освобождение транскрипта осуществляется только после сплайсинга последнего интрона. Данные о белок-белковых взаимодействиях между компонентами комплексов дополнительно подтверждают существование таких связей.

Изложенная выше лотка подразумевает, что должны существовать определенные механизмы, которые предотвращают прохождение этапов транскрипции не в свое время. В частности, настоящая работа посвящена изучению некоторых аспектов регуляции данного процесса и в ней показано, что функция сигналов полиаденилирования заблокирована внутри интронов.

Цели и задачи исследования. Целью данной работы стало изучение особенностей функционирования сигналов полиаденилирования при расположении их в интронах генов. В связи с этим были поставлены следующие задачи:

1) Определить, насколько часто встречаются скрытые СПА в интронах генов йгохор/Ша те1апо£а$1ег\ выявить случаи, когда СПА одних генов располагаются в интронах других генов.

2) Проверить эффективность процессинга 3'-конца на СПА в экзонах и интронах эндогенных локусов.

3) Создать транзиентную репортернуго систему для определения эффективности прохождения процессинга З'-конца на тестируемых элементах.

4) Проверить функционирование СПА в экзонах и интронах в транзиентной репортерной системе, определить влияние делеции донорного сайта на активность СПА в случае его расположения в интроне.

5) На основе данных секвенирования РНК определить частоту встречаемости случаев, когда происходит полиаденилирование в интроне.

Научная новизна и практическая значимость работы.

В диссертационной работе было обнаружено, что функционирование сигналов полиаденилирования, расположенных внутри интронов, заблокировано. Установлено, что скрытые сигналы полиаденилирования широко представлены в интронах йгозорЬИа meIanogaster. Проведен анализ встречаемости генов, полностью расположенных в интронах других генов, и установлено, что перекрытие в сигналах полиаденилирования достаточно частое явление, затрагивающее около 17% всех генов. Показано, что внутри интронов сигналы полиаденилирования подавлены: они функционируют, находясь в экзонах, но не в интронах. Это явление подтверждено в экспериментах с транзиентной репортерной системой на культуре клеток, а также в исследовании локусов в геноме. Показано, что удаление 5'-сайта сплайсинга, превращающее последовательность интрона в продолжение экзона, приводит к восстановлению функции ранее заблокированных сигналов полиаденилирования. Согласно проведенному в работе анализу транскриптома Ого^оркИа meIanogasíer, сигналы полиаденилирования внутри интронов используются очень редко. В работе приведены данные, подтверждающие, что транскрипционный аппарат игнорирует преждевременные сигналы полиаденилирования до тех пор, пока они расположены в интроне. В работе подробно обсуждается наблюдаемое явление, и предлагаются модели, объясняющие возможные механизмы процесса.

Диссертационная работа вносит существенный вклад в развитие представлений о функционировании аппарата транскрипции. Практическая значимость работы состоит в возможности использования теоретических выводов и методических подходов в медицине и биотехнологии. Разработанная модельная система тестирования последовательностей на

наличие сигналов полиаденилирования и их силу может найти применение при подборе элементов при создании экспрессионных векторов. Искусственные интроны, разработанные и использованные в работе, могут применяться в биотехнологической промышленности для увеличения выхода целевого белка.

Публикации и апробация работы. По результатам диссертационной работы опубликовано 2 статьи. Основные положения и результаты работы были представлены на следующих конференциях: 1) "Competition within introns: Splicing wins over polyadenylation via a general mechanism", ESF-EMBO Symposium, "Systems Biology of Drosophila Development", Pultusk, Poland, 2012. 2) «Блокирование терминации транскрипции в нитронах». XIX международная научная конференция студентов, аспирантов и молодых учёных «Ломоносов». Москва, Россия, 2012.

Структура и объем работы. Диссертационная работа состоит из введения, обзора литературы, материалов и методов исследования, результатов, обсуждения, выводов, списка литературы и приложения. Работа изложена на 93 страницах машинописного текста, включает 8 таблиц, 19 рисунков. Список цитируемых литературных источников включает 183 наименования.

СОДЕРЖАНИЕ РАБОТЫ

Настоящая работа посвящена изучению конкуренции сплайсинга и расщепления/полиаденилировачия - двух ко-транскрипционных процессов, требующих четкую координацию для правильного созревания транскрипта.

1. СПА широко представлены в нитронах Drosophila melanogaster.

Сигналы полиаденилирования представляют собой короткие последовательности из шести нуклеотндов ААТААА. Такой вариант встречается примерно у 60% транскриптов. Остальные случаи - последовательности, в которых 1-2 буквы заменены (Наиболее частые варианты: ATTAAA, TATAAA, AGTAAA). На уровне целого генома таких коротких последовательностей должно встречаться много. При этом преждевременное расположение сигнала полиаденилирования в составе гена может привести к нарушению функции последнего. Следовательно, должны существовать механизмы для предотвращения полиаденилирования в неподходящем месте. Внутри экзонов появление таких сигналов может элиминироваться в результате отбора, как нарушающее аминокислотную последовательность кодируемого белка. В некодирующих частях давление такого отбора на изменения ослаблено, поэтому последовательности, подходящие для запуска З'-процессинга, могут возникать спонтанно.

Ранее блокирование СПА было показано для скрытых сайтов в 5'-нетранслируемой области генов [Guo et al., 2011]. Аналогично преждевременные СПА могут встречаться и в интронах генов.

В ходе данной работы было проверено, насколько широко такие сигналы представлены в последовательностях интронов Drosophila melanogaster. Для достижения этой цели использовалась программа PolyA_SVM, предназначенная для анализа и предсказания СПА [Cheng et al., 2006]. Программа предсказывает СПА, используя метод опорных векторов и последовательности 15 цис-регуляторных элементов. В качестве исходных данных программа принимает последовательности ДНК в FASTA-формате. На выходе выдает информацию о присутствии сайта, при его наличии - координаты и значение e-value, характеризующее надежность предсказания по этому сайту. Ранее было показано, что данная программа подходит для предсказания СПА у Drosophila melanogaster [Guo et al., 2011].

Последовательности 58 594 интронов Drosophila melanogaster были получены из FlyBase, версии 5.34. Приблизительно 55% последовательностей оказались короче 120 п.н., минимальной длины, необходимой для работы программы (рис. 1А); две трети остальных

Рис. 1. СПА широко представлены в ширинах ОгояорИЦа ше/аыо^ачгег. А. Круговая диаграмма, отображающая доли интронов, содержащих и не содержащих СПА, и долю коротких интронов. Предсказано программой Ро1уА_й\'М. Б. Круговая диаграмма, отображающая доли генов, содержащих другие гены внутри нитрона, и доли генов, вложенных в нн троны, разделенные на группы по их принадлежности тяжу ДНК.

последовательностей (около 30% всей выборки), по результатам предсказания программы, содержали один или более СПА. Таким образом, потенциальные СПА широко представлены в интронах. При этом наблюдалась следующая закономерность: чем больше длина интрона, тем больше в нем находилось потенциальных СПА, что хорошо согласуется с тем фактом, что СПА

■ Интроны с длиной с120Ьр — Сигнал присутствует м Сигнал отсутствует

ы Гены, содержащие внутри интрона гены 1 Сонаправленные внутренние гены Гены в интронах двух направлений » Противоположно направленные внутренние гены ■ Другие гены

могут возникать случайно внутри нитронов вследствие простоты данного сигнала. Существует два возможных способа реализации таких сигналов: они могут быть либо заблокированными, либо активными. В первом случае сигнал никак не влияет на транскрипцию, проходящую через него, и последующий сплайсинг. При реализации второго варианта транскрипция прекращается несвоевременно.

В этом контексте, интересно изучить пары такие генов, где один «вложенный» ген полностью расположен в интроне другого гена (пример таких пар приведен на рис.2). У пар генов с подобной архитектурой внутренний ген обладает всеми необходимыми элементами: промотором, телом гена с экзонами и часто с интронами, сигналом полиаденилирования.

Рис. 2. Структура и взаимное расположение пар генов, у1г-е1Р6 и х16-пор5 относительно друг друга. Профиль экспрессии (по данным секвенирования РНК) в 82-клетках. Изображения получены с помощью >уеЬ-интерфейса проекта тос!Епсо11е.

Для корректной работы внешнего гена, СПА внутреннего «вложенного» гена не должен влиять на его транскрипцию. Главное отличие между транскриптами внешнего и вложенного генов в момент прохождения через СПА последнего (за исключением длины) в том, что транскрипт внешнего имеет 5'СС. Другими словами, для внешнего гена данный сигнал является сигналом внутри его интрона, а транскрипционный аппарат находится в статусе «прочтения интрона», что, по всей видимости, обуславливается его белковым составом: появлением компонентов сплайсосомы. Для внутреннего гена данный сигнал - сигнал из экзона, все вышележащие интроны или уже сплайсированы, либо их границы определены сплайсосомой.

С использованием данных Р1уВазе была определена встречаемость таких пар генов (рис. 1Б). Для данного поиска была создана база данных, содержащая необходимую для поиска информацию. Координаты генов и их интронов использовались для определения случаев, где

\

один ген полностью располагается внутри интрона другого. В результате было найдено 865 внешних генов, содержащих 1651 вложенный ген. Из них 727 генов имели то же направление, что и внешний ген. Поэтому их СПА могут влиять на транскрипцию внешнего гена.

Таким образом, было показано, что СПА широко представлены в последовательностях интронов. Это было предсказано путем анализа последовательностей интронов на наличие потенциальных СПА и при анализе встречаемости пар «вложенный ген - внешний ген».

2. Экспериментальное подтверждение функционирования СНА в экзонах, но не в интронах генов.

Как было показано выше, транскрипционная машина часто встречается с преждевременным СПА внутри интронов. Проверить функционирование этих элементов можно на примере пары вложенного и внешнего генов. Если СПА работает при расположении внутри интрона, транскрипция внешнего гена должна обрываться преждевременно, с образованием соответствующего продукта. Представленность разных форм продуктов можно определить с помощью количественной ОТ-ПЦР, присутствие и размер образуемых молекул РНК - с помощью нозерн-блот анализа. Преждевременно терминированные транскрипты могут подвергаться деградации на стадии контроля качества мРНК, поэтому цитоплазматическая фракция РНК, где присутствуют только созревшие продукты, может не содержать данную форму. Исходя из этого, дополнительно для анализа представленности вариантов форм РНК использовалась ядерная фракция, которая, помимо созревшей РНК, содержит интермедиаты процессинга и продукты распада.

Для разделения шггоплазматической и ядерной фракций использовались лизирующие растворы, разрушающие цитоплазматическую мембрану клеток, но не затрагивающие ядерную оболочку. Осадок, состоящий из ядер клеток, использовался для выделения ядерной фракции РНК, а супернатант - для цитоплазматической. Для проверки влияния СПА вложенного гена на транскрипцию внешнего была проведена количественная ОТ-ПЦР для двух пар генов, у^-еШб и х1б-пор5 (рис. 2, 3). Основным критерием для выбора этих генов был высокий уровень экспрессии обоих пар в культуре клеток Э2 (рис. 2). Определение уровня и профиля экспрессии генов было основано на данных секвенирования РНК, полученных из базы данных то(ШМСООЕ. Анализ проводили для ядерной и цитоплазматической РНК, используя пары праймеров к участкам, отмеченным на рис. 3. В то время как цитоплазматическая фракция содержала полностью созревшую РНК, ядерная фракция дополнительно содержала интермедиаты и продукты распада. Это позволяло при анализе детектировать транскрипты, которые не были процессированы окончательно и не были транспортированы в цитоплазму.

к цитопдезштихеейзя РНК ...»

дг:......................,::...................г—Яг

Й " И

•Л Л .« ■

___

я Л ш

3 « 5

Рис. 3. СПА функционируют в экзонах, но не в интронах. На схемах эксперимента с парами генов (А) }Чг-е11'Л и (Б) х16-пор5, экзоны и интроны изображены как прямоугольники и уголки (V), соответственно; короткие нумерованные линии отмечают участки, узнаваемые зондами. Гистограммы показывают уровни ядерной и цитоплазматической РНК в этих участках. Результат нозерн-блот анализа ядерной (я) и цитоплазматической (ц) фракций РНК из 82-клеток, гибридизованных с зондами, узнающими участки из х16-пор5 генов, представлен внизу. Цифры на панели с результатом нозерн-блот анализа показывают участок, которому соответствует зонд. Слева указана принадлежность детектируемых продуктов: неспл. - длинный иесплайсированный продукт, синтезируемый с промотора дг/6; пор5 и д16-процессированные продукты генов пор5 и х!6, соответственно.

В цитоплазматической фракции при помощи количественной ОТ-ПЦР были выявлены высокие уровни только для участков из экзонов тестируемых генов (рис. 3; участки 1, 4, 6), значения для участков из интронов были детектированы на фоновом уровне (рис. 3; участки 3, 5). Это говорит о присутствии в цитоплазме только созревшей и полностью процессированной формы, при этом преждевременно расщепленная/полиаденилированная РНК, о присутствии которой говорил бы высокий уровень РНК в участках 2 и 3, в образцах отсутствует (рис. 3).

В ядерной фракции уровни РНК на участках из экзонов и интронов приблизительно эквивалентны друг другу, что указывает на присутствие длинного несплайсированного транскрипта генов ytr (рис. ЗА) или х 16 (рис ЗБ). Отсутствие значительных различий между участками из интронов (точки 3 и 5) и высокий уровень для последнего экзона (точка 6) свидетельствует о том, что преждевременного расщепления/полиаденилирования транскриптов генов ytr и х16 внутри интрона не происходит. В точке 4, соответствующей экзону внутреннего гена, уровень повышается относительно точек 3 и 5, что говорит о присутствии транскрипта внутреннего гена (eIF6 или пор5), который полиаденилируется на собственном СПА.

Параллельно, мы провели нозерн-блот анализ для пары генов х16-пор5, используя зонды для участков из трех экзонов и одного интрона (рис. ЗБ). В ядерной фракции для всех точек детектируется (на пределе чувствительности) длинная РНК, соответствующая по длине несплайсированному продукту х/6. В обеих фракциях зонды, узнающие последовательности экзонов, давали сигналы, которые по размерам соответствовали процессированным транскриптам х/6 (зонды 1 и 6) и пор5 (зонд 4). Нужно отметить, что нозерн-блот анализ не выявил транскриптов гена х!6, расщепляемых на СПА гена пор5, который располагается в интроне х16. Транскрипт гена х!6 расщепляется/полиаденилируется только на своем собственном СПА, расположенном в последнем экзоне.

Суммируя результаты нозерн-блот анализа и количественной ОТ-ПЦР можно заключить, что транскрипционная машина, транскрибирующая внешний ген, игнорирует СПА в интроне, в то время как вложенный в интрон ген успешно его использует, так как в его случае он является сигналом в экзоне.

3. СПА, встроенные в интрон, функционально выключены

Анализ эндогенных событий расщепления/полиаденилирования не выявил событий процессипга транскрипта внешнего гена на СПА внутри интрона. Преимущество данной серии экспериментов состоит в том, что они позволяли исследовать процессинг РНК в естественном окружении, но недостатком является невозможность свободно модифицировать элементы, вносить изменения в их состав или делеции. Поэтому для дальнейшего анализа функционирования СПА было решено перейти на использование репортерной системы на клеточной культуре S2 Drosophila melanogaster.

3.1 Создание модельной системы для определения эффективности работы СПА

Для проверки активности СПА была разработана и опробована модельная система, позволяющая тестировать свойства СПА в зависимости от их положения в теле гена. В качестве маркерных генов были выбраны два гена люцифераз: медузы (Renilla luciferase, Rluc) и

10

светлячка (firefly luciferase, Flue). Данные гены хорошо подходят для определения их уровня экспрессии. При добавлении соответствующего субстрата (для каждой люциферазы свой) происходит химическая реакция с образованием квантов света, которые можно детектировать, определяя количество фермента каждого типа. Кроме того, возможно измерение количества люцифераз при одновременном присутствии их в одной пробе.

Созданные конструкты изображены на рис. 4.

а

[ рАс 1 R lue г

г-*-

[ рАс | -я р

Рис. 4. Созданные конструкты. рАс - актиновый промотор. R lue - Renilla luciferase. F lue - Firefly luciferase. T - СПА из вируса SV40. rpr - IRES дрозофилииого гена reaper.

Плазмидами с конструктами трасфицировались клетки культуры S2 Drosophila melanogasler. Спустя 24-48 часов, клетки собирали и проводили анализ активности репортерных генов.

Первые два конструкта были созданы для проверки возможности экспрессии репортерных генов под данным промотором и подтверждения нетоксичности продуктов их экспрессии для дрозофилиных клеток.

Третий конструкт включал кодирующие части обеих люцифераз, объединенных одним промотором. В данном варианте белковый продукт синтезируется только для первой люциферазы - Renilla (по кэп-зависимому механизму). Для одновременной экспрессии обеих люцифераз был создан четвертый конструкт с сайтом внутренней инициации трансляции (IRES) из гена rpr (reaper) дрозофилы, встроенным между люциферазами.

Результаты измерений активности люцифераз для всей линейки контрольных конструктов представлены в таблице 1.

Таблица 1. Результаты измерений активности люцифераз.

конструкт Активность R luc Активность F luc

Пусгые-клетки- 0,18 0,1

1 pAcRluc 254 0,21

- Р V 1 Iik 0,16

3 pAc_R-Fluc 59,6 0,6

4 рАс R-rpr-Fluc 2ZS ■■ 6,5'■ ■

В качестве контроля для определения фонового уровня свечения были взяты клетки, которые проходили все этапы трансфекции, но без добавления ДНК-конструкта. Фоновый уровень составил 0,1-0,2 единицы. Видно, что в конструктах 1 и 2 соответствующий ген экспрессируется на очень высоком уровне. Уровень второго маркера не превышает фоновый. В конструкте 3 с двумя маркерными генами, как и положено, первый экспрессируется довольно сильно. Активность второго гена тоже детектируется, но только немного превышает фоновый уровень. Это можно объяснить активным кэп-зависимым синтезом белка с первой рамки считывания и слабым, за счет не диссоциировавших после трансляции рибосом, — со второй. В четвертом конструкте, с вводом сайта внутренней инициации трансляции, заметно увеличивается активность второго белкового продукта.

Тестируемые элементы вставлялись перед IRES. Если СПА в составе тестируемого элемента приводил к расщеплению/полиаденилированию транскрипта, то образовывался короткий транскрипт, содержащий в своем составе кодирующую чать только первой люциферазы. Если же потенциальный СПА оказывается нефункциональным, образуется только длинный транскрипт, содержащий кодирующие части обеих люцифераз, при этом первая экспрессируется кэп-зависимо, а вторая - с участка внутренней инициации трансляции. По соотношению активности второй люциферазы к первой можно определить долю длинных бицистронных транскриптов в общем количестве производимой с конструкта РНК. Иначе говоря, активность первой люциферазы отражает общее количество синтезируемой с конструкта РНК (т.к. первый цистрон присутствует в обоих видах транскриптов - коротком и длинном), а активность второй люциферазы — количество длинного бицистронного транскрипта.

Таким образом, используя данный конструкт, можно достаточно легко детектировать изменения количества второго белкового продукта (Flue) при встройке последовательностей перед сайтом внутренней инициации трансляции.

3.2 Проверка активности СПА в модельной системе.

Для дальнейшей работы с СПА нужно было точно установить их активность в используемой культуре клеток S2. Известно, что ген yellow, СПА которого использовали для дальнейших исследований, является тканеспецифичным, поэтому не исключался вариант специфичности работы его СПА и возможной неспособности функционировать в 82-клетках. Кроме того необходимо было показать, что сигналы из вложенных генов пор5 и eIF6 функционируют, определить, какой силой обладают используемые СПА, для правильной интерпретации результатов.

Созданные для этих целей конструкты изображены на рис. 5.

рАс Rluc рАс Rluc

т i

рАс Rluc

П L

Рис. 5. Созданные конструкты для проверки возможной тканеспецифичности и силы терминирующих последовательностей. Вверху - исходный конструкт с тремя репортерными генами. В середине - конструкт, полученный вставкой сайта внутренней инициации трансляции меяеду двумя цистроиами. Внизу — перед сайтом внутренней инициации трансляции вставляются исследуемые сигналы (t): СПА вируса SV40 (tSV40) и СПА из генов пор5 (tnop5), eIF6 (teIF6) и yellow (ty).

рАс - актииовый промотор. T - СПА вируса SV40. Rluc - геи Renilla luciferase. Flue - ген Firefly luciferase. rpr - IRES дрозофилиного гена reaper, t - исследуемый СПА.

Для анализа эффективности процессинга РНК на тестируемых элементах, поздний СПА вируса SV40 (tSV40) и СПА из генов пор5 (tnop5), eIF6 (telF6), yellow (ty) были заклонированы ниже первого цистрона. Базовая конструкция без вставок и конструкт с линкерной последовательностью (без СПА) эквивалентной длины, что и тестируемый СПА, использовались в качестве контроля.

Полученными конструктами трансфицировались клетки культуры S2. Результаты измерений представлены на гистограмме на рис. 6.

Для конструкта без сайта внутренней инициации трансляции между цистронами характерно отсутствие активности Flue, в связи с тем, что транслируется только первая люцифераза. Отношение Fluc/Rluc для данной конструкции близко к нулю (на

ЛГ

ЗондК

ЗондР

Rluc

фт ***

шиш

5ЩН « 4.;

1

ZsB^MmsI.

- 4.2 kb

- 3.8 kb

1.7 kb

ffia

~ 4.2 kb ,8kb

SSfS* yy

4s" & J& &

^ <A ^

Рис. 6. Реиортерная система подтверждает, что СПА, вставленные в интрон, функционально заблокированы. Бицистронная система основана на двух люциферазах: Rluc и Flue, расположенных под общим промотором гена actin SC. IRES располагается между двумя люциферазами. Стрелка указывает место вставки СПА вируса SV40 (tSV40) и СПА из генов пор5 (tnop5), eIF6 (teIF6) и yellow (ty). Интрон гена yellow и этот же интрон с СПА ty были клонированы в эту же позицию. Отношение Fluc/Rluc для конструктов показано на гистограмме. Результаты нозерн-блот анализа нетрансфицированных (пус.кл.) и трансфицированимх 82-клеток с пробами к обеим люциферазам подтверждают результаты люциферазного анализа.

гистограмме не показано). Аналогичные значения для конструктов с тестируемыми СПА, свидетельствовали бы об очень высоком уровне активное™ СПА, приводящему к полному отсутствию длинных транскриптов. Значение для базового конструкта (есть IRES перед второй люциферазой) было взято за единицу. Этот контрольный конструкт показывает, как должна выглядеть зависимость между люциферазами при отсутствии терминации на проверяемой последовательности. Все тестируемые СПА увеличивают длину транскрипта, изменяют расстояние между Rluc и IRES. Это может отразиться на отношении продуктов двух репортерных генов. Для проверки такого влияния был заклонирован линкер такой же длины, что и остальные СПА. Как показано на гистограмме, линкерная последовательность не изменила отношение по сравнению с базовой. Все перечисленные выше СПА уменьшали отношение Fluc/Rluc, указывая на то, что транскрипт расщеплялся/полиаденилировался после первой люциферазы (рис. 6). Согласно данным результатам было получено экспериментальное подтверждение того, что исследуемые элементы обладают активностью СПА и функционируют в созданной репортерной системе. По снижению значения отношения Fluc/Rluc можно определить уровень активности СПА. Сильные сигналы должны в большей мере снижать это отношение из-за уменьшения доли длинных бицистронных транскриптов. Для СПА из генов yellow и eIF6 падение в количестве второго белкового продукта приблизительно одинаково. СПА из вируса SV40 оказался сильнее. Самым активным оказался СПА из гена пор5.

14

Для тотальной РНК из клеток, трансфицированных базовой конструкцией и конструкцией с ty, был проведен нозерн-блот анализ. Использовались комплиментарные зонды к двум люциферазам (R и F на рис. 6). Результат анализа подтвердил, что размещение ty в позиции между двумя люциферазами приводит к появлению короткого транскрипта, что детектируется в результате гибридизации с зондом R. Детектируемый продукт, размером S ,7 т.н. соответствует короткому моноцистронному продукту, расщепленному/полиаденилированному на СПА между двумя люциферазами (рис. 6). Для базовой конструкции детектировался продукт размером 3,8 т.н., что соответствует длинному бицистронному транскрипту. Хотя для конструкции с ty активность второй люциферазы детектировалась, продукт длиной 3.8 т.н., обнаруженный для базовой конструкции, не детектировался. По всей видимости, его количества было недостаточно для детекции с помощью нозерн-блот анализа.

3.3 Установление особенностей работы терминатора в интроне гена yellow.

Целью создания второго набора конструкций являлось определение функциональной активности СПА гена yellow Drosophila melanogaster в первом интроне гена yellow. Для этого были созданы вектора с интроном и СПА ty, вставленным в интрон (рис. 7). Двойной

!

Rlue

рАс J Rluc

Рис. 7. Конструкты, для определения особенностей работы СПА в интроне гена. Вверху -конструкт со вставленным интроном перед сайтом внутренней инициации трансляции (контроль). Внизу-СПА расположеп в центре нитрона.

рАс - актиновый промотор. Т - СПА вируса SV40. Rluc - ген Renilla luciferase. Flue - ген Firefly luciferase. rpr - IRES дрозофилиного гена reaper, t - СПА гена yellow.

люциферазный анализ показал, что вставка интрона уменьшила соотношение Fluc/Riuc по

отношению к базовой конструкции (рис. 6). Мы объясняем это наблюдение в изменении

эффективности IRBS-зависимой инициации трансляции, либо из-за увеличения расстояния,

либо из-за присутствия неизвестных элементов: фрагмент с интроном содержал небольшие

фланкирующие участки экзонов. Однако вставка СПА ty в интрон не изменила величину

отношения Fluc/Rluc по сравнению с конструктом с интроном без вставки. Нозерн-блот анализ

для данных конструктов был проведен с зондами к обеим люциферазам (рис. 6). Зонд F,

предназначенный для детекции длинных транскриптов с двумя цистронами, выявил продукты в

15

дорожках с РНК базовой и двух интрон-содержащих конструктов. Длина детектируемой РНК у интрон-содержащих конструктов соответствовала сгшайсированному варианту (4,2 т.н.). Таким образом, для всех трех конструктов - базового и интрон-содержащих - выявлялись бицистронные транскрипты. Стоит отметить, что появление СПА ty внутри интрона никак не отразилось на прохождении сплайсинга - длинных несплайсированных транскриптов также обнаружено не было. Зонд R детектировал всю РНК, синтезируемую с конструктов. Для конструкта с ty детектировалась только короткая форма (1,7 т.н.), что говорит о высокой активности СПА в этой позиции, приводящей к отсутствию длинных форм транскриптов. Для базовой и интрон-содержащих конструктов зонд R выявил только транскрипты такого же размера, что и зонд F. Примечательно, что для конструкта с ty внутри интрона коротких форм транскриптов не детектировалось. Это говорит о том, что вставленный в интрон сигнал полиаденилирования не функционирует в интроне.

Таким образом, показано, что транскрипт расщепляется/полиаденилируется во всех случаях, когда сигнал полиаденилирования располагается в экзонах. СПА, расположенный в интроне гена yellow, не прерывал транскрипцию, и детектировалась только сплайсированная форма.

3.4 Исследование активности инсулятора 1А2 и сигнала полиаденилирования в интроне гена yellow в трансгенных линиях Drosophila melanogaster

Инсуляторами называют регуляторные элементы генома, способные блокировать взаимодействие между энхансерами и промоторами только в том случае, когда находятся между ними. Ранее в лаборатории был обнаружен эндогенный инсулятор (1А2), содержащий два сайта связывания для белка Su(Hw), расположенный на 3-конце гена yellow. Этот инсулятор находится рядом с сигналом полиаденилирования, необходимым для терминации транскрипции гена yellow. Поэтому возможен вариант, когда инсулятор и СПА работают согласованно и усиливают работу друг друга. Одна из моделей действия инсуляторов предполагает, что энхансеры, используя РНК-полимеразу II, продвигаются вдоль цепи ДНК к промотору. При этом инсулятор может ингибировать продвижение РНК-полимеразы вдоль хроматиновой фибриллы и тем самым блокировать активность энхансера. Поэтому решено было проверить, способен ли 1А2-инсулятор усиливать сигнал полиаденилирования гена yellow благодаря потенциальной способности замедлять движение РНК-полимеразы II.

Была проверена способность эндогенного Su(Hw)-3aBHCHMoro инсулятора 1А2 работать в интроне гена yellow и участвовать в терминации транскрипции как самостоятельно, так и в

комбинации с СПА из З'-конца гена yellow (ty). С этой целью была создана конструкция EyeY(Ty,<1A2)W (рис. 8А). Регуляторная область гена yellow содержит три основных энхансера,

алаза тало щетинки

К Кор тОр Ор тЖ Ж Б №Т S 4 5 2 1 H/T S ччу mV 1 NfT

Ey«Y(Ty)(1A2)W 112 4 4 12 3 8 1 12 1 9 2 12

EysY(,\)(1A2|W 1 1 2 4 4 0/12 7 4 1 «12 2 8 2 1/12

EyeY(Ty)(i)VY 3 5 1 3 10/12 3 8 1 0/12 10 1 1 12/12

глаза тело щетиши

К Кор тОр Ор ТЖ Ж Б N/T 5 4 3 2 1 W/T 5 те» mV 1 К/Т EyeYfTy1A2)W 1 5 6 6 18 13 5 1В 1 4 8 5 13

EyeY(i)W 3 10 1 4 17/18 4 14 9(18 17 1 17/18

Рис. 8. Исследование способности 1А2-инсулятора к усилению сигнала полиаденилирования в интроне гена. (А) Схема конструкции EyeY(T>,(bU,W и анализ экспрессии генов white и yellow в траисгенных линиях и их производных. Обозначения: черными квадратами на концах обозначены концы Р-элсмента, необходимые для интеграции конструкции в геном, белые круги - энхансеры yellow (выше промотора -тела и крыльев, в интроне — щетинок), черный пятиугольник - энхансер глаз, черный овал - сигнал полиаденилирования из З'-конца гена yellow, черный прямоугольник с двумя белыми овалами - инсулятор 1А2. Белый и черный прямоугольники - гены yellow и white, соответственно, горизонтальными стрелками указано направление их транскрипции. Вертикальными стрелками отмечены сайты узнавания для Flp- и Сге-рекомбиназ. Сокращения в названиях линий: Еу — энхансеры гена yellow, е - энхансер глаз, Y - ген yellow, W — ген white, элементы Ту и 1А2 заключены в скобки, что означает то, что их можно удалить при помощи сайт-специфической рекомбинации, удаление элемента отмечено символом Л. Фенотипичсское проявление уровня экспрессии гена yellow в последних сегментах брюшка: 1 - отсутствие экспрессии гена yellow, 5 -нормальный уровень экспрессии гена yellow, 2-4 - промежуточные уровни экспрессии гена yellow. Обозначения уровня экспрессии ттл yellow в грудных шетинках и волосках: 1 - все щетинки и волоски желтые; mv - волоски и половина щетинок желтые; wv -волоски и 1-2 щетинки желтые; 5 — нормальный уровень экспрессии, все волоски и щетинки черные. Для гена white представлена степень пигментации глаз: Кр - красный, соответствует нормальному уровню экспрессии гена, Кор - коричневый, тОр — темно-оранжевый, Ор - оранжевый, тЖ - темно-желтый, Ж — желтый, Б — белый. Цифры в строках соответствуют числу линий с соответствующим уровнем экспрессии гена yellow или white. Столбец N/T показывает отношение числа линий, в которых наблюдалось изменение уровня экспрессии гена при удалении исследуемого элемента, к общему числу анализируемых линий.

(Б) Схема конструкции RyeYrlvlA2,\V и анализ экспрессии генов white и yellow в трансгенных линиях и их производных.

которые активируют транскрипцию в теле и крыльях (расположены выше старта транскрипции) и щетинках (находится в интроне гена yellow). Ген white, определяющий пигментацию глаз, был встроен с З'-стороны гена yellow. Активность гена white в глазах определяется энхансером, встроенным в трансгенной конструкции между энхансерами тела и крыльев. В интрон гена yellow, между промотором и энхансером щетииок, были встроены сигнал полиаденилирования гена yellow и 1А2-инсулятор. Таким образом, встроенная последовательность отделяет энхансер, определяющий экспрессию в щетинках, от промотора. Сигнал полиаденилирования был окружен сайтами узнавания fit для дрожжевой Ир-рекомбиназы, что позволяет вырезать данный элемент из трансгенной линии. 1А2-инсулятор был окружен сайтами узнавания 1ох для Сге-рекомбиназы, что позволяет удалять инсулятор из трансгенной линии (рис. 8А).

В результате инъекции конструкции в эмбрионы дрозофилы линии y'w"18 было получено 12 трансгенные линий, содержащих единичную инсерцию конструкции. Трансгенные линии имели пигментированные тело и крылья, что говорит о том, что вставка сигнала полиаденилирования в интроне гена не оказывает значительного влияния на уровень экспрессии гена, регулируемого энхансерами, расположенными в 5'-области гена, выше промотора. Действительно, делеция сигнала полиаденилирования приводила только к слабому усилению пигментации тела и крыльев в 4 из 12 проанализированных трансгенных линий.

Экспрессия гена yellow в щетинках была нарушена значительно сильнее: пигментация щетинок была значительно снижена и носила вариабельный характер. Делеция сигнала полиаденилирования привела к незначительному увеличению уровня пигментации только в 1 из 12 трансгенных линий. Таким образом, сигнал полиаденилирования, расположенный в интроне гена, не влияет на уровень экспрессии данного гена.

Делеция 1А2-инсулятора не изменяла пигментацию тела и крыльев во всех проанализированных 12 трансгенных линиях. Таким образом, 1А2-инсулятор не способен усиливать действие сигнала полиаденилирования и не оказывает влияние на активность энхансеров тела и крыльев, расположенные с 5-стороны от промотора гена yellow. С другой стороны, делеция 1А2-инсулятора привела к полному восстановлению уровня экспрессии гена yellow в щетинках (рис. 8А). Следовательно, инсулятор 1А2 эффективно изолирует энхансер щетинок от промотора гена. 1А2-инсулятор также сохраняет способность частично блокировать энхансер глаз: в 10 из 12 трансгенных линий делеция инсулятора приводила к увеличению пигментации глаз. Таким образом, одна копия 1А2-инсулятора сохраняет свою инсуляторную активность при расположении в интроне транскрибирующегося гена.

Полученные результаты демонстрируют, что комбинация 1 А2-инсулятора и сигнала полиаденилирования не способна эффективно прерывать транскрипцию в интроне гена.

Для исключения варианта, при котором при разделении двух исследуемых элементов и помещении их между 1ох- и frt-сайтами нарушились корректные расстояния между данными регуляторными элементами, была сделана конструкция EyeY(IylA2'W, в которой ДНК-фрагмент, содержащий сигнал полиаденнлирования и инсулятор, был встроен в интрон гена yellow (рис. 8Б). Этот фрагмент был окружен lox-сайтами. В остальном конструкция имеет такое же строение, что

В результате инъекции конструкции в эмбрионы линии y'w1"8 было получено 18 трансгенных линий, содержащих единичную инсерцию конструкции (рис. 8Б). Только в половине трансгенных линий деления ДНК-фрагмента приводила к небольшому увеличению пигментации тела и крыльев. Сходное незначительное влияние на уровень экспрессии гена yellow оказывает один сигнал полиаденнлирования, без 1А2-инсулятора. Следовательно, 1А2-инсулятор не увеличивает эффективность сигнала полиаденилирования, расположенного в интроне гена yellow. Одновременно делеция изучаемого фрагмента привела к значительному увеличению пигментации глаз и щетинок в 17 из исследованных 18 трансгенных линий, что подтверждает способность 1А2-инсулятора блокировать активность энхансеров глаз и щетинок, соответственно, даже в том случае, когда через него идет транскрипция.

Таким образом, полученные данные продемонстрировали, что сигнал полиаденилирования из гена yellow не способен эффективно терминировать транскрипцию, когда находится в нитроне гена, а 5и(Н\у)-зависимый 1А2-инсулятор не способен усиливать эффективность данного сигнала полиаденилирования. Ранее в регуляторной области МДГ4 был найден инсулятор, который состоит из 12 сайтов связывания для белка Su(Hw). Для данного инсулятора было показано, что он, в отличие от 1А2, может усиливать активность терминаторов транскрипции. Такой противоречивый результат можно объяснить тем, что инсулятор из МДГ4 содержит гораздо больше сайтов связывания для белка Su(Hw), что может оказывать существенное влияние в процессе усиления терминации транскрипции. Помимо этого последовательность инсулятора из МДГ4 содержит несколько повторов ААТААА, которые, возможно, в некоторых случаях могут демонстрировать свойства функциональных сигналов полиаденилирования.

В результате было показано, что сигнал полиаденилирования из гена yellow теряет свою активность при размещении его в интроне гена. В то же время размещенный в интроне гена yellow инсулятор не усиливает активность сигнала полиаденилирования.

3.5 Проверка активности СПЛ внутри искусственного интрона.

Интрон гена yellow - длинная последовательность и может содержать неизвестные регуляторные элементы, которые могут влиять на транскрипцию, и ко-траяскршщионные процессы. Поэтому было решено создать искусственный интрон (AI), который не содержит в своем составе каких-либо регуляторных элементов за исключением минимального набора сигналов сплайсинга: донорный сайт, акцепторный сайт, точку ветвления, поли (Т/С) участок. Сигналы сплайсинга подбирались исходя из консенсуса, выведенного при анализе последовательностей интронов Drosophila melanogaster. Фрагмент кодирующей части гена lacZ был использован для разделения сигналов сплайсинга. Суммарная длина исходной последовательности составляла около 200 п.н. В середину исходной последовательности были заклонированы разные СПА или линкерные последовательности, длиной в среднем 300 п.н. Были использованы тестируемые выше последовательности ty, tSV40, tnop5 и teIF6. В качестве контроля сигналы ty, tnop5 и teIF6 были заклонированы в обратной, не функционирующей как СПА, ориентации. В связи с тем, что СПА SV40 работает в обеих ориентациях, линкерная последовательность из гена lacZ эквивалентной ему длины была взята в качестве контроля.

Описанная выше тестовая система была взята за основу. В положение после первой люциферазы, перед IRES, были заклонированы искусственные интроны содержащие сигналы полиаденилирования в обоих ориентациях и линкерная последовательность (рис. 9). Анализ активности люцифераз не выявил значительных отличий между базовой конструкцией и векторами, содержащими СПА в прямой ориентации, конструктами, содержащими СПА в обратной ориентации, и конструкцией с линкером из /acZ (рис. 9). Таким образом, не было обнаружено ни одного случая функционирования СПА в AI, как и в модели с интроном гена yellow и в экспериментах с парами генов в геномных локусах, что еще раз подтвердило наше предположение об отсутствии расщепления/полиаденилирования внутри интронов.

Для подтверждения блокирования расщепления/полиаденилирования только в интронах, мы провели аналогичные эксперименты с конструкциями, содержащими ty и tSV40 внутри AI, но с делегированным донорным сайтом. Как ожидалось, данная деления должна превратить AI в продолжение экзона, а СПА при этом должен начать функционировать. Как показано на рис. 9, отношение Fluc/Rluc в конструктах, содержащих СПА в прямой ориентации, снижается. Следовательно, в отсутствие донорного сайта короткий моноцистронный транскрипт образуется на первом функционирующем СПА. В контрольных конструкциях, с СПА в обратной ориентации, сигналы не работают, что приводит к синтезу длинного бицистронного транскрипта и высокой активности обеих люцифераз. Отличие отношения Fluc/Rluc от базовой

f

fluc/Rk* i

• -i

I.........JL.

*.....Т.................... « |......I

"II ' ,JL. 1 И f 1 ..........Щ- rfTtl Llltlli - I™ ¡р.......... .S. |Г..........Ж.

0 ШЖЖЖЖ!^^

Al Al Й5-СС

Рис 9. Репортериая система подтверждает то, что СПА, вставленные в искусственный интрон (AI), функционально заблокированы. Бицистронная система описана на рис. 6. Стрелка указывает место вставки искусственных интронов с СПА вируса SV40 (tSV40) и СПА из генов nopS (tnop5), eIF6 (teIF6) и yellow (ty) в двух ориентациях. Отношение Fluc/RIuc для конструктов показано на гистограмме. AI — конструкты с полным интроном, AI Д5'СС - с делегированным донорным сайтом.

конструкции, по всей видимости, объясняется изменением эффективности инициации трансляции, в связи с появлением дополнительной последовательности несплайсированного интрона.

Интересно отметить случай описанный в [Langemeier et al., 2012; Langemeier et al., 2013], где мутация приводит к появлению функционального 5'СС выше СПА, а его распознавание компонентом сплайсосомы Ul snRNP вызывает подавление формирования З'-конца.

Таким образом, на системе с искусственным интроном было показано, что СПА не функционируют в интронах. Удаление 5'-сайта сплайсинга приводит к восстановлению функции сигналов полиаденилирования.

4. Использование СПА внутри интронов - редкое явление в геноме и, по всей видимости, является индуцибельным.

Мы установили, что расщепление/полиаденилирование не происходит в интронах, как в локусах генома, так и в плазмидной репортерной системе. Однако, тем не менее, известно, что в случаях, когда альтернативный З'-экзон не включается в транскрипт, транскрипция должна прерываться в интроне (рис. 10Б). Стоит отметить, что вариант с исключением последнего экзона часто решается без полиаденилирования в интроне. Донорный сайт интрона, расположенного перед исключаемым экзоном, сплайсируется на альтернативный акцепторный сайт, сразу после которого идет сигнал полиаденилирования (рис. 10В). Таким образом,

Рис. 10. Схема транскриптов генов с альтернативным формированием З'-конца. А -изоформа, получаемая при сплайсинге. Б - внутри интрона происходит расщепление/полиаденилирование. В - доиориый сайт интрона, сплайсируется на альтернативный акцепторный сайт, сразу после которого идет сигнал полиаденилирования.

появление альтернативного акцепторного сайта перед СПА приводит к эффективному полиаденилированию с исключением экзонов лежащих ниже. Наоборот, игнорирование первого акцепторного сайта приводит к пропуску СПА, как лежащего в интроне, сплайсированию на следующий акцепторный сайт и включению З'-экзонов (рис. 10А).

Поэтому было решено проверить, как часто встречаются случаи, когда транскрипт оканчивается в интроне. Схема поиска изображена на рис. 11. Используя аннотацию генома из

Гены с транскриптами оканчивающимися в интроне: 403

) Не пересекаются с другими генами: 233 ~| ) Пересекаются: 170 |

Два транскрипта: 70 | | >2 транскриптов|

Обе формы: 16

Только сплайсированная изоформа: 20

Нет

сплайсировзнной изоформы: 6

Обе изоформы отсутствуют: 4

Ошибки аннотации или артефакты: 24

Рис. 11. Схема поиска генов с изоформой расщепляемой/полиаденилируемой в интроне.

р1уВазе, мы обнаружили 403 гена, организованных таким образом. Транскрипт считался оканчивающимся в интроне, если его последний экзон начинался выше донорного сайта интрона, в котором он заканчивался. Для анализа паттерна экспрессии изоформ этих генов, мы

использовали данные секвенирования РНК для различных линий клеток и стадий развития, доступные в проекте тосШМСООЕ. Мы исключили 170 генов, которые пересекались с другими генами. Полученные из тосШМССЮЕ данные секвенирования РНК были с неопределенной принадлежностью к тяжу ДНК, поэтому в такой ситуации невозможно определить с какого гена шла транскрипция. Затем мы выбрали 70 генов только с двумя вариантами транскриптов: первый сплайсировался, второй заканчивался в интроне (рис. 11).

Для выбранных генов был определен уровень транскрипции для каждого из двух его транскриптов. Уровень оценивался как соотношение количества прочтений высокопроизводительного секвенирования РНК из специфичного именно для этого транскрипта участка к общей длине этого участка. Уровень сплайсированного транскрипта оценивался как среднее значение плотности чтения для З'-экзона. Уровень терминированной в интроне изоформы был вычислен как разность между средним значением для участка между 5'СС и окончанием транскрипта и средним значением участка между концом транскрипта и З'СС. Вычитание среднего значения для участка между концом транскрипта и З'СС необходимо в качестве поправки на общий фон и несплайсированную РНК (доля ядерной РНК, содержащей несозревшую РНК, в тотальном препарате составляет около 10%). Доля транскрипта, оканчивающегося в интроне, была оценена как отношение его уровня к сумме уровней обоих транскриптов. Там, где сумма уровней обоих транскриптов была близка к нулю, доля не определялась.

Согласно вычисленным уровням и соотношению уровней транскриптов, мы разбили выбранные гены на несколько групп. Первая, наибольшая, группа включала 20 генов, в которых транскрипт, оканчивающийся в интроне, не был детектирован или его уровень был близок к уровню среднего фона. Вполне возможно, что у этой категории генов транскрипты, расщепленные/полиаденилированные в интроне, не синтезируются или синтезируются в очень маленьких количествах. У второй группы, включающей шесть генов, не обнаруживается продукт сплайсинга, что ставит под сомнение наличие альтернативного З'-экзона. Третья группа из 16 генов, обладает обоими изоформами с заметным переключением между ними, что, возможно, является индуцибельным процессом (рис. 12). Уровень каждой изоформы и соотношение между ними изменяется во время развития, или отличается в разных клеточных линиях. Кроме того, мы отобрали группу генов с вероятно ошибочной аннотацией. Наши доводы по такому заключению (такие как не соответствие границ экзонов и покрытия чтениями секвенирования РНК) представлены в приложении диссертации.

Таким образом, наши наблюдения демонстрируют, что СПА функционируют внутри интронов крайне редко. Согласно данным аннотации, только 403 гена, возможно, имеют

.с х: х:

О см

ГВдп0035318 ГВдп0035611 РВдп003587 9 ГВдп0037109 РВдп0037737 РВдп0039965 РВдп0050414 ГВдп0051105 1ГВдп0051314 РВдп005397 8 ГВдп008612 9 РВдп0259166 ГВдп0259209 ГВдп0259678 ГВдп0261823 ГВдп0261834

о о о о

'л 01 <л

1'•!•§■§•§•§•§•§■§•§•§.-.„„ Ы И Ш Ш ц Ы Ы Ш Ы Ш (2 ^

Рис. 12. Тепловая карта, иллюстрирующая паттерны экспрессии двух изоформ для 16 генов в 4 линиях клеток и 30 стадий развития. Для каждого гена верхняя линия соответствует уровню сплайсированнон формы, средняя - для терминированной в интроне, нижняя - отношение уровня транскрипта, терминированного в нитроне, к общей мРНК гена. Цветовая шкала внизу характеризует уровни экспрессии изоформ в величинах плотности прочтения при секвенировании РНК (слева) и долю терминированной в интроне изоформы (справа).

транскрипты, оканчивающиеся в интроне. При этом у 20 из 70 анализированных генов транскрипт, оканчивающийся в интроне, не был детектирован или его уровень был близок к уровню среднего фона, у 6 генов не было продукта сплайсинга, и только 16 генов имели обе изоформы, уровень и отношение которых менялись во время развития или в различных линиях клеток.

ЗАКЛЮЧЕНИЕ

Транскрипция у эукариог - сложный процесс, состоящий из множества этапов. Каждый этап должен осуществляться в строго определенной последовательности, происходить в

24

определенное время транскрипционного цикла. Поэтому должны существовать механизмы, благодаря которым осуществляется сопряжение ко-транскрипционных процессов. В нашем исследовании мы исходили из предположения, что использование неуместных СПА внутри интронов не допускается. Это предположение было выдвинуто в связи с тем, что сигналы полиаденилирования - несложные в своем строении мотивы, и это может приводить к их большой встречаемости в геноме по теории вероятностей. Несвоевременное их функционирование во время транскрипции может приводить к дисфункции гена. Кроме того было показано, что в 5'-нетранслируемых областях СПА заблокированы, что наводит на мысль о существовании механизма блокирования СПА в неподходящем месте. Ранее был описан феномен функционирования скрытых СПА внутри интрона после нокдауна U1 snRNP в клетках культуры HeLa [Kaida et al., 2010]. В данном эксперименте истощение U1 snRNP приводило к тому, что не все интроны оказывались способны ко-транскрипционно определить свои границы, что, по всей видимости, приводило к активации СПА, как если бы они находились внутри экзонов.

В начале нашей работы мы проверили частоту встречаемости СПА в интронах Drosophita melanogaster и обнаружили, что СПА широко представлены в интронах - более 30% от всех интронов. С учетом того факта, что многие гены содержат более одного интрона, можно сказать, что проблема преждевременных СПА характерна для большого их количества. Затем мы обратили внимание на случаи, когда один ген расположен в интроне другого так, что транскрипционный аппарат последнего вынужден проходить преждевременный для него СПА внутреннего гена. Оказалось, что это довольно распространенное явление. Таким образом, можно утверждать, что в геноме очень часто встречаются скрытые СПА, часть из которых является работоспособной только в определенном геномном контексте.

Наши опыты на примере пар вложенный-внешний ген выявили, что такая организация генов не приводит к нарушению работы внешнего гена. При транскрипции внешнего гена СПА вложенного гена, расположенный в интроне, игнорируется. Это было показано при помощи количественной ПЦР и нозерн-блот анализа.

Созданная в работе репортерная система удобна для измерения активности СПА. Она позволяет не только выявить функционирующие сайты, но и количественно оценить силу сигнала, определить отношение количества транскриптов, у которых произошло расщепление/полиаденилирование к общему количеству синтезируемой РНК.

С использованием созданной репортерной системы, была проверена активность СПА в интронах. Нами не было выявлено транскриптов, получаемых при процессинге на СПА в интронах, как с интроном из гена yellow, так и с искусственно синтезированным интроном.

Примечательно, что делеция всего нескольких нуклеотидов донорного сайта сплайсинга в репортерной системе приводит к восстановлению функции СПА.

Блокирование функционирования СПА на примере нитрона гена yellow также было показано на трансгенных линиях Drosophila melanogaster. Анализ полного транскриптома показал, что изоформы, получаемые при использовании СПА внутри интронов, редко экспрессируются у Drosophila melanogaster, а отношение между интрон-терминированной и сплайсированной формами изменяется в процессе развития.

Объединяя наши и ранее полученные данные, мы заключили, что транскрипция в общем случае не прерывается на СПА внутри интронов. Исключения из этого правила редки и указывают на то, что должны быть дополнительные условия для активация СПА внутри интронов. Примечателен тот факт, что среди генов с альтернативным включением З'-экзона, мы обнаружили только 16 генов, экспрессирующих две изоформы транскриптов одновременно, одна - сплайсированная, вторая - процессированная на СПА внутри интрона. По нашему мнению, в данном случае происходит регулируемое переключение между изоформами.

Наблюдаемое явление способствует пониманию логики транскрипции: каждый этап происходит строго в отведенный для него промежуток времени, формирование З'-конца в интроне заблокировано. Однако молекулярные механизмы, ответственные за эту особенность, требуют отдельных исследований.

ВЫВОДЫ

1) Показано, что сигналы полиаденилирования (СПА) широко представлены в интронах генов Drosophila melanogaster. В 30% всех интронов предсказываются СПА. 6% генов (внешние) содержат внутри своих интронов гены, обладающие своими СПА (вложенные).

2) Показано на примере пар «вложенный-внешний ген», что один и тот же СПА функционирует, когда расположен в экзоне, но не в интроне гена.

3) Разработана транзиентная репортерная система для определения активности СПА в культуре клеток S2 Drosophila melanogaster.

4) На примере двух разных интронов доказано, что в транзиентной репортерной системе СПА, размещенные в интронах генов, не функционируют. Удаление 5'-сайта сплайсинга приводит к восстановлению функции сигналов полиаденилирования.

5) Показано, что СПА гена yellow в трансгенных линиях Drosophila melanogaster теряет свою активность при размещении его в интроне гена. Прилегающий к СПА инсулятор не способен усиливать активность сигнала полиаденилирования.

6) Установлено, что в геноме Drosophita melanogaster изоформы транскриптов, оканчивающиеся в интроне, встречаются редко: только 403 гена, возможно, имеют такие формы транскриптов. Только у 16 из 70 проанализированных генов найдены обе изоформы.

СПИСОК РАБОТ, ОПУБЛИКОВАННЫХ ПО ТЕМЕ ДИССЕРТАЦИИ

Статьи в научных журналах

1. М.В. Тихонов. П.Г. Георгиев, О.Г. Максименко. «Конкуренция внутри интронов: Сплайсинг побеждает полиаденилирование посредством общего механизма». Acta Naturae. Том 5, № 4 (19), 2013, С.52-61.

2. М.В. Тихонов, академик П.Г. Георгиев, О.Г. Максименко. «Исследование активности инсулятора 1А2 и сигнала полиаденилирования в интроне гена yellow Drosophila melanogaster». Доклады Академии наук. Том 456, № 2, Май 2014, С. 241-245.

Патенты

1. О. Максименко, М. Тихонов, С. Тощаков, Е. Зарайский, П. Георгиев. Способ идентификации элементов, обладающих способностью терминировать транскрипты. Патент 2476597. Дата приоритета 16.06.2009.

Тезисы конференций

1. Tikhonov М.. Georgiev P., Maksimenko О. "Competition within introns: Splicing wins over polyadenylation via a general mechanism". ESF-EMBO Symposium, "Systems Biology of Drosophila Development". Pultusk, Poland, 2012.

2. Тихонов M. «Блокирование терминации транскрипции в интронах». XIX международная научная конференция студентов, аспирантов и молодых учёных (Ломоносов». Москва, Россия, 2012.

Подписано в печать 10.12.2014г. Бумага офсетная. Печать цифровая. Формат 60x90/16. Усл. печ. л. 1. Заказ № 175. Тираж 100 экз. Типография «КОПИЦЕНТР» 119234, г. Москва, Ломоносовский пр-т, д.20 Тел. 8(495)213-88-17