Бесплатный автореферат и диссертация по биологии на тему
Активность ретроэлементов в нейрональных тканях взрослого организма
ВАК РФ 03.01.03, Молекулярная биология

Автореферат диссертации по теме "Активность ретроэлементов в нейрональных тканях взрослого организма"

Федеральное агентство научных организаций (ФАНО России) Федеральное государственное бюджетное учреждение науки ИНСТИТУТ БИООРГАНИЧЕСКОЙ ХИМИИ им. академиков М.М. Шемякина и Ю.А. Овчинникова Российской академии наук

Курносов Алексей Анатольевич Астивность ретроэлсментов в нейропальных тканях взрослого

организма

специальность — 03.01.03 - молекулярная биология

АВТОРЕФЕРАТ диссертации на соискание учёной степени кандидата биологических наук

на правах рукописи

005570541

Москва - 2015

005570541

Работа выполнена в лаборатории сравнительной и функциональной геномики в Федеральном государственном бюджетном учреждении науки Институт биоорганической химии им. академиков М.М. Шемякина и Ю.А. Овчинникова Российской академии наук (ИБХ РАН).

Научный руководитель:

Мамедов Ильгар Зияддинович, кандидат биологических наук, старший научный сотрудник лаборатории сравнительной и функциональной геномики ИБХ РАН

Официальные оппоненты:

Калмыкова Алла Ивановна, доктор биологических наук, заведующая лабораторией исследования геномных повторов эукариот Федерального государственного бюджетного учреждения науки Институт молекулярной генетики Российской академии наук (ИМГ РАН)

Балановскнй Олег Павлович, доктор биологических наук, заведующий лабораторией геномной географии Федерального государственного бюджетного учреждения науки Институт общей генетики им. Н.И.Вавилова Российской академии наук (ИОГен РАН)

Ведущая организация:

Федеральное государственное бюджетное учреждение науки Институт высшей нервной деятельности и нейрофизиологии Российской академии наук (ИВНД и НФ РАН)

Защита диссертации состоится «30» сентября 2015 года в 10:00 на заседании диссертационного совета Д 002.019.01 при Федеральном государственном бюджетном учреждении науки Институт биоорганической химии им. академиков М.М. Шемякина и Ю.А. Овчинникова Российской академии наук по адресу: 117997, г. Москва, В-437, ул. Миклухо-Маклая, д. 16/10.

С диссертацией можно ознакомиться в библиотеке Института биоорганической химии им. академиков М.М. Шемякина и Ю.А. Овчинникова Российской академии наук и на сайте www.ibch.ru.

Автореферат разослан » 2015 года.

Учёный секретарь

диссертационного совета,

доктор физико-математических наук

В .А. Олейников

Общая характеристика работы

Актуальность проблемы

Почти 50% генома человека состоит из ретроэлементов, которые на протяжении эволюционной истории постепенно увеличивали свое присутствие в геноме эукариотических организмов за счет используемого ими механизма ретротранспозиции. Активность ретроэлементов может быть причиной значительных изменений структуры генома, а появление новых инсерций может приводить к кардинальным изменениям в функционировании расположенных рядом генов. Это делает ретроэлементы одним из факторов, определяющих эволюцию и функционирование генома, регуляцию и экспрессию генов. С одной стороны, инсерции ретроэлементов часто приводят к нарушению работы генов и, как следствие, к появлению генетических заболеваний. С другой стороны, ретроэлементы являются источником, поставляющим геному новые регуляторные последовательности, а их активность может приводить к появлению новых экспрессионно активных копий генов.

Большинство инсерций ретроэлементов, изученных к настоящему времени, возникали вследствие активности ретроэлементов в гаметах, либо в терминальных клетках на ранних стадиях эмбриогенеза. Такие инсерции присутствуют в большинстве клеток организма, передаются по наследству и могут закрепиться в генофонде популяции. В то же время активность ретроэлементов в других клетках организма, как считалось, подавлена с помощью эпигенетических механизмов. Поиск соматических инсерций, присутствующих в небольшом числе клеток, затруднен тем, что концентрация таких инсерций в образцах ДНК крайне мала, а место интеграции в геноме предсказать невозможно. В последние годы стали накапливаться данные, свидетельствующие о том, что количество копий ретроэлементов может увеличиваться в ДНК клеток некоторых областей человеческого мозга. Одновременно с этим, эксперименты на клеточных культурах показали, что ретротранспозиционная активность значительно повышается в момент дифференцировки клеток предшественников нейронов. Это может приводить к возникновению генетической вариабельности нервных клеток, в том числе участвующих в формировании памяти и обучении, а, следовательно, к функциональным различиям между ними . Определение вклада транспозиционной активности ретроэлементов в формирование генетической вариабельности клеток нейрональной ткани представляет актуальную проблему современной молекулярной биологии, связанной с изучением молекулярно-генетических основ функциональной пластичности мозга человека.

Цель и задачи работы

Целью данной работы было сравнительное исследование транспозиционной активности ретроэлементов в геномной ДНК различных отделов головного мозга человека. Для выполнения поставленной цели были сформулированы следующие задачи:

1. Разработка метода полногеномной идентификации соматических инсерций ретроэлементов, относящихся к подсемействам и А!иУа5, основанного на технологиях секвенирования нового поколения.

2. Полногеномная идентификация соматических инсерций ретроэлементов в ДНК, выделенной из образцов тканей четырех отделов мозга (мозжечка, фронтальной коры, субвентрикулярной зоны и зубчатой извилины) и контрольной не-нейрональной ткани (миокарда).

3. Анализ распределения идентифицированных соматических инсерций в исследуемых отделах головного мозга человека..

4. Сравнительный анализ распределения идентифицированных соматических инсерций в геномной ДНК исследуемых образцов тканей.

Научная новизна и практическая ценность работы

Полномасштабное картирование соматических инсерций ретроэлементов путем полного секвенирования генома каждой клетки является слишком дорогой и трудозатратной задачей. В данной работе был создан оригинальный экспериментальный подход к поиску соматических инсерций ретроэлементов, который включает методику приготовления библиотек, обогащенных последовательностями ретроэлементов, и специализированный алгоритм анализа данных секвенирования нового поколения. Разработанный алгоритм анализа данных позволяет среди миллионов последовательностей, которые представляют присутствующие во всех клетках организма копии ретроэлементов, выделять последовательности, представляющие соматические инсерции. Таким образом, в ходе выполнения данной работы создан инструмент, позволяющий получать максимально полную информацию об активности ретроэлементов в ДНК соматических клеток, обходясь относительно небольшими затратами. Данный инструмент может быть использован для исследований активности ретроэлементов в других тканях и других видах организмов в норме и при изучении онкологических заболеваний. Разработанный экспериментальный подход был использован для идентификации нескольких тысяч соматических инсерций ретроэлементов в ДНК, выделенной из образцов тканей нескольких отделов мозга человека. Данные о распределении этих

4

инсерций являются первым прямым доказательством повышенной ретротранспозицнонной активности в зубчатой извилине гиппокампа - единственном отделе мозга, для которого достоверно показано наличие нейрогенеза у взрослых людей. Это позволяет предположить, что в зубчатой извилине происходит формирование популяций нервных клеток, генетически не идентичных другим нейронам, а потому обладающих отличиями на физиологическом уровне, что может влиять на их участие в процессах формирования памяти и обучения.

Исследование распределения соматических инсерций в геноме показало, что гены обогащены инсерциями LIHs по сравнению с межгенными участками. В то же время, инсерции AluYa5 равномерно распределены в геномах клеток всех исследованных областей мозга, кроме зубчатой извилины.

Публикации и апробация работы

По материалам работы опубликовано 2 статьи в рецензируемых научных журналах. Отдельные части диссертации были доложены на конференциях: Structural and Functional Diversity of Genomes, 2012, Брно, Чехия; XXV Международная зимняя молодежная научная школа «Перспективные направления Физико-химической биологии и биотехнологии», 2013 Москва, Россия; 38th FEBS Congress "Mechanisms in Biology", 2013, Санкт-Петербург, Россия.

Объем и структура диссертации

Диссертационная работа изложена на 103 страницах и состоит из введения, обзора литературы, результатов и обсуждения, материалов и методов, выводов, списка сокращений и списка литературы, включающего 130 источников. Диссертация содержит 25 рисунков и 13 таблиц.

Содержание работы

1. Использование метода супрессионной ПЦР для создания полногеномных библиотек фланкирующих последовательностей ретроэлементов

Одной из основных сложностей в геномном картировании ретроэлементов является низкая степень вариабельности их последовательностей. Поэтому как для картирования ранее известных мобильных элементов, так и для определения положения новых инсерций необходимо знание структуры последовательностей, фланкирующих последовательность ретроэлемента. Для получения библиотек фланкирующих последовательностей ретроэлементов (фланков) был модифицирован метод, основанный на супрессионной ПЦР, ранее использовавшийся в нашей лаборатории для поиска полиморфных мобильных элементов.

Геномную ДНК выделяли из четырех образцов нейрональных тканей одного индивида: фронтальной коры, субвентрикулярной зоны бокового желудочка, зубчатой извилины, и мозжечка, а также одной не-нейрональной ткани - миокарда, взятой в качестве контроля. На первом этапе подготовки библиотеки геномная ДНК гвдролизовалась эндонуклеазами рестрикции, узнающими тетрануклеотидные последовательности ДНК (рис. 1 а). Независимое использование двух эндонуклеаз рестрикции (Alul и HaeHI для приготовления библиотек фланкирующих последовательностей LI; Alul и Rsal для приготовления библиотек фланкирующих последовательностей Alu) для каждого из образцов ДНК повышает число фланков, попадающих в библиотеку.

Затем к полученным фрагментам ДНК лигировали олигонуклеотидные адаптеры (рис. 1 а). Перед проведением амплификации З'-концы прошедших лигирование молекул достраивались, что приводило к образованию способных формировать внутримолекулярный дуплекс повторов на концах этих молекул.

Для дополнительного увеличения длины способной к формированию дуплекса

адаптерной части использовалась технология внешнего праймирования. Поэтому на

первом этапе супрессионной ПЦР использовалась комбинация из трех праймеров: 1)

праймера, комплементарного последовательности ретроэлемента, 2) праймера, З'-часть

которого комплементарна 5'-части лигированного адаптера и 3) праймера,

комплементарного 5' части праймера 1. Внутримолекулярный дуплекс, образованный

концами находящихся в реакционной смеси молекул, очень стабилен, вследствие чего

эффективность их амплификации крайне низка Однако, присутствие во внутренней части

6

молекулы сайта отжига ретроэлемент-специфического праймера позволяет ему гибридизоваться, и элонгация этого праймера приводит к разрушению шпилечной структуры и, как следствие, амплификации молекулы (рис. 1 б). В данной работе использовали оригинальный набор праймеров, который позволял селектировать мобильные элементы наиболее ретротранспозиционно-активных групп ЫНэ и А1иУа5. Продукты супрессионной ПЦР служили матрицей для ПЦР с вложенными праймерами (рис. I б), которая была необходима для повышения специфичности.

AluYa5

L1HS

геномная ДНК

а.рестрикция и лигирование адаптеров

>

5'фланк SAlu

SL1 З'фланк [> ■

в. секвенирование на платформе lllumina

'I

супрессия ПЦР

данные секвенирования

Рис. 1. Схема приготовления библиотек фланкирующих последовательностей ретроэлементов. Ретроэлементы и их фрагменты показаны желтыми и зелеными фигурами. Олигонуклеотидные адаптеры показаны красными прямоугольниками. Маленькими вертикальными стрелками показаны сайты рестрикции. Горизонтальными стрелками показаны сайты отжига прагшеров.

Таким образом, были получены библиотеки молекул, содержащие фрагмент ретроэлемента, фланк и остаток супрессионного адаптера. Молекулы ДНК, входящие в библиотеки LI, состояли из З'-концевого фрагмента LI, включающего сигнал полиаденилирования, а также прилегающей к нему последовательности. Молекулы ДНК, входящие в библиотеки Alu, состояли из 5'-концевого фрагмента Alu и прилегающей к нему последовательности.

Полученные библиотеки секвенировали с использованием технологии секвенирования нового поколения Illumina, которая позволяет получать десятки миллионов коротких, но достаточных для однозначного картирования на референсный геном, последовательностей.

2. Бионнформатический анализ данных секвенирования фланкирующих последовательностей ретроэлементов

Из нуклеотидных последовательностей, полученных в ходе секвенирования, отбирали те, которые соответствовали критериям качества сиквенсов: 1. в одном из двух парных сиквенсов должна присутствовать структура концевого фрагмента ретроэлемента; 2. длина фрагмента, прочитанного с высоким качеством должна быть достаточной для однозначного картирования. Нуклеотиды, которые были определены с низкой достоверностью, последовательно отрезались в направлении 3' - 5' от последовательности (рис. 2 б).

Одной из проблем, с которыми сталкиваются исследователи в ходе поиска соматических инсерций ретроэлементов с использованием технологий секвенирования нового поколения, является большое число ложно-положительных результатов. Последовательности, обладающие характеристиками соматических инсерций, но представляющие собой ложно-положительные результаты, возникают в ходе подготовки библиотек. Поскольку число сиквенсов, представляющих истинные соматические инсерции, крайне незначительно, и суммарное число таких инсерций также может быть невелико, ложно-положительные результаты могут существенно исказить выводы исследовательской работы о количестве и свойствах соматических инсерций Большинство таких артефактов возникает на этапе дотирования, когда вместо адаптерного олигонуклеотида к фрагменту, не содержащему последовательность ретроэлемента, лигируется фрагмент, полученный при расщеплении другого участка генома, содержащий ретроэлементную последовательность. При дотировании двух фрагментов ДНК, ни один из которых не является адаптерным олигонуклеотидом, происходит восстановление структуры рестриктного сайта, который служит маркером артефактного происхождения сиквенса. Следовательно, последовательности, содержащие такие рестриктные сайты, исключались из дальнейшего анализа (рис. 2 в).

Рис. 2. Общая схема анализа данных секвенирования библиотек фланкирующих последовательностей ретроэлементов

Перед картированием с 5'-концов сиквенсов были удалены последовательности адаптера (поскольку такая структура отсутствует в геноме, ее наличие мешало бы картированию), а также ретроэлемента.

При работе с библиотеками фланкирующих последовательностей 1Л задача удаления сиквенса ретроэлемента осложнялась тем, что З'-конец ретроэлементов этой группы содержит ро!уА последовательность, длина которой может значительно варьировать. Используемый для отрезания фрагментов Ы ретроэлементов компьютерный алгоритм последовательно удалял из структуры сиквенса нуклеотиды, следующие за сигналом полиаденилирования, и останавливался только когда ро1уА последовательность сменялась последовательностью фланка. После отрезания ро1уА парные сиквенсы разделялись на несколько групп в зависимости от длины информативной части, оставшейся в каждом из сиквенсов (подробно см. рис. 3).

^f ^>NNNNNWNNNNNNNWNN<^ " fs

^АААдТ Isi Iaaaaa^^ h

1 L1

NWNNNWNNNWNNNWWN^^ | St19 I

Pue. 3. Типы пар сиквепсов фланкирующих последовательностей L1 в зависимости от длины ро/уА последовательности. Стрелками обозначены сиквенсы; L1 - последовательность ретроэлемента; АЛА - последовательность polyA; stl9 - последовательность адаптерного нуклеотида; NNN ~ непрочитанный фрагмент ДНК между парньши сиквенсами; значок ножниц обозначает отрезание фрагмента сиквенса перед картированием.

Картирование парных сиквенсов осуществлялось с помощью программы Bowtie 2 (рис. 2 г). На этапе картирования отсекается ещё часть последовательностей, возникших вследствие вероятной химеризации. Пары сиквенсов, представляющие химерные последовательности, картируются на референсный геном на далеком расстоянии друг от друга (т.е. большем, чем максимальная длина молекул, секвенируемых на платформе Illumina), либо дискордантно (т.е. в неправильной ориентации относительно друг друга).

Координаты однозначно картированных, «несмешанных» и конкордантных сиквенсов объединялись в упорядоченные таблицы. В результате наличия в сиквенсах небольших ошибок (однонуклеотидных замен, коротких инсерций и делеций), возникших в ходе секвенирования или пробоподготовки, в таблицах образуются кластеры из расположенных рядом координат, представляющих, на самом деле, одну инсерцию. Координаты, входящие в такой кластер, объединялись в пик, которому присваивалась координата, представленная наибольшим числом сиквенсов (рис. 2 д).

Из полученных списков координат удаляли те, рядом с которыми внутри отрезка длиной 50 н.о. в сторону фланкирующей последовательности в последовательности референсного генома находился сайт, распознаваемый эндонуклеазой рестрикции, с помощью которой готовилась библиотека (рис. 2 е). Таким образом были удалены координаты потенциально химерных последовательностей, которые прошли предыдущие антихимерные фильтры.

Поскольку основной задачей данного исследования является поиск не детектированных ранее инсерций, полученные в ходе анализа координаты аннотировались, и среди них выявлялись те, которые соответствуют известным ретроэлементам. Для этого таблицы

координат пересекались с координатами инсерций, присутствующих в референсном геноме 1^19, а также в базах данных полиморфных ретроэлементов (1ЬШР и РКЕО.

Финальным этапом анализа было выявления среди всех имеющихся координат инсерций тех, которые принадлежали потенциально соматическим инсерциям (рис. 2 ж). Соматические инсерции должны были соответствовать следующим критериям: 1. их координата не должна совпадать с координатой известной ранее инсерции; 2. их координата должна присутствовать в библиотеках, полученных только для одного из исследуемых тканевых образцов; 3. Координата этих инсерций должна быть определена с точностью до одного нуклеотида.

3. Общая характеристика полученных библиотек фланкирующих последовательностей ретроэлементов

Всего в ходе секвенирования библиотек, созданных для пяти используемых в данной работе образцов тканей, было получено 10 709 681 пар сиквенсов фланкирующих последовательностей Ы и 61 213 133 пар сиквенсов фланкирующих последовательностей А1и. Число пар сиквенсов, картированных уникально и дискордантно, составило 6 157 865 для Ы и 51 968 997 для А1и. Всего было найдено 7497 координат, соответствующих критериям потенциальных соматических инсерций, для Ы и 8990 координат для А1и (таблица 1).

Таблица 1. Характеристика библиотек фланкирующих последовательностей ретроэлементов, число потенциальных соматических инссрций в ДНК пяти образцов тканей и их распределение в генаие.

мозжечок фронтальная кора субвентрнкулярная зона латерального желудочка зубчатая извилина миокард

Число высококачественных сиквенсов 2723127 825363 1845367 3435529 1880295

Число конкордантно и однозначно картированных сиквенсов 1567532 470132 1077680 1955533 1 086 988

Число (%) сиквенсов, представляющих потенциальные соматические инсерции 1712 (0.0629) 475 (0.0576) 1161 (0.0629) 3211 (0.0935) 1170 (0.0622)

Число потенциальных соматических инсерций 1651 462 1133 3100 1151

Число (%) соматических инсерций в генах 842 (51.00) 236 (51.08) 584 (51.54) 1558 (50.26) 578 (50.22)

Число (%) соматических инсерций в участках, длиной 5 т.п.н., прилегающих к сайтам начала транскрипции генов 92 (5.57) 31 (6.71) 74 (6.53) 177 (5.71) 62 (5.39)

А1и

Число высококачественных сиквенсов 11978540 11962901 10921385 13339041 13011266

Число конкордантно и однозначно картированных сиквенсов 10197303 10171787 9161508 11358859 11079810

Число (%) сиквенсов, представляющих потенциальные соматические инсерции 1376 (0.0115) 2217 (0.0185) 1353 (0.0124) 3079 (0.0231) 1275 (0.0098)

Число потенциальных соматических инсерций 1317 2138 1308 2984 1243

Число (%) соматических инсерций в генах 623 (47.30) 1028 (48.08) 609 (46.56) 1465 (49.10) 589 (47.39)

Число (%) соматических инсерций в участках, длиной 5 т.п.н., прилегающих к сайтам начала транскрипции генов 67 (5-09) 105 (4.91) 61 (4.66) 105 (3.52) 55 (4.42)

Все найденные потенциальные соматические инсерции были представлены очень небольшим числом сиквенсов (1 - 5), а значит каждая из них была представлена в очень небольшом количестве клеток или даже в одной клетке.

4. Валпдацня потенциальных соматических инсерций ретроэлементов

Часть идентифицированных соматических инсерций (34 LI и 26 Alu) была проверена с использованием независимого метода.

Для вапидации соматических инсерций применялась ПЦР с вложенными праймерами, продукты которой секвенировались по методу Сэнгера. В качестве матрицы использовались продукты первого этапа супрессионной ПЦР. Первая ПЦР проводилась с праймером, комплементарным последовательности ретроэлемента (3-L1HS3 для LI или AY107 для Alu), а второй праймер Flank-out гибридизовался на уникальную последовательность фланка. Для вложенной ПЦР использовали ретроэлемент-специфический праймер (3-L1HS4 для LI или AY98 для Alu) и фланк-специфический праймер Flank-in (рис. 4).

фрагмент ретроэлемента фланкирующая последовательность

Рис. 4. Схема расположения праймеров для валидации соматических инсерций ретроэлементов. Всего было подтверждено существование 15 LI и 17 Alu. Наличие однонуклеотидной замены в первичной структуре одной из инсерций LI, позволило установить, что в последовательности референсного генома hgl9 присутствуют два ретроэлемента, несущих такую же характеристическую замену. Семь из подтвержденных инсерций Alu несли в нуклеотидной последовательности характеристические замены, благодаря которым в референсном геноме hgl9 и базе данных RefSeq были найдены родственные Alu. Среди этих Alu, вероятно, присутствуют мастер-гены детектированных соматических инсерций.

Несмотря на то, что количество молекул, представляющих каждую соматическую инсерцию в исходных образцах геномной ДНК, было, по всей видимости, ничтожно

малым, была предпринята попытка амплификации некоторых валидированных соматических инсерций с использованием исходной геномной ДНК в качестве матрицы. В результате была амплифицирована и секвенирована одна соматическая инсерция Alu, расположенная на хромосоме 13, причем искомый ПЦР-продукт удалось получить только в одной из 12 идентичных реакций. Данный результат является очень редким, если не уникальным, случаем прямого доказательства существования соматических инсерций ретроэлементов в геномной ДНК здоровой ткани человека.

5. Оценка специфичности метода получения библиотек фланкирующих последовательностей ретроэлементов

Методика приготовления библиотек была оптимизирована для амплификации преимущественно ретроэлементов, входящих в наиболее ретротранспозиционно активные группы LIHs и AluYa5. Следовательно, специфичность метода может быть определена как доля однозначно картированных сиквенсов, представляющих мобильные элементы этих групп. На LIHs приходилось 84.27% (рис. 5 а), а на AluYa5 79.05% (рис. 5 б) всех сиквенсов в ДНК-библиотеках.

Часть сиквенсов, координаты которых не аннотированы в референсном геноме, аннотированы как LIHs и AluYa5 в базах данных dbRIP и PRED, что повышает оценку специфичности используемого подхода до 89.2% для LI и 80.37% для Alu. При этом верхняя оценка специфичности будет включать все неаннотированные последовательности, которые с высокой долей вероятности представляют полиморфные LIHs и AluYa5, не охарактеризованные ранее, и составляет 97.51% и 87.88%. для LI и Alu соответственно.

„ 100 #

а 90

I 80

70

2 60

50 40

30 20

10

/ ^ / ^ ^ * * /

Рис. 5. а - доля от общего числа сиквенсов, приходящиеся на различные семейства LI. б - доля от общего числа сиквенсов, приходящиеся на различные семейства Alu. AluYb8/9 -суммарная доля сиквенсов, принадлежащих ретроэлементам подсемейств AluYb8 и AluYb9; NA - доля сиквенсов, представляющих неаннотированные инсерции.

6. Анализ распределения соматических инсерций ретроэлементов в анализируемых образцах тканей

Поскольку число потенциальных соматических инсерций, детектированных в библиотеке, зависит от общего числа сиквенсов, полученных для этой библиотеки, для сравнения библиотек между собой число соматических инсерций предварительно нормализовали на число сиквенсов.

Процент сиквенсов, представляющих соматические инсерции Ы различался между анализируемыми образцами (таблица 1, рис. 6 а). Процент сиквенсов, представляющих соматические инсерции Ы, в ДНК мозжечка, фронтальной коры, субвентрикулярной зоны латерального желудочка и миокарда был весьма сходен (0.0576 - 0.0629%) и был значимо ниже, чем процент соматических инсерций в зубчатой извилине (0.0935%) (рис. 6 а; р<0.0001). Попарное сравнение всех полученных библиотек с помощью теста на принадлежность к распределению Пуассона с одинаковым значением X подтвердило, что частота возникновения соматических инсерций Ы в зубчатой извилине выше, чем во всех остальных тканях мозга и миокарде, при том, что статистически значимые отличия между всеми образцами, кроме зубчатой извилины, отсутствуют (р<0.0001 для зубчатой извилины и р>0.05 для всех остальных библиотек).

Наиболее высокий процент сиквенсов (0.0231%), представляющих соматические инсерции А1и, также как в случае с Ы, наблюдался в зубчатой извилине (таблица 1, рис. 6 б). Однако, достаточно большое количество соматических инсерций было также детектировано во фронтальной коре (0.0185%). Значительно более низкий процент соматических инсерций А1и был детектирован в остальных тканях: мозжечке, субвентрикулярной зоне латерального желудочка и миокарде (0.0115, 0.0124 и 0.0098% соответственно). Тем не менее, попарное сравнение всех образцов с помощью теста на принадлежность к распределению Пуассона с одинаковым значением X показало, что статистически значимы различия не только между зубчатой извилиной и фронтальной корой и другими тканями, но и между всеми остальными образцами. Значимого различия не наблюдалось только в паре мозжечок - субвентрикулярная зона (р=0.0506).

Таким образом, в настоящей работе с использованием глубокого секвенирования впервые прямо показано, что число соматических инсерций ретроэлементов в зубчатой извилине значимо выше, чем в других зонах мозга, а также чем в не-нейрональной ткани (миокарде). Как показано в других исследованиях, активация ретротранспозиционной активности 1Л совпадает с нейрональной дифференцировкой. Принимая это во внимание, можно предположить, что взрыв ретротранспозиционной активности, наблюдаемый в

зубчатой извилине, объясняется наличием в ней большого количества пролиферирующих клеток-предшественников нейронов. Каждая соматическая инсерция ретроэлемента теоретически может изменить профиль экспрессии генов в клетке, следовательно, ретротранспозиционная активность в ходе пролиферации клеток-предшественников может приводить к возникновению субпопуляций нервных клеток, физиологически отличающихся от остальных нейронов зубчатой извилины.

а 6

0.1 0,025

Рис. 6. а - нормализованное количество соматических инсерций /,/ в исследуемых образцах; б -нормализованное количество соматических инсерции Ы в исследуемых образцах

В другой зоне мозга, для которой показан нейрогенез у взрослых млекопитающих, -субвентрикулярной зоне латерального желудочка, однако, повышение ретротранспозиционной активности детектировано не было. Здесь надо заметить, что, согласно ряду исследований, у людей, в отличие от грызунов, нейрогенез в этой зоне начинает затухать по достижении возраста 18 месяцев и у взрослых людей практически отсутствует. Следовательно, различия в количестве соматических инсерций между субвентрикулярной зоной и зубчатой извилиной можно объяснить принципиальной разницей в количестве пролиферирующих клеток-предшественников.

7. Анализ геномного распределения соматических инсерций

Теоретически, ретротранспозиции могут привести к встраиванию новой копии ретроэлемента в любое место в ДНК клетки. На практике можно ожидать, что для данного типа клеток в некоторых локусах вероятность появления новой инсерции выше, чем в других, в силу неоднородности компактизации разных участков хроматина. Более того, можно предположить, что клетки после возникновения в них ретротранспозиций подвергаются отбору, и часть носителей новых инсерций может исчезнуть из популяции, если эти инсерции мешают экспрессии или регуляции генов, важных для нормального функционирования данного типа клеток. Эти два фактора могут приводить к тому, что распределение соматических инсерций ретроэлементов в геноме может отличаться от ожидаемого случайного распределения.

Для того, чтобы выяснить, отличается ли распределение в геноме детектированных соматических инсерций ретроэлементов от случайного, для каждого из экспериментально полученных наборов координат соматических инсерций были сгенерированы по методу Монте-Карло искусственные наборы координат такого же размера, в которых координаты и ориентация инсерций определялись случайно. Компьютерные симуляции были повторены 1000 раз для каждой библиотеки, что позволило оценить разброс данных, который мог бы наблюдаться для инсерций, не характеризующихся предпочтительной локализацией в тех или иных типах геномных последовательностей.

Всего 3798 инсерций инсерций Ы детектировались внутри генов (подавляющее большинство в интронных участках) (таблица 1). Сравнение с данными компьютерных симуляций показало, что во всех исследованных образцах это количество выше предсказанного на основании нуль-гипотезы о случайном распределении инсерций в геноме (р < 0.001; = 0.02; = 0.001; < 0.001; = 0.01 для мозжечка, фронтальной коры, субвентрикулярной зоны, зубчатой извилины и миокарда соответственно; метод Монте-Карло, 1000 симуляций) (рис. 7 а). Еще 436 соматических инсерций Ы были детектированы внутри промоторных участков (областей длиной 5000 п. о., прилегающих к сайту начала транскрипции генов) (таблица 1). Эти значения также оказались значимо выше предсказанных с помощью компьютерных симуляций (р = 0.004; = 0.002; = 0.002; < 0.001; = 0.032 для мозжечка, фронтальной коры, субвентрикулярной зоны, зубчатой извилины и миокарда соответственно; метод Монте-Карло, 1000 симуляций) (рис. 7 б). Доля соматических инсерций 1Л в генах и промоторах очень сходна во всех пяти библиотеках, что подтверждает тестом на избыточную дисперсию, (во всех случаях р > 0.98).

Во всех библиотеках внутри генов было найдено 4314 потенциальных соматических инсерций Alu (таблица 1). Количество этих инсерций не отличалось от предсказанного с помощью компьютерных симуляций для всех образцов, кроме зубчатой извилины, в которой число соматических Alu внутри генов значимо превышало ожидаемое значение (р = 0.013; метод Монте-Карло, 1000 симуляций) (рис. 7 в). В промоторных участках было найдено 393 соматические инсерции Alu. Зубчатая извилина оказалась единственным образцом, в котором наблюдалось значимо меньшее количество инсерций в промоторах, чем в симулированных наборах координат (р = 0.021; метод Монте-Карло, 1000 симуляций) (рис. 7 г). В то же время, применение теста на избыточную дисперсию показало отсутствие значимых различий в доле интеграции Alu в гены и промоторные участки между образцами (во всех случаях р > 0.98).

Вывод о том, что соматические инсерции LI встраиваются с повышенной частотой в гены и промоторные участки на первый взгляд противоречит сделанным ранее другими исследователями наблюдениям, согласно которым LI элементы, напротив, менее представлены в этих участках генома. Это несовпадение может объясняться различиями в механизмах селекции, действующими против взрослых соматических клеток, в которых происходят ретротранспозиции, и клеток зародышевой линии. Если первые, скорее всего, могут быть элиминированы в случае нарушения функционирования экспрессирующихся именно в этих клетках генов, то вторые могут находиться под селектирующим давлением, действующим против всего организма, в чьем генотипе присутствует новая инсерция. Единственным образцом, в котором наблюдаются отличные от предсказанных количества соматических инсерций Alu в генах и промоторах, является зубчатая извилина. Из этого следует, что, в отличие от остальных тканей, в зубчатой извилине наличие в функционально значимых участках генома соматических инсерций Alu является фактором, влияющим на судьбу несущих эти инсерции клеток.

а

1800 „_ 16(50

Ij

>s 1100 s

а. 1200 ш

X 1000 s

§ SOG н

ш 600 т

С 100 о

* 200

Ш предсказанное количество L1 в промоторах Ш детектированное количество L1 в промоторах

Рис. 7. а - количество инсерций LI в генах; б - количество инсерций LI в промоторах; в -количество инсерции Alu в генах; г - количество инсерции Alu в промоторах. Планки погрешностей показывают одно стандартное отклонение.

8. Анализ ориентации соматических инсерций ретроэлементов относительно расположенных рядом генов

Наличие инсерций ретроэлементов в интронах и промоторах генов может влиять на их экспрессию, что делает такие инсерции фактором естественного отбора и, как следствие, определяет частоту встречаемости инсерций в этих областях генома. Функциональные последствия присутствия ретроэлементов определяются также тем, в какой ориентации они находятся относительно направления транскрипции (ориентации) рядом расположенного гена, а потому частота встречаемости одинаково и противоположно ориентированных инсерций не случайна. Однако, исследования частоты встречаемости

Ш предсказанное количество Alu в промоторах Ш детектированное количества Alu ß промоторах

р'-'0.004

одинаково и противоположно ориентированных ретроэлементов сфокусированы, как правило, на инсерциях, присутствующих во всех клетках организма, в то время как в данной работе рассматриваются соматические инсерции, на которые действуют другие механизмы отбора.

В библиотеках, полученных для всех образцов тканей, наблюдалось ярко выраженная тенденция к снижению представленности ориентированных одинаково с генами инсерций Ы в нитронах генов (анализ распределения между библиотеками, полученными для мозга и миокарда: р = 0.9999, тест на избыточную дисперсию; анализ распределения внутри каждой из библиотек, полученных для мозга и миокарда: р < 0.0001 для всех образцов, биномиальный тест). В среднем, ориентация 40.96% Ы совпадала с ориентацией генов, а ориентация 59.05% Ы была противоположна (таблица 2). В то же время, биномиальный тест не выявил никаких значимых различий в представленности одинаково и противоположно ориентированных инсерций в промоторах генов. Более низкая представленность одинаково ориентированных инсерций может объясняться их более сильным негативным эффектом на функционирование клеток, например, за счет возникновения новых сайтов терминации транскрипции внутри рамки считывания генов. Эти данные совпадают с данными, полученными ранее в работах, в которых изучались ретроэлементы, закрепившиеся в популяции, одновременно доказывая возможность негативной селекции новых инсерций ретроэлементов, ориентированных одинаково с генами, в соматических клетках.

В отличие от Ы, соматические инсерции А1и с равной вероятностью находились в одинаковой и противоположенной ориентациях с генами как в нитронах, так и в промоторных областях. Единственным исключением стала зубчатая извилина, для которой в интронах наблюдалось преимущественное встраивание новых инсерций в ориентации, противоположной ориентации расположенных рядом генов (р = 0.032) (таблица 2). Единственным образцом тканей, для которого наблюдаются отклонения от случайного распределения, вновь стала зубчатая извилина. Это является дополнительным подтверждением существования в этой зоне мозга механизмов селекции, действующих на клетки, в ДНК которых присутствуют соматические инсерции А1и ретроэлементов.

Таблица 2. Данные об ориентации соматических инсерций ретроэлементов в интронах и промоторах генов. ФК - фронтальная кора, СВЗ - субеентрикулярная зона, ЗИ - зубчатая извлпина

| мозжечок | ФК | СВЗ | ЗИ | миокард

Ы

количество соматических инсерций в интронах 842 236 584 1558 578

число (%) одинаково ориентированных инсерций 345 (40.97) 97 (41.10) 239 (40.92) 644 (41.34) 234

число (%) противоположно ориентированных инсерций 497 (59.03) 139 (58.90) 345 (59.08) 914 (58.66) 344 (59.52)

количество соматических инсерций в промоторах 92 31 74 177 62

число (%) одинаково ориентированных инсерций 38 (41.30) 20 (64.52) 31 (41.89) 88 (49.72) 34 (54.84)

число (%) противоположно ориентированных инсерций 54 (58.70) 11 (35.48) 43 (58.11) 89 (50.28) 28 (45.16)

А1и

количество соматических инсерций в интронах 623 1028 609 1465 589

число (%) одинаково ориентированных инсерций 323 (51.85) 497 (48.35) 304 (49.92) 691 (47.17) 279 (47.37)

число (%) противоположно ориентированных инсерций 301 (48.15) 531 (51.65) 305 (50.08) 774 (52.83) 310 (52.63)

количество соматических инсерций в промоторах 67 105 61 105 55

число (%) одинаково ориентированных инсерций 29 (43.28) 43 (40.95) 32 (52.46) 45 (42.86) 25 (45.45)

число (%) противоположно ориентированных инсерций 38 (56.72) 62 (59.05) 29 (47.54) 60 (57.14) 30 (54.55)

Выводы

1. Разработан новый экспериментальный подход к идентификации соматических инсерций ретроэлементов, включающий массированное секвенирование специализированных библиотек геномных последовательностей, фланкирующих ретроэлементы, и оригинальный алгоритм анализа данных секвенирования.

2. С использованием разработанного подхода в клетках головного мозга человека впервые идентифицировано 7497 соматических инсерций ЫНэ и 8990 соматических инсерций А1иУа5 элементов.

3. В результате сравнительного анализа представленности идентифицированных инсерций в геномной ДНК клеток различных отделов мозга человека самое большое количество транспозиций ретроэлементов выявлено в зубчатой извилине гиппокампа.

4. Проведен анализ взаимного распределения по геному соматических инсерций ЫШ и известных генов. Показано, что во всех исследованных отделах мозга количество инсерций ЫНэ значимо выше в промоторных областях и шгтронах генов. Установлено, что соматические инсерции 1Л№ ретроэлементов, расположенные в интронах генов, преимущественно имеют ориентацию, совпадающую с направлением транскрипции гена.

5. Проведен анализ взаимного распределения по геному соматических инсерций А1иУа5 и известных генов. Установлено, что из всех исследованных областей мозга только в зубчатой извилине количество соматических инсерций А1иУа5 значимо выше в интронах генов и ниже в промоторных областях.

Диссертационная работа выполнена при поддержке госконтрактом №14.604.21.0118 Список работ, опубликованных по теме диссертации

Статьи

1. Kurnosov A. A., Ustyugova S. V., Nazarov V. I., Minervina A. A., Komkov A. Y., Shugay M., Pogorelyy M. V., Khodosevich К. V., Mamedov I. Z., Lebedev Y. B. The evidence for increased LI activity in the site of human adult brain neurogenesis. PLoS One. 2015; 10(2): eOU7854.

2. А. А. Курносое, С. В. Устюгова, М. В. Погорелый, А. Ю. Комков, Д. А. Болотин, К. В. Ходосевич, И. 3. Мамедов, Ю. Б. Лебедев. Стратегия поиска соматических инсерций ретроэлементов в геноме человека. Биоорг. химия. 2013;39(4): 466-76.

Тезисы докладов на конференциях

1. A. Kurnosov, S. Ustyugova, М. Pogorely, К. Khodosevich, М. Shugay, D. Bolotin, I. Mamedov and Y. Lebedev. Whole-genome identification of somatic retroelement insertions in human brain tissues. FEBS Congress "Mechanisms in Biology", 2013, Saint Petersburg, Russia. FEBS Journal 2013;280 (Suppl. 1): 6.

2. Курносов А. А., Погорелый MB., Шугай M. А., Мамедов И. 3., Лебедев Ю.Б. Ретроэлементы и вариабельность генома человека. XXV Международная зимняя молодежная научная школа «Перспективные направления Физико-химической биологии и биотехнологии», 2013, Москва, Россия. Том 1. Тезисы докладов и стендовых сообщений, стр. 30.

3. Курносов А. А., Погорелый М.В., Шугай М. А., Мамедов И. 3., Лебедев Ю.Б. Полногеномный поиск соматических инсерций Alu ретротранспозонов. XXV Международная зимняя молодежная научная школа «Перспективные направления Физико-химической биологии и биотехнологии», 2013, Москва, Россия. Том 2. Конкурс молодых ученых. Тезисы докладов, стр. 21.

4. Alexey A. Kurnosov, Svetlana V. Ustyugova, Konstantin V. Khodosevich, Mikhail A. Shugay, Dmitrij A. Bolotin, Ilgar Z. Mamedov, Yuri B. Lebedev. Identification of new retroelement insertions in the human genome. Structural and Functional Diversity of Genomes, 2012, Brno, Czech Republic. Book of abstracts, p. 39.

5. I.Z. Mamedov, A.A. Kurnosov, S.V. Ustyugova, D.A. Shagin, Y.B. Lebedev. A new set of

markers for human identification based on 32 polymorphic Alu insertions. Genomic Impact of

Eukaryotic Transposable Elements. 2012, Asilomar. Book of abstracts, p. 136.

24

Подписано в печать:

30.06.2015

Заказ № 10806 Тираж - 100 экз. Печать трафаретная. Типография «11-й ФОРМАТ» ИНН 7726330900 115230, Москва, Варшавское ш., 36 (499) 788-78-56 www.autoreferat.ru