Бесплатный автореферат и диссертация по биологии на тему
Разработка системы функциональных молекулярно-генетических маркеров на основе инсерций ALU-ретроэлементов
ВАК РФ 03.01.06, Биотехнология (в том числе бионанотехнологии)

Автореферат диссертации по теме "Разработка системы функциональных молекулярно-генетических маркеров на основе инсерций ALU-ретроэлементов"

005010883

КОМКОВ АЛЕКСАНДР ЮРЬЕВИЧ

РАЗРАБОТКА СИСТЕМЫ ФУНКЦИОНАЛЬНЫХ МОЛЕКУЛЯРНО-ГЕНЕТИЧЕСКИХ МАРКЕРОВ НА ОСНОВЕ ИНСЕРЦИЙ АЬи-РЕТРОЭЛЕМЕНТОВ

03.01.06 Биотехнология (в том числе бионанотехнологии)

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата химических наук

- 1 М к?

МОСКВА-2012

005010883

Работа выполнена на кафедре биотехнологии и бионанотехнологии Московского государственного университета тонких химических технологий имени М. В. Ломоносова и в Лаборатории сравнительной и функциональной геномики Учреждения Российской академии наук Института биоорганической химии имени академиков М. М. Шемякина и

Ю. А. Овчинникова РАН

Научный руководитель:

академик РАМН, доктор химических наук, Швец Виталий Иванович

профессор

Официальные оппоненты:

член-корреспондент РАН, Костров Сергей Викторович

доктор химических наук, профессор

доктор биологических наук, профессор Брага Элеонора Александровна

Ведущая организация: Центр «Биоинженерия» РАН

Диссертационного Совета Д 212.120.01 при Московском государственном университете тонких химических технологий им. М. В. Ломоносова по адресу: 119571, Москва, проспект Вернадского, д. 86.

С диссертацией можно ознакомиться в библиотеке МИТХТ им. М.В. Ломоносова (119571, Москва, проспект Вернадского, д. 86). С авторефератом диссертации можно ознакомиться на сайте www.mon.gov.ru

Автореферат разослан « » февраля 2012 г.

Ученый секретарь Диссертационного Совета, кандидат химических наук,

Защита диссертации состоится « марта 2012 г. в 15 ч 00 мин на заседании

старший научный сотрудник

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ 1 Актуальность проблемы. Одной из важнейших задач, стоящих перед современной функциональной геномикой, является поиск молекулярно-генетических факторов, вовлеченных в формирование различных комплексных фенотипов, проявляющихся при нормальных и особенно при патологичных состояниях организма. Наиболее остро стоит вопрос о молекулярных механизмах и факторах, лежащих в основе возникновения и развития социально значимых многофакторных и мультигенных заболеваний. Типичными представителями таковых являются патологии онкологического профиля.

Согласно современным представлениям, опухолевая трансформация клеток происходит в результате ступенчатого процесса накопления и отбора соматических мутаций. Часть мутаций, не являющихся нейтральными, приводит к активации генов позитивного контроля клеточного деления (онкогенов) и инактивации генов негативного контроля (онкосупрессоров). Такие мутации дают опухолевому клону пролиферативное преимущество перед клетками-предшественниками и соседними здоровыми клетками. В результате происходит бесконтрольный рост и формирование опухолевой ткани, имеющей гетерогенную структуру с одним или несколькими доминирующими клонами. Несмотря на то, что ведущая роль в малигнизации клеток принадлежит соматическим мутациям, некоторые существующие в популяции аллели онко-значимых генов и их сочетания могут являться факторами предрасположенности к развитию новообразования и иметь прогностическое значение, оказывая влияние на различные стадии патогенеза и определяя, таким образом, путь дальнейшего развития опухоли.

Инсерции ретроэлементов, благодаря сохраняющейся ретропозиционной активности, являются богатым источником новых аллелей генов и одновременно одной из причин возникновения соматического мозаицизма. Инсерционный полиморфизм ретроэлементов считается одним из важнейших факторов вариабельности генома.

Наиболее многочисленной группой ретроэлементов в геноме человека является семейство Alu-повторов. Из более миллиона копий Alu-элементов около 2000 представляют собой полиморфные инсерции. Известно 25 de «ovo-инсерций Alu, участвующих в развитии различных генетических заболеваний. Интеграции в кодирующие области генов разрушают экзоны и приводят к сдвигу рамки считывания. Подобные инсерции являются причинами возникновения болезни Дента, гемофилии А, наблюдаются при некоторых семейных случаях рака яичников и рака молочной железы. Ряд интронных инсерций может при созревании транскрипта вызывать пропуск близлежащего экзона, в том числе со сдвигом рамки считывания. С этим явлением связана причина развития синдрома Аперта и нейрофиброматоза. Последовательности Alu-элементов являются сайтами гомологичных рекомбинаций, которые нередко приводят к появлению протяженных делеций, способных захватывать один или несколько экзонов, нарушая целостность генов. Подобные делеции наблюдаются при

1 В руководстве работой и подготовке ее к защите принимал участие заведующий Лабораторией сравнительной и функциональной геномики ИБХ РАН, д.б.н. Лебедев Ю. Б.

Список сокращений: МГМ - молекулярко-генетические маркеры; ОЛЛ - острый лимфобласгный лейкоз; ПЦР -полимеразная цепная реакция; ОТ - обратная транскрипция; SNP - однонукгсеотидные полиморфные замены. .<'

3 ,

\

таких заболеваниях, как наследственная копропорфирия и дефицит фактора V свертывания крови. Инсерции в интроны и З'-нетранслируемые области способны менять профили экспрессии соответствующих генов.

Имеются косвенные данные в пользу участия Alu-элементов в опухолевом патогенезе. Показано, что плотность инсерций Alu в известных онкосупрессорах значительно выше, чем в протоонкогенах. Кроме того, при многих онкологических заболеваниях инсерции Alu-элементов оказываются деметилированы. В некоторых случаях это приводит к повышению уровня транскрипции Alu-элементов, что, в свою очередь, может способствовать увеличению частоты соматических ретропозиций Alu.

Ретропозиционная активность, способность модулировать экспрессию генов, а также вовлеченность в процесс опухолевого патогенеза делает «мастер-гены» и некоторые полиморфные инсерции Alu-элементов подходящими объектами для создания на их основе тест-систем для диагностики предрасположенности к онкологическим заболеваниям, прогноза их развития и выбора адекватной терапии. Кроме того, возможности полиморфных Alu-маркеров в области идентификации личности позволяют в перспективе создать представительный набор функциональных молекулярно-генетических маркеров, одновременно являющийся генетическим паспортом пациента. Это является важным шагом в направлении развития персонифицированной медицины.

Актуальной задачей молекулярной биотехнологии в таком контексте становится создание надежной, информативной и методически доступной системы функциональных молекулярно-генетических маркеров, применимой в медицинской практике.

Работа выполнена при финансовой поддержке и в рамках ФЦП «Научные и научно-педогогические кадры инновационной России» на 2009-2013 гг. (государственный контракт № 14.740.11.0120), грантов Программы Президиума РАН «Фундаментальные науки - медицине» и РФФИ 11-04-01159а.

Целью работы является создание системы молекулярно-генетических маркеров на основе полиморфных инсерций Alu-элементов для диагностики риска развития острого лимфобластного лейкоза.

Экспериментальные задачи, решаемые для достижения поставленной цели:

• разработка биоинформатического алгоритма для идентификации ретропозиционно активных инсерций Alu-ретроэлементов;

• биоинформатический поиск полиморфных инсерций Alu-ретроэлементов в интронах генов человека, продукты которых могут являться потенциальными участниками малигнизации кроветворных клеток;

• создание системы ПЦР-адаптированных маркеров на основе выбранных инсерций Alu-элементов и сравнительное генотипирование образцов геномной ДНК здоровых доноров и пациентов с острым лимфобластным лейкозом;

• сравнительный анализ транскрипции аллельных пар генов в образцах, гетерозиготных по инсерциям Alu-ретроэлементов на уровне первичных транскриптов.

Научная новизна работы. В ходе исследования разработан оригинальный алгоритм для поиска ретропозиционно активных инсерций Alu-элементов, являющихся

4

источником новых наследуемых и соматических инсерций Alu. С помощью данного алгоритма впервые идентифицированы человек-специфичные инсерции «мастер-генов», относящихся к наиболее активно амплифицирующимся семействам AluYa5 и AluYb8.

Подтверждено полиморфное состояние 22 инсерций Alu, впервые определены частоты их встречаемости в популяциях человека. Показан ингибиторный эффект инсерций Alu на транскрипцию генов в нормальных и опухолевых клетках крови.

Впервые показана ассоциация пяти инсерций Alu-элементов с острым лимфобластным лейкозом.

Практической ценностью обладает уникальный набор из 31 молекулярно-генетического маркера на основе полиморфных инсерций Alu. Предлагаемый набор адаптирован для задач по идентификации личности, популяционных и медико-биологических исследований. 10 маркеров на основе инсерций, имеющих выраженный ингибиторный эффект на транскрипцию генов, применимы в исследованиях патологий кроветворной системы. Пять маркеров могут быть использованы для диагностики предрасположенности к острому лимфобластному лейкозу.

Основные положения, выносимые на защиту:

1. Создание набора МГМ на основе инсерций Alu-ретроэлементов;

2. Сравнительное генотипирование ДНК здоровых доноров и доноров с OJIJI;

3. Функциональный анализ Alu-ретроэлементов в лимфоидных клетках.

Апробация работы. Основные результаты работы были доложены на V съезде Вавиловского общества генетиков и селекционеров (Москва, 2009), Московской международной научно-практической конференции «Биотехнология: экология крупных городов» (Москва, 2010) и Международной конференции «Проблемы популяционной и общей генетики» (Москва, 2011).

Публикации. По материалам диссертационной работы опубликовано 3 статьи в рецензируемых журналах, тезисы к 6 научным конференциям.

Структура диссертации. Диссертация изложена на 126 листах машинописного текста, состоит из обзора литературы, результатов и их обсуждения, экспериментальной части, выводов и списка литературы с 270 ссылками; содержит 21 таблицу, 30 рисунков.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ I. Разработка биоинформатического алгоритма для идентификации ретропозиционно активных копий Alu-ретроэлементов.

Согласно современным представлениям, распространение Alu-элементов по геному происходит за счет небольшого числа ретропозиционно активных копий или «мастер-генов». В ходе эволюции одни «мастер-гены» сменялись другими, что привело к возникновению нескольких семейств инсерций Alu. В контексте поиска источников соматического мозаицизма и инсерций de novo интерес представляют, прежде всего, «мастер-гены», чьи копии продолжают распространяться по геному в настоящее время. Ранее были предложены подходы, позволяющие идентифицировать лишь нуклеотидные последовательности «мастер-генов». В данной части работы рассматривается алгоритм,

5

разработанный для биоинформатической идентификации инсерций Alu, которые могут рассматриваться в качестве современных «мастер-генов».

Минимальными требованиями, предъявляемыми к структурам «мастер-генов», являются нативность внутреннего промотора РНК полимеразы III и наличие достаточно протяженного ро1у(А)-участка, обеспечивающего эффективное связывание с обратной транскриптазой. Свидетельством эволюционно недавней ретропозиционной активности Alu-элементов является существование видоспецифичных копий Alu. Наибольшее число инсерций Alu, специфичных для генома человека, найдено среди подсемейств AluY: Уа5, Yb8, Yb9. На присутствие активного «мастер-гена» в составе каждого из этих подсемейств указывает наличие рассеянной в геноме группы идентичных копий, часть из которых представляет полиморфные или de novo инсерции. Одна или несколько инсерций в составе таких групп и является «мастер-геном».

Имеется несколько возможных путей появления в геноме новой группы инсерций, отличающихся от существующих по нуклеотидной последовательности. Для поиска инсерций «мастер-генов» больший интерес представляет путь, предполагающий сохранение ретропозиционной активности структурно измененных аллелей предсуществующей инсерции «мастер-гена». В диплоидном геноме фиксированную инсерцию ретропозиционно активного ретроэлемента можно рассматривать как биаллельный вариант «мастер-гена». Изменение нуклеотидной последовательности «мастер-гена» начинается с появления замены в одном из его аллелей. Мутированный аллель либо закрепляется в популяции, либо из нее элиминируется. В период сосуществования в популяции обоих аллелей мутация, отличающая их нуклеотидные последовательности, интерпретируется как SNP (однонуклеотидная полиморфная замена). Если эта замена не затрагивает функционально значимые участки последовательности «мастер-гена», соответствующий ей аллель останется ретропозиционно активным, и в одной точке генома будут существовать два (или более) структурно отличающихся аллеля «мастер-гена», каждый из которых будет источником новых копий Alu-элементов в геноме. Для идентификации инсерций «мастер-генов», представленых в популяции более чем одним ретропозиционно активным аллелем и имеющих некоторое число «дочерних» копий в геноме, и предназначен описываемый алгоритм (рис. 1).

Инсерции Alu-элементов, рассматриваемые в качестве потенциальных «мастер-генов», должны удовлетворять следующим основным критериям: принадлежать к подсемействам Alu, имеющим человек-специфичные инсерций; входить в состав групп структурно эквивалентных Alu-элементов, часть из которых представлена полиморфными элементами; должны иметь аллели, совпадающие по структуре с элементами некоторых анализируемых групп, и не должны иметь аллелей с уникальной последовательностью.

I ЭТАП

II ЭТАП

ГЕНОМНЫЙ БРАУЗЕР UCSC GRCH37/HG19

выбор целевых подсемейств alu (repeat masker)

вхсяные fiahtibif (аш): + координаты ucsc + последовательность

нуклеотидов + ориентация + полиморфные

V

► ^ ДНЫ I

Alu Ya5 Yb8 : Yb8"

. . МХвсе) : 3858 321

N (диморфные) 317 46

(2)

множественное выравнивание последовательностей нуклеотидов (MUSCLE)

V

(3)

удаление 3'-poly(A) из последовательностей нуклеотидов

(4)

удаление неполноразм0>ных элементов

■ • 1

Alu Ya5 Yb8 Yb9

m (все) 2279 1641

- L, n.o. 281 'гее :

(5)

г руппировка элементов массива в кластеры с идентичными НП

(6)

Удаление кластеров, не содержащих полиморфных элементов

...... ■■

Alu Ya5 Yb8 Yo9

610 57

N КЛАСТЕРОВ 183 SlÉtt

ЦЕЛЕВОЙ МАССИВ 4.

CTD

(10)

Картирование SNP внутри нуклЕотдаых

ПОСЛВДОаАТЕЛЬНОСТЕЙ элементов массива

f dbSNP j ^ ;Bujld 132 у

входные данные (SNP): +координаты ucsc +порядковый номер +аллели

+частоты аллелей +ори6нтация

V

МАССИВ ЭЛЕМЕНТОВ С SNP 1

ЧАРАКТ6РИСТИЧЕСКИЕ ОТЛИЧИЯ НУКЛЕОТИДОВ в -■W V

; Ч! ' . ' .4' . ' . ' M

А

(8)

кластеры с полиморфными элементами

О)

j I Удаление кластеров с размером n<3

"цатшой массива"

Построение кластерных

СЕТЕЙ (network)

(7)

Alu N(ece)

Ya5 662

Yb8 Yb9 4," W

r-j)

II ЭТАП

(11)

выбор из кластеров элементов с SNP в характеристических позициях

Alu Ya5 YbS YbS

M (ALU) 126 59 2

N (SNP) 149 72 2.

(12)

удаление элементов ,с дополнительными SNP вне характеристических позиций

Alu Ys5 Yb8

N (ALU) ' 46 1Ш8

ЯЯ 53 15

КБ

Yb9

¡■¡и! 2 ■

п (13)

i удаление элементов | с эыр в одинаковых \7 характеристических позициях

М , 1

_и 1-1 ,1__14_ г

П (14)

i верификация нуклеотидов в ^ i характеристических позициях v кластеров и бмр

Alu

МАС1Е.Р-ГГНЫ ~Va5~ *Yb8 "

Рисунок 1. Алгоритм поиска «мастер-генов». А/ - количество; L - длина последовательности; (1) -(14) - последовательность пошаговых преобразований массива данных; НП - нуклеотидная последовательность.

Стратегия поиска инсерций «мастер-генов» заключается в последовательном уменьшении массива данных (каждый элемент массива содержит информацию об одной инсерции Alu) за счет удаления групп элементов массива, которые с большой долей вероятности не содержат искомые «мастер-гены».

Алгоритм поиска разбивается на два основных этапа (рис. 1). Первый этап заключается в идентификации нуклеотидных последовательностей «мастер-генов» и

7

формировании кластеров структурно идентичных элементов, содержащих полиморфные элементы. Второй этап представляет собой поиск аллелей Alu-элементов, включенных в состав кластеров, и сравнение структур аллелей потенциальных «мастер-генов» и их вероятных копий. Вывод о принадлежности Alu-элемента к «мастер-генам» делали при наличии у анализируемой инсерции двух или более аллелей, последовательности которых совпадают с таковыми присутствующих в геноме копий Alu, при условии отсутствий инсерций с таким же набором аллелей.

На первом этапе анализа были выбраны подсемейства AluYa5, AluYb8 и AluYb9, включающие наибольшее число человек-специфичных инсерций. Элементы, относимые к этим подсемействам, были отсортированы по их нуклеотидным последовательностям. Из массива групп полноразмерных элементов, были удалены группы, не содержащие полиморфных элементов. Из числа элементов оставшихся групп были построены диаграммы кластерных сетей (рис. 2). В узлах таких диаграмм находятся группы копий (кластеры) Alu-элементов, имеющих идентичные нуклеотидные последовательности, либо единичные копии Alu. Такие диаграммы графически отображают взаимосвязь групп элементов, входящих в состав семейств и подсемейств Alu и их тонкие структурные отличия.

AluYa5 ' • AluYb8

/ \ \ """.......а

/ \ '•»...........-—..........

1 мутация

Рисунок 2. Диаграммы кластерных сетей (Median-Joining Network) молодых семейств Alu. Серые круги - кластеры Alu, диаметр круга пропорционален размеру кластера. Черные точки - А1и-повторы с уникальной нуклеотидной последовательностью. Показаны кластеры, включающие не менее одной полиморфной инсерции.

На втором этапе поиск «мастер-генов» осуществлялся среди элементов кластеров, имеющих в своем составе не менее трех элементов. По базе данных dbSNP были выявлены SNP, картированные внутри нуклеотидных последовательностей анализируемых Alu-элементов. В каждой из пар ближайших по нуклеотидным

последовательностям кластеров были выбраны Alu-элементы с SNP в позициях, совпадающих с диагностическими позициями кластеров. Из нового массива Alu-элементов были удалены те, в чьих последовательностях картированы дополнительные SNP, позициям которых не соответствовала ни одна из диагностических позиций существующих кластеров. Среди структурно идентичных кандидатных «мастер-генов» с SNP в одинаковых позициях выявить наиболее вероятный «мастер-ген» не представляется возможным, поэтому такие элементы из анализа исключались. Выбирались только уникальные сочетания последовательности Alu и SNP. В результате было отобрано 12 элементов, удовлетворяющих выставленным критериям поиска «мастер-генов». Таким образом, в ходе анализа было идентифицировано 6 потенциальных «мастер-генов» из семейства AluYa5, 6 из семейства AluYb8. Среди инсерций семейства AluYb9 поиск «мастер-генов» с использованием предложенного алгоритма результатов не дал.

ИНСЕРЦИЯ "МАСТЕР-ГЕНА"

аллель 1_

—Г>ЯИММмм1>-

. ___ . аллель 2

—&ojhoi а>-

поиск аллелей "мастер-гена" i

—0СШЕИ1'

—brm-t'»aaaaf>—

—ЫЗШУ —ыj уь£. шрмаь—

Рисунок 3. Поиск «мастер-генов» по известным аллелям. Черные прямоугольники - инсерции Alu, треугольники - сайты интеграции Alu, белые звездочки - однонуклеотидные замены; серые круги - кластеры Alu-элементов с идентичными

нуклеотидными последовательностями (согласно рис. 2).

Интересно отметить, что идентифицированные «мастер-гены» локализованы как в интронах генов, так и в межгенных областях и относятся к наиболее многочисленным группам Alu-элементов соответствующих подсемейств. Однонуклеотидные замены в последовательностях инсерций «мастер-генов» не затрагивают функционально значимые участки Alu и не должны оказывать влияния на ретропозиционную способность соответствующего аллеля «мастер-гена». Длина ро1у(А)-участка в среднем 22 нуклеотида. Учитывая, что максимум ретропозиционной активности приходится на Alu-элементы с ро1у(А)-участком длиной около 50 нуклеотидов, а Alu-элементы без poly(A)-участка в ретропозиции не участвуют, ретропозиционная активность идентифицированных «мастер-генов» должна находиться в области средних значений. Следствием этого должен быть нейтральный характер инсерций «мастер-генов», что позволило большинству из них фиксироваться в популяции. Тем не менее, повышение уровня транскрипции «мастер-генов» при некоторых патологиях может приводить к увеличению частоты ретропозиций. В таких случаях изменение уровня транскрипции

«мастер-гена» относительно нормы может являться одним из диагностических показателей возникшего заболевания.

Таблица 1. Идентифицированные «мастер-гены».

Alu Координаты UCSC (GRCh37/hg19) Локуе Ближаиший ген SNP Аллгли Частота аллелей

Yd5 ,72 6q23.2 37 т п n Г/ ref12393280 T199C 0.50|0.50

Ya5 ehrBrl 27202492-127202801 8q24.13 752r.no. до TRIB1 rsiOO93372 G98Ä 0; 75)0.25

Ya5 chr6:56576608-56576904 6p12.1 Внутри DST rs34255101 T174C 0.50|0.50

Ya5 chr8:70753546-70753852 8q13.3 6 т.ч.с. 0с SLCQ6A1 rs13266545 T89C 0.67|0,33

Ya5 chr4:123299160-123299469 4q27 650 п.о. do ADAD1 rs10031286 G237C 0.50)0.50

Ya5 chr13:45523335-45523635 13q14.12 Внутри NUFIP1 rs112313525 T79C 0.50)0.50

Yb8 chr21:39092996-39093309 21q22.13 Внутри KCNJ6 rs56329555 T259C 0.50)0.50

Yb8 chr2:188239718-188240025 2q32 1 Внутри CALCRL rs4482438 T92C 0.33)0.67

Yb8 chr6:38326546-38326846 6p21.2 Внутри BTBD9 rs13206261 T268C 0.67(0.33

Yb8 Chr6:102311731-102312039 6q16.3 Внутри GRIK2 rs6914919 T144C 0.33)0.67

Yb8* chrl 3:70861683-70861997 13q21.33 179 т.п.о. do KLHL1 rs111232413 G211A 0.50)0.50

Yb8 chr3 90033878-90034191 3p11:1 503 т.п.о. öo ЕРНАЗ rs!12263293 T230C 0,50)0.50

Обозначения: «UCSC» - геномный браузер itittp://qenome.ucsc.edu/).' «rs» {'reference SNP) -идентификационный номер по базе данных dbSNP; цифра в обозначении аллелей - положение SNP относительно начала Alu-повтора; * - полиморфная инсерция.

Для проверки возможности идентифицированных «мастер-генов» выступать в качестве источника соматического мозаицизма при остром лимфобластном лейкозе была разработана система для анализа транскрипции одного из «мастер-генов» семейства AluYa5. Объектом анализа был выбран «мастер-ген» в локусе 6q23.2 (табл. 1). В качестве контроля была использована инсерция с идентичной структурой, не являющаяся «мастер-геном», локализованная вне известных генов.

Рисунок 4. Анализ транскрипции «мастер-гена», (а) -

схема ОТ-ПЦР. Черные прямоугольники - инсерция Alu и ее фрагменты, белые звездочки - уникальные замены, соответствующие З'-концевым нуклеотидам праймеров, надписи в овалах сверху - номера этих позиций относительно первого нуклеотида Alu и символы соответствующих нуклеотидов; белый треугольник -сайт интеграции Alu; серые горизонтальные стрелки -положения праймеров, (б) - электрофореграммы продуктов ОТ-ПЦР. Обозначения дорожек: М - маркер длин ДНК 100 п.о. (Сибэнзим, Россия); кДНК - продукты амплификации фрагментов кДНК; ДНК - продукты амплификации фрагментов геномной ДНК; Н20 -отрицательный контроль; 8b, 12Ь, 9Ь - номера образцов ОЛЛ (даны по табл. 2); стрелками слева показаны длины фрагментов ДНК из некоторых полос маркера; черными треугольниками справа показаны положения ожидаемых продуктов амплификации; вертикальная стрелка указывает на полосу, соответствующую продукту амплификации кДНК транскрипта анализируемого Alu-элемента; MG-267 - анализируемый «мастер-ген» (координаты UCSC: chr6:134453267-134453572); MG-973 - «контрольная» инсерция Alu (координаты UCSC: chr3; 137477973-137478273).

Анализ проводили методом ОТ-ПЦР. Амплификацию кДНК осуществляли при помощи стратегии nested ПЦР с двумя парами праймеров (рис. 4). В ходе ОТ-ПЦР была показана способность рассматриваемой копии Alu-повтора транскрибироваться в

10

кДНК транскрипта "мастер-гена"

|АА/ф-

АУ fori AY for2 MG rev2 MfTrevI

1-й раунд ПЦР j L AY fori f MG rsv1

|AAAA>~

AY for2 MG rev2

2-й раунд ПЦрП ay for2 / MG r«v2

: AY farZ MG rev2

¿Г образец 8b обрэзвц 12b обрэзвц 9b

^ M кДНК ДНК кДНК ДНК кДНК ДНК

=:! ܧ Щ

500 п о. ШШ4. 200 п.о..

отдельных образцах мононуклеарных клеток крови при остром лимфобластном лейкозе. Измерение уровня транскрипции анализируемой копии Alu совместно с уровнем экспрессии гена обратной транскриптазы LINE может использоваться для оценки степени ретропозиционной активности Alu и иметь прогностическое значение.

Предложенный алгоритм может быть реализован в программном коде и использоваться для поиска инсерций потенциальных «мастер-генов» различных семейств и подсемейств Alu-элементов, ретропозиционно активных как в терминальных, так и в соматических линиях клеток.

II. Создание функциональных молекулирно-генетическнх маркеров.

Одними из самых распространенных онкологических заболеваний у детей являются острые лейкозы. На их долю приходится до 20 % от всех злокачественных новообразований, возникающих у детей. Частота лейкозов достигает 4 случаев на 100000 детского населения до 14 лет. Пик заболевания приходится на возраст от 2 до 5 лет.

Термином острые лейкозы объединяют группу неопластических заболеваний гематопоэтической системы, имеющих клональную природу. Субстрат опухоли представлен потомками одной активно пролиферирующей перерожденной бластной клетки кроветворной системы, утратившей способность к дальнейшей дифференцировке. Первично поражается костный мозг. Развитие заболевания сопровождается вытеснением опухолевыми клетками здоровых форменных элементов крови и инфильтрацией различных органов и тканей, прежде всего, центральной нервной системы. Принадлежность бластов к той или иной линии гематопоэза, степень их дифференцировки обусловливают клиническое течение и прогноз острого лейкоза.

Целью данной части работы является поиск среди полиморфных инсерций Alu-ретроэлементов возможных функциональных участников малигнизации кроветворных клеток при остром лимфобластном лейкозе (OJIJI).

Особенности подхода к функциональному анализу.

Был проведен функциональный анализ инсерций «молодых» Alu-ретроэлементов при остром лимфобластном лейкозе у детей. Исследовалось влияние интронных инсерций Alu-элементов на экспрессию содержащих их аллелей генов и возможное участие некоторых из таких инсерций в развитии лейкоза. Для функционального анализа применялся подход, использующий явление инсерционного полиморфизма и заключающийся в попарном сравнении количеств первичных транскриптов двух аллелей генов в гетерозиготном состоянии. Наиболее корректно оценить влияние инсерции ретроэлемента на соотношение количеств транскриптов аллелей удается в одноядерных клетках с диплоидным кариотипом. В таких клетках соотношения аллелей генов эквивалентны, и количества первичных транскриптов обоих аллелей в отсутствие импринтинга должны находиться на одинаковом уровне. Поэтому возникающие отличия в представленности транскриптов аллелей должны являться, прежде всего, следствием присутствия или отсутствия инсерции Alu.

В работе были использованы фракции одноядерных клеток периферической крови здоровых доноров, а также периферической крови и пунктата костного мозга пациентов с острым В-лимфобластным лейкозом.

В табл. 2 приведены некоторые характеристики использованных в исследовании образцов крови пациентов с OJIJI. Все образцы представляют собой В-П-вариант острого лимфобластного лейкоза (OJIJT общего типа). Возраст доноров от 1.5 до 12 лет, количество лейкоцитов в крови от 1 до 65 млн./мл, содержание среди них лимфобластов от 28 до 96 %. Для всех образцов был проведен анализ наличия транскриптов химерных генов, наиболее характерных для лейкозов: BCR/ABL, MLL/AF4, TEL/AML1, Е2А/РВХ. В 8 из 17 образцов обнаружен транскрибирующийся химерный ген TEL/AML1 (табл. 2). Таблица 2. Характеристики образцов B-II подтипа ОПЛ.

№ образца 1Ь 2Ь зь 4Ь 5Ь 6Ь 7Ь 8Ь 9Ь 10Ь 11Ь 12Ь 13Ь 14Ь 15Ь 16Ь 17Ь

TEUAML1 н 5 + + ; н -,+;; н н + : н н •';;+;:;.' н ; +' н н

Пол м Ж ж ж м ж м Ж м м м м м ж м ж м

Возраст, лет 12 6 4 11 2 5 12 3 3 1.5 8 3 3 4 2.5 5 3

Лейкоциты, млн./мл 30 5.6 47.7 1.6 65.8 5.4 3.3 8.4 10 18.8 0.9 6.3 48 37.8 6.6 10.9 50

Лимфобласты в крови. % 38 НД 55 НД 89 85 НД 96 28 93 НД 81 83 НД 78 90 НД

Обозначения: генотипы по покусу TEUAML1 «н» - норма, «+» - наличие хромосомной перестройки и химерного гена TEL/AML1; НД-детекцию не проводили.

Разработка системы молекулярно-генетических маркеров

Молекулярно-генетические маркеры (МГМ) должны обладать двумя принципиальными характеристиками: уникальной нуклеотидной последовательностью, позволяющей точно маркировать определенный участок хромосомы, и каким-либо элементом меж- или внутривидовой вариабельности (однонуклеотидные полиморфные замены, мини- и микросателлиты, полиморфные инсерции ретроэлементов и др.). Такие маркеры находят широкое применение в популяционных исследованиях, используются для определения отцовства и генетической паспортизации населения. Поиск ассоциаций с различными фенотипами, в том числе с моно- и полигенными заболеваниями, а также функциональный анализ МГМ позволяют значительно повысить информативность маркеров и расширить области их применения в таких направлениях, как выявление предрасположенности и ранняя диагностика заболеваний, выбор стратегии лечения и др.

В настоящей работе исследовались МГМ на основе полиморфных инсерций Alu-ретроэлементов. Полиморфные инсерции, характеризующиеся значимыми различиями частот встречаемости у здоровых доноров и пациентов с ОЛЛ могут обладать существенным прогностическим значением и рассматриваться в качестве одного из факторов предрасположенности к развитию ОЛЛ. Потенциальная способность таких инсерций модулировать экспрессию генов делает их возможными участниками процесса малигнизации кроветворных клеток.

Поиск полиморфных инсерций осуществлялся с помощью геномного браузера UCSC (http://genome.ucsc.edu) и специализированных баз данных dbRIP (http://dbrip.org) и PRED (http://labcfg.ibch.ru/home.html), где суммирована актуальная информация, касающаяся теоретически предсказанных и экспериментально подтвержденных

полиморфных инсерций ретроэлементов. Важными характеристиками полиморфных инсерций являются геномная локализация, классификационная принадлежность к подсемействам и среднепопуляционная частота встречаемости (табл. 3, рис. 5).

chr.1

CDC2L16 EIF2C3 С

chr.2

PLA2R1 С AGPS С ITGA4 В

chr.3

chr.4

chr.5

ER8B2IP Я MEF2CГ

chr.6

марзкгС oseb

TAXI BP 1 TARP PKD1L1

chr.7 t=

chr.6

chr.10

PAS g PCGF6H

PTPRO ITPR2 STK38L

ehr. 12

chr.13

BRCA2

MAX p TSHR С

brca1с PITPNC1 p

PTPRAС P.PN? i

Рисунок 5. Положение анализируемых инсерций Alu на хромосомах. Черные стрелки - инсерции, находящиеся в полиморфном состоянии в исследуемых выборках, серые стрелки - инсерции, полиморфное состояние которых не было подтверждено в исследуемых группах индивидов. Надписи напротив стрелок- аббревиатуры соответствующих генов.

Из более чем 2000 полиморфных инсерций Alu в геноме человека около 800 локализованы в интронах генов, экспрессирующихся в различных органах и тканях. Более 100 генов, несущих в интронах полиморфные инсерции Alu-элементов, имеют достаточно высокий уровень транскрипции в периферической крови (рис. б). Из этого набора генов были выбраны те, продукты которых могут являться потенциальными участниками малигнизации клеток гематопоэтической системы. Белковые продукты отобранных генов (табл. 6) являются участниками различных, преимущественно регуляторных, внутриклеточных процессов и включают факторы транскрипции и ферменты различных классов (киназы, фосфатазы, GTP-азы).

С использованием методов биоинформатики были проанализированы относительные уровни экспрессии выбранных генов в лейкоцитах (рис. 6). Учитывая полученные результаты и данные о клеточном составе фракции одноядерных клеток крови, следует отметить, что основной вклад в уровень транскрипции генов HPSE и DSE вносит их транскрипция в моноцитах; количество транскриптов гена RASGRP3 определяется его активностью в B-клетках; транскрипция генов TARBP1, МАРЗК7, NLRPI и SOS1 осуществляется преимущественно в Т-клетках, гена RRAS2 - в В- и NK-клетках, гена TIAMI - в Т-клетках и моноцитах, гена MEF2C- в B-клетках и моноцитах. Остальные из

рассматриваемых нами генов транскрибируются на высоком уровне в трех и более типах одноядерных лейкоцитов.

о

МЕ(2С ТАХ1ВР1 RA81A PTPRA 50S1 RABL3 HPSE ANP32B PKD1L1 HSRC2 6SPTS OSE AF4 AGPS EIF2C3 NLRP1 Т1АМ1 RA5GRP3

90 о

с/ RRAS2 МАРЗК7 TARBP1 SNTB1 STK3BL РТРШ PITPNC1 CNOT4 IURAP RAB2A NRP1 SYT17 PHF21A /TGA4 OSBPLSO PCGF6 TSHR RPN2

Рисунок 6. Относительный уровень транскрипции генов в отдельных типах лейкоцитов. По оси

ординат приведено отношение А/В х 100%, где А - средний уровень транскрипции гена в определенном типе клеток (обозначение типов приведено в нижней части рисунка), В - в лейкоцитарной фракции крови в целом. Данные об уровнях транскрипции генов получены из http://www.uniDrot.orQ/ и http://bioaps.org.

В табл. 6 суммированы основные характеристики 31 из 53 созданных в настоящей работе МГМ. Каждый маркер представляет собой пару уникальных интронных праймеров, фланкирующих сайт интеграции полиморфной инсерции Alu. Большая часть инсерций принадлежит «молодым» подсемействам: AluYa5, AluYb8 и AluYb9. Все инсерции полноразмерные, оканчиваются ро1у(А)-последовательностью и фланкированы короткими прямыми повторами; локализованы в интронах на разном расстоянии от точки начала транскрипции, в прямой или обратной ориентации относительно направления транскрипции гена.

Таким образом, была создана первая версия системы МГМ, в которую вошли 53 ПЦР-адаптированных маркера на основе полиморфных инсерций Alu-ретроэлементов в 51 гене (49 генов с одной инсерцией, гены MEF2C и BRCA2 - с двумя).

Определение аллелъного состояния генов

Отличительной особенностью генома каждого индивида (за исключением однояйцевых близнецов) является наличие уникального набора аллелей полиморфных локусов. На этом свойстве базируются современные системы идентификации личности и

та

ttifiüllih!

ш

DIAPH2 ERBB4 TARP IQGAPl МАХ PTPN22 PLA2R1 PLCG2 ITPR2 PTPLB ERBB2IP BRCA1 ВЯСА2 FAS CDC2U GAPDH АСТВ Ш CD14+ Моноциты ■ С019+ B-клетки D CD4+Т-клетки а CD8+Т-клетки □С056+МК-клетхи

установления родства. Биаллельные маркеры на основе полиморфных инсерции Alu-элементов, наряду с широко используемыми в настоящее время микросателлитами и однонуклеотидными полиморфными заменами, также могут успешно применяться для этих целей, обладая при этом рядом конкурентных преимуществ. Во-первых, для каждого Alu-маркера заранее известен предковый аллель (не содержащий инсерцию), что делает маркеры такого типа незаменимыми в филогенетических исследованиях. Во-вторых, инсерции Alu обладают достаточно высокой стабильностью в геноме, обусловленной отсутствием специфических механизмов удаления инсерции из сайта интеграции. В связи с этим, можно считать, что частота встречаемости аллелей и распределение генотипов является отражением генетических процессов, происходящих в популяции. В-третьих, Alu-маркеры имеют преимущества технического характера, к которым относится низкая стоимость, методическая простота и возможность автоматизации анализа.

а

Геномная ДНК

-{яэвяаааф-

^ Экэ N-и}— A!u+ аллель

-)3k3n|-

Aluu аллель

ЛЦР

"О'5

-Ь*ЛПУ1 ААЛдГ>*-

G rev

и/или

н>г-

G rev

Генотипы образцов ДНК по локусу GSPT1

М +/+ +/+

+/-

+/+

-/-

+/-

Рисунок 7. Генотипирование образцов геномной ДНК. (а) - схема локус-специфичной ПЦР. Белые

прямоугольники с надписью Экз - экзоны, черные прямоугольники - инсерции Alu, белый треугольник - сайт интеграции Alu, серые стрелки - положения праймеров. (б) - злектрофореграмма продуктов ПЦР-амплификации ДНК. Обозначения дорожек: М - маркер длин ДНК (Сибзнзим, Россия), генотипы: «+/+» - оба аллеля содержат инсерцию, «■+/-» - один из аллелей содержит инсерцию, «-/-» - оба аллеля без инсерции. Стрелками в правой части обозначены положения продуктов амплификации обоих аллелей. Стрелки слева показывают длины фрагментов ДНК из некоторых полос маркера.

На данном этапе работы было проведено исчерпывающее генотипирование образцов геномной ДНК двух выборок доноров по 53 А1и-маркерам. Обе выборки были составлены из образцов геномной ДНК представителей городского населения московского региона. Первая (контрольная) выборка формировалась из группы взрослых доноров, не имевшие в детстве онкологических заболеваний крови, вторая (целевая) из детей с диагнозом острый В-лимфобластный лейкоз общего типа. На основе результатов генотипирования были установлены генотипы индивидов из обеих групп доноров и рассчитаны частоты встречаемости А1и-содержащих аллелей генов.

В контексте решения задач по идентификации личности наибольшей информативностью обладают инсерции со значениями среднепопуляционных частот встречаемости в пределах от 0.25 до 0.75. Среди исследованных 53 маркеров подобными значениями частот встречаемости обладают 24 маркера.

Таблица 3. Генотипы здоровых доноров по присутствию/отсутствию инсерции Alu в интронах генов.

CDC2L1 |1рЭ6.33 Ya3j *!-. +!- +/- ■'/■ +J- +1- [ *!- +/> +1- '+/-. +/-■[ +/- +Л 0.50

Обозначения: (1) - семейств о Alu-элементов; (2) - частота встречаемости Alu*-аллелей группе доноров; М - мужчина, Ж - женщина; «+/+» - оба аплеля содержат инсерцию Alu, «+/-» ■ один из аллелей содержит инсерцию, «-/-» - оба аллеля не содержат инсерцию.

Таблица 4. Генотипы пациентов с ОЛЛ по присутствию/отсутствию инсерции Alu в интронах генов.

Обозначения: (1) - семейство Alu-элементов; (2) - частота встречаемости Alu -аллелей в группе доноров; М - мужчина, Ж - женщина; «+/+» - оба аллеля содержат инсерцию Alu, «+/-» -один из аллелей содержит инсерцию, «-/-» - оба аллеля не содержат инсерцию.

Эти маркеры в дальнейшем могут быть использованы в качестве основы для создания набора интронных МГМ для идентификации личности. 14 других маркеров имеют частоты в пределах от 0 до 0.25 и от 0.75 до 1 (не включая 0 и 1). Эти маркеры имеют меньшую индивидуализирующую способность, но при этом могут представлять интерес для популяционных исследований, поскольку аллели с одними из них недавно появились в смешанной популяции московского региона, с другими - давно и близки к фиксации в геномах индивидов. Оставшиеся 15 маркеров характеризуются в обеих выборках частотами встречаемости, равными либо 1, либо 0. Маркеры из этой группы полностью лишены индивидуализирующей способности в исследуемых выборках.

На основе первых двух групп маркеров была создана вторая версия системы МГМ, включающая 38 полиморфных инсерций. Для каждой из них было проведено сравнение частот встречаемости Alu-содержащих аллелей в геномах доноров из целевой и контрольной групп. 33 инсерциям в обеих выборках соответствуют близкие значения частот встречаемости (p-value > 0.05). Различия частот встречаемости 5 инсерций в 4 генах (MEF2C, ТАХ1ВР1, RABIA и PHF21A) в выборках здоровых доноров и пациентов с ОЛЛ могут рассматриваться как значимые (p-value=:0.05) (табл. 6) и иметь диагностическое значение.

5 последних и 5 дополнительных маркеров были использованы для генотипирования образцов геномной ДНК представителей четырех этнических групп населения России. На основе полученных результатов были установлены генотипы индивидов и рассчитаны частоты встречаемости Alu-содержащих аллелей в каждой из четырех рассматриваемых этнических групп (табл. 3). По две инсерции (из ассоциированных с ОЛЛ) в двух этнических группах (MEF2C-Yb8 и PHF21A-Ya5 в группе калмыков, TAX1BP1-Yb8 и RAB1A-Yd2 в группе украинцев) имеют частоты, сопоставимые с соответствующими частотами в выборке пациентов с ОЛЛ. Наблюдаемые результаты могут свидетельствовать о повышенном риске развития ОЛЛ у калмыков и украинцев, по сравнению с мордвой и коми. Сопоставление данных молекулярно-генетических и эпидемиологических исследований в дальнейшем может внести значительный вклад в понимание особенностей патогенеза онкологических заболеваний.

Таблица 5. Частоты А1и+-аллелей в выборках представителей этнических групп населения России.

Ген Alu (1) Частота встречаемости А1и+-аллеля

Локус Мордва (n=15) Калмыки (n=15) Коми (п=15) Украинцы (п=15) Контроль (п=15) ОЛЛ (п=17)

MEF2C 5q14.3 Ya5 0.30 0.27 0.20 0.18 0.13 0.41

MEF2C 5q14.3 Yb8 0.33 0.57 0.30 0.23 0.23 0.50

PHF21A 11p11.2 Ya5 0.70 0.32 0.60 нд 0.70 0.41

ТАХ1ВР1 7p15.2 Yb8 0.00 0.03 0.00 0.10 0.00 0.15

RAB1A 2p14 Yd2 0.73 0.57 0.73 0.80 0.60 0.82

PTPRA 20p13 Y 0.50 0.10 0.23 0.47 0.17 0.35

SOS1 2p22.1 Ya4b 0.96 0.80 0.87 1.00 1.00 0.91

RSRC2 12q24.31 Ya5 0.23 0.10 0.27 0.43 0.37 0.26

TARBP1 1q42.2 Ya5 0.40 0.53 0.48 0.63 0.53 0.59

ANP32B 9q22.33 Ya5 0.57 0.70 0.45 0.48 0.57 0.41

Обозначения: (1)- семейство Alu-элементов: п - размер выборки: НД - детекция не проводилась.

Аллель-специфический анализ транскрипции

На первом этапе были оценены уровни транскрипции AIu-несодержащих аллелей генов в лимфоидных клетках периферической крови здоровых доноров и пунктата костного мозга пациентов с ОЛЛ. По результатам этого анализа 7 маркеров в генах, предковые аллели которых транскрибировались на низком уровне, были исключены из дальнейшего эксперимента. На основе оставшегося 31-го маркера была сформирована третья версия системы МГМ, которая была использована для сравнительного анализа транскрипции аллелей генов.

Транскрипцию аллельных пар анализировали на образцах клеток, гетерозиготных по присутствию Alu-элемента. Анализ носил полуколичественный характер и осуществлялся методом ступенчатой ОТ-ПЦР на матрице кДНК-копий гетерогенной ядерной РНК (гяРНК). Базовый уровень транскрипции соответствующих генов оценивали для образцов, гомозиготных по отсутствию инсерции Alu, и нормировали по уровню транскрипции гена «домашнего хозяйства» GAPDH. В среднем, для всех исследованных образцов, продукт ПЦР, соответствующий несплайсированному транскрипту GAPDH, детектировался при 27-30 циклах ПЦР, что приблизительно соответствует наличию ~10 молекул транскрипта на 100 клеток. Поэтому при отсутствии продукта ПЦР после 39 циклов амплификации считали, что в образце транскрипт представлен менее чем 1-2 молекулами на 100 клеток («min» в табл.6).

Гетерагенная ядерная РНК

НэюмН

-ОеВДАМд^_ 1 Экз N*T] Älu+аллель

G го»

НЭкзЫЬ

от-пцрф/6fer; й ПУ

-¡Ж1И|АМА1>^-— И/ИЛИ

G г®»,

Aiu ампликон

Д)ц"[ ампликон

Число циклов ОТ-ПЦР

Рисунок 8. Функциональный анализ интронных инсерций Alu-элементов, (а)

Схема ОТ-ПЦР-анализа транскрипции аллельных пар. Черными стрелками показано расположение и ориентация праймеров G-for и G-rev. Черный прямоугольник - инсерция Alu, белые прямоугольники с обозначением «экэ№» -соответствующие экзоны. Белым треугольником показан сайт интеграции Alu. (б) Электрофореграмма продуктов ОТ-ПЦР. Обозначения дорожек: М - маркер длин ДНК 100 п.о. (Сибэнзим, Россия), -ОТ -отрицательный контроль, ДНК - продукты амплификации геномной ДНК, числами обозначены циклы ОТ-ПЦР, на которых отбирали аликвоты. Стрелками в правой части обозначены положения продуктов амплификации обоих аллелей или их транскриптов.

Схема анализа транскрипции аллелей приведена на рис. 8. Для каждой инсерции проводилось сравнение количеств первичных транскриптов Alu-содержащего (А1и+) и Alu-несодержащего (Alu0) аллелей. Вывод о снижении содержания А1и+-транскрипта (ингибиторном эффекте инсерции Alu) делали на основании разности числа циклов ПЦР, необходимых для появления электрофоретически детектируемых количеств

соответственно Alu+- и А1и°-продуктов ПЦР. Для оценки соотношения количеств транскриптов аллелей использовали формулу: NmuJNami = 2"'т, где п - число циклов ПЦР, необходимое для появления А1и°-продукта, т - число циклов ПЦР, необходимое для появления А1и+-продукта (табл.6).

По каждому маркеру было исследовано от 1 до 4 гетерозиготных образцов из обеих выборок. Результаты сравнительного анализа уровней транскрипции 31 аллельной пары исследуемых генов обобщены в табл. 6. По характеру и степени воздействия на транскрипцию соответствующих аллелей генов исследуемые инсерции Alu-элементов можно условно разделить на несколько групп.

Инсерции в 8 генах (RABIA, PTPRA, SOS1, ANP32B, RSRC2, AF4, NLRP1, SNTBI) практически не оказывают влияния на транскрипцию соответствующих аллелей.

Инсерции в 12 генах (HPSE, DSE, МАРЗК7, PKD1L1, STK38L, P1TPNC1, CNOT4, IL1RAP, RAB2A, NRP1, RPN2 и PHF21A) приводят к различной степени снижения (от одного порядка до полного ингибирования) количества транскрипта А1и+-аллеля в лейкоцитах здоровых доноров. В образцах клеток пациентов с ОЛЛ оба аллеля каждого из этих генов имеют крайне низкий уровень транскрипции (продукты ПЦР не детектировались при 39 циклах амплификации).

Причина отличий уровней транскрипции этих генов в образцах клеток двух выборок связана либо со степенью малигнизации клеток лимфоидного ряда пациентов с лейкозом, либо с тканевой или клеточной специфичностью экспрессии этих генов, поскольку в крови здоровых доноров не содержится предшественников лимфоцитов.

7 инсерций в 6 генах (MEF2C, GSPT1, EIF2C3, RASGRP3, RRAS2 и TARBP1) приводят к аллель-специфическому снижению количества первичных транскриптов как в одноядерных клетках крови здоровых доноров, так и в лимфоидных клетках костного мозга и крови пациентов с ОЛЛ.

Вне этих групп, при наличии инсерций в генах ТАХ1ВР1 и SYT17 наблюдается ингибирование транскрипции А1и+-аллеля в лимфобластах пациентов с ОЛЛ, для гена AGPS - ингибирование в лейкоцитах здоровых доноров, для гена RABL3 -ингибирование транскрипции А1и+-аллеля только в образцах из костного мозга пациентов с ОЛЛ.

В отдельных образцах клеток крови одна и та же инсерция может приводить к различной степени снижения уровня транскрипции аллеля. Это, вероятно, связано с тканевой или клеточной специфичностью ингибиторного эффекта и с гетерогенностью клеточного состава образцов. Так, для 5 из 18 инсерций (в генах HPSE, PKD1L1, GSPT1, RASGRP3 и RRAS2), обладающих ингибиторным эффектом в одноядерных клетках крови, содержание транскрипта А1и+-аллеля было снижено на 1-2 и более порядков. Три из 5 рассматриваемых инсерций находятся в генах (PKD1L1, GSPT1 и RRAS2), транскрибирующихся во всех типах анализируемого пула клеток крови; две - в генах (HPSE и RASGRP3), транскрибирующихся в клетках преимущественно одного типа лейкоцитов (рис. 6).

Таблица 6. Характеристики МГМ и аллель-специфичное влияние инсерций А1и-элементов на уровень первичных транскриптов генов.

ГЕН ФУНКЦИЯ ПРОДУКТА ГЕНА ЛОКУС Alu (a) ÜjU- Ннчрон Контроль (rt-!5) B-H ОЛЛ (a=J7) p-value Контроль В-НОЛЛ

(ПО иС5С) gr (с) Частота XBP© ЧастшЦХВР (0 1B> (h) Уровень Alu /Alu

MEF2C ФАКТОР ТРАНСКРИПЦИИ 5ql4.3 Yb8 a/s 7/10 0.24 (e) 0.13 1.00 0.41 1.00 0.024 0.125; 0.125; 0.125 min; min

MEF2C ФАКТОР ТРАНСКРИПЦИИ 5ql4.3 Ya5 s 7/10 0.37 (e) 0.23 0.52 0.50 0.64 0.039 min; min; min min

PHF21A РЁГУЛЯЦЦЯ ТРАНСКРИПЦИИ llpll.2 Ya5 a/s 5/18 0.51 (e) 0.70 1.00 0.41 0.33 0.038 min; min; 0.125 _

TAX1BPI ФАКТОР ТРАНСКРИПЦИИ 7р15.2 Yb8 J a/s 1/16 0.04 (e) 0.00 1.00 0.15 1.00 O.OSS НД min

RAB1A СТР-АЗА 2р14 Yd2 a/s 1/5 0.71 (e) 0.60 0.30 0.82 0.42 0.057 l; 1 1

PTPRA ТИРОЗШОВАЯ ФОСФАТАЗА 20р13 Y S 1/27 0.33 (e) 0.17 0.34 0.35 0.34 0.155 1 1

SOSI ФАКТОРОБМЕНАОТРЛдаР 2р22.1 Ya4b s 1/22 0.91 (e) 1.00 1.00 0.91 1.00 0.239 НД 1

RAML3 СТР-АЗА 3ql3.33 Yb8 s 3/7 0.17 0.31 0.29 1.00 0.255 1 min; min

HPSE ГИДРОЛАЗА 4q21.23 Ya5 a/s 12/12 0.33 0.61 0.21 0.53 0.272 0.125. min _

ANP32B ШАПГРОН 9q22.33 YaS a/s 3/6 0.55 (e) 0.57 1.00 0.41 1.00 0.316 1; 1 1

PKDIL1 ФАКТОР КЛЕТОЧНОЙ АДГЕЗИИ 7р12.3 Ya5 a/s 28/56 0.67 0.11 0.79 0.06 0.382 0.125; min -

RSRC2 ПРОЛИФЕРАЦИЯ 12q24.31 YaS s 1/10 0.26 (e) 0.37 1.00 0.26 1.00 0.427 1; 1; 1; 1 1; 1; 1; l

GSPTI ОТР-АЗА 16pl3.13 YaS a/s 1/14 0.67 0.60 0.59 0.61 0.430 0.125; min min(HK); -(KM)

OSE ЗПИМЕРАЗА 6q22.I Y s 3/5 0.30 0.55 0.21 1.00 0.552 min; min -

AF4 ФАКТОР ТРАНСКРИПЦИИ 4q21.3 Y a/s 14/19 0.53 1.00 0.38 0.61 0.556 1; 1, 1 1

AGPS СИНТАЗА 2q31.2 Yb8 a/s 10/19 0.67 0.23 0.58 <0.01 0.584 min НД

EIF2C3 ФАКТОР ТРАНСЛЯЦИИ 1p34.3 Ya5 s 8/18 0.03 1.00 0.09 1.00 0.616 min min

NLRP1 АКТИВАТОР КАСПДЗ 17pl3.2 Yb8 s 3/15 0.53 0.32 0.44 0.61 0.617 1; 1; 1; 1 _

RASGRP3 ФАКТОР ОБМЕНА ОТР/ОБР 2p22.3 Yb8 a/s 16/18 0.76 (d) 0.87 1.00 0.82 0.42 0.738 min. 0.016 min

RRAS2 СТР-АЗА Ilpl5.2 Ya5 a/s 1/5 0.17 1.00 0.21 1.00 0.757 min; 0.125; 1 min; min; min

МАРЗК7 МАР-КИНАЗА 6(i22.31 Y s 13/16 0.24 (d) 0.40 1.00 0.33 1.00 0.789 0,125 _

TARBPI ФАКТОР ТРАНСКРИПЦИИ 1q42.2 Ya5 a/s 9/29 0.51 (e) 0.53 1.00 0.59 0.34 0.801 min; min; min 1; min

SNTBI ПОДДЕРЖАНИЕ ЦИТОСКЕПЕТ А 8q24.12 Yb8 s 2/7 0.57 0.28 0.56 0.34 1.000 ); 1 1

STK3SL СЕРИЮТРЮНИНОВАЯ КИНАЗА 12pl 1.23 YaS a/s 1/13 0.23 (d) 0.13 0.20 0.15 0.29 1.000 min _

PITPNCI ПЕРЕДАЧА СИГНАЛА 17q24.2 Yb8 a/s 1/9 0.27 0.22 0.26 1.00 1.000 min _

CNOT4 ФАКТОР ТРАНСКРИПЦИИ 7q33 YaS s 1/10 0:71 (d) 0.80 0.45 0.74 1.00 1.000 min _

ILIRAP РЕЦЕПТОР ИНТЕРЛЕЙКИНА-1 3q28 YaS a/s 3/8 0.44 (d) 0.50 0.62 0.50 0.62 1.000 min; min _

RAB2A СТР-АЗА 8ql2.1 Ya4 s 6/7 0.23 0.12 0.26 1.00 1.000 min _

NRP1 ФАКТОР КЛЕТОЧНОЙ АДГЕЗИИ lOpl 1.22 Yb8 s 11/15 0.74 (d) 0.70 1.00 0.71 0.08 1.000 0.125; 0.125; 0.125 _

SYT17 ТРАНСПОРТ i 6p 12.3 Yb9 s 5/7 0.51 (d) 0.20 0.45 0.18 1.00 1.000 НД min

RP\'2 МОДИФИКАЦИЯ БЕЛКОВ 20q 11.23 Ya5 s 2/16 0.20 (d) 0.20 1.00 0.18 0.04 1.000 min; min; min -

Обозначения: (а) Семейство Alu; (b) ориентация Alu относительно направления транскрипции гена; (с) номер интрона с инсерцией АЫчисло интронов гена; (d) по базе данных dbRIP fhttp://dbrip. ora/l: (е) установлена в настоящей работе; (f) характеристика равновесия Харди-Вайнберга в распределении аллелей; (д) вероятность случайного различия частот встречаемости А1и+-аллеля в контрольной и целевой выборках; (h) уровни транскрипции А1и+-аллелей относительно А1и°-аллелей в проанализированных образцах (значения для каждого из образцов показаны через «;»), «min» - нет Alu*, «-» - нет обоих аллелей; «НД» - детекция не проводилась.

Полученные данные наглядно показывают, что аллель-специфическое снижение количества первичного транскрипта представляет достаточно распространенное явление и может проявляться как в здоровых, так и малигнизированных клетках.

Сравнительный анализ количеств первичных и зрелых транскриптов.

Одними из наиболее вероятных причин снижения содержания в клетке транскриптов Alu-содержащих аллелей гена могут быть два аллель-специфических эффекта -ингибирование транскрипции или повышение скорости сплайсинга. При реализации первого эффекта сниженному количеству первичного транскрипта должно соотвествовать сниженное количество зрелого, в случае реализации второго -повышенное количество зрелого. Справедливость этих гипотез проверяли на примере гена TARBP1 (рис. 9). Этот ген имеет единственный белок-кодирующий транскрипт, для которого не описано альтернативного сплайсинга в районе инсерции Alu. Нами проведена оценка количества первичных транскриптов А1и+-аллелей и количества сплайсированных транскриптов обоих аллелей в образцах OJIJ1 с тремя возможными генотипами: гомозиготах (-/-), (+/+) и гетерозиготе (+/-). Было исследовано два гомозиготных образца -/-, два гетерозиготных образца +/- и три гомозиготных образца +/+. Уровень транскрипции гена TARBP1 измерялся относительно уровня транскрипции гена «домашнего хозяйства» GAPDH.

Несплайсированные транскрипты

G-fof

—|Эв8)-

Сплайсированные транскрипты

О

TARBP1

GAPDH

[ЭвЯэвЯЭй М! TARBP1

|Э«з7|Зю8[

Rв4

GAPDH

TARBP1/ GAPDH

М 24 27 30 33 36 39 -ОТДНКМ24 27 30 33 36 39-отднк М24 27 30 33 36 M2I 24 27 30 33 36

Рисунок 9. Анализ транскрипции аллельных пар гена ТАЯВР1. В верхней части рисунка показаны схемы ОТ-ПЦР, на которых приведены структуры фрагментов анализируемых транскриптов и указаны положения праймеров относительно соответствующих зкзонов (экз№). Под каждой схемой помещены электрофореграммы соответствующих типов ОТ-ПЦР (обозначения дорожек аналогичны рис.2). В левой части рисунка указаны номера анализируемых образцов (даны по табл.1) и соответствующие им генотипы: «-/-» - генотип А1и°/А1и°, «+/+» - генотип А1и*/А1и«+/-» - генотип А1и*/А1и°. Для каждого образца приведено по четыре электрофореграммы ОТ-ПЦР-анализа транскрипции генов ТАЯВР1 и ОАРОН на уровне пре-мРНК и мРНК. Числа в правой части рисунка -количества сплайсированных транскриптов гена ТАИВР1 относительно количества транскриптов гена «домашнего хозяйства» вАРОН для каждого проанализированного образца.

В образцах лимфобластов 1Ь, ЗЪ, 10Ь, 9Ь, 13Ь детектируются первичные транскрипты хотя бы одного аллеля гена ТАЯВР1, сплайсированные транскрипты в тех же образцах также детектируются и представлены на одинаковом уровне. В образцах 2Ь

и 12b первичные транскрипты не детектируются, а сплайсированные транскрипты представлены на достаточно высоком уровне, но при этом в 8 раз меньшем, чем в образцах lb, 3b, 10b, 9b и 13b. Иными словами, отсутствие детектируемого количества первичных транскриптов сопровождается лишь частичным снижением количества сплайсированных транскриптов.

Ни ингибирование транскрипции Alu-содержащего аллеля, ни повышение скорости сплайсинга, взятые отдельно, не могут описать полученные результаты. Лишь совместное действие двух этих эффектов может дать приемлемое объяснение наблюдаемых соотношений количеств сплайсированных и несплайсированных транскриптов.

Заключение. Разработанная система МГМ включает 31 высокоинформативный маркер и представляет новое поколение молекулярно-генетических диагностических систем. Обладая всеми возможностями физических и полиморфных маркеров, применяемых в настоящее время в популяционной генетике, криминалистике и медико-генетической экспертизе, проанализированные полиморфные Alu-элементы имеют также важное функциональное значение, участвуя в регуляции транскрипции генов. 5 маркеров имеют выраженный диагностический потенциал в отношении острого В-лимфобластного лейкоза. Остальные маркеры могут найти применение при разработке наборов МГМ для диагностики различных вариантов лейкозов, а также других патологий кроветворной системы.

ВЫВОДЫ

1. Разработан алгоритм для биоинформатической идентификации инсерций Alu-ретроэлементов, обладающих ретропозиционной активностью («мастер-генов»). С помощью предложенного алгоритма впервые идентифицировано 12 инсерций «мастер-генов» в семействах AluYa5 и AluYb8.

2. Проведен полногеномный биоинформатический поиск полиморфных инсерций Alu-ретроэлементов в интронах генов, продукты которых являются потенциальными участниками малигнизации кроветворных клеток. Создана серия ПЦР-адаптированных молекулярно-генетических маркеров, включающая 53 пары уникальных праймеров, фланкирующих сайты интеграции выявленных инсерций.

3. Проведено исчерпывающее генотипирование геномных ДНК здоровых доноров и пациентов с ОЛЛ по 53 Alu-маркерам. Впервые определены частоты встречаемости 53 инсерций Alu у городского населения московского региона, 10 инсерций - в четырех этнических группах населения России.

4. Впервые показаны достоверные различия частот встречаемости 5 инсерций Alu-ретроэлементов у пациентов с острым лимфобластным лейкозом и здоровых доноров.

5. Осуществлен массированный функциональный анализ 31 полиморфной инсерции Alu-ретроэлементов в лимфоидных клетках здоровых доноров и пациентов с ОЛЛ. Показано выраженное снижение количества транскриптов Alu-содержащих аллелей 22 генов.

Основное содержание работы изложено в следующих публикациях:

1. Амосова A. JL, Комков А. Ю., Устюгова С. В., Мамедов И. 3., Лебедев Ю. Б. Ретропозоиы в эволюции генома современного человека. Биоорганическая химия. 2009. Т.35. №6. С.779-788.

2. Комков А. Ю., Лебедев Ю. Б., Швец В. И. Разработка тест-системы для анализа эффекта «смены матрицы» при обратной транскрипции in vitro. Вестник МИТХТ. 2011. Т.6. №6. С.77-83.

3. Комков А. Ю., Масчан М. А., Швец В. И., Лебедев Ю. Б. Функциональный анализ полиморфных инсерций Alu-ретроэлементов при остром лимфобластном лейкозе. Биоорганическая химия. 2012. Т.38. №3. С.282-289.

4. Комков А. Ю., Амосова А. Л., Лебедев Ю. Б. Влияние полиморфных инсерций Alu-элементов на экспрессию генов человека. «Съезд генетиков и селекционеров, посвященный 200-летию со дня рождения Чарльза Дарвина» и «V съезд Вавиловского общества генетиков и селекционеров». Москва, 21-28 июня 2009 (Тезисы докладов, часть II, стр. 62).

5. Лебедев Ю. Б., Комков А. Ю., Устюгова С. В., Амосова А. Л., Мамедов И. 3. Разработка систем функциональных маркеров для прогнозирования и индивидуальной терапии онкологических заболеваний крови. «Фундаментальные науки - медицине». Тезисы докладов на конференциях и семинарах по научным направлениям Программы в 2009 году. М.: Фирма «Слово», 2009, стр.56.

6. Лебедев Ю. Б., Комков А. Ю., Мамедов И. 3., Амосова А. Л., Устюгова С. В., Разработка систем функциональных маркеров для прогнозирования и индивидуальной терапии онкологических заболеваний крови. «Фундаментальные науки - медицине». Тезисы докладов на конференциях и семинарах по научным направлениям Программы в 2010 году. М.: Фирма «Слово», 2010, стр. 66.

7. Комков А. Ю., Швец В. И., Лебедев Ю. Б. Создание молекулярно-генетических маркеров на основе полиморфных инсерций Alu-ретроэлементов. Московская международная научно-практическая конференция «Биотехнология: экология крупных городов». Москва, 15-17 марта 2010 (Материалы конференции, стр. 461-462).

8. Комков А. Ю., Лебедев Ю. Б. Функциональный анализ полиморфных инсерций Alu ретроэлементов в геноме человека. Международная конференция «Проблемы популяционной и общей генетики». Москва, 14-16 ноября 2011 (Сборник тезисов, стр. 140-141).

9. Лебедев Ю. Б., Комков А. Ю., Масчан М. А., Курносов А. А., Мамедов И. 3. Функциональный анализ полиморфных Alu-ретроэлементов при остром лимфобластном лейкозе. «Фундаментальные науки - медицине». Тезисы докладов на конференциях и семинарах по научным направлениям Программы в 2011 году. М.: Фирма «Слово», 2011, стр. 77.

Заказ № 91-А /02/2012 Подписано в печать 01.02.2012 Тираж 100 экз. Усл. п.л. 1.0

ООО "Цифровичок", тел. (495) 649-83-30 www.cfr.ru; е-таИ:гак@с/г. ги

Текст научной работыДиссертация по биологии, кандидата химических наук, Комков, Александр Юрьевич, Москва

61 12-2/300

МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ТОНКИХ ХИМИЧЕСКИХ ТЕХНОЛОГИЙ ИМЕНИ М. В. ЛОМОНОСОВА

На правах рукописи

КОМКОВ АЛЕКСАНДР ЮРЬЕВИЧ

РАЗРАБОТКА СИСТЕМЫ ФУНКЦИОНАЛЬНЫХ МОЛЕКУЛЯРНО-ГЕНЕТИЧЕСКИХ МАРКЕРОВ НА ОСНОВЕ И Н С Е РЦ И Й Л1Л- РЕТ РОЭЛ ЕМ Е11 ТО В

03.01.06 Биотехнология (в том числе бионанотехнологии)

Диссертация на соискание ученой степени кандидата химических наук

Научный руководитель Академик РАМН, д.х.н., проф. Швец В.И.

Москва 2012

Оглавление

Список сокращений..................................................................................................................5

ВВЕДЕНИЕ....................................................................................................................................6

ГЛАВА 1. ОБЗОР ЛИТЕРАТУРЫ................................................................................................9

1.1. Молекулярные и клеточные особенности онкологических заболеваний........................9

1.1.1. Клеточные особенности канцерогенеза...................................................................10

1.1.1.1. Моноклональная эволюция...............................................................................11

1.1.1.2. Поликлональная эволюция...............................................................................12

1.1.1.3. «Самораспространение» («самозасеивание»)..................................................13

1.1.1.4. «Мутаторный фенотип»....................................................................................13

1.1.1.5. Раковые стволовые клетки................................................................................13

1.1.2. Реконструкция истории прогрессии опухоли..........................................................15

1.1.3. Системные нарушения..............................................................................................19

1.1.3.1. Нестабильность генома.....................................................................................20

1.1.3.2. Митогенное стимулирование............................................................................21

1.1.3.3. Уклонение от апоптоза......................................................................................22

1.1.3.4. Репликативное бессмертие................................................................................22

1.1.3.5. Неоангиогенез...................................................................................................23

1.1.3.6. Метастазирование как неслучайный процесс..................................................24

1.1.3.7. Уклонение от разрушения иммунной системой...............................................25

1.1.3.8. Опухоль-стимулирующее воспаление..............................................................25

1.1.3.9. Репрограммирование схемы метаболизма.......................................................26

1.1.4. Ключевые гены канцерогенеза (онкогены и онкосупрессоры)...............................26

1.1.5. МикроРНК.................................................................................................................29

1.1.6. Соматические мутации в онкогенах и онкосупрессорах.........................................30

1.1.6.1. Единичные замены нуклеотидов......................................................................31

1.1.6.2. Хромосомные аномалии....................................................................................32

1.1.6.3. Copy number variations (CNV)...........................................................................33

1.1.7. Эпигенетические модификации...............................................................................34

1.1.8. Заключение. Спектр альтернативных сценариев канцерогенеза............................35

1.2. Л/м-ретроэлементы как потенциальные онкомаркеры....................................................36

1.2.1. Структура Alu-ретроэлементов................................................................................36

1.2.2. Распространение Alu в геноме.................................................................................36

1.2.3. Ретропозиционно активные Alu-элементы..............................................................39

1.2.4. Системы защиты генома от распространения Alu..................................................41

1.2.5. Функциональная значимость Alu элементов...........................................................42

1.2.5.1. Alu-опосредованные делеции...........................................................................42

1.2.5.2. Влияние на транскрипцию генов......................................................................43

1.2.6. Заключение. Инсерции Alu как потенциальные онкомаркеры...............................46

ГЛАВА 2. РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ............................................................................47

2.1 Разработка алгоритма идентификации ретропозиционно активных ^4/м-элементов......47

2.1.1. Признаки «мастер-генов».........................................................................................48

2.1.2. Появление структурно новых инсерций Alu...........................................................49

2.1.3. Алгоритм для идентификации инсерций «мастер-генов».......................................52

\

2.1.4. Анализ транскрипции «мастер-генов».....................................................................56

2.2. Разработка функциональных молекулярно-генетических маркеров.............................57

2.2.1. Особенности подхода к функциональному анализу...............................................58

2.2.2. Разработка системы молекулярно-генетических маркеров....................................62

2.2.3. Определение аллельного состояния генов...............................................................64

2.2.4. Аллель-специфический анализ транскрипции........................................................69

2.2.5. Сравнительный анализ количеств первичных и зрелых транскриптов..................75

2.3. Анализ эффекта «смены матрицы» при обратной транскрипции in vitro......................77

2.3.1. Участие инсерций Alu-элементов в процесс «смены матрицы».............................78

2.3.2. Смена матрицы при синтезе кДНК первичных транскриптов................................79

2.3.3. Стабильность Alu-Alu вторичных структур РНК и «смена матрицы»...................87

2.3.4. Разработка тест-системы для мониторинга эффекта «смены матрицы»................90

2.3.4.1. Дизайн РНК-матрицы для тестирования обратных транскриптаз..................90

2.3.4.2. Анализ эффекта «смены матрицы» in vitro......................................................92

2.3.4.3. Анализ эффективности процесса «смены матрицы» in vitro...........................93

2.3.5. Заключение...............................................................................................................94

ГЛАВА 3. ЭКСПЕРИМЕНТАЛЬНАЯ ЧАСТЬ..........................................................................96

3.1. Материалы........................................................................................................................96

3.1.1. Оборудование...........................................................................................................96

3.1.2. Расходные материалы...............................................................................................96

3.1.3. Реактивы....................................................................................................................96

3.1.4. Ферменты..................................................................................................................97

3.1.5. Буферные и другие растворы...................................................................................97

3.1.6. Клеточные материалы..............................................................................................97

3.1.7. Последовательности олигонуклеотидных праймеров.............................................98

3.1.8. Программное обеспечение и web-pecypcbi..............................................................99

3.2. Методы...........................................................................................................................101

3.2.1. Фракционирование крови.......................................................................................101

3.2.2. Выделение геномной ДНК и тотальной фракции РНК.........................................101

3.2.3. Выделение ядер клеток...........................................................................................101

3.2.4. Выделение ядерной РНК........................................................................................101

3.2.5. Синтез кДНК...........................................................................................................102

3.2.6. ПЦР амплификация геномной ДНК.......................................................................102

3.2.7. ОТ-ПЦР амплификация..........................................................................................102

3.2.8. Поиск диморфных инсерций Alu и дизайн праймеров.........................................102

3.2.9. Статистический анализ...........................................................................................103

3.2.10. Подготовка ДНК-матрицы для транскрипции in vitro.........................................103

3.2.11. Транскрипция in vitro............................................................................................103

3.2.12. Расчет вторичных структур РНК.........................................................................103

Выводы..................................................................................................................................104

Публикации по теме диссертации........................................................................................104

Список литературы...............................................................................................................106

СПИСОК СОКРАЩЕНИЙ

OJIJI - острый лимфобластный лейкоз;

ОТ - обратная транскрипция;

ПЦР - полимеразная цепная реакция;

ОТ-ПЦР - полимеразная цепная реакция с обратной транскрипцией; гя-РНК - гетерогенная ядерная РНК; пре-мРНК - предшественник матричной РНК; мРНК - матричная РНК/

гя-кДНК - кДНК-копии гетерогенной ядерной РНК; НТО - нетранслируемая область мРНК; МГМ - молекулярно-генетический маркер; ПК - периферическая кровь;

ОКПК - одноядерные клетки периферической крови;

КМ - костный мозг;

п.о. - пара оснований;

т.п.о. - тысяча пар оснований;

SNP - single-nucleotide polymorphism (однонуклеотидная полиморфная замена); CNV - copy number variations (вариабельность числа копий); SINE - Short INterspersed Elements (короткие диспергированные элементы); LINE - Long INterspersed Elements (длинные диспергированные элементы); ORF - open reading frame (открытая рамка считывания).

ВВЕДЕНИЕ.

Одной из важнейших задач, стоящих перед современной функциональной геномикой, является поиск молекулярно-генетических факторов, вовлеченных в формирование различных комплексных фенотипов, проявляющихся при нормальных и особенно при патологичных состояниях организма. Наиболее остро стоит вопрос о молекулярных механизмах и факторах, лежащих в основе возникновения и развития социально значимых многофакторных и мультигенных заболеваний. Типичными представителями таковых являются патологии онкологического профиля.

По данным Американского онкологического общества рак по уровню смертности среди пациентов продолжает занимать одну из лидирующих позиций среди всех болезней человека (http://www.cancer.org/), оставаясь одним из самых опасных на настоящий момент заболеваний. Однако во многих случаях негативное воздействие на организм способно оказывать не только само заболевание, но и терапевтические подходы, обладающие значительными побочными эффектами. Особого внимания заслуживает терапия детских онкологических заболеваний, поскольку отдельные методы лечения могут приводить к необратимым нарушениям развития молодого организма (рис.1). Успехи последнего времени в области качества терапии рака во многом обязаны повышению понимания молекулярных и клеточных механизмов канцерогенеза, а также прогрессу в сфере разработки систем диагностики и прогноза развития рака.

Рисунок 1. Однояйцевые близнецы в возрасте 26 лет. Сестра, стоящая справа, перенесла в 4-х летнем возрасте острый лимфобластный лейкоз, прошла несколько этапов терапии, включая облучение. Дано по (.ЫИег, 2011).

Согласно современным представлениям, опухолевая трансформация клеток происходит в результате ступенчатого процесса накопления и отбора соматических мутаций. Часть мутаций, не являющихся нейтральными, приводит к активации генов позитивного контроля клеточного деления (онкогенов) и инактивации генов негативного контроля (онкосупрессоров). Такие мутации дают опухолевому клону пролиферативное преимущество

перед клетками-предшественниками и соседними здоровыми клетками. В результате происходит бесконтрольный рост и формирование опухолевой ткани, имеющей нередко гетерогенную структуру с одним или несколькими доминирующими клонами. Несмотря на то, что ведущая роль в малигнизации клеток принадлежит соматическим мутациям, некоторые существующие в популяции аллели онкозначимых генов и их сочетания могут являться факторами предрасположенности к развитию новообразования и иметь прогностическое значение, оказывая влияние на различные стадии канцерогенеза и определяя, таким образом, путь дальнейшего развития опухоли.

Инсерции ретроэлементов, благодаря сохраняющейся ретропозиционной активности, являются богатым источником новых аллелей генов и одновременно одной из причин возникновения соматического мозаицизма. Вместе с тем, инсерционный полиморфизм ретроэлементов считается одним из важнейших факторов вариабельности генома. Соматические инсерции ретроэлементов можно рассматривать в качестве селективных молекулярно-генетических маркеров опухолевых клонов, а некоторые полиморфные в популяциях человека инсерции как факторы предрасположенности к развитию онкологических заболеваний.

Наиболее многочисленной группой ретроэлементов в геноме человека является семейство Alu-повторов. Из более миллиона копий /¿/¿/-элементов около 2000 представляют собой полиморфные инсерции. Известно 25 de novo-инсерций Alu, участвующих в развитии различных генетических заболеваний. Интеграции в кодирующие области генов разрушают экзоны и приводят к сдвигу рамки считывания. Подобные инсерции являются причинами возникновения болезни Дента, гемофилии А, наблюдаются при некоторых семейных случаях рака яичников и рака молочной железы. Ряд интронных инсерций может при созревании транскрипта вызывать пропуск близлежащего экзона, в том числе со сдвигом рамки считывания. С этим явлением связана причина возникновения синдрома Аперта и нейрофиброматоза. Последовательности Л/и-элементов являются сайтами гомологичных рекомбинаций, которые нередко приводят к появлению протяженных делеций, способных захватывать один или несколько экзонов, нарушая целостность генов. Подобные делеции наблюдаются при таких заболеваниях, как наследственная копропорфирия и дефицит фактора V свертывания крови. Инсерции в интроны и З'-нетранслируемые области способны менять профили экспрессии соответствующих генов.

Имеются косвенные данные в пользу участия J/w-элементов в опухолевом патогенезе. Показано, что плотность инсерций Alu в известных онкосупрессорах значительно выше, чем в протоонкогенах. Кроме того, при многих онкологических заболеваниях инсерции Alu-элементов оказываются деметилированы. В некоторых случаях это приводит к повышению

уровня транскрипции J/и-элементов, что, в свою очередь, может способствовать увеличению частоты соматических ретропозиций Alu.

Ретропозиционная активность, способность модулировать экспрессию генов, а также вовлеченность в процесс опухолевого патогенеза, делает «мастер-гены» и некоторые полиморфные инсерции Л/м-элементов подходящими объектами для создания на их основе тест-систем для диагностики предрасположенности к онкологическим заболеваниям, прогноза их развития и выбора адекватной терапии. Кроме того, возможности полиморфных у4/м-маркеров в области идентификации личности позволяют в перспективе создать представительный набор функциональных молекулярно-генетических маркеров, одновременно являющийся генетическим паспортом пациента. Это является важным шагом в направлении развития персонифицированной медицины.

Актуальной задачей молекулярной биотехнологии в таком контексте становится создание надежной, информативной и методически доступной системы функциональных молекулярно-генетических маркеров, способной найти применение в медицинской практике.

Целью данной работы является разработка системы функциональных молекулярно-генетических маркеров на основе полиморфных инсерций А /м-ретроэлемснтов для диагностики риска развития острого лимфобластного лейкоза.

Для достижения поставленной цели решались следующие экспериментальные задачи:

разработка биоинформатического алгоритма для идентификации ретропозиционно активных инсерций А /м-ретроэлементов в геноме человека;

биоинформатический поиск полиморфных инсерций ^4/и-ретроэлементов в интронах генов человека, продукты которых могут являться потенциальными участниками малигнизации кроветворных клеток;

создание системы ПЦР-адаптированных молекулярно-генетических маркеров на основе выбранных инсерций Л/ы-элементов и сравнительное генотипирование образцов геномной ДНК здоровых доноров и пациентов с острым лимфобластным лейкозом;

проведение сравнительного анализа транскрипции аллельных пар генов в образцах, гетерозиготных по инсерциям/4/м-ретроэлементов на уровне первичных транскриптов;

изучение эффектов, затрудняющих интерпретацию результатов функционального анализа Alu, и поиск путей совершенствования подхода для осуществления функционального анализа инсерций Alu-элементов.

ГЛАВА 1. ОБЗОР ЛИТЕРАТУРЫ.

1.1. МОЛЕКУЛЯРНЫЕ И КЛЕТОЧНЫЕ ОСОБЕННОСТИ ОНКОЛОГИЧЕСКИХ

ЗАБОЛЕВАНИЙ.

Заболевания онкологического профиля являются типичными представителями мультифакторных и полигенных расстройств организма человека. В патогенез онкологических заболеваний вовлечены как генетические факторы, так и факторы окружающей среды. Различные комбинации этих факторов обуславливают возможность существования множества вариантов внешне сходных опухолей у различных индивидов. Иначе говоря, каждый случай новообразования индивидуален и может рассматриваться как отдельное заболевание. Тем не менее, несмотря на уникальность любого новообразования, развитие различных типов опухоли в целом происходит по общим принципам. Обобщенный сценарий канцерогенеза включает несколько последовательных этапов: инициацию, промоцию, ангиогенез, инвазию и метастазирование.

На стадии инициации происходит начало опухолевого перерождения. Ключевыми событиями на молекулярном уровне здесь являются инактивация путей индукции апоптоза, нарушения в системах репарации ДНК и повышение частоты мутаций. Благодаря повышенной частоте возникновения мутаций, растет вероятность накопления нормальной клеткой необходимых для опухолевой трансформации замен нуклеотидов. Появившиеся первичные опухолевые клетки постепенно получают пролиферативное преимущество по отношению к окружающим их здоровым клеткам и своим предшественникам. Повышенная частота мутаций