Бесплатный автореферат и диссертация по биологии на тему
Методические подходы к быстрому картированию сайтов расщепления генома
ВАК РФ 03.00.03, Молекулярная биология

Автореферат диссертации по теме "Методические подходы к быстрому картированию сайтов расщепления генома"

РОССИЙСКАЯ АКАДЕМИЯ НАУК

Институт биоорганической химии им академиков М М Шемякина и Ю А Овчинникова

На правах рукописи

ГАЙНБТДИНОВ ИЛЬДАР ВАИСОВИЧ

МЕТОДИЧЕСКИЕ ПОДХОДЫ К БЫСТРОМУ КАРТИРОВАНИЮ САЙТОВ РАСЩЕПЛЕНИЯ ГЕНОМА

специальность 03 00 03 - молекулярная биология

АВТОРЕФЕРАТ на соискание учёной степени кандидата биологических наук

ио3163416

Москва-2008

003163416

Работа выполнена в лаборатории структуры и функций генов человека Института биоорганической химии им академиков М М Шемякина и Ю А Овчинникова РАН Научный руководитель

кандидат химических наук Т Л Ажикина

Официальные оппоненты

доктор биологических наук К А Лукьянов

кандидат биологических наук И И Артамонова

Ведущая организация

Институт молекулярной биологии им В А Энгельгардта

Защита состоится в 10 часов на заседании

Специализированного совета Д 002 019 01 при Институте биоорганической химии им академиков М М Шемякина и Ю А Овчинникова РАН по адресу 117997, ГСП-7, г Москва, В-437, ул. Миклухо-Маклая 16/10

С текстом диссертации можно ознакомиться в библиотеке Института биоорганической химии им академиков ММ ШемякинаиЮА Овчинникова РАН

Автореферат разослан

Заместитель председателя Диссертационного совета,

член-корр РАН, доктор химических на;

ВМ Липкин

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ.

Актуальность проблемы.

Прошло уже более пяти лет с тех пор, как молекулярная генетика перешагнула важнейший рубеж в своем развитии - определение полной нуклеотидной последовательности генома человека Наличие подобного ресурса информации обеспечило прорыв в комплексных исследованиях функционирования генов, однако не дало окончательного ответа на вопрос, каким образом один и тот же набор кодирующих последовательностей позволяет формировать огромнейшее разнообразие типов клеток До сих пор однозначно неизвестно, какие именно механизмы участвуют в переключении активности генов и, таким образом, в образовании профиля экспрессии генов, необходимого для того или иного вида ткани Среди возможных факторов, определяющих эту дифференцировку и называемых "эпигенетическими", рассматриваются модификации ДНК, а также гистонов — белков, отвечающих за компактизацию хроматина В совокупности со специальными ДНК- и гистон-связывающими белками эти две эпигенетические модификации способны в разных тканях и на разных стадиях развития изменять набор экспрессирующихся генов Изучение подобного эпигенетического влияния ведется уже не первый десяток лет и метилирование ДНК (по пятому положению цитозинового основания) общепризнано считается одним из факторов, определяющих связывание транскрипционных факторов в промоторных областях генов Также имеются данные о вовлеченности этой модификации в процесс опухолеобразования эпигенетической инактивации онкосупрессоров и активации онкогенов Кроме того, считается, что метилирование ДНК ответственно за супрессию мобильных элементов, а также, предположительно, за поддержание стабильности хромосомного материала

Тем не менее, данные в этой области исследования ограничиваются достоверными, но все-таки фрагментарными сведениями о влиянии отдельных или нескольких сайтов метилирования ДНК на экспрессию тех или иных генов в конкретных наборах тканей Это обусловлено ограниченностью методической базы исследователей, использующих, главным образом, те подходы, которые позволяют опредетять статус метилирования локальных областей генома длиной не более нескольких тысяч пар оснований После полного секвенирования генома человека стали возможны и приобрели особую актуальность комплексные исследования целых геномных локусов Это может позволить получить представление о системной совместной работе генов, принадлежащих одному семейству или просто

располагающихся рядом в геноме, а также понять, какие изменения происходят на мультигенном уровне в процессе дифференцировки той или иной ткани или ее опухолевого перерождения Поскольку неметилированные области генома обычно содержат активно транскрибируемые гены, то создание протяженных и даже полногеномных профилей метилирования ДНК могло бы позволить косвенным образом определить характер экспрессии в исследуемом образце

Сравнительно недавно в Лаборатории Структуры и Функций Генов Человека ИБХ РАН был предложен, разработан и успешно применен новый подход к определению профиля метилирования ДНК на протяженных участках генома размером от нескольких сотен тысяч пар оснований (NGSCC, Nonmethylated Genomic Sites Coincidence Cloning, Azhikina et al, 2004) Метод заключается в картировании неметилированых сайтов той или иной метил-чувствительной эддонуклеазы рестрикции Однако он сопряжен с довольно большим объемом секвенирования, влекущим за собой значительные временные затраты и дороговизну рутинных исследований Данная работа была направлена на создание нового экспериментального подхода, значительно снижающего количество времени и ресурсов, необходимых для картирования сайтов расщепления генома (в данном случае - последовательностей узнавания метил-чувствительной эндонуклеазы)

Цели и задачи работы

Цечью настоящей работы являлась разработка и применение нового метода быстрого картирования сайтов расщепления заданных сегментов генома длиной от 1 до нескольких млн п о (RIDGES, Rapid IDentificatxon of GEnomic Splits) на примере сайтов расщепления метил-чувствительной эндонуклеазой рестрикции Этот метод представляет собой эффективный подход к изучению метилирования протяженных участков генома, который можно использовать для рутинных исследований одновременно большою количества образцов Работа состояла из двух основных частей 1 Разработка нового экспериментального метода экспресс-картирования 2 Создание комплекса компьютерных программ, осуществляющих обработку результатов и их визуализацию

Были поставлены следующие задачи

- Создание и оптимизация метода быстрого картирования сайтов расщепления протяженных фрагментов геномной ДНК метил-чувствительными эндонуклеазами рестрикции

- Разработка теоретической базы и создание программного обеспечения, потностью автоматизирующего процесс картирования

- Разработка принципов визуализации получаемых результатов и создание комплексного программного обеспечения, осуществляющего эту задачу

- Получение карты распределения неметилированных ЯраН-сайтов для локуса П198208-СОХ7А1 19 хромосомы человека (длина 1 млн по) в ткани легких и подтверждение полученных результатов независимыми методами

Научная новизна и практическая ценность.

Был впервые разработан и протестирован новый методический принцип, отличающийся от ранее использовавшихся распространенных экспериментальных подходов, позволяющий с минимальными затратами времени картировать сайты расщепления генома Метод характеризуется в первую очередь быстротой применения и подходит для рутинной исследовательской работы, включающей изучение большого количества образцов С его помощью был впервые подробно исследован профиль метичирования протяженного мультигенного локуса генома человека длиной более 1 млн пар оснований

Для облегчения и ускорения обработки получаемых массивов данных был создан комплекс программных продуктов, позволяющих также гибко изменять параметры анализа результатов

Так как получаемые результаты сложно интерпретировать в исходном "сыром" виде, были предложены несколько подходов к их визуализации, а также разработано программное обеспечение, осуществляющее эту визуализацию максимально простым для пользователя способом

Таким образом, основным практическим результатом работы стало создание принципиально новой разработанной методической базы для исследования статуса метилирования ДНК Методика может быть применена для комплексного и даже полногеномного исследования влияния метилирования как эпигенетического фактора на дифференцировку тканей, неоплазию и другие фундаментальные клеточные процессы

Структура диссертации

Диссертация изложена на ^листах машинописного текста, имеет традиционную структуру и состоит из следующих разделов введения, обзора литературы, изложения результатов и их обсуждения, экспериментальной части, выводов, списка цитируемой литературы, включающего /(^"ссылок, и приложений

Основные экспериментальные данные и разработки, представленные в диссертации, получены лично автором Исследования проводи дись в соавторстве со Скворцовой Ю В (ЛСФГЧ, ИБХ РАН)

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

1 Rapid IDentification of GEnomic Splits (RIDGES) - метод быстрого картирования сайтов расщепления генома .

Расщепление геномной ДНК в функционально значимых сайтах (гипо- и гиперметилированных CpG динуклеотидах, участках, чувствительных к ДНКазе1 и связывающих хроматин) и последующее их картирование широко применяется в функциональных исследованиях генома. Для определения координат картируемых сайтов образующиеся в результате эксперимента многочисленные фрагменты необходимо секвенировать, что является трудоемкой и дорогостоящей задачей Для решения этой проблемы нами было предложено использовать принцип, примененный Велкулеску при создании метода SAGE (Velculescu et al, 1995) и заключающийся в секвенировании не полных фрагментов, а коккатемеров их коротких репрезентативных участков (тагов)

Для этого исподьзуются эндонуклеазы рестрикции IIS типа, вносящие разрыв в ДНК на некотором отдалении от сайта узнавания Искусственное введение последовательности узнавания такой эндонуклеазы около картируемого сайта геномного расщепления осуществляется посредством лигирования нуклеотидного адаптера(Рис 1)

Последующая обработка полноразмерных фрагментов этой эндонуклеазой приводит к образованию тагов Эти короткие участки являются репрезентативными, поскольку получены однотипно, а их нукдеотидная последовательность является достаточной для однозначного картирования Длина их определяется выбором используемого фермента IIS типа, и в нашем случае была использована эндонуклеаза Mmel, вносящая разрыв через 21 пару оснований от своего сайта узнавания Данный выбор обусловлен тем фактом, что на момент выполнения работы Mmel являлся единственньм коммерчески доступным ферментом, позволяющим получать таги наибольшей длины и, таким образом, максимально однозначно картировать сайты геномного расщепления

ДНК

Сайт расщепления генома __I_

Расщепление генома

Сайт рестрикции Лигирование адаптора

эндонуклеазы IIS типа

ПЛ

Образование тагов

I I 1=1

- > > Образование димеров тагое

ш

Образование конкатемеров тагов

11 i11 ИФЦ=Н=И

Библиотека SAGE Рисунок 1. Схематическое изображение принципиальных стадий SAGE.

Конкатемеризация тагов и последующее секвенирование полученных конкатемерных молекул позволяет получить информацию о сайтах расщепления генома при существенно меньших материальных и временных затратах на секвенирование

1.1 Схема метода.

Новый метод был разработан на примере картирования сайтов расщепления генома метил-чувствительной эндонуклеазой рестрикции Hpall, (сайт узнавания CCGG). Поскольку полногеномный анализ сайтов CCGG не представляется возможным из-за большого количества этих сайтов (несколько десятков миллионов для генома человека) мы ограничили изучение локусом D19S208-COX7A1 19 хромосомы длиной 1022 тыс. п.о. Этот локус хорошо охарактеризован и является модельным объектом для построения полной функциональной карты регуляторных цис-элементов на полигенном протяженном геномном участке, проводимого в Лаборатории

5

Структуры и Функций Генов Человека (ИБХ РАН) Изучение распределения неметилированных CpG динуклеотидов в этом локусе проводилось для геномной ДНК образца легочной ткани человека

Ранее в ЛСФГЧ был разработан метод картирования неметилированных CpG сайтов в протяженных геномных локусах (NGSCC) Мы использовали этот метод для получения набора фрагментов ДНК, принадлежащих локусу DI9S208-COX7A1 и содержащих CpG динуклеотид в составе сайта узнавания эндонуклеазы Hpall, неметилированный в ДНК легочной ткани Дальнейшее клонирование данных фрагментов и определение их нуклеотидной последовательности позвотяло картировать неметилированные CpG динуклеотиды по длине исследуемого локуса и, таким образом, получить тканеспецифическую карту распределения неметилированных сайтов в протяженном геномном токусе Чем больше котичество картированных фрагментов, тем более достоверным будет получаемая карта, однако это сопряжено со значительным объемом секвенирования

Полученная нами смесь представляла из себя набор Alul-Hpall рестриктных фрагментов, фланкированных с двух сторон адаптерами А (фланкирующий Alul сайт) и Б (фланкирующий Hpall сайт) (рис 2,1)

Для введения последовательности узнавания эндонуклеазы IIS типа в непосредственной близи от исследуемого Hpall сайта полученные фрагменты гидролизовали эндонуклеазой Hpall (рис 2,1), затем смесь лечили на две части и к образованному "липкому" концу лигировали адаптеры ВД и ГД (рис 2,2, адаптеры содержат общую (Д) 5'-последовательность, а также сайт Mmel на 3'-конце) Для удобства дальнейшей работы проводили амплификацию продукта лигирования (рис 2,11) с праймерами, идентичными последовательностям лигированных адаптеров (рис 2, 3) После обработки амплификата эндонуклеазой Mmel (рис 2,4) образовавшиеся 60-ти звенные нуклеотидные фрагменты (рис 2,111) изолировали с помощью ПААГ электрофореза (рис 2,5), а затем смешивали друг с другом и проводили лигирование (рис 2,6) При этом образовывались фрагменты (рис 2, IV), содержащие лигированные «хвост к хвосту» таги и различающиеся на концах адапторные последовательности

Эти фрагменты амплифицировали в два этапа сначала с праймерами, идентичными внешней части адаптеров Д, а затем внутренней В и Г (рис 2,7) Стация образования димеров (молекулы структуры IV, рис 2) вводится для последующего выявления артефактов ПЦР селекции поскольку вероятность образования двух идентичных димеров в силу статистических закономерностей чрезвычайно низка, то

AluI

Hpall

Alul

I-

Hpall

идролиз Hps!) (1) Лигирование адаптеров БД и ГД (2)

ПЦР (И AlpI

Mmel

Hpall (III) «-

Mmel

(IV)

Гидролиз Mmel (4)

ПААГ электрофорез (5) HpaH -<

-_Ьгаж

Лигирование (6)

ПЦР (7)

Hpall Hpall

-м-

Mmel

Гидролиз Hpall, ПААГ электрофорез (8)

Hpall

(V) PL

-*4-

Mmel

Hpall

—Ip

Лигирование (9)

Hpall

Hpall

Hpall

Hpall

(VI)

Mtnel

Mmel

Hpall

HpoII

-+4-

-*4-

-M-

-*>4-

-M-

Рисунок 2 . Схема метода RIDGES. ДНК обозначена горизонтальными линиями и стрелками. Сайты узнавания рестрикционных эндонуклеаз - вертикальными линиями, аданторные последовательности А, Б, В, Г, Д - прямоугольниками. 1-9 - стадии эксперимента (объяснения в тексте), I-VI - промежуточные продукты.

появление их объясняется именно этим эффектом, по этой причине повторяющиеся последовательности удаляются из последующего анализа.

Для избавления от адапторных последовательностей амплификат гидролизовали эндонуклеазой Hpall. Целевые таги длиной 21 п.о. выделяли в полиакриламидном геле в виде димеров (рис.2,У), после чего для образования конкатамеров (рис.2,VI) полученные димеры лигировали друг с другом (рис.2,9).

1500 по—* 500 по-*

100 по—о-

Рисунок 3. Результат электрофоретического разделения продуктов конкатамери-зации димеров (агароза, 2%). М - маркер длин ДНК, Н - конкатамеры, полученные из нормальной ДНК легких человека.

Пример получения коикатамерных последовательностей из дитагов приведен на рис.3 Видно, что длина конкатамеров составляет тысячи п.о., что соответствует по крайней мере сотням тагов на одну молекулу конкатамера.

Для последующего клонирования к образовавшимся конкатемерам лигировали адаптор, лигазную смесь амплифицировали с праймером, идентичным адаптеру. Для удобства последующего секвенирования клонов в дальнейший анализ отбирали фракцию конкатемеров длиной не более 600 п.о.. Эту фракцию конкатемерных молекул лигировали в вектор и клонировали.

В результате определения нуклеотидной последовательности клонированных конкатамеров полностью подтвердилась их структура - 21 -нуклеотидные таги, перемежающиеся CCGG -сайтом узнавания Нра\\ эндонуклеазы (структура VI на рис

1.2 Компьютерная автоматизация обработки получаемых результатов и их картирования.

Обработка результатов секвенирования конкатамеров и дальнейшее картирование неметилированных сайтов ЯрдП вручную является крайне трудоемким. По этой причине было решено автоматизировать обработку результатов эксперимента с помощью компьютерного программного обеспечения, для создания которого был выбран современный продукт Delphi 7 компании Borland. Объектно-ориентированная среда Delphi 7 позволила создать серию удобных для пользователя программ, предназначенных для следующих этапов обработки:

А. Формирование списка всех 21-нуклеотидных тагов, полученных в результате секвенирования конкатамеров

Для этой цели предназначена программа RIDGES_ExtractTags, где в качестве входного используется текстовый файл в стандартном FASTA формате, содержащий нуклеотидные последовательности конкатамеров Программа пошагово наглядно осуществляет следующие операции (по желанию пользователя все промежуточные результаты можно сохранять и использовать эти файлы для дальнейшего анализа с любой стадии)

- указание картируемого сайта, разграничивающего димеры 21-нуклеотидных тагов (в нашем случае fípall), и поиск димеров в нуклеотидной последовательности конкатамеров с учетом максимальной и минимальной длины димеры, образующиеся из тагов, могут иметь не только каноническую длину, но и большую, как результат лигирования при отжиге одного, а не двух выступающих нуклеотидов, и при "тупом" лигировании после случайной достройки "липких" концов тагов, также возможные ошибки полимеризации в ходе ПЦР могут уменьшать длину димеров,

удаление из полученного списка совпадающих по нуклеотидной последовательности димеров (появление их в результатах крайне маловероятно в силу статистической закономерности образования димеров и объясняется ПЦР селекцией, см выше),

- выделение из димеров отдельных тагов, а также их одинаковая ориентация относительно разграничивающего сайта (для наглядности и удобства последующей обработки),

Результаты сохраняются в текстовом файле FASTA формата, наглядны и удобны для дальнейшего использования

Б. Создание базы данных всех присутствующих в исследуемом локусе 21-нуклеотидных тагов, фланкирующих сайты Hpall.

Получаемый в конечном итоге набор коротких 21-нуклеотидных тагов необходимо однозначно картировать по длине исследуемого участка генома Для этого требуется предварительно создать базу всех возможных имеющихся в локусе репрезентативных фрагментов Данная задача реализуется в автоматическом режиме с помощью программы RIDGES_DATABASEAnchorHelper Как и предыдущая, эта программа совершает пошаговые операции с нуклеотидной последовательностью изучаемого локуса

- поиск в последовательности исследуемого отрезка генома всех картируемых с помощью NGSCC сайтов (5'-CCGG-3', содержащиеся в Alul-Hpall, параметр можно изменять в зависимости от используемой метил-чувствительной эндонуклеазы),

- вычленение 21-ти звенных тагов, фланкирующих картируемый 5'-CCGG-3'c обеих сторон,

-исключение из конечной базы 21-ти звенных тагов, которые нельзя однозначно картировать Как правило, это таги, расположенные в повторяющихся элементах генома Так, был проведен предварительный статистический расчет картируемости 21-ти звенных тагов, содержащих сайт эндонуклеазы Hpall , в локусе D19S208-COX7A1 Согласно полученным результатам около 12% всех присутствующих в локусе CCGG сайтов невозможно картировать из-за вырожденности содержащих их тагов Как оказалось, эта сравнительно небольшая фракция, принадлежит, в основном, не функционально значимым, а высокоповторяющимся элементам генома, главным образом SINE то есть особого интереса для исследователей не представляет

Сохраненные в текстовом файле FASTA формата результаты содержат набор полученных последовательностей В заголовке каждой из них указан порядковый номер картир>емого сайта и его относительная координата по длине исследуемого локуса генома Этот файл далее используется для переформатирования его в базу данных тагов исследуемого локуса с помощью стандартной программы formatdb пакета BLAST

В Картирование полученных экспериментально тагов по базе данных тагов исследуемого локуса

Далее осуществляется поиск в построенной общей базе тагов исследуемого локуса тех тагов, которые содержатся в результатах реального эксперимента Это производится путем сравнивания базы данных и текстового файла, полученного в RIDGES_ExtractTags, с помощью алгоритма BLAST, что позволяет легко получить относительные координаты всех картированных в эксперименте сайтов по длине исследуемого локуса генома

Первоначально эти координаты содержатся в стандартном текстовом файле вместе с подробной информацией о выравнивании результатов BLAST Для удобства пользователя необходимо перевести эти данные в простой список координат Созданная для этой цели программа RIDGESJSortout осуществляет поиск по файлу результатов выравнивания BLAST всех полных (21 из 21) и неполных совпадений (20 из 21 в случае ПЦР ошибок, имеется возможность отключить поиск этих неточных

соответствий) и экстракцию относительных координат соответствующих Нра\\ сайтов в отдельный список;

Конечный результат (список) сохраняется в удобном формате в обычном текстовом файле с суммированными данными (с указанием общего количества точных и неточных совпадений).

1.3 Подходы к функциональному анализу получаемых результатов и их компьютерная реализация.

1.3.1 Визуализация результатов картирования.

Финальным этапом любого метода является функциональный анализ полученных в ходе эксперимента результатов. В силу очевидно большого объема последних эта стадия представляется довольно сложной без выработки определенных подходов к ее решению.

Одним из таких подходов является графическая визуализация местоположения каждого картированного неметилированного сайта относительно кодирующих и регуляторных последовательностей, а также различных повторяющихся элементов исследуемого геномного локуса. За основу для реализации данной задачи было решено использовать Геномный Браузер (UCSC Genome Browser, сервер Университета Санта-Круз, США, http://genorae.ucsc.edu/). Для интеграции в удобный графический интерфейс Геномного Браузера данных о картированных неметилированных сайтах НраМ необходим файл специального формата. Для подготовки этого файла был создана программа RIDGES_barchartetc. Кроме непосредственного отображения всех картированных сайтов имеется также возможность указания степени повторяемости каждого из них в результатах эксперимента (рис.4).

1ИНЭТЫ _

илиро- _

сайты

Гены —►

Рисунок 4. Пример визуализации с помощью Геномного Браузера. Обозначения слева от рисунка: "Координаты" - абсолютные координаты на хромосоме, "Неметилированные сайты" - результат картирования неметилированных Нрай сайтов в легочной ткани человека, "Гены" - схематическое изображение генных экзонов (широкие линии), интронов (узкие линии) и направления транскрипции (стрелки).

II II

FLJ25660 ^

404500001

LISF2 H^J AY147B80 |Ц>?»| _НАМР_У_

40500000]

40550006)

lillll II I

II I! Illlll III I I Elll 11

ф :||> |i >; > |) Я CD22 > ф >|>|: ДО GPR42 |

MAG (-¡H GPR40 |

AK026467 | -. я GPR41

1.3.2 Нормализация и последующая визуализация нормализованных результатов.

Как уже было упомянуто выше, новый экспериментальный подход дает в качестве результата набор неметилированных сайтов исследуемого локуса Однако распределение CpG динуклеотидов в составе CCGG сайта в геноме неравномерно и отсутствие экспериментально найденных сайтов в каких-либо участках генома может отражать всего лишь отсутствие возможности картировать сайты в этих участках Таким образом, для правильной интерпретации результатов необходимо нормализовать их перед отображением

Одним из способов нормализации является подсчет отношения количества сайтов, картированных в результате эксперимента, к общему количеству всех сайтов, которые можно картировать с помощью RIDGES Подсчет этого отношения ведется внутри отрезков, содержащих равное количество последних, и отображается в соответствующем масштабе В данном случае при отображении масштаб физической карты и получаемой карты нормализованной плотности метилированности совпадать не будут Однако для удобства интерпретации результатов необходимо эти две карты привести в соответствие обе карты приводятся на экране и с помощью соединяющих их линий обозначаются общие границы отрезков, внутри которых проводится подсчет нормализованной степени метилированности Причем степень метилированности каждого отрезка изображается в виде столбца соответствующей высоты (рис 5)

Для избавления исследователя от ручного создания подобного рисунка была создана программа Physrestmap Для нее в качестве входных требуются два текстовых файла, содержащих 1) все сайты изучаемого участка генома, которые возможно картировать и 2) набор сайтов, полученный в результате реального эксперимента Кроме этого необходимо указать полную длину исследуемого локуса и количество сайтов в отрезках, на которые он будет делиться Дополнительно по желанию пользователя можно менять графические параметры получаемого рисунка

Таким образом, для обработки и визуализации получаемых результатов был создан комплексный программный продукт с простым интерфейсом, осуществляющий все необходимые операции

NGSCC Гены

RIDGES

Рисунок 5. Пример нормализации с помощью программы Physrestmap нормализованных результатов эксперимента с легочной тканью человека (локус D19S208-COX7A1). Обозначения слева от рисунка: "NGSCC" - результат картирования неметилированных сайтов Нрай, полученных с помощью NGSCC, "RIDGES" -результат картирования неметилированных сайтов Нра\\, полученных в результате конкатамеризации "Гены" - схематическое изображение генов исследуемого локуса (направление стрелок соответствует направлению транскрипции).

2. Распределение неметилированных сайтов //pall в локусе D19S2Q8-COX7A1 19 хромосомы для легочной ткани человека.

В ходе RIDGES из последовательностей 60 конкатемеров благодаря вышеописанному программному обеспечению были получены последовательности 906 21-нуклеотидных тагов, что составляет около 15 тагов на один конкатемер (это значение определяется, главным образом, длиной одного прохода чтения при реакции секвенирования).

Из общего количества тагов картировать по длине исследуемого локуса удалось около 76% (686), что позволило определить местоположение неметилированных Нра\\ сайтов. Невозможность картировать остальные 24% тагов можно объяснить ошибками секвенирования и SNP полиморфизмом.

^ i Локализация Ilpall сайта Количество повторяющихся тагов Статус метилирования ilpall сайта (жирный кружок) и ближайших СрО: бс ль! й-не метилирован, черный-метнлирован, серый -присутствие метилированных и нсмстилиропанпг.тх шитслсй.

1 2 экзон РКУ2 1

2 3 интрон MGC15677 2 99»

3 11 интрон SSX26 " 2

4 4 интрон ал i'ds 7

5 7 интрон ом ms И)

6 27 экзои мае имзз 32

7 36 экзон .\ract.mi 33

Рисунок 6. Результат бисульфитного секвенирования Hpall сайтов, представленных повторяющимися тагами.

Общее количество уникальных картированных HpaU сайтов составляет 286 143 из них представлены одним тагом, 70 - двумя и далее 30x3, 14x4, 10x5, 2x6, 5x7, 2x8, 3x9, 3x10, 2x11, 1x32, 1x33 Неравномерность представленности тагов может быть связана с различной степенью метилированности разных CpG динуклеотидов как следствие гетерогенности популяции клеток исследуемой ткани Этот предположение было подтверждено бисульфитным секвенированием HpaU сайтов, представленных повторяющимися тагами (рис 6) Результат эксперимента позволил продемонстрировать наличие неметилированых аллелей практически во всех исследованных Нра\\ сайтах, присутствие же метилированных аллелей объясняется гетерогенностью клеточной популяции легочной ткани Была также показана некоторая количественная зависимость повторяемости от неметилированности Очевидно, могут иметься и другие факторы, влияющие на представленность тагов в конкатемеров, в частности, ПЦР селекция

Параллельно было проведено определение нуклеотидной последовательности клонированных фрагментов ДНК, полученных с помощью NGSCC из идентичного образца легочной ткани В результате секвенирования 335 клонов картировано 270 неметилированных сайтов Hpall, из которых уникальными были 190 Остальные 65 в большинстве представляли собой Alul-Alul фрагменты Их появление объясняется тем фактом, что в геномной ДНК количество сайтов узнавания А1и\ по сравнению с HpaU на порядок больше, в результате представленность Alul-Alul фрагментов значительно превосходит представленность Alul-Hpall, что не позволяет полностью избавиться от первых RIDGES в отличие от NGSCC позволяет избавиться от таких фрагментов с самого начала, так как первой стадией протокола является стадия гидролиза эндонуклеазой HpaU, в которой Alul-Alul фрагменты участвовать не способны

При статистическом сравнении двух экспериментальных походов было показано, что 83 из 190 (44%) картированных с помощью NGSCC сайтов Hpall совпали с найденными в RIDGES Неполное совпадение объясняется тем, что наборы неметилированных CCGG, полученных NGSCC и RIDGES, являются двумя независимыми и неполными выборками довольно большого множества Основываясь на данных о количестве повторяющихся тагов, можно примерно оценить суммарное теоретическое количество неметилированных Hpall сайтов для RIDGES и NGSCC) Для этого использовали формулу Пуассона, которая описывает распределение вероятности (Р) появления элемента множества в независимой выборке в количестве х PixMl^/xOe11. где р. - параметр распределения Пуассона, зависящий от размеров множества и выборки В программной среде Maple V Release 5 0 вычисляли

максимально приближенные параметры распределения, на основе которых определяли примерный размер каждого множества: 630 и 500 для NGSCC и RIDGES соответственно. То есть в рассмотрение было взято примерно 30 and 57% от общего возможного количества картируемых неметилированных сайтов, что позволяет делать качественные выводы о профиле их распределения, так как является достаточно репрезентативной выборкой общего множества.

Для общего сравнения распределения неметилированных Hpall сайтов, получаемых в ходе прямого секвенирования фрагментов, полученных в NGSCC, и секвенирования конкагамеров тагов, представляющих эти фрагменты (RIDGES), был использован подход с использованием предварительной нормализации, описанный выше. Весь исследуемый локус в данном случае был поделен на 60 отрезков по 30 Hpall сайтов в каждом (рис.5). Согласно полученным данным высота пиков для обоих методов отличается слабо в подавляющем числе случаев. Таким образом, общие профили метилирования, полученные с помощью прямого секвенирования фрагментов и RIDGES, практически совпадают, что позволяет говорить о надежности и воспроизводимости нового экспериментального подхода.

ss

О А

¿•ЩШ?!'

________... * чУ^щгогаюИШИМпш?!-1

вШя№

Рисунок 7. Объединенные результаты NGSCC и RIDGES на легочной ткани человека, нормализованные и представленные с помощью программы Physrestmap. SS - количество картированных неметилированных на 30 присутствующих в геноме Iipall сайтов. Локус DI9S208-COX7A1 условно поделен на 10 сегментов (от 0 до 1). Гены схематически изображены в виде стрелок, направление которых соответствует направлению транскрипции; СрО-островки представлены вертикальными полосками различной толщины, соответствующей их физической длине в локусе.

После объединения результатов NGSCC и RIDGES было получено 393 уникальных неметилированных Hpall сайта и построен общий профиль их распределения по длине исследуемого локуса. При этом можно сделать вывод об общей кластеризации картированных неметилированных сайтов в областях, богатых генами, как описанными, так и гипотетическими. Подобная тенденция совпадает с общеизвестными фактами о распределении метилированных сайтов по геному. В

частности, около 40% всех картированных сайтов располагается в генных областях, включая интроны, несмотря на то, что они составляют лишь примерно 25% изучаемого локуса Таким образом, в исследуемом локусе кодирующие области, согласно данным, полученным нашим методом, являются менее метилироваными, чем межгенные отрезки Этот вывод совпадает с общепринятым наблюдением, согласно которому гены обычно неметилированы по отношению к остальной части генома

Около 50% неметилированных HpaXL сайтов локализована в пределах повторяющихся элементов различных классов (главным образом, в коротких диспергированных повторах) При этом почти половина этих сайтов (=40%) содержится в повторах, располагающихся в интронах различных генов Таким образом, существенная фракция неметилированных ретроэлементов в исследуемом локусе находится в генных областях Этот результат находится в полном согласии с литературными данными, согласно которым большая часть транспозирующихся элементов генома находится в метилированном состоянии, неметилированными остаются, главным образом, только те, что располагаются в пределах генов

Неожиданным оказалось присутствие в профиле распределения неметилированной безгенной области, располагающейся в интервале с относительными координатами 0,24-0,34 (рис 7) Это, возможно, указывает на отсутствие корреляции между плотностью генов и плотностью метилирования Однако более детальное изучение этого участка, возможно, позволит обнаружить в нем кодирующие области Также необходимо отметить, что в нем было локализовано некоторое количество сайтов связывания транскрипционных факторов (Chernov et al, 2006)

Таким образом, новый метод успешно применен к созданию набора неметилированных Hpall сайтов внутри отрезка генома человека между генами FXYD5 и СОХ7А1 Представленный метод также может быть использован для картирования любых сайтов расщепления генома последовательностей узнавания других метил-чувствительных (Notl) и метил-нечувствительных эндонуклеаз, сайтов, расщепляемых ДНКазоМ, химическим или физическим воздействием

Основным преимуществом нового подхода является значительное сокращение объема секвенирования, нужного для картирования сайтов расщепления Это позволяет интегрировать данный принцип в любую методику, где возникает необходимость в рутинном определении местопочожения того или иного сайта по длине генома

выводы

1) Создан принципиально новый методический подход к экспресс-картированию сайтов расщепления протяженных фрагментов генома (на примере картирования сайтов расщешения метил-чувствительной эндонуклеазой Нра11)

2) Создано программное обеспечение, необходимое для обработки результатов метода и их визуализации

3) Впервые с помощью разработанного метода получена подробная карта метилирования для локуса В198208-СОХ7А1 19й хромосомы в нормальной ткани легких чечовека Продемонстрирована кластеризация картированных неметилированных сайтов в областях, богатых генами

Основные результаты диссертации изложены в следующих работах-

ИВ Гайнетдинов, ТЛ Ажикина, ЕД Свердлов Биохимия (2007) 72 1449 -1458 Короткие репрезентативные последовательности в структурных и функциональных геномных исследованиях.

Azhikina Т, Gainetdinov I, Skvortsova Y, Sverdlov E Mol Gen Genomics (2006) 275 615-622 Methylation-free site patterns along a 1-Mb locus on Chrl9 m cancerous and normal cells are similar A new fast approach for analyzing unmethylated CCGG sites distribution

Azhikma T, Gainetdinov I, Skvortsova Y, Batrak A, Dmitneva N, Sverdlov E Mol Gen Genomics (2004) 271 22-32 Non-methylated Genomic Sites Coincidence Cloning (NGSCC) an approach to large scale analysis of hypomethylated CpG patterns at predetermined genomic loci

Тезисы научных конференций-

Ажикина Т JI, Скворцова Ю В , Гайнетдинов И.В , Свердлов Е Д "Метод клонирования идентичных последовательностей (Coincidence Cloning) в геномных исследованиях" (2007), Новосибирск, III международная конференция "Фундаментальные науки - медицине " (тезисы докладов стр 13)

Скворцова Ю В , Гайнетдинов И.В , Ажикина Т Л , Свердлов Е Д "Изучение тканеспецифического метилирования протяженных геномных локусов» (2007), Москва, XIX зимняя молодежная научная школа "Перспективные направления физико-химической биологии и биотехнологии " (тезисы докладов стр 9)

Azhikina Т, Skvortsova Yu, Gainetdinov I, Sverdlov E "RIDGES - a new technique for construction of high density map of unmethylated CpG sites within preselected genomic loci " (2006) Helsinki, Finland, "Human Genome Meeting" (Abstract book, p 76)

Gaynetdinov I, Azhikma, Skvortsova Y, Sverdlov E "ExAGeM - a high-throughput approach to analysis of CpG methylation along large genomic loci" " (2004), "Functional Genomics, Exploring the Edges of Omics" EMBL/EMBO 2nd symposium EMBL, Heidelberg, Germany (Abstract Book, p 54)

Azhikma T, Skvortsova Y, Gainetdinov I, Sverdlov E "Differences in DNA methylation profiles within 1Mb long D19S208-COX7A1 locus lb normal lung and non-small lung cancer " (2004), "DNA Methylation - An Important Genetic Signal Its Significance in Biology and Pathogenesis" Symposium der Deutschen Akademie der Naturforscher Leopoldma, Weissenburg, Germany (Abstract Book, p 59)

Gainetdinov I, Batrak A, Skvortsova Y, Azhikma T, and Sverdlov E " Nonmethylated Genomic Sites Coincidence Clonmg (NGSCC) - an approach to large scale analysis of hypomethylated CpG patterns m predetermined genome loci and comparison of the patterns in normal tissue and seminoma" (2003), "Comparative and Functional Genomics Workshop", Hinxton, The United Kingdom (Abstract Book, p 38)

Gainetdinov I, Skvortsova Y, Batrak A, Azhikina T, and Sverdlov E "Tissue-specific methylation of the human D19S208-COX7A1 locus" (2003), Conference for Young Scientists, PhD Students and Students on Molecular Biology and Genetics, Kyiv, Ukraine (Abstract Book, p 61)

Подписано в печать 12 12 2007 г Печать трафаретная

Заказ № 1053 Тираж 100 экз

Типография «11-й ФОРМАТ» ИНН 7726330900 115230, Москва, Варшавское ш, 36 (495) 975-78-56, (499) 788-78-56 www autoreferat ru

Содержание диссертации, кандидата биологических наук, Гайнетдинов, Ильдар Ваисович

СПИСОК СОКРАЩЕНИЙ

ГЛАВА I. ПРИНЦИПЫ Й ЭКСПЕРИМЕНТАЛЬНЫЕ ПОДХОДЫ К

ИЗУЧЕНИЮ МЕТИЛИРОВАНИЯ ДНК. ОБЗОР ЛИТЕРАТУРЫ

Введение. Метилирование ДНК и возможные его функции

1.1 Способы определения общего количества 5-метил-цитозина

1.2 Применение метил-чувствительных рестрикционных эндонуклеаз

1.3 Секвенирование по Максаму-Гилберту

1.4 Бисулъфитное секвенирование

1.5 МВИ-аффинная колонка 25 Заключение

ГЛАВА II. РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЯ

2.1 Создание и оптимизация нового метода

2.2 Компьютерная автоматизация обработки получаемых результатов и их картирования

2.2.1 Формирование списка всех 21 -нуклеотидныхрепрезентативных последовательностей, полученных в результате секвенирования конкатмеров

2.2.2 Создание базы данных всех присутствующих в исследуемом локусе 21-нуклеотидных фрагментов, фланкирующих сайты НраП; которые можно картировать с помощью МЗ&СС

2.2.3 Картирование имеющихся 21-нуклеотидных фрагментов по базе исследуемого локуса

2.3 Подходы к функциональному анализу получаемых результатов и их компьютерная реализация

2.3:1 Визуализация результатов картирования* 36 2.3.2 Нормализация и последующая визуализация нормализованных результатов

2.4 Получение распределения гипометилированных сайтов НраП в локусе В19Б208-СОХ7АТ19 хромосомы для нормальной легочной ткани человека

ГЛАВА III. ПРАКТИЧЕСКАЯ ЧАСТЬ

3.1. Материалы

5.2. Методы 47 ВЫВОДЫ 56 СПИСОК ЛИТЕРАТУРЫ ; 57 БЛАГОДАРНОСТИ 66 ПРИЛОЖЕНИЯ >1«1>1 I., I I . . м ■■

СПИСОК СОКРАЩЕНИЙ

SINE - Short Interspersed Nuclear Elements (короткие диспергированные повторы); ВЭЖХ — высокоэффективная жидкостная хроматография; ОФ-ВЭЖХ - обратно фазовая высокоэффективная жидкостная хроматография; SAM - S-аденозил-метионин, ПЦР - полимеразная цепная реакция; ERMA - enzyme regional methylation assay; ПДРФ - полиморфизм длин рестриктных фрагментов, LM-PCR - ligation mediated PCR (ПЦР с предварительным лиированием адаптерных последовательностей); ПДАФ -полиморфизм длин амплификационных фрагментов, MSAP - methylation sensitive amplification polymorphism; MSRF - methylation-sensitive restriction fingerprinting (метил-чувствительный рестрикционных фингерпринтинг); RLGS-M - restriction landmark genomic scanning using methylation-sensitive restriction endonucleases (метил-чувствительное геномное сканирование с использованием двумерного гель-электрофореза); MCA - methylated CpG island amplification (амплификация метилированных CpG островков); NGSCC - Non-methylated Genomic Sites Coincidence Cloning (клонирование совпадающих неметилированных последовательностей); URS — Unmethylated Restriction Sites (неметилированный сайт рестрикции); MSP - methylation-specific PCR (метил-специфический ПЦР); MS-SnuPe — methylation-sensitive single nucleotide primer extension (метил-чувствительная однонуклеотидная достройка праймера); COBRA - combined bisulfite restriction analysis (комбинированный' бисульфит-рестриктный анализ); SSCP - single stranded confo rmational pol ymorphism (одноцепочечный конформационный полиморфизм); MBD - methyl-CpG-binding domain (домен, связывающий метилированные CpG динуклеотиды); DMH - differential methylation hybridization (дифференциальная по метилированию гибридизация); ICEAMP - identification of CpG islands exhibiting altered methylation patterns (идентификация CpG островков с различным профилем метилирования); SAGE - Serial Analysis of Gene Expression < (серийный анализ экспрессии генов); ПААГ

V, I , . I полиакриламидный гель; RIDGES - Rapid Identification of Genomic Splits (быстрое ь, ! и ■ i картирование сайтов расщепления генома); UCSC - University of California, Santa-Cruz (Калифорнийский Университет, Санта-Круз).

ГЛАВА I. ПРИНЦИПЫ И ЭКСПЕРИМЕНТАЛЬНЫЕ ПОДХОДЫ К ИЗУЧЕНИЮ МЕТИЛИРОВАНИЯ ДНК. ОБЗОР ЛИТЕРАТУРЫ Введение. Метилирование ДНК и возможные его функции

Среди известных модификаций ДНК у высших эукариот наиболее изученной является метилирование, которое происходит по пятому углеродному положению пиримидинового кольца цитозина. Образующийся при этом 5-метил-цитозин выполняет эпигенетическую функцию, заключающуюся в наследуемой компартментализации генома, например, на транскрипционно активные и неактивные участки.

Важно отметить, что в подавляющем числе случаев (главным образом, это относится к позвоночным животным) метилируется лишь цитозин, входящий в состав симметричного динуклеотида^, Исторически принято обозначать его как

•! Н !

Срв или в случае модификации тСрО, отмечая тем самым, что оба основания принадлежат одной цепи ДНК. В случае же двухцепочечной молекулы возможны три? качественных состояния:

- неметилированное - ^^ mCpG Ср G.

- полуметилированное - QpC или Gpmc> mCp G

- полностью метилированное - Q^m^,

Возможность наследования метилирования в ряду клеточных поколений по полуконсервативному механизму (Bird, 1978) обусловлена именно симметричностью метилируемой последовательности и осуществляется благодаря наличию в ядре особых ферментов ДНК-метилтрансфераз (Bestor, 2000).

Среди возможных функций метилирования, нужно отметить, в частности, его способность участвовать в регуляции экспрессии тканеспецифических генов, регуляции транскрипции в процессе эмбриогенеза, поддержании стабильности хромосомного набора, канцерогенезе.

1.1 Способы определения общего количества 5-метил-цитозина

Изначально сведения о напитай в ДНК высших эукариот 5-метил-цитозина были получены в 1948 году Роллином Д. Хотчкиссом (Hotchkiss, 1948). Тогда, при фракционировании азотистых оснований и нуклеозидов, образующихся в результате гидролиза ДНК тимуса теленка соляной кислотой, ему удалось обнаружить "аномальное" основание, которое в силу сходства его спектра поглощения с цитозином было названо им "эпи-цитозином", а позже химически идентифицировано как 5-метилцитозин. Для подобного качественного анализа нуклеиновых кислот Хотчкисс использовал метод бумажной хроматографии в н-бутаноле. Почти одновременно очень схожий подход был предложен Эрнстом Вишером и Эрвином Чаргаффом (Vischer and Chargaff, 1948). Нужно отметить, что оба эти метода позволяют не только качественно, но также и количественно оценивать нуклеотидный состав ДНК.

Вслед за выше упомянутыми работами было предложено огромное количество различных модификаций метода хроматографического разделения азотистых оснований и их нуклеоз(т)идных производных (Vanyushin et al., 1968; Rubery and Newton, 1971). Все они. отличались от оригинальных как значительно возросшим разрешением, так и более надежными количественными", оценками: Также очень высокой чувствительностью обладает подход,, включающий предварительное радиоактивное мечение ДНК /л v/vo (Rubery and'Newton, 1973), в то же время это резко снижает точность количественной оценки; из-за возможного неравномерного включения метки (Harbers ei al., 1975). Нужно отметить также, что в случае некоторых, объектов (например, живые многоклеточные огранизмы) подобное мечение бывает • -Ii. ■.;• . О: невозможным.

Позже в связи с развитием усовершенствованных модификаций хроматографических методов были предложены новые способы, оценки содержания 5-метил-цитозина в ДНК. Среди них можно упомянуть газожидкостную (Razin and Sedat, 1977), ионообменную (Burtis,. 1970), а также высокоэффективную жидкостную хроматографию (ОФ-ВЭЖХ, Ehrlich, and Ehrlich,. 1979). При этом наибольшее распространение все же получила ВЭЖХ смеси мононуклеотидов, получаемой в результате либо химического (Catania et al., 1987; Eick et al., 1983), либо энзиматического гидролиза ДНК (нуклеаза PI, ДНКаза I, фосфодиэстераза яда змеи (Ehrlich et al., 1982) или же микрококковая нуклеаза вместе с щелочной фосфатазой (Leonard et al., 1993)). Последний обладает преимуществом, заключающемся в том, что он не сопровождается химической деградацией нуклеотидов (Kuo et al., 1980). Применение ВЭЖХ совместно с фотоспектрометрией позволяет определять наличие 5метил-цитозина в количествах исходного препарата от 2,5 мкг (Gama-Sosa et al, 1983). Чувствительность этого метода была увеличена до 180 фг 5-метил-цитозина в 10 пг смеси с немодифицированным основанием благодаря использованию массспектрометрии для детекции нуклеотидов, а в комбинации с радиоактивным мечением дала возможность определить фракции метил-цитозина в ДНК дрозофилы равные 0,05-0,1% (Gowher et al., 2000).

Развитие техники капиллярного электрофоеза позволило создать подход, имеющий ряд преимуществ по сравнению с ВЭЖХ: низкая стоимость, быстрота эксперимента, а также минимальное количество материала, требуемого для aHanH3a(Fraga et al., 2000). Получение смеси нуклеотидов из геномной ДНК может производиться как химическим, так и энзиматическим (нуклеаза Р1 и щелочная фосфатаза) способом. При этом химический гидролиз обычно сопровождается образованием сложных смесей полинуклеотидов и их производных,что снижает достоверность оценки. Примерно 0,5% модифицированного основания может быть обнаружено таким образом* в 1 мкг ДНК (Fraga et al., 2000). Дополнительное л' üi ' • • использование лазер-индуцированной флуоресценции и масс-спектрометрии увеличивает чувствительность до 10"5% (Sharma et al., 2000).

Для изучения метилирования ДНК применяли и фотометрические методы, основанные на тонких различиях спектров оснований и их производных. Но в виду своей очень низкой чувствительности они не получили широкого распространения (Vanyuchin et al., 1970).

Акцепторная способность ДНК в реакции энзиматического метилирования in vitro в присутствии меченого донора - [СНз- HJ-S-аденозил-метионина (SAM) - также позволяет оценивать степень метилирования ДНК (Sheid et al., 1968). Метод отличается относительной простотой исполнения, но требует наличия соответствующих i '.»i .,1,. ферментов (SssI ДНК метилтрансфераза) . При этом в первом приближении акцепторная способность препарата будет пропорциональна количеству неметилированных цитозиновых остатков. Выше описанный подход применяют в большинстве случаев лишь для получения качественных и относительных количественных оценок тотального статуса метилирования ДНК. Дополнительное же использование внутреннего стандарта (точного количества ДНК с известным статусом метилирования в сайтах, узнаваемых метил-трансферазой) позволяет перейти от относительной к абсолютной количественной оценке (Galm et al., 2002). Также особые модификации метода, включающие стадии обработки ДНК бисульфитом и последующей ПЦР со специфическими праймерами, позволяют ограничивать анализ определенными участками генома* (enzyme regional methylation assay, ERMA, Galm et al., 2002).

Также был предложен метод идентификации 5-метил-цитозина, основанный на реакции хлорацетальдегида с азотистыми основаниями, содержащими аминогруппу (Oakeley et al., 1999). Образующиеся при этом их производные можно детектировать методами флуорометрии. Для специфической идентификации метилированного цитозина предварительно проводят реакцию дезаминирования бисульфитом неметилированных оснований, а для освобождения г препарата от аденина, также способного к взаимодействию с хлорацетальдегидом, используют термическую кислотную апуринизацию. Чувствительность этого метода сравнима с таковой для ВЭЖХ, но не требует в отличие от последнего специального хроматографического оборудования, а также проводится, с использованием относительно недорогих и стабильных химических реагентов,

Методы гибридизации in situ также позволяют оценить общее содержание 5-метил-цитозина в геномной ДНК. В частности, иммунохимический подход, основанный на высокоаффинном взаимодействии антиген-антитело, позволяет с очень высокой степенью чувствительности1 («0,01%), а главное специфичности, идентифицировать 5-метил-цитозинт: суммарном препарате, его гидролизате, а также в отдельных клетках, в изолированных метафазных. хромосомах и в хроматине (таким образом, например, было установлено глобальное гипометилирование, неактивной X хромосомы (Bensaada et al., 1998)). Чаще всего применяют имму но ферментный (de Сароа et al., 1996) радиоиммунологический (Barbin et al., 1994) или флуоресцентный анализ ДНК (Miniou et al., 1994), иммобилизованной на нитроцеллюлозной мембране. Причем также возможно предварительное электрофоретическое фракционирование препарата, обработанного рестрикционной эндонуклеазой, в этом случае могут быть получены; ограниченные сведения; о распределении модифицированного основания; в анализируемом геноме (Tweedie et al., 1997). Подбор/моноклонального антитела для детекции является наиболее важным этапом в эксперименте. Зарекомендовавшим себя, .(•; .i. <■.< ¡iiii I. с> .".»t!j . . • • как взаимодействующее специфически, и количественно, явлется так. называемое антитело FMG9, дающее в сочетании с ELISA достаточно достоверные результаты (Mizugaki ef а/., 1996). - при этом все неметалированные цитозины подвергаются дезалишированию под действием бисульфита (см. ниже), а в процессе ПЦР амплификации уменьшается представленность молекул ДНК, содержащих модифицированные щггозиновые остатки; то есть, акцепторная способность полученного амплификата в этом случае будет пропорциональна количеству 5-метилцитозинов в исходном препарате.

Некоторые рестрикционные эндонуклеазы и iix метил-чувствительные изошизомеры также применяются для исследования метилирования (Singer et al, 1979а; Antequera et al, 1984; Tweedie et al, 1997). В частности, анализ наличия в препарате ДНК фракции, гидролизуемой некоторой рестрикционной эндонуклеазой, но устойчивой к действию ее метил-чувствительного изошизомера, позволяет получить сведения о количестве и распределении соответствующих сайтов в образце, содержащих 5-метил-цитозин. Очевидно, нужно учитывать, что анализу подвергается не весь геном, а лишь та часть цитозиновых остатков, которые входят в состав узнаваемой ферментами последовательности. Также этот подход может быть сопряжен с некоторыми артефактами вроде (i) частичной неферментативной деградации ДНК или, с другой стороны, (ii) ее неполного гидролиза ферментом (последнее может объясняться присутствием ингибитора или неполной депротеинизацией). И то, и другое обычно обусловлено загрязненностью используемых препаратов, по этой причине подобные эксперименты требуют исключительной чистоты анализируемых образцов. При этом рекомендуется включение внутреннего контроля эффективности гидролиза ферментом - радиоактивно меченой ДНК (для увеличения чувствительности), которую можно отличить от исследуемой и которая содержит сайты, узнаваемые используемой рестрикционной эндонуклеазой (Rein et al., 1998).

Наконец, некую минимальную информацию о рисунке распределения метилированных остатков цитозина в исследуемом препарате может дать анализ частот встречаемости динуклеотидов (метод "ближайшего соседа" (Josse et al, 1961)). При этом после предварительной ник-трансляции анализируемой ДНК в присутствии одного из четырех [a- P]-dNTP и последующего ее гидролиза микрококковой нуклеазой или фосфодиэстеразой селезенки теленка, образуются меченные З'-фосфатмононуклеотиды, исходно находившиеся в цепи с 5'-конца от включившегося dNTP.

Последующие хроматографическое разделение и количественный анализ .«,. ij |, ii. получившейся смеси позволяют получить сведения« о частотах встречаемости определенных динуклеотидов в исследуемом образце (от 5 мкг) с достоверностью от 0,01% (Gruenbaum et al, 1981). Дополнительно, неполный гидролиз ДНК расширяет возможности подобного анализа до олигонуклеотидов (Josse et al, 1961), а увеличение чувствительности может быть достигнуто специфическим in vivo мечением 5-метил-цитозина при помощи SAM (Antequera et al, 1984).

Таким образом, разнообразие подходов, предназначенных для идентификации общего количества 5-метил-цитозина, позволяют выбрать среди них максимально адекватный в отношении трудоемкости и требуемой чувствительности. Тем не менее, те сведения, которые они позволяют получить, недостаточны для анализа специфического рисунка распределения метилированных последовательностей в геноме и его динамики.

1.2 Применение метил-чувствительных рестрикционных эндонуклеаз

Одними из часто используемых подходов являются методы идентификации 5-метилцитозина, основанные на использовании метил-чувствительных рестрикционных эндонуклеаз. На сегодняшний день известно более трехсот подобных ферментов и около тридцати из них имеют метил-нечувствительные изошизомеры (McClelland et al., 1994).

Впервые возможность подобного рода подхода была предложена в работах Эдвина Саузерна и Эдриэна Бёрда по изучению метилирования генов рРНК амфибий (Bird and Southern, 1978). При этом использованные ими эндонуклеазы по-разному гидролизовали соматическую и ооцитарную рДНК, что, как было показано в этой работе, связано с различиями в степени их метилирования. Сходным образом Герард Роизес объяснял неравномерное распределение сайтов рестрикции тех же ферментов в повторах сателлитной ДНК теленка (Roizes, 1976). В обоих случаях исследователи работали с очищенными в градиенте хлористого цезия фракциями многокопийной ДНК, что, очевидно, значительно упрощало анализ. Для изучения же статуса метилирования специфических монокопийных геномных последовательностей подобный способ фракционирования не приго-ден, а использование пред-варительного клонирования или ПЦР амплификации приводит к утрате исходного рисунка метилирования (Gautier et

Геномная ДНК

ПЕТИЛ-ЧУВСТВИТЕЛЬНАЯ РЕСТРИКЦИОНЦАЯ, ЭНДОНУКЛЕАЗА

UU.v,

МЕТИЛ-НЕЧУВСТВИТЕЛЬНАЯ РЕСТРИКЦИОННАЯ ЭНДОНУКЛЕАЗА

ГЕЛЬ-ЭЛЕКТРОФОРЕЗ САУЗЕРН БЛОТ-ГИБРИДИЗАЦИЯ

ГЕЛЬ-ЭЛЕКТРОФОРЕЗ

Рисунок 1. Изучение статуса метилирования специфических сайтов гидролиза рестрикционных эн-а1., 1977). Тем не менее, для донуклеаз ) с использованием методов Саузерн блот-гибридизацни (слева, [О - специфический решения такой задачи зонд) и ПЦР' (справа, -праймеры). может быть исполь-зован метод, являющийся фактически одним из вари-антов анализа полиморфиз-ма длин рестриктных фраг-ментов (ПДРФ, Bird, 1978; Bird and Southern, 1978). В этом случае преперат исследуемой ДНК, обработанной метил-чувствительной рест-рикционной эндонуклеазой, предварительно фракционируют при помощи гель-электрофореза, иммобилизуют на нитроцеллюлозной мембране, а затем гибридизуют со специфическим зондом (Саузерн-блот гибридизация, рис. 1, слева). Последующий анализ длин полученных фраг-ментов позволяет сделать выводы о статусе метилирования исследуемой последовательности. Дополнительно в качестве контроля может быть использован соответствующий метил-нечувствительный изошизомер. Нужно также отметить, что применение этого довольно простого в своем экспериментальном исполнении подхода позволяет с удовлетворительной чувствительностью (от 10 % метилированных последовательностей в 10 мкг исходной ДНК) проводить быстрый анализ большого числа образцов.

Позже была предложена также более чувствительная модификация этого метода (от 0,1% метилированных последовательностей в 10 нг исходной ДНК), основанная на ПЦР амплификации исследуемой области генома после обработки препарата эндонуклеазой (Singer-Sam et al., 1990а). При этом только исходно метилированный и поэтому не подвергшийся гидролизу фрагмент ДНК будет амплифицироваться экспоненциально (рис. 1, справа). Количественно оценивать представленность метилированных и неметилированных последовательностей в исходном препарате позволяет так называемый "конкурентный" (competitive) ПЦР, где одна и та же пара праймеров используется для амплификации как геномной, так и идентичной ей, но к • •» О отличимой по размеру экзогенно добавленной ДНК (Singer-Sam et al, 1990b). Можно также использовать предварительное лигирование адаптеров к продуктам гидролиза и последующий ПЦР с одним специфическим праймером и другим, идентичным последовательности адаптера (ligation mediated PCR, LM-PCR). При этом амплифицироваться будут как гидролизованные, так и не гидролизованные (то есть метилированные) в исследуемом сайте фрагменты, а конечное количественное отношение продуктов амплификации будет соответствовать их представленности в исходной смеси (Steigerwald et al., 1990).

Тем не менее, очевидно, что для проведения исследований с помощью подобных подходов требуется предварительное секвенирование изучаемой области генома. Также принципиальным ограничением этих методов является то, что в данном случае м м «ч J исследуется статус метилирования не всей последовательности, а лишь тех ее участков, которые содержат сайт узнавания используемой эндонуклеазы. К другими их

0) (¡)

ГЕНОМНАЯ ДНК 0) т(н)

ГИДРОЛИЗ ЭНДОНУКЛБАЗАМИ л.,И

ЛИГИРОВАНИЕ

АДАПТЕРОВ (¡-□)Н-и) п о и

ПЦР-АМПЛИФИКАЦИЯ ^праймеры

1-М-о) о о о

ГЕЛЬ-ЭЛЕКТРОФОРЕЗ

1) 0) хз □—□ о о о о сг сг

Рисунок 2. Метод анализа полиморфизма амплифицированных фрагментов. Образцы ДНК гидролизуют двумя эндонуклеазами: 1 - метил-нечувствительной, гидролизующей редко встречаемую последовательность (0, и и - метил-чувствительной (слева) или ее метил-нечувствительным изошизомером (справа), узнающими последовательность (н). После чего к полученным фрагментам лигируют соответственно два типа адаптеров ( □ ■ ) и проводят ПЦР с праймерами ( • О ), идентичными последовательности использованных адаптеров. Анализ ампликонов методом гель-электрофореза позволяет идентифицировать фрагменты (отмечены стрелкой), содержащие на одном из своих концов метилированный сайт (11). недостаткам можно отнести возможные артефакты, связанные с неполным гидролизом ДНК. В частности, немногие из ныне применяемых ферментов, которые были протестированы на чувствительность к модификациям вне сайта узнавания, оказались в некоторых случаях подвержены сильному ингибированию (McClelland et al., 1994). Среди других причин устойчивости неметилированных последовательностей к действию метил-чувствительных рестрикционных эндонуклеаз можно назвать пониженную частоту встречаемости узнаваемых сайтов в гидролизуемой ДНК. Так, например, было показано, что Hpall эндонуклеаза, требует для своей активности наличия по меньшей мере двух узнаваемых ею последовательностей (5'-CCGG-3'), и поэтому не способна гидролизовать геном вируса SV40, где 5'-CCGG-3' сайт встречается один раз (Kupper et al, 1997). Для решения этой проблемы было предложено включать в инкубационные смеси олигонуклеотидные дуплексы (15нт), содержащие сайт рестрикции соответствующей эндонуклеазы, в количестве 20-100 кратного молярного избытка по отношению к гидролизуемому субстрату (Kupper et al., 1997).

Не так давно была также разработана модификация метода анализа полиморфизма амплифицированных фрагментов (рис. 2, ПДАФ, MSAP, methylation

-1 • \ I sensitive amplification polymorphism, Reyna-Lopez et al, 1997), предназначенная для полногеномного анализа метилирования. В этом случае сначала осуществляют гидролиз

ДНК двумя рестрикционными эндонуклеазами: метил-нечувствительной, узнающей и гидролизующей редко встречаемую последовательность (обычно гексануклеотид, для уменьшения количества получаемых продуктов гидролиза и упрощения последующего анализа); и метил-чувствительной эндонуклеазой, параллельно ее метил- ) I. J нечувствительным изошизомером. Это различие объясняется метилированием исходного образца ДНК по сайту, узнаваемому второй парой эндонуклеаз и находящемуся с одного из концов соответствующего фрагмента. Последующая элюция этого фрагмента из геля и ре-ПЦР с использованными праймерами позволят в дальнейшем его секвенировать . и, возможно, картировать расположение iMи. . ; соответствующего метилированного сайта в геноме. Можно также добавить, что обычно для упрощения анализа результатов проводят ПЦР с олигонуклеотидами, идентичными последовательности используемого адаптера, но содержащими на 3'-конце дополнительные 1-4 нуклеотида (overhang) для избирательной амплификации лишь части рестриктных фрагментов. Таким образом, последовательно комбинируя все возможные варианты сочетаний этих нуклеотидов, можно упорядоченно проанализировать тот огромный набор фрагментов, который образуется после гидролиза исследуемой ДНК эндонуклеазами. Нужно также добавить, что использование двух изошизомеров, обладающих чувстительностью к метилированию разных цитозиновых остатков в узнаваемой ими последовательности (например, Hpall и Mspl эндонуклеазы неспособны гидролизовать CmCGG и mCCGG сайты, соответственно), может значительно расширить возможности метода (Xiong et al., 1999; Noyer et al., 2005).

Еще одним вариантом подхода, основанного на применении рестрикционных эндонуклеаз, можно считать так называемый "фингерпринтинг" с использованием ПЦР со случайными праймерами (methylation-sensitive restriction fingerprinting, MSRF, Gonzalgo et al., 1997; Huang et al., 1997; Wu and Ho, 2004). Ha первом этапе ДНК также подвергают обработке двумя эндонуклеазами: метил-нечувствительной, узнающей и гидролизующей часто встречаемую последовательность; и метил-чувствительнои или ее метил-нечувствительным изошизомером, соответственно. Далее две смеси продуктов гидролиза используют для последующей ПЦР со случайными короткими олигонуклеотидами в качестве праймеров. Получаемый амплификат сходным образом анализируют при помощи метода гель-электрофореза высокогоразрешения, а интересующие фрагменты также элюируют из геля. Причем необходимо добавить,что

ОБА АЛЛЕЛЯ НЕМЕТИЛИРОВАНЫ

Г,. <А>

ОДИН АЛЛЕЛЬ МЕТИЛИРОВАН

ОБА АЛЛЕЛЯ МЕТИЛИРОВАНЫ

ГИДРОЛИЗ ЭНДОНУКЛЕАЗОЙ А МЕЧЕНИЕ КОНЦОВ <"А)

ГИДРОЛИЗ Э/ФОРЕЗ В 1011 НАПРАВЛЕНИИ ГИДРОЛИЗ Э/ФОРЕЗ ВО 2ОН НАПРАВЛЕНИИ

Рисунок 3. Метод ИЬвв-М. Исследуемые образцы ДНК сначала гидролизуют метил-чувствительной эндонуклеазой А, затем проводят достройку липких концов в присутствии радиоактивно меченых нуклеозидтрифосфатов. Далее гидролизуют- препарат эндонуклеазой В и фракционируют электрофоретически в первом направлении, после чего гель обрабатывают эндонуклеазой С и вновь разделяют во втором направлении. Сравнение интенсивности пятен на радиоавтографах, полученных из разных образцов, позволяет идентифицировать дифференциально метилированные последовательности. последующая их реамплификация с использованием тех же коротких олигонуклеотидов сопряжена с повышенной гетерогенностью и низким выходом получаемых продуктов, а также обычно не позволяет с достаточной эффективностью эти продукты клонировать. По этим причинам часто используют олигонуклеотиды общей длиной около 20 нт, которые идентичны исходным прайм ерам в своей 3'-области и содержат в дополнительной 5'-концевой последовательности сайты узнавания определенных эндонуклеаз, что облегчает последующие этапы клонирования (Zeng et al., 1998). Нужно отметить, что главным отличием метода MSRF от описанного выше ПДАФ является заведомо неполный анализ получаемых рестриктных смесей. Причиной тому очевидно является использование ПЦР со случайными олигонуклеотидами. Существует также возможность комбинирования различных последовательностей праймеров, нотем не менее, подобный анализ не является упорядоченным и по „этим причинам может приводить к излишней г .< v. трудоемкости.Другой принцип лежит в основе полногеномного анализа метилирования ДНК методом RLGS-M (рис.3, restriction landmark genomic scanning using methylation-sensitive restriction endonucleases, Hatada et al., 1991; Kawai et al., 1993; Costello et al., 2000; Takamiya et al., 2006). В этом случае препарат сначала щцролизуют метил-чувствительной рестрикционной эндонуклеазой А (чаще всего Not I, узнающей i , i N > палиндромныи октануклеотид 5' -GCUgGCCGC-З ' ), а образовавшиеся фрагменты радиоактивно метят достройкой "липких" концов в присутствии [a-32P]-dNTP и гидролизуют ферментом В. Затем гидролизат электрофоретически фракционируют, после чегоагарозный гель обрабатывают эндонуклеазой С и вновь разделяют во втором направлении (методом гель-электрофореза высокого разрешения). Полученный в конечном итоге радиоавтограф представляет собой характерную двумерную картину распределения (паттерн) более чем трех тысяч А/А, А/В и А/С рестриктных фрагментов. Нужно отметить, что хорошая воспроизводимость этого рисунка позволяет применять его для сравнения в двух образцах ДНК статуса метилирования одновременно большого количес-тва последовательностей. При этом увеличение или уменьшение интенсивности определенного пятна связано соответственно с гипо- или гиперметилированием сайта узнавания эндонуклеазы А. Интересующие фрагменты могут быть элюированы из геля и использованы для их картирования в исследуемом геноме. Следует также добавить, что использование в качестве фермента А именно эндонуклеазы Not I позволяет более или менее направленно исследовать участки генома, представляющие собой кодирующие области. Это обусловлено тем, что около i >14. i<. . i А

89% всех узнаваемых Not I эндонуклеазой последовательностей находится в CpGостровках (Lindsay and Bird, 1987), большинство из которых в свою очередь ассоциировано с генами и их промоторными участками в геномах млекопитающих (см. выше).

Тем не менее, несмотря на большое количество преимуществ, метод также обладает недостатками, среди которых можно отметить: i) необходимость большого количества ДНК (от 10 мкг) для получения радиоавтографа удовлетворительного качества; ii) большую трудоемкость, связанную с получением и последующим анализом радиоавтографов; при этом за последнее время было разработано и предложено к использованию довольно большое количество всевозможного программного обеспечения, автоматизирующего обработку результатов, полученных с помощью RLGS-M (Rouillard et al, 2001; Takahashi and Nakazawa, 2001); iii) ограниченность использования в связи с размером изучаемого генома (до 3*109 по); тем не менее, включение этапа "рестриктной ловушки" (см. ниже) позволяет предварительно "упрощать" исследуемый образец и поэтому может быть использовано в случае исследования сложных геномов (например, высших растений, амфибий и т.д., Okuizumi et al., 1994); iv) низкая эффективность и значительный фон при клонировании интересующих фрагментов; объясняется это тем, что элюат из соответствующей области геля чаще всего представляет собой сложную смесь В/С, В/В и С/С продуктов гидролиза и одного из интересующих меченных А/А, А/В или А/С рестриктных фрагментов.

При этом для решения последней проблемы, то есть для увеличения эффективности и специфичности клонирования, были предложены следующие способы: - перед разделением препарата в первом- направлении' его при помощи так

I I 1 чич1 ' называемой "рестриктной ловушки" (restriction trapper) специфически обогащают фрагментами, содержащими на одном/двух концах сайт(ы) гидролиза эндонуклеазы А. Для этого после обработки образца ферментами А и В, полученные фрагменты специфиески лигируют к олигонуклеоитидному дуплексу, гидролизованному с одного конца эндонуклеазой А и иммобилизованному с другого на твердой подложке (латексные шарики). Далее после отмывки нелигировавшихся молекул ДНК, проводят элюцию А/А, А/В и А/С фрагментов путем обработки образца ферментом A. (Hayashizaki et al., 1992; Hirotsune et al., 1993);

- после элюции смеси фрагментов из геля, ее амплифицируют, используя предварительно дотированные три типа адапторов (соотвествующие трем эндонуклеазам и восстанавливающие их сайты узнавания) и идентичные им праймеры; затем, после обработки амплификата эндонуклеазой А, специфически лигируют полученные продукты в линеаризованный вектор, содержащий на одном конце выступающий 3'-концевой тиминовый остаток, а на другом -гидролизованный эндонуклеазой A (Suzuki et al., 1994);

- комбинация двух описанных выше модификаций (Suzuki et al., 1994).

Можно добавить также, что также было предпринято предварительное клонирование всех А/А и А/В рестриктных фрагментов с последующим картированием их в геноме и идентификацией соответствующих им пятен на радиоавтографе (Plass et al., 1997). Этот очень трудоемкий подход позволяет, таким образом, систематически анализировать результаты, получаемые с помощью RLGS-M, и в будущем приведет к созданию упорядоченной базы данных, что, в свою очередь, значительно облегчит исследования ш -4— га ш 1 I В mm —Н

D Е F 1m m —I—H

Smal Xmal тупые" концы липкие концы

-1"—|

ЛИГИРОВАНИЕ АДАПТЕРОВ

АНПЛИКОН X

АМПЛИКОН XI

ГИБРИДИЗАЦИЯ р ЗОНД "В"

ЗОНД "D"

АМПЛИКОН I

АМПЛИКОН II

ВЫЧИТАЮЩАЯ П ГИБРИДИЗАЦИЯ

Рисунок 4. Метод амплификации метилированных Срв-островков. Препарат ДНК ги-дролизуют метил-чувствительной эндонуклеазой Бта! (5'-СССССО-3', образует "тупые" концы), а затем ее метил-нечувствительным изошизомером Хта1 (образует "липкие" концы) (слева - образец содержит метилированный, справа - неметилированный СрО-островок О). К "липким" концам продуктов гидролиза лигируют адапторы, после чего проводят ПЦР с праймерами, идентичными последовательности адаптеров. Полученные ампликоны используют для гибридизации с зондами, специфическими к определенным Срв-островкам (слева) или сравнивают методом вычитающей гибридизации (справа). метилирования ДНК методом RLGS-M (Yu et al, 2004).

Сравнение статуса метилирования двух образцов можно также осуществлять при помощи метода вычитающей гибридизации. Впервые этот подход был применен группой японских ученых для поиска дифференциально метилированных последовательностей в нормальной паренхиме печени и гепатоцеллюлярной карциноме, соответственно (Ushijima et al., 1997). Для этого они к предварительно обработанным метил-чувствительной рестрикционной эндонуклеазой препаратам трейсера и драйвера лигировали адаптеры после чего проводили ПЦР с праймерами, идентичными последовательности использованных адаптеров. При этом, в процессе амплификации происходит обогащение смеси фрагментами размером 300-600 по, представляющими собой, главным образом, гипо-метилированные (и поэтому подвергшиеся гидролизу эндонуклеазой) участки генома. Последующее проведение 2-3 раундов вычитающей гибридизации позволяет получить набор последовательностей, имеющих разный статус метилирования в двух сравниваемых образцах ДНК (Chien et al., 2005). Подобным образом можно также проводить: i) поиск генов, подверженных импринтингу (Peters et al., 1999); ii) идентификацию тканеспецифически экспрессирующихся последова

I 1 L тельностей (Yuan et al., 1999); iii) анализировать на полногеномном уровне изменения в статусе метилирования при инсерциях чужеродной ДНК (трансгены, ретровирусы, ДНК-транспозоны) (Muller et al., 2001);

Тем не менее, очевидно, что "упрощение" образцов в результате их амплификации, приводит к потере части дифференциально метилированных последовательностей.

Среди других недостатков метода можно отметить сильную "загрязненность" получаемых библиотек повторяющимися элементами, что, в свою очередь, затрудняет как ее анализ, так и последующее картирование вставок клонов. Избежать этой проблемы можно путем введения дополнительной стадии нормализации* амплификатов перед проведением вычитающей гибридизации (Muller et al., 2001). i [ / - - •

Был также разработан новый подход для идентификации метилированных CpG-островков (MCA, methylated ÇpG island amplification, Toyota et al, 1999; Asada et al, 2006). Принцип метода схематически изображен на рисунке 4. Получаемые в результате наборы последовательностей, кроме электрофоретического разделения (Frigola et al, 2002) или прямого секвенирования, обычно также анализируют методом

- под нормализацией образца понимают выравнивание представленности фрагментов ДНК, входящих в его состав. вычитающей гибридизации (рис.4,справа, Toyota et al, 1999). Далее, для анализа статуса метилирования определенного CpG-островка можно гибридизовать получаемые в результате MC А ампликоны с соответствующим специфическим зондом (рис.4,слева, Toyota et al., 1999).

В последнее время появилась тенденция ограничить полногеномный анализ протяженными полигенными локусами, обладающими общими регуляторными системами. В ЛСФГЧ была разработана методика картирования неметилированных CpG-сайтов на мегабазных участках генома (Non-methylated Genomic Sites Coincidence Cloning (NGSCC)), которая позволяет картировать сайты вне зависимости от их расположения по отношению к CpG-островку. Метод основан на клонировании идентичных нуклеотидных последовательностей, принадлежащих к разным фрагментированным ДНК-пулам. В качестве сравниваемых пулов ДНК используют:

- геномную ДНК из клеток определенной ткани, фрагментированную метил-чувствительной рестриктазой Hpall;

- полный набор Hpall рестриктных фрагментов ДНК клонированного локуса.

К полученным пулам лигируют два разных типа супрессионных олигонуклеотидных адаптеров. В результате совместной денатурации и ренатурации обоих пулов фрагментов происходит образование гетеродуплексов идентичных нуклеотидных последовательностей, принадлежащих различным пулам. Для выделения таких гетеродуплексов из смеси используют эффект селективной супрессии ПЦР, г. V , 1 возникающий вследствие наличия различных супрессионных адаптеров. Выделенные

Т Г 1 » таким образом фрагменты принадлежат к изучаемому геномному локусу и при этом содержат неметилированный CpG-сайт, характерный для данной ткани. Клонирование, определение нуклеотидной последовательности этих фрагментов, картирование неметилированных CpG-сайтов в геноме обеспечивают профиль распределения неметилированных сайтов в изучаемом локусе генома. Такое тканеспецифическое распределение характерно для определенной ткани, или стадии развития организма, поэтому должно отражать ее функциональные особенности. Таким образом, методом NGSCC можно получить набор неметилированных CpG-динуклеотидов в составе рестриктных сайтов (Unmethylated Restriction Sites (URS)), которые распределены по длине изучаемого геномного локуса вне зависимости от положения CpG-островков. Такие URS могут рассматриваться как маркеры, распределение которых достоверно описывает тканеспецифический профиль метилирования внутри протяженного локуса. Этот профиль уникален, характерен только для данной ткани и отражает ее функциональное состояние.

Заключение Диссертация по теме "Молекулярная биология", Гайнетдинов, Ильдар Ваисович

выводы

1) Создан принципиально новый методический подход к экспресс-картированию сайтов расщепления генома (на примере сайтов метил-чувствительной эндонуклеазы Нра11).

2) Создано программное обеспечение, необходимое для обработки результатов метода и их визуализации.

3) Впервые с помощью разработанного метода получен подробный профиль метилирования для локуса Б1982()8-СОХ7А1 19й хромосомы в нормальной ткани легкого человека.

Библиография Диссертация по биологии, кандидата биологических наук, Гайнетдинов, Ильдар Ваисович, Москва

1. Antequera F, Tamame M, Villanueva JR and Santos T. DNA methylation in fungi. J Biol Chem 259, 8033-8036 (1984).

2. Asada K, Asada R, Yoshiji H, Fukui H, Floyd RA and Kotake Y. DNA cytosine methylation profile in various cancer-related genesi altered in cultured rat hepatocyte cell lines as compared with primary hepatocytes. Oncol Rep 15, 1241-1248 (2006).

3. Barbin: A, Montpellier G, Kokalj-Vokac N, Gibaud A, Nivcleau A, Malfoy B, Dutrillaux B and Bourgeois CA. New sites of methylcytosine-rich DNA detected on metaphase chromosomes. Hum: Genet. 94; 684-692 (1994).

4. Baumer A, Wiedemann U, Hergersberg M and Schinzel A. A novel MSP/ DHPLC method for the investigation of the methylation status of imprinted genes enables the molecular detection of low cell mosaicisms. Hum. Mutat. 17,423-430 (2001).

5. Benhattar, J and Clement G. Mèthylation-sensitive. single-strand conformation analysis: a; rapid method to screen for and analyze DNA methylation. Methods. Mol- Biol 287, 181-193 (2004).

6. Bestor TH. The DNA methyltransferascs of mammals. Hum Mol Genet 9,2395-2402 (2000).

7. Bird AP! Use of restriction enzymes to study eukaryotic DNA methylation: II: The symmetry of methylated' sites supports; semi-conservative^^copying : of methylation patterns. J Mol Biol 118, 49-60 (1978).

8. Bird AP and .Southern EM; Use of restriction enzymes to study eukaryotic DNA methylation: I. The methylation-patterns in ribosomal DNA from Xenopus laevis. J Mol Biol 118, 27-47(1978).

9. Brena RM, Auer H, Kornacker K, Hackanson B, Raval A, Byrd JC and Plass C. Accuratei '• • miciMN'!.;: ■ ¡1 ^ ■■quantificatio of DNA methylation using COBRA coupled with the Agilent Bioanalyzer platform. Nucleic Acids Res 34, el7 (2006).

10. Brock GJ, Charlton J and Bird A. Densely methylated sequences that are preferentially localized^ at telomere-proximal regions of human chromosomes. Gene 240, 269-277. (1999).

11. Catania J, Keenan BC, Margison GP and Fairweather DS. Determination of 5-methylcytosine by acid- hydrolysis of DNA with} hydrofluoric acid. Anal; BiocKem; 167, 347-351 (1987). ' . ' ■ "■ .

12. Chien J, Staub J, Avula R, Zhang H, Liu W, Hartmann LC, Kaufmann SH, Smith DI and . . Shridhar Y. Epigenetic silencing of TCEAL7 (Bex4) in ovarian cancer. Oncogene 24, 5089-5100 (2005).

13. Church GM and Gilbert W. Genomic sequencing; Proc Natl^Acad»Sei U S A 81; 1991-1995: ,■ *''--. • 1. t !. :.rii i . . ,i :1984).• ■ '-en,'. ••••.'

14. Clark SJ, Harrison? J, Paul CL and.; Frommer M. High sensitivity mapping of methylatedcytosines. Nucleic Acids Res 22, 2990-2997. (1994). Cross SH, Charlton JA, Nan X and Bird AP. Purification of CpG islands using a methylated

15. Eick D, Fritz HJ and Doerfler W. Quantitative determination of 5-methylcytosine in DNA by reverse-phase high-performance liquid chromatography. Anal. Biochem. 135,165-171 (1983).

16. Frommer M, McDonald LE, Millar DS, Collis CM; Watt F, Grigg GW, Molloy PL and Paulr V Ir ■-. I'

17. DNA by methylation-sensitive arbitrarily primed PCR. Cancer Res 57, 594-599:1 i <J VA uii1997).

18. Harbers K, Harbers B and Spencer JH. Nucleotide clusters in deoxyribonucleic acids. XII. The distribution of 5-methylcytosine in pyrimidine oligonucleotides of mouse L-cellsatellite DNA and main band DNA. Biochem Biophys Res Commun 66, 738-746 (1975).

19. Kuo KC, McCune RA, Gehrke GW, Midgett R" and EhrlichrM; Quantitative reversed-phase; high performance liquid chromatographic determination of major and modified deoxyribonucleosides in DNA. Nucleic Acids Res. 8,4763-4776 (1980).

20. Kupper D, Reuter M, Meisel A and Kruger DH. Reliable detection of DNA CpG methylation••'• ■■ A. I'.':/• :n:rv • profiles by the isoschizomers Mspl/Hpall using: oligonucleotide stimulators.

21. Rouillard'rJMi Erson^AE, RuickR; AsakawaJ;lWimmer:K,.Muleris"M^Petty EM^

22. S: Virtual genome scan: a tool for restriction landmark-based scanning of the humangenome. Genome Res 11, 1453-1459. (2001).

23. Rubery ED and Newton AA. A simple paper chromatographic method for separation ofmethylated adenines and cytosine from the major bases found in nucleic acids. Anal•!• • Mi. A-.liw Biochem 42-149-154. (1971).

24. Rubery ED and Newton AA. DNA methylation in normal and tumour virus-transformed cellsin tissue culture. I. The level of DNA methylation in BHK21 cells and in BHK21 cellstransformed by polyoma virus (PyY cells). Biochim Biophys Acta 324; 24-36. (1973).

25. Takahashi K and Nakazawa M. DNAinsight: a web based image processing system for large scale RLGS analysis. Genome Inform Ser Workshop Genome Inform 12, 212-221 (2001).

26. Wu M and Ho SM-.PMP24, a gene identified by MSRF, undergoes DNA hypermethylation-associated gene silencing during cancer progression in an LNCaP model. Oncogene 23,250-259 (2004).

27. Xiong LZ, Xu LZ, Saghai Maroof MA and Zhang Q: Patterns of cytosine methylation in an elite rice hybrid and its parental lines, detected by a methylation-sensitiveamplification polymorphism technique. Mol Gen Genet 261, 439-446 (1999).1 it. tin., a

28. Xiong Z and Laird PW. COBRA: a sensitive and quantitative DNA methylation assay. Nucleic Acids Res 25,2532-2534 (1997).1. U'v-ii- 1

29. Yamamoto F, Yamamoto M, Soto JL, Kojima E, Wang EN, Perucho M, Sekiya T and Yamanaka H. Notl-Msell methylation-sensitive amplied fragment length polymorhism for DNA methylation analysis of human cancers. Electrophoresis 22, 1946-1956. (2001).

30. Yan PS, Perry MR, Laux DE, Asare AL, Caldwell CW and Huang TH-M. CpG island arrays: an application toward deciphering epigenetic signatures of breast cancer. Clin Cancer Res 6,1432-1438 (2000).

31. Yu L, Liu C, Bennett K, Wu YZ et al. A Notl-EcoRV promote library for studies of genetic and epigenetic alterations in mouse models of human malignancies. Genomics 84, 647-660 (2004).

32. Yuan L, Shan J, Risi DD, Broome J, Lovecchio J, Gal D, Vinciguerra V and Xu H-P. Isolation of a novel gene, TSP50, by a hypomethylated DNA fragment in human breast cancer. Cancer Res 59, 3215-3221 (1999).

33. Zeng M, Martsen EO and Lapeyre JN. Re-amplification of short primer-generated bands from RAPD and methylation-sensitive restriction fingerprinting by discrimination primers. Biotechniques 24,402-403, 406. (1998).

34. Zhou D, Qiao W, Yang L and Lu Z. Bisulfite-modified target DNA array for aberrant methylation analysis. Anal Biochem 351,26-35 (2006).1..V .1 \1. БЛАГОДАРНОСТИ

35. Автор выражает глубокую признательность сотрудникам кафедры молекулярной биологии Биологического факультета Московского Государственного Университета имени М. В. Ломоносова за полученные знания, а также за высокую требовательность и постоянное внимание.