Бесплатный автореферат и диссертация по биологии на тему
Анализ дифференциального метилирования геномов методами непредвзятого скрининга
ВАК РФ 03.02.07, Генетика

Автореферат диссертации по теме "Анализ дифференциального метилирования геномов методами непредвзятого скрининга"

005013769

ТАНАС Александр Сергеевич

АНАЛИЗ ДИФФЕРЕНЦИАЛЬНОГО МЕТИЛИРОВАНИЯ ГЕНОМОВ МЕТОДАМИ НЕПРЕДВЗЯТОГО СКРИНИНГА

03.02.07 - генетика 03.01.09 - математическая биология, биоинформатика

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата биологических наук

1 5 ид?Ш

Москва-2012

005013769

Работа выполнена в Федеральном государственном бюджетном учреждении «Медико-генетический научный центр» Российской академии медицинских наук

Научный руководитель:

кандидат биологических наук, доцент Стрельников Владимир Викторович

Официальные оппоненты:

Поляков Александр Владимирович, доктор биологических наук, профессор Федеральное государственное бюджетное учреждение «Медико-генетический научный центр» Российской академии медицинских наук, заведующий лабораторией ДНК-диагностики

Лисица Андрей Валерьевич, доктор биологических наук, член-корр. РАМН Федеральное государственное бюджетное учреждение «Научно-исследовательский институт биомедицинской химии имени В.Н.Ореховича» Российской академии медицинских наук, заведующий лабораторией биоинформационных технологий

Ведущая организация:

Федеральное государственное бюджетное учреждение науки «Институт биологии гена» Российской академии наук

Защита состоится «02 »шк&М 2012 г. часов на заседании Диссертационного ученого совета Д 001.016.01 при Федеральном государственном бюджетном учреждении «Медико-генетический научный центр» Российской академии медицинских наук (115478, Москва, ул. Москворечье, 1)

С диссертацией можно ознакомиться в библиотеке Федерального государственного бюджетного учреждения «Медико-генетический научный центр» Российской академии медицинских наук по адресу: 115478, Москва, ул. Москворечье, д.1.

Автореферат разослан « I/ сС »_2012 г.

Учёный секретарь диссертационного совета Д 001.016.01 по защите докторских и кандидатских диссертаций,

доктор медицинских наук, профессор Зинченко Репа Абульфазовна

I. ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность проблемы. Несмотря на очевидную ценность метилирования ДНК как диагностического маркера, накопленных на сегодняшний день данных об особенностях метилирования участков генома человека в норме и при патологии недостаточно для формирования эффективных систем эпигенетических маркеров опухолевого процесса (Shin S.H. et al, 2010; Hong S.J. et al, 2010; Wang W. et al, 2010; Suijkerbuijk K.P.M. et al 2011). Предполагается, что прогресс в разработке новых высокотехнологичных методов скрининга дифференциального метилирования ДНК позволит переломить эту ситуацию (Воск С., 2009).

Подходы к скринингу дифференциального метилирования ДНК можно принципиально разделить на две группы. Первая группа подразумевает предварительный отбор локусов для исследования, осуществляемый на основании некоторой гипотезы, предсказывающей наиболее вероятное выявление дифференциального метилирования именно этих локусов. Задача методов, осуществляющих подходы этой группы, - проверка исходной гипотезы о наличии дифференциального метилирования заранее отобранных последовательностей ДНК (Nemtsova M.V. et al., 2005; Wojdacz T., 2009; Ushijima T., 2005). Вторая группа подразумевает непредвзятый скрининг дифференциального метилирования. При помощи соответствующих методов в ходе скрининга сначала выявляется дифференциальное метилирование заранее неизвестных локусов генома, а затем проводится идентификация их нуклеотидных последовательностей (Fraga M.F., Esteller M., 2002). Непредвзятый скрининг эффективно выявляет дифференциальное метилирование геномных участков, которые, в силу недостаточной изученности эпигеномов, не подпадают ни под одну из современных гипотез и не включаются в анализ методами первой группы, что не только расширяет фундаментальные представления о роли метилирования ДНК в норме и при патологии, но и способствует диверсификации основ разработки эпигенетических диагностических маркеров (Schumacher A. et al., 2006, Gebhard С. et al., 2006).

До недавнего времени возможности применения методов непредвзятого скрининга были в значительной степени ограничены сложностью геномной идентификации выявляемых дифференциально метилированных участков ДНК. Предложенный Е.Б.Кузнецовой с соавторами в 2007 г. протокол прямого секвенирования дифференциально метилированных фрагментов ДНК облегчает процесс геномного картирования за счет исключения этапа клонирования фрагментов, однако все еще требует их физического извлечения из полиакриламидных гелей. Секвенирование генома человека в сочетании с математическим моделированием раскрыло ранее недоступный способ картирования дифференциально метилированных локусов, выявляемых методами непредвзятого скрининга. Были предприняты попытки разработки виртуального изображения результатов одного из методов скрининга дифференциального метилирования -рестрикционно-ориентированного геномного сканирования - для идентификации фрагментов ДНК с использованием симулирующего программного обеспечения (Rouillard J. et al., 2001, Koike К. et al., 2008). Разработанные системы не получили распространения, вероятно, вследствие сложности самого метода скрининга. Очевидно, разработка подходов к анализу дифференциального метилирования геномов методами непредвзятого скрининга является актуальной задачей, что определило цель настоящей работы.

Цель работы. Разработать подходы к анализу дифференциального метилирования геномов методами непредвзятого скрининга.

Задачи исследования.

1. Сформировать современный алгоритм непредвзятого скрининга дифференциального метилирования геномов.

2. Разработать способ определения геномной принадлежности выявляемых дифференциально метилированных фрагментов ДНК, исключающий необходимость их реамплификации, клонирования и секвенирования.

3. Разработать алгоритм и компьютерную программу моделирования результатов экспериментов с использованием баз данных нуклеотидных последовательностей.

4. Охарактеризовать иерархию и описать количественные и качественные параметры продуктов амплификации интерметилированных сайтов, получаемых при различных экпериментальных условиях.

5. Провести сравнительный анализ геномов клеточных линий рака молочной железы на основе разработанного алгоритма скрининга дифференциального метилирования.

Научная новизна.

В результате настоящего исследования разработан принципиально новый современный алгоритм скрининга дифференциального метилированния геномов, основанный на сочетании классического генноинженерного подхода - амплификации интерметилированных сайтов (АИМС), высокоразрешающего способа разделения фрагментов нуклеиновых кислот - капиллярном электрофорезе, и оригинального компьютерного обеспечения. Разработанная в рамках исследования программа AIMS in silico является первым компьютерным симулятором адаптор-опосредованной ПЦР, применимым к полному геному человека. Впервые охарактеризованы количественные и качественные параметры продуктов АИМС, получаемых при различных экпериментальных условиях; критически переоценены закономерности редукции результирующей картины при увеличении длин универсальных праймеров АИМС в зависимости от нуклеотидного состава удлинителей. Впервые предложено рестриктазное картирование дифференциально метилированных фрагментов ДНК на основе математического моделирования.

Проведенный анализ геномов клеточных линий рака молочной железы ZR-75-1, HBL-100, HS 578 Т, ВТ-474, MCF7 и T-47D выявил 6 дифференциально метилированных геномных локусов, которые ранее не изучались с точки зрения дифференциального метилирования. Среди них - участки CpG-островков, расположенных в первых интронах генов AN КЗ и MAFK, в промоторной области гена C2CD2, в межгенных областях на хромосомах 12ql3.13 и 13q32.1, а также участок первого экзона гена PURB, не являющийся CpG-островком. Выявление дифференциального метилирования неканонической локализации подтверждает непредвзятость разработанного алгоритма скрининга.

Теоретическая и практическая значимость.

Программа компьютерной симуляции результатов АИМС - AIMS in silico -позволяет в кратчайшие сроки провести научно обоснованное моделирование эксперимента с заранее заданными параметрами и определить оптимальный дизайн реальных экспериментов, исходя из задач исследования и приборной базы. Модуль программы AIMS in silico, обеспечивающий моделирование рестриктазного геномного картирования продуктов АИМС, позволяет быстро и эффективно проводить дизайн рестриктазного картирования. Разработанный способ определения

геномной принадлежности выявляемых дифференциально метилированных фрагментов ДНК исключает необходимость их реамплификации, клонирования и секвепирования.

Охарактеризованная иерархия продуктов АИМС служит удобным руководством к предварительной оценке степени снижения сложности результирующей картины при увеличении длин универсальных праймеров АИМС в зависимости от нуклеотидного состава удлинителей. Программа просмотра и анализа электрофореграмм PeakPick обеспечивает удобную среду для осуществления дифференциального анализа репрезентаций эпигеномов и, кроме того, является одной из немногих общедоступных программ анализа результатов капиллярного электрофореза в целом. Разработанные алгоритмы, программы и методы оформлены в виде рекламно-технических описаний и описания новой медицинской ДНК-технологии, прошедших государственную регистрацию.

Выявленные при анализе геномов клеточных линий рака молочной железы ZR-75-1, HBL-100, HS 578T, ВТ-474, MCF7 и T-47D дифференциально метилированные геномные локусы могут служить субстратом для разработки молекулярно-генетических маркеров РМЖ.

Основные положения, выносимые на защиту.

1. Предложенный алгоритм скрининга дифференциального метилированния геномов, объединяющий классические генноинженерные подходы, высокоразрещающий способ разделения фрагментов нуклеиновых кислот и оригинальное компьютерное обеспечение, представляет собой эффективную, завершенную систему, успешно прошедшую практическую апробацию.

2. Классический способ геномной идентификации дифференциально метилированных участков ДНК, выявляемых методом АИМС, может быть заменен рестриктазным картированием, проводимым на основе предварительного компьютерного моделирования.

3. Разработанные алгоритм и компьютерная программа AIMS in silico впервые обеспечили возможность моделирования результатов экспериментов АИМС с использованием баз данных нуклеотидных последовательностей генома человека.

4. Проведенная характеристика иерархии продуктов АИМС и полученные описания количественных и качественных параметров репрезентаций для различных экспериментальных условий позволяют быстро и эффективно осуществлять планирование реальных экспериментов АИМС.

5. Непредвзятый характер скрининга дифференциального метилирования методом АИМС подтвержден выявлением в образцах клеточных линий РМЖ дифференциального метилирования неканонической локализации.

Апробация работы.

Материалы исследования были доложены на ежегодных конференциях Европейского общества генетики человека в 2008 и 2009 гг., V и VI Международных конференциях «Молекулярная медицина и биобезопасность» (г. Москва) в 2008 и 2009 гг., VI съезде Российского общества медицинских генетиков в 2010 г. (г. Ростов-на-Дону), V конференции молодых ученых России с международным участием «Фундаментальные науки и прогресс клинической медицины» (г. Москва) в 2008 г., 6-м симпозиуме "Биологические основы терапии онкологических и гематологических заболеваний" (г. Москва) в 2009 г., конференции молодых ученых, посвященной 40-летию МГНЦ РАМН (г. Москва) в 2009 (диплом и премия), Всемирном эпигенетическом конгрессе (г. Берлин) в 2009 г., 11-й и 12-й Европейских

конференциях по цитогенетике и молекулярной генетике солидных опухолей (г. Бильбао, 2008 и г. Неймеген, 2010), III Международной Студенческой Научно-практической Конференции РУДН (г. Москва) в 2011 г., VI Московском международном конгрессе «Биотехнология: состояние и перспективы развития» (г. Москва) в 2011 г.

Разработанные в рамках исследования алгоритмы и компьютерные программы были использованы при выполнении НИР по гранту РФФИ № 08-04-01685 «Общие закономерности структурно-функциональной организации эпигеномов клеток рака молочной железы», по государственному контракту № 8/3-655н-08 от 31 декабря 2009 «Поиск и характеристика новых молекулярных маркеров для ранней диагностики, прогноза течения, мониторинга эффективности лечения рака мочевого пузыря», по государственному контракту № 8/3-657н-08 от 31 декабря 2009 «Поиск и характеристика новых молекулярных маркеров для ранней диагностики, прогноза течения, мониторинга эффективности лечения рака почки», по государственному контракту № 02.740.11.0089 от 15 июня 2009 в рамках федеральной целевой программы «Научные и научно-педагогические кадры инновационной России» на 2009-2013 годы по теме «Разработка новых диагностических технологий на основе механизмов эпигенетической регуляции», по гранту Earlier Breast Cancer Test Foundation " Development and validation of a differential methylation screening technology applicable for the identification of early breast cancer diagnostic markers".

Личный вклад автора.

Автором лично сформирован обобщенный алгоритм геномного скрининга дифференциального метилирования ДНК на основе поэтапного анализа существующих подходов к скринингу. Проведена оптимизация метода скрининга на основе критического анализа обобщенной схемы и алгоритма амплификации интерметилированных сайтов (АИМС). Разработаны алгоритм и компьютерная программа моделирования результатов экспериментов АИМС с использованием баз данных нуклеотидных последовательностей. Охарактеризована иерархия продуктов АИМС и описаны количественные и качественные параметры репрезентаций АИМС. Разработана компьютерная программа визуализации данных экспериментов и дифференциации геномных профилей. Разработаны алгоритм и компьютерная программа геномной идентификации выявляемых дифференциально метилированных участков ДНК. Проведен анализ дифференциального метилирования ДНК клеточных линий рака молочной железы, включающий: экстракцию геномной ДНК, амплификацию интерметилированных сайтов и сравнение геномных профилей, планирование и осуществление рестриктазного картирования дифференциально метилированных локусов, бисульфитную конверсию геномной ДНК, дизайн праймеров для метилспецифической ПЦР и проведение метилспецифической ПЦР, метилспецифическое секвенирование и построение детальных карт метилирования изучаемых участков генома, метилспецифический анализ конформации однонитевых фрагментов. Все этапы анализа дифференциального метилирования ДНК клеточных линий рака молочной железы выполнены личнот

Публикации. По теме диссертационного исследования опубликовано 27 печатных работ, в том числе 4 статьи в журналах, рекомендованных ВАК Минобрнауки для опубликования основных научных результатов диссертации, 2 главы в учебниках, 17 тезисов, зарегистрирована 1 новая медицинская ДНК-технологии, 3 рекламно-технических описания компьютерных программ.

Структур а н объем диссертации. Диссертационная работа изложена на 116 страницах машинописного текста, иллюстрирована 11 таблицами и 59 рисунками, состоит из введения, обзора литературы, экспериментальной части (материалы и методы), описания результатов и их обсуждения, выводов, списка цитируемой литературы, включающего 100 ссылок, и 2 приложений.

II. МАТЕРИАЛЫ И МЕТОДЫ

Материал для исследования.

Клеточные линии рака молочной железы ZR-75-1, HBL-100, HS 578 Т, ВТ-474, MCF7 и T-47D, послужившие материалом для дифференциального метилирования ДНК, предоставлены Федеральным государственным бюджетным учреждением науки «Институт биологии гена» Российской академии наук.

Экстракция и анализ геномной ДНК.

Экстракцию ДНК клеточных линий проводили стандартным методом (Sambrook J. et al., 1989). Рестрикцию ДНК, лигирование с адаптерами, полимеразную цепную реакцию и электрофорез проводили стандартными методами (Sambrook J. et al., 1989). Использовали рестриктазы Smal, Xmal (Сибэнзим, Россия), ДНК лигазу Т4 (Fermentas, Литва), ДНК-полимеразу Taq (Сибэнзим, Россия).

Валидацию статуса метилирования изучаемых локусов проводили метилспецифическим секвенированием (Hajkova Р., 2002) и метилспецифическим анализом конформации однонитевых фрагментов (Bianco Т., 1999). Реакцию автоматического прямого секвенирования проводили на приборе ABI Prism 3100, с использованием BigDye Terminator v3.1 Cycle Sequencing Kit (Applied Biosystems, США) по протоколам производителя.

Разработка алгоритмов и программного обеспечения непредвзятого скрининга дифференциального метилирования геномов.

При разработке программ использованы методы модульного, объектно-ориентированного и динамического программирования, цифровой обработки сигналов, численной оптимизации, разработки пользовательских интерфейсов, а также реляционная методология организации хранилища данных.

Использован портал организации совместной работы http://www.assembla.com, в состав которого интегрированы репозиторий с системой управления версиями, система управления задачами, пополняемая участниками проекта база знаний.

Целевой платформой разработки выбрана программная платформа .NET Framework для Microsoft Windows, позволяющая вести разработку с использованием различных специализированных языков программирования.

Программы написаны на языках программирования С# и С++.

Для хранения данных продуктов обработки исходной последовательности генома эндонуклеазой рестрикции используется реляционная система управления базами данных Microsoft SQL Server. Возможность задания индексов по предварительно вычисленным фланкирующим последовательностям фрагментов позволяет значительно ускорить выборку данных. Реляционная методология организации хранилища данных характеризуется простотой структуры данных, удобным табличным представлением и возможностью использования формального аппарата алгебры отношений и реляционного исчисления для обработки данных.

Smal

Xmal

лигирование с адаптером

ПЦР AG

радиоавтографы денатурирующих ПААГ

Рис. 1. Схема метода амплификации интерметилированных сайтов (АИМС). Сплошная линия изображает участок геномной ДНК, содержащий семь сайтов узнавания изошизомеров ресгриктаз Smal и Xmal - CCCGGG. Неметилированпые сайты обозначены синим цветом, метилированные - красным, адаптеры и праймеры -зеленым. Радиоавтографы полиакриламидных гелей (ПААГ) иллюстрируют фингерпринты, полученные с использованием праймеров, удлиненных на 1-3 нуклеотида (Frigola J. et al., 2002).

Программное обеспечение планирования и анализа результатов экспериментов.

В качестве инструмента для дизайна эксперимента по амплификации интерметилированных сайтов (АИМС) путем предварительного компьютерного моделирования ожидаемых результатов использована собственная программа компьютерной симуляции AIMS in silico.

В модифицированном методе АИМС (схема оригинального метода представлена на рис. 1) разделение флуоресцентно меченых продуктов проводили капиллярным электрофорезом на приборе АВГ Prism 3100 (Applied Biosystems, США). Результаты фрагментного анализа ДНК обрабатывали с использованием программы GeneMapper 2.0 (Applied Biosystems, США) и собственного программного

обеспечения PeakPick. Геномную идентификацию дифференциально метилированных участков ДНК, выявляемых методом АИМС, проводили методом рестриктазного картирования на основе моделей, сформированных программой AIMS in silico.

В качестве материала для компьютерного моделирования эпигеномных экспериментов использовали последовательность генома человека hgl9, GRCh37 Genome Reference Consortium http://www.ncbi.nlm.nih.gov/projects/genome/assembly/ grc/ в файлах формата FASTA (http://www.ncbi.nlm.nih.gov/BLAST/fasta.shtml).

Данные электрофореграмм получены из выходных файлов автоматического генетического анализатора ABI Prism 3100 (Applied Biosystems, США) формата ABIF (http://www.appliedbiosystems.com).

III. РЕЗУЛЬТАТЫ И ИХ ОБСУЖДЕНИЕ.

3.1. СОВРЕМЕННЫЙ АЛГОРИТМ НЕПРЕДВЗЯТОГО СКРИНИНГА ДИФФЕРЕНЦИАЛЬНОГО МЕТИЛИРОВАННИЯ

ГЕНОМОВ

Идеологическую и методологическую основу проведенного исследования составил специально разработанный алгоритм скрининга дифференциального метилирования геномов. Алгоритм состоит из трех основных блоков: 1) генноинженерный метод формирования репрезентаций эпигеномов; 2) метод высокоразрешающего разделения отдельных элементов репрезентации (исследуемых фрагментов ДНК); 3) методы компьютерного моделирования результатов экспериментов, планирования in silico, анализа результатов исследований in vitro.

В качестве основного подхода к формированию репрезентаций эпигеномов был принят метод, в наибольшей степени удовлетворяющий сформулированным требованиям - непредвзятому характеру скрининга, возможности стандартизации процедуры эксперимента, простоте и экономичности протоколов, возможности быстрой и технически несложной идентификации геномной принадлежности дифференциально метилированных участков ДНК, и возможности тестирования большого количества (десятков) образцов в одном эксперименте. Из опубликованных к настоящему времени методов таким требованиям в наибольшей степени удовлетворяет АИМС - амплификация интерметилированных сайтов (Frigola J. et al 2002).

Серьезным недостатком метода АИМС является техническая сложность геномной идентификации идентификации продуктов реакции. Это относится как к методу визуализации (радиоавтография низкопроцентного денатурирующего полиакриламидного геля большого размера с последующим совмещением изображения с реальным гелем), так и к методу определения геномной принадлежности интересующих фрагментов (клонирование амплификатов, содержащихся в элюатах интересующих областей, с последующим секвенированием множества клонов). В идеале метод, генерирующий такое значительное количество целевых фрагментов ДНК, как АИМС (в чем его несомненный плюс) должен быть реализован на платформе, обеспечивающей разрешение фрагментов ДНК по длине с точностью до одного нуклеотида. Такая платформа представлена па сегодняшний день капиллярным электрофорезом в формате фрагментного анализа. Примененный способ дискриминации продуктов АИМС, синтезированных с флуоресцентно меченых праймеров, с помощью многоканального капиллярного электрофореза

значительно повышает разрешающую способность метода и избавляет от необходимости использования радиоактивно меченых материалов.

Высокая разрешающая способность капиллярного электрофореза в сочетании с компьютерным обеспечением анализа результатов позволяют с высокой точностью определять длины выявляемых дифференциально метилированных фрагментов генома. Такая информация может использоваться для идентификации геномной локализации интересующих фрагментов т .чШсо, что исключает этапы физической изоляции их из геля, клонирования и секвенирования, снижая, тем самым, временные затраты, трудоёмкость и ресурсоёмкость исследования.

В целом, сочетание преимуществ АИМС, капиллярного электрофореза и компьютерного анализа позволяют разработать оригинальный современный алгоритм непредвзятого скрининга дифференциального метилирования геномов (рис. 2).

Рис. 2. Блок-схема алгоритма непредвзятого скрининга дифференциального метилирования геномов.

3.2. АЛГОРИТМ И КОМПЬЮТЕРНАЯ ПРОГРАММА МОДЕЛИРОВАНИЯ РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТОВ АИМС С ИСПОЛЬЗОВАНИЕМ БАЗ ДАННЫХ НУКЛЕОТИДНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ

В классическом варианте реализация АИМС приводит к формированию сложных фингерпринтов, количественный и качественный состав которых практически невозможно предугадать. С точки зрения идеологии непредвзятости скрининга метилирования такая ситуация оптимальна. В то же время получение четких информативных наборов продуктов АИМС возможно далеко не при любых условиях экспериментов.

Технология АИМС исключительно консервативна. На этапе лигирования фланкирующие участки всех продуктов рестрикции образцов геномной ДНК унифицируются с точки зрения последующей ПЦР, проводимой с универсальных праймеров. Нуклеотидный состав праймеров на 90-100% определяется составом адаптеров. Жесткие условия ПЦР, дающие высокую специфичность реакции и отсутствие неспецифичных продуктов, обеспечивают высокий уровень стандартизации метода и повторяемости результатов. Во всем протоколе АИМС существуют только два относительно гибких сегмента. Это выбор изошизомеров

рестриктаз, используемых при подготовке репрезентаций геномов, и вариации 3'-концов праймеров, которые могут различаться по длине на 1-4 нуклеотидов. Эти вариабельные участки праймеров («удлинители») могут различаться не только по длине, но и по нуклеотидному составу. Таким образом, дизайн эксперимента включает в себя лишь выбор рестриктаз, протяженности и нуклеотидного состава удлинителей. От этих факторов зависит количество возможных результирующих фрагментов АИМС и их геномная принадлежность. Тем не менее, разнообразие каргип АИМС, возникающее при разных сочетаниях указанных переменных параметров, исключительно велико.

Адекватный дизайн экспериментов АИМС можно обеспечить путем предварительного математического моделирования ожидаемых результатов. Такая возможность обеспечивается разработанной программой компьютерной симуляции AIMS in silico. Алгоритм работы программы включает моделирование полного набора фрагментов ДНК, получаемых при обработке исследуемого генома рестриктазой, выбранной для формирования геномной библиотеки (традиционно для АИМС это рестриктаза Xmal). Полученный набор фрагментов представляет собой полную репрезентацию АИМС, служащую основой для моделирования возможных исходов АИМС in vitro при различных условиях. Полученная полная репрезентация виртуально подвергается лигированию с предложенным пользователем адаптером и ПЦР с универсальными праймерами, содержащими заданные удлинители на З'-конце. Получаемые полные наборы возможных продуктов АИМС для заданных условий можно характеризовать с количественной и качественной точек зрения, причем в последнем случае реальное клонирование и секвенирование отдельных фрагментов ДНК заменяется сравнением с уже существующими геномными базами данных. Таким образом, алгоритм моделирования результатов экспериментов воспроизводит лабораторный протокол АИМС.

Интерактивный интерфейс разработанной на основе этого алгоритма программы AIMS in silico позволяет осуществлять ввод файлов, содержащих нуклеотидные последовательности, предназначенные для анализа, и выбор пользователем исходных условий эксперимента. К вводимым условиям эксперимента относятся: сайт узнавания рестриктазы, используемой для скрининга дифференциального метилирования, нуклеотидный состав короткой и длинной частей адаптера, нуклеотидный состав специфического удлинителя универсального праймера. Предусмотрена возможность ограничения длин результирующих фрагментов АИМС, в зависимости от способа их физического разделения. Выходные данные: общее количество продуктов ПЦР, которые могут быть получены при проведении АИМС с заданными условиями, их распределение по длинам, нуклеотидные последовательности каждого из ПЦР-продуктов. В графическом виде информация представляется как виртуальная хроматограмма капиллярного электрофореза, построенная в виде суперпозиции пиков Гаусса, соответствующих индивидуальным продуктам АИМС. Выбор отдельного пика при помощи курсора вызывает информацию о нем в специальном окне (рис. 3).

При составлении программы использованы преимущества технологии баз данных. Собственно анализ целевых последовательностей начинается с создания пользователем базы данных, содержащей информацию о каждом участке изучаемого генома, возникающем после обработки геномной ДНК эндонукпеазой рестрикции: длину продукта рестрикции и его нуклеотидный состав. После того, как такая база данных создана и сохранена, возможность быстрого обращения к ее содержимому

обеспечивает высокую скорость симуляции результатов АИМС для различных удлинителей универсального праймера.

Query: CCG N

IB IB U -J

Name Site

Extender: CCG; total: 74, Intact: 74, hydrolyzed: 0

190 Nucleotides

200

Length 177 Count 2

Length Data

177 ATTCGCAAAGCTCTGACCGGGCCGCGGCGGGGACGGSGACCGGGGCGCGGGGCCGGGGCTACCT

177 ATTCGCAAAGCTCTCACCGCCCCGGCGGCAGAGGGCGGGCGCCTGTGATCCGTGGCCAGGGAGC

Рис. 3. Пример окна программы AIMS in silico с выходными данными.

3.3. КОЛИЧЕСТВЕННАЯ И КАЧЕСТВЕННАЯ ХАРАКТЕРИСТИКА ПРОДУКТОВ АИМС, ПОЛУЧАЕМЫХ ПРИ РАЗЛИЧНЫХ ЭКПЕРИМЕНТАЛЬНЫХ УСЛОВИЯХ

Характеристика распределения сайтов узнавания эндопуклсазы рестрикции Xmal в геноме человека.

В классическом варианте АИМС используется эндонуклеаза рестрикции Xmal с сайтом узнавания CACCGGG. Программа AIMS in silico позволила оценить количественный и качественный состав продуктов гидролиза геномной ДНК человека этой рестриктазой. Общее число продуктов гидролиза составило 374146. Распределение последовательности CCCGGG по геному оказалось в целом случайным. Характер распределения сайтов узнавания Xmal одинаков на всех хромосомах. Митохондриальный геном последовательностей CCCGGG не содержит. Случайное пространственное распределение сайтов CCCGGG отличает рестриктазу Xmal от часто используемой в эпигенетических исследованиях Hpall, сайты узнавания которой преимущественно концентрируются в областях CpG-островков. Случайное распределение сайтов CCCGGG дало основание предположить, что использование Xmal в экспериментах АИМС позволит проводить дифференциальный анализ метилирования самых разнообразных, с точки зрения структуры и функции, геномных элементов. Это предположение полностью подтверждается более детальным анализом продуктов рестрикции Xmal.

Характер распределения Хша1-фрагментов, ограниченных порогом длин эффективного разделения капиллярным электрофорезом, показан на рис. 4, А. Общее число продуктов АИМС длиной до 600 нуклеотидов составило 73102.

a m

peaks I Extender: ; Total count: 72810

1400 1200 1000 BOO 600 400 200

К

100

—(_.— I

300 400

Nucleotides

—+—

500

Extender: eg; Total count: 308

300 400

Nucleotides

I- line peaksl Extender: ccg; Total count: 71

Nucleotides

Рис. 4. Виртуальные электорофореграммы АИМС, полученные с помощью программы ArMS in silico: А - характер распределения продуктов АИМС без удлинителей, отражающий распределение в геноме Хша1-фрагментов длиной до 600 н.п. Б, В - виртуальные электорофореграммы АИМС с удлинителями CG и CCG, соответственно.

Качественный анализ полученной репрезентации генома показал, что она обогащена повторяющимися последовательностями с длинами коровых единиц от 100 до 1000 нуклеотидов, принадлежащими самым разнообразным классам рассеянных и тандемных повторов: Alu, LTR, прителомерным повторам, неклассифицированным повторам низкой сложности и др. Некоторые близкородственные, или, по крайней мере, в значительной степени гомологичные высококопийные повторяющиеся последовательности образовали выраженные кластеры продуктов АИМС (несколько высоких, до 1500 копий, пиков на хроматограмме, в области длин до 80 нуклеотидов, рис. 4, А). Присутствуют в разных соотношениях и другие классы геномных последовательностей (уникальные межгенные и интронные участки, CpG-островки и т.д.).

Количественная иерархия продуктов АИМС генома человека

Для ограничения сложности картин АИМС с целью облегчения анализа электрофореграмм при проведении ПЦР используются праймеры, удлиненные на несколько нуклеотидов. Обычно выбор удлинителей праймеров проводится случайным образом и утверждается либо отвергается по результатам экспериментов.

Авторы метода АИМС изначально постулировали, что при прочих равных условиях добавление каждого дополнительного нуклеотида к универсальным праймерам предполагает снижение сложности результирующей картины (т.е. снижение количества продуктов АИМС) примерно в 5 раз для C,G и в 3 раза для А,Т. Такое предположение сделано, исходя из представленности нуклеотидов в геноме человека.

Случайный выбор удлинителей с использованием такой приблизительной эмпирической формулы для оценки сложности репрезентаций геномов снижает ценность АИМС как универсального метода скрининга, необходимой характеристикой которого должен стать высокий уровень стандартизации. Кроме того, использование различных наборов нуклеотидов в качестве удлинителей должно сдвигать спектральный состав результирующих репрезентаций либо в А,Т-богатые области, либо в области CpG-островков, и это влияние должно, несомненно, учитываться не только при анализе результатов, но и на самом первом этапе исследования - в процессе определения дизайна эксперимента.

Для предоставления исследователям возможности обоснованного выбора удлинителей с помощью программы AIMS in silico сформировано графическое представление количественной иерархии продуктов АИМС генома человека (рис. 5). Приведенная гистограмма ясно показывает, что для подавляющего числа семейств удлинителей достаточно трех нуклеотидов, чтобы снизить сложность картины АИМС таким образом, чтобы продукты ПЦР можно было четко дифференцировать после разделения в полиакриламидном геле. Речь идет о количестве продуктов, не превышающем второго порядка в пределах длин до одной тысячи нуклеотидов.

Предоставляемая программой симуляции АИМС in silico возможность построения иерархического дерева конечных продуктов в зависимости от длин и нуклеотидного состава удлинителей не только позволяет уточнить функцию снижения сложности для каждого конкретного случая, но и демонстрирует удивительные результаты. Так, характер первого же нуклеотида в удлинителе практически не влияет на сложность картины: присоединение нуклеотида А, Т, С или G приводит к ограничению количества продуктов соответственно до 8.5, 5.5, 7 и 7 тысяч. При этом разница результатов присоединения А и Т значительно более

выражена, чем разница между А/Т и C/G. Чрезвычайно выраженные различия наблюдаются на уровне удлинителей из двух нуклеотидов. Так, в семействе удлинителей с первым нуклеотидом Т значения результирующих количеств продуктов АИМС для ТА, ТС, ТО и TT составляют 20, 152, 191 и 2547 соответственно, т.е. разница в степени сложности репрезентаций составляет целых два порядка. Снижение сложности до состояния практически полной неинформативности для некоторых удлинителей наступает уже на уровне грех нуклеотидов. В частности, АИМС in silico с одним из удлинителей ААТ, TAT, ТСА и GTA приводит к возникновению лишь одного продукта реакции. В то же время, использование некоторых других гринуклеотидных удлинителей приводит к едва заметному снижению сложности исходной картины: например, для AGG количество фрагментов составляет 2829, для TTC - 2161. Экспериментальное определение этих параметров потребовало бы невероятных затрат труда, времени и материалов, а неопределение наверняка привело бы к ложной интерпретации опытных данных.

Важным качественным параметром, определяющим дизайн АИМС, является характер распределения продуктов ПЦР по длинам в анализируемой области. Распределение должно быть в целом равномерным, длины отдельных фрагментов в идеале должны различаться не менее чем на два нуклеотида. В этом случае будет обеспечиваться четкая идентификация пиков на хроматограмме капиллярного электрофореза и однозначность результатов анализа.

Не менее важным фактором, влияющим на выбор удлинителей для проведения АИМС, является их полная гомология с теми или иными структурно-функциональными элементами генома,

определяющая конечный качественный состав анализируемых фрагментов ДНК.

Рис. 5. Иерархическая диаграмма продуктов АИМС до 1 т.п.п., предсказанных для классических условий эксперимента. Синим цветом обозначено общее количество первичных фрагментов (при отсутствии удлинителей) - около 100 тыс. Красным цветом указаны количества продуктов, получаемых при использовании однонуклеотидных удлинителей, желтым - двухнуклеотидных, зеленым - трехпуклеотидных. Диапазон предсказанных количеств фрагментов составляет от 1 до 100000, поэтому ось абсцисс представлена логарифмической шкалой.

Качественный состав продуктов АИМС генома человека и дизайн экспериментов АИМС при помощи программы AIMS in silico

Нуклеотидные последовательности продуктов АИМС, предоставляемые программой AIMS in silico, позволяют однозначно локализовать анализируемые фрагменты и, пользуясь доступными базами данных, определить принадлежность каждого из них к тому или иному классу геномных последовательностей. Используя эту возможность, можно целиком осуществить обоснованный дизайн эксперимента АИМС в зависимости от целей исследования и доступной приборной базы, ни разу не прибегая к планировочным экспериментам. Ниже приводится конкретный пример, демонстрирующий возможности дизайна экспериментов АИМС in silico.

Поставим задачу определения условий АИМС для изучения характера метилирования не менее 100 CpG-островков в образцах условно нормальной и опухолевой тканей молочной железы. Планирование такого эксперимента будет включать следующие этапы. Прежде всего, предложим рабочую гипотезу, ограничивавшую качественный состав потенциальных удлинителей. Гипотеза заключается в простом и очевидном предположении, что для обогащения фракции продуктов АИМС фрагментами классических CpG-островков необходимо использовать удлинители, содержащие по крайней мере один динуклеотид CG. Среди двухнуклеотидных такой удлинитель, очевидно, лишь один - CG, и результаты компьютерной симуляции АИМС (рис. 4, Б) показывают, что его использование в эксперименте нецелесообразно: в пределах длин до 600 нуклеотидов он создает 308 фрагментов, причем их распределение не соответствует сформулированным выше требованиям.

Среди тринуклеотидных удлинителей последовательностей, содержащих CG, восемь: ACG, CCG, CGA, CGC, CGT, CGG, GCG, и TCG. Количество продуктов АИМС длиной до 600 нуклеотидов для каждого из них - соответственно 10, 71, 3, 73, 3, 43, 65, и 21. Ни один из этих удлинителей не дает возможности анализа 100 фрагментов АИМС, поэтому выберем из них три, обещающих достаточно высокую информативность - CCG, CGC и GCG. Рассмотрение результатов виртуального электрофореза для удлинителя CGC (рис. 6, Б) показывает, что его высокая информативность, предполагаемая исходя из количества продуктов АИМС, обманчива. Из 73 фрагментов 60 группируются в области до 250 нуклеотидов; формируются 8 кластеров фрагментов одной длины, относящихся к 2-10 геномным локусам. Кластер фрагментов с длинами 222 н.п. включает в себя 5 продуктов АИМС, представляющих участки сателлитных повторов и не имеющих отношения к CpG-островкам. Одиннадцать фрагментов с общей длиной 44 н.п. и три фрагмента с общей длиной 46 н.п. представлены высокогомологичными участками непромоторных CpG-островков. Что же касается предсказанных продуктов АИМС, получаемых при использовании удлинителей CCG и GCG, то их распределение более равномерно, расстояние между большинством пиков превышает два нуклеотида, обе репрезентации содержат лишь по одному кластеру из трех продуктов АИМС (рис. 6, А и В). По этим признакам удлинители CCG и GCG в большей степени соответствуют оптимальным параметрам репрезентации, чем CGC.

На следующем этапе необходимо определить качественный состав продуктов АИМС, получение которых возможно с выбранными удлинителями CCG и GCG. Используя нуклеотидные последовательности продуктов АИМС, с помощью программы BLAT определяем их геномную локализацию и принадлежность к классу CpG-островков.

2.5

0 20 6

5 1.5 л

1 ' ■«

г

0.5 0.0

А

Б

Э.О

С

~ 1.5 а

I ,.о г

0.5

В

Рис. 6. Виртуальные электорофореграммы АИМС с удлинителями ССй(А) и СОС(Б) и ОСО(В).

Рассмотрим результаты этого этапа более подробно на примере удлинителя ССй. Пример соответствующей виртуальной хроматограммы представлен на рис. 6, А. Состав предсказанной репрезентации генома отражен на рис. 7. Анализ показывает, что абсолютное большинство результирующих продуктов АИМС при удлинителе ССО принадлежит классическим протяженным СрО-островкам с высоким содержанием СрО-динуклеотидов: от 25 до 400, в среднем 125.

Аналогичные результаты дает количественный и качественный анализ продуктов АИМС при удлинителе ССО. Таким образом, совместный анализ образца биологического материала с использованием удлинителей ССО и ОСй позволяет определять состояние метилирования 136 геномных участков, 122 из которых представлены СрО-островками. Дизайн эксперимента АИМС с заранее заданными параметрами завершен.

Ех1епйег: ССС; юга!: 71, [п1ас1: 71, (1ус1го|уге(1: 0

Ехипйег: СвС; (ои1. 73, ¡льэс;: 73, Ьу(1го1уге(1: 0

щЩкШ! Ни III II I , 1 и, II I

100 200 300 400 500

Ех1епс1ег; ССС; 1о1а1: 6Б, 1п1ас1:66, Ьус1го1угес1:0

||и»го1У2ва иная

18

CpG островки: 93%

внутригенные CpG-островки; 21%

промоторные CpG-островки: 47%

не CpG-островки: 4% репрезентации, предсказанной для АИМС с

Рис. 7. Состав геномной удлинителем ССв. А - фракции Срв-островков и других последовательностей; Б отношение СрО-островков к кодирующим последовательностям.

другие C,G богатые участки: 7%

' 3-CpG-островки: 8%

межгенные \ промоторные НЕ

CpG-островки: 17% \ СрО-островки: 3%

3.4. АЛГОРИТМ И КОМПЬЮТЕРНАЯ ПРОГРАММА ГЕНОМНОЙ ИДЕНТИФИКАЦИИ ВЫЯВЛЯЕМЫХ |

ДИФФЕРЕНЦИАЛЬНО МЕТИЛИРОВАННЫХ УЧАСТКОВ ДНК

Особенности первичной нуклеотидной последовательности продуктов АИМС j не позволяют проводить их точную идентификацию по молекулярной массе в соответствии с распределением, предсказанным in silico. Исключительно обогащенные С,С-нуклеотидами фрагменты ДНК мигрируют в среде разделения со скоростями, отличными от таковых, характерных для фрагментов с усредненным нуклеотидным составом. Кроме того, использование денатурирующей среды для проведения капиллярного электрофореза зачастую вызывает различия электрофоретической подвижности С,С-обогащенных комплементарных фрагментов ДНК, приводя к двоению соответствующих сигналов на электрофореграмме.

Традиционный дизайн АИМС предполагает клонирование и секвенирование интересующих фрагментов ДНК для определения их геномной принадлежности. Пользуясь тем, что определение нуклеотидной последовательности генома человека уже практически полностью завершено и, соответственно, последовательности возможных продуктов АИМС также известны, этапы клонирования и секвенирования | заменены последовательными этапами рестриктазного картирования in si/ico и in ¡ vitro.

Для осуществления рестриктазного картирования in silico был введен дополнительный модуль в программу AIMS in silico. Моделирование рестриктазного картирования проводится на основе полной репрезентации АИМС, предсказанной для ! конкретных условий эксперимента, с использованием рестриктаз, выбираемых из заранее сформированного списка. Сигналы виртуальной электрофореграммы, соответствующие «гидролизованным» продуктам АИМС при выборе конкретной I рестриктазы, определяются по изменению цвета.

Виртуальная электрофореграмма результатов рестриктазного картирования продуктов АИМС интерактивна; предусмотрена возможность копирования полной 1 нуклеотидной последовательности выбранного продукта АИМС при помощи курсора (рис. 8).

Query: CCG ш

§Г uJ -J

Extender: CCG; total : 74, intact: 71, hydrolyzed: 3

400 500 Nucleotides

Length 530 Count 1

Length Data

Copy Ctrl* С -m-

¥

Рис. 8. Пример определения последовательности продукта АИМС в рамках виртуального рестриктазного картирования в программе AIMS in silico.

Разработан алгоритм интеграции рестриктазного картирования in silico и in vitro. Картирование реально получаемых продуктов АИМС проводится, как и в случае компьютерного моделирования, на основе полной репрезентации АИМС, получаемой для конкретных условий эксперимента. Для создания полной репрезентации in vitro из лабораторного протокола АИМС исключается этап гидролиза ДНК метилчувствитедьной рестриктазой Smal. Таким образом моделируется состояние полного метилирования изучаемого генома.

3.5. АНАЛИЗ ДИФФЕРЕНЦИАЛЬНОГО МЕТИЛИРОВАНИЯ ДНК КЛЕТОЧНЫХ ЛИНИЙ РАКА МОЛОЧНОЙ ЖЕЛЕЗЫ

При сравнении элекгрофореграмм продуктов АИМС геномов клеточных линий с удлинителем CCG выявлены дифференциально метилированные локусы в диапазонах длин 150-167, 167-176 и 176-190 п.н. (рис. 9).

- ZRMS HBLMS HS.MS

- ет ws - M0F7A1S - ТЧ70 Ms

Рис. 9. Сравнение элекгрофореграмм продуктов АИМС с удлинителем CCG клеточных линий РМЖ.

Моделирование с помощью программы AIMS in silica предсказывает получение в эксперименте АИМС с удлинителем CCG в указанном диапазоне трех групп продуктов: l)ccgl64, ccg!65, ccgl68; 2) ccgl76, ccgl77.1, ccgl77.2, и 3) ccgl89. Краткая характеристика геномной принадлежности локусов продуктов приведена в таблице 1. Виртуальная электрофореграмма продуктов представлена на рис. 10. С помощью программы AIMS in silico получен план рестриктазного картирования (табл. 2)

Таблица 1. Характеристика геномной принадлежности локусов.

Фрагмент ccg 164 ccg165 ccgl68 ccg176 ccr177.1 ccgl77.2 ccgl89

Локали-зация 7pl 3 16q23.2 10q21.2 12ql3.13 7p22.3 13q32.1 21q22.3

Ген PURB ATM IN ANK3 межгенный =40т.п.н. SCN8A, ANKRD33 MAFK межгенный =16кБ 3' ABCC4 C2CD2

1 экзон 1 экзон -1 интрон 1 интрон l интрон 1 экзон (5'UTR)

Нить - + - + -

TSS* 494 248 212 192 43

CpG-островок - + + + + + +

CG-кластер + + + + + + +

" расстояние до TSS (transcription start site - сайт инициации транскрипции)

Рис. 10. Результаты моделирования продуктов АИМС с удлинителем ССй диапазоне длин 160-190 п.н.

Таблица 2. План рестриктазного картирования

ccgl64 ccgl65 ccg!68 ccgl76 ccgl77.1 ccg 177.2 ccg189

Accl61 +

Sbn +

Egel + +

Avrll +

Bso311 +

BssHU + +

Гидролиз продуктов АИМС эндонуклеазами рестрикции и сравнение электрофореграмм позволили однозначно определить положение пиков продуктов на электрофореграммах (рис. 11).

5000 4000 3000 | 2000 1000 0

Рис. 11. Пример позиционирования пиков продуктов на электрофореграмме продуктов АИМС клеточной линии МСР7 до (черным) и после гидролиза ВвзНП (красным). Зеленой стрелкой обозначен пик продукта, соответствующий сс§177.2, синей стрелкой - продукт гидролиза.

С использованием метода метилспецифического секвенирования (рис. 12) построены карты метилирования (рис. 13) выявленных локусов дифференциального метилирования.

Рис. 12. Пример элекгрофореграммы метилспецифического секвенирования локуса с^\11.2 в клеточной линии МСР7. Стрелками указаны сайты узнавания рестриктазы Бта! в полностью метилированном состоянии (после бисульфитной обработки - ТТСООО).

Эта) Эта!

^ 9 у+у уу*??9?999 9 9 9*»?»*99 9 99 999 9 9 9

нвыоо 9 9*?*ууууу**туу * 99*49 9999999 999 9?? 99 9

Н„7ЯТ 9 9999^9^99999 у р оду» уодздру уур Ш 9 9 9

вт-474 9 №999 999 999Л99У??+ ? 99**?999999 + ?Р 99999 9 ысп 9 УУ1ИУУ9?9+ У У **УУУУ»УУ У?9 99 9

т-47о 9 999 ФЯтЯФ? 9 <?<НИ??9?ЗД>9 ??9 9?999 9

Рис. 13. Карты метилирования локуса генома человека, содержащего фрагмент АИМС ccgl77.2. Белыми кружками показаны неметилированные СрО-динуклеотиды, черными - метилированные, серыми - частично метилированные, желтыми - СрО-динуклеотиды, состояние метилирования которых определить не удалось.

Сравнение результатов, полученных методами АИМС и мегилчувствительного секвенирования, показало совпадение оценок статуса метилирования сайтов 8та1 по всем исследуемым локусам во всех образцах, кроме локуса ^164 (Р1ЖВ) в линии НВЬ и локусов сс§168 и ^177.1 в линии Т-47Б, для которых метилспецифическое секвенирование не подтвердило наличия метилирования. Возможно, наблюдаемые расхождения объясняются более высокой чувствительностью метода АИМС по сравнению с секвенированием по Сэнгеру.

Сравнение электрофореграмм полной репрезентации и продуктов АИМС клеточной линии НВЬ-100 (рис. 14) показало, что уровень сигнала продукта АИМС, соответствующего локусу ссц168, примерно вдвое ниже, чем на электрофореграмме полной репрезентации, что согласуется с данными карты метилирования по локусу а^168 для клеточной линии НВЬЧОО - один сайт 8та1 полностью метилирован, второй в полуметилированном состоянии (рис. 15). Уровень сигнала продукта АИМС, соответствующего локусу ccgl64, значительно ниже, чем на электрофореграмме полной репрезентации, что позволяет предположить наличие в образце минорной субпопуляции геномов (мозаичность), в которых соответствующие СрО-динуклеотиды находятся в метилированном состоянии.

5000 ■1000

S

I 3000 с

2000 1000

Size (nucleotides)

Рис. 14. Сравнение электрофореграмм полной репрезентации (черным) и продуктов АИМС (красным) клеточной линии HBL-100.

Smal

nI'

Smal \1/

QfM fMftWP fififfff

.QQ?9 даросжр

(ХРРОРРОСЖР даото

QQP форросжр 9W?

QQ9Q дадасдр рода

т-™

Рис. 15. Карты метилирования локуса генома человека, содержащего фрагмент АИМС ссд!68 (АИКЗ). Здесь и далее белыми кружками показаны неметилированные Срв-динуклеотиды, черными - метилированные, серыми - в полуметилированном состоянии, желтым - СрО-динуклеотиды, состояние метилирования которых определить не удалось.

Сравнение электрофореграмм полной репрезентации и продуктов АИМС клеточной линии Т-471) (рис. 16) показывает, что уровень сигналов продуктов АИМС, соответствующих локусам ccgl68 и сс§177.1 значительно ниже, чем на электрофореграмме полной репрезентации, что может быть объяснено тем же явлением.

7000 . 6000 5000 JOfIG 3000 2000 1000

Size (nucleotides)

Рис. 16. Сравнение электрофореграмм полной репрезентации (черным) и продуктов АИМС (красным) клеточной линии T-47D.

Метилспецифический анализ копформации однонитевых фрагментов АИМС ccgI68 показал в образце клеточной линии HBL100 наличие метилированных молекул, обладающих измененной электрофоретической подвижностью относительно неметилированной ДНК (

рис. 17). Для образца клеточной линии T-47D показано наличие только фракций молекул с измененной электрофоретической подвижностью, в то время как

результаты метилспецифического секвенирования (рис. 15) не показывают наличия метилирования ни по одному CpG-динуклеотиду, что может быть объяснено высокой гетерогенностью клеточной линии по статусу метилирования в связи с повреждением механизма поддержания метилирования в этой клеточной линии (Ting А.Н. et а!., 2006).

1 2 3 4 5 6 7

нами H&'jfcU- Яй'*" **

■ - • ■ • Щ / 11

Рис. 17. Метилсиецифический анализ конформации однонитевых фрагментов по локусу АИМС ccgl68. 1, 3, 4, 5, 7 - образцы неметилированной ДНК. 2 - образец ДНК клеточной линии HBL100. 6 - образец ДНК клеточной линии T-47D. Стрелками указаны сигналы, соответствующие неметилированным молекулам.

Проведенное исследование говорит о высокой чувствительности разработанного метода анализа дифференциального метилирования геномов. Анализ геномов клеточных линий рака молочной железы ZR-75-1, HBL-I00, HS 578 Т, ВТ'474, MCF7 и T-47D выявил 6 дифференциально метилированных геномных локусов, которые ранее не изучались с точки зрения дифференциального метилирования: участки CpG-островков, расположенных в первых интронах генов ANK3 и MAFK, в промоторной области гена C2CD2, в межгенных областях на хромосомах 12ql3.13 и 13q32.1, а также участок первого экзона гена PURB, не являющийся CpG-островком. Выявление дифференциального метилирования неканонической локализации подтверждает непредвзятость разработанного алгоритма скрининга.

ВЫВОДЫ.

1. Сочетание классического генноинженерного подхода (амплификации ингерметилировапных сайтов) и высокоразрешающего способа разделения фрагментов нуклеиновых кислот - капиллярного электрофореза - с математическим моделированием экспериментов позволило разработать современный алгоритм скрининга дифференциального метилирования геномов.

2. Рестриктазпое картирование, проводимое на основе предварительного математического моделирования, исключает необходимость реамплификации, клонирования и секвенирования индивидуальных продуктов амплификации интерметилированных сайтов в процессе определения их геномной принадлежности.

3. Разработанные алгоритм и компьютерная программа AIMS in silico впервые обеспечили возможность моделирования результатов экспериментов амплификации

интерметилированных сайтов с использованием баз данных нуклеотидных последовательностей генома человека.

4. Проведенная характеристика иерархии продуктов амплификации интерметилированных сайтов и полученные описания количественных и качественных параметров репрезентаций для различных экспериментальных условий позволяют быстро и эффективно осуществлять планирование экспериментов.

5. Анализ геномов клеточных линий рака молочной железы ZR-75-1, HBL-100, HS 578 Т, ВТ-474, MCF7 и T-47D выявил 6 дифференциально метилированных геномных локусов, которые ранее не изучались с точки зрения дифференциального метилирования. Среди них - участки CpG-островков, расположенных в первых интронах генов ANK3 и MAFK, в промоторной области гена C2CD2, в межгенных областях на хромосомах 12q 13.13 и 13q32.1, а также участок первого экзона гена PURB, не являющийся CpG-островком. Выявление дифференциального метилирования неканонической локализации подтверждает непредвзятость разработанного алгоритма скрининга.

СПИСОК ОПУБЛИКОВАННЫХ РАБОТ ПО ТЕМЕ ДИССЕРТАЦИИ

Статьи, опубликованные в изданиях, рекомендованных ВАК:

1. Стрельников В.В., Танас A.C., Шкарупо В.В., Кузнецова Е.Б., КекееваТ.В., Завалишина Л.Э., Франк Г.А., Залетаев Д.В. Современный высокотехнологичный метод скрининга дифференциального метилирования геномов на основе амплификации интерметилированных сайтов // Молекулярная медицина, 2009. № 4. С. 18-26

2. Залетаев Д.В., Стрельников В.В., Немцова М.В., Бабенко О.В., Кузнецова Е.Б., Землякова В.В., Кекеева Т.В., Михайленко Д.С., Шкарупо В.В., Танас A.C. Маркеры метилирования в диагностике онкологических заболеваний // Медицинская генетика, 2010. Т.9 №1. С. 15-21

3. Танас A.C., Шкарупо В.В., Кузнецова Е.Б., Залетаев Д.В., Стрельников В.В. Дизайн эксперимента и анализ результатов амплификации интерметилированных сайтов с использованием компьютерной программы AIMS in silico // Молекулярная биология, 2010. Т.44№ 2. С. 355-365

4. Tanas A.S., Shkarupo V.V., Kuznetsova Е.В., Zaletayev D.V., Strelnikov V.V. Novel tools for unbiased DNA differential methylation screening // Epigenomics, 2010. Vol. 2. No. 2. P. 325-333

Публикации в других изданиях:

5. Танас A.C., Стрельников В.В., Шкарупо В.В., Кузнецова Е.Б., Залетаев Д.В. Современный высокотехнологичный метод диагностики маркеров метилирования в онкологии // Онкогематология, 2008. №4. С. 73-74

6. Strelnikov V.V., Tanas A.S., Shkarupo V.V., Kuznetsova E.B., Zaletaev D.V. Unbiased differential methylation screening assay for applications in cancer epigenetic research. 11 European Workshop on Cytogenetics and Molecular Genetics of Solid Tumours // Atlas of Genetics and Cytogenetics in Oncology and Haematology, 2008. P.59-60

7. Shkarupo V.V., Tanas A.S., Kuznetsova E.B., Zavalishina L.E., Frank G.A., Zaletaev D.V., Strelnikov V.V. A semi-automated unbiased differential methylation screening assay for applications in cancer epigenetic research // Eur. J. Hum. Genet., 2008. V.16. Suppl. 2. P. 223

8. Шкарупо В.В., Таиас A.C., Кузнецова Е.Б., Стрельников В.В.,Залетаев Д.В. Метод анализа структурно-функциональной организации эпигеномов клеток рака молочной железы // Тезисы V Конференции молодых ученых России с международным участием «Фундаментальные науки и прогресс клинической медицины» Москва, 2008. С. 489

9. Стрельников В.В., Танас A.C., Шкарупо В.В., Кузнецова Е.Б., Залетаев Д.В. Синтетический непредвзятый метод скрининга дифференциального метилирования геномов опухолевых клеток // V Международная конференция «Молекулярная медицина и биобезоиасность», научная программа и тезисы, 2008. С. 94-95

10.Танас A.C., Шкарупо В.В., Кузнецова Е.Б., Залетаев Д.В., Стрельников В.В. Программное обеспечение для скрииига дифференциального метилирования геномов на основе амплификации интерметилированных сайтов // Медицинская генетика, 2009. Т.8. №12 (90). С. 33

11.Tanas A.S., Shkarupo V.V., Kuznetsova Е.В., Zaletaev D.V., Strelnikov V.V. Amplification of intermethylated sites, Bioinformatics and Capillary electrophoresis: the ABC of the cancer methylomes // Eur. J. Hum. Genet., 2009. V.17. Suppl.2. P. 284

12.Tanas A.S., Shkarupo V.V., Kuznetsova E.B., Zaletayev D.V., Strelnikov V.V. Software for Genomic/Epigenomic Research // Eposters.net - the online journal of scientific posters, 2009. EP10983

13.Шкарупо B.B., Танас A.C., Кузнецова Е.Б., Залетаев Д.В., Стрельников B.B. Современные подходы к скринингу дифференциального метилирования геномов клеток рака молочной железы // Медицинская генетика, 2009. Т.8. №12 (90). С. 41

14.Стрельников В.В., Таиас A.C., Землякова В.В., Залетаев Д.В. Разработка новых методов диагностики маркеров метилирования ДНК в онкологии // Учебник под ред. М.А.Пальцева и Д.В.Залетаева "Системы генетических и эпигенетических маркеров в диагностике онкологических новообразований". М.: ОАО «Идательство «Медицина», 2009. 384 е.: ил. (Учеб. лиг. для студ. мед. вузов). ISBN 5-225-03384-9. УДК 606006.04.07:575. Глава 11. С. 349-384

15.Стрельников В.В., Таиас A.C., Шкарупо В.В., Кузнецова Е.Б., Залетаев Д.В. Современные высокотехнологичные методы диагностики маркеров метилирования ДНК в онкологии // Пятый московский международный конгресс «Биотехнология: состояние и перспективы развития», 16-20 марта 2009. С. 90-91

16.Шкарупо В.В., Танас A.C., Кузнецова Е.Б., Стрельников В.В., Залетаев Д.В. Скрининг дифференциального метилирования геномов клеток рака молочной железы // Материалы VI съезда Российского общества медицинских генетиков, г.Ростов-на-Дону, 14-18 мая 2010. С. 197

17.Стрельников В.В., Кузнецова Е.Б., Шкарупо В.В., Танас A.C., Залетаев Д.В. Уроки непредвзятого скрининга дифференциального метилирования ДНК // Материалы V[ съезда Российского общества медицинских генетиков, г.Ростов-на-Дону, 14-18 мая 2010. С. 172-173

18.Strelnikov V., Tanas A., Shkarupo V., Kuznetsova Е., Gorban N., Zaletaev D. Non-microarray DNA differential methylation screening in breast cancer // 12th European Workshop on Cytogenetics and Molecular Genetics of Solid Tumors, Nijmegen, the Netherlands, 3-6 June 2010. P. 104

19.Tanas A., Shkarupo V., Kuznetsova E., Zaletaev D., Strelnikov V. AIMS in silico & PeakPick: a software package supporting unbiased screening of DNA differential methylation in cancer // 12th European Workshop on Cytogenetics and Molecular Genetics of Solid Tumors, Nijmegen, the Netherlands, 3-6 June 2010. P. 106

20.Танас A.C., Шкарупо В.В., Стрельников В.В. Компьютерная программа AIMS in silico // Рекламно-техническое описание, описание программы, описание применения. Регистрационный номер ВНТИЦ 50201050017. Москва, 2010 г.

21.Танас A.C., Руденко В.В., Стрельников В.В. Компьютерная программа PeakPick // Рекламно-техническое описание, описание программы, описание применения. Регистрационный номер ВНТИЦ 50201050040. Москва, 2010 г.

22. Руденко В.В., Танас A.C., к.б.н. Стрельников В.В., к.б.н. Кузнецова Е.Б., проф. Залетаев Д.В. Скрининг аномального метилирования ДНК на основе метода амплификации интерметилированных сайтов для диагностики злокачественного опухолевого процесса // Медицинская ДНК-технология, Разрешение ФС № 2011/132 от 27.05.2011г.

23.Тапас A.C., Руденко В.В., Стрельников В.В., Залетаев Д.В. Алгоритмы и программное обеспечение скрининга эпигенетических нарушений при раке // Шестой московский международный конгресс «Биотехнология: состояние и перспективы развития», 2011. С. 139-140

24.Стрельников В.В., Кузнецова Е.Б., Танас A.C. Методы анализа метилирования ДНК // Учебник под ред. М.А.Пальцева и Д.В.Залетаева «Введение в молекулярную диагностику», том 2 «Молекулярно-генетические методы в диагностике наследственных и онкологических заболеваний». М.: ОАО «Издательство «Медицина», 2011. - 506 е.: ил. (Учеб. лит. для студ. мед. вузов). С. 80-99

25.Танас A.C., Руденко В.В., Кузнецова Е.Б., Залетаев Д.В., Стрельников В.В. Алгоритмы и программное обеспечение скрининга дифференциального метилирования геномов клеток злокачественных новообразований // III Международная Студенческая Научно-практическая Конференция РУДН, 2011. С.25-26

26.Руденко В.В., Кузнецова Е.Б., Танас A.C., Залетаев Д.В., Стрельников В.В. Скрининга дифференциального метилирования геномов клеток рака молочной железы // III Международная Студенческая Научно-практическая Конференция РУДН, 2011.С. 24-25

27. Танас A.C., Руденко В.В., Стрельников В.В. Программа для ЭВМ "AIMS in silico 2". Рекламно-техническое описание, описание применения. Регистрационный номер ВНТИЦ 50201151514, Москва, 2011 г.

Список сокращений.

АИМС - амплификация интерметилированных сайтов

ДНК - дезоксирибонуклеиновая кислота

КЭФ - капиллярный электрофорез

п.н. - пара нуклеотидов

ПААГ - полиакриламидный гель

ПЦР - полимеразная цепная реакция

РМЖ - рак молочной железы

т.п.н. - тысяча пар нуклеотидов

\

Подписано в печать. Формат 60x84/16 Бумага офсетная. Печать офсетная. Усл. печ. л. 1,0 Тираж 120 Экз. Заказ № 963 Типография ООО "Ай-клуб" (Печатный салон МДМ) 119146, г. Москва, Комсомольский пр-кт, д.28 Тел. 8-495-782-88-39

Текст научной работыДиссертация по биологии, кандидата биологических наук, Танас, Александр Сергеевич, Москва

61 12-3/750

Федеральное государственное бюджетное учреждение "Медико-генетический научный центр" Российской академии медицинских наук

На правах рукописи

Танас Александр Сергеевич

АНАЛИЗ ДИФФЕРЕНЦИАЛЬНОГО МЕТИЛИРОВАНИЯ ГЕНОМОВ МЕТОДАМИ НЕПРЕДВЗЯТОГО СКРИНИНГА

03.02.07 «генетика» 03.01.09 «математическая биология, биоинформатика»

Диссертация на соискание ученой степени кандидата биологических наук

Научный руководитель к.б.н. В.В. Стрельников

Москва 2012

ОГЛАВЛЕНИЕ

ОГЛАВЛЕНИЕ..............................................................................................................................1

СПИСОК ИСПОЛЬЗУЕМЫХ СОКРАЩЕНИЙ........................................................................5

ВВЕДЕНИЕ....................................................................................................................................6

Глава 1. ОБЗОР ЛИТЕРАТУРЫ................................................................................................12

1.1. Значение метилирования ДНК в норме и патологии....................................................12

1.2. Распределение СрО-динклеотидов в геноме. СрО-островки.......................................13

1.3. Дифференциальное метилирование ДНК......................................................................15

1.4. Аномальное метилирование генов, вовлеченных в канцерогенез..............................17

1.5. Методы анализа метилирования ДНК............................................................................20

1.5.1. Методы ген-специфического анализа метилирования ДНК.................................21

1.5.2. Методы скрининга дифференциального метилирования геномов нормальных и опухолевых клеток..............................................................................................................27

1.6. Обобщенный алгоритм геномного скрининга дифференциального метилирования ДНК...........................................................................................................................................37

1.7. Способы оптимизации методов поиска и идентификации СрО-островков, аномально метилированных в процессе канцерогенеза.........................................................................40

1.8. Программное обеспечение скрининга дифференциального метилирования геномов.

...............................................................................................................;...................................45

РЕЗЮМЕ..................................................................................................................................54

Глава 2. МАТЕРИАЛЫ И МЕТОДЫ........................................................................................56

2.1. Выявление дифференциально метилированных локусов геномов.............................56

2.1.1. Выделение геномной ДНК.......................................................................................56

2.1.2. Ферментативный гидролиз ДНК.............................................................................56

2.1.3. Лигирование с адаптерами.......................................................................................57

2.1.4. Полимеразная цепная реакция для метода АИМС................................................58

2.1.5. Электрофорез ПААГ.................................................................................................59

2.1.6. Фрагментный анализ продуктов АИМС.................................................................59

2.1.7. Рестриктазное картирование....................................................................................59

2.1.8. Обработка ДНК бисульфитом натрия.....................................................................59

2.1.9. Метилспецифическое секвенирование...................................................................60

2.1.10. Электрофорез МБ-ББСА.........................................................................................62

2.2. Разработка алгоритмов и программного обеспечения непредвзятого скрининга дифференциального метилирования геномов......................................................................63

2.2.1. Модель обработки геномной ДНК эндонуклеазой рестрикции...........................63

2.2.2. Калибровка электрофореграмм по маркеру молекулярного веса........................66

Глава 3. РЕЗУЛЬТАТЫ И ИХ ОБСУЖДЕНИЕ.......................................................................69

3.1. Оптимизация алгоритма непредвзятого скрининга дифференциального метилированния геномов........................................................................................................69

3.1.1. Требования к современному методу скрининга дифференциального метилирования геномов......................................................................................................69

3.1.2. Оптимизация метода скрининга на основе анализа обобщенной схемы и алгоритма АИМС................................................................................................................72

3.2. Алгоритм и компьютерная программа моделирования результатов экспериментов АИМС с использованием баз данных нуклеотидных последовательностей....................75

3.2.1. Алгоритм и компьютерная программа AIMS in silico...........................................75

3.3. Характеристика иерархии продуктов АИМС и описание количественных и качественных параметров репрезентаций АИМС...............................................................78

3.3.1. Количественная и качественная характеристика распределения сайтов узнавания эндонуклеазы рестрикции Xmal в геноме человека......................................78

3.3.2. Количественная иерархия продуктов АИМС генома человека............................80

3.3.3. Качественный состав продуктов АИМС генома человека и дизайн экспериментов АИМС при помощи программы AIMS in silico.....................................82

3.3.4. Компьютерная программа визуализации данных экспериментов и дифференциации эпигеномных профилей........................................................................85

3.4. Алгоритм и компьютерная программа геномной идентификации выявляемых дифференциально метилированных участков ДНК............................................................87

3.5. Анализ дифференциального метилирования ДНК клеточных линий рака молочной железы......................................................................................................................................90

3.5.1. Выявление и картирование дифференциально метилированных локусов геномов.................................................................................................................................90

3.5.2. Анализ дифференциально метилированных локусов, выявленных АИМС, методом метилспецифического секвенирования.............................................................94

ЗАКЛЮЧЕНИЕ.........................................................................................................................102

ВЫВОДЫ...................................................................................................................................105

СПИСОК ЛИТЕРАТУРЫ.........................................................................................................106

Приложение А. Описание компьютерной программы AIMS in silico.................................117

А. 1. Описание применения компьютерной программы AIMS in silico...........................118

А.2. Описание установки компьютерной программы AIMS in silico..............................129

А.З. Установка соединения с базой данных.......................................................................130

Приложение Б. Описание компьютерной программы РеакРкЖ:...........................................132

Б.1. Описание применения компьютерной программы РеакРюк.....................................133

СПИСОК ИСПОЛЬЗУЕМЫХ СОКРАЩЕНИЙ

АИМС - амплификация интерметилированных сайтов

ДНК - дезоксирибонуклеиновая кислота

рДНК - ДНК рибосомных генов

РНК - рибнуклеиновая кислота

ПЦР - полимеразная цепная реакция

МЧ-ПЦР - метилчувствительная полимеразная цепная реакция МС-ПЦР - метилспецифическая полимеразная цепная реакция РДА - репрезентативно-дифференциальный анализ

МЧ-РДА - метилчувствительный репрезентативно-дифференциальный анализ МЧФП - метилчувствительный фингерпринтинг ПААГ - полиакриламидный гель

РОГС - рестрикционно-ориентированное геномное сканирование МЧ-РОГС - метилчувствительное рестрикционно-ориентированное геномное сканирование

ВиРОГС - виртуальное изображение рестрикционно-ориентированного геномного

сканирования LTR - long terminal repeat (длинный концевой повтор)

AFLP - amplified fragment length polymorphism (полиморфизм длин

амплифицированных фрагментов) ПДМА - полидиметилакриламид БД - база данных ПК - персональный компьютер

SSCP - single strand conformation polymorphism (полиморфизм конформации

однонитевых фрагментов) КЭФ - капиллярный электрофорез РМЖ - рак молочной железы п.н. - пара нуклеотидов

ВВЕДЕНИЕ

Актуальность проблемы.

Несмотря на очевидную ценность метилирования ДНК как диагностического маркера, накопленных на сегодняшний день данных об особенностях метилирования участков генома человека в норме и при патологии недостаточно для формирования эффективных систем эпигенетических маркеров опухолевого процесса (Shin et al, 2010; Hong et al, 2010; Wang et al, 2010; Suijkerbuijk et al 2011). Предполагается, что прогресс в разработке новых высокотехнологичных методов скрининга дифференциального метилирования ДНК позволит переломить эту ситуацию (Воск С., 2009).

Подходы к скринингу дифференциального метилирования ДНК можно принципиально разделить на две группы. Первая группа подразумевает предварительный отбор локусов для исследования, осуществляемый на основании некоторой гипотезы, предсказывающей наиболее вероятное выявление дифференциального метилирования именно этих локусов. Задача методов, осуществляющих подходы этой группы, - проверка исходной гипотезы о наличии дифференциального метилирования заранее отобранных последовательностей ДНК (Nemtsova M.V. et al., 2005; Wojdacz T., 2009; Ushijima T., 2005). Вторая группа подразумевает непредвзятый скрининг дифференциального метилирования. При помощи соответствующих методов в ходе скрининга сначала определяется дифференциальное метилирование заранее неизвестных локусов генома, а затем проводится идентификация их нуклеотидных последовательностей (Fraga M.F., Esteller M., 2002). Непредвзятый скрининг эффективно выявляет дифференциальное метилирование геномных участков, которые, в силу недостаточной изученности эпигеномов, не подпадают ни под одну из современных гипотез и не включаются в анализ методами первой группы, что не только расширяет фундаментальные представления о роли метилирования ДНК в норме и при патологии, но и способствует диверсификации основ разработки эпигенетических диагностических маркеров (Schumacher A. et al., 2006, Gebhard С. et al., 2006).

До недавнего времени возможности применения методов непредвзятого скрининга были в значительной степени ограничены сложностью геномной идентификации выявляемых дифференциально метилированных участков ДНК. Предложенный Е.Б.Кузнецовой с соавторами в 2007 г. протокол прямого секвенирования

дифференциально метилированных фрагментов ДНК облегчает процесс геномного картирования за счет исключения этапа клонирования фрагментов, однако все еще требует их физического извлечения из полиакриламидных гелей. Секвенирование генома человека в сочетании с математическим моделированием раскрыло ранее недоступный способ картирования дифференциально метилированных локусов, выявляемых методами непредвзятого скрининга. Были предприняты попытки разработки виртуального изображения результатов одного из методов скрининга дифференциального метилирования - рестрикционно-ориентированного геномного сканирования - для идентификации фрагментов ДНК с использованием симулирующего программного обеспечения (Rouillard et al., 2001, Koike et al., 2008). Разработанные системы распространения не получили, вероятно, вследствие сложности самого метода скрининга. Очевидно, разработка подходов к анализу дифференциального метилирования геномов методами непредвзятого скрининга все еще является актуальной задачей, что определило цель настоящей работы.

Целью настоящей работы является разработка подходов к анализу дифференциального метилирования геномов методами непредвзятого скрининга.

Задачи исследования

1. Сформировать современный алгоритм непредвзятого скрининга дифференциального метилирования геномов.

2. Разработать способ определения геномной принадлежности выявляемых дифференциально метилированных фрагментов ДНК, исключающий необходимость их реамплификации, клонирования и секвенирования.

3. Разработать алгоритм и компьютерную программу моделирования результатов экспериментов с использованием баз данных нуклеотидных последовательностей.

4. Охарактеризовать иерархию и описать количественные и качественные параметры продуктов амплификации интерметилированных сайтов, получаемых при различных экпериментальных условиях.

5. Провести сравнительный анализ геномов клеточных линий рака молочной железы на основе разработанного алгоритма скрининга дифференциального метилирования.

Научная новизна.

В результате проделанной работы разработан принципиально новый современный алгоритм скрининга дифференциального метилированния геномов, основанный на сочетании классического генноинженерного подхода - амплификации интерметилированных сайтов (АИМС), высокоразрешающего способа разделения фрагментов нуклеиновых кислот - капиллярном электрофорезе, и оригинального компьютерного обеспечения. Разработанная в рамках исследования программа AIMS in silico является первым компьютерным симулятором адаптор-опосредованной ПЦР, применимым к полному геному человека. Впервые охарактеризованы количественные и качественные параметры продуктов АИМС, получаемых при различных экпериментальных условиях; охарактеризована иерархия продуктов АИМС; критически переоценены закономерности редукции результирующей картины при увеличении длин универсальных праймеров АИМС в зависимости от нуклеотидного состава удлинителей.

Проведенный анализ геномов клеточных линий рака молочной железы ZR-75-1, HBL-100, HS 578 Т, ВТ-474, MCF7 и T-47D выявил 6 дифференциально метилированных геномных локусов, которые ранее не изучались с точки зрения дифференциального метилирования. Среди них - участки CpG-островков, расположенных в первых интронах генов ANK3 и MAFK, в промоторной области гена C2CD2, в межгенных областях на хромосомах 12ql3.13 и 13q32.1, а также участок первого экзона гена PURB, не являющийся CpG-островком. Выявление дифференциального метилирования неканонической локализации подтверждает непредвзятость разработанного алгоритма скрининга.

Практическая значимость.

Программа компьютерной симуляции результатов АИМС - AIMS in silico -позволяет в кратчайшие сроки провести научно обоснованное моделирование эксперимента с заранее заданными параметрами и определить оптимальный дизайн реальных экспериментов, исходя из задач исследования и приборной базы. Модуль программы AIMS in silico, обеспечивающий моделирование рестриктазного геномного картирования продуктов АИМС, позволяет быстро и эффективно проводить дизайн рестриктазного картирования. Разработанный способ определения геномной

принадлежности выявляемых дифференциально метилированных фрагментов ДНК исключает необходимость их реамплификации, клонирования и секвенирования.

Охарактеризованная иерархия продуктов АИМС служит удобным руководством к предварительной оценке степени снижения сложности результирующей картины при увеличении длин универсальных праймеров АИМС в зависимости от нуклеотидного состава удлинителей. Программа просмотра и анализа электрофореграмм РеакРюк обеспечивает удобную среду для осуществления дифференциального анализа репрезентаций эпигеномов и, кроме того, является одной из немногих общедоступных программ анализа результатов капиллярного электрофореза в целом. Разработанные алгоритмы, программы и методы оформлены в виде рекламно-технических описаний и описания новой медицинской ДНК-технологии, прошедших государственную регистрацию.

Выявленные при анализе геномов клеточных линий рака молочной железы 211-751, НВЬ-100, Ш 578 Т, ВТ-474, МСБ7 и Т-47Э дифференциально метилированные геномные локусы могут служить субстратом для разработки молекулярно-генетических маркеров РМЖ.

Апробация работы.

Материалы исследования были доложены на ежегодных конференциях Европейского общества генетики человека в 2008 и 2009 гг., V и VI Международных конференциях «Молекулярная медицина и биобезопасность» (г. Москва) в 2008 и 2009 гг., VI съезде Российского общества медицинских генетиков в 2010 г. (г. Ростов-на-Дону), V конференции молодых ученых России с международным участием «Фундаментальные науки и прогресс клинической медицины» (г. Москва) в 2008 г., V Московском международном конгрессе «Биотехнология: состояние и перспективы развития» в 2009 г., 6-м симпозиуме "Биологические основы терапии онкологических и гематологических заболеваний" (г. Москва) в 2009 г., конференции молодых ученых, посвященной 40-летию МГНЦ РАМН (г. Москва) в 2009 (диплом и премия), Всемирном эпигенетическом конгрессе (г. Берлин) в 2009 г., 11-й и 12-й Европейских конференциях по цитогенетике и молекулярной генетике солидных опухолей (г. Бильбао, 2008 и г. Неймеген, 2010), конкурсе работ молодых ученых МГНЦ РАМН (г. Москва) в 2010 (диплом и премия), VI

Московском международном конгрессе «Биотехнология: состояние и перспективы развития» в 2011 г.

По результатам работы опубликовано 4 статьи, 15 тезисов, 2 главы в учебниках, 1 новая медицинская ДНК-технология, 3 рекламно-технических описания компьютерных программ.

Разработанные в рамках исследования алгоритмы и компьютерные программы были использованы при выполнении НИР по гранту РФФИ № 08-04-01685 «Общие закономерности структурно-функциональной организации эпигеномов клеток рака молочной железы», по государственному контракту № 8/3-655н-08 от 31 декабря 2009 «Поиск и характеристика новых молекулярных маркеров для ранней диагностики, прогноза течения, мониторинга эффективности лечения рака мочевого пузыря», по государственному контракту № 8/3-657н-08 от 31 декабря 2009 «Поиск и характеристика новых молекулярных маркеров для ранней диагностики, прогноза течения, мониторинга эффективности лечения рака почки», по государственному контракт�