Бесплатный автореферат и диссертация по биологии на тему
Гибридизационные подходы в широкомасштабных исследованиях геномов
ВАК РФ 03.00.03, Молекулярная биология

Автореферат диссертации по теме "Гибридизационные подходы в широкомасштабных исследованиях геномов"

РОССИЙСКАЯ АКАДЕМИЯ НАУК

Институт биоорганической химии им. академиков М. М. Шемякина и Ю. А. Овчинникова

На правах рукописи УДК 577.2

□03470053

Ажикина Татьяна Леодоровна

ГИБРИДИЗАЦИОННЫЕ ПОДХОДЫ В ШИРОКОМАСШТАБНЫХ ИССЛЕДОВАНИЯХ ГЕНОМОВ

03.00.03 - Молекулярная биология

АВТОРЕФЕРАТ

диссертации на соискание учёной степени доктора биологических наук

Москва-2009

< 4 1М 2С03

003470053

Работа выполнена в лаборатории структуры и функций генов человека Института биоорганической химии им. академиков М.М. Шемякина и Ю.А. Овчинникова РАН

Научный консультант:

Академик РАН, докт. хим. наук, профессор Евгений Давидович Свердлов Официальные оппоненты:

Чл.-корр. РАН, докт. биол. наук Сергей Анатольевич Лукьянов Чл.-корр. РАН, докт. биол. наук, профессор Борис Федорович Ванюшин Докт. биол. наук Петр Михайлович Рубцов Ведущая организация: Институт Биологии Гена РАН

Специализированного совета Д 002.019.01 при Институте биоорганической химии им. М.М. Шемякина и Ю.А. Овчинникова РАН по адресу: 117997, г. Москва, ул. Миклухо-Маклая, 16/10

С диссертацией можно ознакомиться в библиотеке Института биоорганической химии им. М.М. Шемякина и Ю.А. Овчинникова РАН

часов на заседании

Автореферат разослан

Учёный секретарь Специализированного сове

доктор физ.-мат. наук

ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность проблемы Структурно-функциональные и сравнительные исследования геномов по-прежнему остаются основой молекулярной биологии и генетики. Все методы таких исследований условно подразделяют на две большие группы: методы прямого секвенирования и методы несеквенирующего сравнительного анализа. Современное секвенирование включает серию высокотехнологичных масштабных методов, позволяющих определять в короткие сроки последовательности десятков и сотен миллионов нуклеотидов. Однако полностью решить проблемы полногеномного исследования только прямым секвенированием вряд ли возможно, поскольку в геномах (особенно эукариотических) имеются локусы, недоступные для клонирования, определения первичной структуры ДНК или однозначной реконструкции протяженных фрагментов из-за наличия большого числа гомопоследовательностей, GC-богатых участков и/или повторов. Так, например, в «окончательном» варианте генома человека, опубликованном International Human Genome Sequencing Consortium в 2004г., оставалось более чем 340 участков, для которых не была определена первичная структура. Кроме того, полногеномное секвенирование остается очень дорогим методом, и всестороннее изучение громадной геномной вариабельности посредством секвенирования с точки зрения материальных затрат в настоящее время и в обозримом будущем нереально.

Методы, относящиеся ко второй группе, основанные на использовании свойства ДНК образовывать устойчивые двухцепочечные структуры из комплементарных одноцепочечных молекул, получили название гибридизационных. Среди гибридазационных подходов в частности активно используются различные виды микроэрреев, позволяющие в значительной степени интенсифицировать исследования при снижении временных и стоимостных затрат. Несмотря на широкое распространение в мире и успешное применение для решения самых разнообразных задач геномики, микроэррейные технологии имеют серьезные недостатки: недостаточная специфичность гибридизации на твердой подложке, а также большое количество ложнопозитивных сигналов, возникающих при взаимодействии повторяющихся элементов генома, семейств генов и других неоднозначных участков. Существенным ограничением метода является обязательность знания нуклеотидной последовательности генома-стандарта, без чего невозможно сконструировать микроэррей, а в сравниваемых со стандартом исследуемых геномах невозможно детектировать последовательности, присутствующие в исследуемом геноме, но отсутствующие в стандарте.

Таким образом, по-прежнему актуальными являются разработка и совершенствование гибридизационных методов анализа геномов, которые могли бы

расширить возможности уже существующих методов, в частности, позволили бы непосредственно выделять последовательности, отличающие разные геномы или их транскриптомы.

Нель работы Цслыо данной работы являлось создание и применение для решения разнообразных задач функциональной и эволюционной геномики новых пибридизационных методов выявления и выделения последовательностей, отличающихся или, наоборот, совпадающих в различных геномах и трансхриптомах, в частности, с использованием олигонуклеотидов с повышенным сродством к комплементарной матрице.

Задачи исследования В ходе работы были решены следующие задачи:

1. Предложена оптимизация метода вычитающей гибридизации для сравнения близкородственных геномов. С помощью этого метода проведено широкомасштабное сравнение и построена карта характеристических делеционно-инсерционных различий в геномах российских штаммов Mycobacterium tuberculosis. Проведено сравнение геномов близкородственных сиговых рыб -байкальского омуля и сига.

2. Разработан новый экспериментальный подход для изучения тканеспецифического метилирования протяженных геномных участков (млн. п.о.), основанный на методе клонирования идентичных последовательностей (Coincidence Cloning). С использованием разработанного метода проведен сравнительный анализ метилирования участка ДНК 19-ой хромосомы в нормальных и опухолевых тканях.

3. Разработан новый экспериментальный подход для изучения транскриптома внутриклеточных патогенов в системе in vivo. С применением разработанного метода получен и охарактеризован транскриптом штамма H37Rv М. tuberculosis в инфекционной системе (легкое мыши, инфицированной М. tuberculosis).

4. Исследована возможность использования олигонуклеотидов с повышенным сродством к комплементарной матрице (содержащих 5-метил-цитозин и 2-аминопурин) в качестве зондов в секвенировании и ПЦР.

Научная новизна, теоретическая и практическая значимость работы Разработана методика экспериментального сравнительного апализа геномов - ПДРФ-вычитающая гибридизация, позволяющая сравнивать геномы близкородственных бактериальных штаммов. С ее помощью впервые проведено сравнение геномов различных штаммов М. tuberculosis, циркулирующих на территории РФ и вызывающих различные клинические формы заболевания. На основе полученных нуклеотидных последовательностей и методики геномной ПЦР разработан экспериментальный подход

для изучения инсерционно-делеционного полиморфизма российской популяции Mycobacterium tuberculosis (ID-тгошрование). Впервые данный подход был применён для генотипирования российских клинических штаммов и последующей кластеризации популяции на генетически однородные группы. Также впервые описана делеция, строго характеристичная для высоковирулентного семейства штаммов W/Beijing. Идентифицированные нуклеотидные последовательности могут быть использованы в качестве молекулярно-генетических маркеров для фундаментальных исследований в области микобактериальной популяционной генетики, а также для практического применения в медико-генетических и эпидемиологических целях, в частности для диагностики различных подгрупп М. tuberculosis в клинических условиях.

Методом ПДРФ вычитающей гибридизации впервые исследован геномный полиморфизм представителей байкальских сиговых рыб - озерного сига {Coregonus lavaretus baicalensis Dybovsky) и омуля (Coregonus autumnalis migratorius Georgia дивергировавших от общего предка 10-20 тыс. лет назад. Впервые найденные генетические различия между байкальскими сиговыми чрезвычайно малы и соответствуют полиморфным некодирующим участкам геномов, варьирующим в результате однонуклеотидных замен'и коротких делеций.

Разработан новый метод изучения метшшровакия ДНК на протяженных геномных участках, который дает информацию о статусе метилирования CpG динуклеотидов вне зависимости от их расположения относительно кодирующих и регуляторных областей. Разработан и протестирован новый методический принцип, позволяющий с минимальными затратами времени картировать сайты расщепления генома. Для ускорения обработки получаемых массивов данных создан комплекс программных продуктов, предложены несколько подходов к визуализации данных, а также разработано программное обеспечение, осуществляющее эту визуализацию максимально простым для пользователя способом. Метод был использован для анализа распределения неметилированных CpG сайтов для различных нормальных и опухолевых тканей человека в полигенном локусе 19 хромосомы FXYD5-COX7A1 размером 1,02 млн.п.о. В результате работы впервые получены подробные эпигенетические карты этого локуса. Разработанный метод может быть применен в фундаментальных исследованиях в области молекулярной биологии и медицины для решения широкого круга проблем, связанных с эпигенетической регуляцией генома, а также для практического применения в медико-генетических целях, в частности, для поиска диагностических маркеров различных патологий, а также терапевтических мишеней.

Впервые разработан метод анализа транскриптома внутриклеточных патогенов непосредственно в инфицированных тканях. С его использованием получен и проанализирован набор генов Mycobacterium tuberculosis, транскрибирующихся в легочной ткани мышей, больных туберкулезом. Разработанный метод анализа патогенной бактериальной РНК из пораженных тканей может быть использован для исследований любого бактериального инфекционного возбудителя, в том числе, поиска факторов вирулентности, мишеней лекарственной терапии, разработки стратегии эпидемиологического мониторинга заболевания.

Впервые исследована возможность использования модифицированных олигонуклеотидов с повышенным сродством к комплементарной матрице, содержащих 5-метилцизозин и 2-аминоаденин, в качестве праймеров в секвенировании и ПЦР. Показана их повышенная эффективность праймирования при сохранении специфичности отжига. Разработан вариант молекулярной дактилоскопии, RAPD, с использованием таких олигонуклеотидов. Апробация результатов работы

Основные результаты работы были представлены на научных конференциях и симпозиумах, в том числе: Международных конференциях «Молекулярная медицина и безопасность» (Москва, 2008,), IV съезде Российского общества биохимиков и молекулярных биологов (Новосибирск, 2008), Всероссийской научно-практической конференции с международным участием «Молекулярная диагностика-2007, Москва», 5-ой (1996 г.), 6-ой (1997 г.) и 9-ой (1999 г.) конференциях российской программы «Геном человека», Международных Энгельгардтовских конференциях по молекулярной биологии (1994, 1999,2005); III (1996), IV (1998), VI (2002), VIII (2006) чтениях, посвященных памяти академика Ю.А. Овчинникова, 2-ой Международной научно-практической конференции МЕДБИОТЕК «Перспективы развития биотехнологий в России» (Пущино, 2005), Международных конференциях «Фундаментальные науки - медицине» (Новосибирск, 2006, 2007,2008), конгрессах HUGO Human Genome Meeting (Heidelberg 1996, Brisbane 1999, Vancouver 2000, Helsinki 2006), Cancer Genomics and Emerging Technologies (Boston, 2006), 3rd Congress of the International Union against Tuberculosis and Lung Diseases (Moscow, 2004), Symposium der Deutschen Akademie der Naturforscher Leopoldina «DNA Methylation - An Important Genetic Signal: Its Significance in Biology and Pathogenesis» (Weissenburg, 2004), 26th Annual Congress of the European Society of Microbiology (Istanbul, 2005), 10th International Symposium on the Biology and Management of Coregonid Fishes (Winnipeg 2008), и других Российских и международных симпозиумах.

Структура и объем диссертации

Диссертационная работа состоит из введения, обзора литературы, описания материалов и методов исследования, изложения результатов работы и их обсуждения, выводов и списка литературы. Работа изложена на ^.г^?страницах, содержит ¿?/гГрисунков, ..^"таблиц и ... . .приложений. Список литературы включает «?^источников. Личный вклад автора

Автору принадлежит решающая роль в планировании эксперимента, разработке методик и обобщении полученных результатов. Весь экспериментальный материал получен автором и руководимыми им аспирантами ИБХ РАН. Публикации

Диссертация обобщает данные 22 основных статей.

РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ

I. ВЫЧИТАЮЩАЯ ГИБРИДИЗАЦИЯ БЛИЗКОРОДСТВЕННЫХ ГЕНОМОВ

1.1 МЕТОД ВЫЧИТАЮЩЕЙ ГИБРИДИЗАЦИИ И ОПТИМИЗАЦИЯ ЕГО ВАРИАНТА - ПДРФ-ВЫЧИТАЮЩЕЙ ГИБРИДИЗАЦИИ

Одним из перспективных подходов к решению задачи поиска различий между двумя сравниваемыми геномами является метод вычитающей гибридизация (ВГ). Этот метод даёт возможность находить нуклеотидные последовательности (мишени), отличающие геном одного организма - так называемого трейсера, от генома другого организма - драйвера. При использовании метода вычитающей гибридизации образцы двух геномных ДНК фрагментируют на отрезки небольшой длины (300-2000 п.о.). Один из образцов (трейсер) смешивают с большим избытком другого (драйвер), ДНК сначала денатурируют, а затем ренатурируют. В ходе ренатурации цепи ДНК трейсера, идентичные драйверу, образуют с ним гибриды, в то время как уникальные трейсер-специфические последовательности гибридизуются сами на себя, образуя гомодуплексы трейсера или «мишени». Удаление гибридов и гомодуплексов «драйвер/драйвер» приводит к значительному обогащению «мишенями» в дифференциальном продукте.

Мы оптимизировали версию ПДРФ-вычитающей гибридизации (RFLP subtraction) для сравнения близкородственных геномных последовательностей. Основной принцип метода приведён на рис. 1.

Геном 1

7-ГТ

Т"1 Г

Геном 2

41 42

Геном 1

Геном 2

Зона 1.1

Зона 2.1

—4

3'

Зона 1.2

Вычитание наборов ДНК из разных зон зона 1.1 - зона 1.2 = фрагменты 3,4 зона 1.2 - зона 1.1 = фрагмент 51 зона 2.1 - зона 2.2 = фрагмент 5 зона 2.2 - зона 2.1 = фрагменты З1,41,42

Зона 2.2

Рис. 1. Основной принцип ПДРФ-вычитающей гибридизации. Геномная ДНК обозначена горизонтальными линиями. Черный прямоугольник - инсерция в геномной ДНК, белый прямоугольник - делеция. Стрелками указаны сайты рестрикции; точечная мутация, приводящая к возникновению дополнительного сайта рестрикции, обозначена звёздочкой. Получаемые рестриктные фрагменты пронумерованы. Электрофореграмма рестриктных фрагментов представлена в нижней части схемы.

Фрагменты, полученные в результате расщепления двух сравниваемых геномов, можно разделить на три типа: (¡) фрагменты, имеющие идентичные нуклеотидные последовательности в двух геномах и т.о. имеющие одинаковые длины (фрагменты 1 и 2); (И) фрагменты, произошедшие от одной нуклеотидной последовательности, но претерпевшие изменения в процессе эволюции и имеющие небольшие инсерции или делеции, их длины будут различны (фрагменты 3,5). Такие фрагменты могут быть легко утеряны при проведении стандартной процедуры вычитания, т.к. существует возможность их совместной гибридизации. Вероятность такой гибридизации будет тем выше, чем меньше размер инсерций или делений. Длины фрагментов третьего типа (Ш) различаются из-за наличия точечных мутаций и возникновения дополнительных сайтов узнавания рестрикционными эндонуклеазами (фрагмент 4).

Параллельное электрофоретическое разделение двух наборов рестрикционных фрагментов приводит к тому, что идентичные фрагменты располагаются в идентичных положениях электрофореграммы, в то время как гомологичные фрагменты, несущие инсерции или делеция, находятся в различных положениях электрофореграммы (рис. 1). Оба набора фрагментов делятся на зоны, содержащие фрагменты с различными длинами. При проведении вычитающей гибридизации двух наборов ДНК одинаковой длины гомологичные фрагменты с различными длинами оказываются в разных зонах и не гибридизуются друг с другом.

Таким образом, разработанный нами подход включает предварительный этап подготовки сравниваемых геномных образцов, состоящий из следующих стадий:

исчерпывающий гидролиз двух сравниваемых образцов ДНК частощепящей эндонуклеазой рестрикции (например, Alu I).

датирование к рестриктным фрагментам обеих ДНК адаптера, состоящего из длинного олигонуклеотида (20-25 нуклеотидов) и комплементарной ему короткой «подложки». Адаптер конструируется таким образом, что при лигировании к фрагментам, образующимся в результате гидролиза ДНК, сайт, специфически узнающийся используемой эндонуклеазой рестрикции, восстанавливается.

ПЦР амплификация фрагментов ДНК с лигированными адаптерами и электрофоретическое разделение продуктов ПЦР в агарозном геле. Вырезание зон, содержащих фрагменты ДНК определённой длины, элюция ДНК из геля.

Полученные наборы фрагментов ДНК далее используются для приготовления трейсера и драйвера. Проведение вычитающей гибридизации и дальнейший анализ проводится стандартным способом.

1.2. ПОЛНОГЕНОМНОЕ СРАВНЕНИЕ РАЗЛИЧНЫХ ШТАММОВ М. tuberculosis

1.2.1.Полногеномное сравнение штаммов HN878 и CDC1551, вызывающих различные клинические Формы туберкулёза

Нами было проведено сравнение генома штамма М. tuberculosis HN878, способного вызывать туберкулёз с внелёгочной формой локализации, и штамма CDC1551. Целью сравнения была оценка эффективности оптимизированного метода ПДРФ-вычитающей гибридизации и поиск молекулярно-генетических маркёров, характеризующих ту или иную форму протекания заболевания. Штамм HN878 принадлежит семейству W, которое выделяется на основании одинакового сполиготнпа Beijing, и характеризуется в частности повышенной частотой проявления множественной лекарственной устойчивости. Штамм CDC1551 является высококонтагиозным. Последовательность его

генома была полностью определена и охарактеризована (Fleischmann et al, 2002). В результате проведённого полногеномного сравнения нами были получены дифференциальные последовательности, присутствующие в геноме штамма HN878 и делегированные или изменённые в геноме штамма CDC1551.

Анализ полученных нуклеотидных последовательностей проводился с помощью международных баз данных, содержащих полногеномные последовательности штаммов М. tuberculosis H37Rv и CDC 1551, а также последовательности геномов М. tuberculosis 210, М. bovis AF2122 и М. bovis BCG, определение которых не было завершено на момент проведения работы.

Было охарактеризовано 9 дифференциальных фрагментов, представляющих собой последовательности ДНК, заключённые между двумя сайтами рестрикции, узнаваемыми эндонуклеазой рестрикции Alu I, которая использовалась в работе. Все фрагменты оказались высоко подобными (97-99% идентичности) последовательностям генома штамма М. tuberculosis 210. Меньший уровень идентичности наблюдался с участками генома CDC1551. Найденные в результате сравнения отличия можно разделить на три группы.

Первая группа генетических различий между геномами HN878 и CDC1551 - это новые места интеграции транспозона IS6110. В результате вычитающей гибридизации было найдено три различных фрагмента, 5'-концевая часть которых была идентична концевой части транспозона 1S6110, а З'-концевая часть каждого фрагмента оказалась идентичной определённому гену CDC1551. В геноме CDC1551 в районе данных генов встраивания IS61 JO не происходит. ПЦР ортологичных локусов в геномах HN878 и CDC1551 показала, что во всех трёх случаях в геном HN878 интегрирована полноразмерная копия транспозона. Места интеграции находятся в межгенных участках генома штамма HN878 (гены МТ3269-МТ3270, МГ0001-МТ0002), а также непосредственно в кодирующей последовательности гена МГ1515, кодирущего катион-транспортирующую АТФазу.

Вторая группа дифференциальных фрагментов является результатом внутригеномных перестроек, связанных с различными повторяющимися последовательностями. Два фрагмента представляют собой комбинации участков генов семейства РРЕ, характерных только для микобактерий. Третий фрагмент представляет собой последовательность ДНК, идентичную участкам в составе повторов в геноме CDC1551 (clustered regularly interspaced short palindromic repeat), но содержащую небольшие мутации инсерционно-делеционной природы. Подобные различия в структуре,

связанные с повторяющимися последовательностями, могли появиться в результате внутригенных рекомбинационных событий или в процессе репликации.

Характерной особенностью третьей группы генетических различий между штаммами HN878 и CDC1551 является наличие протяженных нуклеотидных последовательностей, отсутствующих в геноме CDC1551.

Все обнаруженные нами дифференциальные фрагменты, характерные для генома «внелёгочного» штамма М. tuberculosis HN878, оказались полностью гомологичными соответствующим локусам генома М. tuberculosis 210, вызывающего туберкулёз с классическими лёгочными симптомами течения заболевания. Это означает, что обнаруженные нами различия не связаны с внелегочной локализацией заболевания. Возможно, выбор пригодной для штамма среды обитания обуславливается не столько его генотипическими особенностями, сколько особенностями организма хозяина и конкретными внутренними условиями во время размножения патогена. Этот вопрос требует дальнейшего изучения.

В результате проведённого геномного сравнения нами было показано, что метод вычитающей гибридизации с использованием разделения полного набора рестрикционных фрагментов по длине и последующим вычитанием полученных «зон» даёт возможность обнаружения небольших мутаций инсерционно-делеционной природы и геномных перестроек. Такие незначительные изменения геномной структуры невозможно детектировать при помощи обычного варианта вычитающей гибридизации. Тем не менее, они могут оказывать существенное влияние на формирование фенотипических свойств патогена, приводя к возникновению генетически близких, но фенотипически различных штаммов.

1.2.2. Полногеномное сравнение геномов российских клинических штаммов М. tuberculosis с геномом штамма H37Rv

Для исследования вариабельности геномов российских штаммов М. tuberculosis было выбрано три штамма, принадлежащих семейству W/Beijing (155/6, 1643, 1462), и один штамм семейства Haarlem (1540), для которого была показана повышенная степень вирулентности по сравнению с представителями семейства W/Beijing. Отбор и культивирование штаммов М. tuberculosis, их микробиологическая характеристика и получение образцов геномной ДНК проводились в лаборатории И.Г. Шемякина (ГНЦ Прикладной Микробиологии, г. Оболенск). В нашей работе геномы штаммов М. tuberculosis 1540, 155/6,1643 и 1462 сравнивались с геномом штамма H37Rv, последовательность которого определена и охарактеризована (Cole et al, 1998).

В результате сравнения было получено 12 фрагментов, присутствующих в геномах российских штаммов М. tuberculosis и делегированных в геноме H37Rv, из которых 10 фрагментов идентичны различным участкам генома штамма CDC1551, а два - участкам генома М. tuberculosis 210. Фрагменты, найденные нами при вычитании, представляют собой геномные последовательности, заключённые между двумя сайтами рестрикции, узнаваемыми эндонуклеазой рестрикции AluI, и являются частью более протяжённых делеций. Большинство фрагментов присутствует в геномах всех сравниваемых штаммов, что может свидетельствовать об определённой степени родства между этими штаммами. Все обнаруженные последовательности располагаются в кодирующих областях генома, это согласуется с данными о пониженной частоте возникновения мутаций в межгенных участках микобактериальных геномов. Кроме того, они не распределяются по геному случайно, а концентрируются в определённых его областях, характеризующихся повышенной степенью вариабельности среди различных штаммов М. tuberculosis.. Некоторые из генов, в состав которых входят найденные дифференциальные фрагменты, кодируют белки с известными функциями, для белковых продуктов других генов функция является лишь предполагаемой (табл. 1).

Табл. 1. Дифференциальные локусы, найденные при сравнении геномов четырёх российских клинических штаммов М. tuberculosis с геномом штамма H37Rv. Серый прямоугольник - наличие локуса в геноме соответствующего штамма, белый прямоугольник - данный фрагмент делегирован в геноме штамма. Буквами МТ обозначены гены CDC1551, в состав которых входят найденные дифференциальные фрагменты, фрагменты А4 и G2 идентичны участкам геномаМ tuberculosis 210.

локус 155/6 ГЛ 3 1462 1540 Функция

MTJ360 i ! ' ! ' ,í >. i. ¡' ® предполагаемая аденилатциклаза

МТ1799 11>> ».**. предполагаемая фосфолипаза С

МТ1802 .»i. мембранный белок, семейство МтрЬ

МТ2081 , 1. »' 1 ь ¥ j í консервативный гипотетический белок

МТ2082 ь* * * i 4 предполагаемая хеликаза

МТ2508 hjí. г 4 трансмембранный нуклеотидсвязывающий белок

МТ3426 ь 1. ' »^VV' -t-1 г* птерин-4-а-карбиноламин дегидратаза

МТ3427 ! ; К?'1; ','t, ' É белок А, участвующий в биосинтезе кофактора молибдогггерина

МТ3428 i »'^i5 регулятор транскрипции, семейство АГзКЛЭпгГ/КесШ

МТ3489 ' • > i • м Is V, г»** ; í,*-* * ^•tn* белок, родственный 1-дезоксиксилулозо-5-фосфат-синтазе

А4 Л ** 1 г , * Г** 4 4 белок - гомолог белков РРЕ семейства (идентичность аминокислотного состава ~ 55%)

G2 i 4.. t . * » 1 .i ■ / i * JL fS .„.». J ít ' белок - гомолог белков РРЕ семейства (идентичность аминокислотного состава ~ 60%)

Большинство найденных нуклеотидных последовательностей присутствует в геномах всех исследуемых российских штаммов М. tuberculosis, однако геном наиболее вирулентного из исследуемых штаммов М. tuberculosis 1540 имеет как минимум три отличия от менее вирулентных штаммов 155/6, 1643 и 1462. Найденные нами дифференциальные фрагменты являются частью генов МТ1799, МТ1802 и МТ2508. Ген МГ1799 (plcD) кодирует известный фактор бактериальной вирулентности - фосфолипазу С. Ген МТ1802 (mmpL8) кодирует один из мембранных белков, предположительно определяющих характер взаимодействия М. tuberculosis с клеткой хозяина. Третьим отличием генома штамма 1540 от штаммов 155/6, 1643 и 1462 является деления размером 212 п.о. в гене MT2S08. Таким образом, наличие в геноме этих трёх инсерций может обуславливать проявление штаммом 1540 более вирулентных свойств.

1.2.3. Исследование полиморфизма найденных дифференциальных локусов в российской популяции клинических штаммов М. tuberculosis

Нами предложен способ генотипирования штаммов М. tuberculosis методом геномной ПЦР следующих локусов: G2, МТ1360, МТ1799, МГ1802, МТ2081, МТ2082, МТ2508, МТ3426, МТ3427, №3428, Rv0073, RvI762c. Локусы Л4 и МТ3489 оказались неполиморфными в изученной популяции, поэтому были исключены. Локусы Rv0073 и Rvl762c получены как дифференциальные в серии не описанных в диссертации экспериментов. Эффективность и достоверность предложенного нами метода, названного ID-типированием, была показана на коллекции 172 штаммов М. tuberculosis, циркулирующих в центральных регионах Российской Федерации. Данная коллекция создана в лаборатории И.Г. Шемякина (ГНЦ Прикладной Микробиологии, г. Оболенск), там же проводилось lS6/70-RFLP-TiinnpoBaHiie, сполиготипирование и кластеризация штаммов. Согласно результатам, полученным И.Г. Шемякиным с сотр., 51 штамм из коллекции принадлежал семейству AI (сполиготип LAM), циркулирующему на территории Российской Федерации и выделенному недавно; 46 штаммов входило в состав семейства W/Beijing, 49 штаммов представляло семейство Haarlem. Остальные представители коллекции либо принадлежали редко представленному сполиготипу Т, либо для них сполиготип не был идентифицирован.

Гены, которые были использованы для ID-типирования, имеют различную степень полиморфизма (табл. 2).

Табл. 2 Инсерционно-делеционный полиморфизм в основных сполигосемействах.

Наличие исследуемого локуса в данном типе сполигосемейства обозначено цифрами (%) UEP - unique event polymorphism

Делегированный Гены в Beijing Haarlem LAM/A1 Характеристика

район составе (46 (49 (51 штамм) делении

делеции штаммов) штаммов)

МТ2508 0 100 100 UEP

RvD2 Ml'1799 0 100 16 IS-dependent

МТ1802 0 100 16

RvDl МТ2081 100 100 94 UEP

МТ2082 100 88 92

RvD5 МТ3426 100 86 98 IS-dependent

МТ3427 100 88 80

МТ3428 100 88 82

МГ1360 98 21

RD105 Rv0073 0 100 100 UEP

RDI 52 Rvl 762 0 100 12 IS-dependent

G2 фрагмент 100 96 10

Делеция гена Rv0073, входящего в состав делегированной последовательности RDI 05 (Region of Difference, протяженная нуклеотидиая последовательность, отсутствующая в геноме штамма М. tuberculosis H37Rv), характерна только для представителей семейства W/Beijing, что уже было описано в литературе. Мы подтвердили на другой географически обособленной группе штаммов, что делеция RDI05 является UEP (unique event polymorphism), строго характеризующей это семейство. Также мы установили, что ранее нигде не упоминаемая делеция в гене МТ2508 размером 212 п.о. также характерна только для представителей семейства W/Beijing и представляет собой ещё один, до настоящего времени не описанный UEP.

Как правило, геномные локусы, связанные с интеграцией транспозона IS6110, обладают повышенной вариабельностью. Таковы гены МТ1799 и МТ1802, входящие в состав ранее описанной делеции RvD2, и МТ3426, МТ2327, МТ3428, входящие в состав делегированного участка генома RvD5. Делеции этих локусов являются результатом гомологичпой рекомбинации между последовательностями IS6110 и могут возникать независимо в геномах неродственных штаммов, поэтому их нельзя назвать отдельными характеристическими признаками. Однако изучение полиморфизма данных участков генома остаётся важной задачей, так как гены, входящие в состав RvD2 и RvD5, являются либо уже доказанными, либо кандидатными факторами вирулентности, следовательно, изменчивость этих районов генома может оказывать влияние на формирование и модуляцию вирулентных свойств патогена.

Штаммы семейства W/Beijing являются генетически однородными по проанализированным 11 последовательностям, промежуточными являются штаммы семейства Haarlem и наиболее генетически гетерогенными оказались штаммы группы AI/LAM. Это соответствует картине сполиготипирования представителей данного семейства. Несмотря на то, что семейства AI/LAM и Haarlem оказались генетически гетерогенными, каждое из них характеризуется определённым набором ID-профилей, с явным доминированием одного варианта. Кроме того, следует отметить отсутствие совпадений среди ID-профилей, характерных для разных семейств М. tuberculosis.

В нашей работе был продемонстрирован высокий уровень инсерционно-делеционного полиморфизма некоторых областей генома, связанный с транспозициями IS6J10 элемента. Чем чаще происходит последовательная передача штамма от человека к человеку и длиннее история циркуляции, тем больше наблюдается транспозиций IS6110 и тем выше степень разнообразия геномов. Исходя из того, что в штаммах семейства AI/LAM выявлено наибольшее разнообразие кодирующих областей генома, связанных с интеграциями транспозона, можно предположить, что представители этого семейства являются эволюционно наиболее древними из трёх проанализированных семейств.

Важное преимущество используемого нами экспериментального подхода в отличие от других методов генотипирования состоит в том, что все используемые нами маркёры являются генами, то есть кодируют белковые продукты, которые в конечном итоге формируют фенотип патогена. Получаемые в ходе ID-типирования профили амплификации, отражающие геномную структуру того или иного микроорганизма, связаны с его фенотипическими чертами, включающими такое важное свойство, как вирулентность. Это открывает широкие возможности для функциональной диагностики М. tuberculosis и позволяет изучать эволюционные отношения между штаммами, базируясь не на чисто генетических, но и на функциональных различиях между ними.

Таким образом, найденные нами дифференциальные нуклеотидные последовательности могут быть использованы для выделения отдельных ветвей внутри уже известных семейств штаммов, то есть для более детальной диагностики, и изучения эволюционных отношений между ними. Профили амплификации, полученные в результате ID-типирования популяции, позволяют проследить за полиморфизмом отдельно взятых генов, потенциальных факторов вирулентности, а также проводить функциональную кластеризацию популяции, опирающуюся на значимые различия между исследуемыми геномами.

1.3. ГЕНОМНОЕ СРАВНЕНИЕ БЛИЗКОРОДСТВЕННЫХ ВИДОВ БАЙКАЛЬСКИХ СИГОВЫХ

Байкальский озерный сиг (Соге^опт 1тагеШ Ьтсактгя БуЬоузку) -глубоководный бснтофаг, обитающий в основном на глубинах 30-100 м и нерестящийся в самом озере. Байкальский омуль (С. аиШтпаИя т1£гШогт Гтеог^) - пелагический планктофаг, обитающий на глубинах до 350-400 м. Долгое время по морфологическим признакам этих рыб относили к разным видам. Проведенные недавно анализ вариабельности мтДНК и изоферментный анализ показали близость байкальского омуля к истинным сигам и, прежде всего, к виду С. \avaretus Ь. Последующий детальный филогеографический анализ структуры мтДНК палеоармических и неоарктических сиговых, а также генеалогические реконструкции байкальских сиговых позволили сделать окончательный вывод о принадлежности байкальского омуля к виду С. 1тагеШз (ЗиЫшюуа й а1,2004). Таким образом, байкальский омуль и озерный сиг являются ближайшими родственниками, их дивергенция от общего предка произошла всего 10-20 тыс. лет назад, по-видимому, в связи с освоением разных трофических ниш. Довольно короткий срок дивергенции байкальского омуля и сига в масштабе эволюционного времени позволяет рассчитывать, что сравнение их геномов может выявить генетические факторы, которые в данном случае играют определяющую роль при дивергенции популяций. Целью нашей работы являлось проведение поиска элементов генома (как кодирующих, так и некодирующих), различных по структуре в геномах омуля и сига.

Для проведения геномного сравнения сига и омуля был выбран метод ПДРФ-вычитающей гибридизации. Структура геномов сиговых неизвестна, однако, по аналогии с Оапю гегго и Те1гао(1оп, полногеномные последовательности которых определены Шйр://гГш.ог^сй1-ЫпАуеЬ(1пуег?М1уа1=аа^РВ Ьоте.арр.

www.genoscope.cns.fr/externe/tetranew'). можно ожидать, что в них присутствует большое количество повторяющихся элементов, которые затрудняют как саму вычитающую гибридизацию, так и последующий анализ полученных клонов. Эту проблему можно преодолеть введением предварительной стадии «нормализации» сравниваемых фрагментированных геномов, широко используемой в схемах ВГ кДНК. На этой стадии происходит образование быстро ренатурирующей фракции, обогащенной высокопредставленными последовательностями, в случае геномного сравнения -повторяющимися элементами генома. Далее эта фракция удаляется из последующего сравнения. Тем самым, происходит обогащение трейсера низкопредставленными, в том числе кодирующими последовательностями генома.

Помимо стадии нормализации мы также применили методическую идею, используемую в анализе полиморфизма длин рестрикционных фрагментов, полученных с

помощью ВГ. Кроме того, чтобы исключить из рассмотрения гетеродуплексы, образованные гомологичными фрагментами близкой длины (и находящимися после электрофоретического разделения в одном пуле), нами введена модификация, заключающаяся в обработке смеси после вычитающей гибридизации нуклеазой золотистой фасоли.

С учетом вышеописанных модификаций нами проведено вычитание пулов геномных фрагментов длиной до 800 п.о. и получена ранжированная библиотека, обогащенная специфическими для сига геномными последовательностями. Клоны библиотеки анализировали методом дифференциальной гибридизации с радиоактивно меченными зондами, приготовленными из продуктов вычитания «сиг-омуль» и «омуль-сиг». Количество дифференциально гибридизующихся клонов составило 85. Для каждого клона была определена нуклеотидная последовательность и проанализирована с использованием доступных баз данных по программе BLASTn (табл. 3). Ни для одного из проанализированных фрагментов не было найдено существенного сходства с известными кодирующими последовательностями. Большинство дифференциально гибридизующихся клонов содержат фрагмент, идентичный на 84-88% внутреннему спейсеру гена 28S рРНК Salvelinus namaycush (клон 26А2, U17965.1).

Среда остальных проанализированных клонов библиотеки два содержат вставку мтДНК, для 11 вставок нет существенной гомологии в банке данных, 14 гомологичны различным некодирующим участкам генов иммунной системы: клеточного рецептора (TCR), IgA, МНС, а также зонадгезинподобного гена (zig), при этом пять различных фрагментов картируются в интронах гена zig, а семь - перед первым экзоном в 5'-области.

Геномные ПЦР с олигонуклеотидными праймерами, сконструированными на основе найденных нуклеотидных последовательностей, показали, что ни одна из проанализированных последовательностей не является сигспецифической. По-видимому, они представляют собой следствие мононуклеотидного полиморфизма в сайте узнавания рестрикционной эндонуклеазой, которая использовалась для фрагментирования сравниваемых геномов, что было подтверждено для некоторых найденных при вычитании фрагментов.

Табл. 3. Результаты сравнения геномных фрагментов сига, полученных в результате вычитания, с геномными последовательностями различных организмов.

Номер клона Сходство с аннотированными геномными последовательностями Длина участка клонированного фрагмента, идентичная геномной последовательности (в скобках приведен процент гомологии) Полол (локал

31,20 О. mykiss, локус IgH.A (AY872257.1) О. mykiss, район гена МНС класса la (АВ162342.1) 100 (88) 99(87) интро ~8 т.п

100,21 S. salar, ген зонадгезинподобного белка (AY785950.1) S. salar, ген CD3 гаммадельта-А (EF421418.1) 99 (90) 98 (86) ~100 т интро

75, 82, 86, 84,08 S. salar, ген зонадгезинподобного белка, (AY785950.1) S. salar, клон 249L01, TCR-альфа/дельта локус (EF467299.1) 28-97 (76-94) 94-99 (76-86) интро интро

30,26,29, 32,27 S. salar, клон 15J19 TCR-альфа/дельта локус (EF467295.1) S. salar, ген зонадгезинподобного белка, (AY785950.1) 62 (88) 63 (86) интро интро

25 О. tshawytscha, ген инсулин-подобного фактора роста I (IGF-I.l), (AY100012.1) S. salar, ген интерферона альфа 1 (IFNA1), (DQ354152.1) 90 (90) 90 (88) интро интро

51 клон Salvelinus namaycush, клон 26А2, ген 28S рРНК (U 17965.1) 23-25 (84-88) внутр спейс ITS

76, 14 С. lavaretus, митохондриальная ДНК (АВ034824.1) 48 (97) митох

11 клонов Danio rerio, различные геномные последовательности 13-24 (91-98) некод

В полученной библиотеке более половины отобранных дифференциальных фрагментов имеют участки, гомологичные внутренним транскрибируемым спейсерам (ITS) генов 28S рРНК. Действительно, ITS-участки отличаются своей полиморфностъю, а межвидовые различия по размеру транскрипционной единицы рРНК обуславливаются различиями в длине спейсерных участков.

15% найденных дифференциальных фрагментов обладают высокой степенью сходства с некодирующими участками генов иммунной системы (TCR, МНС, IgA) и зонадгезинподобного гена (zig). Функция последнего неизвестна, однако на основании того, что он экспрессируется преимущественно в кишечнике рыб и обладает значительной гомологией с генами иммунной системы слизистой кишечника (например, с FCGBP и с геном муцина), можно предполагать его участие в формировании иммунитета рыб. Известно, что генам иммунной системы свойственны частые перестройки и большая вариабельность. В нашем случае все найденные ПДРФ располагаются в некодирующих областях гена. В 5'- и 3'-UTR-областях zig, занимающих до 90% длины локуса, возможно, расположено множество регуляторных элементов, мутации в которых способны изменять уровень транскрипции гена.

Следует отметить одну отличительную особенность найденных нами геномных фрагментов сига, картированных вблизи генов иммунной системы. Почти все они имеют участки (9-37% длины фрагмента), которые на 65-85% сходны с широко распространенными среди рыб Tcl-подобными транспозонами (у лососевых - это 5% генома). С одной стороны, известно, что у рыб эти мобильные элементы нередко экспрессируются, а после встраивания их в геном происходит быстрое накопление мутаций (Krasnov et al, 2005). С другой стороны, существует немало доказательств участия некодирующих РНК-мобильных элементов в регуляции экспрессии генов на разных уровнях. Известно, что экспрессия Tel-подобных мобильных элементов особенно активируется при внешних стрессовых стимулах. Возможно, что и в случае байкальских сига и омуля транспозонные последовательности играют определенную роль в активности найденных генов иммунной системы. Не исключено, что высокая фенотапическая пластичность сиговых (и вообще рыб) отчасти обеспечивается активностью многочисленных транспозоншдх копий в их геноме, особенно при активации их в стрессовых условиях окружающей среды, например, при резком похолодании.

В целом, полученные нами данные свидетельствуют о малых различиях в геномах сига и омуля. Это может свидетельствовать о том, что, как предполагается в настоящее время, омуль и сиг образуют две субпопуляции одного вида. Дивергенция этих популяций, по-видимому, может идти по пути регуляторной эволюции, то есть сравнительно малых изменений в регуляторных системах организма, которые, тем не менее, обуславливают

значительные различия в уровнях и тканеспецифичности экспрессии генов. Вероятно в рассматриваемом нами случае пары близкородственных сиговых транскрипционная дивергенция, обусловленная однонуклеотидными заменами и короткими делециями/инсерциями в геномной ДИК, между изолированными популяциями возникает быстрее, чем масштабная дивергенция на геномном уровне.

2. МЕТОД КЛОНИРОВАНИЯ ИДЕНТИЧНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ ■ ОТБОР ИЗ СЛОЖНЫХ СМЕСЕЙ ПОСЛЕДОВАТЕЛЬНОСТЕЙ С ЗАДАННЫМИ СВОЙСТВАМИ

В основе разработанного нами метода лежит принцип клонирования идентичных последовательностей (Coincidence Cloning, СС), заключающийся в отборе фрагментов с одинаковыми нуклеотидными последовательностями, принадлежащими двум разным образцам. Применявшиеся ранее методы, основанные на использовании этого принципа, оказались низкоэффективны и не получили широкого распространения (Devon and Brookes, 1996). Их главным недостатком была низкая селективность, то есть результирующие библиотеки Coincidence cloning содержали большие количества последовательностей, принадлежащих либо одному, либо другому из двух образцов ДНК. Для снижения неспецифического фона Лукьянов с соавт. использовали эффект селективной супрессии ПЦР (SSP) (Лукьянов и др, 1996).

На рис. 2 представлена общая схема метода.

На первом этапе к двум наборам фрагментов ДНК лигируют разные по структуре супрессионные одноцепочечные адаптеры. После денатурации образцов и в процессе их последующей совместной ренатурации совпадающие последовательности способны к образованию гибридных дуплексов, содержащих на 5'-концах два разных адаптера и поэтому экспоненциально амплифицирующихся в ходе дальнейшей ПЦР. Молекулы ДНК, уникальные для одного из исходных наборов, образуют только гомодуплексы, которые имеют на концах одинаковые адаптеры и поэтому в силу эффекта SSP не способны к экспоненциальной амплификации.

фрагментированная ДНК 1

фрагментированная ДНК 2

лигирование супрессионных адаптеров

совместная денатурация ренатурация достройка концов _

I

ПЦР с праймерами

I

jjj экспоненциальная амплификация ^ * *

/ \ < I V /

Рис. 2. Схема процедуры клонирования идентичных последовательностей (Coincidence Cloning, С С), основанной на эффекте селективной супрессии полимеразной цепной реакции. Фрагменты, уникальные для каждого из исходных наборов, изображены пунктирными или штрих-пунктирными линиями, общие фрагменты - сплошными линиями. Два типа супрессионных адаптеров показаны в виде черных или белых прямоугольников; последовательности, комплементарные им, обозначены как заштрихованные прямоугольники соответствующего цвета.

2.1 МЕТОД COINCIDENCE CLONING (КЛОНИРОВАНИЕ ИДЕНТИЧНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ) ДЛЯ АНАЛИЗА ТКАНЕСПЕЦИФИЧЕСКОГО МЕТИЛИРОВАНИЯ ПРОТЯЖЕННЫХ ГЕНОМНЫХ ЛОКУСОВ

В качестве образцов для совместной гибридизации используются геномная ДНК из определенной ткани, фрагментированная с учетом тканеспецифического метилирования, и геномный локус, представленный набором клонированных последовательностей.

2.1.1. Картирование неметилпрованных Срв-сайтов

Для картирования неметилированных СрО-сайтов на стадии подготовки образцов к СС проводится рестрикция геномной ДНК метилчувствительной эндонуклеазой (НраП, сайты

Геномная ДНК Метилирована

-fed

.................1

Клонированная ДНК, гомологичная изучаемому локусу Неметилирована

■>т

Рестрикция метилчувствительной рестриктазой

Получение фрагментов, несущих на концах неметилированный сайт

Совместная денатурация и ренагурация

1 Амплификация фрагментов, принадлежащих изучаемому

| локусу и содержащих на одном го концов Срй-сайт,

' неметилированный в геноме. Клонирование, создание

: ^ ^ библиотеки. ^

Рис. 3. Схема модификации метода Coincidence Cloning для анализа распределения неметилированных CpG сайтоп. Пунктирными линиями обозначены последовательности ДНК, специфичные дм каждого из образцов. Сплошными линиями обозначены последовательности, общие для обоих образцов. Знаком обозначены неметилированные сайты.

узнавания ССОв). Также использовался «частощепящий» фермент АШ, рестрикция которым позволяет получить набор фрагментов длиной не более 1,5 тыс. п.о. (подобный диапазон длин является оптимальным для проведения последующих процедур ПЦР-амплификации). На рис. 3 представлена общая схема этой модификации метода.

Для контроля эффективности разработанного метода было оценено обогащение некоторых геномных фрагментов, расположенных в неметилированных областях До СС После СС

115 18 21 24 27 30

A.COX7AI

C.CKAPI

Рис. 4. Электрофоретическое разделение продуктов ПЦР, полученных с использованием праймеров, специфичных к Нра11-А1и1 фрагментам, расположенным в конститутивно неметилированных локусах.

Матрицы: «до СС» - смесь А1и1 -Нра11 фрагментов, «после СС» -продукты амплификации после СС. Праймеры специфичные к Срй-островкам в промоторных областях генов СОХ7А1 (А и В) и С КАР! (С).

исследуемого локуса (CpG-островки в промоторных областях генов «домашнего хозяйства») СОХ7А1 (регуляторная субъединица цитохромоксидазы митохондрий) и СКАР1 (цитоскелет ассоциированный белок). Для оценки обогащения выбранных участков, достигаемого в СС, были проведены ПЦР со специфичными праймерами, в качестве матриц использовали набор Hpall-Alul геномных фрагментов и амплификат после СС. Три примера амплификации представлены на рис. 4. Число циклов ПЦР, необходимых для детекции продукта в смеси после СС, на 15 меньше, чем в случае образца до СС. Таким образом, достигнуто обогащение в не менее чем 104 раз, т. е. близкое к максимально возможному.

Для картирования найденных неметилированных CpG-сайтов и определения их положения относительно охарактеризованных генов, EST, повторяющихся элементов и CpG-островков использовалась база данных сервера UCSC Human Genome Browser (http://genome.ucsc.edu/cgi-bin/hgGatewav). Для статистической обработки информации, полученной после скрининга библиотеки, и для графического изображения паттерна метилирования был применен специальный пакет программ, разработанный Гайнетдиновым И.В.

2.1.2. Картирование гиперметилнрованных последовательностей

В другой модификации метода для отбора геномных последовательностей, обогащенных СрО-метилированными сайтами, используется аффинная хроматография на колонке с иммобилизованным метилсвязывающим белком. На рис. 5 представлена схема этой модификации метода.

Геномная ДНК Метилирована

>25

г<2)

Клонированная ДНК, гомологичная изучаемому локусу Иеметилирована.

I

_J

Рестрикция Msel

..¡А-.

Использование MBD-колонки для получения фракции гиперметилированных геномных фрагмеетов.

—У " ^AJtim ш

■V-------------------¿f.

Совместная денатурация и ренатурация

t__±— .

"Sis -

I

Амплификация фрагментов, принадлежащих изучаемому локусу ДНК и гиперметилированных в геноме. Клонирование, создание библиотеки.

Чу' -Ч*-^-_'г^г-г

Рис. 5. Схема модификации метода Coincidence Cloning для анализа распределения метилированных последовательностей. Пунктирными линиями обозначены последовательности ДНК, специфичные для каждого из образцов. Сплошными линиями обозначены последовательности, общие для обоих образцов. Знаком "ЙГ обозначены метилированные сайты.

Локализация гиперметилированных последовательностей | - для ДНК нормальной ткани, | - для ДНК опухолевой ткани.

Рис. 6, Сравнение распределения неметилированных сайтов СССв и гиперметилированных последовательностей в локусе 19 хромосомы РХ¥04-С0Х7Л1 для нормальной и опухолевой тканей янчка. Графики плотности распределения неметилированных сайтов (ось У) для ДНК нормальной (серого цвета) и опухолевой (черного цвета) тканей относительно координат локуса РХУВ4-СОХ7А1 (ось X). Под графиками дано схематическое изображение распределения генов (горизонтальные стрелки) локуса; вертикальными стрелками отмечены координаты картированных гиперметилированных последовательностей, серыми стрелками для нормальной ткани и черными стрелками для опухолевой ткани.

Геномную ДНК гидролизовали эндонуклеазой рестрикции Мее I. Сайт узнавания этого фермента ТТАА встречается в геномной ДНК человека со средней частотой 1 на 100-200 п.о., однако в случае врО-островков эта частота уменьшается до 1 на 1000 п.о.

Полученный набор Мэе 1-фрагментов геномной ДНК фракционировали на аффинной колонке для получения фракции, максимально обогащенной метил-СрО-содержащими фрагментами. Для этого в качестве аффинного агента в колонке был использован белок, содержащей метил-Срв-связывающий домен белка МеСР2 крысы (МВБ-домен). Работа по созданию «МВБ колонки» и фракционированию геномной ДНК была проведена в группе мембранных биоэнергетических систем Р. Дмитриевым под руководством д.х.н. М.И. Шахпаронова.

Обе разработанные модификации были применены для исследования метилирования локуса 19-ой хромосомы человека ЕХ¥05 -СОХ7А1 длиной 1,02 млн п.о. для образцов семиномы и нормальной паренхимы яичка, полученных от одного пациента.

На рис. 6 представлено графическое распределение плотности неметилированных сайтов ССвй и картирование гиперметилированных последовательностей в локусе ШВ5 -СОХ7А1 19-ой хромосомы для образцов ДНК нормальной и опухолевой тканей яичка, полученные описанными выше двумя модификациями метода. Как видно, в ДНК обеих

тканей неметилиропанные сайты неравномерно распределены по всему локусу и группируются в определенных местах, т.е. наблюдается их кластеризация. Найденные гиперметилированные последовательности находятся в областях с низкой плотностью неметилированных сайтов.

2.2. RAPID IDENTIFICATION OF GENOMIC SPLITS (RIDGES) - МЕТОД БЫСТРОГО КАРТИРОВАНИЯ САЙТОВ РАСЩЕПЛЕНИЯ ГЕНОМА

Для получения подробных тканеспецифических карт распределения неметилированных сайтов для протяженных локусов необходим значительный объем секвенирования. Нами разработан метод, позволяющий минимизировать затраты на секвенирование и картирование большого количества сайтов расщепления генома (в нашем случае - неметилированных CG в составе рестриктных сайтов). Для этого используются эндонуклеазы рестрикции IIS-типа, вносящие разрыв в ДНК на некотором отдалении от сайта узнавания. Искусственное введение последовательности узнавания такой эндонуклеазы около картируемого сайта геномного расщепления осуществляется посредством лигирования нуклеотидного адаптера (рис. 7).

Последующая обработка полноразмерных фрагментов этой эндонуклеазой приводит к образованию тагов. Эти короткие участки являются репрезентативными, поскольку получены однотипно, а их нуклеотидная последовательность является достаточной для однозначного картирования. Длина их определяется выбором используемого фермента IIS типа, и в нашем случае была использована эндонуклеаза Mmel, вносящая разрыв через 21 п.о. от своего сайта узнавания.

Конкатамеризация тагов и последующее секвенирование полученных конкатамерных молекул позволяет получить информацию о сайтах расщепления генома при существенно меньших материальных и временных затратах на секвенирование

Полученная в результате проведения СС смесь представляла из себя набор Alul-Hpall рестриктных фрагментов, фланкированных с двух сторон адаптерами А (фланкирующий сайт Alul) и Б (фланкирующий сайт Hpall) (рис. 8, структура I). Для введения последовательности узнавания эндонуклеазы IIS-типа в непосредственной близи от исследуемого сайта Hpall полученные фрагменты гидролизовали эндонуклеазой Hpall (рис. 8,1), затем смесь делили на две части и к образованному «липкому» концу литеровали адаптеры ВД и ГД (рис. 8,2; адаптеры содержат общую (Д) 5'-последовательность, а также сайт Mmel на 3-конце). Для удобства дальнейшей работы проводили амплификацию продукта лигирования (рис. 8, структура II) с праймерами, идентичными последовательностям лигированных адаптеров (рис. 8, 3). После обработки амплификата эндонуклеазой Mmel (рис. 8,4) образовавшиеся 60-ти звенные нуклеотидные фрагменты

(рис. 8, структура III) изолировали с помощью ПААГ-электрофореза (рис. 8, 5), а затем смешивали друг с другом и проводили лигирование (рис. 8, б). При этом образовывались

Сайт расщепления ДНК ген?ма

tS? Расщепление генома

Сайт рестрикции Лигирование адаптера

эндонуклеазы IIS типа

Ж&

ш „

Образование тагов

4V

_ ff .

i-ЫИ

Li '3

Л Образование димеров тагов

«у

5 Щ

И Образование конкатемеров тагов

Рис. 7. Схематическое изображение принципиальных стадий коикатамеризации

фрагменты (рис. 8, IV), содержащие дотированные «хвост к хвосту» таги и различающиеся на концах адаптерные последовательности.

Эти фрагменты амплифицировали в два этапа: сначала с праймерами, идентичными внешней части адаптеров Д, а затем внутренней В и Г (рис. 8, 7). Стадия образования димеров (рис. 8, структура IV) вводится для последующего выявления артефактов ПЦР-селекции: поскольку вероятность образования двух идентичных димеров в силу статистических закономерностей чрезвычайно низка, то появление их объясняется именно этим эффектом, по этой причине повторяющиеся последовательности удаляются из

последующего анализа. Для избавления от адаптерных последовательностей амплификат гидролизовали эпдонуклсазой Нра11. Целевые таги длиной 21 п.о. выделяли в полиакриламидном геле в виде димеров (рис. 8, V), после чего для образования конкатамеров (рис. 8, VI) полученные димеры лигировали друг с другом (рис. 8, 9).

Для последующего клонирования к образовавшимся конкатамерам лигировали адаптер, лигазную смесь амплифицировали с праймером, идентичным адаптеру. Для удобства последующего секвенирования клонов в дальнейший анализ отбирали фракцию конкатамеров длиной не более 600 п.о. Эту фракцию конкатамерных молекул лигировали в вектор и клонировали.

Alfil

о czEfj—

_мл

(")ГТП-

HpoII

С

Hpall t

Mmel

Mmel

(IV)

Hpall

идроли» Hpall (1)> Лигировани» адаптеров ВД и ГД (2)

пцрр)_Mji

Гидролм Mmel (4) ПААГ алеетрофорва (5)

Лигирование (6}

Г1ЦР(7)

ИраИ Hpall

-►4-

М mil

Гидроли» Hpall, ПААГ »л«ктрофоре» (8)

Hpo.II

(V) р!-.

Mniíl

Hpall

_Jp

Hpall

Hpall

Лигировани* (9)

Hpall

Hpall

(VI)

Hpall

Hpall

Mmel

Mmel

Hpall

Hpall

Рис. 8. Схема метода RIDGES. ДНК обозначена горизонтальными линиями и стрелками. Сайты узнавания рестрикционных эндонуклеаз - вертикальными линиями, адаптерные последовательности А, Б, В, Г, Д - прямоугольниками. 1-9 - стадии эксперимента, I-VI - промежуточные продукты.

В результате определения нуклеотидной последовательности клонированных конкатамеров полностью подтвердилась их структура - 21-нуклеотидные таги, перемежающиеся ССвй - сайтом узнавания эндонуклеазы НраП (структура VI на рис 8).

2.3. компьютерная автоматизация обработки получаемых результатов и их Картирования (совместно с Гайнетдиновым И.В.)

Обработка результатов секвенирования конкатамеров и дальнейшее картирование неметилированных сайтов НраИ вручную является крайне трудоемким. По этой причине было создано компьютерное программное обеспечение, автоматизирующее обработку результатов эксперимента. Основные этапы обработки результатов представлены на рис. 9.

2.3.1. Извлечение набора тагов из конкатамеров

Формирование списка всех 21-нуклеотидных тагов, полученных в результате секвенирования конкатамеров, производится в результате следующих пошаговых операций:

- поиск димеров в нуклеотидной последовательности конкатамеров с учетом максимальной и минимальной длины: димеры, образующиеся из тагов, могут иметь не только каноническую длину, но и большую, как результат ошибок при лигировании и ПЦР;

- удаление из полученного списка совпадающих по нуклеотидной последовательности димеров (появление их в результатах крайне маловероятно в силу статистической закономерности образования димеров и объясняется ПЦР-селекцией);

- выделение из димеров отдельных тагов, а также их одинаковая ориентация относительно разграничивающего сайта (для наглядности и удобства последующей обработки);

2.3.2. Создание базы данных всех присутствующих в исследуемом локусе 21-нуклеотидных тагов, фланкирующих сайты НраП

Получаемый в конечном итоге набор коротких 21-нуклеотидных тагов необходимо однозначно картировать по длине исследуемого участка генома. Для этого требуется предварительно создать базу всех возможных имеющихся в локусе репрезентативных фрагментов, что осуществляется следующим образом:

- поиск в последовательности исследуемого отрезка генома всех картируемых сайтов (5-ССОО-З', содержащиеся в А1и1-Нра11; параметр можно изменять в зависимости от используемой метилчувствительной эндонуклеазы);

- вычленение 21-звенных тагов, фланкирующих картируемый ССОО с обеих сторон;

- исключение из конечной базы 21-звенных тагов, которые нельзя однозначно картировать. Как правило, это таги, расположенные в повторяющихся элементах генома.

Был проведен предварительный статистический расчет картируемости 21- звенных тагов, содержащих сайт эндонуклеазы НраП, в локусе V19Я208-СОХ7Л1. Согласно

полученным результатам около 12% всех присутствующих в локусе CCGG-сайтов невозможно картировать из-за вырожденности содержащих их тагов. Эта сравнительно небольшая фракция принадлежит, в основном, не функционально значимым, а высокоповторяющимся элементам генома, главным образом, SINE, то есть особого интереса для исследователей не представляет.

Сохраненные в текстовом файле формата FASTA результаты содержат набор полученных последовательностей. В заголовке каждой из них указан порядковый номер картируемого сайта и его относительная координата по длине исследуемого локуса генома.

2.3.3. Картирование полученных экспериментально тагов по базе данных тагов исследуемого локуса

Поиск в построенной общей базе тагов исследуемого локуса тех тагов, которые содержатся в результатах реального эксперимента, производится путем сравнивания этих баз данных с помощью алгоритма BLAST, что позволяет получить относительные координаты всех картированных в эксперименте сайтов по длине исследуемого локуса генома.

Конечный результат (список) сохраняется в обычном текстовом файле с суммированными данными (с указанием общего количества точных и неточных совпадений).

2.3.4. Визуализация результатов картирования

Финальным этапом любого метода является функциональный анализ полученных в ходе эксперимента результатов. В силу очевидно большого объема последних эта стадия представляется довольно сложной без выработки определенных подходов к ее решению.

Одним из таких подходов является графическая визуализация местоположения каждого картированного неметилированного сайта относительно кодирующих и регуляторных последовательностей, а также различных повторяющихся элементов исследуемого геномного локуса. За основу для реализации данной задачи был использован Геномный Браузер (UCSC Genome Browser, сервер Университета Санта-Круз, США, http://genome.ucsc.edu/). Для интеграции в удобный графический интерфейс Геномного Браузера данных о картированных неметшшрованных сайтах Hpall подготавливается файл специального формата. Кроме непосредственного отображения всех картированных сайтов имеется также возможность указания степени повторяемости каждого из них в результатах эксперимента.

2.3.5. Нормализация и последующая визуализация нормализованных результатов

Как уже было указано выше, новый экспериментальный подход дает в качестве результата набор неметилированных сайтов исследуемого локуса. Однако распределение CpG-динуклеотидов в составе CCGG-сайта в геноме неравномерно и отсутствие экспериментально найденных сайтов в каких-либо участках генома может отражать всего

лишь отсутствие возможности картировать сайты в этих участках. Таким образом, для правильной интерпретации результатов необходимо нормализовать их перед отображением.

Одним из способов нормализации является подсчет отношения количества сайтов, картированных в результате эксперимента, к общему количеству всех сайтов, которые можно картировать с помощью RIDGES. Подсчет этого отношения ведется внутри отрезков, содержащих равное количество последних, и отображается в соответствующем масштабе. В данном случае при отображении масштаб физической карты и получаемой карты нормализованной плотности метилированности совпадать не будут. Однако для удобства интерпретации результатов приводятся в соответствие: с помощью соединяющих их линий обозначаются общие границы отрезков, внутри которых проводится подсчет нормализованной степени метилированности. Степень метилированности каждого отрезка изображается в виде столбца соответствующей высоты.

Таким образом, для обработки и визуализации получаемых результатов был создан комплексный программный продукт с простым интерфейсом, осуществляющий все необходимые операции.

(tTcB>i№miuHiti*Kiwmiu{iMi|№uiTnNW«i№«iicM итмттттЯВестсссАвлатотвттнысдокмВМктгаАТвТтмсассет естиытсЯК^тгмхтсгаисхстстммкслсмтлтЯНмлснмпасасс

мсл#*ис«Астсс*тсбб*£сЕ1Щб*лас1>4ет1бс*бг«р:сс**сслс*1сЛ

конкатамеры. полуинны« > мслеркнента

(1) Извлечение набора I тагов из конкатамеров |

НАБОР ТАГОВ ИЗ ЭКСПЕРИМЕНТА

НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ИССЛЕДУЕМОГО ЛОКУСА

(2) Создание базы "виртуальных" тагов исследуемого локуса

BLASTN •

БАЗА "ВИРТУАЛЬНЫХ" ТАГОВ

Поиск тагов, полученных в эксперименте в базе "виртуальных" тагов

I (3) Сортировка данных картирования

НАБОР КООРДИНАТ КАРТИРОВАННЫХ САЙТОВ РАСЩЕПЛЕНИЯ

(4) Визуализация в Геномном Браузере J | (5) Визуализация плотности сайтов коордии«ты-+Г

Картированные-свйты

•-»Плотность картированных сайтов

Гены

Рис. 9 Схема компьютерной обработки данных, полученных в результате секвснирования конкатамеров

2.4 АНАЛИЗ РАСПРЕДЕЛЕНИЯ МЕТИЛИРОВАНИЯ ЛОКУСА FXYDS-COX7A1 (Chr 19) В НОРМАЛЬНОЙ И ОПУХОЛЕВОЙ ТКАНЯХ ЛЕГКОГО И КЛЕТОЧНОЙ ЛИНИИ А549 (КАРЦИНОМА ЛЕГКОГО)

Разработанный намн метод был использован при исследовании метилирования локуса 19-ой хромосомы FXYD5-COX7A1 для ДНК нормальной и опухолевой тканей легкого пациента с диагнозом плоскоклегочный рак легкого III стадии и ДНК клеточной линии А549 (карцинома легкого). Для всех трех образцов анализировалось распределение неметилированных сайтов CCGG. Для ДНК нормальной ткани легкого в исследуемом локусе было картировано 429 неметилированных сайтов, для ДНК опухолевой ткани легкого - 352 и для ДНК клеточной линии А549 -165. На основании повторяемости клонов в клонотеках неметилированных фрагментов был сделан вывод о том, что такое количество найденных сайтов является достаточным для достоверного описания метилирования данного локуса в трех тканях. На рис. 10 показано распределение найденных неметилированных CCGG-сайтов, картированных с использованием геномного браузера UCSC Human Genome Browser (http://penome.ucsc.edu/cei-bin/hgGatewav).

Также для анализа использовался метод графического представления результатов, учитывающий неравномерность распределения CpG-сайтов в геноме - гистограмма плотности неметилированных сайтов CCGG относительно распределения всех сайтов CCGG (рис. 11). Анализ карт распределения неметилированных сайтов и их гистограмм показывает схожесть распределения метилирования для нормальной и опухолевой тканей легкого. Во всех трех случаях наблюдается ярко выраженная кластеризация неметилированных сайтов. Несмотря на существующее мнение о тенденции гипометилирования кодирующих последовательностей генов (Antequera, 2003), полученные результаты демонстрируют, что в ДНК обеих тканей гипомегилированные области находятся как в богатых генами участках, так и в обедненных (например, участок локуса с условными координатами 0,3 - 0,35, рис. 11). С другой стороны, выявлено гиперметилирование генбогатых участков (участок 0,67 -0,7). Возможным объяснением этого явления может быть существование еще неизвестных генов или же регуляторных cw-элементов, контролирующих удаленные гены.

Сравнение полученных результатов демонстрирует схожесть распределения метилирования для нормальной и опухолевой тканей легкого, в то время как распределение метилирования в клеточной линии А549 отличается от исследованных тканей.

Самое существенное отличие линии А549 - наличие трех расположенных рядом участков, каждый из которых имеет длину около 30 тыс п.о. (см. выноску на рис. 10). Два района, ограниченные генами USF2-MAG и FFAR3-FFAR2, являются гшзерметилированными и фланкируют гипометилированный участок, ограниченный генами CD22-FFAR1. Подтверждение разницы в уровне метилирования между двумя районами USF2-MAG и CD22-FFAR1 было сделано с применением гибридизации по Cay зерну. Гиперметютрованносгь участка USF2-MAG была также подтверждена результатами бисульфитного секвенирования некоторых фрагментов данного участка локуса .

Рис. 11. Гистограммы относительной плотности неметилированных сайтов CCGG.

2.5. ИССЛЕДОВАНИЕ ВЗАИМОСВЯЗИ ТРАНСКРИПЦИИ, СТРУКТУРЫ ХРОМАТИНА И МЕТИЛИРОВАНИЯ ПРОМОТОРНОЙ ОБЛАСТИ ГЕНОВ MAG И НАМР В КЛЕТОЧНОЙ ЛИНИИ А549

При анализе распределения неметилированных CpG сайтов в 1МЬ локуса 19-ой хромосомы FXYD5 -СОХ7А1 в клеточной линии А549 (карцинома легкого) было найдено аномальное гиперметилирование протяженного, около 30 тыс. п.о., генсодержащего участка. В этом участке находятся гены MAG и НАМР, для которых известно, что их экспрессия высоко тканеспецифична. В исследованных нами тканях (нормальная и опухолевая ткани легких) и клеточной линии А549 уровень метилирования локуса MAG-HAMP различен, в тканях этот участок существенно менее метилирован, чем в клеточной линии. При этом

' Результаты гибридизации и секвенирования приведены в диссертации

транскрипция во всех трех образцах практически не детектируется, то есть отсутствует корреляция между транскрипцией этих генов и статусом метилирования локуса, в котором они расположены. Более того, уменьшение уровня метилирования при выращивании клеточной линии в присутствии 5-азадезоксицитидина (5-Aza-dC) не приводит к какому-либо существенному увеличению уровня транскрипции (рис. 12).

Известно, что в ряде случаев понижение уровня метилирования оказывается непосредственным или опосредованным фактором в активации транскрипции гепов. Но, с другой стороны, полногеномный анализ влияния деметилирующих агентов и эффекта инактивации метилтрансфераз показывает, что они оказывают различное действие на разные группы гепов, активируя часть из них и не изменяя или даже понижая транскрипцию других (Gius et al., 2004). Одна из гипотез объясняет этот двойственный эффект деметилирования зависимостью изменения активности генов от региональных особенностей структуры локализованного рядом с ними хроматина. Известны случаи, когда неметилированпые молчащие гены активировались под действием ингибитора деацетилаз гистонов трихостатина A (TSA) (Hitchins et al, 2007).

Анализ состояния хроматина, проведенный для участков 5'-области генов МАО и НАМ?, показал, что только дополнительное к деметилированию ДНК иягибирование деацетилирования гистонов приводит к ощутимому повышению активного состояния хроматина и транскрипционной активности этих генов (рис. 12). Однако, уровень транскрипции, достигаемый в линии, обработанной 5-Aza-dC и TSA одновременно, различается для MAG и НАМР почти в 3 раза, при том, что уровень ацетилирования гистона НЗК9 примерно одинаков. Ранее в гене MA G были картированы 2 сайта связывания транскрипционного фактора CTCF (Vetchinova et al, 2006), один из которых расположен в первом интроне гена, а второй - в третьем интроне, непосредственно перед CpG-островком. Известно, что метилирование блокирует связывание CTCF с ДНК (Mukhopadhyay et al, 2004), поэтому можно предположить, что в случае MAG (в отличие от НАМР) снятие метилирования приводит к связыванию CTCF со своими сайтами, расположенными в гене MAG, и последующей репрессии транскрипции. Подобный механизм подавления транскрипции был описан, например, для гена hTERT (Renaud et al, 2007).

2 3 4 1 2 3 4

MAG HAMP

1 2 3 4 1 2 3 4

MAG HAMP

Рис. 12. Уровень транскрипции н уровень ацетилирования гистона НЗК9 для генов НАМР и MAG в клеточной линии А549 при следующих условиях: 1, контрольный эксперимент; 2, в присутствии 5-Aza-dC; 3, в присутствии TSA; 4, в присутствии 5-Aza-dC и TSA.

A, уровень транскрипции (относительно гена GAPDH)

B, уровень ацетилирования гистона НЗК9 Результаты получены в трех независимых экспериментах

Гликопротеин, ассоциированный с миелином, кодируемый геном MAG, -чрезвычайно специализированный белок, экспрессирующийся преимущественно в нервных тканях. Известно, что по мере дифференцировки и созревания олигодендритов крысы происходит повышение уровня транскрипции, которое сопровождается постеленным деметилированием CpG-сайтов промоторной области (Grubinska et al, 1994; Laszkiewicz et al,

1997). CpG-сайты, расположенные в самом гене, сохраняют свой уровень метилирования. Таким образом, наши данные в сочетании с этими могут указывать на то, что активная экспрессия гена MAG происходит при деметилировании промоторной области и сохранении метилирования CpG-сайтов, расположенных внутри гена,

2.5. АНАЛИЗ БАКТЕРИАЛЬНОГО ТРАНСКРИПТОМА ВНУТРИКЛЕТОЧНЫХ ПАТОГЕНОВ IN VIVO

Анализ специфической экспрессии генов патогенов (микроорганизмов и простейших) в инфицированном организме представляет собой широко распространенную задачу как в исследовательских лабораториях, где он нацелен на получение данных о взаимодействиях организма и патогена, так и, в перспективе, в клинике, где сведения о качественном и количественном содержании различных РНК патогена могут служить средством диагностики и прогноза течения болезни. Однако анализ транскриптома патогенной бактерии в непосредственной инфекционной среде - пораженной ткани - существующими методами затруднен из-за сложностей, связанных с выделением бактериальной РНК, ее чрезвычайно малого количества и проблемы отделения бактериальной РНК от подавляющего количества тотальной РНК хозяина, в то время как изучение генной экспрессии бактерий при их выращивании в жидкой среде и имитации реальных условий инфекции не отражает реальной картины, возникающей при развитии болезни.

Мы применили метод Coincidence Cloning для извлечения кДНК бактериального патогена из смеси с кДНК мыши. В качестве модели была использована модель инфекции мышей линии A/'Sn штаммом М. tuberculosis H37Rv на 9-ой неделе заражения, то есть модель хронической фазы микобактериальной инфекции (предоставлена А.С. Аптом, ЦНИИ Туберкулеза РАМН). В качестве двух образцов ДНК использовали суммарную кДНК, синтезированную на основе тотальной РНК, выделенной из ткани легкого инфицированной мыши и геномную ДНК М. tuberculosis H37Rv. Оба образца ДНК были предварительно гидролизованы частощепящей рестриктазой Rsal. К двум наборам Rsal фрагментов литеровали супрессионные одноцепочечные адаптеры.

Полученные наборы фрагментов геномной ДНК и кДНК смешивали в равном весовом соотношении. Поскольку, по разным оценкам, содержание РНК М. tuberculosis в тотальной РНК, выделяемой из пораженного легкого, составляет менее 0,2% (Banaie et al, 2006), молярное соотношение микобактериальной геномной и кДНК в смеси составляет не менее 100 : 1. Такое избыточное количество геномной ДНК позволяет сохранить различную представленность микобактериальных транскриптов.

В результате проведения двух раундов селективной ПЦР был получен ампликон, обогащенный фрагментами бактериальной кДНК. Высокая степень обогащения клонированного ампликона подтверждена результатами сиквенса выборки из 70 клонов: лишь 24% вставок обнаружили (фрагментарную) гомологию с мышиными транскриптами, а 76% вставок оказались идентичны по нуклеотидным последовательностям различным участкам генома М. tuberculosis H37Rv. Наличие разнотипных супрессионных адаптеров на противоположных концах вставок всех микобактериальных клонов свидетельствует о транскрибируемости найденных последовательностей М. tuberculosis в зараженных мышиных клетках.

Сравнительную оценку содержания различных типов транскриптов в исходном образце кДНК и в результирующем СС ампликоне провели для 16 генов М. tuberculosis методом полуколичественного ПЦР-анализа кДНК. Анализ выявил три группы транскриптов: слабо транскрибируемые гены (6 из 16) не детектируются в исходном образце, но достоверно представлены (28-39 цикл ПЦР) в ампликоне; умеренно- (5 генов, детектируемых на 35-36 циклах ПЦР для образца кДНК и 8-20 циклах для ампликона) и средне- (5 генов, детектируемых на 39-40 и 22-28 циклах соответственно) транскрибируемые гены приблизительно сохраняют соотношение представленности в обоих сравниваемых образцах. Таким образом, продемонстрировано, что процедура СС в целом сохраняет не только качественный, но и количественный профиль транскриптома, кроме того, чувствительность метода позволяет анализировать даже самые низкопредставленные-транскрипты (на примерах транскриптов, не детектируемых в образце кДНК).

Масштабный анализ полученного ампликона проводился проведено методом параллельного пиросеквинирования с использованием геномного анализатора GS FLX (Roche) в Центре Биоинженерии PAHf. Нуклеотидные последовательности были определены в 98 692 независимых реакциях. 75 436 последовательностей (76,4 %) имели гомологию с последовательностью генома М. tuberculosis. Таким образом, в результате СС произошло обогащение бактериальной кДНК более чем в 1 ООО раз.

2.5.1. Анализ транскриптов М. tuberculosis, транскрибирующихся в мышиной легочной ткани

В результате секвенирования получена информация о транскрипции 536 генов, что составляет около 14% от общего количества белок кодирующих генов (Приложение к диссертации). Такое небольшое количество транскрибирующихся генов можно объяснить недостаточным объемом секвенирования, что приводит к потере информации о

' Список транскрибирующихся генов с указанием количества транскриптов приведен в Приложении к диссертации

пизкопредставленных транскриптах, однако, возможно, таким образом, проявляется факт общего уменьшения количества транскрибирующихся последовательностей при хронизации инфекции. Согласно (Talaat et ai, 2007) и (Sohaskey, 2008) в хронической фазе туберкулеза происходит снижение общего уровня синтеза белка и РНК.

Из-за высокой степени идентичности нуклеотидной последовательности генов транспозаз не удалось провести однозначное отнесение фрагментов кДНК к генам этой функциональной категории (insertion sequences and phages), которую не учитывали в дальнейшем анализе транскриптома.

Гены, для которых были найдены кДНК, были отнесены к основным биохимическим категориям согласно http://genolist.pasteur.fr/TubercuList. и определена доля транскрибирующихся генов в каждой категории. Для большинства категорий доля транскрибирующихся генов не отличается достоверно от среднего по геному (табл. 4). Исключение составляет категория генов липидного метаболизма.

Табл. 4. Аннотация транскрибирующихся генов к биохимическим категориям.

Категория Количество генов данной категории (% относительно общего количества генов) Количество транскрибирующихся генов данной категории (% относительно общего количества транскрибирующихся генов)

0 virulence, detoxification, adaptation 111(3) 16(3)

1 lipid metabolism 226 (6.05) 49(9)

2 information pathways 223 (5.97) 26 (4.8)

3 cell wall and cell processes 698(18.7) 105 (19,5)

6 PE/PPE 131 (3.5) 17 (3.2)

7 intermediary metabolism and respiration 869 (23.3) 131 (24.4)

8 unknown 242(6.5) 29 (5.4)

9 regulatory proteins 184(5) 23 (4.3)

10 conserved hypothetical 1018 (27) 138 (25.7)

16 conserved hypothetical with an orthologue in M. bovis 32 (0.9) 2 (0.3)

TOTAL 3734 536*

При анализе генов М. tuberculosis, транскрибирующихся в легких инфицированной мыши, наибольший интерес вызывают следующие группы:

Гены липидного метаболизма. Существенно увеличено количество генов, вовлеченных в липидпый метаболизм (экспрессируются 49 из 226 генов), при этом экспрсссируются как

1 Без учета категории «insertion sequences and phages»

компоненты каскадов биосинтеза жирных кислот (например 9 из 34 генов семейства/ас/Д кодирующих аннл-КоА-синтетазы), так и их деградации (10 из 33 генов fadE, кодирующих ацил-КоА-дегидрогсназы). Очень высок уровень экспрессии генов семействаpps, кодирующих ферменты синтеза фтиоцерола, необходимого для синтеза основного компонента клеточной стенки микобактерии - димикоцерозатов фтиоцерола (PDIMs). Из 5 генов семействаppsA-E экспрессируются 3, причем ppsC и ppsD с очень высоким уровнем экспрессии.

Среди генов семейства ттаА1-4, кодирующих синтетазы метоксимиколовой кислоты (methoxy mycolic acid synthase), экспрессируются 3 гена из 4.

В геноме М. tuberculosis выделяется кластер генов поликетидсинтаз, pksl-l 7, белковые продукты которого также вовлечены в процесс синтеза фтиоцерола или фенилфтиоцерола, хотя их точная функция не установлена. В нашем эксперименте получены данные об экспрессии 6 из 16 генов этого семейства.

Чрезвычайное значение для функционирования микобактерий имеют белки, ассоциированные с поликетидсинтазами (polyketide synthase associated proteins, геныpapAl-5), продукты которых являются ацилтрансферазами. Предполагается, что они могут осуществлять этерификацию трегалозы или её производных. В геноме эти гены существуют в виде нескольких функциональных оперонов, содержащих также гены семействаpks и семейства мембранных белков mmpL. Нами показана экспрессия 3 генов из 5, входящих в это семейство.

Гены метаболизма дыхательных путей Несмотря на то, что резкого увеличения количества транскрибирующихся генов этой категории не отмечено, наблюдается перераспределение транскрипции генов, соответствующих переходу микобактерии с аэробного дыхания на анаэробный. (Gennaro et al, 2005). Отмечается экспрессия генов, входящих в narGHIJ operan, кодирующий нитрат-редуктазы (экспрессируются гены narH, narl, narj), а также пагХ и пагКЗ, кодирующие переносчики нитратов. Для такого сдвига в дыхании бактерии, находящейся в хронической фазе инфекционного процесса, характерно снижение активности АТФ-синтезирующего аппарата, что проявляется в снижении транскрипции генов, находящихся в кластере atpA-H, транскрибируется только ген aptD.

Гены информационных путей Свовлеченные в репликаиию. репарацию и транскрипцию ДНЮ Транскрипция генов, кодирующих рибосомальные белки, и вовлеченных в биосинтез ДНК, немного понижена по сравнению со средним значением, что может указывать на замедление репликации бактериальных клеток. По-видимому, этот факт отражает свойства хронической стадии инфекционного процесса, связанной с ослаблением бактериального роста. Такой факт

отмечают ряд авторов, например, при сравнении транскрипции генов этой категории в дендритных клетках по сравнению с in vitro (Tailleux et al, 2008).

Таким образом, в целом, проанализированный бактериальный транскриптом действительно качественно и количественно соответствует хронической фазе инфекционного процесса и адаптации М tuberculosis к иммунной системе хозяина.

3. ИСПОЛЬЗОВАНИЕ ОЛИГОНУКЛЕОТИДОВ с ПОВЫШЕННЫМ СРОДСТВОМ к КОМПЛЕМЕНТАРНОЙ МАТРИЦЕ КАК ЗОНДОВ В МОЛЕКУЛЯРНОЙ БИОЛОГИИ

Принципиальной основой использования олигонуклеотидов как зондов в молекулярной биологии является образование стабильного дуплекса с комплементарной последовательностью ДНК. Возможность варьирования, то есть увеличения или уменьшения стабильности таких дуплексов позволяет существенно увеличить их потенциал в исследованиях структуры и функций генетического материала.

Существует много возможностей модифицировать углеродно-фосфатный остов, фосфатные группы или гетероциклические основания. В нашей работе использован опыт синтеза олигонуклеотидов с модифицированными гетероциклическими основаниями, полученный в группе проф. В.К. Потапова.

Нами исследованы олигонуклеотиды, содержащие 5-метилцизозин (юе5С) и 2-аминоаденин (am2А) вместо цитозина и адепина соответственно. Известно, что стабильность пары диаминопурин-тимидин увеличивается за счет появления дополнительной водородной связи (Cheong et al, 1988), а пары 5-метилцитозин-гуашш - за счет гидрофобных взаимодействий метальной группы в большой бороздке спирали ДНК (Hoheinsel et al, 1990), при этом происходит увеличение температуры плавления комплементарного дуплекса примерно на Io С на модифицированное звено в обеих случаях (рис. 13).

Нами было впервые осуществлена характеристика таких олигонуклеотидов (Strongly Binding Oligonucleotides, SBO) с точки зрения их сродства к комплементарной ДНК матрице в матричном синтезе. При этом было показано, что:

а) модифицированные олигонуклеотиды более эффективно праймируют матричный синтез ДНК по сравнению с немодифицированпыми олигонуклеотидами той же структуры, при этом сохраняется специфичность синтеза.

б) определена минимальная длина олигонуклеотида, способного эффеетивпо праймировать синтез. Чтобы ответить на этот вопрос, мы провели измерение эффективности синтеза ДНК, праймированного модифицированными и немодифицированпыми пента-и гексамерами. Анализ включения á[P32]-dATP во вновь синтезированную цепь продемонстрировал, что пентамеры, как нормальной структуры, так SBO, не эффективны в качестве праймеров,

гексамеры продемонстрировали достаточно хорошую эффективность затравки, однако, БВО более эффективны, даже при повышенных температурах (данные приведены в тексте диссертации)

Лт = 1°С / base pair (Hoheisel et al., 1390)

ЛТш = 1°C / base pair

(Choong et e[., 1988)

Рис. 13 Модифицированные гетероциклические основания

5-метилцитозин (А), 2-аминоаденин (Б) и их взаимодействие с комплементарной матрицей

3.1. Комбинации SBO в качестве объединенных праймеров для секвенирования

Полученные результаты позволили нам пользовать SBO как компоненты длинного праймера в упорядоченном секвенировании primer walking (рис. 14). В 1992 г. группой W. Studier'a было продемонстрировано, что вместо длинного 15-17-ти звенного олигонуклеотида можно использовать комбинацию трех 6-ти звенных составляющих его олигонуклеотидов. Праймирование подобным «составным» праймером происходит в присутствии белка SSB, специфически связывающего одноцепочечные ДНК. Стэкинг-взаимодействия концевых звеньев коротких олигонуклеотидов, прилегающих друг к другу, приводят к повышенной стабильности образуемых ими дуплексов. Нами показано, что использование SBO в качестве коротких модулей составного праймера приводит к существенному увеличению эффективности праймирования в случае гексамеров и даже праймированию комбинацией пентамеров, что невозможно при использовании немодифицированных олигонуклеотидов (рис. 15).

Рис. 14. Primer walking (А) и стратегия составных праймеров (В)

та&М поввккЙВеЛ modified

ds м ss Рис. 15. Определение первичной структуры ДНК

|||| Sijjl бактериофага М13 с помощью комбинированного

|»®в §Mj ираймера, состоящего из немодифицированных (1+2+3) и

Я*з| модифицированных (1м+2м+3м) пентамеров.

5 *; S 1 "Ml Модифицированные основания выделены подчеркиванием.

«"I 5'- GTAAAACGACGGCCAGT

1 CCAGT

1м CCAGT

ИЁ 2 GACGG

2м GACGG

Шж- 3 ААААС

~ ж Зм ААААС

т"

%

ss- одноцепочечная матрица; ds - двуцепочечная матрица

Данный подход был успешно применен для определения первичной структуры областей 19-й хромосомы человека, содержащих длинные концевые повторы (ЬТ11) в рамках проекта «Геном Человека».

3.2. Использование модифицированных олигонуклеотидов в ПЦР

Нами были исследованы преимущества SBO в ПЦР-амплификации, а именно: а) влияние температуры отжига на ПЦР (рис. 16). Использование SBO позволяет проводить амплификацию при более высоких температурах отжига. Как немодифицированные, так и SBO праймеры были эффективны при температуре отжига 57°С (данные не приведены), однако, только SBO были эффективны при температурах 65°С и выше. Полученные результаты демонстрируют преимущество SBO в условиях амплификации матриц со сложной вторичной структурой, требующих повышенных температур амплификации.

NMNMNMNM

65 С 72 С

Рис. 16. Зависимость эффективности ПЦР амплификации от температуры отжига при использовании немодифицированных (IV) и модифицированных (М) олигонуклеотидиых праймеров. Олигонуклеотиды М13сИг (ОТААААСООССАСТ) и М13геу (САООААААСАОСТАТСАС) были использованы для амплификации вставок длиной 1,1 т.п.о. и 2,5 т.п.о. при различных температурах отжига.

б) БВО позволяет преодолевать эффект супрессии ПЦР на матрицах со вторичной структурой (рис. 17). Известно, что такие структуры подавляют амплификацию с обычных олигонуклеотидиых праймеров независимо от температуры отжига (Лукьянов и др, 1994). Мы использовали две ДНК-матрицы, различающиеся длиной и структурой центральных участков, и для обоих случаев было показано, что модифицированные олигонуклеотиды способны вытеснять немодифицированную цепь из дуплекса, тем самым обеспечивая амплификацию.

5' GTAAAACGACGGCCAGI I I I I I I I iTTTTNN NNAAAAAAAAAAAAACTGGCCGTCGTTTTAC 3' 3'<EATTTTGCTGCCGGTCAAAAAAAAAAAAANN_NNTTTTTTTTTTTnGACCGGCAGeAAAATG 5'

Ь 312 bp TGACCGGCAGCAAAATG 5'

5' GTAAAACGACGGCCAGT S' GTAAAACGACGGCCAGTTI I I I Г II I I I I 3'C ATTTTGCTGCCGGTCAAAAAAAAAAAAA

Melting, annealing

"Frying pan" structura

20 cycles

Na Nb Ma Mb

25 cycles

.528 bp -312 bp

Na Nb Ma' Mb

Рис. 17. ПЦР амплификация фрагментов ДНК, образующих вторичную структуру в месте посадки праймера. Верхняя часть - структура ДНК. Нижняя часть - Разделение продуктов ПЦР в агарозном геле после 20 (слева) и 25(справа) циклов амплификации. N и M - результаты, полученные для ^модифицированных и модифицированных праймеров, соответственно.

Эти свойства SBO могут быть использованы в случаях, если ограничено количество нуклеотидного материала; чрезвычайно желательно уменьшение количества циклов ПЦР, в частности для уменьшения накопления артефактов, связанных с ПЦР-селекцией, а также в тех случаях, когда сайт посадки праймера для ПЦР находится в области со стабильной вторичной структурой.

3.3. Использование модифицированных олигонуклеотидов в случайно праймированной полимеразной цепной реакции (RAPD)

Случайно праймированная ПЦР нашла широкое применение для молекулярной дактилоскопии геномов различных уровней сложности (Williams et al, 1990; Akopyants et al, 1992). Использование максимально коротких олигонуклеотидных праймеров дает возможность увеличивать информативность получаемой картины случайного праймирования за счет большей часто ты встречаемости коротких последовательностей в

геноме. Однако уменьшение длины праймера должно приводить к уменьшению его эффективности, что может быть компенсировано увеличением прочности связывания праймера с матрицей путем введения в него модифицированных звеньев.

Для сравнения эффективности нормальных и модифицированных праймеров в условиях ИАРО нами был использован 10-ти звенный праймер в модифицированном и нормальном вариантах (рис. 18). ИАРБ проводили на различных бактериальных геномных

.ЛУ':

£ л

932 Ьр Ш ■ ■ '

Ьр' « — ^

«

- ~

2Г ЛГАЖУЗгК:-? ■""> ' ....... '

Рис. 18. КАРП с использованием немодифицированного (АСССТАСАСТ) или модифицированного (АСССТАСАСТ) праймеров. а - температура отжига 37°С; б - 50°С. Дорожки: 1 - маркер длин. В качестве матриц использованы бактериальные геномные ДНК дорожки 2, 3-5.1урЫтиг1ит, 4,5-Е. соИ К802, 6, 7- Я ру1оп ОТСТ11638. Образцы 2, 4,6 получены с помощью немодифицированного праймера, образцы 3, 5, 7 - с помощью его модифицированного аналога.

ДНК в качестве матрицы и разных температурах отжига (рис.18). При сравнительно низкой температуре отжига (рис 18, а) видно, что оба праймера дают полосы амплификации. При повышении температуры отжига праймера (рис. 18, б) только модифицированные праймеры сохраняют способность к амплификации, при этом увеличивается резкость полос и меняется их распределение. Различные паттерны в случае модифицированных и ^модифицированных праймеров могут отражать сложную систему взаимодействий праймеров с матрицей ДНК. Эти взаимодействия могут, в частности, включать конкуренцию праймеров с собственной

вторичной структурой одноцепочечных ДНК, в результате которой более прочно связывающиеся праймеры могут взаимодействовать с ДНК в областях существующих внутримолекулярных шпилек. Этот результат показывает принципиальную возможность использования модифицированных праймеров в ЛАРО.

ВЫВОДЫ

1. Для проведения полногеномного сравнения близкородственных бактериальных штаммов разработан оптимизированный метод ПДРФ-вычитающей гибридизации. Эффективность метода продемонстрирована на примере сравнения геномов штаммов М. tuberculosis HN878 и CDC 1551, вызывающих различные клинические формы заболевания туберкулезом. Идентифицировано и охарактеризовано 9 нуклеотидных последовательностей, отличающих геном штамма HN878 от генома штамма CDC1551. Проведено сравнение геномов четырёх российских клинических штаммов М. tuberculosis с геномом штамма H37R.V. Идентифицировано и охарактеризовано 12 нуклеотидных последовательностей, отличающих геномы российских штаммов от секвенированного генома штамма H37Rv.

2. Предложен способ генотипирования штаммов М. tuberculosis методом геномной ПЦР 12 локусов (ID-типирование). Эффективность и надежность метода показана на коллекции из 172 штаммов М. tuberculosis, циркулирующих в центральных регионах Российской Федерации. Обнаружен новый характеристический геномный локус, присутствующий только в геномах штаммов М. tuberculosis семейства W/Beijing. Концепция Ю-типирования носит универсальный характер и может использоваться как стандартный подход при проведении эпидемиологических исследований и анализа популяций любых бактериальных патогенов.

3. Методом ПДРФ-вычитающей гибридизации впервые полногеномном уровне исследованы различия близкородственных представителей байкальских сиговых рыб- озерного сига (С. lavaretus baicalensis Dybovsky) и омуля (С. autumnalis migratorius Georgi). Показано, что данным методом не обнаруживаются устойчивые межвидовые различия. Все найденные нуклеотидные последовательности соответствуют полиморфным некодирующим участкам геномов, варьирующим в результате однонуклеотидных замен и коротких делеций. Многие из них картируются вблизи генов иммунной системы и имеют участки, идентичные широко распространенным среди рыб Tel-подобным транспозонам, транскрипционная активность

которых может влиять на экспрессию близлежащих генов. Отсутствие устойчивых различий между геномами этих сиговых свидетельствует об их высокой близости, возможно связанной с их недавней эволюционной дивергенцией.

4. Разработана концепция анализа паттернов метилирования протяженных областей геномов. Концепция предполагает возможность влияния на экспрессию генов метилирования протяженных участков генома, включающих эти гены, а не только метилирования их регуляторных участков. Усовершенствован метод клонирования последовательностей, идентичных в двух сравниваемых геномах или транскриптомах, на его основе разработан новый метод анализа распределения тканеспецифического метилирования на протяженных участках геномной ДНК. Предложен принципиально новый методический подход к экспресс-картированию сайтов расщепления протяженных фрагментов генома (на примере картирования сайтов расщепления метилчувствительной эндонуклеазой рестрикции Hpall).

5. Впервые проведен подробный анализ распределения метилирования в локусе FXYD5-СОХ7А1 19-ой хромосомы человека длиной 1,02 млн. п.о. для различных образцов геномной ДНК (паренхимы и семиномы яичка, нормальной и опухолевой тканей легкого, клеточной линии А549). Показано, что различия между паттернами метилирования локуса FXYD5-СОХ7А1 в исследованных нормальных и опухолевых тканях минимальны. Показано, что для клеточной линии А549 характерно гиперметилирование протяженной, содержащей гены, области длиной 30 тыс. п.о., не обнаруженное в других исследованных тканях. Сравнительный анализ транскрипционной активности генов MAG и НАМР, содержащихся в данной области, в разных тканях продемонстрировал ее независимость от метилирования ДНК. Полученные данные ставят под вопрос универсальность принятой точки зрения о роли метилирования в регуляции генов.

6. Разработан метод получения кДНК, представляющей полный транскриптом бактериального патогена, из пораженной ткани организма хозяина. Применение метода позволяет получать новые данные о механизмах патогенеза инфекционного заболевания и изменении регуляции экспрессии геномов патогенов при инфекции организмов Эффективность метода продемонстрирована на примере получения кДНК М. tuberculosis из легочной ткани инфицированных мышей. Проведен анализ последовательностей, транскрибирующихся в легочной ткани мыши на 9-ой неделе развития инфекции. Показано,

что для исследованных генов наблюдается качественное и количественное соответствие паттерна экспрессии паттерну, наблюдаемому при хронической фазе туберкулеза.

7. Предложены новые способы применения модифицированных олигонуклеотидов, содержащих 5-метилцизозин и 2-аминоаденин, и обладающих повышенным сродством к комплементарной матрице, в качестве праймеров для секвенирования и ПЦР. Продемонстрирована их повышенная эффективность праймирования при сохранении специфичности гибридизации. Разработан метод определения первичной структуры с использованием набора коротких модифицированных олигонуклеотидов в качестве праймера, Разработан вариант молекулярной дактилоскопии, ЯАРБ, с использованием таких олигонуклеотидов.

Список литературы Обзоры:

1. Гайнетдинов, И. В., Ажикина, T.JI., Свердлов Е.Д. (2007). Короткие репрезентативные последовательности в геномных исследованиях. Биохимия 72(11): 11791186.

2. Ажикина, Т.Л., Свердлов, Е.Д. (2005). Изучение тканеспецифического CpG метилирования ДНК в протяженных геномных локусах. Биохимия 70(5): 596-603.

3. Ажикина, Т.Д., Монастырская, Г.С., Свердлов, Е.Д. (2004). Полногеномные несеквенирующие анализы патогенов - неотъемлемый компонент мероприятий биобезопасности. Молекулярная медицина 3:33-40.

4. Sverdlov, Е. and Azhikina Т. (2005). Primer Walking, Encyclopedia of Life Sciences: DOI: 10.1038/npg.els.0005382

5. Azhikina, T. (2000). Sequencing Strategies and Tactics in DNA and RNA Analysis. Encyclopedia of Analytical Chemistry. R. A. Meyers. Chichester, John Wiley&Sons Ltd.

6. Potapov, V., T. Azhikina, Demin, V.V., Limborskaja, S.A. and Sverdlov E.D. (1996). Modified oligonucleotides as a tool for DNA sequencing, fingerprinting and mapping. Pure&Appl Chem 68(6): 1315-1320.

Статьи:

7. Быченко, O.C., Суханова, Л.В., Уколова, С.С., Скворцов, Т.А., Потапов, В.К., Ажикина, Т.Л., Свердлов, Е.Д. (2009) Геномная близость байкальского омуля и сига. Биоорганическая Химия, 35,95-102.

8. Gvozdevskiy, N.A., Azhikina, T.L., Botvinnik, А.О., Evsyukova, I.Y., Shemyakin, I.G. and Sverdlov, E.D. (2006) New approach aimed at investigation of genomic polymorphism of the Russian M. tuberculosis population. FEES Journal, 273,270

9. Гвоздевский, H.A., Ажикина, Т.Л., Свердлов, Е.Д. (2006) Делеционно-инсерционные различия геномов высоковирулентного штамма HN878 Mycobacterium tuberculosis и менее вирулентного штамма CDC1551. Журнал Микробиологии Эпидемиологии и Иммунологии, 1, 10-15

10. Azhikina, Т., Gvozdevsky, N., Botvinnik, A., Fushan, A., Shemyakin, I., Stepanshina, V., Lipin, M., Barry, C., 3rd and Sverdlov, E. (2006) A genome-wide sequence-independent comparative analysis of insertion-deletion polymorphisms in multiple Mycobacterium tuberculosis strains. Res Microbiol, 157, 282-290.

11. Azhikina, Т., Gainetdinov, I., Skvortsova, Y. and Sverdlov, E. (2006) Methylation-free site patterns along a 1-Mb locus on Chrl9 in cancerous and normal cells are similar. A new fast approach for analyzing unmethylated CCGG sites distribution. Mol Genet Genomics, 275,615— 622.

12. Azhikina, Т., Gainetdinov, I., Skvortsova, Y., Batrak, A., Dmitrieva, N. and Sverdlov, E. (2004) Non-methylated Genomic Sites Coincidence Cloning (NGSCC): an approach to large scale analysis of hypomethylated CpG patterns at predetermined genomic loci. Mol Genet Genomics, 271,22-32.

13. Kurdyukov, S.G., Lebedev, Y.B., Artamonova, II, Gorodentseva, T.N., Batrak, A.V., Mamedov, I.Z., Azhikina, T.L., Legchilina, S.P., Efimenko, I.G., Gardiner, K. and Sverdlov, E.D. (2001) Full-sized HERV-K (HML-2) human endogenous retroviral LTR sequences on human chromosome 21: map locations and evolutionary history. Gene, 273,51 -61.

14. Kostina, M., Azhikina, Т., Gorodentseva, Т., Berg, D. and Sverdlov, E. (2000) Contiguous strings of strongly binding short oligonucleotides as a useful tool for completing sequencing experiments. DNA Seq, 10, 355-364.

15. Kurdjukov, S., Azhikina, Т., Lebedev, Y., Gardiner, K. and Sverdlov, E. (1999) Mapping of endogenous retroviral LTRs on Chr21-concentration of the regulatory elements within the gene-enriched 21 q22 region. Cytogenet Cell Genet, 86,17.

16. Чернов, И.П., Поляков, A.C., Акопов, С.Б., Николаев, Л.Г., Ажикина, Т.Д., Костина, М.Б., Свердлов, Е.Д. (1999) Идентификация и картирование на хромосоме 19 человека хромосомспецифического повторяющегося элемента, предпочтительно связывающегося с ядерным матриксом. Биоорганическая Химия, 25,242-247.

17. Хиль, П.П., Костина, М.Б., Ажикина, Т.Л., Колесник, Т.Б., Лебедев, Ю.Б., Свердлов, Е.Д. (1997) Структурные характеристики четырех длинных концевых повторов (LTR) эндогенных человеческих ретровирусов и особенности участков их интеграции. Биоорганическая Химия 23,434—440.

18. Lebedev, Y., Akopyants, N., Azhikina, Т., Shevchenko, Y., Potapov, V., Stecenko, D., Berg, D. and Sverdlov, E. (1996) Oligonucleotides containing 2-aminoadenine and 5-methylcytosine are more effective as primers for PCR amplification than their nonmodified counterparts. Genet Anal, 13, 15-21.

19. Azhikina, Т., Kostina, M., Skaptsova, N., Potapov, V., Berg, D. and Sverdlov, E. (1996) Factors affecting the priming efficiency of short contiguous oligonucleotide strings in the primer walking strategy of DNA sequencing. DNA Seq, 6,211-216.

20. Azhikina, Т., Veselovskaya, S., Myasnikov, V., Potapov, V., Ermolayeva, O. and Sverdlov, E. (1993) Strings of contiguous modified pentanucleotides with increased DNA-binding affinity can be used for DNA sequencing by primer walking. Proc Natl Acad Sci USA, 90,11460-11462.

21. Ажикина, Т.Л., Шевченко, Ю.О., Лебедев, Ю.Б., Веселовская, С.В., Мясников, В.А., Потапов, В.К., Свердлов, Е.Д.(1993) Олигонуклеотиды, образующие высокостабильные дуплексы, их использование в качестве праймеров при секвенировании и в полимеразной цепной реакции. Докл Акад Наук 330, 642-645.

22. Ажикина, Т.Л., Потапов, В.К., Веселовская, С.В., Мясников, В.А., Свердлов, Е.Д.(1993) Комбинации коротких олигонуклеотидов с повышенной прочностью образования дуплексов в качестве объединенных праймеров в секвенировании. Докл Акад Наук, 331,751753.

Работа выполнена при финансовой поддержке российской программы «Геном человека», программы Президиума РАН «Молекулярная и клеточная биология», программы «Ведущие научные школы РФ», Российского Фонда Фундаментальных Исследований, программы ШТАЗ, программы МНТЦ, гранта ННМ1.

Подписано в печать: 22.04.2009

Заказ № 1911 Тираж -100 экз. Печать трафаретная. Типография «11-й ФОРМАТ» ИНН 7726330900 115230, Москва, Варшавское ш., 36 (499) 788-78-56 www.autoieferat.ru

Содержание диссертации, доктора биологических наук, Ажикина, Татьяна Леодоровна

Список сокращений

1. Введение

2. Обзор литературы "Этапы развития сравнительных гибридизационных методов и их место в современных структурно-функциональных исследованиях геномов и транскриптомов"

2.1. Вычитающая гибридизация - принцип метода

2.2 Вычитающая гибридизация без применения ПЦР

2.3 Вычитающая гибридизация с использованием ПЦР

2.4 Representational Differential Analysis и современное искусство вычитания

2.4.1. RDA - проблемы и пути их решения

2.4.2. Применение RDA в геномных сравнениях

2.4.3. Применение RDA для сравнения кДНК

2.4.4. Метил-чувствительный репрезентативный дифференциальный анализ (MS-RDA)

2.4.5. Направления усовершенствования RDA

2.4.6. Разделение фрагментированных геномов по длине - метод упрощения геномов

2.5. In Gel Competitive Reassociation - 1GCR "

2.6. Эпоха ПЦР-супрессии

2.6.1. Вычитающая гибридизация кДНК (Suppressive Subtractive

Hybridization, SSH)

2.6.2. Вычитающая гибридизация геномных ДНК

2.6.3. Нормализация и истощение библиотек кДНК

2.6.4. Coincidence cloning 42 2.7 Заключение

3. Материалы и методы

3.1 Стандартные методики

3.2 Ткани, клеточные линии, штаммы, космиды

3.3 Компьютерный анализ

3.4 Методы, использованные в изучении геномного полиморфизма штаммов

М. tuberculosis

3.5 Методы, использованные в изучении геномного полиморфизма байкальских сиговых

3.6 Методы, используемые при изучении метилирования локуса

FXYD5-COX7A1 (Chr 19)

3.7 Методы, используемые для получения набора последовательностей М.tuberculosis, транскрибирующихся в легком мыши

3.8 Методы, используемые при изучении олигонуклеотидов с повышенным сродством к комплементарной матрице

4. Результаты и обсуждение

4.1 Вычитающая гибридизация близкородственных геномов

4.1.1. ПДРФ-вычитающая гибридизация

4.1.2. Полногеномное сравнение различных штаммов M.tuberculosis

4.1.3. Геномное сравнение близкородственных видов байкальских сиговых

4.2 Метод клонирования идентичных последовательностей 104 4.2.1.Метод клонирования идентичных последовательностей для анализа тканеспецифического метилирования протяженных геномных локусов 105 4.2.2 Rapid Identification of Genomic Splits

4.2.3. Распределение неметилированных сайтов в локусе FXYD5-COX7A1 хромосомы 19 в нормальной и опухолевой тканях легкого, а также клеточной линии А

4.2.4. Анализ бактериального транскриптома внутриклеточных патогенов in vivo

4.3. Использование олигонуклеотидов с повышенным сродством к комплементарной матрице как зондов в молекулярной биологии

4.3.1 Комбинации SBO в качестве объединенных праймеров для секвенирования

4.3.2 Использование модифициролванных олигонуклеотидов в ПЦР 150 4.3.3.Использование модифицированных олигонуклеотидов в RAPD

5. Выводы

Введение Диссертация по биологии, на тему "Гибридизационные подходы в широкомасштабных исследованиях геномов"

Структурно-функциональные и сравнительные исследования геномов по-прежнему остаются основой молекулярной биологии и генетики. Все методы таких исследований условно подразделяют на две большие группы: методы прямого секвенирования и методы несеквенирующего сравнительного анализа. Современное секвенирование включает серию высокотехнологичных масштабных методов, позволяющих определять в короткие сроки последовательности десятков и сотен миллионов нуклеотидов. Однако полностью решить проблемы полногеномного исследования только прямым секвенированием вряд ли возможно, поскольку в геномах (особенно эукариотических) имеются локусы, недоступные для клонирования, определения первичной структуры ДНК или однозначной реконструкции протяженных фрагментов из-за наличия большого числа гомопоследовательностей, GC-богатых участков и/или повторов. Так, например, в «окончательном» варианте генома человека, опубликованном International Human Genome Sequencing Consortium в 2004г., оставалось более чем 340 участков, для которых не была определена первичная структура. Кроме того, полногеномное секвенирование остается очень дорогим методом, и всестороннее изучение громадной геномной вариабельности посредством секвенирования с точки зрения материальных затрат в настоящее время и в обозримом будущем нереально.

Методы, относящиеся ко второй группе, основанные на использовании свойства ДНК образовывать устойчивые двухцепочечные структуры из комплементарных одноцепочечных молекул, получили название гибридизационных. Среди гибридизационных подходов в частности активно используются различные виды микроэрреев, позволяющие в значительной степени интенсифицировать исследования при снижении временных и стоимостных затрат. Несмотря на широкое распространение в мире и успешное применение для решения самых разнообразных задач геномики, микроэррейные технологии имеют серьезные недостатки: недостаточная специфичность гибридизации на твердой подложке, а также большое количество ложнопозитивных сигналов, возникающих при взаимодействии повторяющихся элементов генома, семейств генов и других неоднозначных участков, проблемы при анализе транскрибирумых на низком уровне кДНК и сложности с дискриминацией различных вариантов сплайсинга. Существенным ограничением метода является обязательность знания нуклеотидной последовательности геномастандарта, без чего невозможно сконструировать микроэррей, а в сравниваемых со стандартом исследуемых геномах невозможно детектировать последовательности, присутствующие в исследуемом геноме, но отсутствующие в стандарте.

Преимущества гибридизации в растворе перед гибридизацией на твердом носителе основаны на преимуществах кинетики второго порядка, а также возможности выделения продуктов гибридизации из смеси для последующего анализа или же проведения дополнительного раунда гибридизации, что существенно увеличивает эффективность процедуры. Методы дифференциального гибридизационного анализа геномов и продуктов их экспрессии можно классифицировать по конечному результату, который они позволяют получить, на (i) методы описательного анализа фрагментов различий сравниваемых объектов (геномов или отдельных участков геномов) и (и) методы физического выделения дифференциальных фрагментов.

К описательным методам относят методы анализа различий определенных геномных локусов, например, анализ полиморфизма длин рестрикционных фрагментов (RFLP) (Pearson, 1985) и методы полногеномного анализа (геномная дактилоскопия (DNA fingerprinting) (Tautz, 1990); ПЦР с произвольно выбранными праймерами (RAPD) (Welsh and McClelland, 1990), (Johnson et al., 1994); кросс-гибридизация (cross-hybridizing) (Gershon et al., 1989).

К группе методов, нацеленных на физическое выделение фрагментов ДНК, содержащих различия между геномами, можно отнести дифференциальный дисплей (для обзора cM.(Broude, 2002)) и методы, объединенные общим названием «вычитающая гибридизация». Методы этой группы дают возможность прямого получения библиотек различий сравниваемых геномов или продуктов их экспрессии, поэтому в результате их использования возможно быстрое получение структурной информации о различиях между объектами и ее использование для дальнейшего функционального анализа.

Таким образом, по-прежнему актуальными являются разработка и совершенствование гибридизационных методов анализа геномов, которые могли бы расширить возможности уже существующих методов, в частности, позволили бы с с высокой эффективностью идентифицировать дифференциальные последовательности геномных ДНК и характерные особенности сравниваемых транскриптомов.

2. ОБЗОР ЛИТЕРАТУРЫ

Этапы развития сравнительных гибридизационных методов и их место в современных структурно-функциональных исследованиях геномов и транскриптомов

В обзоре литературы автор ограничивается рассмотрением метода вычитающей гибридизации, его основных принципов, этапов развития, места в современной сравнительной геномике. Исчерпывающий обзор литературы по этим вопросам малореален из-за огромного и постоянно растущего объема публикаций, поэтому особое внимание будет уделено наиболее ярким модификациям и приложениям этого метода.

Заключение Диссертация по теме "Молекулярная биология", Ажикина, Татьяна Леодоровна

5. ВЫВОДЫ

1. Для проведения полногеномного сравнения близкородственных бактериальных штаммов разработан оптимизированный метод ПДРФ-вычитающей гибридизации. Эффективность метода продемонстрирована на примере сравнения геномов штаммов М. tuberculosis HN878 и CDG1551, вызывающих различные клинические формы заболевания туберкулезом. Идентифицировано и охарактеризовано 9 нуклеотидных последовательностей, отличающих геном штамма HN878 от генома штамма CDC1551. Проведено сравнение геномов четырёх российских клинических штаммов М. tuberculosis с геномом штамма H37R.v. Идентифицировано и охарактеризовано 12 нуклеотидных последовательностей, отличающих геномы российских штаммов от секвенированного генома штамма H37R.v.

2. Предложен способ генотипирования штаммов*М tuberculosis методом геномной ПЦРг 12 локусов (ID-типирование). Эффективность и надежность.метода показана на коллекции из 172 штаммов М. tuberculosis, циркулирующих в центральных регионах Российской» Федерации. Обнаружен новый-характеристический геномный локус, присутствующий только в геномах штаммов М. tuberculosis семейства W/Beijing. Концепция ГО-типирования. носит универсальный характер и может использоваться как стандартный подход при проведении эпидемиологических исследований и анализа популяций любых бактериальных патогенов.

3. Методом ПДРФ-вычитающей гибридизации впервые на полногеномном уровне исследованы различия близкородственных представителей байкальских сиговых рыб-озерного сига (С. lavaretus baicalensis Dybovsky) и омуля (С. autumnalis migratorius Georgi). Показано, что данным методом не обнаруживаются устойчивые межвидовые различия. Все найденные нуклеотидные последовательности соответствуют полиморфным некодирующим участкам геномов, варьирующим в результате однонуклеотидных замен и коротких делеций. Многие из них картируются вблизи генов иммунной системы и имеют участки, идентичные широко распространенным среди рыб Tel-подобным транспозонам, транскрипционная активность которых может влиять на экспрессию близлежащих генов. Отсутствие устойчивых различий между геномами этих сиговых свидетельствует об их высокой близости, возможно связанной с их недавней эволюционной дивергенцией.

4. Разработана концепция анализа паттернов метилирования протяженных областей геномов. Концепция предполагает возможность влияния на экспрессию генов метилирования протяженных участков генома, включающих эти гены, а не только метилирования их регуляторных участков. Усовершенствован метод клонирования последовательностей, идентичных в двух сравниваемых геномах или транскриптомах, на его основе разработан новый метод анализа распределения тканеспецифического метилирования на протяженных участках геномной ДНК. Предложен принципиально новый. методический подход к экспресс-картированию сайтов расщепления протяженных фрагментов генома (на примере картирования сайтов расщепления метилчувствительной эндонуклеазой рестрикции Hpall).

5. Впервые проведен подробный анализ распределения метилирования в локусе FXYD5— СОХ7А1 19-ой хромосомы человека длиной 1,02 млн. п.о. для различных образцов геномной ДНК (паренхимы и семиномы яичка, нормальной и опухолевой тканей легкого, клеточной линии А549). Показано, что различия между паттернами метилирования локуса FXYD5-СОХ7А1 в исследованных нормальных и опухолевых тканях минимальны. Показано, что для клеточной линии А549 характерно гиперметилирование протяженной, содержащей гены, области длиной 30 тыс. п.о., не обнаруженное в других исследованных тканях. Сравнительный анализ транскрипционной активности генов MAG и НАМР, содержащихся в данной области, в разных тканях продемонстрировал ее независимость от метилирования ДНК. Полученные данные ставят под вопрос универсальность принятой точки зрения о роли метилирования в регуляции генов.

6. Разработан метод получения кДНК, представляющей полный транскриптом бактериального патогена, из пораженной ткани организма хозяина. Применение метода позволяет получать новые данные о механизмах патогенеза инфекционного заболевания и изменении регуляции экспрессии геномов патогенов при инфекции организмов. Эффективность метода продемонстрирована на примере получения кДНК М. tuberculosis из легочной ткани инфицированных мышей. Проведен анализ последовательностей, транскрибирующихся в легочной ткани мыши на 9-ой неделе развития инфекции. Показано, что для исследованных генов наблюдается качественное и количественное соответствие паттерна экспрессии паттерну, наблюдаемому при хронической фазе туберкулеза.

7. Предложены новые способы применения модифицированных олигонуклеотидов, содержащих 5-метилцизозин и 2-аминоаденин, и обладающих повышенным сродством к комплементарной матрице, в качестве праймеров для секвенирования и ПЦР. Продемонстрирована их повышенная эффективность праймирования при сохранении специфичности гибридизации. Разработан метод определения первичной структуры с использованием набора коротких модифицированных олигонуклеотидов в качестве праймера. Разработан вариант молекулярной дактилоскопии, RAPD, с использованием таких олигонуклеотидов.

Библиография Диссертация по биологии, доктора биологических наук, Ажикина, Татьяна Леодоровна, Москва

1. Abe, М., Ohira, М., Kaneda, A., Yagi, Y., Yamamoto, S., Kitano, Y., Takato, Т.,

2. Nakagawara, A. and Ushijima, T. CpG island methylator phenotype is a strong determinant of poor prognosis in neuroblastomas. Cancer Res 2005, 65, 828-834.

3. Agarwal, N., Hardt, Т., Brero, A., Nowak, D., Rothbauer, U., Becker, A., Leonhardt, H. and Cardoso, M.C. MeCP2 interacts with HP1 and modulates its heterochromatin association during myogenic differentiation. Nucleic Acids Res 2007, 35, 5402-5408.

4. Ahmed, F.E. Molecular techniques for studying gene expression in carcinogenesis. J Environ Sci Health С Environ Carcinog Ecotoxicol Rev 2002, 20, 77-116.i.

5. Akopov, S.B., Ruda, Y.M., Batrak, Y.Y., Vetchinova, A.S., Chernov, I.P., Nikolaev, L.G.,

6. Bode, J. and Sverdlov, E.D. Identification, genome mapping, and CTCF binding of potential insulators within the FXYD5-COX7A1 locus of human chromosome 19ql3.12. Mamm Genome 2006, 17, 1042-1049.

7. Akopyants, N.S., Fradkov, A., Diatchenko, L., Hill, J.E., Siebert, P.D., Lukyanov, S.A.,

8. Sverdlov, E.D. and Berg, D.E. PCR-based subtractive hybridization and differences in gene content among strains of Helicobacter pylori. Proc Natl Acad Sci U S A 1998, 95, 13108-13113.

9. Akopyanz, N., Bukanov, N.O., Westblom, T.U., Kresovich, S. and Berg, D.E. DNA diversity among clinical isolates of Helicobacter pylori detected by PCR-based RAPD fingerprinting. Nucleic Acids Res 1992, 20, 5137-5142.

10. Allen, N.L., Hilton, A.C., Betts, R. and Penn, C.W. Use of representational differenceanalysis to identify Escherichia coli 0157-specific DNA sequences. FEMS Microbiol Lett 2001, 197, 195-201.

11. Altschul, S.F., Madden, T.L., Schaffer, A.A., Zhang, J., Zhang, Z., Miller, W. and Lipman, D.J. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Res 1997, 25, 3389-3402.

12. Andersson, Т., Unneberg, P., Nilsson, P., Odeberg, J., Quackenbush, J. and Lundeberg, J. Monitoring of representational difference analysis subtraction procedures by global microarrays. Biotechniques 2002, 32, 1348-1350, 1352, 1354-1346, 1358.

13. Andersson, Т., Borang, S., Unneberg, P., Wirta, V., Thelin, A., Lundeberg, J. and Odeberg, J. Shotgun sequencing and microarray analysis of RDA transcripts. Gene 2003, 310, 3947.

14. Antequera, F. Structure, function and evolution of CpG island promoters. Cell Mol Life Sci 2003, 60, 1647-1658.

15. Aslanidis, C. and de Jong, P J. Coincidence cloning of Alu PCR products. Proc Natl Acad Sci USA 1991, 88, 6765-6769.

16. Attema, J.L., Papathanasiou, P., Forsberg, E.G., Xu, J., Smale, S.T. andWeissman, I.L.

17. Epigenetic characterization of hematopoietic stem cell differentiation using miniChIP and bisulfite sequencing analysis. Proc Natl Acad Sci U S A 2007, 104, 12371-12376.

18. Azhikina, Т., Gainetdinov, I., Skvortsova, Y., Batrak, A., Dmitrieva, N. and Sverdlov, E.

19. Non-methylated Genomic Sites Coincidence Cloning (NGSCC): an approach to large scale analysis of hypomethylated CpG patterns at predetermined1 genomic loci. Mol-Genet Genomics 2004,271, 22-32.

20. Bailey, D.M., Carter, N.P., de Vos, D., Leversha, M.A., Perryman, M'.T. and-Ferguson-Smith,-M. A. Coincidence painting: a rapid method for cloning region specific DNA sequences. Nucleic Acids Res 1993, 21, 5117-5123.

21. Baldocchi, R.A., Tartaglia, K.E., Bryda, E.C. and Flaherty, L. Recovery of probes linked to the jcpk locus on mouse chromosome 10 by the use of an improved representational difference analysis technique. Genomics 1996, 33, 193-198.

22. Banaiee, N., Jacobs, W.R., Jr. and Ernst, J.D. Regulation of Mycobacterium tuberculosis whiB3 in the mouse lung and macrophages. Infect Immun 2006, 74, 6449-6457.

23. Bautz, E.K. and Reilly, E. Gene-specific messenger RNA: isolation by the deletion method. Science 1966,151,328-330.

24. Berger, S.L. The complex language of chromatin regulation during transcription. Nature 2007, 447, 407-412.

25. Bernardi, G. The isochore organization of the human genome. Annu Rev Genet 1989, 23, 637-661.

26. Bifani, P.J., Mathema, В., Kurepina, N.E. and Kreiswirth, B.N. Global dissemination of the

27. Mycobacterium tuberculosis W-Beijing family strains. Trends Microbiol 2002, 10, 4552.

28. Bird, A. Does DNA methylation control transposition of selfish elements in the germline? Trends Genet 1997, 13,469-472.

29. Bishop, C.E., Guellaen, G., Geldwerth, D., Voss, R., Fellous, M. and Weissenbach, J. Single-copy DNA sequences specific for the human Y chromosome. Nature 1983,303, 831832.

30. Bjourson, A.J., Stone, C.E. and Cooper, J.E. Combined subtraction hybridization andpolymerase chain reaction amplification procedure for isolation of strain-specific Rhizobium DNA sequences. Appl Environ Microbiol 1992, 58,2296-2301.

31. Blasi, F., Ciarrocchi, A., Luddi, A., Strazza, M., Riccio, M., Santi, S., Arcone, R.,

32. Pietropaolo, C., D'Angelo, R., Costantino-Ceccarini, E. et al. Stage-specific gene expression in early differentiating oligodendrocytes. Glia 2002, 39, 114-123.

33. Bleicher, F., Couble, M.L., Buchaille, R., Farges, J.C. and Magloire, H. New genes involved in odontoblast differentiation. Adv Dent Res 2001, 15, 30-33.

34. Bogdanova, E.A., Shagin, D.A. and Lukyanov, S.A. Normalization of full-length enriched cDNA. Mol Biosyst 2008, 4, 205-212.

35. Bogdanova, E.A., Shagina, I.A., Mudrik, E., Ivanov, I., Amon, P., Yagner, L.L., Lukyanov, S.A. and Shagin, D.A. DSN depletion is a simple method to remove selected transcripts from cDNA populations. Mol Biotechnol 2009, 41, 247-253.

36. Bogush, M.L., Yelikodvorskaya, t.v., Lebedev, Y.B., Nikolaev, L.G., Lukyanov, S.A.,

37. Brennan, M.J., Delogu, G., Chen, Y., Bardarov, S., Kriakov, J., Alavi, M. and Jacobs, W.R., Jr. Evidence that mycobacterial PEPGRS proteins are cell surface constituents that influence interactions with other cells. Infect Immun 2001, 69, 7326-7333.

38. Britten, R.J. and Davidson, E.H. (1985) In Hames, B. and Higgins, S. (eds.), Nucleic Acids Hybridization. IRL Press, Oxford-Washington, pp. 3-14.

39. Brosch, R., Gordon, S.V., Pym, A., Eiglmeier, K., Gamier, T. and Cole, S.T. Comparative genomics of the mycobacteria. Int J Med Microbiol 2000, 290, 143-152.

40. Broude, N.E. Differential display in the time of microarrays. Expert Rev Mol Diagn 2002,2, 209-216.

41. Brown, N.F. and Beacham, I.R. Cloning and analysis of genomic differences unique to

42. Burkholderia pseudomallei by comparison with B. thailandensis. J Med Microbiol 2000,49, 993-1001.

43. Brown, N.F., Lew, A.E. and Beacham, I.R. Identification of new transposable genetic elements in Burkholderia pseudomallei using subtractive hybridisation. FEMS Microbiol Lett 2000, 183, 73-79.

44. Bulanenkova, S., Snezhkov, E., Nikolaev, L. and Sverdlov, E. Identification and mapping of open chromatin regions within a 140 kb polygenic locus of human chromosome 19 using E. coli Dam methylase. Genetica 2007, 130, 83-92.

45. Buzdin, A., Kovalskaya-Alexandrova, E., Gogvadze, E. and Sverdlov, E. GREM, a technique for genome-wide isolation and quantitative analysis of promoter active repeats. Nucleic Acids Res 2006, 34, e67.

46. Buzdin, A. and Lukyanov, S. (2007) Nucleic Acids Hybridization. Springer.

47. Chalaya, Т., Gogvadze, E., Buzdin, A., Kovalskaya, E. and Sverdlov, E.D. Improvingspecificity of DNA hybridization-based methods. Nucleic Acids Res 2004, 32, el30.

48. Chang, Y., Cesarman, E., Pessin, M.S., Lee, F., Culpepper, J., Knowles, D.M. and Moore, P.S. Identification of herpesvirus-like DNA sequences in AIDS-associated Kaposi's sarcoma. Science 1994, 266,1865-1869.

49. Cheong, C., Tinoco, I., Jr. and Chollet, A. Thermodynamic studies of base pairing involving 2,6-diaminopurine. Nucleic Acids Res 1988, 16, 5115-5122.

50. Chernov, I.P., Akopov, S.B., Nikolaev, L.G. and Sverdlov, E.D. Identification and mapping of DNA binding proteins target sequences in long genomic regions by two-dimensional EMS A. Biotechniques 2006, 41, 91-96.

51. Chernov, I.P., Timchenko, K.A., Akopov, S.B., Nikolaev, L.G. and Sverdlov, E.D. Identification of tissue-specific DNA-protein binding sites by means of two-dimensional electrophoretic mobility shift assay display. Anal Biochem 2007, 364, 6066.

52. Choi, J.Y., Sifri, C.D., Goumnerov, B.C., Rahme, L.G., Ausubel, F.M. and Calderwood, S.B. Identification of virulence genes in a pathogenic strain of Pseudomonas aeruginosa by representational difference analysis. J Bacteriol 2002, 184, 952-961.

53. Chong, S. and Whitelaw, E. Epigenetic germline inheritance. Curr Opin Genet Dev 2004, 14, 692-696.

54. Choudhary, R.K., Mukhopadhyay, S., Chakhaiyar, P., Sharma, N., Murthy, K.J., Katoch,

55. V.M. and Hasnain, S.E. PPE antigen Rv2430c of Mycobacterium tuberculosis induces a strong B-cell response. Infect Immun 2003, 71, 6338-6343.

56. Chu, W.M., Ballard, R., Carpick, B.W., Williams, B.R. and Schmid, C.W. Potential Alu function: regulation of the activity of double-stranded RNA-activated kinase PKR. Mol Cell Biol 1998, 18,58-68.

57. Clark, S.J. Action at a distance: epigenetic silencing of large chromosomal regions in carcinogenesis. Hum Mol Genet 2007,16 Spec No 1, R88-95.

58. Cole, S.T., Brosch, R., Parkhill, J., Gamier, Т., Churcher, C., Harris, D., Gordon, S.V., Eiglmeier, K., Gas, S., Barry, C.E., 3rd et al. Deciphering the biology of Mycobacterium tuberculosis from the complete genome sequence. Nature 1998, 393, 537-544.

59. Collier, G., Walder, K., De Silva, A., Tenne-Brown, J., Sanigorski, A., Segal, D., Kantham, L. and Augert, G. New approaches to gene discovery with animal models of obesity and diabetes. AnnN Y Acad Sci 2002, 967,403-413.

60. Costello, J.F., Plass, C. and Cavenee, W.K. Restriction landmark genome scanning. Methods Mol Biol 2002a, 200, 53-70.

61. Costello, J.F., Smiraglia, D.J. and Plass, C. Restriction landmark genome scanning. Methods 2002b, 27,144-149.

62. Cox, H.S., Kubica, Т., Doshetov, D., Kebede, Y., Rusch-Gerdess, S. and Niemann, S. The Beijing genotype and drug resistant tuberculosis in the Aral Sea region of Central Asia. Respir Res 2005, 6, 134.

63. Creelan, J.L., Bjourson, A.J., Meehan, B.M. and McCullough, S J. Characterisation of strain-specific sequences from an abortifacient strain of ovine Chlamydia psittaci using subtraction hybridisation. FEMS Microbiol Lett 1999, 171, 17-25.

64. Cross, S.H., Charlton, J.A., Nan, X. and Bird, A.P. Purification of CpG islands using a methylated DNA binding column. Nat Genet 1994, 6,236-244.

65. Dai, E., Tong, Z., Wang, X., Li, M., Cui, В., Dai, R., Zhou, D., Pei, D., Song, Y., Zhang, J. et al. Identification of different regions among strains of Yersinia pestis by suppression subtractive hybridization. Res Microbiol 2005, 156, 785-789.

66. Delcenserie, V., Lessard, M.H., LaPointe, G. and Roy, D. Genome comparison of Bifidobacterium longum strains NCC2705 and CRC-002 using suppression subtractive hybridization. FEMS Microbiol Lett 2008, 280, 50-56.

67. Devon, R.S. and Brookes, A.J. Coincidence cloning. Taking the coincidences out of genome analysis. Mol Biotechnol 1996, 5, 243-252.

68. Diatchenko, L., Lukyanov, S., Lau, Y.F. and Siebert, P.D. Suppression subtractivehybridization: a versatile method for identifying differentially expressed genes. Methods Enzymol 1999, 303, 349-380.

69. Dijkstra, J.M., Kiryu, I., Yoshiura, Y., Kumanovics, A., Kohara, M., Hayashi, N. and Ototake, M. Polymorphism of two very similar MHC class Ib loci in rainbow trout (Oncorhynchus mykiss). Immunogenetics 2006, 58; 152-161.

70. Dordet-Frisoni, E., Dorchies, G., De Araujo, G., Talon; R. and Leroy, S. Genomic diversity in Staphylococcus xylosus. Appl Environ Microbiol 2007, 73, 7199-7209.

71. Dover, G. Molecular drive: a cohesive mode of species evolution. Nature 1982,299, 111-117.

72. Eckhardt, F., Lewin, J., Gortese, R., Rakyan, V.K., Attwood, J., Burger, M., Burton, J., Cox, T.V., Davies, R., Down; T.A. et al. DNA methylation profiling of human chromosomes 6, 20 and 22. Nat Genet 2006, 38, 1378-1385.

73. Endoh, D., Cho, K.O., Tsukamoto, K., Morimura, Т., Kon, Y. and Hayashi, M. Application of representational difference analysis to genomic fragments of Marek's disease virus. J Clin Microbiol 2000, 38, 4310-4314.

74. Ermolaeva, О ;D. and Sverdlov, E.D: Subtractive hybridization, a technique for extraction of DNA sequences distinguishing two closely related genomes: critical analysis. Genet Anal 1996, 13,49-58.

75. Esteller, M. Epigenetic lesions causing genetic lesions in human cancer: promoter hypermethylation of DNA repair genes. Eur J Cancer 2000, 36, 2294-2300.

76. Feinberg, A.P. and Tycko, B. The history of cancer epigenetics. Nat Rev Cancer 2004,4,143153.

77. Fleischmann, R.D., Alland, D., Eisen, J.A., Carpenter, L., White, O., Peterson, J., DeBoy, R., Dodson, R., Gwinn, M., Haft, D. et al. Whole-genome comparison of Mycobacterium tuberculosis clinical and laboratory strains. J Bacterid 2002, 184, 5479-5490.

78. Frohme, M., Scharm, В., Delius, H., Knecht, R. and Hoheisel, J.D. Use of representationaldifference analysis and cDNA arrays for transcriptional profiling of tumor tissue. Ann NY Acad Sci 2000, 910, 85-104; discussion 104-105.

79. Furuta, J., Nobeyama, Y., Umebayashi, Y., Otsuka, F., Kikuchi, K. and Ushijima, T.

80. Silencing of Peroxiredoxin 2 and aberrant methylation of 33 CpG islands in putative promoter regions in human malignant melanomas. Cancer Res 2006, 66, 6080-6086.

81. Gebicke-Haerter, P. Expression profiling methods used in drug abuse research. Addict Biol 2005,10, 37-46.

82. Geng, M., Wallrapp, С., Muller-Pillasch, F., Frohme, M., Hoheisel, J.D. and Gress, T.M. Isolation of differentially expressed genes by combining representational difference analysis (RDA) and cDNA library arrays. Biotechniques 1998, 25, 434-438.

83. Gershon, P.D., Ansell, D.M. and Black, D.N. A comparison of the genome organization of capripoxvirus with that of the orthopoxviruses. J Virol 1989, 63, 4703-4708.

84. Gordon, S.V., Brosch, R., Billault, A., Gamier, Т., Eiglmeier, K. and Cole, S.T. Identification of variable regions in the genomes of tubercle bacilli using bacterial artificial chromosome arrays. Mol Microbiol 1999a, 32, 643-655.

85. Gordon, S.V., Heym, В., Parkhill, J., Barrell, B. and Cole, S:T. New insertion sequences and a novel repeated sequence in the genome of Mycobacterium tuberculosis H37Rv. Microbiology 1999b, 145 ( Pt 4), 881-892.

86. Gotoh, K. and Oishi, M. Screening of gene-associated polymorphisms by use of in-gelcompetitive reassociation and EST (cDNA) array hybridization. Genome Res 2003, 13,492-495.

87. Gotoh, K. and Oishi, M. Isolation of polymorphic mRNAs (cDNAs) by in-gel competitive reassociation. Genomics 2004, 84, 435-440.

88. Gotoh, K., Inoue, K., Ogura, A. and Oishi, M. Intra-strain polymorphisms are detected but no genomic alteration is found in cloned mice. Biochem Biophys Res Commun 2006, 348, 166-169.

89. Graveel, C.R., Jatkoe, Т., Madore, S.J., Holt, A.L. and Farnham, P.J. Expression profiling and identification of novel genes in hepatocellular carcinomas. Oncogene 2001, 20, 27042712.

90. Grubinska, В., Laszkiewicz, I., Royland, J., Wiggins, R.C. and Konat, G.W. Differentiation-specific demethylation of myelin associated glycoprotein gene in cultured oligodendrocytes. JNeurosci Res 1994, 39, 233-242.

91. Guo, L.H., Shi, J.N., Zhang, Y., Liu, X.D., Duan, J. and Wei, S. Identification of genetic differences between two clinical isolates of Streptococcus mutans by suppression subtractive hybridization. Oral Microbiol Immunol 2006, 21, 372-380.

92. Gvozdevskii, N.A., Azhikina, T.L. and Sverdlov, E.D. Deletion-insertion differencesbetween the genomes of Mycobacterium tuberculosis highly virulent strain HN878 and less virulent strain CDC1551. Zh Mikrobiol Epidemiol Immunobiol 2006, 10-15.

93. Hillis, D.M. and Dixon, M.T. Ribosomal DNA: molecular evolution and phylogenetic inference. The Quarterly Review of Biology 1991, 66, 411-453.

94. Hillmann, A., Dunne, E. and Kenny, D. cDNA amplification by SMART-PCR andsuppression subtractive hybridization (SSH)-PCR. Methods Mol Biol 2009, 496,223243.

95. Hirsh, A.E., Tsolaki, A.G., DeRiemer, K., Feldman, M.W. and Small, P.M. Stable association between strains of Mycobacterium tuberculosis and their human host populations. Proc Natl Acad Sci U S A 2004, 101, 4871-4876.

96. Но, T.B., Robertson, B.D., Taylor, G.M., Shaw, R.J. and Young, D.B. Comparison of

97. Mycobacterium tuberculosis genomes reveals frequent deletions in a 20 kb variable region in clinical isolates. Yeast 2000, 17, 272-282.

98. Hollestelle, A. and Schutte, M. Representational difference analysis as a tool in the search for new tumor suppressor genes. Methods Mol Med 2005, 103, 143-159.

99. Howard, S.T., Byrd, T.F. and Lyons, C.R. A polymorphic region in Mycobacterium abscessus contains a novel insertion sequence element. Microbiology 2002, 148, 2987-2996.

100. Hozier, J., Graham, R., Westfall, Т., Siebert, P. and Davis, L. Preparative in situ hybridization: selection of chromosome region-specific libraries on mitotic chromosomes. Genomics 1994, 19,441-447.

101. Huang, X., Li, Y., Niu, Q. and Zhang, K. Suppression Subtractive Hybridization (SSH) and its modifications in microbiological research. Appl Microbiol Biotechnol 2007, 76, 753-760.

102. Hughes, M.S., Beck, L.A., Skuce, R.A. and Neill, S.D. Development of mycobacterial species-specific DNA probes by subtraction hybridization. FEMS Microbiol Lett 1997,156,31-36.

103. Jenkin, G.A., Stinear, T.P., Johnson, P.D. and Davies, J.K. Subtractive hybridization reveals a type I polyketide synthase locus specific to Mycobacterium ulcerans. J Bacteriol 2003, 185,6870-6882.

104. Ji, W., Wright, M.B., Cai, L., Flament, A. and Lindpaintner, K. Efficacy of SSH PCR in isolating differentially expressed genes. BMC Genomics 2002, 3, 12.

105. Johnson, S.L., Midson, C.N., Ballinger, E.W. and Postlethwait, J.H. Identification of RAPD primers that reveal extensive polymorphisms between laboratory strains of zebrafish. Genomics 1994, 19, 152-156.

106. Kanduma, E., McHugh, T.D. and Gillespie, S.H. Molecular methods for Mycobacterium tuberculosis strain typing: a users guide. J Appl Microbiol 2003, 94, 781-791.

107. Kaneda, A., Kaminishi, M., Nakanishi, Y., Sugimura, T. and Ushijima, T. Reducedexpression of the insulin-induced protein 1 and p41 Arp2/3 complex genes in human gastric cancers. Int J Cancer 2002, 100, 57-62.

108. Kato-Maeda, M., Rhee, J.T., Gingeras, T.R., Salamon, H., Drenkow, J., Smittipat, N. and Small, P.M. Comparing genomes within the species Mycobacterium tuberculosis. Genome Res 2001, 11, 547-554.

109. Kibel, A.S., Schutte, M., Kern; S.E., Isaacs, W.B. and Bova, G.S. Identification of 12p as a region of frequent deletion in advanced prostate cancer. Cancer Res 1998, 58, 56525655.

110. Kieleczawa, J., Dunn, J.J. and Studier, F.W. DNA sequencing by primer walking with strings of contiguous hexamers. Science 1992,258,1787-1791.

111. Kim, S., Zeller, K., Dang, C.V., Sandgren, E.P. and Lee, L.A. A strategy to identifydifferentially expressed genes using representational difference analysis and cDNA arrays. Anal Biochem 2001, 288, 141-148.

112. Kohne, D.E., Levison, S.A. and Byers, M.J. Room temperature method for increasing the rate of DNA reassociation by many thousandfold: the phenol emulsion reassociation technique. Biochemistry 1977, 16, 5329-5341.

113. Krasnov, A., Koskinen, H., Afanasyev, S. and Molsa, H. Transcribed Tel-like transposons in salmonid fish. BMC Genomics 2005, 6, 107.

114. Kubica, Т., Agzamova, R., Wright, A., Aziz, M.A., Rakishev, G., Bismilda, V., Richter, E., Rusch-Gerdes, S. and Niemann, S. The Beijing genotype is a major cause of drug-resistant tuberculosis in Kazakhstan. Int J Tuberc Lung Dis 2005, 9, 646-653.

115. Kunkel, L.M., Monaco, A.P., Middlesworth, W., Ochs, H.D. and Latt, S.A. Specific cloning of DNA fragments absent from the DNA of a male patient with an X chromosome deletion. Proc Natl Acad Sci U S A 1985, 82,4778-4782.

116. Rodgers, L., McCombie, R. et al. PTEN, a putative protein tyrosine phosphatase gene mutated in human brain, breast, and prostate cancer. Science 1997, 275, 1943-1947.1., M.S., Monahan, I.M., Waddell, S.J., Mangan, J.A., Martin, S.L., Everett, M.J. and

117. Mahairas, G.G., Sabo, P.J., Hickey, M.J., Singh, D.C. and Stover, C.K. Molecular analysis of genetic differences between Mycobacterium bovis BCG and virulent M. bovis. J Bacteriol 1996,178,1274-1282.

118. Manca, C., Tsenova, L., Barry, C.E., 3rd, Bergtold, A., Freeman, S., Haslett, P.A., Musser,

119. J.M., Freedman, V.H. and Kaplan, G. Mycobacterium tuberculosis CDC1551 induces a more vigorous host response in vivo and in vitro, but is not more virulent than other clinical isolates. J Immunol 1999, 162, 6740-6746.

120. Matz, M., Usman, N., Shagin, D., Bogdanova, E. and Lukyanov, S. Ordered differential display: a simple method for systematic comparison of gene expression profiles. Nucleic Acids Res 1997, 25, 2541-2542.

121. Matz, M.V. and Meleshkevitch, E.A. Ordered differential display. Methods Mol Biol 2006, 317, 59-74.

122. Milner, J.J., Cecchini, E. and Dominy, P.J. A kinetic model for subtractive hybridization. Nucleic Acids Res 1995,23, 176-187.

123. Miyamoto, K., Asada, K., Fukutomi, Т., Okochi, E., Yagi, Y., Hasegawa, Т., Asahara, Т.,

124. Sugimura, T. and Ushijima, T. Methylation-associated silencing of heparan sulfate Dglucosaminyl 3-0-sulfotransferase-2 (3-OST-2) in human breast, colon, lung and pancreatic cancers. Oncogene 2003, 22, 274-280.

125. Miyamoto, K., Fukutomi, Т., Akashi-Tanaka, S., Hasegawa, Т., Asahara, Т., Sugimura, T. and Ushijima, T. Identification of 20 genes aberrantly methylated in human breast cancers. Int J Cancer 2005, 116,407-414.

126. Mizuguchi, R., Inoue, S., Kiyama, R. and Oishi, M. Construction of libraries for methylation sites by in-gel competitive reassociation (IGCR). DNA Res 1995, 2, 219-223.

127. Monastyrskaya, G., Fushan, A., Abaev, I., Filyukova, O., Kostina, M., Pecherskih, E. and

128. Sverdlov, E. Genome-wide comparison reveals great inter- and intraspecies variability in B. pseudomallei and B. mallei pathogens. Res Microbiol 2004, 155, 781-793.

129. Nekrutenko, A. and Baker, R.J. Subgenome-specific markers in allopolyploid cotton

130. Gossypium hirsutum: implications for evolutionary analysis of polyploids. Gene 2003, 306, 99-103.

131. Nesbo, C.L., Nelson, K.E. and Doolittle, W.F. Suppressive subtractive hybridization detects extensive genomic diversity in Thermotoga maritima. J Bacteriol 2002,184,44754488.

132. Novak, P., Jensen, Т., Oshiro, M.M., Wozniak, R.J., Nouzova, M., Watts, G.S., Klimecki,

133. W.T., Kim, C. and Futscher, B.W. Epigenetic inactivation of the HOXA gene cluster in breast cancer. Cancer Res 2006, 66, 10664-10670.

134. Odeberg, J., Wood, Т., Blucher, A., Rafter, J., Norstedt, G. and Lundeberg, J. A cDNA RDA protocol using solid-phase technology suited for analysis in small tissue samples. Biomol Eng 2000,17,1-9.

135. Ohki, R., Oishi, M. and Kiyama, R. A whole-genome analysis of allelic changes in renal cell carcinoma by in-gel competitive reassociation. Mol Carcinog 1998, 22, 158-166.

136. Olek, A., Oswald, J. and Walter, J. A modified and improved method for bisulphite based cytosine methylation analysis. Nucleic Acids Res 1996, 24, 5064-5066.

137. Ong, C., Ooi, C.H., Wang, D., Chong, H., Ng, K.C., Rodrigues, F., Lee, M.A. and Tan, P. Patterns of large-scale genomic variation in virulent and avirulent Burkholderia species. Genome Res 2004, 14, 2295-2307.

138. Orlando, V. Mapping chromosomal proteins in vivo by formaldehyde-crosslinked-chromatin immunoprecipitation. Trends Biochem Sci 2000, 25; 99-104.

139. Panaud, O., Vitte, C., Hivert, J., Muzlak, S., Talag, J., Brar, D. and Sarr, A. Characterization of transposable elements in the genome of rice (Oiyza sativa L.) using Representational Difference Analysis (RDA). Mol Genet Genomics 2002, 268, 113121.

140. Pastorian, K., Hawel, L., 3rd and Byus, C.V. Optimization of cDNA representational.difference analysis for the identification of differentially expressed mRNAs. Anal Biochem 2000; 283, 89-98.

141. Pearson, P.L. Restriction fragment-length polymorphisms (RFLP's) and their use in mapping the human genome. Prog Clin Biol Res 1985,177, 23-36.

142. Politov, D.V., Bickham, J., Patton, J.S.Molecular phylogeography of Palearctic and Nearctic ciscoes. Annales Zoologici Fennici. 2004, 41, 13-24.

143. Politov, D.V., Gordon; N.Yu., Afanasiev, K.A. Altukhov, Yu.P. & Bickham, J.W.1.entification of palearctic coregonid fish species using mtDNA and allozyme genetic markers. Journal of Fish Biology 2000, 57(Supplement A), 51-71.

144. Pomati, F. and Neilan, B.A. PCR-based positive hybridization to detect genomic diversity associated with bacterial secondary metabolism. Nucleic Acids Res 2004, 32, e7.

145. Poulet, S. and Cole, S.T. Repeated DNA sequences in mycobacteria. Arch Microbiol 1995, 163, 79-86.

146. Rachman, H., Strong, M., Schaible, U., Schuchhardt, J., Hagens, K., Mollenkopf, H.,

147. Eisenberg, D. and Kaufmann, S.H. Mycobacterium tuberculosis gene expression profiling within the context of protein networks. Microbes Infect 2006, 8, 747-757.

148. Rauch, T.A., Zhong, X., Wu, X., Wang, M., Kernstine, K.H., Wang, Z., Riggs, A.D. and Pfeifer, G.P. High-resolution mapping of DNA hypermethylation and hypomethylation in lung cancer. Proc Natl Acad Sci USA 2008, 105, 252-257.

149. Raynaud, C., Guilhot, C., Rauzier, J., Bordat, Y., Pelicic, V., Manganelli, R;, Smith, I., Gicquel, B. and Jackson, M. Phospholipases С are involved in the virulence of Mycobacterium tuberculosis. Mol Microbiol 2002,45, 203-217.

150. Rebrikov, D., Desai, S., Kogan, Y.N., Thornton, A.M. and Diatchenko, L. Subtractivecloning: new genes for studying inflammatory disorders. Ann Periodontol 2002, 7, 1728.

151. Rebrikov, D.Y. and Kogan la, N. Use of suppressor subtraction hybridization for finding strain-specific sequences in bacterial genomes. Genetika 2003, 39,1317-1321.

152. Rebrikov, D.V., Desai, S.M., Siebert, P.D. and Lukyanov, S.A. Suppression subtractive hybridization. Methods Mol Biol 2004,258, 107-134.

153. Reed, M.B., Domenech, P., Manca, C., Su, H., Barczak, A.K., Kreiswirth, B.N., Kaplan, G.and Barry, C.E., 3rd. A glycolipid of hypervirulent tuberculosis strains that inhibits the innate immune response. Nature 2004, 431, 84-87.

154. Robertsen, B. The interferon system of teleost fish. Fish Shellfish Immunol 2006, 20, 172191.

155. Robertson, B.D. and Meyer, T.F. Genetic variation in pathogenic bacteria. Trends Genet 1992, 8, 422-427.

156. Rosenberg, M., Przybylska, M. and Straus, D. "RFLP subtraction": a method for making libraries of polymorphic markers. Proc Natl Acad Sci U S A 1994, 91, 6113-6117.

157. Rubin, C.M., Kimura, R.H. and Schmid, C.W. Selective stimulation of translational expression by Alu RNA. Nucleic Acids Res 2002, 30, 3253-3261.

158. Safi, H., Barnes, P.F., Lakey, D.L., Shams, H., Samten, В., Vankayalapati, R. and Howard, S.T. IS6110 functions as a mobile, monocyte-activated promoter in Mycobacterium tuberculosis. Mol Microbiol 2004, 52, 999-1012.

159. Sambrook, J., Fritsch, E.F. and Maniatis, T. (1989) Molecular cloning: a laboratory manual (2nd edition). Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N. Y.

160. Sampson, S.L., Richardson, M., Van Helden, P.D. and Warren, R.M'. IS6110-mediated deletion polymorphism in isogenic strains of Mycobacterium tuberculosis. J Clin Microbiol 2004,42, 895-898.

161. Sasaki, H., Nomura, S., Akiyama, N., Takahashi, A., Sugimura, Т., Oishi, M. and Terada, M. Highly efficient method for obtaining a subtracted genomic DNA library by the modified in-gel competitive reassociation method. Cancer Res 1994, 54, 5821-5823.

162. Shagin, D.A., Lukyanov, K.A., Vagner, L.L. and Matz, M.V. Regulation of average length of complex PCR product. Nucleic Acids Res 1999,27, e23.

163. Shagin, D.A., Rebrikov, D.V., Kozhemyako, V.B., Altshuler, I.M., Shcheglov, A.S.,

164. Zhulidov, P.A., Bogdanova, E.A., Staroverov, D.B., Rasskazov, V.A. and Lukyanov, S. A novel method for SNP detection using a new duplex-specific nuclease from crab hepatopancreas. Genome Res 2002, 12, 1935-1942.

165. Shields, J.M., Der, C.J. and Powers, S. Identification of Ras-regulated genes byrepresentational difference analysis. Methods Enzymol 2001, 332,221-232.

166. Shiloh, Y., Rose, E., Colletti-Feener, C., Korf, В., Kunkel, L.M. and Latt, S.A. Rapid cloning of multiple amplified nucleotide sequences from human neuroblastoma cell lines by phenol emulsion competitive DNA reassociation. Gene 1987, 51, 53-59.

167. Siebert, P.D., Chenchik, A., Kellogg, D.E., Lukyanov, K.A. and Lukyanov, S.A. An improved PCR method for walking in uncloned genomic DNA. Nucleic Acids Res 1995, 23, 1087-1088.

168. Slotkin, R.K. and Martienssen, R. Transposable elements and the epigenetic regulation of the genome. Nat Rev Genet 2007, 8, 272-285.

169. Smith, T.J., Wilson, L., Kenwrick, S.J., Forrest, S.M., Speer, A., Coutelle, C. and Davies, K.E. Isolation of a conserved sequence deleted in Duchenne muscular dystrophy patients. Nucleic Acids Res 1987, 15, 2167-2174.

170. Snell, T.W., Brogdon, S.E. and Morgan, M.B. Gene expression profiling in ecotoxicology. Ecotoxicology 2003,12,475-483.

171. Sohaskey, C.D. Nitrate enhances the survival of Mycobacterium tuberculosis during inhibition of respiration. J Bacterid 2008, 190, 2981-2986.

172. Sternberg, M.B. and Gepstein, S. Subtractive hybridization techniques to study cellular senescence. Methods Mol Biol 2007, 371, 289-305.

173. Stevenson, D.S. and Jarvis, P. Chromatin silencing: RNA in the driving seat. Curr Biol 2003, 13, R13-15.

174. Straus, D. and Ausubel, F.M. Genomic subtraction for cloning DNA corresponding to deletion mutations. Proc Natl Acad Sci U S A 1990, 87, 1889-1893.

175. Sturzl, M. and Roth, W.K. PCR-synthesized single-stranded DNA: a useful tool for 'hyb' and 'HAP' standardization for construction of subtraction libraries. Trends Genet 1990, 6, 106.

176. Sukhanova, L.V., Smirnov, V.V., Kirilchik, S.V., Shimizu I. Grouping of Baikal omul

177. Coregonus autumnalis migratorius Georgi within the C. lavaretus complex confirmed by using a nuclear DNA marker. Annales Zoologici Fennici. 2004, 41, 41-49.

178. Sukhanova, L.V., Smirnov, V.V., Smirnova-Zalumi, N.S., Kirilchik, S.V., Griffiths, D. &

179. Suzuki, M.M. and Bird, A. DNA methylation landscapes: provocative insights from epigenomics. Nat Rev Genet 2008, 9, 465-476.

180. Tabor, S. and Richardson, C.C. DNA sequence analysis with a modified bacteriophage T7 DNA polymerase. Proc Natl Acad Sci U S A 1987, 84, 4767-4771.

181. Talarico, S., Durmaz, R. and Yang, Z. Insertion- and deletion-associated genetic diversity of Mycobacterium tuberculosis phospholipase C-encoding genes among 106 clinical isolates from Turkey. J Clin Microbiol 2005,43, 533-538.

182. Tautz, D. Genomic finger printing goes simple. Bioessays 1990, 12,44-46.

183. Toder, R., Xia; Y. and Bausch, E. Interspecies comparative genome hybridization and interspecies representational difference analysis reveal gross DNA differences between humans and great apes. Chromosome Res 1998, 6,487-494.

184. Toder, R., Grutzner, F., Haaf, T. and Bausch, E. Species-specific evolution of repeated DNA sequences in great apes. Chromosome Res 2001, 9, 431-435.

185. Trempat, P., Villalva, C., Xerri, L., Armstrong, F., Duplantier, M.M., Delsol, G. and Brousset, P. Gene expression profiling in anaplastic large cell lymphoma and Hodgkin's disease. Leuk Lymphoma 2004, 45, 2001-2006.

186. Ueda, S., Washio, K. and Kurosaki, K. Human-specific sequences: isolation of species-specific DNA regions by genome subtraction. Genomics 1990, 8, 7-12.

187. Ushijima, Т., Morimura, K., Hosoya, Y., Okonogi, H., Tatematsu, M., Sugimura, T. and

188. Nagao, M." Establishment of methylation-sensitive-representational difference analysis and isolation of hypo- and hypermethylated genomic fragments in mouse liver tumors. Proc Natl Acad Sci U S A 1997, 94, 2284-2289.

189. Ushijima, Т. and Yamashita, S. Methylation-sensitive representational difference analysis (MS-RDA). Methods Mol Biol 2009, 507, 117-130.

190. Valway, S.E., Sanchez, M.P., Shinnick, T.F., Orme, I., Agerton, Т., Hoy, D., Jones, J.S.,

191. Westmoreland, H. and Onorato, I.M. An outbreak involving extensive transmission of a virulent strain of Mycobacterium tuberculosis. N Engl J Med 1998, 338, 633-639.

192. Velculescu, V.E., Zhang, L., Vogelstein, B. and Kinzler, K.W. Serial analysis of gene expression. Science 1995, 270, 484-487.

193. Viana-Niero, C., de Haas, P.E., van Soolingen, D. and Leao, S.C. Analysis of geneticpolymorphisms affecting the four phospholipase С (pic) genes in Mycobacterium tuberculosis complex clinical isolates. Microbiology 2004, 150, 967-978.

194. Waddell, S.J., Chung, G.A., Gibson, K.J., Everett, M.J., Minnikin, D.E., Besra, G.S. and

195. Butcher, P.D. Inactivation of polyketide synthase and related genes results in the loss of complex lipids in Mycobacterium tuberculosis H37Rv. Lett Appl Microbiol 2005, 40, 201-206.

196. Waddell, S.J. and Butcher, P.D. Microarray analysis of whole genome expression of intracellular Mycobacterium tuberculosis. Curr Mol Med 2007, 7,287-296.

197. Wang, X. and Feuerstein, G.Z. Suppression subtractive hybridisation: application in the discovery of novel pharmacological targets. Pharmacogenomics 2000,1, 101-108.

198. Weber, M., Davies, J.J., Wittig, D., Oakeley, E.J., Haase, M., Lam, W.L. and Schubeler, D. Chromosome-wide and promoter-specific analyses identify sites of differential DNA methylation in normal and transformed human cells. Nat Genet 2005, 37, 853-862.

199. Welsh, J. and McClelland, M. Fingerprinting genomes using PCR with arbitrary primers. Nucleic Acids Res 1990,18, 7213-7218.

200. Wieland, I., Bolger, G., Asouline, G. and Wigler, M. A method for difference cloning: gene amplification following subtractive hybridization. ProcNatl Acad Sci U S A 1990, 87, 2720-2724.

201. Wieland, I., Bohm, M. and Bogatz, S. Isolation of DNA sequences deleted in lung cancer by genomic difference cloning. ProcNatl Acad Sci U S A 1992, 89, 9705-9709.

202. Williams, J.G., Kubelik, A.R., Livak, K.J., Rafalski, J.A. and Tingey, S.V. DNApolymorphisms amplified by arbitrary primers are useful as genetic markers. Nucleic Acids Res 1990, 18, 6531-6535.

203. Wu, J., Wang, S.H., Potter, D., Liu, J.C., Smith,- L.T., Wu, Y.Z., Huang, Т.Н. and Plass, C. Diverse histone modifications on histone 3 lysine 9 and their relation to DNA methylation in specifying gene silencing. BMC Genomics 2007, 8,131.

204. Yamashita, S., Yoshida, Y., Kurahashi, A., Sugimura, T. and Ushijima, T. Construction of a high-throughput rat genetic mapping system with 466 arbitrarily primed-representational difference analysis markers. Mamm Genome 2000, 11, 982-988.

205. Yang, Z., Yang, D., Kong, Y., Zhang, L., Marrs, C.F., Foxman, В., Bates, J.H., Wilson, F. and Cave, M.D. Clinical relevance of Mycobacterium tuberculosis plcD gene mutations. Am J Respir Crit Care Med 2005,171,1436-1442.

206. Yokota, H., Amano, S., Yamane, Т., Ataka, K., Kikuya, E. and Oishi; M. Differential cloning using in-gel competitive reassociation. Electrophoresis 1995, 16, 286-290.

207. Zeschnigk, M., Horsthemke, B. and Lohmann, D. Detection of homozygous deletions in tumors by hybridization of representational difference analysis (RDA) products to chromosome-specific YAC clone arrays. Nucleic Acids Res 1999,27, e30.

208. Zhang, Y.L., Ong, C.T. and Leung, K.Y. Molecular analysis of genetic differences between virulent and avirulent strains of Aeromonas hydrophila isolated from diseased fish. Microbiology 2000, 146 (Pt 4), 999-1009.

209. Zhang, Y.W., Ding, L.S. and Lai, M.D. Reg gene family and human diseases. World J Gastroenterol 2003, 9,2635-2641.

210. Zhu, J. and Yao, X. Use of DNA methylation for cancer detection and molecular classification. J Biochem Mol Biol 2007,40,135-141.

211. Zhulidov, P.A., Bogdanova, E.A., Shcheglov, A.S., Vagner, L.L., Khaspekov, G.L.,

212. Kozhemyako, V.B., Matz, M.V., Meleshkevitch, E., Moroz, L.L., Lukyanov, S.A. et al. Simple cDNA normalization using kamchatka crab duplex-specific nuclease. Nucleic Acids Res 2004, 32, e37.

213. Быченко, O.C., Суханова, JI.B., Уколова, C.C., Скворцов, Т.А., Потапов, В.К., Ажикина, Т.Л. and Свердлов, Е.Д. Геномная близость байкальского омуля и сига. Биоорганическая Химия 2009, 35, 95-102.

214. Решетников, Ю.С. Современные проблемы изучения сиговых рыб. Вопросы ихтиологии. 1995, 35, С. 156-174.