Бесплатный автореферат и диссертация по биологии на тему
Экспериментальные подходы к идентификации и картированию ЦИС-регуляторных элементов в протяженных областях генома человека
ВАК РФ 03.00.03, Молекулярная биология

Автореферат диссертации по теме "Экспериментальные подходы к идентификации и картированию ЦИС-регуляторных элементов в протяженных областях генома человека"

9 М-1

3931 'СКАЯ АКАДЕМИЯ НАУК

ИНСТИТУТ БИООРГАНИЧЕСКОЙ ХИМИИ им. академиков М.М. Шемякина и Ю.А. Овчинникова

На правах рукописи УДК 577.214.6

Николаев Лев Григорьевич

ЭКСПЕРИМЕНТАЛЬНЫЕ ПОДХОДЫ К ИДЕНТИФИКАЦИИ И КАРТИРОВАНИЮ ЦИС-РЕГУЛЯТОРНЫХ ЭЛЕМЕНТОВ В ПРОТЯЖЕННЫХ ОБЛАСТЯХ ГЕНОМА ЧЕЛОВЕКА

03.00.03 - молекулярная биология

Автореферат диссертации на соискание ученой степени доктора биологических наук

МОСКВА-2008

Работа выполнена в Институте биоорганической химии им. академиков М.М. Шемякина и Ю.А. Овчинникова РАН.

Научный консультант:

академик РАН Свердлов Евгений Давидович

Официальные оппоненты:

Чл.-корр. РАН, докт. хим. наук Кочетков Сергей Николаевич

Чл.-корр. РАН, докт. хим. наук Габибов Александр Габибович

Докт. биол. наук Сулимова Галина Ефимовна

Ведущая организация:

Институт биологии гена РАН

Защита диссертации состоится "21" JUC^S^ 2008 г. в часов на заседании специализированного совета Д 002.019.01 при Институте биоорганической химии им. академиков М.М. Шемякина и Ю.А. Овчинникова РАН по адресу: 117997, Москва, ул. Миклухо-Маклая 16/10.

С диссертацией можно ознакомиться в библиотеке Института биоорганической химии им. академиков М.М. Шемякина и Ю.А. Овчинникова РАН.

Автореферат разослан 2008 г.

Ученый секретарь

специализированного ее"""1 доктор физ.-мат. наук

ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность проблемы. Сейчас, когда закончено определение нуклеотидных последовательностей нескольких геномов млекопитающих (Lander et al. 2001; Venter et al. 2001; Waterston et al. 2002), главной задачей геномики становится изучение регуляторных механизмов, определяющих фенотипическое разнообразие живых организмов. Считается, что в геноме млекопитающих имеется 20000-30000 генов, кодирующих белки; однако последние данные указывают на то, что транскрибируется существенно большая часть генома (Caminci 2006). Не кодирующие белки транскрипты играют важную роль в регуляции генома, что существенно увеличивает сложность строения геномной машины. Вся совокупность генов и транскрибируемых областей генома многоклеточных организмов связана в сложнейшую регулируемую сеть, определяющую существование многочисленных типов специализированных клеток. Транскрипция генов и некодирующих последовательностей регулируется на нескольких уровнях: линейной архитектуры генома, представленной цис-регуляторными элементами ДНК, модификации ДНК, структуры хроматина, структурной компартментализации ядра и др.

Следует признать, что, несмотря на серьезные достижения в изучении организации отдельных регуляторных систем (Maston et al. 2006), мы все еще далеки от полного понимания механизмов, управляющих геномом как целым. Даже в относительно простых случаях идентификации геномных элементов, играющих роль цис-регуляторов, мы встречаем серьезные затруднения, требующие для их преодоления длительных усилий большого числа исследователей. Согласно теоретическим предсказаниям геном человека может содержать до 100000 энхансеров и сайленсеров, однако к настоящему времени охарактеризована лишь небольшая их часть (Pennisi 2004).

Понятно, что для полной функциональной характеристики организма необходимо знать положение и функциональное состояние всех регуляторных последовательностей его генома во всех типах клеток на всех этапах его жизни. Хотя эта грандиозная задача пока далека от решения, разработка подходов для этого уже началась, в частности, в рамках предлагаемого исследования.

Регуляторные элементы генома даже одного и того же типа (например, энхансеры) в общем случае не обладают заметной гомологией первичных структур. Это связано в первую очередь со специфичностью их действия. Определенный цис-элемент должен оказывать свое действие (связывать регуляторные белки) в определенном месте и в определенное время, и поэтому не может быть близок по первичной структуре к подобному по активности элементу, действующему в другом типе клеток и на другой стадии развития организма. Эта особенность цис-регуляторных элементов не позволяет идентифицировать их по сходству первичных структур методами биоинформатики, и приводит к необходимости разработки экспериментальных методов их идентификации, причем эти методы должны быть различны для различных типов регуляторов.

За последнее время было предложено большое число различных экспериментальных подходов для идентификации регуляторных последовательностей внутри генома. Во всех этих подходах используется один и тот же ключевой элемент - получение высокообогащенных клонотек фрагментов ДНК, содержащих соответствующие регуляторные

элементы. После конструирования таких клонотек нахождение их места в геноме становится чисто технической задачей и может быть осуществлено при помощи различных технологий, таких как гибридизация с геномными микрочипами, массированное секвенирование, технологии, сходные с SAGE (Serial Analysis of Gene Expression) и др. Эти подходы можно разделить на две труппы. В первую входят методы, которые можно назвать структурными, т.е. методы, основанные на взаимодействии ДНК с белками или субклеточными структурами, а также на структурных особенностях ДНК. Вторую группу составляют функциональные подходы, обычно использующие "метод репортерного гена".

Построение функциональных карт генома можно вести по двум основным направлениям. Во-первых, можно картировать один или небольшое число элементов внутри полного генома или достаточно большой его части (полногеномный подход). Такого рода технологии в основном применяются в последние несколько лет. Во-вторых, можно определить положение достаточно большого числа (в перспективе - всех) регуляторных элементов внутри относительно небольшой области генома, с перспективой объединения этих областей в полногеномную функциональную карту.

В нашей работе были использованы оба упомянутых выше подхода. На ранних этапах работы (1995-2000 г.), когда последовательность генома человека не была еще известна, мы использовали полнохромосомный (на примере хромосомы 19) подход. Полученный опыт показал, что технические ограничения такого подхода не позволяют построить функциональные карты, содержащие все или основную часть регуляторных элементов, и, по мере накопления экспериментальных данных, мы перешли к детальному картированию относительно небольшого (1 млн. п.о.) фрагмента хромосомы 19 человека, расположенного между генами FXYD5 и СОХ7А1, который и стал основной моделью для отработки методов идентификации различных регуляторных элементов.

Цели и задачи исследования. Цель настоящей работы заключалась в разработке подходов, идентификации и функциональном картировании ряда цис-регуляторных элементов внутри протяженных областей генома человека.

В ходе работы были решены следующие задачи:

1. Предложен метод идентификации и картирования участков прикрепления ДНК к ядерному матриксу. С помощью этого подхода реконструирована доменная структура областей хромосом 19 и 16 человека длиной соответственно 1 млн.п.о. и 2.9 млн.п.о.

2. Разработан метод двумерного EMSA, при помощи которого составлена карта расположения участков связывания ядерных белков и фактора транскрипции CTCF в протяженной области хромосомы 19 человека.

3. Предложен метод EMSA-дисплея и продемонстрирована его пригодность для идентификации и картирования тканеспецифичных сайтов связывания белков в геномных последовательностях.

4. Предложен метод идентификации сайтов связывания факторов транскрипции на основе иммуномагнитной сепарации, который позволил идентифицировать, картировать и охарактеризовать ряд участков связывания фактора с-Мус в последовательности хромосомы 19 человека.

5. Предложен метод идентификации и картирования потенциальных инсуляторов. Внутри области хромосомы 19 человека длиной 1 млн.п.о. идентифицировано, картировано и охарактеризовано 8 таких последовательностей.

Научная новизна, теоретическая и практическая значимость работы. В настоящей работе сформулирован подход к функциональному картированию геномов, заключающийся в построении подробных карт, включающих все или большую часть цис-регуляторных элементов, для относительно небольших (несколько млн. п.о.) областей генрма. В дальнейшем подобные частичные карты могут быть объединены в функциональные карты целых хромосом и полных геномов. Для осуществления предложенной концепции разработан ряд оригинальных методов, позволяющих экспериментально идентифицировать ряд цис-регуляторных элементов, получить клонотеки этих элементов, и определить их положение относительно друг друга и относительно генов внутри протяженных областей генома.

На основании полученных нами в данной работе и имеющихся литературных данных мы построили первый вариант интегрированной карты регуляторных последовательностей для области хромосомы 19 человека длиной 500 т.п.о. Полученная карта, хотя и является наиболее полной из имеющихся в настоящее время карт геномных областей высших эукариот, пока далека от завершения, особенно в части тканеспецифичности действия приведенных регуляторных последовательностей. Тем не менее, она дает представление о сложности регуляторной системы генома и о трудности их исследования. Мы надеемся, что предложенные в настоящей работе методы позволят в обозримом будущем создать более исчерпывающие функциональные карты как отдельных областей, так и полных геномов.

Адробадия результатов работы. Основные результаты работы были представлены на научных конференциях и симпозиумах, в том числе: 5-й (1996 г.), б-й (1997 г.) и 9-й (1999 г.) конференциях российской программы "Геном человека"; 4-й международной Энгельгардтовской конференции по молекулярной биологии (1999 г.); III (1996 г.), IV (1998 г.), VI (2002 г.), VIII (2006 г.) чтениях, посвященных памяти академика Ю.А. Овчинникова, конгрессах HUGO Human Genome Meeting (Гейдельберг 1996 г., Эдинбург 2001 г., Хельсинки 2006 г.).

Работа выполнена при финансовой поддержке российской программы "Геном человека", Программы Президиума РАН "Молекулярная и клеточная биология". Программы "Ведущие научные школы РФ", Российского фонда фундаментальных исследований, программы INTAS и грантов НАТО и министерства энергетики США.

Структура и объем диссертации. Диссертационная работа состоит из введения, обзора литературы, описания материалов и методов исследования, изложения результатов работы и их обсуждения, заключения, выводов и списка литературы. Работа изложена на 191 странице, содержит 46 рисунков и 16 таблиц. Список литературы включает 347 источников.

Публикации. Диссертация обобщает данные 20 основных статей.

РЕЗУЛЬ ТА ТЫ И ИХ ОБСУЖДЕНИЕ

1. ИДЕНТИФИКАЦИЯ, ГЕНОМНОЕ КАРТИРОВАНИЕ И ФУНКЦИОНАЛЬНЫЙ АНАЛИЗ УЧАСТКОВ ПРИКРЕПЛЕНИЯ ДНК К ЯДЕРНОМУ МАТРИКСУ (S/MARS)

Одним из важных структурно-функциональных элементов клеточного ядра, ответственным за образование и регуляцию активности хроматина, являются участки прикрепления ДНК к ядерному матриксу.

Скелетная структура интерфазного ядра - ядерный матрикс - имеет повышенное сродство к последовательностям определенного типа (scaffold/matrix attachment regions, S/MARs), что делает ядерный матрикс уникальным инструментом, позволяющим отобрать те фрагменты ДНК, которые осуществляют прикрепление интерфазного хроматина к ядерному матриксу и образуют его петельно-доменную структуру. Гены, расположенные в различных доменах, физически изолированы друг от друга связанными с ядерным матриксом S/MAR-элементами, и способны регулироваться независимо.

Указанное свойство ядерного матрикса было использовано нами для отбора и идентификации фрагментов ДНК, предпочтительно связывающихся с ядерным матриксом, в различных областях генома человека, что позволило, как картировать все отобранные элементы, так и сделать выводы о взаимном расположении S/MAR элементов и генов и их возможной функциональной взаимосвязи.

Картирование последовательностей, предпочтительно связывающихся с ядерным матриксом, на хромосоме 19 человека

Конструирование библиотеки коротких фрагментов

Общая схема конструирования хромосом-специфической библиотеки последовательностей, предпочтительно связывающихся с ядерным матриксом, показана на Рис. 1. Смесь коротких (200-800 п.о.) фрагментов ДНК хромосомы 19, полученных расщеплением ДНК исходной геномной библиотеки хромосомы 19 человека, клонированной в лямбда-векторе, рестриктазами и присоединением к обоим концам адаптеров, была использована для отбора матрикс-связываюшихся фрагментов (S/MARs) путем связывания с ядерным матриксом in vitro. К суспензии ядерных матриксов после блокирования неспецифического связывания избытком ДНК Е. coli добавляли смесь коротких фрагментов ДНК, инкубировали, интенсивно промывали для удаления не связавшейся ДНК, и связавшиеся с матриксом фрагменты ДНК выделяли после разрушения матриксов обработкой SDS и протеиназой К. Связавшуюся ДНК хромосомы 19 затем амплифицировали и использовали для второго раунда связывания с ядерным матриксом. Процесс связывания с ядерным матриксом был повторен пять раз. Результаты каждого этапа связывания показаны

на Рис. 2. Исходная ДНК (дор. 1) выглядит как набор полос, соответствующих фрагментам, полученным при расщеплении рестриктазами плеч векторной ДНК фага лямбда. Гетерогенный набор фрагментов, полученный при расщеплении вставки, дает лишь незначительный фон. При последующих циклах связывания дискретные полосы исчезают, и появляется зона, состоящая из большого числа разных по длине фрагментов (Рис. 2, дор. 4,6, 8, 10). Гибридизация с меченой ДНК фага лямбда (Рис. 2, дор. 3, 5, 7, 9, 11) показывает, что уже после 4-го цикла связывания среди амплифшшрованных фрагментов практически не остается фрагментов фага лямбда. Этот факт служит указанием на то, что библиотека обогащается последовательностями, имеющими повышенное сродство к ядерному матриксу.

После 5-го раунда связывания с ядерным матриксом ПЦР-амшшфицированная смесь фрагментов была расщеплена рестриктазой Xho I, сайт узнавания которой содержался в последовательности адаптера, и клонирована в плазмидный вектор. После трансформации клетки 384 были отобраны и ранжированы.

Характеристика клонов библиотеки

Наличие и размеры вставок во всех клонах библиотеки были проверены с помощью ПЦР. Все проверенные клоны содержали вставку. 40 клонов со вставкой длиной 2S0-S00 п.о. были отобраны для секвенирования. Нуклеотидные последовательности вставок сравнивали с банком данных нуклеотидных последовательностей GenBank с использованием BLAST (Altschul et al. 1997).

Для проверки их способности связываться с ядерным матриксом, клоны были радиоактивно мечены 32Р с помощью ПЦР. Фрагменты ДНК фагов лямбда и Т7 были использованы как отрицательные (не связывающиеся с матриксом) контроли, в качестве положительного контроля была использована вставка плазмиды pUCMARlO, содержавшей в векторе pUC19 вставку длиной 250 п.о., представляющую собой 10-кратный повтор последовательности синтетического S/MAR, идентичного локализованному на З'-конце энхансера гена IgH.

Меченые вставки клонов библиотеки и pUCMARlO были смешаны с равным количеством каждого из отрицательного контролей и ядерными матриксами. После инкубации смесь была разделена на фракции осадка и супернатанта. Очищенную ДНК из обеих фракций анализировали с помощью денатурирующего гель-электрофореза в поли акрил амидном геле (Рис. 3). Как видно на рисунке, все вставки клонов библиотеки, кроме одной (М0А6), то есть около 90%, предпочтительно связываются с ядерным матриксом, хотя эффективность связывания варьирует для различных клонов.

Клетки

Библиотека космидных клонов, перекрывающая изучаемую область генома

Выделение Г ядер

Получение ядерного матрикса

Ядерный метрике . (скэффолд)

*

Расщепление Sau ЗА, Csp(>-\

Отбор фрагментов, связывающихся с ядерным матриксом

^ Лигиропание адаптеров

S/MAR

П ЦР-амнлификация связавшихся фрагментов

Клонирование библиотеки S/MARs

IJ + с — о

Секвенирование i

Картирование S/MAR-элементов

Рис. 1. Общая схема получения библиотеки матрикс-связывающих последовательностей.

Для количественной оценки эффективности связывания исследуемых клонов с ядерным матриксом полосы, соответствующие ДНК в/МАИв и контрольной ДНК были вырезаны из геля, уровни радиоактивности полос в обеих фракциях измерены с помощью сцинтилляционного счетчика, и на основании этих данных были рассчитаны коэффициенты связывания для каждого из клонов по следующей формуле: В=(8с х Рш)/(Рс х Яш),

М 123456789 10

Рис. 2. Электрофорез в 2% агарозе ДНК, связавшейся с ядерным магрикеом ( дор. 1,3.5, 7, 9), и блат-гибридизация ДНК этих дорожек с меченой ДНК фага лямбда (дор. 2, 4, 6, 8, 10). 1,2- исходный материал, последующие пары дорожек соответствуют 1, 3,4 и 5 циклам связывания. М - маркер длин фрагментов (ДНК рВК.322. расщепленная Ви N1).

к «

2 п ® мл 2 2 2 2

ОС <

- _ _ _____ЭФо<<<<<тсотсо

L

J_

J

Э Р

Рис. 3. Связывание меченых вставок клонов с ядерным матриксом. Я -супернатинтм, Р - осадки, полученные после связывания соответствующих фрагментов. I. и Т - соответственно фрагменты ДНК фагов лямбда и Т7.

где В - коэффициент связывания, Рш - радиоактивность (имп/мин) ДНК S/MAR в осадке, Рс -радиоактивность (имп/мин) контрольной ДНК в осадке, Sm -радиоактивность (имп/мин) ДНК

S/MAR-клона в супернатанте, Sc - радиоактивность (имп/мин) ДНК контролей в супернатанте.

Анализ первичной структуры S/MAR-кпонов

Для характеристики особенностей первичной структуры S/MARs мы использовали пакет программ PC/GENE. Результаты анализа показали, что 12 из 21 S/MAR-клонов содержат достаточно протяженные участки, обогащенные А+Т (более 75% А+Т), что характерно для одного из классов этих элементов (Boulikas 1995). В то же время другие S/MARs с высоким сродством к ядерному матриксу вообще не содержали А+Т обогащенных участков длиннее 20 п.о. Число обращенных повторов, способных образовывать шпилечные или крестообразные структуры (Boulikas 1995), также не коррелировало со способностью клонов связываться с ядерным матриксом. По-видимому, объяснением этого факта может служить наличие разных типов S/MAR-элементов, из которых обогащенным А+Т и обращенными повторами является лишь один.

Картирование S/MAR-клонов на хромосоме 19

До появления полной первичной структуры генома человека метрическая карта хромосомы 19, построенная в Ливерморской национальной лаборатории (США) (Ashworth et al. 1995), была одной из самых подробных и надежных карт хромосом человека. Для привязки S/MAR-последовательностей к этой карте мы использовали схему, приведенную на Рис. 4. Клоны, принадлежащие хромосоме 19 человека и предпочтительно связывающиеся с ядерным матриксом, были радиоактивно мечены при помощи ПЦР и гибридизовались с космидными библиотеками F и R хромосомы 19 (Сагтапо et al. 1989), ранжированными на фильтрах высокой плотности (около 3000 космидных клонов на фильтр) (Olsen et al. 1993). Всего гибридизация была проведена примерно с 15000 космид для каждого S/MAR. Наличие S/MAR-последовательности в космидных клонах было затем подтверждено при помощи ПЦР, с использованием положительно гибридизующихся космид в качестве матрицы и клон-специфичных пар праймеров. Локализацию космид проводили с использованием базы данных Ливерморской национальной лаборатории. Привязку космид к физической карте осуществляли, основываясь на отнесении космид к космидным контигам, образованным на основании рестриктного фингерпринтинга и последующего расположения их на хромосоме при помощи флюоресцентной гибридизации in situ (FISH) (Ashworth et al. 1995). Результаты картирования представлены на Рис. 5 и залесены в базу данных Ливерморской национальной

Последовательность клона

п . * •

Подбор праимеров

Амплификация геномной ДНК из... Китайского Плаценты Гибридных клеток хомячка человека человек-хомячок

♦ + 1 I

Гибридизация с фильтрами высокой плотности

I

Идентификация гибридизующихся космид; проверка результатов с помощью ПЦР.

Нет продуктов амплификации

1

STOP

Продукт ожидаемого размера

i

Картирование. Регистрация в базе данных.

Нет продукта ожидаемого размера

1

Проверка специфичности праймеров

Рнс. 4. Схема картирования S/MARs на хромосоме 19.

лаборатории, доступную через Internet (http://www-bio.llnl.gov/bbrp/genome/genome.html).

Принимая, что размер хромосомы 19 составляет около 6x107 п.о. и средняя длина хроматиновых доменов равна 60 т.п.о., можно оценить, что общее количество фрагментов ДНК хромосомы 19, связывающихся с ядерным матриксом в интерфазе должно быть около 1000. Однако число последовательностей хромосомы 19, способных связываться с ядерным матриксом, может оказаться существенно больше, так как значительная часть

э/МАггв внутри о повторов

-8

г8

г8

га

А

Уникальные Б/МАКб

М0В2

М1В10

¡-1. 1-1 ■

М0А11

'МОАЗ

МЕЯ25

МЕЯ25

4—мзет

Рис. 5. Места локализации $/МАЯз разного типа на хромосоме 19 человека.

потенциальных сайтов связывания может и не быть присоединенной к матриксу в течение всего клеточного цикла. В связи с этим максимальное количество Я/МАЯ-злементов хромосомы может составить несколько тысяч.

Нами был выбран подход, позволяющий получить хромосом-специфичную и высоко представительную библиотеку. Из 40 проанализированных нами клонов 21 (>50%) содержали вставку, специфичную для хромосомы 19 человека, а 20 из них (95%) связывались с ядерным матриксом in vitro существенно сильнее, чем контрольная ДНК. Таким образом, полученная нами библиотека оказалась высоко представительной и значительно обогащенной матрикс связывающими фрагментами.

Анализ библиотеки показал, что ранжированная ее часть может содержать до 150 независимых S/MAR-клонов. Это число в несколько раз больше, чем общее количество эукариотических S/MAR-элементов, охарактеризованных до начала этой работы. Необходимо отметить, что это количество может быть увеличено путем ранжирования и анализа дополнительного числа клонов.

Описанные выше эксперименты позволили нам картировать на хромосоме 19 человека значительное количество участков ДНК, предпочтительно связывающихся с ядерным матриксом. В то же время, эти эксперименты обладали двумя недостатками. Во-первых, полная нуклеотидная последовательность хромосомы 19 на тот момент не была определена, что создавало трудности при точном картировании S/MARs и, в особенности, при идентификации и анализе близлежащих генов. Во-вторых, ввиду большого числа S/MARs на всей хромосоме 19 (более тысячи), представляло значительные трудности идентифицировать и картировать все или подавляющую часть S/MAR-элементов, что необходимо для корректной реконструкции доменной структуры хромосомы.

Идентификация и картирование S/MARs в локусе FXYD5-COX7A1 хромосомы 19 человека

Публикация первого варианта полной нуклеотидной последовательности генома человека (Lander et al. 2001) открыла возможность подробного функционального анализа геномных последовательностей значительной длины - сотен тысяч и миллионов пар оснований, которые могут включать в себя ряд согласованно работающих генов. На следующем этапе работы мы сосредоточились на относительно небольшом (1 млн. п.о.) локусе хромосомы 19, расположенном между маркерами FXYD5-C.OX7A1, полная нуклеотидная последовательность которого была определена к началу работы. Этот локус содержит более 40 идентифицированных генов и ряд гипотетических кодирующих последовательностей, что делает его привлекательным объектом для функциональных исследований.

Конструирование библиотеки фрагментов ДНК, предпочтительно связывающихся с ядерным матриксом

Для идентификации S/MAR-элементов мы модифицировали разработанный ранее метод, использовав ядерные матриксы, приготовленные методом LIS-экстракция, и сконструировали библиотеку S/MARs из локуса FXYD5-COX7A1. В качестве источника ДНК для селекции S/MARs мы использовали набор из 30 космид, полностью перекрывающих локус FXYD5-COX7A1 19 хромосомы человека, любезно предоставленный Ливерморской Национальной лабораторией (США). Общая схема получения библиотеки матрикс-связывающих последовательностей не отличается от приведенной на Рис. 1. На первом этапе необходимо было исчерпывающе расщепить ДНК, выделенную из 30 космид, на фрагменты, достаточно длинные, чтобы содержать полный S/MAR (200-1000 п.о.) и достаточно короткие, чтобы эффективно амплифицироваться при помощи ПЦР. Для расщепления использовались рестриктазы Saul А и Схрб-1, образующие липкие концы. Применение двух различных ферментов необходимо для того, чтобы избежать потери потенциальных S/MARs из-за образования слишком длинных или коротких фрагментов, которые в дальнейшем могут быть утрачены при селекции и ПЦР. Для последующей ПЦР-амплификации и клонирования к полученному набору фрагментов присоединялись синтетические адаптеры. На следующем этапе был использован метод связывания ДНК с ядерным матриксом in vitro.

К суспензии ядерных матриксов, полученных методом LIS-экстракции, добавляли большой избыток фрагментированной ДНК£. ее//, не содержавшей S/MAR-элементов, для блокирования неспецифического связывания. Далее связывание проводили аналогично тому, как описано в предыдущем разделе. Всего было проведено пять последовательных связываний. На электрофореграмме (Рис. 6) видно, что исходная смесь, содержащая около 4000 фрагментов ДНК, имеет вид мазка, состоящего из большого числа разных по длине фрагментов. К пятому циклу выявляется ряд фрагментов определенной длины, предпочтительно связывающихся с ядерным матриксом. Это указывает на обогащение библиотеки последовательностями, имеющими повышенное сродство к ядерному матриксу.

Этот набор фрагментов ПЦР-амплифицировали и клонировали, 184 белых колонии были ранжированы.

Плазмидную библиотеку, обогащенную последовательностями, способными к специфическому связыванию с ядерным матриксом, проверяли на наличие и размер вставок. Далее фрагменты ДНК переносили на нейлоновый фильтр и гибридизовали с меченой смесью фрагментов после пятого цикла связывания. Этот этап позволил исключить клоны,

Цикл селекции

Рис. 6. Селекция фрагментов ДНК, прсдпочти гелыю связывающихся с ядерным матриксом. Электрофоре-J в 1% шарошом геле исходной библиотеки коротких фрагментов ДНК (дор. 0), и после ). 2, 3 и 5 циклов селекции (дор 1, 2, 3 н 5 соответственно), М - маркер длин фрагментов ДНК.

дающие слабый сигнал при гибридизации, из последующей работы. Слабо гибридизующиеся клоны, мало представленные в библиотеке, с большой вероятностью не являются в/МАЯ-элементами и в дальнейшем не анализировались.

По результатам гибридизации было отобрано 29 клонов и определена их первичная структура. После сравнения первичных структур клонов между собой было выявлено 16 независимых последовательностей.

Для определения числа независимых клонов в библиотеке мы предположили, что каждый клон представлен в библиотеке равным количеством копий. Рассмотрим библиотеку, содержащую N клонов, по т копий каждого клона. Поскольку вероятность выбора клона конкретного тина равна 1/К и достаточно мала, то можно считать, что число к появлений клона данного типа подчиняется распределению Пуассона. Размер библиотеки при этом можно оценить как Ы=(число клонов, выбираемых в одной серии опытов)^, где я - параметр пуассоновского распределения. Число независимых клонов для нашей библиотеки, полученное таким образом, оказалось близким 20. Таким образом, 16 обнаруженных клонов представляют собой если не все, то большую часть потенциальных Б/МАЯб в нашей библиотеке.

Определение коэффициента связывания клопов библиотеки с ядерным матриксом in vitro Матрикс-связывающие свойства отобранных последовательностей были проверены при помощи связывания их с ядерным матриксом in vitro. Для них был определен коэффициент связывания с ядерным матриксом тем же методом, что и для S/MARs хромосомы 19 (см. выше). Все полученные клоны связывались с матриксом значительно лучше, чем контрольные фрагменты ДНК, хотя эффективность этого связывания варьировала в зависимости от клона (не показано).

Для всех этих клонов был определен коэффициент их связывания с ядерным матриксом в %% по отношению к положительному контролю - вставке плазмиды pUCMARlO по следующей формуле: в(%)= 100%x(E(mar)/E(pucmario)).

Следует отметить, что абсолютная величина коэффициента связывания, и, в меньшей степени, его нормированное значение, могут достаточно сильно изменяться в зависимости от того, какой препарат ядерного матрикса используется для его определения. Таким образом, эти данные являются лишь полуколичественными. Тем не менее, все тестированные S/MAR-элементы обладали повышенным сродством к ядерному матриксу во всех проведенных экспериментах.

Анализ первичной структуры S/MAR клонов

Первичные структуры S/MARs анализировали так, как указано выше (стр. 9). Результаты показали, что 10 S/MAR-клонов содержат протяженные участки (20 п.о. и более), обогащенные А+Т (более 75% А+Т). Некоторые S/MARs, также, как и S/MARs охарактеризованные ранее, не содержали А+Т-обогащенных участков длиннее 20 п.о. Аналогично другим S/MARs хромосомы 19 (стр. 9), число найденных в них обращенных повторов не коррелировало со способностью клонов связываться с ядерным матриксом.

Компьютерный анализ секвенированных клонов и их картирование

Последовательности 16 независимых клонов были проверены на гомологию с последовательностями из нуклеотидной базы данных GenBank. Как и ожидалось, все 16 последовательностей оказались на 99-100% совпадающими с последовательностями, соответствующими локусу FXYD5-COX7A1 хромосомы 19 человека. Расположение S/MAR-элементов относительно генов приведено на геномной карте (Рис. 7).

1 H i з

□ Si 1 «

*-Ж—

AC002128 AC002132 AC002511 AD001502 №000090

100 ZOO 300 400

Thousand

11 Ü

»| Ig |io

Hl 12

13

ni

14

15

"16

bese paire

«=0023«в ACQ02133 №000633 AC00Í118 ЛС004144 AC002984

600 700 WO 900 1000

Рис. 7. Карта локуса tXYD5-COX7A1 хромосомы 19 человека. Горизонтальные стрелки соответствуют известным генам. Вертикальные стрелки обозначают положение S/MAR-элементов, длины стрелок приблизительно соответствуют эффективности связывания данного S/MAR с ядерным матриксом.

Таким образом, используя метод специфического связывания фрагментов ДНК с ядерным матриксом in vitro, мы идентифицировали и картировали в данном локусе 16 S/MAR-элементов, коэффициент связывания которых колебался от 10 до 120% по сравнению с хорошо охарактеризованным S/MAR из локуса IgH мыши. По оценке, локус содержит около 20 S/MARs, и, таким образом, нами было идентифицировано и картировано представительное большинство S/MAR-элементов, хотя и нельзя исключить, что небольшая их часть была потеряна в процессе селекции.

Большая часть (11 из 16) обнаруженных S/MARs расположены в межгенных областях, и их можно отнести к структурным элементам, разграничивающим хроматиновые домены. Эти 11 S/MAR- элементов подразделяют локус на 10 доменов длиной от 6 до 272 т.п.о. Средний размер домена составляет 88 т.п.о., что хорошо согласуется с более ранними оценками среднего размера петель хроматина (Boulikas 1995; Iarovaia et al. 1996). В то же время 4 из 10 доменов не содержат ни охарактеризованных, ни гипотетических генов. Три из этих "псевдодоменов" являются очень короткими (от 6 до 16 т.п.о.), и возможно, имеют в своем составе протяженные регуляторные элементы генома, содержащие внутренние S/MAR-элементы, подобно LCR (locus control region) (Maston et al. 2006). Возможно, что наиболее протяженный домен, содержит в своем составе пока не идентифицированные гены.

Как видно из карты, в одном и том же домене могут находиться гены, имеющие существенно разную тканеспецифичность. Так, например, в одном домене расположены ген СОХ6В, кодирующий 6В субъединицу цитохромоксидазы С, экспрессирующуюся во всех тканях (Carrero-Valenzuela et al. 1991), и ген уроплакина 1 А, который преимущественно экспрессируется в уротелии (Sun et al. 1996). Этот результат может объясняться различными, но не обязательно взаимоисключающими способами:

1. Поскольку мы использовали ядерный метрике из клеток HeLa, карта распределения S/MAR-элементов является тканеспецифичной. Это означает, что в библиотеке ломимо конститутивных S/MAR-элементов, которые функционируют во всех типах клеток, присутствуют и тканеспецифичные S/MARs, связанные с матриксом только в данном типе клеток.

2. Другим объяснением может служить то, что часть S/MARs, расположенных между генами

с различной тканеспецифичностью, могла быть потеряна в процессе эксперимента. Это может происходить потому, что используемый нами метод приводит прежде всего к обнаружению "сильных" S/MARs, со сравнительно высокой аффинностью к ядерному матриксу.

3. Для формирования функционального домена необходимы не только S/MAR-элементы, но и участки связывания различных регуляторных факторов, которые расположены в активных областях хромосомы.

S/MAR-элементы внутри генов

Расположение S/MARs в интронах не является необычным и было обнаружено в генах легкой и тяжелой цепей иммуноглобулинов мыши (Cockerill et al. 1987), в генах бета-глобина и топоизомеразы I человека (Jarman and Higgs 1988; Romig et al. 1994), и в ряде других генов (Bode et al. 1998). В большинстве случаев эти S/MARs ассоциированы с важными цис-регуляторными элементами.

Пять из 16 S/MAR-элементов локуса FXYD5-COX7AI были локализованы нами в интронах известных генов - гена белка, сходного с предшественником бета-амилоида (amyloid beta precursor-like protein 1, APLP1) (Bayer et al. 1999), пролиноксидазы 1 печени и почек (kidney and liver proline oxidase 1, PRODH2), гликопротеина, ассоциированного с миелином (myelin associated glycoprotein, MAG), принадлежащего к суперсемейству иммуноглобулинов (Konat 1996; Schachner and Bartsch 2000), и нефрина (nephrin, NPHS1) (Lenkkeri et al. 1999), что позволяет предположить участие S/MARs в регуляции этих генов. Вызывает большой интерес, что 4 из 5 генов, содержащих S/MARs в интронах, экспрессируются строго тканеспецифично, в нервных тканях (MAG, APLP1), и тканях почки (PRODH2 и NPHS1). Более того, все 4 гена связаны с возникновением различных наследственных заболеваний.

Наличие S/MAR-элементов в интронах генов позволяет предположить, что эти S/MARs являются регуляторными элементами, ответственными за тканеспецифичность и уровень их экспрессии.

S/MAR-элементы, находящиеся в интронах, должны обладать особыми свойствами. Во-первых, они не должны мешать прохождению РНК-полимеразы II (Bode et al. 1998; Phi-Van and Stratling 1990). Для этого их взаимодействие с ядерным матриксом должно быть тканеспецифичным и/или реализовываться только в течение некоторых периодов жизненного цикла клетки. Эти S/MARs, таким образом, представляются наилучшими кандидатами на роль "динамических" или "функциональных" S/MAR-элементов (Jackson et al. 1992). Такая их роль хорошо согласуется с тканеспецифичностью экспрессии генов, в которых они обнаруживаются.

4.5. 7. Функционирование идентифицированных S/MARs in vivo

Для того чтобы проверить, действительно ли идентифицированные нами S/MAR-элементы лежат в основании петель ДНК, совместно с О.В. Яровой и С В. Разиным (Институт биологии гена РАН) были проведены эксперименты по флюоресцентной гибридизации in situ с ядерными гало (Gerdes et al. 1994). Для этого использовали ДНК космидных клонов.

перекрывающих область в 170 т.п.о. между S/MARs 3 и 4 (см. Рис. 7) и ядерные гало, приготовленные из клеток HL-60 экстракцией 2М NaCl. Результаты гибридизации этой области генома с ядерными гало показывают, что в большинстве клеток наблюдаются две петли ДНК, закрепленные на ядерном матриксе. Эти петли представляют собой изучаемую область генома, присутствующую в двух гомологичных хромосомах. Можно заключить, что S/MAR-элементы, фланкирующие данную область, располагаются на ядерном матриксе, тогда как область между S/MARs 3 и 4 входит в состав ядерного гало. Полученные результаты подтверждают, что идентифицированные S/MARs действительно прикреплены к ядерному матриксу, а находящаяся между ними ДНК образует выступающую петлю.

2. ИДЕНТИФИКАЦИЯ И КАРТИРОВАНИЕ УЧАСТКОВ СВЯЗЫВАНИЯ ЯДЕРНЫХ БЕЛКОВ

Метод двумерного сдвига опектрофоретической подвижности (2D-EMSA)

Для отбора и идентификации фрагментов ДНК, способных связываться с транскрипционными факторами, нами был предложен подход, основанный на двумерном сдвиге электрофоретической подвижности фршментов ДНК в геле (Рис. 8). В качестве исходного материала для селекции используется библиотека коротких фрагментов, перекрывающих интересующую нас область генома, приготовленная тем же методом, что и для селекции S/MARs. В качестве источника ДНК-связывающих белков используется ядерный экстракт. Библиотеку коротких фрагментов радиоактивно метят, смешивают с ядерным экстрактом в присутствии неспецифических конкурентов (ДНК Cotí и/или поли-dI:dC-mwiH-dI:dC), инкубируют и наносят на неденатурирующий полнакриламидный гель первого направления, аналогичный используемому в стандартном методе EMSA. После разделения комплексов белок-ДНК в первом направлении соответствующую дорожку вырезают, инкубируют в SDS-содержащем буфере для разрушения комплексов ДНК-белок, и разделяют во втором, перпендикулярном направлении в присутствии SDS. При таком подходе фрагменты ДНК, не связывающиеся с белками, имеют одинаковую электрофоретическую подвижность в обоих направлениях, и после электрофореза образуют диагональ. В то же время, связывающиеся с белками фрагменты ДНК в первом направлении имеют подвижность меньшую, чем во втором, и располагаются ниже диагонали ("тени"

Длинные клонированные фрагменты, перекрывающие исследуемую область генома

Обработка мелкощспящимя ресгрнктяздмн. присоединение синтетических адаптеров

4

Белки ядерного -жстракта

О

Мочение иР

Смешать, инкуАиронать, нанес! и на ПЛАГ

1-е нанраши'ние, ЕМ8Л

Связывающиеся. с белками фрагменты

Вырезать, тлюиронать ДНК

I

ПЦР, клонирование, секвснировпнне, анализ

Рис. 8. Схема эксперимента по двумерному сдвигу электрофоретнческой подвижности (20-ЕМ5А).

ДНК-белковых комплексов). Таким образом, если вырезать часть геля, находящуюся ниже диагонали, и элюировать из нее ДНК, то эта фракция ДНК будет обогащена фрагментами, связывающимися с белками ядерного экстракта из данного типа клеток, то есть будет отражением содержащихся в данных клетках пула белков, специфически связывающихся с ДНК. Для понижения уровня фона описанную выше процедуру двумерного электрофореза можно повторять.

Метод 20-ЕМ8А позволяет отбирать, клонировать и картировать фрагменты ДНК, специфически связывающиеся с белками. Результаты двумерного ЕМБА зависят от белкового состава используемого ядерного экстракта, и характеризуют всю совокупность ядерных белков данной линии клеток или ткани, то есть ткансспецифичность связывания ядерных белков. Применение метода 20-ЕМ8А не требует никаких сведений о белках, и с его

помошью можно идентифицировать участки связывания до сих пор не идентифицированных ядерных белков.

Мы использовали 20-ЕМЭА для идентификации сайтов связывания ядерных белков внутри области генома длиной 563 т.п.о., находящейся между генами РХУВ5-Т2РР хромосомы 19 человека. Область содержит более 20 охарактеризованных генов, что позволяет сделать выводы о взаимном расположении белок-связывающих элементов и генов и их возможной функциональной взаимосвязи.

Получение и анализ библиотеки участков связывания белков из области РХУ05-Т2РР хромосомы 19 человека

В качестве источника ДНК для селекции связывающих белки фрагментов использовали набор космидных клонов, полностью перекрывающих локус РХУй5-Т2РР длиной 563 т.п.о. хромосомы 19 человека. ДНК была обработана рестриктазами &шЗА и СхрбЛ, в результате чего был получен набор фрагментов со средней длиной -500 п.о., имеющих липкие концы. Для последующей ПЦР-амплификации и клонирования к полученному набору фрагментов присоединяли синтетические адаптеры и радиоактивно метили смесь фрагментов. На следующем этапе методом двумерного ЕМвА из полученной смеси отобрали фрагменты, содержащие участки связывания с белками ядерного экстракта клеток .)игка1. Результаты двумерного ЕМвА приведены на Рис. 9. Зона, обозначенная пунктирной линией, была вырезана из геля, и ДНК элюироввна.

Набор фрагментов, полученных в результате двух циклов селекции, амплифицировали и клонировали. Около 200 колоний были ранжированы, вставки 120 клонов метили 32Р и при помощи стандартного метода ЕМвА проверяли их способность специфически связываться с ядерными белками. Результаты проверки для части клонов приведены на Рис. 10А. Было показано, что 98 из 120 вставок (-80%) способны связываться с белками ядерного экстракта, что подтверждает высокую эффективность процедуры двумерного ЕМБА. Кроме того, для 6 случайно выбранных клонов была подтверждена специфичность их связывания с белками методом конкуренции с немеченым зондом (Рис. 1 ОБ).

Общее число участков связывания ядерных белков в области РХУ05-ТгРР.

Все фрагменты ДНК, способные связываться с белками, секвенировали, и их последовательности сравнивали с базой данных последовательностей генома человека. В целом, было идентифицировано 78 последовательностей, принадлежащих области /ГЛУА5-72РР. Сравнение последовательностей между собой выявило 52 уникальные последовательности.

я а с

я ■

§

а.

|

05

Первое направление (ЕМ8А)

.........................

Рис. 9. Результаты 20-ЕМ8Ас использованием ядернго зкетракта клеток Jur)tat и библиотеки коротких фрагментов ДНК из области РХУВ5-Т2РР хромосомы 19 человека.

Свободный МИД

+ЯЭ

Конк. - ^шЛ - —^

ЯЭ - + + + - + + + - + + +

Шм жжшяря

1 Комплексы Г J ДНК-белок [_

Рис. 10. (А) Сдвиг электрофоретической подвижности (ЕМБА) для восьми фрагментов ДНК, полученных после ЗО-ЕМЯА. (Б) Конкурентный анализ трех фрагментов, связывающих ядерные белки. Ослабление полос, соответствующих комплексам ДНК-белок, при добавлении немечешюго зонда (10 и 20-кратный молярный избыток) свидетельствует о специфичности связывания. ЯЭ - ядерный экстракт.

Для оценки общего числа независимых клонов библиотеки мы использовали то же приближение, что и при оценке числа З/МАЯв, что позволило оценить общее число участков связывания белков в изучаемой области в 120. Таким образом, найденные нами 52 участка связывания белков составляют около половины всех участков, которые могут быть идентифицированы методом 20-ЕМ5А в клетках ,1игка1. Если экстраполировать полученные

нами данные на весь геном, то общее число участков связывания белков в геноме можно оценить в -600000 для одного типа клеток 120х[3000 (длина генома в млн.п.о.)]/[0,56 (длина изученной области)]. Это число не кажется слишком большим, учитывая недавние оценки числа участков связывания отдельных факторов транскрипции - 12000 сайтов Spl, 25000 сайтов с-тус, 1600 сайтов р53 (Cawley et al. 2004) и около 12000 сайтов NF-kB (Martone et al. 2003).

Расположение в геноме участков ДНК, способных связываться с белками

Все идентифицированные участки связывания белков были разделены на две почти равные группы - уникальные и повторяющиеся. К последней группе отнесены последовательности, более чем на 25% состоящие их повторяющихся элементов генома, чаще всего Alu и LINE-последовательностей и длинных концевых повторов (LTR) эндогенных ретровирусов человека. Оба типа участков связывания были нанесены на физическую карту области FXYD5-TZFP (Рис. 11).

Участки связывания белков по их расположению относительно генов можно подразделить на интронные, 3'- и 5'-участки (расположенные не далее, чем в 1 т.п.о. от соответственно 3'- и 5'-концов генов) и межгенные. Как видно из Табл. I, уникальные участки связывания имеют тенденцию располагаться вблизи или внутри генов - только 2 из 25 уникальных сайтов находятся на расстоянии более 1 т.п.о. от соответствующих генов. Напротив, более 50% (14 из 27) участков связывания белков, содержащих повторы, располагаются в межгенных областях.

Лишь небольшая часть (15%) идентифицированных сайтов связывания была найдена в промоторных (5'-) областях генов, что подтверждает наблюдения, сделанные при картировании участков связывания конкретных факторов транскрипции (Cawley et al. 2004; Martone et al. 2003). Основная часть (70%) располагается в нитронах или межгенных областях (Табл. 1). Можно предположить, что эти сайты принадлежат регуляторным элементам, не связанным непосредственно с генами, таким как энхансеры, инсуляторы или локус-контролирующие области (LCR).

Таблица 1. Статистика расположения сайтов связывания белков.

Положение Сайты с Уникальные Всего

относительно генов повторами сайты

3' от гена 3 4 7

5' от гена 2 6 8

Интронный/экзонный 8 13 21

Межгенный 14 2 16

Всего 27 25 52

5 2 I g ass S

2M § § § И J 7 g g S37 39 &

ч-т—^-*--*—* —^Чг-►—*—^-rS>-

1 28 } 4 s JO 63133 34 35 36 38 8

35 1Ö0 L$0 250 2?Ö" ЗЙ0

Т.П.О.

I 1 i 2 i6 I

8

10 12 §41 I < ЛШ 46§47| 18 20 S 24 S О £ 26 27fc

H 1 4---5 tff'&is г , - . ^ ' - ^ ^--------V-

911 40 13 4244 45 19 21 22 49 23 50 2551 52

3(5ö зад i5ö 4?ö 555 sZö

600

т.п.©.

Рис. 11. Расположение участков связывания белков в области FXYD5-TZFP хромосомы 19 человека длиной 500 т.п,о. Гены и их направления транскрипции обозначены горизонтальными стрелками. Вертикальные стрелки обозначают положения участков связывания белков. Указаны следующие гены: FXYD5, содержащий FXYD-домсн регулятор ионного транспорта 5; LISCH7, специфичный для печени фактор транскрипции: USF2. фактор трнаскрипции 2, взаимодействующий с c-fos; НЛМР (Leap-О- антимикробный пептид печени; MAG, птикопротеин, ассоциированный с миелином; CD22, антиген CD22; GPR40. 41, 43, рецепторы, ассоциировавшее с G-белком; UNQ46, ген с неизвестной функцией: ВХ648076, ген с неизвестной функцией; GAPDS, гпицеральдегид-3-фосфэтпегидрогсназа, специфичная для семенников; NIF1E14, белок, содержащий 7 трансмембранных доменов: А1Т4А, альфа-полипептид Н+/К+ АТФ-азы; ВС064390, ген с неизвестной функцией; ETV2, вариант 2 гена ets2; СОХ6В, субъединихи Vlb цитохром-c оксидазы; UPK1A, уроплакин 1 A; and TZFP, белок семенников, содержащий цинковые пальцы.

Идентификация и картирование тканеепецифичных участков связывания белков

Активность основной части цис-регуляторных элементов генома, определяющих структурные и функциональные свойства высших организмов, зависит от типа клеток или тканей, то есть тканеспецифична (\Iaston е< а1. 2006). Тканеспецифичность этих элементов, в свою очередь, определяется тканеспецифичным связыванием с этими элементами ядерных белков, в частности, факторов транскрипции. Присутствие или отсутствие в клетке комплекса регуляторного элемента с соответствующим фактором транскрипции может быть следствием присутствия или отсутствия этого фактора транскрипции в клетке, посттрансляционной модификации фактора, облегчающей или нарушающей его связывание с ДНК, либо модификации (например, метилирования) самого регуляторного элемента.

Последовательности ДНК, связывающие регуляторные белки тканеспецифично, играют важную роль в регуляции активности генома, и их идентификация, клонирование и картирование весьма важно для изучения функциональной активности генома. Учитывая огромное количество цис-регуляторных элементов в геноме, эта задача не может быть решена существующими методами. Для идентификации тканеепецифичных сайтов связывания белков в геномных последовательностях мы разработали метод дифференциального ЕМ5А-дисплея, основанный на процедуре двумерного ЕМБА, и применили его к анализу участка хромосомы 19ч 13.1 человека длиной 137т.п.о.

Процедура двумерного ЕМЯА-дисппея . -

Схема двумерного ЕМвА-дисплея приведена на Рис. 12. На первой стадии используется техника двумерного ЕМБА, описанного в предыдущем разделе. Процедуру двумерного ЕМвА проводили с меченой библиотекой коротких фрагментов, полученной при расщеплении ДНК космид, перекрывающих область хромосомы 19 человека длиной 137 т.п.о., находящуюся внутри области ГХУ05-С0Х7А1, использованной нами ранее для картирования в/МАЛв, и ядерными экстрактами из трех типов клеток - ,1игка1, РАЫС-1 и Нер02. Отобранные после двух циклов селекции фрагменты, связывающиеся с белками каждого из ядерных экстрактов, после мечення 32Р наносили на соседние дорожки денатурирующего ПААГ. Полосы, присутствующие в реакционной смеси из одной линии клеток, и отсутствующие в другой, либо имеющие существенно разную интенсивность, вырезали, амплифицировали при помощи ПЦР и клонировали для дальнейшего анализа.

Таким образом, дифференциальный ЕМЗА-дисплей позволяет выявить и клонировать фрагменты ДНК, образующие различные комплексы с белками при использовании ядерных экстрактов из различных типов клеток или тканей.

| ПЦР, мечеиие 3!Р Электрофорез в денатурирующем ПААГ

Рис. 12. Общая схема ЕМ$А-днсплся. ЛПК-белковые комплексы, полученные при помощи ядерных жирантов нч двух или более линий клеток или тшювтканей при помощи двумерною КМвА (см. соответствующий раздел), радиоактивно мстят н разделяют в соседних дорожках денатурирующего полиакриламидного геля.

Результаты второго цикла 213-ЕМ8А для трех клеточных линий человека приведен на Рис. 13. Области, ограниченные пунктирной линией, были вырезаны из геля, и фрагменты ДНК из них элюированы. После мечения, эти фрагменты разделяли в денатурирующем ПААГ (Рис. 14А). Как видно из рисунка, картины распределения фрагментов ДНК различны для разных типов клеток. Отдельные дифференциальные полосы (обозначены стрелками) вырезали из геля, их ДНК амллифицировали и клонировали.

Некоторые из полос, из-за неидеального разделения в геле, либо неточности при вырезании, могли содержать более одного фрагмента ДНК. В связи с этим для каждой из полос секвенировали по три клона. В результате секвенирования выяснилось, что полосы 2, 7 и 10 (Рис 14А) были представлены единственной последовательностью, полоса 11 - двумя последовательностями (обозначены как 11.2 и 11.3), а полосы 4 и 8 - тремя различными последовательностями (обозначены соответственно 4.1, 4.2, 4.6 и 8.1, 8.2, 8.4. Всего было идентифицировано 11 последовательностей, н их способность связывать ядерные белки тканеспецифично проверена одномерным ЕМБА с ядерными экстрактами из всех трех типов клеток (Рис. 14Б-Ж).

Анализ дифференциальных участков связывания

В соответствии с Рис. 14Б-Ж, идентифицированные последовательности можно разделить на три типа. Первый из них, представленный последовательностью 7, не проявляет тканеспецифичности связывания, и был отнесен к ложноположительным фрагментам. Второй тип последовательностей (фрагменты 2,4.1,4.2,4.6,10 и 11.3) образует единственный тканеспецифичный комплекс с белками. Для этих комплексов характерна низкая электрофоретическая подвижность в случае экстрактов из клеток 1игка1 и РАЖМ, и высокая - для экстракта из клеток Нер02. Наконец, для последовательностей 8.1 -8.4 и 11.2 (третий тип) наблюдалась более сложная картина. Последовательности 8.1 и 8.2 образуют сходные комплексы - единственный с ядерным экстрактом из клеток Зитка^ два комплекса с экстрактом из клеток РАМС-1, и единственный комплекс с высокой электрофоретической подвижностью с экстрактом клеток НерС2. Наблюдалось также несколько минорных комплексов. Фрагмент 11.2 образует дополнительно два не тканеспецифичных комплекса. Фрагмент 8.4 образует ДНК-белковые комплексы с одинаковой подвижностью с ядерными экстрактами из клеток .1игка1 и РАЫС-1, и несколько комплексов с более высокой и низкой подвижностями с экстрактом из клеток НерС2. В целом, как видно из Рис. 14, ядерные экстракты клеток Дигка! и РАЫС-1 дают начала сходным по типу комплексам (кроме фрагмента 8.1), тогда как картина разделения ДНК-белковых комплексов, образуемых экстрактом клеток НерС2, существенно отлична.

В большинстве наблюдавшихся случаев дифференциального связывания белков (7 из 10), различие состояло не в присутствии или отсутствии соответствующего ДНК-белкового комплекса, а в изменении его электрофоретической подвижности. Это изменение может объясняться различным белковым составом комплекса. По-видимому, тканеспецифичное связывание белков различных ядерных экстрактов одной и той же последовательностью

«1игка1

РА1МС-1

......

Рис. 13. Результаты второго цикла двумерного ЕМЭА для ядерных экстрактов из трех линий клеток человека.

11 ■ 10-

ЙВВ» 4"

11.2 11Л С.1РН ОРН

Е

4.2 4.3 4.6 СЛРН СЛРН CJPH

Ж

8.1 8.2 8.4 С.1РН ОРН С.1РН

» 18

_ ей

^^^^^^^^^ ^^^^^^^^

Рис. 14, (А) Результаты ЕМЗА-диСплея. Стрелками укачаны полосы, вырезанные из геля и подвергнутые дальнейшему анализу. (Б-Ж) Результаты НМБА с фрагментами ДНК, вырезанными из геля (А) и клонированными. С - контроль без белка. }. Р, Н - ядерные экстракты клеток .1игка1, РАN0-1 и НерС2. соответственно.

довольно редко подчиняется принципу "есть или нет". Гораздо чаще ДНК-белковые комплексы образуются во всех случаях, но их состав различен.

Примечательно, что совершенно различные последовательности ДНК (11.2 и 11.3, 4.2, 4.3 и 4.6) образуют ДНК-белковые комплексы с практически идентичной электрофоретической подвижностью со всеми тремя ядерными экстрактами. Этот факт можно объяснить двумя способами - во-первых, эти фрагменты ДНК могут иметь короткие гомологичные участки, которые связываются с одним и тем же белковым фактором. Во-вторых, эти фрагменты могут связываться с различными белками, но получившиеся комплексы обладают одинаковой подвижностью.

Чтобы различить две эти возможности, мы провели эксперименты по конкурентному EMSA - в реакционную смесь для EMSA добавляли 30-кратный молярный избыток немеченых той же или других последовательностей (Рис. 1S). Как видно из рисунка, фрагменты 4.2,4.3 и 4.6 связывают один и тот же белковый фактор (факторы). Фрагменты же 11.2 и 11.3 связываются с различными белками (Рис. 1S) и совпадение электрофоретических подвижностей образуемых ими ДНК-белковых комплексов случайно.

Все идентифицированные фрагменты были картированы внутри области хромосомы 19 человека длиной 137 т.п.о. (Рис. 16). Эта область содержит как свободный от генов участок, так и участок, содержащий три близко расположенных гена. Как видно из Рис. 16, участки связывания белков распределены вдоль изучаемой области неравномерно. Пять из 12 участков картируются внутри небольшой (7,6 т.п.о.) области, расположенной на расстоянии около 25 т.п.о. с 5'-стороны от гена LSR, активно экспрессирующегося в печени (Yen et al. 1999). Более того, 2 тканеспецифичных участка связывания располагаются во втором интроне этого гена. ДНК-белковые комплексы, образуемые этими 7 участками с ядерными экстрактами клеток Jurkat и PANC-1, обладают сходной электрофоретической подвижностью и отличаются от комплексов, образуемых с ядерным экстрактом клеток HepG2, что предполагает их участие в регуляции экспрессии гена LSR в печени. Пять участков связывания, расположенных вдали от промоторной области гена LSR могут относиться к не связанным структурно с геном регуляторным последовательностям, таким как энхансеры или локус-контролирующие области (LCR).

Шесть из 10 дифференциальных участков связывания белков располагаются внутри или частично перекрываются с повторяющимися последовательностями, в частности Alu, LINE и LTR эндогенных ретровирусов человека. Такое же распределение уникальных и повторяющихся сайтов связывания было обнаружено нами и для недифференциальных сайтов (см. Табл. 1). Эти данные указывают на то, что повторяющиеся элементы могут

Конкурент -

ЯЭ -

- 4.2 4.3 4.6 Конкурент - - 11.3 11.2 ЯЭ " + + +

Зонд 4.2 Зонд 11.3

Рис. 15. Конкурентный ЕМ5А с зондами клонов 4.2 и 11.3. Фрагменты ДНК, использованные для конкуренции, обозначены над соответствующими дорожками. ЯЭ - ядерный экстракт.

Космнлные клоны

__________________ ас00212в _

И I

•Л

Дифференциальные спи гы свишваннм

«I

4.3| 2|

n.i|

«I ю|

11.31 •16

-4-

-4-

Пар оснований

Рис. 16. Распределение дифференциальных участков связывания ядерных белков. Группы сайтов, образующие различные ДНК-белковые комплексы с белками клеток Jurkat/PANC-1 и HcpG2, и, возможно, участвующие в регуляции транскрипции гена специфичного для печени фактора транскрипции LSR, обведены рамкой.

играть более важную роль в регуляции активности генома, чем предполагалось ранее (ВигсИп 2004).

Идентификация и картирование участков связывания фактора транскрипции CTCF

Нами была разработана модификация метода двумерного EMSA, позволяющая картировать сайты связывания in vitro для конкретных транскрипционных факторов. Модификация заключалась в том, что в эксперименте (см. схему на Рис. 8) вместо ядерного экстракта был использован конкретный белок. С помощью этого метода мы идентифицировали и картировали участки связывания фактора транскрипции CTCF в FXYD5-СОХ7А1 хромосомы 19 человека, и впоследствии подтвердили наличие данных функциональных сайтов in vivo с помощью метода иммунопреципитации хроматина (СЫР). Разработанный нами метод позволяет выявлять и картировать участки связывания транскрипционных факторов на протяженных (несколько млн. п.о.) участках ДНК.

Фактор транскрипции CTCF представляет собой многофункциональный белок, найденный у высших эукариот (Ohlsson et al. 2001), а недавно и у дрозофилы и других насекомых (Gray and Coates 2005; Moon et al. 2005). Первоначально он был идентифицирован как белок, связывающийся с последовательностью СССТС в промоторе гена с-тус курицы (Lobanenkov et al. 1990). CTCF состоит из трех доменов, один из которых включает 11 мотивов "цинковых пальцев". Различные комбинации этих мотивов обеспечивают узнавание различных сайтов связывания и выполнение различных функций (Ohlsson et al. 2001). В частности, его связывание необходимо для проявления активности большинства инсуляторов (Bell et al. 1999).

Получение белка CTCF и его функциональный анализ

Синтез белка CTCF проводили in vitro в сопряженной системе транскрипции/трансляции. В качестве конструкции, несущей полноразмерную кДНК CTCF человека, использовали плазмиду рЕТ7.1, любезно предоставленную 3. Абдуллаевым и В. Лобаненковым (NIH, США).

Отбор фрагментов, связывающихся с CTCF

В качестве источника ДНК для выявления участков связывания транскрипционного фактора CTCF мы использовали ту же библиотеку коротких фрагментов области FXYDS-СОХ7А1 хромосомы 19 человека, что и для идентификации и картирования S/MAR-элементов этой области. Отбор фрагментов, связывающихся с CTCF, проводили в два цикла с применением двумерного электрофореза. Для этого ПЦР-меченые фрагменты анализируемой библиотеки инкубировали с синтезированным в системе in vitro CTCF в тех же условиях, что и белки ядерного экстракта, и разделяли электрофорезом в неденатурирующих условиях. Полосу геля первого направления, содержащую комплексы ДНК-CTCF, инкубировали в SDS-содержащем буфере для освобождения ДНК из комплексов, а затем проводили электрофорез

во втором направлении в денатурирующих условиях. Гель экспонировали с рентгеновской пленкой в течение двух суток, по истечении которых проводили анализ полученных радиоавтографов. На Рис. 17 показан радиоавтограф геля второго направления. Участок, обведенный пунктирной линией, (отсутствующий в том случае, если не добавлять синтезированный CTCF в реакционную смесь перед первым направлением) вырезали, элюировали, и проводили второй раунд селекции по той же схеме.

Амплифицированный при помощи ПЦР набор фрагментов ДНК, полученных в результате двух циклов отбора, клонировали. Для дальнейшего анализа было отобрано 96 колоний. Полученную библиотеку, обогащенную последовательностями, способными к специфическому связыванию с белком CTCF, проверяли на наличие и размер вставок. Из проанализированных 84 клонов 13 содержали двойную вставку, 7 не содержали вставок и далее не анализировались. Остальные 64 клона, которые содержали вставку необходимой длины) были секвенированы. При сравнении нуклеотидных последовательностей между собой было выявлено 10 уникальных последовательностей, которые далее анализировали на их способность связываться с белками клеток HeLa.

Проверка способности обнаруженных фрагментов ДНК связываться с белком CTCF методом иммунопреципитации хроматина

С помощью метода нммунопреципитации хроматина мы проверили способность выявленных нами десяти последовательностей связывать транскрипционный фактор CTCF in vivo в клетках линии HeLa. Выбор клеточной линии обусловлен тем, что, согласно литературным данным в клетках этой линии достаточно высокий уровень экспрессии CTCF (Docquier et al. 2005).

Для иммунопреципитации хроматина мы использовали антитела к транскрипционному фактору CTCF (анти-CTCF), полученные к N-концевому фрагменту белка. В качестве отрицательного контроля проводили преципитацию ДНК-белковых комплексов с неспецифическими антителами, полученными к растительному белку тауматину (любезно предоставлены Е.А. Стукачевой, ИБХ РАН). Для анализа выделенной ДНК проводили ПЦР-амплификацию со специфическими парами праймеров всех десяти последовательностей. Результаты СЫР представлены на Рис. 18А. Как видно, все 10 фрагментов, обнаруженные ранее по способности связываться с CTCF in vitro, амплифицируются с матрицы выделенной ДНК, полученной в результате сшивания геномной ДНК с белками хроматина и последующей преципитации антителами к CTCF (панель "ChIP"). Амплификации фрагментов не наблюдается при использовании неспсцифических антител к растительному белку

1-е направление, EMSA

Фрагменты, связавшие CTCF

Рис. 17. Двумерный сдвиг электрофоретнческой подвижности в присутствии транскрипционного фактора CTCF. синтезированного in vitro.

1__

тауматину (панель "Контроль"). Панель "Input" представляет собой результат амплификации со специфическими парами праймеров фрагментированной геномной ДНК.

В качестве положительного контроля мы амплифицировали фрагмент промотора гена с-тус длинной 150 п.о., способный специфически связываться с CTCF (Filippova et al. 1996). Как видно на Рис. 18Б, при этом образуется продукт ожидаемой длины, в то время, как амплификации фрагмента кодирующей части гена бета-актина (отрицательный контроль) не наблюдается. Можно сделать вывод, что все десять обнаруженных фрагментов связываются с транскрипционным фактором CTCF in vivo в клетках линии HeLa.

Наши данные по связыванию CTCF подтверждают гипотезу о том, что белок, способный связываться с данной последовательностью in vitro, будет способен связываться с этой последовательностью и в составе хроматина. По-видимому, вследствие своей динамической природы, структура хроматина представляет собой лишь относительное препятствие для связывания факторов транскрипции (см. обсуждение в работе Morse 2003).

Картирование и анализ расположения фрагментов, связывающихся с CTCF, в локусе FXYD5-СОХ7А1 19 хромосомы человека

Анализ нуклеотидных последовательностей не выявил каких-либо консенсусных

CTCF-связывающий фрагмент 1 23456789 10

Input

ChIP

Контроль

| о i О

Ч Ч я*

с-лус (3-актин

Рис. 18. ПЦР-анализ ДНК, выделенной методом хромитнн-нммунопрсципитяцни с использованием антител к белку СТСР (Л) Цифры указывают номер идентифицированной последовательности (Табл. 14), амшжфицируемой со специфической парой праймеров. (Б) Положительный (фрагмент промотора с-пц'с) и отрицательный (фрагмент кодирующей области гена бета-актииа) контроли, аыплифицироваиные с ДНК, выделенной с использованием антител к СТСЕ

участков в первичной структуре локуса. Несмотря на то, что белок CTCF называют СССТС связывающим фактором, он также взаимодействует с последовательностями, не содержащими мотив СССТС (Vostrov and Quitschke 1997). Поиск мотива СССТС в обнаруженных нами фрагментах выявил тесть фрагментов, содержащих, по крайней мере, одному такому мотиву. В общей сложности во всех десяти последовательностях с общей протяженностью 3984 п.о. найдено 17 мотивов СССТС, то есть в этих последовательностях СССТС-мотив встречается в четыре раза чаще, чем ожидается для случайно выбранной последовательности, имеющей такую же длину (1 мотив/1024 п.о.). В четырех

последовательностях, в которых отсутствует участок СССТС, найдены похожие мотивы, такие как, СССТТСС и ССТССС.

Если предположить, что частота встречаемости сайтов связывания CTCF в области FXYD5-COX7A1 характерна для всего генома, то суммарное количество мест связывания белка в геноме составит ~30 тыс. Полученное значение согласуется с экспериментально установленным средним размером доменов хроматина, значение которого колеблется в пределах от 80 до 300 т.п.о. (Heng et al. 2001), что соответствует 10-40 тысячам пограничных элементов (инсуляторов) в геноме млекопитающих. Следует учитывать, что CTCF - это многофункциональный фактор, и может помимо инсуляторов связываться и с другими регуляторными элементами. Кроме того, за счет добавления в реакцию связывания ДНК Cotl, нами были в основном выведены из рассмотрения сайты связывания, расположенные в повторяющихся элементах генома, которые могут играть определенную функциональную роль, включая формирование независимых транскрипционных доменов (Willoughby et al. 2000)

Все десять обнаруженных нами, фрагментов были нанесены на карту области FXYD5-СОХ7А1 хромосомы 19 человека (Рис. 19). Семь идентифицированных последовательностей локализованы внутри генов, три в межгенных областях. Чаше всего участки связывания CTCF располагаются в интронах (в некоторых случаях частично перекрываются с небольшими экэонами) генов GAPDS (глицеральдегид-3-фосфатдегидрогеназа, специфичная для яичек), WDR62, кодирующий гипотетический белок с неустановленной функцией; MAG (гликопротеин, ассоциированный с миелином); и CD22 (иэоформа В-клеточного рецептора), а также в З'-нетранслируемой области гена A TP4А (каталитическая а-субъединица Н+/К+-АТФ-аэы, ответственная за поддержание определенной кислотности в желудке). Все указанные гены характеризуются различной тканеспецифической экспрессией.

Так как CTCF связывается с последовательностями, обладающими функциями инсуляторов, некоторые из найденных участков (в основном фрагменты, локализованные в межгенных участках) могут выполнять функции инсуляторных элементов, разграничивая функционально-независимые домены хроматина. Нами были определены три гена, фланкированные с каждой стороны сайтами связывания CTCF, которые могут выполнять роль пограничных элементов: ген, кодирующий а-субъединицу Н+/К+-АТФ-азы, ограниченный фрагментами 2 и 8; ген MAG (myelin-associated glycoprotein), кодирующий гликопротеин, ассоциированный с миелином, фланкированный фрагментами 4 и 5, и ген ТМЕМ147, кодирующий белок, содержащий семь трансмембранных доменов, ограниченный фрагментами 1 и 8. По крайней мере, два из указанных генов характеризуются

» »»

Шгт

43 5 6

Тысяч п.о.

100

?

.. J ? е Е( И

200

300

3 £ §1

187

400~

5 I ё 8

$ 3

3 * -

н!

•» 4-

ш

600

700

800

900

Тысяч П.О.

Рис. 19. Карта области ЕХУй5-СОХ7А 1 хромосомы 19 человека. Горизонтальные стрелки соответствуют известным генам. Вертикальные стрелки обозначают положение идентифицированных нами последовательностей, связывающихся с белком СТСР.

тканеспецифичностью экспрессии, отличающейся от ткаиеспецифичности экспрессии окружающих их генов. Ген А ТР4А, например, экспрессируется преимущественно в слизистой желудка и поджелудочной железе (Oshiman et al. 1991), а ген MAG - преимущественно в нервных тканях (Konat 1996). Можно предположить, что фрагменты, фланкирующие эти гены, способны выполнять роль инсуляторов, образующих петлевые домены хроматина.

Область FXYD5-COX7A1 содержит кластер из четырех генов, кодирующих рецепторы, сопряженные с G-белками: FFAR3, GPR41, GPR42 и FFAR2. Ранее было обнаружено, что гены GPR41 и FFAR2 имеют различные профили экспрессии (Brown et al. 2003). Обнаруженный нами фрагмент 9, расположенный между генами GPR42 и FFAR2, потенциально способен обеспечивать независимую экспрессию этих генов.

Две обнаруженные нами последовательности, связывающиеся с белком CTCF, содержат фрагменты повторяющихся элементов, схожих с Alu-элементами и способные к транспозициям. В литературе нет данных о расположении сайтов связывания CTCF в мобильных элементах генома, однако у некоторых Alu-элементов обнаружены свойства инсуляторов (Willoughby et al. 2000).

Разработанный нами метод позволяет выявлять последовательности, способные связываться и с другими транскрипционными факторами, что чрезвычайно актуально при создании функциональных карт геномов.

3. ИДЕНТИФИКАЦИЯ И КАРТИРОВАНИЕ ПОТЕНЦИАЛЬНЫХ ИНСУЛЯТОРОВ

Ранее мы рассмотрели идентификацию и картирование в геноме человека участков связывания ядерных белков и S/MAR-элементов. В данной главе мы предлагаем подход к идентификации и картированию еще одного класса регуляторных элементов генома -инсуляторов. Инсуляторы - это последовательности ДНК, способные предотвращать нежелательные взаимодействия между регуляторными элементами генома, например между промотором и энхансером, а также, будучи помешенными по краям генетической конструкции (трансгена), вводимой генно-инженерными способами в клетки, образовывать независимый домен и тем самым защищать экспрессию трансгена от эффекта положения (Gaszner and Felsenfeld 2006; Valenzuela and Kamakaka 2006; West and Fraser 200S). В частности, одним из основных свойств инсуляторов является их способность блокировать действие энхансера на промотор только в том случае, если инсулятор располагается между этими элементами. На основе этого свойства мы разработали систему для поиска инсуляторов в длинных геномных последовательностях.

Отбор потенциальных инсуляторов

Для идентификации и картирования потенциальных инсуляторов мы применили эффект блокирования энхансера (Kellum and Schedl 1992) и позитивно-негативную селекцию (ВоггеШ et al. 1988). Общая схема метода представлена на Рис. 20А. Библиотеку коротких фрагментов изучаемой области генома клонируют между промотором и энхансером гена тимидинкиназы вируса простого герпеса (HSV-rt). Вставка фрагмента ДНК, обладающего активностью инсулятора, между промотором и энхансером гена HSV-/Í существенно ингибирует экспрессию этого гена в клетках, стабильно трансфицированных приведенной на Рис. 20А конструкцией, что придает этим клеткам устойчивость к галцикловиру. Геномная ДНК этих клеток используется как матрица для ПЦР с праймерами 1L и 1R, полученные фрагменты ДНК далее клонируют и анализируют.

Для селекции потенциальных инсуляторов нами был сконструирован вектор pPNT/EmP. При конструировании вектора использованы плазмиды pGTN8 и pPNT, любезно предоставленные Е.В.Снежковым. За основу конструкции была взята плазмида pPNT (Tybulewicz et al. 1991), содержащая ген устойчивости к неомицину (Neo*) и ген тимидинкиназы вируса простого герпеса (HSV-/A:), придающий экспрессирующим его клеткам чувствительность к ганцикловиру (GANC), позволяющие проводить позитивно-негативную селекцию. Промотор фосфоглицераткртказы (PGK), управляющий геном тимидинкиназы, был заменен на регуляторную область из плазмиды pGTN8, содержащую минимальный промотор цитомегаловируса (CMV) и энхансер CMV. В результате этой и других модификаций была получена плазмида pPNT/EmP (Рис. 20Б).

В дальнейшем pPNT/EmP была использована в качестве негативного контроля при негативной селекции, придавая содержащим ее клеткам чувствительность к GANC. В качестве положительного контроля была изготовлена плазмида pPNT/mP, содержащая в регуляторной области перед геном тимидинкиназы только мипимальный промотор CMV и придающая клеткам фенотип GANCR.

Источником ДНК для идентификации инсуляторов в области FXYD5-COX7A1 хромосомы 19 человека служила та же библиотека коротких фрагментов этой области, что и для идентификации и картирования S/MAR-элементов этого локуса. Библиотека была амплифицирована при помощи адаптера, содержавшего сайт узнавания Xho I.

Продукты ПЦР, расщепленные Xho I, лигировали с обработанным Sal I вектором pPNT/EmP. В результате лигирования вектора со вставкой утрачивались сайты для рестриктаз Xho I и Sal I. Для предотвращения трансформации клеток векторами, не содержащими вставки, лигазная смесь предварительно была обработана Sal 1.

А

Набор космид, перекрывающий область FXYDS-COX7A1 хромосомы 19 человека

Расцншлытс San ЗА, Cspé-l Пржаслиш-нис ядяитеров, Г1ЦР Расшеплеиие Xho 1

PGK-Pr

CMV-Enh

HSV-tk

Glcl CMV CMV

iÚtod эитаысер «ишимлквый

™ ^ проышар

Траисфекцин клеток, отбор с помощью G418 Селекции ганциклоииром, ПЦР Клонирование, секвенирование

Рис. 20. (А) Общая схема отбора ннсуляторов. mPGK.1 - промотор фосфоглицераткиназы человека; Neo*-геи неомицинфосфотрансферазы; HSV-/A- - ген тимидннкияазы вируса простого герпеса. (Б) Схема плазмиды pPNT/EraP для позитивно-негативной селекции ннсуляторов.

Последовательность области РХУ05-С0Х7А1 длиной 1 млн. п.о. при расщеплении образует около 2000 фрагментов со средней длиной 500 п.о. Учитывая то, что для повышения представительности библиотеки исходная ДНК была расщеплена независимо двумя различными ферментами (5ш/ЗА и Схрб-1, см. Материалы и методы), число различных фрагментов возросло до 4000. Следовательно, для получения представительной библиотеки с не менее чем трехкратным перекрыванием изучаемой области необходимо было получить не менее 12000 независимых клонов. Для получения такой представительности библиотеку выращивали на чашках Петри, после чего -12000 колоний были суспендированы в жидкой среде из. Из этой суспензии и был выделен пул плазмид рРЫТ/ЕтР, содержащих короткие вставки, перекрывающие изучаемую область генома. Далее этим пулом трансфицировали клетки СНО. Параллельно были проведены контрольные трансфекции плазмидами рРЫТ/ЕтР (без вставки) и рРЫТ/шР, не содержащей энхансера. Последняя плазмида использовалась как положительный контроль на инсуляторную активность.

Клетки с интегрированными в геном конструкциями были отобраны селекцией на устойчивость к генетицину (0-418), и из устойчивых к генетицину клеток далее проводили отбор при помощи ганцикловира. Селекция ганцикловиром приводила к 100% гибели клеток, содержащих придающую им чувствительность к этому антибиотику плазмиду рР>0Т/ЕтР (без вставок). В то же время большинство клеток, содержащих контрольную плазмиду рРЫ'Г/тР, оказалось устойчивой к ганцикловиру. Наблюдавшееся все же незначительное число

погибших клеток является, по всей видимости, следствием интеграции pPNT/mP в области генома, подверженные активации эндогенными энхансерами.

Анализ отобранных клонов

После селекции клеток, трансфицированных pPNT/EmP с лигированным пулом коротких фрагментов, выделяли геномную ДНК из устойчивых к ганцикловиру клеток и использовали ее как матрицу для ПЦР с праймерами 1L и 1R (Рис. 20А). Результаты ПЦР приведены на Рис. 21 А. Можно видеть, что исходный набор фрагментов ДНК (дор. 1) после клонирования в pPNT/EmP, трансфекции и позитивно-негативной селекции переходит в ограниченный набор фрагментов (дор. 2). При использовании для ПЦР ДНК-матрицы, полученной из контрольных клеток, трансфицированных плазмидой pPNT/EmP (без селекции ганцикловиром) получается единственная полоса, соответствующая фрагменту ДНК, амплифицируемому праймерами 1L и 1R на плазмиде без вставки (дор. 3). При использовании ДНК-матрицы из клеток, трансфицированных pPNT/mP, продукта не наблюдается, т.к. эта конструкция не содержит последовательности праймера 1L.

Отобранные фрагменты ДНК (Рис. 21 А, дор. 2) были клонированы, и полученные клоны проверены на наличие и размер вставок при помощи ПЦР с праймерами 1L и 1R (Рис. 21 Б). Можно видеть, что все проверенные клоны содержали вставки. 20 вставок были секвенированы, при этом было получено 8 независимых последовательностей.

Нужно отметить, что ген тлмидинкиназы в процессе отбора мог подвергнуться мутациям, нарушающим активность бежа. Кроме того, экспрессия тимидинкиназы в некоторых клетках могла быть селективно ингибирована за счет регуляторных элементов генома, расположенных вблизи интегрированной конструкции. В обоих случаях клетки могли стать устойчивыми к ганцикловиру, и последовательности ДНК, полученные из таких клеток, ошибочно идентифицированы как инсуляторы. Чтобы устранить такую возможность, мы провели дополнительный цикл селекции, в котором все 8 полученных потенциальных инсуляторов были поодиночке клонированы в рРКТ/ЕшР и вновь трансфицированы в клетки СНО. Все трансфицированные клетки оказались устойчивыми к ганцикловиру, что доказывает правильность отбора данных последовательностей.

Экспрессия гена HSV-лк может быть ингибирована и в тех случаях, когда клонированный в pPNT/EmP геномный фрагмент обладает не инсуляторной, а сайленсерной активностью (Brand el al. 1985; Laimins et al. 1986). Так как активность сайленсера, в

; 1 2 М 3 4

ШтШ

п.о. шшттш

1000* «и—.

750 ► _

500 ► Шщ щШ щщ * щ A

250 ►

м

п.о. , .. . . .,. .

ИМИ)* 750 ► ШМШ ^

500 ► mm - д...

250 ► —

Рис. 21. (А) Результаты процедуры селекции. ПЦР амплификация с лраймерами 11. и I (I (см. Рис. 42Б). Матрицами для ПЦР служили: дор. I - пул плазмид до траисфекции, дор 2 - геномная ДНК клеток, трансфицированных библиотекой коротких фрагментов, клонированных в векторе рРЖУНтР после позитивной (0418) и негативной (ОАЫС) селекций, дор. 3 - геномная ДНК из клеток, трансфицированных исходной плазмидой рРЫТ/ЕшР (без селекции ОАМС), дор. 4 - геномная ДНК клеток, трансфицированных плазмидой рРМТ-тР. (Б) ПЦР амплификация с нраймераыи 11. и IК 12 случайных клонов из бибшютеки инсуляторов. М - I т.и.о. ДНК маркер (Снбзнзим).

отличие от иисулятора, не зависит от положения и ориентации относительно промотора, то при конструировании вектора мы предположили, что сайленсер будет подавлять активность не только тимидинкиназы, но и находящегося неподалеку гена устойчивости к неомицину, и такие клетки будут погибать на стадии селекции G-418. Для проверки эффективности этого процесса мы клонировали три из идентифицированных последовательностей (№ 2, 5 и 8, см. ниже) в плазмиду pGL3-promoter vector с 5'-стороны от промотора SV-40 и измерили люциферазную активность такой конструкции при транзиентной трансфекции в клетки HeLa относительно исходного вектора. Во всех трех случаях сайленсерной активности не наблюдалось.

Хорошо известно, что большинство инсуляторов высших организмов способны связывать фактор транскрипции CTCF, принимающий участие в блокировании энхансера (Ohlsson et al. 2001). Для проверки способности потенциальных инсуляторов связывать CTCF, мы провели эксперименты по иммунопреципитации хроматина для 7 из 8 отобранных нами последовательностей. Последовательность 8 состоит в основном из повторяющегося элемента Alu, что делает практически невозможным подбор к ней качественных праймеров для ПЦР. Как видно из Рис. 22, все 8 фрагментов с потенциальной инсуляторноб активностью, амплифицируются с матрицы ДНК, полученной в результате сшивания геномной ДНК с белками хроматина и последующей преципитации антителами к CTCF (панель "ChIP"). Амплификации фрагментов не наблюдается при использовании неспецифических антител к растительному белку тауматину (панель "Контроль"). Панель "Input" представляет собой результат амплификации со специфическими парами праймеров фрагментированной геномной ДНК. Положительный и отрицательный контроли аналогичны Рис. 18Б (не показано).

Можно сделать вывод, что все фрагменты связываются с транскрипционным фактором CTCF in vivo в клетках линии HeLa.

Если допустить, что содержание потенциальных инсуляторов в изученной области типично для всего генома человека, можно оценить количество инсуляторов в геноме в 20000. Эта цифра вполне согласуется со средней длиной хроматинового домена, определенной из эксперимента как 80-300 т.п.о. (Heng et al. 2001), что соответствует примерно 10000-40000 пограничных элементов на геном млекопитающих.

4.13.3. Расположение инсуляторов в геномной последовательности

Восемь фрагментов ДНК со свойствами потенциальных инсуляторов были картированы в области FXYD5-COX7AI хромосомы 19 человека (Рис. 23). Из них 5 последовательностей были найдены в межгенных областях, две - в интронах, и одна последовательность перекрывала два коротких экзона и один короткий кнтрон. Было обнаружено, что два гена фланкированы инсуляторами с обеих сторон - ген альфа-полипептида Н+/К+ АТР-аэы (АТР4А) ограничен инсуляторами 5 и 1, а ген белка, сходного с предшественником бета-амилоида (APLP1) ограничен инсуляторами 4 и 8 (Рис. 23). Для обоих генов характерна строгая тканеспецифичность экспрессии -АТР4А экспрессируется в слизистой оболочке желудка (Oshiman et al. 1991), a APLP1 - в нервных тканях (Wasco et al. 1992). Эти данные согласуются с представлением о том, что инсуляторы подразделяют геномную ДНК на петлевые домены, содержащие гены со сходными профилями экспрессии (Bell et al. 2001).

Область FXYD5-COX7A1 содержит также кластер генов, кодирующих рецепторы, ассоциированные с G-белком - FFAR2, FFAR3, GPR41 и GPR42. Ранее было обнаружено, что GPR41 и FFAR2 имеют различные профили экспрессии, a GPR42 предположительно является неактивным псевдогеном GPR41 (Brown et al. 2003). Положение потенциального инсулятора 6, находящегося между GPR41 и FFAR2, согласуется с независимой экспрессией этих генов.

Пять из восьми найденных инсуляторов содержат фрагменты повторяющихся последовательностей, в основном ретротранспозонов. Так, инсулятор 1 содержит фрагмент длинного диспергированного элемента LINE (Kazazian and Goodier 2002), а инсулятор 8 -длинный концевой повтор эндогенного ретровируса человека ERV1 (Renan and Reeves 1987). Последовательности 2, 4 и 7 частично перекрываются с Alu-элементами. Было показано, что некоторые Alu-элементы обладают активностью инсуляторов. Например, был описан Alu-элемент, расположенный в 5'-некодирующей области гена кератина 18 мыши и способный защищать трансген от эффекта положения (Recillas-Targa et al. 2004). Ретротранспозиция элементов Alu и LINE, таким образом, может быть одним из механизмов перестройки доменной структуры хроматина (Arnold et al. 2000). Можно предположить, что одной из

Отобранные инсуляторы 1 2 3 4 5 6 7

Input ChIP Контроль

Рис. 22. ПЦР-анализ ДНК, выделенной методом хроматии-иммунопреципигации с использованием антител к белку CTCF. Цифры указывают номер идентифицированной последовательности, амплифицируемой со специфической парой прнймеров.

регуляторных функций ретроэлементов является их участие в образовании функциональных доменов. Подобное предположение высказывалось нами ранее для ретроэлементов, содержащих S/MARs.

Нужно отметить, что изученная область может содержать и другие инсуляторы, которые не были идентифицированы из-за ограниченных возможностей использованного подхода. Идентифицируемые при данном подходе инсуляторы должны быть активны в клетках СНО и по отношению к промоторно-энхансерной паре цитомегаловируса, таким образом некоторые ткане- или энхансер-специфичные инсуляторы могли быть пропущены. Эти недостатки, однако, могут быть преодолены путем использования других клеточных линий и промоторно-энхансерных конструкций. Таким образом, несмотря на перечисленные недостатки, предложенный подход может стать важным инструментом функциональной геномики.

4. ЗАКЛЮЧЕНИЕ. ПЕРВЫЙ ВАРИАНТ ИНТЕГРАЛЬНОЙ КАРТЫ ФУНКЦИОНАЛЬНЫХ ЭЛЕМЕНТОВ

Основной задачей при экспериментальном картировании цис-регуляторных элементов генома является получение достаточно полной библиотеки фрагментов ДНК, содержащих эти элементы. В идеале такая библиотека должна содержать все активные в данном типе клеток регуляторные элементы и не содержать ничего кроме них. В этом случае построение карты расположения данных элементов в секвенированном геноме может быть сведено к массированному секвенированию (Barski et а). 2007; Bentley 2006) этой библиотеки с последующей привязкой полученных сиквенсов к последовательности генома, либо же к картированию этих же фрагментов при помощи гибридизации с геномными микрочипами (Mockler et al. 2005; Shields 2006).

Нами предложен ряд экспериментальных подходов для получения высокообогащенных клонотек фрагментов ДНК, содержащих регуляторные элементы генома - участки прикрепления ДНК к ядерному матриксу, инсуляторы и участки связывания факторов транскрипции и других ядерных белков.

Описанные подходы можно разделить на две группы. В первую группу входят методы, которые можно назвать структурными, т.е. из генома или его части отбираются и клонируются фрагменты, способные к структурным взаимодействиям с белками (картирование сайтов связывания белков с ДНК) либо субклеточными структурами (картирование S/MARs). Вторую группу составляют функциональные подходы, обычно использующие "метод репортерного гена", т.е. отбираются фрагменты ДНК, обладающие

40400000

40500000

40600000

40700000

40800000

4090Q0Q0

Промоторы Энхансеры SMARs

Инсуляторы

Участки связывания CTCF Участки связывания бел ко» Транскрибируемые областв

II

I I

I I

I I

I II

I III IIIHIIIIII

FXYD5 Ж LSR HM CD22 4M

П1ЕМ162 Ц НАМР Ц FFAKJ \

U FFAR3 *

USF2 ГЧ GPR42 |

ШСЧМ

II

Ulli Ulli

IIH I 11 IIIIII II I III nillllll III

III

I I

11

FFAR2 I DMKX |

UNQ467 I АТР4Л fl SBSN Ц GAPDHS №1 TMEMI47 I

I I I IIIIII I HIB

TZFP 4

KIAA084J |H I ETV2 I

MGC10433 Ml

COX6B1 4H upkia HH

Рис. 23. Первый вариант интегрированной карты функциональных элементов области хромосомы 19 человека длиной 500т.п.о., находящейся между генами FXYD5 и TZFP Обозначены положения промоторов (Kim et al. 2005а), энхансеров (С.Б. Акопов и соавт., в печати), транскрибируемых последовательностей (Carninci 2006), а также по результатам данной работы S/MAR-элементов, иисуляторов, участков связывания фактора транскрипции CTCF и участков связывания ядерных белков. Карта построена при помощи Human Genome Browser (Kent 2002), сборка мая 2004 г.

функциональной активностью при клонировании их в систему, после трансфекции придающую клеткам какой-либо легко обнаруживаемый признак - устойчивость к антибиотику либо способность к флюоресценции. Таким методом можно отобрать из генома и клонировать фрагменты ДНК, обладающие промоторной, энхансерной, инсуляторной и другими активностями. Мы продемонстрировали пригодность разработанных подходов для построения функциональных карт на примере длинных мультигенных участков хромосомы 19 человека.

Важнейшей особенностью распределения регуляторных элементов в геноме является его тканеспецифичность. Очевидно, что картина распределения регуляторных элементов одного и того же генома может быть различной для различных типов клеток и тканей, стадий дифференцировки клеток и даже различных состояний ткани и организма. В рамках данной работы нами предложен метод сравнения двух или более типов клеток по распределению в их геномах участков связывания белковых факторов (метод ЕМБА-дисплея).

На основании полученных нами в данной работе и имеющихся литературных данных мы построили первый вариант интегрированной карты регуляторных последовательностей для области хромосомы 19 человека длиной 500 т.п.о., расположенной между генами РХУИЗ и 7ТЯР (Рис. 23). Полученная карта пока далека от завершения, особенно в части тканеспецифичности действия приведенных регуляторных последовательностей. Тем не менее, она дает представление о сложности регуляторной системы генома и о трудности их исследования. Мы надеемся, что предложенные в настоящей работе методы позволят в обозримом будущем создать более исчерпывающие функциональные карты как отдельных областей, так и полных геномов.

5. ОСНОВНЫЕ ВЫВОДЫ

1. Сформулирован подход к функциональному картированию геномов, заключающийся в

построении подробных карт, включающих все или большую часть цис-регуляторных элементов относительно небольших (несколько млн. п.о.) областей генома.

2. Разработан универсальный метод идентификации участков прикрепления ДНК к ядерному

матриксу (S/MARs). При помощи этого метода идентифицировано и картировано 22 S/MARs, находящихся на хромосоме 19 человека, а также повторяющийся S/MAR-элемент, связанный с семейством генов карциноэмбриональных антигенов (CEA-MAR). Высказано предположение о том, что дупликация генов семейства может происходить по границам петлевых доменов хроматина.

3. В области FXYD5-COX7A1 хромосомы 19 человека длиной 1 млн.п.о. идентифицировано и

картировано 16 S/MAR-элементов, а в области потери гетерозиготности при раке легких q22.1 хромосомы 1 б человека длиной 2,9 млн.п.о. - 40 S/MAR-элементов.

4. Выявлен подкласс S/MAR-элементов, не обогащенных АТ-парами оснований и

обращенными повторами и показано, что S/MARs могут располагаться не только в межгенных областях, но и в интронах генов, а также в их З'-нетранслируемых областях.

5. Показано, что некоторые представители повторяющихся элементов семейства LINE

обладают предпочтительным сродством к ядерному матриксу.

6. Разработан метод двумерного сдвига электрофоретической подвижности (EMSA), с

помощью которого в области FXYD5-TZFP хромосомы 19 человека длиной 560 т.п.о. идентифицированы и картированы 52 участка, специфически связывающих ядерные белки. Показано, что участки связывания белков не располагаются преимущественно в 5'-областях генов, а могут с большой частотой обнаруживаться в интронах и 3'-некодирующих участках.

7. Разработан метод EMSA-дисплея, способный идентифицировать тканеспецифичные

участки связывания белков. С его помощью идентифицированы 10 фрагментов ДНК, образующие различные комплексы с ядерными белками в разных типах клеток.

8. Разработан метод идентификации участков связывания ядерных белков на основе

иммуномагнитной сепарации. При помощи этого метода выявлено и картировано 20 последовательностей хромосомы 19 человека, способных связываться с белком Мах.

9. Разработана система поиска инсуляторов в протяженных геномных последовательностях. В

области FXYD5-COX7A1 хромосомы 19 человека идентифицированы и картированы восемь потенциальных инсуляторов. Методом иммупопреципитации хроматина показано, что семь из восьми потенциальных инсуляторов способны связываться с фактором транскрипции CTCF.

10. С помощью двумерного EMSA выявлены 10 участков области FXYD5-COX7AI хромосомы 19 человека длиной 1 млн.п.о., способных специфически связываться с фактором транскрипции CTCF in vitro и in vivo. Показано, что семь из десяти последовательностей расположены внутри генов (преимущественно в интронах), три расположены в межгенных участках локуса.

11. Построен прототип карты функциональных элементов для области хромосомы 19 человека длиной -600 т.п.о.

ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ

Обзоры

1. Nikolaev, L.G., S.B. Akopov, I.P. Chernov, E.D. Sverdlov. 2007. Maps of cis-regulatory nodes in megabase long genome segments are an inevitable intermediate step toward whole genome functional mapping. Current Genomics 8:137-149.

2. Акопов, С.Б., И.П. Чернов, A.C. Ветчинова, C.C. Буланенкова, Л.Г. Николаев. 2007. Идентификация и картирование цис-регуляторных элементов внутри длинных геномных последовательностей. Молек. биология 41:787-792.

3. Акопов, С.Б., И.П. Чернов, С.С. Буланенкова, Ю.В. Скворцова, А.С. Ветчинова, Л.Г. Николаев. 2007. Методы идентификации эпигенетических элементов млекопитающих в длинных мультигенных геномных последовательностях. Биохимия 72:725-732.

4. Чернов, И.П., С.Б. Акопов, Л.Г. Николаев. 2004. Структура и функции участков прикрепления ДНК к ядерному матриксу (S/MARs). Биоорганич. химия 30:1 -11.

Статьи

5. Shaposhnikov, S.A., S.B. Akopov, I.P. Chernov, P.D. Thomsen, C. Joergensen, A.R. Collins, E. Frengen, L.G. Nikolaev. 2007. A map of nuclear matrix attachment regions within the breast cancer loss of heterozygosity region on human chromosome 16q22.1. Genomics #9:354-361.

6. Chernov, I.P., K.A. Timchenko, S.B. Akopov, L.G. Nikolaev, E.D. Sverdlov. 2007. Identification of tissue-specific DNA-protein binding sites by means of two-dimensional electrophoretic mobility shift assay display. Anal. Biochem. 364:60-66.

7. Vetchinova, A.S., S.B. Akopov, I.P. Chernov, L.G. Nikolaev, E.D. Sverdlov. 2006. Two-dimensional electrophoretic mobility shift assay: identification and mapping of transcription factor CTCF target sequences within an FXYD5-COX7A1 region of human chromosome 19. Anal. Biochem. 354:85-93.

8. Chernov, I.P., S.B. Akopov, L.G. Nikolaev, E.D. Sverdlov. 2006. Identification and mapping of DNA binding proteins target sequences in long genomic regions by two-dimensional EMSA. BioTechniques 41.90-96.

9. Akopov, S.B., V.M. Ruda, V.V. Batrak, A.S. Vetchinova, I.P. Chernov, L.G. Nikolaev, J. Bode, E.D. Sverdlov. 2006. Identification, genome mapping, and CTCF binding of potential insulators within the FXYD5-COX7A1 locus of human Chromosome 19ql3.12. Mamm. Genome /7.10421049.

10. Сасс, A.B., B.M. Руда, С.Б. Акопов, E.B. Снежков, Л.Г. Николаев, Е.Д. Свердлов. 2005. Регуляторный потенциал S/MAR-элементов при транзиентной экспрессии. Биоорганич. химия 31:77-81.

11. Iarovaia, O.V., S.B. Akopov, L.G. Nikolaev, E.D. Sverdlov, S.V. Razin. 2005. Induction of transcription within chromosomal DNA loops flanked by MAR elements causes an association of loop DNA with the nuclear matrix. Nucleic Acids Res. 55:4157-4163.

12. Chernov, I.P., S.B. Akopov, L.G. Nikolaev, E.D. Sverdlov. 2002. Identification and mapping of nuclear matrix attachment regions in a one megabase locus of human chromosome 19ql 3.12: Long-range correlation of S/MARs and gene positions. J. Cell. Biochem. 84:590-600.

13. Bode, J., T. Schlake, M. Iber, D. Schubeler, J. Seibler, E. Snezhkov, L. Nikolaev. 2000. The transgeneticist's toolbox: novel methods for the targeted modification of eukaryotic genomes. Biol. Chem. 557. 801-813.

14. Чернов, И.П., A.C. Поляков, С.Б. Акопов, Л.Г. Николаев, Т.Л. Ажикина, М.Б. Костина, Е.Д. Свердлов. 1999. Идентификация и картирование на хромосоме 19 человека хромосомспецифического повторяющегося элемента, предпочтительно связывающегося с ядерным матриксом. Биоорганич. химия 25:355-361.

15. Николаев, Л.Г., С.Б. Акопов, И.П. Чернов, Б.О. Глотов, Л.К. Эшворт, Е.Д. Свердлов. 1998. Расположение 19 участков связывания ДНК с ядерным матриксом (MARs) на хромосоме 19 человека. Доклады РАН 36/.-409-411.

16. Акопов, С.Б., Л.Г. Николаев, О. Тырсин, А.С. Руэов, Е.Д. Свердлов. 1997. Идентификация и характеристики 14 последовательностей генома китайского хомячка, предпочтительно связывающихся с ядерным матриксом. Биоорганич. химия 25. 727-731.

17. Nikolaev, L.G., Т. Tsevegiyn, S.B. Akopov, L.K. Ashworth, E.D. Sverdlov. 1996. Construction of a chromosome specific library of human MARs and mapping of matrix attachment regions on human chromosome 19. Nucleic Acids Res. 24.1330-1336.

18. Николаев, Л.Г. 1996. Идентификация и выделение белков, узнающих последовательность энхансера HIV-1. Молек. биология 50:714-720.

19. Volik, S., Y. Lebedev, L. Nikolaev, Y. Shevchenko, T. Vinogradova, E. Kopantzev, T. Kolesnik, G. Monastyrskaya, U. Kunz, K.H. Grzeschik, E.D. Sverdlov. 1995. Mapping of transcribed sequences on human chromosome 19. DNA Seq. 6:13-26.

20. Николаев, Л.Г., Ц. Цоггхишиг, С.Б. Акопов, Е.Д. Свердлов. 1995. Картирование на хромосоме 19 человека последовательностей, предпочтительно связывающихся с ядерным матриксом. Биоорганич. химия 27:959-963.

Подписано в печать 04.04.2008 Печать трафаретная

Заказ № 240 Тираж: 100 экз.

Типография «11-й ФОРМАТ» ИНН 7726330900 115230, Москва, Варшавское ш., 36 (495) 975-78-56, (499) 788-78-56 www.autoreferat.iu

р-39б$

2007500292

Содержание диссертации, доктора биологических наук, Николаев, Лев Григорьевич

Список сокращений

1. Введение

2. Обзор литературы. Идентификация и картирование 1<ис-регуляторных элементов внутри длинных геномных последовательностей

2.1. Структура, функции и геномное расположение участков прикрепления ДНК к ядерному матриксу (в/МАИ«)

2.1.1. Упаковка генетического материала в клеточном ядре

2.1.2. Ядерный матрикс и ядерный скэффолд

2.1.3. ДНК в составе ядерного матрикса и ее свойства. Определение и способы получения ДНК ядерного матрикса

2.1.4. Б/МАЯ-элементы

2.1.5. Структурные особенности ДНК ядерного матрикса

2.1.6. Образование петельных доменов

2.1.7. Нейтрализация эффекта положения

2.1.8. Б/МАЯз как участки интеграции ретровирусных векторов

2.1.9. Белки, специфически связывающиеся с Б/МАЯ^

2.1.10. Б/МАЯз и петельные домены хроматина

2.1.11. Интронные Э/МАЯз

2.1.12. Б/МАЯз и другие регуляторные элементы генома

2.2. Методы массированной идентификации и картирования г<«с-регуляторных элементов

2.2.1. Промоторы

2.2.2. Энхансеры/сайленсеры

2.2.3. Картирование инсуляторов

2.2.4. Участки начала репликации

2.2.5. Участки связывания ядерных белков

2.3. Идентификация эпигенетических элементов млекопитающих в длинных мультигенных геномных последовательностях

2.3.1. Картирование метилированных СрО сайтов

2.3.2. Идентификация открытых и закрытых участков хроматина

2.3.3. Картирование участков хроматина, содержащих модифицированные гистоны

2.3.4. Картирование участков гиперчувствительности ДНК к ДНК-азе I

3. Материалы и методы

3.1. Стандартные методики

3.2. Культуры клеток

3.2.1. Использованные культуры клеток

3.2.2. Трансфекция клеток с использованием реагента Lipofectin

3.2.3. Трансфекция клеток электропорацией

3.3. Компьютерный анализ

3.4. Получение ядерного матрикса из культур клеток

3.4.1. Выделение препаратов ядерного матрикса из культур клеток высокосолевым методом

3.4.2. Выделение ядерного матрикса методом LIS экстракции

3.5. Получение и анализ библиотеки последовательностей, предпочтительно связывающихся с высокосолевым ядерным матриксом

3.5.1. Выделение ДНК фаговой библиотеки хромосомы

3.5.2. Расщепление рестриктазами и присоединение синтетических линкеров

3.5.3. Селекция фрагментов ДНК, связывающихся с высокосолевым ядерным матриксом in vitro

3.6. Связывание меченых фрагментов ДНК с ядерным матриксом in vitro

3.7. Идентификация и картирование S/MARs на хромосоме 19 человека

3.7.1. Проверка видоспецифичности полученных клонов

3.7.2. Получение меченых фрагментов ДНК при помощи ПЦР

3.7.3. Гибридизация с космидными библиотеками хромосомы 19 с использованием фильтров высокой плотности

3.7.4. Проверка результатов гибридизации с помощью ПЦР и определение местоположения S/MARs в космидном контиге

3.8. Идентификация S/MARs в локусах хромосом 16 и 19 человека

3.8.1. Получение библиотеки коротких фрагментов ДНК

3.8.2. Селекция фрагментов ДНК, связывающихся in vitro с ядерным матриксом, полученным методом экстракции LIS

3.9. Идентификация сайтов связывания фактора транскрипции CTCF 51 3.9.1. Получение белка CTCF в бесклеточной системе

3.9.2. Селекция методом двумерного EMSA фрагментов, содержащих участки, способные связываться с транскрипционным фактором CTCF

3.10. Идентификация участков связывания фактора транскрипции Мах

3.11. Идентификация сайтов связывания белков ядерного экстракта

3.11.1. Приготовление ядерных экстрактов из клеток в культуре

3.11.2. Обработка космид А ТФ-зависимой экзонуклеазой

3.11.3. Селекция методом двумерного EMSA фрагментов, содержащих участки, способные связываться с белками ядерного экстракта

3.11.4. Дифференциальный дисплей

3.12. Иммунопреципитация хроматина

3.13. Получение библиотеки инсуляторов 56 4. Результаты и их обсуждение

4.1. Идентификация, геномное картирование и функциональный анализ участков прикрепления ДНК к ядерному матриксу (S/MARs)

4.2. Картирование последовательностей, предпочтительно связывающихся с ядерным матриксом, на хромосоме 19 человека

4.2.1. Конструирование библиотеки коротких фрагментов

4.2.2. Отбор клонов, принадлежащих хромосоме 19 человека

4.2.3. Связывание клонов библиотеки с ядерным матриксом in vitro

4.2.4. Прочно связанная с матриксом ДНК и S/MAR-клоны

4.2.5. Анализ первичной структуры S/MAR-кпонов

4.2.6. Повторяющиеся элементы генома связываются с ядерным матриксом

4.2.7. Картирование S/MAR-клонов на хромосоме

4.3. Последовательности генома китайского хомячка, предпочтительно * связывающихся с ядерным матриксом

4.3.1. Определение коэффициента связывания S/MARs китайского хомячка с ядерным матриксом

4.3.2. Анализ первичной структуры S/MARs

4.3.3. Матрикс-связывающие свойства повторяющихся последовательностей

4.4. CEA-MAR - повторяющийся S/MAR элемент на хромосоме 19 человека

4.4.1. Характеристика повторяющегося S/MAR-элемента

4.4.2. Расположение CEA-MAR-элемента на хромосоме 19 человека

4.4.3. Первичные структуры CEA-MAR-элементов

4.5. Идентификация и картирование S/MARs в локусе FXYD5-COX7A1 хоромосомы 19 человека

4.5.1. Конструирование библиотеки фрагментов ДНК, предпочтительно связывающихся с ядерным .матриксом

4.5.2. Анализ библиотеки S/MARs при помощи ПЦР

4.5.3. Определение коэффициента связывания клонов библиотеки с ядерным матриксом in vitro

4.5.4. Анализ первичной структуры S/MAR клонов

4.5.5. Компьютерный анализ секвенированных клонов и их картирование

4.5.6. S/MAR-элементы внутри генов

4.5.7. Функционирование идентифицированных S/MARs in vivo

4.6. Идентификация и картирование S/MARs в области потери гетерозиготности при раке легких q22.1 хромосомы 16 человека

4.6.1. Получение и анализ S/MAR-элементов

4.6.2. Анализ первичной структуры S/MAR

4.6.3. Предсказание полоэюений S/MARs в геноме in silico

4.6.4. Карта S/MARs в области 16q22.

4.6.5. Гипотетические домены хроматина в области 16q22.

4.7. Регуляторный потенциал S/MAR-элементов при временной экспрессии

4.8. Крупномасштабная идентификация и картирование участков связывания ядерных белков

4.9. Идентификация и картирование участков связывания ядерных белков в области FXYD5-TZFP хромосомы 19 человека

4.9.1. Метод двумерного сдвига электрофоретической подвижности (2D-EMSA)

4.9.2. Получение и анализ библиотеки участков связывания белков из области FXYD5-TZFP хромосомы 19 человека

4.9.3. Общее число участков связывания ядерных белков в области FXYD5-TZFP

4.9.4. Расположение участков связывания белков в геноме

4.10. Идентификация и картирование тканеспецифичных участков связывания белков

4.10.1. Процедура двумерного EMSA-дисплея

4.10.2. Анализ дифференциальных участков связывания

4.11. Идентификация и картирование участков связывания фактора транскрипции CTCF

4.11.1. Получение белка CTCF и его функциональный анализ

4.11.2. Отбор фрагментов, связывающихся с CTCF

4.11.3. Проверка способности обнаруженных фрагментов ДНК связываться с белком СТСЕ методом иммунопреципитации хроматина 131 4.11.4. Картирование и анализ расположения фрагментов, связывающихся с CTCF, в локусе

FXYD5-COX7A1 19 хромосомы человека

4.12. Идентификация участков связывания фактора транскрипции Мах

4.12.1. Получение библиотеки коротких фрагментов хромосомы 19 человека и характеристика белка Мах

4.12.2. Схема идентификации и картирования участков связывания белка Мах

4.12.3. Характеристика Мах-связывающихся последовательностей

4.12.4. Анализ геномного окружения идентифицированных последовательностей

4.12.5. Транскрипция генов, предположительно регулирующихся системой Max/Myc/Mad

4.13. Идентификация и картирование потенциальных инсуляторов

4.13.1. Отбор потенциальных инсуляторов

4.13.2. Анализ отобранных клонов

4.13.3. Расположение инсуляторов в геномной последовательности

Введение Диссертация по биологии, на тему "Экспериментальные подходы к идентификации и картированию ЦИС-регуляторных элементов в протяженных областях генома человека"

Сейчас, когда закончено определение нуклеотидных последовательностей нескольких геномов млекопитающих (Lander et al. 2001; Venter et al. 2001; Waterston et al. 2002), главной задачей функциональной геномики становится изучение регуляторных механизмов, определяющих фенотипическое разнообразие живых организмов. Считается, что в геноме млекопитающих имеется 20000-30000 генов, кодирующих белки; однако последние данные указывают на то, что транскрибируется существенно большая часть генома (Carninci 2006). Вся совокупность генов и транскрибируемых областей генома многоклеточных организмов связана в сложнейшую регулируемую сеть, определяющую существование многочисленных типов специализированных клеток. Транскрипция генов и некодирующих последовательностей регулируется на нескольких уровнях: линейной архитектуры генома, представленной г/г/с-регуляторными элементами ДНК, модификации ДНК, структуры хроматина, структурной компартментализации ядра и др.

Следует признать, что, несмотря на серьезные достижения в изучении организации отдельных регуляторных систем (Maston et al. 2006), мы все еще далеки от полного понимания механизмов, управляющих геномом как целым. Даже в относительно простых случаях идентификации геномных элементов, играющих роль г/г/с-регуляторов, мы встречаем серьезные затруднения, требующие для их преодоления длительных усилий большого числа исследователей. В качестве примера можно сказать, что согласно теоретическим предсказаниям геном человека может содержать до 100000 энхансеров и сайленсеров, однако к настоящему времени охарактеризовано лишь несколько сот таких элементов (Pennisi 2004).

Понятно, что для полной функциональной характеристики организма необходимо знать положение и функциональное состояние всех регуляторных последовательностей его генома во всех типах клеток на всех этапах его жизни. Хотя эта грандиозная задача пока далека от решения, разработка подходов для этого уже началась, в частности в рамках предлагаемого исследования.

Регуляторные элементы генома даже одного и того же типа (например, энхансеры) в общем случае не обладают заметной гомологией первичных структур. Это связано в первую очередь со специфичностью их действия. Определенный г/г/с-элемент должен оказывать свое действие (связывать регуляторные белки) в определенном месте и в определенное время, и поэтому не может быть близок по первичной структуре к подобному по активности элементу, действующему в другом типе клеток и на другой стадии развития организма. Эта особенность z/zic-регуляторных элементов не позволяет идентифицировать их по сходству первичных структур методами биоинформатики, и приводит к необходимости разработки экспериментальных методов их идентификации, причем эти методы должны быть различны для различных типов регуляторов.

Построение функциональных карт генома можно вести по двум основным направлениям. Во-первых, можно картировать один или небольшое число элементов одного типа (например, участков связывания определенного фактора транскрипции) внутри полного генома или достаточно большой его части (полногеномный подход). Во-вторых, можно определить положение достаточно большого числа (в перспективе - большей части) регуляторных элементов разных типов внутри относительно небольшой области генома, с перспективой объединения этих областей в полногеномную карту.

Какую же стратегию следует выбрать для картирования функциональных элементов генома? Как показывает недавно проведенный анализ (Shields 2006), надежды на новые технологии, в частности на ДНК микрочипы, которые в принципе позволяют проводить полногеномный анализ экспрессии генов и расположения регуляторных элементов, оправдались не вполне ввиду низкой воспроизводимости результатов и других недостатков. В связи с этим, по нашему мнению, более реалистичной является стратегия, включающая подробный анализ отдельных функциональных доменов или относительно длинных (несколько млн.п.о.) областей генома. Последующее объединение фрагментарных данных в карты целых хромосом или полных геномов позволит понять всю сложнейшую систему функциональных взаимодействий между регуляторными элементами генома.

Подобный подход применен в проекте, нацеленном на картирование всех цис-регуляторных элементов генома. Проект разработан и осуществляется международным консорциумом ENCODE (the ENCyclopedia Of DNA Eléments, http://www.genome.gov/10005107) (ENCODE consortium 2004). На начальной стадии проекта предполагается разработать ряд подходов, которые позволят идентифицировать эти элементы и картировать их в относительно небольшой (~1%) области генома человека.

В нашей работе были использованы оба упомянутых выше подхода. На ранних этапах работы (1995-2000 г.), когда последовательность генома человека не была еще известна, мы использовали полнохромосомный (на примере хромосомы 19) подход. Полученный опыт показал, что технические ограничения такого подхода не позволяют построить функциональные карты, содержащие все или основную часть регуляторных элементов, и, по мере накопления экспериментальных данных, мы перешли к детальному картированию относительно небольшого (1 млн. п.о.) фрагмента хромосомы 19 человека, расположенного между генами FXYD5 и СОХ7А1, который и стал основной моделью для отработки методов идентификации различных регуляторных элементов.

Заключение Диссертация по теме "Молекулярная биология", Николаев, Лев Григорьевич

6. Основные результаты и выводы

6.1. Разработан универсальный метод идентификации участков прикрепления ДНК к ядерному матриксу (S/MARs).

6.2. При помощи этого метода идентифицировано и картировано 22 S/MARs, принадлежащих хромосоме 19 человека.

6.3. Идентифицировано 14 S/MARs, принадлежащих геному китайского хомячка.

6.4. Идентифицирован и картирован на хромосоме 19 человека повторяющийся S/MAR-элемент, связанный с семейством генов канцероэмбриональных антигенов (CEA-MAR). Высказано предположение о том, что дупликация генов семейства может происходить по границам петлевых доменов хроматина.

6.5. В области FXYD5-COX7A1 длиной 1 млн.п.о. хромосомы 19 человека идентифицировано и картировано 16 S/MAR-элементов. Реконструирована доменная структура области в клетках Jurkat.

6.6. В области потери гетерозиготности при раке легких q22.1 хромосомы 16 человека длиной 2,9 млн.п.о. идентифицировано и картировано 40 S/MAR-элементов.

6.7. Показано, что S/MARs могут располагаться не только в межгенных областях, но и в интронах генов, а также в З'-нетранслируемых областях.

6.8. Выявлен подкласс S/MAR-элементов, не обогащенных АТ-парами оснований и обращенными повторами.

6.9. Показано, что некоторые представители повторяющихся элементов семейства LINE обладают предпочтительным сродством к ядерному матриксу.

6.10. Показано, что различные области генома человека характеризуются различными типами доменной структуры, что может быть связано с особенностями их функционирования.

6.11. Разработан метод двумерного EMS А.

6.12. С помощью двумерного EMS А в области FXYD5-TZFP хромосомы 19 человека длиной 560 т.п.о. идентифицированы и картированы 52 участка, специфически связывающих ядерные белки.

6.13. Показано, что участки связывания белков не располагаются преимущественно в 5-областях генов, а могут с большой частотой обнаруживаться в интронах и 3'-некодирующих участках.

6.14. С помощью двумерного EMSA выявлены 10 участков области FXYD5-COX7A1 длиной 1 млн.п.о. хромосомы 19 человека, способных специфически связываться с фактором транскрипции CTCF in vitro и in vivo. Показано, что семь из десяти последовательностей расположены внутри генов (преимущественно в интронах), три расположены в межгенных участках локуса.

6.15. Разработан метод EMS A-дисплея, способный идентифицировать тканеспецифичные участки связывания белков. С его помощью идентифицированы 10 фрагментов ДНК, образующие различные комплексы с ядерными белками клеток Jurkat и PANC-1, с одной стороны, и клеток HepG2.

6.16. Разработан метод отбора участков связывания ядерных белков на основе иммуномагнитной сепарации.

6.17. При помощи этого метода выявлено и картировано 20 последовательностей хромосомы 19 человека, способных связываться с белком Мах. Методом иммунопреципитации хроматина показано, что некоторые из этих последовательностей связаны с белком Мах in vivo.

6.18. Выявлен ряд генов, потенциально регулируемых системой Myc:Max:Mad. Методом PCR в реальном времени подтверждена связь уровня экспрессии 5 генов с уровнем экспрессии белков Мус и Madl в клетках HL-60.

6.19. Разработана система поиска инсуляторов в протяженных геномных последовательностях. В области FXYD5-COX7A1 хромосомы 19 человека идентифицированы и картированы восемь потенциальных инсуляторов.

6.20. Методом иммунопреципитации хроматина показано, что семь из восьми потенциальных инсуляторов способны связываться с фактором транскрипции CTCF.

6.21. Построен прототип карты функциональных элементов для области хромосомы 19 человека длиной -600 т.п.о.

Библиография Диссертация по биологии, доктора биологических наук, Николаев, Лев Григорьевич, Москва

1. Акопов, С.Б., Николаев, Л.Г., Тырсин, О., Рузов, А.С., and Свердлов, Е.Д. 1997.

2. Идентификация и характеристики 14 последовательностей генома китайского хомячка, предпочтительно связывающихся с ядерным матриксом. Биоорганич. химия 23: 727-731.

3. Чернов, И.П., Акопов, С.Б., and Николаев, Л.Г. 2004. Структура и функции участковприкрепления ДНК к ядерному матриксу (S/MARs). Биоорганич. химия 30: 1-11.

4. Николаев, Л.Г., Акопов, С.Б., Чернов, И.П., Глотов, Б.О., Эшворт, Л.К., and Свердлов, Е.Д. 1998. Расположение 19 участков связывания ДНК с ядерным матриксом (MARs) на хромосоме 19 человека. Доклады РАН361: 409-411.

5. Рогаев, Е.И. 1999. Генетические факторы и полигенная модель болезни Альцгеймера. Генетика 35: 1558-1571

6. Adachi, Y., Kas, Е., and Laemmli, U.K. 1989. Preferential, cooperative binding of DNA topoisomerase II to scaffold- associated regions. Embo J8: 3997-4006.

7. Adorjan, P., Distler, J., Lipscher, E., Model, F., Muller, J., Pelet, C., Braun, A., Florl, A.R., Gutig, D., Grabs, G. et al. 2002. Tumour class prediction and discovery by microarray-based DNA methylation analysis. Nucleic Acids Res 30: e21.

8. Allen, G.C., Hall, G., Jr., Michalowski, S., Newman, W., Spiker, S., Weissinger, A.K., and

9. Thompson, W.F. 1996. High-level transgene expression in plant cells: effects of a strong scaffold attachment region from tobacco. Plant Cell 8: 899-913.

10. Allen, G.C., Hall, G.E., Jr., Childs, L.C., Weissinger, A.K., Spiker, S., and Thompson, W.F. 1993. Scaffold attachment regions increase reporter gene expression in stably transformed plant cells. Plant Cell 5: 603-613.

11. Allen, G.C., Spiker, S., and Thompson, W.F. 2000. Use of matrix attachment regions (MARs) to minimize transgene silencing. Plant Mol Biol 43: 361-376.

12. Altschul, S.F., Madden, T.L., Schaffer, A.A., Zhang, J., Zhang, Z., Miller, W., and Lipman, D.J. 1997. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Res 25: 3389-3402.

13. Alvarez, J.D., Yasui, D.H., Niida, H., Joh, Т., Loh, D.Y., and Kohwi-Shigematsu, T. 2000. The MAR-binding protein SATB1 orchestrates temporal and spatial expression of multiple genes during T-cell development. Genes Dev 14: 521-535.

14. Antes, T.J., Chen, J., Cooper, A.D., and Levy-Wilson, B. 2000. The nuclear matrix protein CDP represses hepatic transcription of the human cholesterol-7alpha hydroxylase gene. J Biol Chem 275: 26649-26660.

15. Antes, T.J., Namciu, S.J., Fournier, R.E., and Levy-Wilson, B. 2001. The 5' boundary of the human apolipoprotein b chromatin domain in intestinal cells. Biochemistry 40: 6731-6742.

16. Ashworth, L.K., Batzer, M.A., Brandriff, B., Branscomb, E., de Jong, P., Garcia, E., Games, J.A., Gordon, L.A., Lamerdin, J.E., Lennon, G. et al. 1995. An integrated metric physical map of human chromosome 19. Nat Genet 11: 422-427.

17. Avramova, Z., SanMiguel, P., Georgieva, E., and Bennetzen, J.L. 1995. Matrix attachment regions and transcribed sequences within a long chromosomal continuum containing maize Adhl. Plant Cell 7: 1667-1680.

18. Avramova, Z., Tikhonov, A., Chen, M., and Bennetzen, J.L. 1998. Matrix attachment regions and structural colinearity in the genomes of two grass species. Nucleic Acids Res 26: 761-767.

19. Azhikina, T., Gainetdinov, I., Skvortsova, Y., Batrak, A., Dmitrieva, N., and Sverdlov, E. 2004.

20. Non-methylated Genomic Sites Coincidence Cloning (NGSCC): an approach to large scale analysis of hypomethylated CpG patterns at predetermined genomic loci. Mol Genet Genomics 271: 22-32.

21. Balint, B.L., Gabor, P., and Nagy, L. 2005. Genome-wide localization of histone 4 arginine 3 methylation in a differentiation primed myeloid leukemia cell line. Immunobiology 210: 141-152.

22. Barbashov, S.F., Glotov, B.O., and Nikolaev, L.G. 1982. Interphase chromatin at the sites of attachment to the nuclear matrix has a nucleosome nature. Dokl AkadNauk SSSR 266: 1274-1277.

23. Barski, A., Cuddapah, S., Cui, K., Roh, T.Y., Schones, D.E., Wang, Z., Wei, G., Chepelev, I., and Zhao, K. 2007. High-resolution profiling of histone methylations in the human genome. Cell 129: 823-837.

24. Bayer, T.A., Cappai, R., Masters, C.L., Beyreuther, K., and Multhaup, G. 1999. It all stickstogether—the APP-related family of proteins and Alzheimer's disease. Mol Psychiatry 4: 524-528.

25. Bell, A.C. and Felsenfeld, G. 1999. Stopped at the border: boundaries and insulators. Curr Opin Genet Dev 9: 191-198.

26. Bell, A.C., West, A.G., and Felsenfeld, G. 1999. The protein CTCF is required for the enhancer blocking activity of vertebrate insulators. Cell 98: 387-396.

27. Bell, A.C., West, A.G., and Felsenfeld, G. 2001. Insulators and boundaries: versatile regulatory elements in the eukaryotic genome. Science 291: 447-450.

28. Benham, C., Kohwi-Shigematsu, T., and Bode, J. 1997. Stress-induced duplex DNA destabilization in scaffold/matrix attachment regions. J Mol Biol 274: 181-196.

29. Bentley, D.R. 2006. Whole-genome re-sequencing. Curr Opin Genet Dev 16: 545-552.

30. Berezney, R. and Coffey, D.S. 1974. Identification of a nuclear protein matrix. Biochem Biophys Res Commun 60: 1410-1417.

31. Berezney, R. and Coffey, D.S. 1977. Nuclear matrix. Isolation and characterization of a framework structure from rat liver nuclei. J Cell Biol 73: 616-637.

32. Berezney, R., Mortillaro, M.J., Ma, H., Wei, X., and Samarabandu, J. 1995. The nuclear matrix: a structural milieu for genomic function. Int Rev Cytol: 1-65.

33. Bibikova, M., Lin, Z., Zhou, L., Chudin, E., Garcia, E.W., Wu, B., Doucet, D., Thomas, N.J., Wang, Y., Vollmer, E. et al. 2006. High-throughput DNA methylation profiling using universal bead arrays. Genome Res 16: 383-393.

34. Birch-Machin, I., Gao, S., Huen, D., McGirr, R., White, R.A., and Russell, S. 2005. Genomic analysis of heat-shock factor targets in Drosophila. Genome Biol 6: R63.

35. Bird, A. 2002. DNA methylation patterns and epigenetic memory. Genes Dev 16: 6-21.

36. Blasquez, V.C., Sperry, A.O., Cockerill, P.N., and Garrard, W.T. 1989. Protein:DNA interactions at chromosomal loop attachment sites. Genome 31: 503-509.

37. Bode, J., Bartsch, J., Boulikas, T., Iber, M., Mielke, C., Schubeler, D., Seibler, J., and Benham, C. 1998. Transcription-promoting genomic sites in mammalia: their elucidation and architectural principles. Gene Therapy Mol Biol 1: 551-580.

38. Bode, J., Benham, C., Knopp, A., and Mielke, C. 2000a. Transcriptional augmentation: modulation of gene expression by scaffold/matrix-attached regions (S/MAR elements). Crit Rev Eukaryot Gene Expr 10: 73-90.

39. Bode, J., Kohwi, Y., Dickinson, L., Joh, T., Klehr, D., Mielke, C., and Kohwi-Shigematsu, T. 1992. Biological significance of unwinding capability of nuclear matrix-associating DNAs. Science 255: 195-197.

40. Bode, J. and Maass, K. 1988. Chromatin domain surrounding the human interferon-beta gene as defined by scaffold-attached regions. Biochemistry 27: 4706-4711.

41. Bode, J., Schlake, T., Iber, M., Schubeler, D., Seibler, J., Snezhkov, E., and Nikolaev, L. 2000b. The transgeneticist's toolbox: novel methods for the targeted modification of eukaryotic genomes. Biol Chem 381: 801-813.

42. Bode, J., Schlake, T., Rios-Ramirez, M., Mielke, C., Stengert, M., Kay, V., and Klehr-Wirth, D. 1995. Scaffold/matrix-attached regions: structural properties creating transcriptionally active loci. Int Rev Cytoh 389-454.

43. Bode, J., Stengert-Iber, M., Kay, V., Schlake, T., and Dietz-Pfeilstetter, A. 1996. Scaffold/matrix-attached regions: topological switches with multiple regulatory functions. Crit Rev Eukaryot Gene Expr 6: 115-138.

44. Bode, J., Winkelmann, S., Gotze, S., Spiker, S., Tsutsui, K., Bi, C., A, K.P., and Benham, C. 2006. Correlations between scaffold/matrix attachment region (S/MAR) binding activity and DNA duplex destabilization energy. J Mol Biol 358: 597-613.

45. Bondarenko, V.A., Liu, Y.V., Jiang, Y.I., and Studitsky, V.M. 2003. Communication over a large distance: enhancers and insulators. Biochem Cell Biol 81: 241-251.

46. Borrelli, E., Heyman, R., Hsi, M., and Evans, R.M. 1988. Targeting of an inducible toxic phenotype in animal cells. Proc Natl Acad Sci U SA 85: 7572-7576.

47. Boulikas, T. 1993a. Homeodomain protein binding sites, inverted repeats, and nuclear matrixattachment regions along the human beta-globin gene complex. J Cell Biochem 52: 23-36.

48. Boulikas, T. 1993b. Nature of DNA sequences at the attachment regions of genes to the nuclear matrix. J Cell Biochem 52: 14-22.

49. Boulikas, T. 1995. Chromatin domains and prediction of MAR sequences. Int Rev Cytolx 279-388.

50. Boulikas, T. and Kong, C.F. 1993. Multitude of inverted repeats characterizes a class of anchorage sites of chromatin loops to the nuclear matrix. J Cell Biochem 53: 1-12.

51. Brand, A.H., Breeden, L., Abraham, J:, Sternglanz, R., and Nasmyth, K. 1985. Characterization of a "silencer" in yeast: a DNA sequence with properties opposite to those of a transcriptional, enhancer. Cell 41: 41-48.

52. Brotherton, T., Zenk, D., Kahanic, S., and Reneker, J. 1991. Avian nuclear matrix proteins bind very tightly to cellular DNA of the beta-globin gene enhancer in a tissue-specific fashion. Biochemistry 30: 5845-5850.

53. Buhrmester, H., von Kries, J.P., and Stratling, W.H. 1995. Nuclear matrix protein ARBP recognizes a novel DNA sequence motif with high affinity. Biochemistry 34: 4108-4117.

54. Bulanenkova, S., Snezhkov, E., Nikolaev, L., and Sverdlov, E. 2007. Identification and mapping of open chromatin regions within a 140 kb polygenic locus of human chromosome 19 using E. coli Dam methylase. Genetica 130: 83-92.

55. Buzdin, A.A. 2004. Retroelements and formation of chimeric retrogenes. Cell Mol Life Sci 61: 2046-2059.

56. Cai, S. and Kohwi-Shigematsu, T. 1999. Intranuclear relocalization of matrix binding sites during T cell activation detected by amplified fluorescence in situ hybridization. Methods 19: 394402.

57. Carninci, P. 2006. Tagging mammalian transcription complexity. Trends Genet 22: 501-510.

58. Carrano, A.V., de Jong, P.J., Branscomb, E., Slezak, T., and Watkins, B.W. 1989. Constructing chromosome- and region-specific cosmid maps of the human genome. Genome 31: 10591065.

59. Carrero-Valenzuela, R.D., Quan, F., Lightowlers, R., Kennaway, N.G., Litt, M., and Forte, M. 1991. Human cytochrome c oxidase subunit VIb: characterization and mapping of a multigene family. Gene 102: 229-236.

60. Cawley, S., Bekiranov, S., Ng, H.H., Kapranov, P., Sekinger, E.A., Kampa, D., Piccolboni, A.,

61. Sementchenko, V., Cheng, J., Williams, A.J. et al. 2004. Unbiased mapping of transcription factor binding sites along human chromosomes 21 and 22 points to widespread regulation of noncoding RNAs. Cell 116: 499-509.

62. Charron, G., Julien, J.P., and Bibor-Hardy, V. 1995. Neuron specificity of the neurofilament light promoter in transgenic mice requires the presence of DNA unwinding elements. J Biol Chem 270: 25739-25745.

63. Chattopadhyay, S., Kaul, R., Charest, A., Housman, D., and Chen, J. 2000. SMAR1, a novel,alternatively spliced gene product, binds the Scaffold/Matrix-associated region at the T cell receptor beta locus. Genomics 68: 93-96.

64. Chenna, R., Sugawara, H., Koike, T., Lopez, R., Gibson, T.J., Higgins, D.G., and Thompson, J.D. 2003. Multiple sequence alignment with the Clustal series of programs. Nucleic Acids Res 31: 3497-3500.

65. Chernov, I.P., Akopov, S.B., Nikolaev, L.G., and Sverdlov, E.D. 2006. Identification and mapping of DNA binding proteins target sequences in long genomic regions by two-dimensional EMSA. BioTechniques 41: 90-96.

66. Chernov, I.P., Timchenko, K.A., Akopov, S.B., Nikolaev, L.G., and Sverdlov, E.D. 2007.1.entification of tissue-specific DNA-protein binding sites by means of two-dimensional electrophoretic mobility shift assay display. Anal Biochem 364: 60-66.

67. Chimera, J.A. and Musich, P.R. 1985. The association of the interspersed repetitive Kpnl sequences with the nuclear matrix. J Biol Chem 260: 9373-9379.

68. Cockerill, P.N. 1990. Nuclear matrix attachment occurs in several regions of the IgH locus. Nucleic Acids Res 18: 2643-2648.

69. Cockerill, P.N. and Garrard, W.T. 1986. Chromosomal loop anchorage of the kappaimmunoglobulin gene occurs next to the enhancer in a region containing topoisomerase II sites. Cell 44: 273-282.

70. Cockerill, P.N., Yuen, M.H., and Garrard, W.T. 1987. The enhancer of the immunoglobulin heavy chain locus is flanked by presumptive chromosomal loop anchorage elements. J Biol Chem 262: 5394-5397. ;

71. Cook, P.R. and Brazell, I. A. 1980. Mapping sequences in loops of nuclear DNA by their progressive detachment from the nuclear cage. Nucleic Acids Res 8: 2895-2906.

72. Cooper, S.J., Trinklein, N.D., Anton, E.D., Nguyen, L., and Myers, R.M. 2006. Comprehensive analysis of transcriptional promoter structure and function in 1% of the human genome. Genome Res 16: 1-10.

73. Crawford, G.E., Holt, I.E., Mullikin, J.C., Tai, D., Blakesley, R., Bouffard, G., Young, A.,

74. Masiello, C., Green, E.D., Wolfsberg, T.G. et al. 2004. Identifying gene regulatory elements by genome-wide recovery of DNase hypersensitive sites. Proc Natl Acad Sci USA 101: 992-997.

75. Dahl, C. and Guldberg, P. 2003. DNA methylation analysis techniques. Biogerontology 4: 233-250.

76. Dang, Q., Auten, J., and Plavec, I. 2000. Human beta interferon scaffold attachment region inhibits de novo methylation and confers long-term, copy number-dependent expression to a retroviral vector. J Virol 74: 2671-2678.

77. Dickinson, L.A., Dickinson, C.D., and Kohwi-Shigematsu, T. 1997. An atypical homeodomain in S ATB1 promotes specific recognition of the key structural element in a matrix attachment region. J Biol Chem 272: 11463-11470.

78. Dickinson, L.A., Joh, T., Kohwi, Y., and Kohwi-Shigematsu, T. 1992. A tissue-specific MAR7SAR DNA-binding protein with unusual binding site recognition. Cell 70: 631-645.

79. Dignam, J.D., Lebovitz, R.M., and Roeder, R.G. 1983. Accurate transcription initiation by RNA polymerase II in a soluble extract from isolated mammalian nuclei. Nucleic Acids Res 11: 1475-1489.

80. Dobreva, G., Chahrour, M., Dautzenberg, M., Chirivella, L., Kanzler, B., Farinas, I., Karsenty, G., and Grosschedl, R. 2006. S ATB2 is a multifunctional determinant of craniofacial patterning and osteoblast differentiation. Cell 125: 971-986.

81. Dorion-Bonnet, F., Mautalen, S., Hostein, I., and Longy, M. 1995. Allelic imbalance study of 16q in human primary breast carcinomas using microsatellite markers. Genes Chromosomes Cancer 14: 171-181.

82. Dunaway, M., Hwang, J.Y., Xiong, M., and Yuen, H.L. 1997. The activity of the scs and scs'insulator elements is not dependent on chromosomal context. Mol Cell Biol 17: 182-189.

83. ENCODE consortium. 2004. The ENCODE (ENCyclopedia Of DNA Elements) Project. Science 306: 636-640.

84. Euskirchen, G., Royce, T.E., Bertone, P., Martone, R., Rinn, J.L., Nelson, F.K., Sayward, F., Luscombe, N.M., Miller, P., Gerstein, M. et al. 2004. CREB binds to multiple loci on human chromosome 22. Mol Cell Biol 24: 3804-3814.

85. Fackelmayer, F.O., Dahm, K., Renz, A., Ramsperger, U., and Richter, A. 1994. Nucleic-acid-binding properties of hnRNP-U/SAF-A, a nuclear-matrix protein which binds DNA and RNA in vivo and in vitro. Eur JBiochem 221: 749-757.

86. Fackelmayer, F.O. and Richter, A. 1994. hnRnp-U/Saf-a is encoded by two differentially polyadenylated mRnas in human cells. Biochim Biophys Acta 1217: 232-234.

87. Feigner, P.L., Gadek, T.R., Holm, M., Roman, R., Chan, H.W., Wenz, M., Northrop, J.P., Ringold, G.M., and Danielsen, M. 1987. Lipofection: a highly efficient, lipid-mediated DNA-transfection procedure. Proc Natl Acad Sci USA 84: 7413-7417.

88. Felsenfeld, G. and Groudine, M. 2003. Controlling the double helix. Nature 421: 448-453.

89. Fernandez, L.A., Winkler, M., and Grosschedl, R. 2001. Matrix attachment region-dependent function of the immunoglobulin mu enhancer involves histone acetylation at a distance without changes in enhancer occupancy. Mol Cell Biol 21: 196-208.

90. Finch, J.T. and Klug, A. 1976. Solenoidal model for superstructure in chromatin. Proc Natl Acad Sci USAl^: 1897-1901.

91. Fischer, D.F., van Drunen, C.M., Winkler, G.S., van de Putte, P., and Backendorf, C. 1998. Involvement of a nuclear matrix association region in the regulation of the SPRR2A keratinocyte terminal differentiation marker. Nucleic Acids Res 26: 5288-5294.

92. FitzPatrick, D.R., Carr, I.M., McLaren, L., Leek, J.P., Wightman, P., Williamson, K., Gautier, P., McGill, N. Hayward, C., Firth, H. et al. 2003. Identification of SATB2 as the cleft palate gene on 2q32-q33. Hum Mol Genet 12: 2491-2501.

93. Forrester, W.C., Fernandez, L.A., and Grosschedl, R. 1999. Nuclear matrix attachment regionsantagonize methylation-dependent repression of long-range enhancer-promoter interactions. Genes Dev 13: 3003-3014.

94. Forrester, W.C., van Genderen, C., Jenuwein, T., and Grosschedl, R. 1994. Dependence of enhancer-mediated transcription of the immunoglobulin mu gene on nuclear matrix attachment regions. Science 265: 1221-1225.

95. Fraga, M.F. and Esteller, M. 2002. DNA methylation: a profile of methods and applications. Biotechniques 33: 632, 634, 636-649.

96. Frisch, M., Freeh, K., Klingenhoff, A., Cartharius, K., Liebich, I., and Werner, T. 2002. In silico prediction of scaffold/matrix attachment regions in large genomic sequences. Genome Res 12: 349-354.

97. Gasser, S.M. and Laemmli, U.K. 1986. Cohabitation of scaffold binding regions withupstream/enhancer elements of three developmentally regulated genes of D. melanogaster. Cell 46: 521-530.

98. Gaszner, M. and Felsenfeld, G. 2006. Insulators: exploiting transcriptional and epigenetic mechanisms. Nat Rev Genet 7: 703-713.

99. Gaubatz, S., Meichle, A., and Eilers, M. 1994. An E-box element localized in the first intronmediates regulation of the prothymosin alpha gene by c-myc. Mol Cell Biol 14: 3853-3862.

100. Gerdes, M.G., Carter, K.C., Moen, P.T., Jr., and Lawrence, J.B. 1994. Dynamic changes in thehigher-level chromatin organization of specific sequences revealed by in situ hybridization to nuclear halos. J Cell Biol 126: 289-304.

101. Geyer, P.K. 1997. The role of insulator elements in defining domains of gene expression. Curr Opin Genet Dev 7: 242-248.

102. Gilbert, N., Boyle, S., Fiegler, H., Woodfine, K., Carter, N.P., and Bickmore, W.A. 2004.

103. Chromatin architecture of the human genome: gene-rich domains are enriched in open chromatin fibers. Cell 118: 555-566.

104. Gindullis, F. and Meier, I. 1999. Matrix attachment region binding protein MFP1 is localized in discrete domains at the nuclear envelope. Plant Cell 11: 1117-1128.

105. Gitan, R.S., Shi, H., Chen, C.M., Yan, P.S., and Huang, T.H. 2002. Methylation-specificoligonucleotide microarray: a new potential for high-throughput methylation analysis. Genome Res 12: 158-164.

106. Glazko, G.V., Rogozin, I.B., and Glazkov, M.V. 2001. Comparative study and prediction of DNA fragments associated with various elements of the nuclear matrix. Biochim Biophys Acta 1517: 351-364.

107. Grandori, C., Cowley, S.M., James, L.P., and Eisenman, R.N. 2000. The Myc/Max/Mad network and the transcriptional control of cell behavior. Annu Rev Cell Dev Biol 16: 653-699.

108. Gray, C.E. and Coates, C.J. 2005. Cloning and characterization of cDNAs encoding putative

109. CTCFs in the mosquitoes, Aedes aegypti and Anopheles gambiae. BMC Mol Biol 6: 16.

110. Greasley, P.J., Bonnard, C., and Amati, B. 2000. Myc induces the nucleolin and BN51 genes: possible implications in ribosome biogenesis. Nucleic Acids Res 28: 446-453.

111. Hale, M.A. and Garrard, W.T. 1998. A targeted kappa immunoglobulin gene containing a deletion of the nuclear matrix association region exhibits spontaneous hyper-recombination in pre-B cells. Mol Immunol 35: 609-620.

112. Hallikas, O., Palin, K., Sinjushina, N., Rautiainen, R., Partanen, J., Ukkonen, E., and Taipale, J.2006. Genome-wide prediction of mammalian enhancers based on analysis of transcription-factor binding affinity. Cell 124: 47-59.

113. Hammarstrom, S. 1999. The carcinoembryonic antigen (CEA) family: structures, suggestedfunctions and expression in normal and malignant tissues. Semin Cancer Biol 9: 67-81.

114. Hancock, R. and Boulikas, T. 1982. Functional organization in the nucleus. Int Rev Cytol 79: 165214.

115. Hayashizaki, Y., Hirotsune, S., Okazaki, Y., Hatada, I., Shibata, H., Kawai, J., Hirose, K.,

116. Watanabe, S., Fushiki, S., Wada, S. et al. 1993. Restriction landmark genomic scanning method and its various applications. Electrophoresis 14: 251-258.

117. Heng, H.H., Goetze, S., Ye, C.J., Liu, G., Stevens, J.B., Bremer, S.W., Wykes, S.M., Bode, J., and Krawetz, S.A. 2004. Chromatin loops are selectively anchored using scaffold/matrix-attachment regions. J Cell Sci 117: 999-1008.

118. Heng, H.H., Krawetz, S.A., Lu, W., Bremer, S., Liu, G., and Ye, C.J. 2001. Re-defining the chromatin loop domain. Cytogenet Cell Genet 93: 155-161.

119. Henriksson, M. and Luscher, B. 1996. Proteins of the Myc network: essential regulators of cell growth and differentiation. Adv Cancer Res 68: 109-182.

120. Homberger, H.P. 1989. Bent DNA is a structural feature of scaffold-attached regions in Drosophila melanogaster interphase nuclei. Chromosoma 98: 99-104.

121. Horikawa, I., Cable, P.L., Afshari, C., and Barrett, J.C. 1999. Cloning and characterization of the promoter region of human telomerase reverse transcriptase gene. Cancer Res 59: 826-830.

122. Jack, R.S. andEggert, H. 1992. The elusive nuclear matrix. Eur J Biochem 209: 503-509.

123. Jackson, D.A., Bartlett, J., and Cook, P.R. 1996. Sequences attaching loops of nuclear andmitochondrial DNA to underlying structures in human cells: the role of transcription units. Nucleic Acids Res 24: 1212-1219.

124. Jackson, D.A., Dickinson, P., and Cook, P.R. 1990a. Attachment of DNA to the nucleoskeleton of HeLa cells examined using physiological conditions. Nucleic Acids Res 18: 4385-4393.

125. Jackson, D.A., Dickinson, P., and Cook, P.R. 1990b. The size of chromatin loops in HeLa cells. EmboJ9: 567-571.

126. Jackson, D.A., Dolle, A., Robertson, G., and Cook, P.R. 1992. The attachments of chromatin loops to the nucleoskeleton. Cell Biol Int Rep 16: 687-696.

127. Jaenisch, R. and Bird, A. 2003. Epigenetic regulation of gene expression: how the genome integrates intrinsic and environmental signals. Nat Genet 33 Suppl: 245-254.

128. Jarman, A.P. and Higgs, D.R. 1988. Nuclear scaffold attachment sites in the human globin gene complexes. EmboJl: 3337-3344.

129. Jenuwein, T. and Allis, C.D. 2001. Translating the histone code. Science 293: 1074-1080.

130. Jenuwein, T., Forrester, W.C., Fernandez-Herrero, L.A., Laible, G., Dull, M., and Grosschedl, R. 1997. Extension of chromatin accessibility by nuclear matrix attachment regions. Nature 385: 269-272.

131. Jurka, J., Kapitonov, V.Y., Pavlicek, A., Klonowski, P., Kohany, O., and Walichiewicz, J. 2005.

132. Repbase Update, a database of eukaryotic repetitive elements. Cytogenet Genome Res 110: 462-467.

133. Jurka, J., Kaplan, D.J., Duncan, C.H., Walichiewicz, J., Milosavljevic, A., Murali, G., and Solus, J.F. 1993. Identification and characterization of new human medium reiteration frequency repeats. Nucleic Acids Res 21: 1273-1279.

134. Kadonaga, J.T. 2004. Regulation of RNA polymerase II transcription by sequence-specific DNA binding factors. Cell 116: 247-257.

135. Kalos, M. and Fournier, R.E. 1995. Position-independent transgene expression mediated byboundary elements from the apolipoprotein B chromatin domain. Mol Cell Biol 15: 198207.

136. Kaneda, A., Takai, D., Kaminishi, M., Okochi, E., and Ushijima, T. 2003. Methylation-sensitiverepresentational difference analysis and its application to cancer research. Ann N Y AcadSci 983: 131-141.

137. Kas, E. and Chasin, L.A. 1987. Anchorage of the Chinese hamster dihydrofolate reductase gene to the nuclear scaffold occurs in an intragenic region. J Mol Biol 198: 677-692.

138. Kaul-Ghanekar, R., Jalota, A., Pavithra, L., Tucker, P., and Chattopadhyay, S. 2004. SMAR1 and Cux/CDP modulate chromatin and act as negative regulators of the TCRbeta enhancer (Ebeta). Nucleic Acids Res 32: 4862-4875.

139. Kawabata, Y., Katunuma, N., and Sanada, Y. 1980. Characteristics of proline oxidase in rat tissues. JBiochem (Tokyo) 88: 281-283.

140. Kazazian, H.H., Jr. and Goodier, J.L. 2002. LINE drive, retrotransposition and genome instability. Cell 110: 277-280.

141. Kellum, R. and Schedl, P. 1992. A group of scs elements function as domain boundaries in an enhancer-blocking assay. Mol Cell Biol 12: 2424-2431.

142. Kent, W.J., Sugnet, C.W., Furey, T.S., Roskin, K.M., Pringle, T.H., Zahler, A.M., and Haussler, D. 2002. The human genome browser at UCSC. Genome Res 12: 996-1006.

143. Kim, T.H., Abdullaev, Z.K., Smith, A.D., Ching, K.A., Loukinov, D.I., Green, R.D., Zhang, M.Q., Lobanenkov, V.V., and Ren, B. 2007. Analysis of the vertebrate insulator protein CTCF-binding sites in the human genome. Cell 128: 1231-1245.

144. Kim, T.H., Barrera, L.O., Qu, C., Van Calcar, S., Trinklein, N.D., Cooper, S.J., Luna, R.M., Glass, C.K., Rosenfeld, M.G., Myers, R.M. et al. 2005a. Direct isolation and identification of promoters in the human genome. Genome Res 15: 830-839.

145. Kim, T.H., Barrera, L.O., Zheng, M., Qu, C., Singer, M.A., Richmond, T.A., Wu, Y., Green, R.D., and Ren, B. 2005b. A high-resolution map of active promoters in the human genome. Nature 436: 876-880.

146. Kipp, M., Gohring, F., Ostendorp, T., van Drunen, C.M., van Driel, R., Przybylski, M., and Fackelmayer, F.O. 2000a. SAF-Box, a conserved protein domain that specifically recognizes scaffold attachment region DNA. Mol Cell Biol 20: 7480-7489.

147. Kipp, M., Schwab, B.L., Przybylski, M., Nicotera, P., and Fackelmayer, F.O. 2000b. Apoptotic cleavage of scaffold attachment factor A (SAF-A) by caspase-3 occurs at a noncanonical cleavage site. J Biol Chem 275: 5031-5036.

148. Kirillov, A., Kistler, B., Mostoslavsky, R., Cedar, H., Wirth, T., and Bergman, Y. 1996. A role for nuclear NF-kappaB in B-cell-specific demethylation of the Igkappa locus. Nat Genet 13: 435-441.

149. Kiryanov, G.I., Smirnova, T.A., and Polyakov, V. 1982. Nucleomeric organization of chromatin. Eur JBiochem 124: 331-338.

150. Klehr, D., Maass, K., and Bode, J. 1991. Scaffold-attached regions from the human interferon beta domain can be used to enhance the stable expression of genes under the control of various promoters. Biochemistry 30: 1264-1270.

151. Kohwi-Shigematsu, T., Maass, K., and Bode, J. 1997. A thymocyte factor SATB1 suppresses transcription of stably integrated matrix-attachment region-linked reporter genes. Biochemistry 36: 12005-12010.

152. Kolosha, V.O. and Martin, S.L. 1997. In vitro properties of the first ORF protein from mouse

153. NE-1 support its role in ribonucleoprotein particle formation during retrotransposition. Proc Natl Acad Sci USA 94: 10155-10160.

154. Konat, G.W. 1996. Chromatin structure and transcriptional activity of MAG gene. Acta Neurobiol Exp 56: 281-285.

155. Kondo, Y., Shen, L., Yan, P.S., Huang, T.H., and Issa, J.P. 2004. Chromatin immunoprecipitation microarrays for identification of genes silenced by histone H3 lysine 9 methylation. Proc Natl Acad Sci USA 101: 7398-7403.

156. Krogh, S., Mortensen, U.H., Westergaard, O., and Bonven, B.J. 1991. Eukaryotic topoisomerase I-DNA interaction is stabilized by helix curvature. Nucleic Acids Res 19: 1235-1241.

157. Magdinier, F., Yusufzai, T.M., and Felsenfeld, G. 2004. Both CTCF-dependent and -independent insulators are found between the mouse T cell receptor alpha and Dadl genes. J Biol Chem 279: 25381-25389.

158. Marais, G., Nouvellet, P., Keightley, P.D., and Charlesworth, B. 2005. Intron size and exon evolution in Drosophila. Genetics 170: 481-485.

159. Marie, C. and Hyrien, O. 1998. Remodeling of chromatin loops does not account for specification of replication origins during Xenopus development. Chromosoma 107: 155-165.

160. Marsden, M.P. and Laemmli, U.K. 1979. Metaphase chromosome structure: evidence for a radial . loop model. Cell 17: 849-858.

161. Maston, G.A., Evans, S.K., and Green, M.R. 2006. Transcriptional Regulatory Elements in the Human Genome. Annu Rev Genomics Hum Genet 7: 29-59.

162. Meier, I., Phelan, T., Gruissem, W., Spiker, S., and Schneider, D. 1996. MFP1, a novel plantfilament-like protein with affinity for matrix attachment region DNA. Plant Cell 8: 21052115.

163. Meissner, A., Gnirke, A., Bell, G.W., Ramsahoye, B., Lander, E.S., and Jaenisch, R. 2005. Reduced representation bisulfite sequencing for comparative high-resolution DNA methylation analysis. Nucleic Acids Res 33: 5868-5877.

164. Mesner, L.D., Crawford, E.L., and Hamlin, J.L. 2006. Isolating apparently pure libraries of replication origins from complex genomes. Mol Cell 21: 719-726.

165. Miao, F. and Natarajan, R. 2005. Mapping global histone methylation patterns in the coding regions of human genes. Mol Cell Biol 25: 4650-4661.

166. Miassod, R., Razin, S.V., and Hancock, R. 1997. Distribution of topoisomerase II-mediatedcleavage sites and relation to structural and functional landmarks in 830 kb of Drosophila DNA. Nucleic Acids Res 25: 2041-2046.

167. Michalowski, S.M., Allen, G.C., Hall, G.E., Jr., Thompson, W.F., and Spiker, S. 1999.

168. Characterization of randomly-obtained matrix attachment regions (MARs) from higher plants. Biochemistry 38: 12795-12804.

169. Mielke, C., Kohwi, Y., Kohwi-Shigematsu, T., and Bode, J. 1990. Hierarchical binding of DNA fragments derived from scaffold-attached regions: correlation of properties in vitro and function in vivo. Biochemistry 29: 7475-7485.

170. Mielke, C., Maass, K., Tummler, M., and Bode, J. 1996. Anatomy of highly expressing chromosomal sites targeted by retroviral vectors. Biochemistry 35: 2239-2252.

171. Mirkovitch, J., Gasser, S.M., and Laemmli, U.K. 1988. Scaffold attachment of DNA loops in metaphase chromosomes. J Mol Biol 200: 101-109.

172. Mirkovitch, J., Mirault, M.E., and Laemmli, U.K. 1984. Organization of the higher-order chromatin loop: specific DNA attachment sites on nuclear scaffold. Cell 39: 223-232.

173. Mirkovitch, J., Spierer, P., and Laemmli, U.K. 1986. Genes and loops in 320,000 base-pairs of the Drosophila melanogaster chromosome. J Mol Biol 190: 255-258.

174. Miyamoto, Y., Yamauchi, J., Sanbe, A., and Tanoue, A. 2006. Dock6, a Dock-C subfamily guanine nucleotide exchanger, has the dual specificity for Racl and Cdc42 and regulates neurite outgrowth. Exp Cell Res 313: 791-804.

175. Mlynarova, L., Jansen, R.C., Conner, A.J., Stiekema, W.J., and Nap, J.P. 1995. The MAR

176. Mediated Reduction in Position Effect Can Be Uncoupled from Copy Number-Dependent Expression in Transgenic Plants. Plant Cell 7: 599-609.

177. Mockler, T.C., Chan, S., Sundaresan, A., Chen, H., Jacobsen, S.E., and Ecker, J.R. 2005. Applications of DNA tiling arrays for whole-genome analysis. Genomics 85: 1-15.

178. Morisawa, G., Han-Yama, A., Moda, I., Tamai, A., Iwabuchi, M., and Meshi, T. 2000. AHM1, a novel type of nuclear matrix-localized, MAR binding protein with a single AT hook and a J domain-homologous region. Plant Cell 12: 1903-1916.

179. Morse, R.H. 2003. Getting into chromatin: how do transcription factors get past the histones? Biochem Cell Biol 81: 101-112.

180. Myslinski, E., Gerard, M.A., Krol, A., and Carbon, P. 2006. A genome scale location analysis of human Staf/ZNF143-binding sites suggests a widespread role for human Staf/ZNF143 in mammalian promoters. J Biol Chem 281: 39953-39962.

181. Nabirochkin, S., Ossokina, M., and Heidmann, T. 1998. A nuclear matrix/scaffold attachment region co-localizes with the gypsy retrotransposon insulator sequence. J Biol Chem 273: 2473-2479.

182. Nakagomi, K., Kohwi, Y., Dickinson, L.A., and Kohwi-Shigematsu, T. 1994. A novel DNAbinding motif in the nuclear matrix attachment DNA-binding protein S ATB1. Mol Cell Biol 14: 1852-1860.

183. Namciu, S.J., Blochlinger, K.B., and Fournier, R.E. 1998. Human matrix attachment regions insulate transgene expression from chromosomal position effects in Drosophila melanogaster. Mol Cell Biol 18: 2382-2391.

184. Nikolaev, L.G., Tsevegiyn, T., Akopov, S.B., Ashworth, L.K., and Sverdlov, E.D. 1996.

185. Construction of a chromosome specific library of human MARs and mapping of matrix attachment regions on human chromosome 19. Nucleic Acids Res 24: 1330-1336.

186. Nikolaev, L.G., Tsogtkhishig, T., Akopov, S.B., and Sverdlov, E.D. 1995. Mapping the sequences, preferentially bound with the nuclear matrix, on human chromosome 19. Bioorg Khim 21: 954-958.

187. Oancea, A.E., Berru, M., and Shulman, M.J. 1997. Expression of the (recombinant) endogenous immunoglobulin heavy-chain locus requires the intronic matrix attachment regions. Mol Cell Biol 17: 2658-2668.

188. Oesterreich, S., Lee, A.V., Sullivan, T.M., Samuel, S.K., Davie, J.R., and Fuqua, S.A. 1997. Novel nuclear matrix protein HET binds to and influences activity of the HSP27 promoter in human breast cancer cells. J Cell Biochem 67: 275-286.

189. Ogbourne, S. and Antalis, T.M. 1998. Transcriptional control and the role of silencers in transcriptional regulation in eukaryotes. Biochem J331 ( Pt 1): 1-14.

190. Ohlsson, R., Renkawitz, R., and Lobanenkov, V. 2001. CTCF is a uniquely versatile transcription regulator linked to epigenetics and disease. Trends Genet 17: 520-527.

191. Olsen, A.S., Combs, J., Garcia, E., Elliott, J., Amemiya, C., de Jong, P., and Threadgill, G. 1993. Automated production of high density cosmid and YAC colony filters using a robotic workstation. Biotechniques 14: 116-117, 120-113.

192. Opstelten, R.J., Clement, J.M., and Wanka, F. 1989. Direct repeats at nuclear matrix-associated DNA regions and their putative control function in the replicating eukaryotic genome. Chromosoma 98: 422-427.

193. Orian, A. 2006. Chromatin profiling, DamID and the emerging landscape of gene expression. Curr Opin Genet Dev 16: 157-164.

194. Orian, A., van Steensel, B., Delrow, J., Bussemaker, H.J., Li, L., Sawado, T., Williams, E., Loo, L.W., Cowley, S.M., Yost, C. et al. 2003. Genomic binding by the Drosophila Myc, Max, Mad/Mnt transcription factor network. Genes Dev 17: 1101-1114.

195. Orlando, V. 2000. Mapping chromosomal proteins in vivo by formaldehyde-crosslinked-chromatin immunoprecipitation. Trends Biochem Sci 25: 99-104.

196. Oshiman, K., Motojima, K., Mahmood, S., Shimada, A., Tamura, S., Maeda, M., and Futai, M. 1991. Control region and gastric specific transcription of the rat H+,K(+)-ATPase alpha subunit gene. FEBS Lett 281: 250-254.

197. Paul, A.L. and Ferl, R.J. 1998. Higher order chromatin structures in maize and Arabidopsis. Plant Cell 10: 1349-1359.

198. Pennacchio, L.A., Ahituv, N., Moses, A.M., Prabhakar, S., Nobrega, M.A., Shoukry, M.,

199. Minovitsky, S., Dubchak, I., Holt, A., Lewis, K.D. et al. 2006. In vivo enhancer analysis of human conserved non-coding sequences. Nature 444: 499-502.

200. Pennacchio, L.A., Loots, G.G., Nobrega, M.A., and Ovcharenko, I. 2007. Predicting tissue-specific enhancers in the human genome. Genome Res 17: 201-211.

201. Pennisi, E. 2004. Searching for the genome's second code. Science 306: 632-635.

202. Phi-Van, L. and Stratling, W.H. 1990. Association of DNA with nuclear matrix. Progr Mol Subcell Biol 11: 1-11.

203. Phi-Van, L. and Stratling, W.H. 1996. Dissection of the ability of the chicken lysozyme gene 5'matrix attachment region to stimulate transgene expression and to dampen position effects. Biochemistry 35: 10735-10742.

204. Pienta, K.J. and Coffey, D.S. 1984. A structural analysis of the role of the nuclear matrix and DNA loops in the organization of the nucleus and chromosome. J Cell Sci Suppl 1: 123-135.

205. Pienta, K.J., Partin, A.W., and Coffey, D.S. 1989. Cancer as a disease of DNA organization and dynamic cell structure. Cancer Res 49: 2525-2532.

206. Poljak, L., Seum, C., Mattioni, T., and Laemmli, U.K. 1994. SARs stimulate but do not confer position independent gene expression. Nucleic Acids Res 22: 4386-4394.

207. Pommier, Y., Cockerill, P.N., Kohn, K.W., and Garrard, W.T. 1990. Identification within thesimian virus 40 genome of a chromosomal loop attachment site that contains topoisomerase II cleavage sites. J Virol 64: 419-423.

208. Porter, S.D., Hu, J., and Gilks, C.B. 1999. Distal upstream tyrosinase S/MAR-containing sequence has regulatory properties specific to subsets of melanocytes. Dev Genet 25: 40-48.

209. Purbowasito, W., Suda, C., Yokomine, T., Zubair, M., Sado, T., Tsutsui, K., and Sasaki, H. 2004. Large-scale identification and mapping of nuclear matrix-attachment regions in the distal imprinted domain of mouse chromosome 7. DNA Res 11: 391-407.

210. Quarles, R.H. 2007. Myelin-associated glycoprotein (MAG): past, present and beyond. J Neurochem 100: 1431-1448.

211. Rauch, T. and Pfeifer, G.P. 2005. Methylated-CpG island recovery assay: a new technique for the rapid detection of methylated-CpG islands in cancer. Lab Invest 85: 1172-1180.

212. Razin, S.V. and Vassetzky, Y.S. 1992. Domain organization of eukaryotic genome. Cell Biol Int Rep 16: 697-708.

213. Recillas-Targa, F., Bell, A.C., and Felsenfeld, G. 1999. Positional enhancer-blocking activity of the chicken beta-globin insulator in transiently transfected cells. Proc Natl Acad Sci USA 96: 14354-14359.

214. Recillas-Targa, F., Valadez-Graham, V., and Farrell, C.M. 2004. Prospects and implications of using chromatin insulators in gene therapy and transgenesis. Bioessays 26: 796-807.

215. Renan, M.J. and Reeves, B.R. 1987. Chromosomal localization of human endogenous retroviralelement ERV1 to 18q22—q23 by in situ hybridization. Cytogenet Cell Genet 44: 167-170.

216. Renz, A. and Fackelmayer, F.O. 1996. Purification and molecular cloning of the scaffoldattachment factor B (SAF-B), a novel human nuclear protein that specifically binds to S/MAR-DNA. Nucleic Acids Res 24: 843-849.

217. Roh, T.Y., Cuddapah, S., and Zhao, K. 2005. Active chromatin domains are defined by acetylation islands revealed by genome-wide mapping. Genes Dev 19: 542-552.

218. Roh, T.Y., Wei, G., Farrell, C.M., and Zhao, K. 2007. Genome-wide prediction of conserved and nonconserved enhancers by histone acetylation patterns. Genome Res 17: 74-81.

219. Rollini, P., Namciu, S.J., Marsden, M.D., and Fournier, R.E. 1999. Identification andcharacterization of nuclear matrix-attachment regions in the human serpin gene cluster at 14q32.1. Nucleic Acids Res 27: 3779-3791.

220. Romig, H., Fackelmayer, F.O., Renz, A., Ramsperger, U., and Richter, A. 1992. Characterization of SAF-A, a novel nuclear DNA binding protein from HeLa cells with high affinity for nuclear matrix/scaffold attachment DNA elements. Embo J11: 3431-3440.

221. Romig, H., Ruff, J., Fackelmayer, F.O., Patil, M.S., and Richter, A. 1994. Characterisation of two intronic nuclear-matrix-attachment regions in the human DNA topoisomerase I gene. Eur J Biochem 221: 411-419.

222. Rosen, S. and Skaletsky, H. 2000. Primer3 on the WWW for general users and for biologistprogrammers. In Bioinformatics Methods and Protocols: Methods in Molecular Biology. (eds. S. Krawetz and S. Misener), pp. 365-386. Humana Press, Totowa, NJ.

223. Roti Roti, J.L., Wright, W.D., and VanderWaal, R. 1997. The nuclear matrix: a target for heatshock effects and a determinant for stress response. Crit Rev Eukaryot Gene Expr 7: 343360.

224. Sabo, P.J., Humbert, R., Hawrylycz, M., Wallace, J.C., Dorschner, M.O., McArthur, M., and

225. Stamatoyannopoulos, J.A. 2004. Genome-wide identification of DNasel hypersensitive sites using active chromatin sequence libraries. Proc Natl Acad Sci USA 101: 4537-4542.

226. Sabo, P.J., Kuehn, M.S., Thurman, R., Johnson, B.E., Johnson, E.M., Cao, H., Yu, M., Rosenzweig, E., Goldy, J., Haydock, A. et al. 2006. Genome-scale mapping of DNase I sensitivity in vivo using tiling DNA microarrays. Nat Methods 3:511-518.

227. Sakkers, R.J., Brunsting, J.F., Filon, A.R., Kampinga, H.H., Konings, A.W., and Mullenders, L.H. 1999. Altered association of transcriptionally active DNA with the nuclear-matrix after heat shock. Int JRadiat Biol 75: 875-883.

228. Sambrook, J. and Russell, D.W. 2001. Molecular Cloning. A laboratory Manual. CSHL Press, Cold Spring Harbor.

229. Schachner, M. and Bartsch, U. 2000. Multiple functions of the myelin-associated glycoprotein MAG (siglec- 4a) in formation and maintenance of myelin. Glia 29: 154-165.

230. Schatz, P., Distler, J., Berlin, K., and Schuster, M. 2006. Novel method for high throughput DNA methylation marker evaluation using PNA-probe library hybridization and MALDI-TOF detection. Nucleic Acids Res 34: e59.

231. Scheuermann, R.H. and Chen, U. 1989. A developmental-specific factor binds to suppressor sites flanking the immunoglobulin heavy-chain enhancer. Genes Dev 3: 1255-1266.

232. Schreiber-Agus, N. and DePinho, R.A. 1998. Repression by the Mad(Mxil)-Sin3 complex. Bioessays 20: 808-818.

233. Schubeler, D., Mielke, C., Maass, K., and Bode, J. 1996. Scaffold/matrix-attached regions act upon transcription in a context-dependent manner. Biochemistry 35: 11160-11169.

234. Scott, K.C., Taubman, A.D., and Geyer, P.K. 1999. Enhancer blocking by the Drosophila gypsy insulator depends upon insulator anatomy and enhancer strength. Genetics 153: 787-798.

235. Senga, T., Iwamoto, S., Yoshida, T., Yokota, T., Adachi, K., Azuma, E., Hamaguchi, M., and1.amoto, T. 2003. LSSIG is a novel murine leukocyte-specific GPCR that is induced by the activation of STAT3. Blood 101: 1185-1187.

236. Shi, H., Maier, S., Nimmrich, I., Yan, P.S., Caldwell, C.W., Olek, A., and Huang, T.H. 2003. Oligonucleotide-based microarray for DNA methylation analysis: principles and applications. JCellBiochem 88: 138-143.

237. Shields, R. 2006. The emperor's new clothes revisited. Trends Genet 22: 463.

238. Singh, G.B., Kramer, J.A., and Krawetz, S.A. 1997. Mathematical model to predict regions of chromatin attachment to the nuclear matrix. Nucleic Acids Res 25: 1419-1425.

239. Singh, J. and Klar, A.J. 1992. Active genes in budding yeast display enhanced in vivo accessibility to foreign DNA methylases: a novel in vivo probe for chromatin structure of yeast. Genes Dev 6: 186-196.

240. Smit, A.F., Toth, G., Riggs, A.D., and Jurka, J. 1995. Ancestral, mammalian-wide subfamilies of LINE-1 repetitive sequences. JMol Biol 246: 401-417.

241. Sommer, A., Bousset, K., Kremmer, E., Austen, M., and Luscher, B. 1998. Identification and characterization of specific DNA-binding complexes containing members of the Myc/Max/Mad network of transcriptional regulators. J Biol Chem 273: 6632-6642.

242. Stief, A., Winter, D.M., Stratling, W.H., and Sippel, A.E. 1989. A nuclear DNA attachmentelement mediates elevated and position-independent gene activity. Nature 341: 343-345.

243. Stratling, W.H. and Yu, F. 1999. Origin and roles of nuclear matrix proteins. Specific functions of the MAR-binding protein MeCP2/ARBP. Crit Rev Eukaryot Gene Expr 9: 311-318.

244. Streydio, C., Swillens, S., Georges, M., Szpirer, C., and Vassart, G. 1990. Structure, evolution and chromosomal localization of the human pregnancy-specific beta 1 glycoprotein gene family. Genomics 6: 579-592.

245. Strissel, P.L., Dann, H.A., Pomykala, H.M., Diaz, M.O., Rowley, J.D., and Olopade, O.I. 1998.

246. Scaffold-associated regions in the human type I interferon gene cluster on the short arm of chromosome 9. Genomics 47: 217-229.

247. Subirana, J.A., Munoz-Guerra, S., Aymami, J., Radermacher, M., and Frank, J. 1985. The layered organization of nucleosomes in 30 nm chromatin fibers. Chromosoma 91: 377-390.

248. Sun, T.T., Zhao, H., Provet, J., Aebi, U., and Wu, X.R. 1996. Formation of asymmetric unit membrane during urothelial differentiation. Mol Biol Rep 23: 3-11.

249. Surdej, P., Got, C., and Miassod, R. 1990a. Developmental expression pattern of a 800 kb DNAcontinuum cloned from the Drosophila X chromosome 14B-15B region. Biol Cell 68: 105118.

250. Thomas, J.O. 1984. The higher order structure of chromatin and histone HI. J Cell Sci Suppl 1:120.

251. Thompson, J.D., Higgins, D.G., and Gibson, T.J. 1994. CLUSTAL W: improving the sensitivity of progressive multiple sequence alignment through sequence weighting, position-specific gap penalties and weight matrix choice. Nucleic Acids Res 22: 4673-4680.

252. Tikhonov, A.P., Bennetzen, J.L., and Avramova, Z.V. 2000. Structural domains and matrixattachment regions along colinear chromosomal segments of maize and sorghum. Plant Cell 12: 249-264.

253. Tremethick, D.J. 2007. Higher-order structures of chromatin: the elusive 30 nm fiber. Cell 128: 651-654.

254. Trinklein, N.D., Aldred, S.F., Hartman, S.J., Schroeder, D.I., Otillar, R.P., and Myers, R.M. 2004. An abundance of bidirectional promoters in the human genome. Genome Res 14: 62-66.

255. Tsongalis, G.J., Coleman, W.B., Smith, G.J., and Kaufman, D.G. 1992. Partial characterization of nuclear matrix attachment regions from human fibroblast DNA using Alu-polymerase chain reaction. Cancer Res 52: 3807-3810.

256. Tsuda, H., Callen, D.F., Fukutomi, T., Nakamura, Y., and Hirohashi, S. 1994. Allele loss onchromosome 16q24.2-qter occurs frequently in breast cancers irrespectively of differences in phenotype and extent of spread. Cancer Res 54: 513-517.

257. Tsuneoka, M., Nakano, F., Ohgusu, H., and Mekada, E. 1997. c-myc activates RCC1 gene expression through E-box elements. Oncogene 14: 2301-2311.

258. Tsutsui, K., Tsutsui, K., Okada, S., Watarai, S., Seki, S., Yasuda, T., and Shohmori, T. 1993. Identification and characterization of a nuclear scaffold protein that binds the matrix attachment region DNA. J Biol Chem 268: 12886-12894.

259. Tybulewicz, V.L., Crawford, C.E., Jackson, P.K., Branson, R.T., and Mulligan, R.C. 1991.

260. Neonatal lethality and lymphopenia in mice with a homozygous disruption of the c-abl proto-oncogene. Cell 65: 1153-1163.

261. Unsinger, J. 2001. Entwicklung regulierbarer retro- und adenoviraler Vektoren fur die Gentherapie. Ph. D. Thesis. Technische Universität Braunschweig, Braunschweig.

262. Valenzuela, L. and Kamakaka, R.T. 2006. Chromatin insulators. Annu Rev Genet 40: 107-138.

263. Venter, J.C. Adams, M.D. Myers, E.W. Li, P.W. Mural, R.J. Sutton, G.G. Smith, H.O. Yandell, M. Evans, C.A. Holt, R.A. et al. 2001. The sequence of the human genome. Science 291: 13041351.

264. Vostrov, A. A. and Quitschke, W.W. 1997. The zinc finger protein CTCF binds to the APBbeta domain of the amyloid beta-protein precursor promoter. Evidence for a role in transcriptional activation. J Biol Chem 272: 33353-33359.

265. Wahlstrom, T. and Henriksson, M. 2007. Mnt takes control as key regulator of the myc/max/mxd network. Adv Cancer Res 97: 61-80.

266. Walhout, A.J., Gubbels, J.M., Bernards, R., van der Vliet, P.C., and Timmers, H.T. 1997. c

267. Myc/Max heterodimers bind cooperatively to the E-box sequences located in the first intron of the rat ornithine decarboxylase (ODC) gene. Nucleic Acids Res 25: 1493-1501.

268. Wang, D.M., Taylor, S., and Levy-Wilson, B. 1996. Evaluation of the function of the humanapolipoprotein B gene nuclear matrix association regions in transgenic mice. J Lipid Res 37: 2117-2124.

269. Waterston, R.H. Lindblad-Toh, K. Birney, E. Rogers, J. Abril, J.F. Agarwal, P. Agarwala, R.

270. Ainscough, R. Alexandersson, M. An, P. et al. 2002. Initial sequencing and comparative analysis of the mouse genome. Nature 420: 520-562.

271. Weber, M., Davies, J.J., Wittig, D., Oakeley, E.J., Haase, M., Lam, W.L., and Schubeler, D. 2005. Chromosome-wide and promoter-specific analyses identify sites of differential DNA methylation in normal and transformed human cells. Nat Genet 37: 853-862.

272. Weil, M.R., Widlak, P., Minna, J.D., and Garner, H.R. 2004. Global survey of chromatin accessibility using DNA microarrays. Genome Res 14: 1374-1381.

273. Weitzel, J.M., Buhrmester, H., and Stratling, W.H. 1997. Chicken MAR-binding protein ARBP is homologous to rat methyl-CpG- binding protein MeCP2. Mol Cell Biol 17: 5656-5666.

274. West, A.G. and Fraser, P. 2005. Remote control of gene transcription. Hum Mol Genet 14 Spec No 1: R101-111.

275. Willoughby, D.A., Vilalta, A., and Oshima, R.G. 2000. An Alu element from the K18 gene confers position-independent expression in transgenic mice. J Biol Chem 275: 759-768.

276. Woodcock, C.L. 2006. Chromatin architecture. Curr Opin Struct Biol 16: 213-220.

277. Woodcock, C.L., Grigoryev, S.A., Horowitz, R.A., and Whitaker, N. 1993. A chromatin folding model that incorporates linker variability generates fibers resembling the native structures. Proc Natl Acad Sci USA 90: 9021-9025.

278. Yamamura, J. and Nomura, K. 2001. Analysis of sequence-dependent curvature in matrixattachment regions. FEBS Lett 489: 166-170.

279. Yang, A.S., Estecio, M.R., Doshi, K., Kondo, Y., Tajara, E.H., and Issa, J.P. 2004. A simple method for estimating global DNA methylation using bisulfite PCR of repetitive DNA elements. Nucleic Acids Res 32: e38.

280. Yen, F.T., Masson, M., Clossais-Besnard, N., Andre, P., Grosset, J.M., Bougueleret, L., Dumas,

281. J.B., Guerassimenko, O., and Bihain, B.E. 1999. Molecular cloning of a lipolysis-stimulated remnant receptor expressed in the liver. J Biol Chem 274: 13390-13398.

282. Yi, M., Wu, P., Trevorrow, K.W., Claflin, L., and Garrard, W.T. 1999. Evidence that the Igkappa , gene MAR regulates the probability of premature V-J joining and somatic hypermutation. J Immunol 162: 6029-6039.

283. Yu, W., Ginjala, V., Pant, V., Chernukhin, I., Whitehead, J., Docquier, F., Farrar, D., Tavoosidana, G., Mukhopadhyay, R., Kanduri, C. et al. 2004. Poly(ADP-ribosyl)ation regulates CTCF-dependent chromatin insulation. Nat Genet 36: 1105-1110.

284. Zahn-Zabal, M., Kobr, M., Girod, P.A., Imhof, M., Chatellard, P., de Jesus, M., Wurm, F., and

285. Mermod, N. 2001. Development of stable cell lines for production or regulated expression using matrix attachment regions. JBiotechnol 87: 29-42.

286. Zeller, K.I., Zhao, X., Lee, C.W., Chiu, K.P., Yao, F., Yustein, J.T., Ooi, H.S., Orlov, Y.L., Shahab, A., Yong, H.C. et al. 2006. Global mapping of c-Myc binding sites and target gene networks in human B cells. Proc Natl Acad Sci USA 103: 17834-17839.

287. Zhong, X.P., Carabana, J., and Krangel, M.S. 1999. Flanking nuclear matrix attachment regions synergize with the T cell receptor delta enhancer to promote V(D)J recombination. Proc Natl Acad Sci USA 96: 11970-11975.

288. Zlatanova, J., Leuba, S.H., and van Holde, K. 1998. Chromatin fiber structure: morphology, molecular determinants, structural transitions. Biophys J 74: 2554-2566.

289. Zong, R.T., Das, C., and Tucker, P.W. 2000. Regulation of matrix attachment region-dependent, lymphocyte-restricted transcription through differential localization within promyelocytic leukemia nuclear bodies. EmboJ 19: 4123-4133.