Бесплатный автореферат и диссертация по биологии на тему
Структура и особенности регуляции генов гомологов RFP2 у человека и мыши
ВАК РФ 03.00.15, Генетика

Автореферат диссертации по теме "Структура и особенности регуляции генов гомологов RFP2 у человека и мыши"

На правах рукописи

Скоблов Михаил Юрьевич

Структура и особенности регуляции генов гомологов КЕР2 у человека и мыши.

специальность - 03.00.15 - генетика

Автореферат диссертации на соискание ученой степени кандидата биологических наук

Москва - 2004

Работа выполнена в лаборатории анализа генома Института общей генетики им.Н.И.Вавилова РАН

Научные руководители: доктор биологических наук

профессор Янковский Николай Казимирович, доктор биологических наук Баранова Анна Вячеславовна.

Официальные оппоненты: доктор биологических наук

Муха Дмитрий Владимирович кандидат биологических наук Шевелев Алексей Борисович

Ведущая организация: Государственное Учреждение Гематологический Научный Центр РАМН.

Защита состоится "_"_2004г в_ч._мин. на заседании

диссертационного совета Д.002.241.01 при Институте общей генетики им.Н.И.Вавилова РАН по адресу: 119991 ГСП-1, Москва, ул.Губкина, д.З. Факс: (095) 132-89-61.

С диссертационной работой можно ознакомиться в библиотеке Института общей генетики им.Н.И.Вавилова РАН.

Автореферат разослан "_"_2004 г.

Ученый секретарь Диссертационного совета, кандидат биологических наук

Г.Н.Полухина

ты

МЬ 02 £

Введение

Актуальность проблемы.

Опухолевые заболевания являются одной из ведущих по частоте группой болезней у человека и одной из основных причин смертности взрослого населения. Вероятность возникновения и интенсивность прогрессии опухолей зависят от генотипа индивида и от соматических мутаций, возникающих в процессе индивидуального развития. Важным генетическим барьером на пути возникновения и прогрессии опухолей являются гены-супрессоры опухолей. Мутации в этих генах «запускают» опухолевый процесс и этапы его прогрессии. Изучение тонкой структуры и регуляции генов супрессоров у человека необходимы для понимания генетического контроля нормы, определяемой этими генами, и молекулярно-генетических механизмов возникновения и прогрессии опухолей. Поэтому проведение таких исследований является высоко актуальным.

Такие исследования стали возможны в последние годы в результате реализации всемирной и российской программы геном человека. Исследование тонкой структуры и функционирования отдельных областей генома происходит сегодня при совмещении данных о структуре генома человека в норме с данными о его структуре при патологическом опухолевом процессе, а также на основе данных сравнительной геномики, что стало возможным лишь в самое последнее время и явилось одним из подходов в диссертационной работе.

Цель и задачи исследования.

Целью исследования является изучение структурно-функциональных особенностей регуляторного района гена ЖЕР2 человека, как наиболее вероятного гена супрессора опухолевого роста, расположенного в области 13ql4 у человека.

Для реализации поставленной цели решались следующие задачи:

1. Определить нуклеотидную последовательность промоторного региона гена ЖЕР2 человека и точку инициации транскрипции для этого гена.

2. Провести биоинформатический анализ промоторной области и выявить потенциальные элементы регуляции транскрипции гена ЖЕР2.

3. Выявить и провести анализ спектра потенциальных сайтов связывания транскрипционных факторов и состава самих транскрипционных факторов, взаимодействующих с регуляторной областью гена ЖЕР2 у человека.

4. Минимизировать промоторную область гена ЖЕР2 человека и экспериментально локализовать потенциальные регуляторные элементы этого гена.

5. Определить нуклеотидную последовательность промоториого региона гена Я/р2 мыши и провести биоинформатический сравнительный анализ последовательностей нуклеотидов промоторных районов гена ЖЕР2 человека и мыши для выявления причин сходства спектров тканеспецифичности экспрессии гена ЖЕР2 у человека и мыши.

Научная новизна.

Впервые определена и зарегистрирована в GenBank (AF363782) последовательность нуклеотидов длиной т.п.н. содержащая промоторный о н

гена КЕР2 человека. Экспериментально определено положение точки инициации транскрипции гена ЖЕР2 человека. Впервые проведен компьютерный анализ промоторной области гена ЖЕР2 человека и выявлены потенциальные элементы регуляции этого гена: GC-бокс и сайты связывания транскрипционных факторов. Выявлена уникальная особенность структуры промотора гена ЖЕР2 человека: в транскрибируемой нити ДНК перед GC-боксом расположен несовершенный повтор структуры GnA длиной 280 п.н.. Выявлена асимметрия в распределении количества сайтов связывания транскрипционных факторов в области несовершенного повтора: около 200 сайтов находятся в транскрибируемой нити ДНК, а в нити, комплементарной этому участку, сайты связывания отсутствуют. Впервые с помощью люциферазных конструкций локализованы четыре регуляторных элемента промотора гена ЖЕР2 человека: базальный промотор, энхансер, сайленсер и участок, отвечающий за стабильность РНК гена. Определены потенциальные сайты связывания транскрипционных факторов в участках промотора гена, предположительно содержащих энхансер и сайленсер. Экспериментально выявлены две изоформы гена мыши ортологичного гену Проведен сравнительный

компьютерный анализ последовательности нуклеотидов промоторной области гена ЖЕР2 человека и мыши. Обнаружен разрыв синтении хромосом человека и мыши непосредственно перед белок-кодирующей областью гена ЖЕР2, которая остается гомологичной у человека и мыши. Экспериментально выявлены две изоформы гена мыши ортологичного гену ЖЕР2 человека. Проведен сравнительный анализ регуляторных элементов в промоторной области генов ЖЕР2 у мыши и человека.

Практическая значимость.

Установление последовательности нуклеотидов промоторной области потенциального гена супрессора опухолей ЖЕР2 практически полезно как основа для мутационного скрининга повреждений этого гена в группах больных затронутых опухолевыми заболеваниями, ассоциированными с утратой области генома

Основные положения выносимые на защиту;

1. Определена и зарегистрирована в GenBank (AF363782) нуклеотидная последовательность промоторного региона гена ЖЕР2 человека. Проведен компьютерный анализ промоторной области гена ЖЕР2 человека и выявлены потенциальные регуляторные элементы.

2. С помощью люциферазной системы была минимизирована промоторная область гена ЖЕР2 человека и локализованы четыре регуляторных элемента: базальный промотор, энхансер, сайленсер и участок, отвечающий за стабильность

3. Определены потенциальные транскрипционные факторы в участках, предположительно содержащих энхансер и сайленсер в промоторной области гена ИРР2 человека.

4. Экспериментально установлены две изоформы мышиного гомолога гена человека. Проведен компьютерный анализ промоторной области гена ЖЕР2 мыши и выявлены потенциальные регуляторные элементы.

5. Проведен сравнительный анализ регуляторных частей гена ЖЕР2 у мыши и человека.

Апробация работы.

Материалы диссертационной работы были доложены и обсуждены на межлабораторном семинаре «Молекулярные и клеточные основы генетических процессов» ИОГен РАН им.Н.И.Вавилова (Москва, 2004); представлены на 10-й итоговой конф. "Геном Человека-2000", г.Москва, 2000, на «II съезде Вавиловского общества генетиков и селекционеров», 1-5 февраля 2000 года, г. Санкт-Петербург, на «II (IV) российском съезде медицинских генетиков», Курск, 17-19 мая, 2000, на школе-конференции "Горизонты физико-химической биологии", Пущино, 28 мая-02 июня 2000г, на «Human Genome Meeting», 2001,19-23 April, Edinbourgh, UK.

Публикации. По теме диссертации опубликовано 14 печагных работ, в том числе 1 статья в журнале Gene и 13 тезисов на международных и всероссийских научных конференциях.

Структура и объем работы. Диссертация состоит из следующих разделов: введение, обзор литературы, материалы и методы исследования, результаты и обсуждение, выводы, список литературы (77 источников) и приложения. Диссертация изложена на 107 страницах машинописного текста, содержит 19 рисунков и 6 таблиц.

Результаты и обсуждение.

1. Определение нуклеотидной последовательности промоторной области гена RFP2 человека.

Ген человека ЯБР2 был впервые клонирован в лаборатории анализа генома в качестве кандидата на роль супрессора опухолевого роста, повреждаемого при В-клеточном хроническом лимфолейкозе. Впоследствии была определена его тонкая структура и паттерн экспрессии (рис.1) [Baranova et 2003]. К моменту начала данной работы нуклеотидная последовательность промоторной области гена ЯБР2 была неизвестна, хотя прилежащие к ней участки были секвенированы во многих лабораториях. Информация о нуклеотидной последовательности этих прилежащих участков была доступна в базах данных нуклеотидных последовательностей генома человека, в первую очередь в базе GenBank. Сложность секвенирования данной области не могла быть преодолена с помощью рутинных, в том числе автоматических, методов определения нуклеотидной последовательности.

Рис.1 Структура гена человека КРР2.

Определение последовательности нуклеотидов промоторного участка гена RFP2 явилось первой задачей представленной работы. Секвенирование областей, непосредственно прилежащих к промотору, также представляло проблему, в частности, в связи с высокой представленностью в их составе нуклеотидов G и С (более 70%), что затрудняло прохождение как реакции секвенирования по Сэнгеру, так и реакции ПЦР.

Участок генома человека, содержащий ген ЯБР2 был доступен в виде плазмиды pGEMD1. Эта плазмида была получен ранее в лаборатории анализа генома как субклон вставки ДНК в рекомбинантной космиде и перекрывала первые экзоны гена, а также его промоторную область, общей протяженностью около 4 т.п.н..

При постановке секвенирующей реакции с праймера, отжигающегося на первом зкзоне гена RFP2 и направленного в сторону промотора, мы получали обрыв реакции на всех четырех дорожках с терминирующими НТФ на 20-30 нуклеотиде от точки праймирования. При этом на радиоавтографе чередовались "нечитаемые" отрезки длиной 4-5 нуклеотидов и "читаемые" отрезки всего лишь по 2-3 нуклеотида. Такая картина секвенирующего геля типична для случаев, когда ДНК-матрица формирует вторичную структуру, препятствующию работе ДНК-полимеразы.

Одним из вариантов решений указанной проблемы является секвенирование "проблемного" участка с комплементарной цепи ДНК, поскольку особенности вторичной структуры на комплементарных нитях ДНК различны. Секвенирование с комплементарной цепи требовало укорочения размера вставки, чтобы приблизить секвенируемую области вставки к праймеру, отжигаемому на конец векторной части молекулы.

.«ЛЬгр

-15 И>

/у ' 3-й кодирующий ЭК50Н

Средний размер промоторного участка большинства генов человека составляет 500 п.н. от первого экзона [Suzuki Y. et al., 2004], хотя в отдельных случаях размер промотора может составлять до 7 т.н.п., как это, например, было показано для промотора гена CIITA, кодирующего трансактиватор Класса II [Piskurich JF et al., 1998]. Поэтому для полноценного представления структуры промоторной области гена RFP2 в составе клонируемого субфрагмента был выбран размер порядка одной тысячи нуклеотидов.

Рис.2. Схема расположения сайтов рестрикции эндонуклеаз в составе вставки плазмиды pGEMDl.

С помощью рестриктазы Dral нами было проведено субклонирование 1200 п.н. промоторной области гена в вектор pGEM3zf- (Рис.2). Клонированный фрагмент был нами секвенирован. Определение неизвестной нуклеотидной последовательности проводили при помощи секвенирования с праймера Т7, отжигавшегося на векторном участке плазмиды. При этом секвенирование начиналось с области, расположенной выше промотора гена. В результате было осуществлено пошаговое определение нуклеотидной последовательности, при котором праймеры для секвенирования следующего участка вставки подбирались к концу вновь определенной последовательности. При этом удалось полностью установить последовательность нуклеотидов по цепи, комплементарной к той, реакцию с которой не удавалось затравить на начальном этапе работы. Определенная нами последовательность нуклеотидов длиной 1200 п.н. была приоритетно зарегистрирована в общедоступной базе данных GenBank под номером AF305674, впоследствии замещенным номером AF363782. Знание нуклеотидной последовательности позволило приступить к биоинформатическому, а затем и к экспериментальному анализу структуры промотора гена RFP2.

Анализ полученной нуклеотидной последовательности показал высокое содержание G и С нуклеотидов в промоторной области - около 70%. Нами было построено, распределение GC-состава секвенированного участка и показано, что оно меняется от 10% до 80% в некоторых 50-нуклеотидных сегментах данного отрезка ДНК.

На всем протяжении нуклеотидной последовательности выделяется GC-богатый район протяженностью примерно - 280 п.н., имеющий довольно четкие границы и содержащий в себе неправильные повторы типа (GGGGA)n (рис.3). Известно, что присутствие тандемных GnA-повторов приводит к образованию сложных вторичных структур, таких как квадруплекс [Risitano A. and Fox K.R. ,2003], которые могут играть роль в регуляции транскрипции [Grand C.L. et al., 2004].

А6СС6СТ®56 ЭТСеСЗСТТСТ ОЗТСТТбАСА ТвС&ЗАТОАА ОТОЗТСТСАА бСгСгТТССАСТ ТТТААААААА АТТСТААААА АТСЗСААССАА СААААААААА

_праймер Р1 ^

ААвТАСАСАА ТССАААСССА АССАТСТТАА ТТ<ЗСАСв(ЗСА бСТТААСТАб САСАСТТТСТ ТСССОЗвСАб ССССАСССОЗ- еАСССЗСОССО СТТСА®ГСОА (ЗСССАССЭТС ТОЗСгСАААСб бСбТССАСТТ СССбСАЭССв СТ<ЗСССА6СС ТСТОСССЮТС <аЗСТТТ»3©ЗС <Э36С6САС6А СТСТСЗвААбв вАЛААААССС СвСАвСССва СССТССССБТ СССАбСЗСбСЗС сссзазазввт Т(ЗАСЭ<ЗСеОЗ АОСАСбСОЭС ббТТОЗАСАС (ЗС:С03ААС<;А АССЗСТСГСТС АССАСССвОС ТСССТСССЗСС ААвеССАбвС СЗСбСЗСССЭ'ЗЭ АСССетЗАСА САССЗССААОЗ

праймер Р12

ссАсаозеАа GCGGGGCCGG AGGЧGCAGGC ТбАСбСТСЗСС GAHGGGGAAG

ОЗАбеСЗ&ЗАб GGGGI\GGGGA бЛЗЭЗЗЙАЗЭ бОЗАААбЭЗА

ббААОЗеАСС ССАбОСЗвА®} (ЗввААСЗ&ЗАС &звАеезоА&

<Зв©ЗААСССА С<3®ЗА6<ЗОаА <ЗСв«ЗА©ЗСв АбОЗОЗААОЭ 6АС®56А<Э6С

АА<Зеб(36А<ЗС? ОЭ&Ав&ЭЭЛА АВСООЗАСАЭ вошсссвсс

ССАвСТАСЗСС

ОС&ССССЗСБА етССАТТТТБ СССЗСТСТСЗСТ ТЭЗСЭССТАС ССТБССЗСТСС СТСТАСГТСО АЯЗАССОЗСС ОТСЗСССССЗС СТТТСССАСТ АОСССЗЗАС

Рис.3. Нуклеотидная последовательность отсеквенированного промоторного участка гена ЯЖР2 человека. Жирным шрифтом выделена последовательность первого экзона гена/Ш^, подчеркнуты найденные нами GnA-повторы.

Высокое содержание GC нуклеотидов, а так же присутствие нескольких блоков С,А-повторов в транскрибируемой цепи, приводящих к образованию вторичных структур в исследуемой области, вероятно и было причиной затруднений при ПЦР-амплификации и секвенировании. Комплементраная цепь, по-видимому, не образовывала каких-либо вторичных структур, что и привело к успешному прохождению реакции секвенирования.

В дальнейшем нами была определена вся нуклеотидная последовательность вставки геномной ДНК в плазмиде pGEMDl (3,6 т.п.н.). Эта последовательность, расположенная перед участком инициации транскрипции гена КБР2, послужила основой для дальнейшей экспериментальной работы по определению функциональной активности отдельных участков регуляторной области этого гена.

Последовательность 3,6 т.п.н. была приоритетно зарегистрирована нами в GenBank под номером AF363782. В результате депонирования этой последовательности была закрыта брешь в базе данных между имеющимися на то время контигами, что позволило нам построить результирующий контиг общей длиной около 100 т.п.н.

Следующим этапом работы было установление точного положения точки инициации транскрипции исследуемого гена КЕР2. С помощью обратной траискриитазы на РНК человека нами была проведена реакция удлинения праймера, направленного в сторону 5'-конца гена. В результате эксперимента нам удалось определить точку инициации транскрипта, которая совпала с длиной самого протяженного из клонов кДНК, последовательности которых находились в базе данных GenBank.

2. Компьютерный анализ промоторной области гена человека RFP2.

Целью компьютерного анализа было выявление регуляторных элементов промотора гена для облегчения их дальнейшего исследования.

В определеной нами последовательности нуклеотидов не обнаруживаются ни ТАТА, ни СААТ блоки, типичные для большинства генов человека, однако присутствуют два GC-богатых бокса, которые часто встречаются в промоторах, не содержащих классических TATA последовательностей [Kuo S. et al., 1999]. Первый из боксов располагается непосредственно перед первым экзоном, а

второй - TTTGGGCGGGCG ~ на расстоянии 430 п.н. от него.

Мы провели детальный компьютерный анализ определенной нами 5'-фланкирующей последовательности гена RFP2. В результате анализа на обоих цепях ДНК был выявлен целый ряд консенсусных элементов, обеспечивающих узнавание этого промотора транскрипционными факторами. Для этого анализа мы использовали программу TFSERCH, находящуюся в открытом досгупе в Интернете. Положение и диаграмма плотности выявленных нами участков связывания всех транскрипционных факторов показаны на рис.4.

Рис. 4. На диаграмме показано распределение плотности сайтов посадки транскрипционных факторов в последовательности промоторной области гена в отрезках по 50 п.н. Нижняя часть диаграммы показывает такое распределение в комплементарной цепи промоторного участка. Подчеркнуто положение повторов типа (ОСОСА)п и первого экзона.

Как можно видеть на диаграмме, максимум плотности сайтов посадки транскрипционых факторов в транскрибируемой цепи приходится на нуклеотидную последовательность с GnA-повторами. Интересно, что другая цепь ДНК не содержит ни одного сайта посадки для транскрипционных факторов в этом участке.

Выявленный дисбаланс плотности распределения сайтов посадки транскрипционных факторов между комплементарными нитями может либо являться частной особенностью регуляции транскрипции исследуемого гена, либо отражать свойство какой-то группы генов. В качестве контроля мы проанализировали ряд других, известных промоторных последовательностей с высоким GC-составом и не содержащих ТАТА-последовательностей, в частности экспериментально подтвержденные промоторы генов человека MYC, Ikl, GMFG, gClqRlp32 и гены крысы, кодирующие циклин В1 и Г/5/7. Ни у одного из этих генов не наблюдали дисбаланса плотности распределения сайтов • посадки транскрипционных факторов между комплементарныеми нитями. Таким образом, обнаруженный феномен является специфической особенностью структуры промотора гена RFP2.

Все предсказанные программой TFSERCH 184 сайта связывания транскрипционных факторов в регуляторной области гена RFP2 были проанализированы по двум параметрам:

1) близость структуры выявленных сайтов к консенсусной для данного транскрипционного фактора. В качестве порога отсечения было выбрано значение коэффециента сходства матриц (уровень matrix similarity по базе TRANSFAC) равное 0,95. Сайты наиболее близкие по структуре к консенсусу являются первоочередными кандидатами для эксперментальной проверки.

2) принадлежность выявленных сайтов связывания транскрипционных факторов к группе сайтов, встречающихся в генах человека участвующих в дифференцировке В-лимфоцитов.

Всего в исследуемом районе обнаружены около 300 сайтов связывания прошедших через два описанных фильтра. Транскрипционные факторы, связывающиеся с этими сайтами приведены в табл. 1.

Предсказанные программой TFSERCH и прошедшие через два описанных фильтра сайты связывания в регуляторной области гена RFP2 связываются с 26 факторами, возможно регулирующим транскрипцию данного гена. Эти факторы принадлежат к 17 различным семействам, пять из которых (CREB, IKAROS, NFKAPPAB, XFD и АР4) представлены более чем одним фактором, а 12 семейств -представлены только одним фактором.

Из таблицы 1. видно, что число сайтов для каждого транскрипционного фактора составляет в данном участке от 1 до 72. Десятикратное превышение плотности обнаруживается для сайтов связывания транскрипционных факторов семейства Ikaros: 60 сайтов для фактора IK2 в исследуемом участке против ожидаемых 6.16 сайтов в среднем по геному на участке такого же размера. Столь большое превышение указывает, что фактор транскрипции IK2 наиболее выражение регулирует транскрипцию гена RFP2. Семейство транскрипционных факторов Ikaros играет решающую роль в регуляции основных стадий развития В- и Т- лимфоцитов [Westman В J. et al., 2002].

Как было отмечено выше, в области GnA повгоров лишь одна из цепей, транскрибируемая, содержит сайты связывания транскрипционных факторов, которые на гистограмме рис. 4 были представлены в совокупности. Мы также исследовали распределение плотностей встречаемости сайтов одного типа, для тех сайтов, которые в составе изучаемого участка гена встретились 5 и более раз, в том числе факторов семейств IKAROS, SP1 и CETS1P54, частота встречаемости которых в составе

промотора гена КЕР2 на порядок больше чем в остальных участках генома. Из полученных данных видно, что характер распределения плотности встречаемости сайтов посадки этих транскрипционных факторов совпадает с общей картиной распределения для всех факторов в совокупности.

Таблица 1. Транскрипционные факторы (колонка 1, в алфавитном порядке) и количество сайтов связывания для них в анализируемом участке 1562 п.н. промотора гена КЕР2 (колонка 2) в сравнении со средним количеством сайтов в случайном участке того же размера в геноме человека (колонка 3).

1 2 3 2/3

АР4 05 10 1,5 6,7

АР4 06 5 0,78 6,4

СЕТ81Р54 18 2,39 7,5

СКЕВ 01 1 0,62 1,6

СЯЕВ 02 1 1,75 0,6

СЯЕВ 04 1 0,53 1,9

ЕУ11 02 1 0,03 33,3

ОС 28 3,31 8,5

ОКЬР 72 7,44 9,7

1К1 13 1,34 9,7

1К2 60 6,17 9,7

1К3 1 0,25 4,0

муоот1 1 0,015 66,7

33 6 5,5

№ЛТ 06 8 2,98 2,7

ШКЛРРЛВ 2 0,66 3,0

ИГКЛРРЛВ50 1 0,08 12,5

И¥КЛРРЛВ65 2 0,14 14,3

ШКВ С 1 0,08 12,5

ШКВ 06 1 0,44 2,3

ККЕВ1 2 0,05 40,0

8Р1 06 31 2,66 11,7

ЗЯЖ 06 1 0,25 4,0

ТЛХСКЕВ 1 0,09 11,1

Х¥В1 1 0,11 9,1

ХРБ2 1 0,11 9,1

Также нами был проделан анализ расположения факторов транскрипции, встречающихся в геноме человека очень редко, в частности факторов ТЛХСКЕВ, 1К3, ХРБ1, ЯЯЕВ1, МУООКР1. В результате оказалось, что все они находятся вне ОпЛ-повторного региона.

3. Функциональная характеристика промоторногорегиона гена человека.

Задачей данного этапа работы было экспериментальное определение размера и положения минимального участка 5'-области гена RFP2, обладающего промоторной активностью. Конструкции создавались путем субклонирования рестрикционных фрагментов из 3,5 т.п.н. участка генома, представленного в составе рекомбинантной плазмиды pGEMDl, содержащей первый экзон гена RFP2. Схема расположения рестрикционных сайтов и получаемых на из основе субфрагментов указана на рис. 5.

Средний размер промоторного участка большинства генов человека составляет 500 п.н. от первого экзона [Suzuki Y. et al., 2004], хотя в отдельных случаях размер промотора может составлять до 7 т.н.п.. Учитывая обнаруженные раннее уникальные особенности промоторного региона гена RFP2, было решено начать минимизацию промоторной области с участка длинной около 3 т.п.н. для полноценного представления структуры промоторной области гена RFP2.

Рис. 5. Схема расположения рестрикционных сайтов и получаемых субфрагментов 5'-области гена, обладающей промоторной активностью.

Вначале были созданы три конструкции, содержащие фрагменты промоторной области длиной 2800, 1400 и 700 н.п. (см. рис. 5). В качестве репортерного гена использовали ген люциферазы, лишенный собственного промотора. Для этого субфрагменты клонировали в вектор pGL3b (Pгomega).

Полученными плазмидами проведена трансфекция эукариотических клеток линии почек человека 293. В качестве отрицательного и положительного контроля проводили трансфекцию клеток этой линии плазмидами (содержит ген

люциферазы без промотора) и (содержит ген люциферазы под контролем

промотора вируса SV40).

Эффективность трансфекции была нормализована с помощью ко-трансфекции плазмиды pCMVb, которая содержала в себе ген /З-галактозидазы под контролем промотора цитомегаловируса человека. После трансфекции эукариотические клетки лизировали и замеряли активность люциферазы в полученных лизатах. Полученные данные обрабатывали и нормировали путем сопоставления уровеней галактозидазной активности. За 100% была принята активность люциферазы из клеток трансфецированных плазмидой рОЬЗс (ген люциферазы под контролем промотора вируса SV40). Люциферазная активность конструкции составила для рСгЬМ1 - 75%,

pGLM2 - 180%, pGLM3 - 180%. Как видно из приведенных данных, максимальная активность наблюдалась у фрагмента длиной 700 н.п., находящегося в составе плазмиды pGLM3 (в 1.8 раза больше уровня экспрессии контрольного промотора вируса SV40).

Следующим шагом была минимизация вставки в плазмиде pGLM3. Для этого мы использовали удобное расположение сайта расщепления рестриктазой Nhel, находящегося на 5 п.н. ниже старта транскрипции гена ЖЕР2. Мы субклонировали следующие Nhel-субфрагменты вставки (см рис. 6) - 201 п.н. фрагмент, содержащий первый экзон ЖЕР2 без первых 5 нуклеотидов (pGLM4) и 526 п.н. фрагмент, содержащий GC-богатую часть промоторной области (pGLM5).

Рис.6. Схема фрагментов промоторной области гена ЖЕР2 соединенных с репортерным геном люциферазы.

Активность люциферазы составила 2,7% для pGLM4. Таким образом, последовательность, представленная в составе плазмиды pGLM4, не является частью промоторной последовательности, что и следует ожидать, так как в этом фрагменте удалены все регуляторные элементы, расположенные выше точки инициации транскрипции, как и сам сайт инициации транскрипции этого гена.

Активность люциферазы составила 83% для pGLM5. Возможны два объяснения падения активности промотора ЖЕР2 в конструкции pGLM5, не противоречащие существующим представлениям о регуляции транскрипции генов человека: 1) на границе разбиения конструкции pGLM3 находится сайт транскрипционного фактора, который в результате разбиения конструкции на части оказывается инактивирован; 2) сайт(ы) транскрипционных факторов находятся внутри транскрибируемого участка гена.

Чтобы проверить это предположение, на основе конструкции рОЬМ3 была создана конструкция рОЬМ3, вставка в которой заканчивается на 50 п.н. правее вставки в рОЬМ5. Измерение люциферазной активности рОЬМ3' действительно показало некоторое увеличение активности промотора по сравнению с фрагментом промотора в рОЬМ5. Заметим, однако, что левый конец вставки в рОЬМ3' при этом оказывается укороченным на 180 п.н. по сравнению с рОЬМ5, что оказалось в дальнейшем весьма важным для интерпретации полученных данных. Сравнение активности люциферазы, образуемой под контролем вставки в рОЬМ3 и в рОЬМ5, позволяет заключить, что область между правыми концами вставок, вероятно, влияет на стабильность образуемой РНК (уровень люциферазы при отсутствии этой области ниже в 2 раза).

Для дальнейшей локализации участков промотора, влияющих на его активность, были созданы еще две плазмиды — рОЬМ6 и рОЬМ7. Эти плазмиды были получены в результате укорочения плазмиды рОЬМ3 путем клонирования РСИ-амплификатов полученных на ее основе. Люциферазная активность плазмиды рОЬМ6 возросла в три раза относительно уровня плазмиде рОЬМ3 и составила 752% относительно положительного контроля с плазмидой рОЬ3е.

Активность конструкции рОЬМ7 упала в 1.5 раза относительно уровня в плазмиде рОЬМ3, и составила 121% от контрольной: Этот феномен может быть объяснен присутствием таких регуляторных элементов, как сайленсера и энхансера. 5' конец вставки плазмиды рОЬМ7 из всех плазмид наиболее приближен к точке инициации транскрипции. На основании этого можно выделить минимальные границы участка базального промотора длиной 253 п.н.

Для уточнения присутствия и локализации сайленсера и энхансера были созданы еще две дополнительных конструкции — рОЬМ8 и рОЬМ9 — путем ПЦР-укорочения плазмиды рОЬМ3 и рОЬМ6 соответственно.

Для определения наличия энхансера мы получили конструкцию рОЬМ9, которая является укороченным вариантом рОЬМ6, не содержащим области с предполагаемым энхансером. Измерение активности показало, что удаление этого района действительно снизило активность промотора примерно в 9 раз.

Для определения наличия сайленсера мы получили конструкцию рОЬМ8, которая содержит область предполагаемого сайленсера, клонированную в составе контрольного вектора рОЬ3е. Структуры этих плазмид приведены на рис 6. Измерение активности показало, что значения активности рОЬ3е и рОЬМ8 практически одинаковы. Эти данные позволили предположить, что сайленсер, если он действительно находится в этом участке генома, специфически ингибирует действие рядом находящегося энхансера.

4. Потенциальныерегуляторные элементы промоторной области гена человека

КЕР2.

Просуммировав данные, полученные выше на основе анализа активности люциферазных конструкций, мы выделили в промоторной области гена КЕР2 четыре региона - сайленсер, энхансер, базальный промотор и участок отвечающий, по-видимому, за стабильность получаемой РНК (рис.7). Размер области, в которой

находится сайленсер, составляет менее 108 п.н., энхансер - менее 79 п.н., базальный промотор - менее 253 п.и.

Enhancer

И

'BemHI Accl Hmcll ,XE>ai S«l! Рй1

Sphl } Hiodlti)

pSLM3 -180%

pGLM3' - 95.1 %

pGlMS - 10j%

pGUM7-121%

PGLM9 - 80%

Рис.7. Схема расположения регуляторных элементов в промоторном регионе гена RFP2.

Мы провели анализ областей, в которых содержатся предполагаемые сайленсер и энхансер, для выявления в них сайтов связывания транскрипционных факторов по схеме, описанной выше, для анализа промоторного района. Результаты приведены в табл.2. Все выявленные сайты оказались единичными в данной области для соответствующих транскрипционных факторов.

Судя но экспериментальным данным, эти оба элемента должны взаимодействовать друг с другом, компенсируя активность энхансера, поэтому, они должны располагаться близко друг к другу, в пределах 50 п.н.. Выяснение действительной роли транскрипционных факторов, приведенных в таблице для определения характера экспрессии гена RFP2 требует экспериментальной проверки.

5. Установление структуры гена мыши Я/р2 и компьютерный анализ промоторного региона.

Следующим этапом было выяснение структуры промотора и определение механизмов регуляции гена Д/р2 мыши. Было известно, что спектр тканеспецифичности экспрессии гена RFP2 у человека и мыши является сходным. В случае сходства структуры промоторов генов-ортологов RFP2 у мыши и человека, мышь можно было бы использовать в качестве модельного организма для дальнейшего глубоко изучения регуляции гена.

Табл. 2. Список потенциальных транскрипционных факторов в участках ДНК, предположительно содержащих энхансер и сайленсер. Серым цветом обозначены факторы, находящиеся в области сайленсера, темно-серым - в области энхансера.

Название транскрипционно о фактора Позиция Соге втШагйу Майта 81гш1аги1у Sequence

ШУВЛ 36 - 1.000 0.882 gcaAACGgcg

» УМУВ_02 36 1.000 0.934 gcaAACGgc

АР2Л6 51 1.000 0.856 ИССХХ^о^

СЕТ81Р54 01 , 53 1.000 0.870 ссСООАЙ^' •

8Р1Л6 86 1.000 0.892 ШЙШСОййсйс

вС 01 86 1,000 0.854 tttgGGCGggcgca

ВВЙЯГ,*

ттт- * -г- ; гтещ?" . Щ&Я&ШЪ г ;

УШШ?' Л п -Кшг:

пши®,:--* гМт*

•'-■»■/•^'•гле^-! ЪШШ 1ЖМШЦ тх-тшёйше^

•¡¡¿-•л^ЧМ4* ШШШШШ:.

ШШж -л ЫЯт •ШдаедН! шттж^ ■

Ъ&ЯШ А " ц тттщ штат

?чтж Щй*,; тшшш^ •

82 * ! ""»'ЗШ-ига ГЛШЖ

-¡шгтт '.■^мШшш'' . ■

ш&ввш . -.-ЖБ&Щ ; : о&Ш ШМт%' •

жтшш < > : ''шг. ШсввЪА&т' -

■:: щемувм г омт

На момент начала работы о структуре генома мыши в области гена 1?/р2 мыши ничего не было известно. Мышиный гомолог Л]р2 расположен на 14-й хромосоме мыши в области, синтенной району 13д14.3 человека. Ранее в нашей лаборатории на основе анализа базы данных ёЪБ8Т была установлена т вШсо структура человеческого гомолога гена ЯЖР2 мыши [Багапоуа й а1., 2003]. На основе перекрывающихся клонов кДНК АА499774, ВР714458, ВВ575397, ВС079221 и ВР714459 были описаны три изоформы мРНК мышиного гена Я(р2. Все они имеют высокую степень сходства с человеческим геном в кодирующей области. Компьютерный анализ показал, что аминокислотные последовательности продуктов человеческого и мышиного генов имеют одинаковую длину и содержат 86% идентичных позиций и всего 8% неэквивалентных замен. В то же время, -нетранслируемые области мышиных изоформ составленных т вШсо не были гомологичны человеческим последовательностям, имеющимися в базах данных ОепБапк и ёЪБ8Т.

Первым этапом этой части работы было экспериментальное доказательство существования выявленных т вШсо изоформ РНК мышиного ортолога геЩр2. Для

этого мы провели ПЦР на продуктах обратной транскрипцией на тотальной РНК мыши (ОТ-ПЦР).

Результаты этого эксперимента приведены на рис.8. Полученные амлификаты были клонированы в вектор и были определены их нуклеотидные

последовательности. В результате мы экспериментально подтвердили существование двух изоформ мРНК у этого гена - Ш1 и Ш2. Обе эти изоформы в своей 5' нетранслируемой части имеют два альтернативных первых экзона и один общий второй.

I ■ • ш5 ш5 в? ц;$ ю5 т5

1кЬМ 10ОЬМ аН . о* ой »10 а» 2 а£

* > * »» » * ' 1 '

' { I 'П Г

2 сжш 2 ехоп Г? 1 Ш 2 П13 ПЧ

Рис.8. Электрофореграмма продуктов реакции ОТ-ПЦР экзонов ЯЛр2 мыши.

В процессе выполнения работы стала доступна черновая версия генома мыши. В результате выравнивания определенных нами последовательностей мРНК изоформ гена мыши против геномной последовательности мыши нам удалось реконструировать структуру мышиного ортолога гена Я]р2 (рис. 9).

Рис. 9. Структура гена мыши К)р2 и его изоформ. Стрелками указаны праймеры для с помощью которых проводили ОТ-ПЦР.

Следующим этапом было проведение компьютерного анализа областей перед двумя первыми экзонами гена мыши. Анализ нуклеотидных последовательностей показал среднее содержание GC нуклеотидов в промоторной области - около 60%. Нами было выявлено два регуляторных элемента перед экзоном 1а: ТАТА-бокс за 23 п.н. от точки инициации транскрипции (CTTTTTATAGC) и GC-бокс за 158 п.н. (TGGGTGGCCC). В непосредственной близости от второго экзона каких-либо регуляторных элементов обнаружено не было. Анализ плотности распределения сайтов посадки транскрипционных факторов также не выявил дисбаланса между двумя цепями ДНК.

6. Сравнительный анализ области гена у человека и мыши.

На момент начала работы о структуре генома мыши в области RFP2 ничего не было известно, она появилась в ходе данной работы в 2002 [Emes R.D. et al., 2003]. Проведенное нами сравнение генома человека и мыши в области гена RFP2 показал, что в этом районе проходит граница синтении, расположенная перед кодирующим экзоном. Таким образом, оказалось, что область промотора и первых двух экзонов гена RFP2 у человека и мыши не имеет протяженных областей гомологии.

В то же время важно отметить, что спектр тканеспецифичности экспрессии этого гена у человека и мыши остается сходным [Baranova et aL, 2003]. Из этого следовало, что при сравнении промоторных областей гена RFP2 у человека и мыши могут быть обнаружены одинаковые регуляторные элементы.

Мы провели сравнительный анализ особенностей промоторных областей гена RFP2 у мыши и человека с целью выявления общих и различных регуляторных элементов.

Структурные и нуклеотидные особенности промоторного района. Промоторная область гена человека имеет очень высокий GC-состав - 72% по сравнению с мышиным гомологом 60%. Также в промоторной области гена человека локализована область с повторами типа GnA, способными образовывать такие сложные вторичные структуры, как квадруплексы, играющие роль в регуляции транскрипции.

Регуляторные элементы. Как уже было выше сказано, в промоторной области гена RFP2 человека не было обнаружено ТАТА-бокса, но найдено два GC-бокса. У мышиного гомолога перед экзоном изоформы IF1 были обнаружены и ТАТА-бокс и GC-бокс.

Характер распределения транскрипционных факторов в промоторной области. У гена RFP2 человека выявлен дисбаланс плотности распределения сайтов посадки транскрипционных факторов между комплементарными цепями ДНК, и определены семейства факторов, вносящих основной вклад в это распределение - IKAROS, SP1, CETS1P54. У гена RJp2 мыши наблюдалось равномерное распределение плотностей сайтов посадки транскрипционных факторов.

Альтернативный сплайсинг 5'-нетранслируемых частей. Для гена RFP2 человека зарегистрировано три изоформы, образующихся в результате альтернативного сплайсинга первых двух нетранслируемых экзонов. Мышиный гомолог данного гена кодирует две изоформы мРНК, IF1 и IF2, каждая из которых имеет свой промотор.

Антисенс регуляция. Антисенс-транскрипт к гену КЕР2 человека был клонирован ранее в лаборатории анализа генома ИОГен РАН. В помотроной области гомолога мыши антисенс-транскрипта обнаружено не было.

Таким образом, ген Е1'Р2 мыши имеет не похожую регуляцию по сравнению с ортологом у человека, и его использование в качестве модельного организма для исследования регуляции гена Е1'Р2 человека не является обоснованным.

Выводы

1. Определена и зарегистрирована в ОепБапк (AF363782) последовательность нуклеотидов длиной 3,6 т.п.н, содержащая промоторный регион и участок инициации транскрипции гена РРР2 человека. Положение точки инициации транскрипции гена ЯЖР2 определено экспериментально.

2. Проведен компьютерный анализ промоторной области гена человека и выявлены потенциальные элементы регуляции этого гена: ОС-бокс и сайты связывания транскрипционных факторов. Проведенный анализ выявил около 300 потенциальных сайтов связывания, для 26 факторов транскрипции, относящимися к 17 семействам.

3. Выявлена уникальная особенность структуры промотора гена человека: в транскрибируемой цепи ДНК перед ОС-боксом расположен несовершенный повтор структуры ОпА длиной 280 п.н. Выявлена асимметрия в распределении количества сайтов связывания транскрипционных факторов в области несовершенного повтора: около 200 сайтов находятся в транскрибируемой цепи ДНК, а в цепи, комплементарной этому участку, сайты связывания отсутствуют.

4. Получены 9 делеционных производных промоторного участка гена ЖЕР2 человека в составе рекомбинантных плазмид с репортерным геном люциферазы. Экспериментально определена активность промотора каждого делеционного варианта и локализованы четыре регуляторных элемента промотора гена: базальный промотор, энхансер, сайленсер и участок, отвечающий за стабильность РНК гена.

5. Определены потенциальные сайты связывания транскрипционных факторов в участках промотора гена ЯЖР2 человека, предположительно содержащих энхансер и сайленсер.

6. Экспериментально выявлены две изоформы гена мыши ортологичного гену Щр2. Проведен сравнительный компьютерный анализ последовательности нуклеотидов промоторной области гена человека установленной в нашей работе и опубликованной в ходе нашей работы последовательности нуклеотидов промоторной области гена мыши. Обнаружен разрыв синтении хромосом человека и мыши непосредственно перед белок-кодирующей областью гена, которая остается гомологичной у человека и мыши.

7. Проведен биоинформатический анализ регуляторной части гена К$р2 у мыши. Проведен сравни гельный анализ регуляторных элементов выявленных в промоторных областях генов у мыши и человека. Проанализированые регуляторные элементы транскрипции не имеют общих черт для объяснения сходства спектров тканеспецифичности экспрессии гена у человека и мыши.

9. Список работ, опубликованных по теме диссертации.

1. Baranova A, Hammarsund M, Ivanov D, Skoblov M, Sangfelt О, Corcoran M, Borodina T, Makeeva N, Pestova A, Tyazhelova T, Nazarenko S, Gorreta F, Alsheddi T, Schlauch K, Nikitin E, Kapanadze B, Shagin D, Poltaraus A, Ivanovich Vorobiev A, Zabarovsky E, Lukianov S, Chandhoke V, Ibbotson R, Oscier D, Einhorn S, Grander D, Yankovsky N., Distinct organization of the candidate tumor suppressor gene RFP2 in human and mouse: multiple mRNA isoforms in both species- and human-specific antisense transcript RFP2OS, Gene. 2003 Dec 4; 321:103-12.

2. Баранова А.В., Иванов Д.В., Бородина Т.А., Макеева Н.В., Скоблов М.Ю., Капанадзе Б.И., Сангфельдт У., Шагин Д.В., Немцова М.В., Никитин ЕА., Полтораус А.Б., Залетаев Д.В., Лукьянов С.А., Кременецкая А.И., Воробьев А.И., Бауш Ч., Забаровский Е.Р., Эйнхорн С, Янковский Н.К. Исследование нового гена человека RFP2 (Leu5) в качестве кандидата на роль супрессора опухолевого роста, повреждаемого при В-клеточном хроническом лимфолейкозе. В сб. отчетов за 1999 год "Геном Человека", Москва, с. 5-6.

3. Баранова А.В., Иванов Д.В., Макеева Н.В., Бородина Т.А., Скоблов М.Ю., Тяжелова Т.В., Шагин Д.В., Немцова М.В., Никитин Е.А., Залетаев Д.В. Лукьянов С.А., Воробьев А.И., Забаровский Е.Р., Эйнхорн С, Янковский Н.К. Новый ген человека Leu5, кодирующий белок, принадлежащий семейству RFP и являющийся кандидатом на роль супрессора опухолевого роста, повреждаемого при В-клеточном хроническом лимфолейкозе. Доклад на конф. и материалы сборника II съезда Вавиловского общества генетиков и селекционеров, Том II, с. 284-285. 1-5 февраля 2000 года, г. Санкт-Петербург.

4. Н.К. Янковский, А.В. Баранова, Т.А. Тяжелова, Н.В. Макеева, Д.В. Иванов, Бородина Т.А., Скоблов М.Ю., Капанадзе Б.И., Сангфельдт У., Бауш Ч., Забаровский Е.Р., Эйнхорн С. Транскрипционная карта участка 13ql4.noдвергающегося делециям у больных В-клеточным хроническим лимфолейкозом. Постерное сообщение на II (IV) российком съезде медицинских генетиков, Курск, 17-19 мая, 2000 г. Опубликовано в сборнике трудов конферецнии т.1, с.287-288.

5. А.В. Баранова, Д.В. Иванов, Бородина Т.А, Макеева Н.В., Скоблов М.Ю., Капанадзе Б.И., Сангфельдт У., Шагин Д.В., М.В. Немцова, Никитин Е.А., Полтараус А.Б., Залетаев Д.В., Лукьянов С.А., Кременецкая А.И., Воробьев А.И., Бауш Ч., Забаровский Е.Р., Эйнхорн С, Янковский Н.К. "Новый ген человека RFP2 (LEU5) -перспективный кандидат на роль супрессора опухолевого роста, повреждаемого при В-клеточном хромническом лимфолекозе" Постерное сообщение на II (IV) российком съезде медицинских генетиков, Курск, 17-19 мая, 2000 г. Опубликовано в сборнике трудов конферецнии т.1, с. 259-260.

6. Иванов Д.В., Бородина Т.А, Скоблов М.Ю., Баранова А.В., Янковский Н.К. Структурно-функциональные исследования нового гане человека RFP2. Постерное собщение на школе-конференции "Горизонты физико-химической биологии", Пущино, 28 мая-02 июня 2000г. Опубликовано в сборнике трудов конферецнии т.1, с.241.

7. Иванов Д.В., Бородина Т.А., Скоблов М.Ю., Пестова А.А., Капанадзе Б.И., Сангфельдт У., Эйнхорн С, Баранова А.В., Янковский Н.К. Структурное и функциональное исследование нового гена человека RFP2. Постерное сообщение на

10-й итоговой конф. "Геном Человека-2000", г.Черноголовка, 18-22 декабря 2000 г., с. 52.

8. A.V. Baranova, T.V. Tyazelova, D.V. Ivanov, M.Yu. Skoblov, T.A. Borodina, A.A. Pestova, B.I. Kapanadze, O. Sangfelt, D. Grander, S. Einhom, N.K. Yankovsky Human chromosome 13 region ql4.3 often deleted in human malignancies: unusual distribution of the repeats and new candidate genes. Human Genome Meeting, 2001, 19-23 April, Edinbourgh, UK, p.88.

9. D.V. Ivanov, M.Yu. Skoblov, T.A.Borodina, A.A. Pestova, K.S.Shachbasov, O.Sangfeldt, S.Einhorn, A.V.Baranova, N.K.Yankovsky Structural and functional characterization of a novel human RFP2 gene Molecular mechanisms of genetic processes and biotechnology International symposium, 2001, Novemberl8-24, Moscow-Minsk, p.50-51.

10. M.Yu. Skoblov, D.V. Ivanov, K.S.Shachbasov, A.V.Baranova, N.K.Yankovsky Promoter region structure of human gene RFP2 Molecular mechanisms of genetic processes and biotechnology International symposium, 2001, Novemberl8-24, Moscow-Minsk, p.30.

И. Иванов Д.В., Скоблов М.Ю., Бородина Т.А., Пестова А.А., Шахбазов К.С., Баранова А.В., Янковский Н.К. Структура и возможные способы регуляции нового гена человека RFP2. Международная конференция «СПИД, рак и родственные проблемы, Санкт-Петербург, 27 мая 2001 г., с. 80-81.

12. Баранова А.В., Иванов Д.В., Скоблов М.Ю., Бородина Т.А., Пестова А.А., Шахбазов К.С., Янковский Н.К. Ген RFP2 - важный кандидат на роль супрессора опухолего роста, повреждаемого про В-клеточном хроническом лимфолейкозе. VI Международная конференция РФФИ «Молекулярная медицина», г.Пущино Московской области, 12 сентября 2001 г., с.67-68.

13. Скоблов М.Ю., Бородина ТА., Гуськова А.А., Баранова А.В., Янковский Н.К. Изучение эволюционных аспектов структуры гена-кандидата онкосупрессора RFP2 у мыши, крысы и человека. Постерное сообщение на второй научной конференции «Актуальные проблемы генетики», ИОГен РАН, Москва, 20-21 февраля 2003 г., с. 14-15.

14. Скоблов М.Ю., Иванов Д.В., Гуськова А.А., Шахбазов К.С., Иванов Д.В., Рубцов П.М., Прасолов B.C., Баранова А.В., Янковский Н.К. Структура промоторной области гена человека RFP2. Постерное сообщение на второй научной конференции «Актуальные проблемы генетики», ИОГен РАН, Москва, 20-21 февраля 2003 г., с. 1112.

Подписано в печать 20.10.2004 Формат 60x88 1/16. Объем 1.5 уел п.л.

Тираж 100 экз. Заказ № 154 Отпечатано в ООО «Соцветие красок» 119992 г.Москва, Ленинские горы, д. 1 Главное здание МГУ, кЛ 02

P197 1J

РНБ Русский фонд

2005-4 15633

Содержание диссертации, кандидата биологических наук, Скоблов, Михаил Юрьевич

1. Введение

1.1. Актуальность проблемы

1.2. Цель и задачи исследования

1.3. Научная новизна

1.4. Научно-практическая значимость работы

1.5. Обоснование постановки темы диссертационной работы

2. Обзор литературы

2.1. Принципы регуляции экспрессии генов у эукариот.

Основные элементы

2.1.1. Промоторы

2.1.2. Энхансеры

2.1.3. Транскрипционные факторы

2.1.4. Регуляция экспрессии генов с помощью антисмысловых РНК

2.2. Сравнение регуляторных частей у гомологичных генов

3. Материалы и методы

3.1. Материалы и оборудование

3.2. Методы

4. Результаты и обсуждение

4.1. Определение нуклеотидной последовательности промоторной области гена человека RFP

4.2. Компьютерный анализ промоторной области гена человека RFP2.

4.3. Функциональная характеристика промоторного региона гена человека RFP

4.4. Потенциальные регуляторные элементы промоторной области гена человека RFP

4.5. Установление структуры гена мыши Rfp

4.6. Сравнительный анализ области гена RFP2 у человека и

Введение Диссертация по биологии, на тему "Структура и особенности регуляции генов гомологов RFP2 у человека и мыши"

1.1. Актуальность проблемы. Опухолевые заболевания являются одной из ведущих по частоте групп болезней человека и одной из основных причин смертности взрослого населения. Вероятность возникновения и интенсивность прогрессии опухолей зависят от генотипа индивида и от соматических мутаций, возникающих в процессе индивидуального развития. Важным генетическим барьером на пути возникновения и прогрессии опухолей являются гены-супрессоры опухолей. Мутации в этих генах «запускают» опухолевый процесс и этапы его прогрессии. Изучение тонкой структуры и регуляции генов супрессоров у человека необходимы для понимания генетического контроля нормы, определяемой этими генами, и молекулярно-генетических механизмов возникновения и прогрессии опухолей. Поэтому проведение таких исследований является высоко актуальным. Такие исследования стали возможны в последние годы в результате реализации всемирной и российской программ геном человека. Исследование тонкой структуры и функционирование отдельных областей генома проводят сегодня путем сопоставления данных о структуре генома человека в норме с данными о его структуре при патологическом опухолевом процессе, а также на основе данных сравнительной геномики. Такой подход стал возможным лишь в самое последнее время, и бвл использован в ходе осуществления данной диссертационной работы. 1.2. Цель и задачи исследования. Целью исследования являлось изучение структурнофункциональных особенностей регуляторного района гена RFP2 человека, как наиболее вероятного гена супрессора опухолевого роста, расположенного в области ql4 хромосомы 13. Для реализации поставленной цели решались следующие задачи: 1. Определить этого гена. 2. Провести биоинформатический анализ промоторной области и выявить потенциальные элементы регуляции транскрипции гена RFP2 3. Выявить и провести анализ спектра потенциальных и список сайтов самих связывания транскрипционных факторов нуклеотидную последовательность промоторного региона гена RFP2 человека и точку инициации транскрипции для транскрипционных факторов, взаимодействующих с регуляторной областью гена RFP2 у человека 4. Минимизировать промоторную область гена RFP2 человека и экспериментально элементы этого гена. 5. Определить региона гена сравнительный нуклеотидную RFP2 мыши анализ последовательность и провести последовательностей промоторного нуклеотидов биоинформатический локализовать потенциальные регуляторные промоторных районов гена RFP2 человека и мыши и, таким образом, выявить причины сходства спектров тканеспецифичности экспрессии гена RFP2 у человека и мыши. 1.3. Научная новизна. Впервые определена и зарегистрирована в GenBank (AF363782) последовательность промоторный нуклеотидов гена длиной 3,6 RFP2. т.п.н содержащая регион человека Экспериментально определено положение точки инициации транскрипции гена RFP2. Впервые проведен компьютерный анализ промоторной области гена RFP2 человека и вьывлены потенциальные элементы регуляции этого гена: GC-бокс и сайты связывания транскрипционных факторов. Выявлена уникальная особенность структуры промотора гена RFP2: в транскрибируемой асимметрия в нити ДНК перед ОС-боксом сайтов расположен связывания несовершенный повтор структуры GnA длиной 280 п.н. Выявлена распределении количества транскрипционных факторов в области несовершенного повтора: около 200 сайтов находятся в транскрибируемой нити ДНК, а в нити, комплементарной этому участку, сайты связывания отсутствуют. Впервые с помощью люциферазных конструкций локализованы четыре регуляторных элемента промотора гена RFP2: базальный промотор, энхансер, сайленсер и участок, отвечающий за стабильность мРНК гена RFP2. Определены потенциальные сайты промотора связывания гена RFP2, транскрипционных факторов в участках предположительно содержащих энхансер и сайленсер. Проведен сравнительный компьютерный анализ последовательности нуклеотидов промоторной области гена RFP2 человека и мыши. Обнаружен разрыв синтении хромосом человека и мыши непосредственно перед белоккодирующей областью гена, которая остается гомологичной у человека и мыши. Экспериментально выявлены две изоформы гена мыши ортологичного гену RFP2 человека. Впервые с помощью биоинформатического анализа в регуляторной части гена RFP2 у мыши выявлен набор 20 потенциальных сайтов связывания для 18 факторов транскрипции, относящимися к 11 семействам. Проведен сравнительный анализ наборов сайтов связывания транскрипционных факторов и самих транскрипционных факторов в регуляторной области генов RFP2 у мыши и человека.

Заключение Диссертация по теме "Генетика", Скоблов, Михаил Юрьевич

6. Выводы

1. Определена и зарегистрирована в GenBank (AF363782) последовательность нуклеотидов длиной 3,6 т.п.н содержащая промоторный региона и участок инициации транскрипции гена RFP2 человека. Положение точки инициации транскрипции гена RFP2 определено экспериментально.

2. Проведен компьютерный анализ промоторной области гена RFP2 человека и выявлены потенциальные элементы регуляции этого гена: GC-бокс и сайты связывания транскрипционных факторов. Проведенный анализ выявил порядка 300 потенциальных сайтов связывания, для 26 факторов транскрипции, относящимися к 17 семействам.

3. Выявлена уникальная особенность структуры промотора гена RFP2 человека: в транскрибируемой цепи ДНК перед GC-боксом расположен несовершенный повтор структуры GnA длиной 280 п.н. Выявлена асимметрия в распределении количества сайтов связывания транскрипционных факторов в области несовершенного повтора: около 200 сайтов находятся в транскрибируемой цепи ДНК, а в цепи, комплементарной этому участку, сайты связывания отсутствуют.

4. Получены 9 делеционных производных промоторного участка гена RFP2 человека в составе рекомбинантных плазмид с репортерным геном люциферазы. Экспериментально определена активность промотора каждого делеционного варианта и локализованы четыре регуляторных элемента промотора гена RFP2: базальный промотор, энхансер, сайленсер и участок, отвечающий за стабильность РНК гена RFP2.

5. Определены потенциальные сайты связывания транскрипционных факторов в участках промотора гена RFP2 человека, предположительно содержащих энхансер и сайленсер.

6. Экспериментально выявлены две изоформы гена мыши ортологичного гену RFP2 человека определив тем самым возможные промоторные регионы. Проведен сравнительный компьютерный анализ последовательности нуклеотидов промоторной области гена RFP2 человека установленной в нашей работе и опубликованной в ходе нашей работы последовательности нуклеотидов промоторной области гена Rfp2 мыши. Обнаружен разрыв синтении хромосом человека и мыши непосредственно перед белок-кодирующей областью гена, которая остается гомологичной у человека и мыши.

7. Проведен биоинформатический анализ регуляторной части гена Rfp2 у мыши. Проведен сравнительный анализ регуляторных элементов выявленных в промоторных областях генов RFP2 у мыши и человека. Проанализированые регуляторные элементы транскрипции не имеют общих черт для объяснения сходства спектров тканеспецифичности экспрессии гена RFP2 у человека и мыши.

Библиография Диссертация по биологии, кандидата биологических наук, Скоблов, Михаил Юрьевич, Москва

1. Патрушев Л.И., Экспрессия генов., Москва, 2000.

2. Abbott A., Abu-Threideh J., Ahrens С., et al. Genome Sequence of the Nematode Caenorhabditis elegans. A Platform for Investigating Biology // Science. 1998. V. 282. P. 2012-2018.

3. Adams MD, Celniker SE, Holt RA., et al. The genome sequence of Drosophila melanogaster// Science. 2000. V. 287. P. 2185-95.

4. Aravin AA., Naumova NM, Tulin AV, Vagin VV, Rozovsky YM, Gvozdev VA. Double-stranded RNA-mediated silencing of genomic tandem repeats and transposable elements in the D. melanogaster germline.// Curr. Biol. 2001. V. 11, P. 1017-1027.

5. Banerji J., Olson L., Schaffher W. A lymphocyte-specific cellular enhancer is located downstream of the joining region in immunoglobulin heavy chain genes // Cell. 1983. V. 33, P. 729-740.

6. Baranova AV, Lobashev AV, Ivanov DV, Krukovskaya LL, Yankovsky NK, Kozlov AP. In silico screening for tumour-specific expressed sequences in human genome. // FEBS Lett. 2001. V. 508 P. 143-8.

7. Bass BL. RNA editing by adenosine deaminases that act on RNA. //Annu. Rev. Biochem. 2002. V. 71, P. 817-846.

8. Baylin SB, Herman JG. Epigenetics and loss of gene function in cancer. In DNA Alterations in Cancer (Ehrlich, M., ed.). Eaton publishing, MA, USA. 2000. P. 293-309.

9. Blackwood EM, Kadonaga JT. Going the Distance: A Current View of Enhancer Action. // Science., 1998., V. 281. P.60.

10. Blackwood MA, Weber BL. BRCA1 and BRCA2: from molecular genetics to clinical medicine. //J Clin Oncol. 1998. V. 16. P. 1969-77.

11. Burke LJ, Zhang R, Lutz M, Renkawitz R. The thyroid hormone receptor and the insulator protein CTCF: two different factors with overlapping functions. // J Steroid Biochem Mol Biol. 2002. V. 83. P. 49-57.

12. Castresana J. Genes on human chromosome 19 show extreme divergence from the mouse orthologs and a high GC content // Nucleic Acids Res. 2002. V. 30. P.1751 1757.

13. Chinwalla AT, Cook LL, Delehaunty KD, et al. Initial sequencing and comparative analysis of the mouse genome // Nature. 2002. V. 420. P. 520-562.

14. Ehrlich M. DNA hypomethylation and cancer. // In: DNA Alterations in Cancer. (Ehrlich, M., ed.). Eaton Publishing, MA, USA. 2000. P. 273-291.

15. Emes RD, Goodstadt L, Winter EE, Ponting CP. Comparison of the genomes of human and mouse lays the foundation of genome zoology. // Hum Mol Genet. 2003 Apr 1; 12(7): 701-9.

16. Feng Q., Zhang Y., Hao P., et al. Sequence and analysis of rice chromosome 4// Nature. 2002. V. 420. P. 316-20.

17. Gibbs RA, Weinstock GM, Metzker ML, Muzny DM, Sodergren EJ, Scherer S, Scott G. Genome sequence of the Brown Norway rat yields insights into mammalian evolution. //Nature. 2004. V. 428. P. 493-521.

18. Gilles SD, Tonegawa S., Expression of cloned immunoglobulin genes introduced into mouse L cells. // Nucleic Acids Res. 1983. V. 11. P. 7981-97.

19. Goffeau A., Barrell B.G., Bussey H., et al. Life with 6000 genes // Science. 1996. V. 274. P. 563-7.

20. Gray M.D., Shen J.C., Kamath-Loel A.S. et al. The Werner syndrome protein is a DNA helicase. // Nature Genet. 1997. V. 17. P. 100103.

21. Grosschedl R, Birnstiel M. Spacer DNA sequences upstream of the TATA sequence are essential for promotion of H2a gene transcription in vivo. // Proc.Nat.Acad.Sci.USA. 1980. V. 77, P. 7102 7106.

22. Ham J, Steger G, Yaniv M., How do eukaryotic activator proteins stimulate the rate of transcription by RNA polymerase II? // FEBS Lett. 1992. V. 307. P. 81-6.

23. Hannon, G.J. RNA interference. // Nature. 2002. V. 418, 244-251

24. Holt RA., Subramanian GM, Halpern A, et al. The genome sequence of the malaria mosquito Anopheles gambiae // Science. 2002. V. 298. P. 129-49.

25. Kennerdell JR, Yamaguchi S, Carthew RW. RNAi is activated during Drosophila oocyte maturation in a manner dependent on aubergine and spindle-E. //Genes Dev. 2002 V. 16, P. 1884-1889.

26. Kim J, Iyer VR., Global role of TATA box-binding protein recruitment to promoters in mediating gene expression profiles. // Mol Cell Biol. 2004. V. 24. P. 8104-12.

27. Kiyosawa H, Yamanaka I, Osato N, Kondo S, Hayashizaki Y; RIKEN GER Group; GSL Members. .Antisense transcripts with FANTOM2 clone set and their implications for gene regulation. // Genome Res. 2002. V. 13, P. 1324-1334.

28. Koop B.F., Hood L. Striking sequence similarity over almost 100 kilobases of human and mouse T-cell receptor DNA // Nat Genet. 1994. V. 7. P. 48-53.

29. Kumar M. and Carmichael GG. Nuclear antisense RNA induces extensive adenosine modifications and nuclear retention of target transcripts. // Proc. Natl. Acad. Sci. U. S. A. 1997. V. 94, P. 3542-3547.

30. Kuo S, Chesrown SE, Mellott JK, Rogers RJ, Hsu JL, Nick HS. In vivo architecture of the manganese superoxide dismutase promoter. II J Biol Chem. 1999. V. 274 P.3345-54.

31. Lamerdin JE, Montgomery MA, Stilwagen S.A., Scheidecker LK, Tebbs RS, Brookman KW, Thompson LH, Carrano AV. Genomic sequence comparison of the human and mouse XRCC1 DNA repair gene regions. // Genomics. 1995. V. 25. P. 547-54.

32. Lander E.S., Linton L.M., Birren В., et al. Initial sequencing and analysis of the human genome // Nature. 2001. V. 409. P. 860-921.

33. Lavorgna G., Dahary D, Lehner B, Sorek R, Sanderson C.M., Casari G. In search of antisense. // Trends in Biochemical Sciences 2004. V.29.P. 15-21.

34. Lehner, B. et al. Antisense transcripts in the human genome. //Trends Genet. 2002. V. 18, P. 63-65.

35. Lieberman PM, Berk AJ. A mechanism for TAFs in transcriptional activation: activation domain enhancement of TFIID-TFIIA--promoter DNA complex formation. // Genes Dev. 1994 V.8. P.995-1006.

36. Magoulas C, Fried M. Isolation and genomic analysis of the human surf-6 gene: a member of the Surfeit locus // Gene. 2000. Vol. 8. P. 115-23.

37. Munroe, SH, Lazar MA. Inhibition of c-erbA mRNA splicing by a naturally occurring antisense RNA. // J. Biol. Chem. 1991. V. 266. P. 2208322086.

38. Nordhoff V., Hubner K., Bauer A., et al. Comparative analysis of human, bovine, and murine Oct-4 upstream promoter sequences // Mamm Genome. 2001. Vol. 12. P. 309-17.

39. Oeltjen J., Malley Т., Muzny D., et al. Large-scale comparative sequence analysis of the human and murine bruton's tyrosine kinase loci reveals conserved regulatory domains // Genome Research. 1997. V. 7. P. 315-329.

40. Okazaki Y., M. Furuno, T. Kasukawa, J. Adachi, H. Bono, S. Kondo, et al., Analysis of the mouse transcriptome based on functional annotation of 60,770 full-length cDNAs. // Nature., 2002 V. 420, P. 563-73.

41. Pedersen AG, Baldi P, Chauvin Y, Brunak S., The biology of eukaryotic promoter prediction—a review. // Comput Chem. 1999. V. 23. P. 191-207.

42. Peters, NT, Rohrbach JA, Zalewski BA, Byrkett CM, Vaughn JC. RNA editing and regulation of Drosophila 4frnp expression by sas-10 antisense readthrough mRNA transcripts. // RNA. 2002. V. 9. P. 698-710.

43. Prescott EM. Proudfoot NJ. Transcriptional collision between convergent genes in budding yeast. // Proc. Natl. Acad. Sci. U. S. A. 2002. V. 99. P. 8796-8801.

44. Ptashne M. How eukaryotic transcriptional activators work. II Nature. 1988. V.335. P. 683-9.

45. Ptashne M, Gann AA. Activators and targets. //Nature. 1990. V. 346. P. 329-31.

46. Queen C, Baltimore D. Immunoglobulin gene transcription is activated by downstream sequence elements. //Cell. 1983. V. 33. P. 741-8.

47. Reik W, Walter, J. Genomic imprinting: parental influence on the genome. // Nat. Rev. Genet. 2001. V. 2. P. 21-32.

48. Risitano A, Fox KR. Stability of intramolecular DNA quadruplexes: comparison with DNA duplexes. // Biochemistry. 2003. V. 42. P. 6507-13.

49. Runte M, Huttenhofer A, Gross S, Kiefmann M, Horsthemke B, Buiting K. The IC-SNURF-SNRPN transcript serves as a host for multiple small nucleolar RNA species and as an antisense RNA for UBE3A. // Hum. Mol. Genet. 2001. V. 10. P. 2687-2700.

50. Salanoubat M., Lemcke K., Rieger M., et al. Sequence and analysis of chromosome 3 of the plant Arabidopsis thaliana. // Nature. 2000. V. 408. P. 820-2.

51. Sanchez M., Queralt R., Bruguera M., Rodes J., Oliva R. Cloning, sequencing and characterization of the rat hereditary hemochromatosis promoter: comparison of the human, mouse and rat HFE promoter regions // Gene. 1998. Vol. 225. P. 77-87.

52. Sasaki Т., Matsumoto Т., Yamamoto K., et al. The genome sequence and structure of rice chromosome 1 // Nature. 2002. V. 420. P. 3126.

53. Scadden AD, Smith CW. Specific cleavage of hyper-edited dsRNAs. // EMBO J. 2001. V. 20. P. 4243-4252.

54. Schild-Poulter C, Shih A, Yarymowich NC, Hache RJ. Down-regulation of histone H2B by DNA-dependent protein kinase in response to DNA damage through modulation of octamer transcription factor 1. // Cancer Res. 2003. V. 63. P. 7197-205.

55. Schramke V, Allshire, R. Hairpin RNAs and retrotransposon LTRs affect RNAi and chromatin-based gene silencing. // Science. 2003. V. 301. P. 1069-1074.

56. Shendure J, Church G.M. Computational discovery of sense-antisense transcription in the human and mouse genomes. // Genome Biol. 2002, V.3. P.l-14.

57. Shenk T. Transcriptional control regions: nucleotide sequence requirements for initiation by RNA polymerase II and Ш. // Curr Top Microbiol Immunol. 1981. V. 93 P. 25-46.

58. Sorek R, Safer, HM. A novel algorithm for computational identification of contaminated EST libraries. // Nucleic Acids Res. 2003. V. 31. P. 1067-1074.

59. Stamm S, Zhu J, Nakai K, Stoilov P, Stoss O, Zhang M. An alternative-exon database and its statistical analysis. // DNA Cell Biol. 2002. V. 19. P. 739-756.

60. Suzuki Y, Yamashita R, Shirota M, Sakakibara Y, Chiba J, Mizushima-Sugano J, Nakai K, Sugano S. Sequence comparison of human and mouse genes reveals a homologous block structure in the promoter regions. // Genome Res. 2004. V. 14. P. 1711-8.

61. Tabata S., Kaneko Т., Nakamura Y., et al. Sequence and analysis of chromosome 5 of the plant Arabidopsis thaliana. // Nature. 2000. V. 408. P. 823-6.

62. The Arabidopsis Genome Initiative. Analysis of the genome sequence of the flowering plant Arabidopsis thaliana // Nature. 2000. V. 408. P. 796-815.

63. Theologis A, Ecker JR, Palm CJ et al. Sequence and analysis of chromosome 1 of the plant Arabidopsis thaliana // Nature. 2000. V.408. P. 816-20.

64. Tufarelli C., Stanley JA, Garrick D, Shaipe JA, Ayyub H, Wood WG, Higgs DR. Transcription of antisense RNA leading to gene silencing and methylation as a novel cause of human genetic disease. // Nat. Genet. 2003. V. 34. P. 157-165.

65. Venter J.C., Adams M.D., Myers E.W., et. al. The sequence of the human genome // Science. 2001. V. 291. P. 1304-1351.

66. Volpe ТА, Kidner C, Hall IM, Teng G, Grewal SI, Martienssen RA. Regulation of heterochromatic silencing and histone H3 lysine-9 methylation by RNAi. Science. 2002. V. 297 P. 1833-1837.

67. Weaks RL, Ramsoondar JJ, Gallagher DS Jr, Nogues C, Piedrahita JA. Isolation, characterization and chromosomal localization of the porcineciliary neurotrophic factor (CNTF) gene 11 Anim Genet. 1997. Vol. 28. P. 354-7.

68. Westman В J, Mackay JP, Gell D. Ikaros: a key regulator of haematopoiesis. // Int J Biochem Cell Biol. 2002. V. 34. P. 1304-7.

69. Wingender E, Dietze P, Karas H, Knuppel R. TRANSFAC: a database on transcription factors and their DNA binding sites. // Nucleic Acids Res. 1996. V. 24. P. 238-41.

70. Wutz A. Barlow DP. Imprinted expression of the Igf2r gene depends on an intronic CpG island. // Mol Cell Endocrinol. 1998. V.140, 914.

71. Zhang Z, Carmichael GG. The fate of dsRNA in the in the human genome. // Nat. Biotechnol. 2001. V. 21. P. 379-386.

72. Zhu H, Joliot V, Prywes R., Role of transcription factor TFIIF in serum response factor-activated transcription // J Biol Chem. 1994. V. 269. P.3489-97.

73. Список работ, опубликованных по темедиссертации.

74. Иванов Д.В., Бородина Т.А., Скоблов М.Ю., Пестова А.А., Капанадзе Б.И., Сангфельдт У., Эйнхорн С., Баранова А.В., Янковский Н.К.

75. Структурное и функциональное исследование нового гена человека RFP2. Постерное сообщение на 10-й итоговой конф. "Геном Человека-2000", г.Черноголовка, 18-22 декабря 2000 г.

76. M.Yu. Skoblov, D.V. Ivanov, K.S.Shachbasov, A.V.Baranova, N.K.Yankovsky Promoter region structure of human gene RFP2 Molecular mechanisms of genetic processes and biotechnology International symposium, 2001, Novemberl 8-24, Moscow-Minsk

77. Я благодарю всех людей, которые помогли мне выполнить эту работу, а также тех, кто мне в этом не мешал:

78. Николая Казимировича Янковского за научное и административное руководство, и существование замечательной лаборатории анализа генома.

79. Анчу Баранову за то, что благодаря ей сложилось моё научное мировоззрение, и я ощутил свободу научной деятельности. Спасибо за все, за эту маленькую жизнь, которую мы прожили.

80. Аню Гуськову и Костю Шахбазова идти вперед, в неизвестность, тяжелее всего. Спасибо, что вы были со мной.

81. Спасибо Андрею Лобашеву за его общение, воспоминание о котором мне очень приятны.

82. Всех сотрудников, аспирантов и студентов лаборатории анализа генома, бывших и нынешних, за приятную человеческую атмосферу.

83. Моих родителей, за их постоянную поддержку и понимание.