Бесплатный автореферат и диссертация по биологии на тему
Молекулярно-генетическая характеристика последовательности HS.633957 человека
ВАК РФ 03.02.07, Генетика

Автореферат диссертации по теме "Молекулярно-генетическая характеристика последовательности HS.633957 человека"

САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

На правах рукописи

МОЛЕКУЛЯРНО-ГЕНЕТИЧЕСКАЯ ХАРАКТЕРИСТИКА ПОСЛЕДОВАТЕЛЬНОСТИ Ш.633957 ЧЕЛОВЕКА

специальность: 03.02.07 - генетика

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата биологических наук

ПОЛЕВ Дмитрий Евгеньевич

1 8 НОЯ 2010

Сан кт-Петербург 2010

004613024

Работа выполнена в негосударственном научно-исследовательском учреждении «Биомедицинский центр», Санкт-Петербург.

Научный руководитель: доктор биологических наук, профессор

Козлов Андрей Петрович

Официальные оппоненты:

доктор биологических наук Евтушенко Владимир Иванович, ФГУ «Российский научный центр радиологии и хирургических технологий Федерального агентства по высокотехнологичной медицинской помощи»

доктор биологических наук Проворов Николай Александрович, ГНУ «Всероссийский научно-исследовательский институт сельскохозяйственной микробиологии» Российской академии

сельскохозяйственных наук

Ведущая организация: Научно-исследовательский институт экспериментальной медицины Северо-Западного отделения РАМН

Защита состоится кОЗор^ 2010 г. в/6 часов на заседании совета Д.212.232.12 по защите докторских и кандидатских диссертаций при Санкт-Петербургском государственном университете по адресу: 199034 Санкт-Петербург, Университетская наб. 7/9, СПбГУ, биолого-почвенный факультет, кафедра генетики и селекции, аудитория 1.

С диссертацией можно ознакомиться в Научной библиотеке им. М. Горького Санкт-Петербургского государственного университета

Автореферат разослан " п " окг^ 2010г.

Учёный секретарь

Диссертационного совета Д.212.232.12

кандидат биологических наук Л.А. Мамон

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность проблемы.

В 2001 году двумя независимыми группами исследователей были опубликованы черновые данные но секвенированию генома человека (The Genome Sequencing Consortium, 2001; Venter et al., 2001); в 2003 году завершился проект по расшифровке генома человека The Human Genome Project. На сегодняшний день полностью отсеквенировано уже несколько индивидуальных человеческих геномов (Levy et al., 2007; Wheeler et al., 2008; Bentley et al., 2008; Wang et al., 2008; Ley et al., 2008; Ahn et al., 2009; Kim et al., 2009; McKernan et al., 2009; Drmanac, et al., 2010). Согласно данным по секвенированию размер гаплоидного генома человека составляет около 3*109 п.н., из которых только 5% относится к белок-кодирующим областям (The Genome Sequencing Consortium, 2001), тогда как транскрибируется 74-93% всего генома человека (The ENCODE Project Consortium, 2007). Очевидно, что основная часть транскриптов не кодирует белки. Возможно, они имеют некие регуляторные функции, но какие именно, в большинстве случаев мы не знаем, поэтому аннотация транскрибируемых участков генома человека остаётся актуальной задачей.

Одним из таких неаннотированных транскрибируемых участков генома человека является локус Hs.633957, ставший объектом данного исследования. Предпосылкой его изучения явились теоретические работы А.П. Козлова, в которых он развивает гипотезу об эволюционной роли опухолей в возникновении новых клеточных типов, получившей недавно название «эволюция путём дифференцировки опухолевых клеток» (Kozlov 1979, 1996, 2010; Kozlov et al., 1992; Козлов 1976, 1983, 1987, 2008). Согласно этой гипотезе, неоплазмы предоставляют пространство и ресурсы для экспрессии и апробации новых генов, которые не могут проявится в нормальных тканях в силу отлаженной там регуляции экспрессии. Одним из основных следствий данной гипотезы является предсказание активации экспрессии множества молчащих участков генома в опухолях. Данное следствие получило подтверждение в биоинформатическом исследовании Барановой с соавторами (Baranova et al., 2001), в котором было обнаружено большое количество участков генома с 1пухолеспецифической экспрессией.

Среди таких участков был локус, соответствующий кластеру Hs.633957 (ранее -Is. 104073) по классификации базы данных UniGene. Кластер Hs.633957 содержал 6 EST (от нгл. Expressed Sequence Tag - ярлык экспрессирующейся последовательности), полученных в опухолевых клеток. Он был описан в базе как «транскрибируемый локус», поскольку ходящие в него последовательности не кодируют белки. Ранее данный участок генома [еловека специально не изучался, и его роль в организме не была описана.

Характер экспрессии локуса Hs.633957 вызывает к нему практический и теоретический [нтерес. Перед нами встали следующие вопросы: действительно ли локус экспрессируется олько в опухолях и его РНК-продукт может быть использован как онкомаркёр, за счёт чего то происходит, какова структура транскриптов локуса, кодирует ли он белок и может ли он [меть какую-то функцию в организме?

з

Цель и задачи исследования. Целью данной работы является молекулярно-генетическая характеристика локуса человека, соответствующего кластеру Hs.633957 базы данных UniGene.

В соответствии с целью были поставлены следующие задачи:

1. Определить полную нуклеотидную последовательность РНК-продукта локуса Hs.633957

2. Выявить возможные альтернативные РНК-продукты данного локуса

3. Описать регуляторную область локуса Hs.633957

4. Определить, в каких органах и тканях экспрессируется локус Hs.633957

5. Провести филогенетический анализ последовательности локуса Hs.633957

6. Определить функцию локуса Hs.633957

Практическая ценность. В ходе работы было обнаружено, что локус Hs.633957 транскрибируется лишь в небольшом количестве нормальных органов взрослого человека, при этом представленность его РНК в образцах тканей здоровых органов низка. В лейкоцитах периферической крови изучаемая РНК не была обнаружена. В опухолях, напротив, локус Hs.633957 экспрессируется часто и на относительно высоком уровне. Полученные данные свидетельствуют о потенциальной возможности использования РНК Hs.633957 в качестве молекулярного маркёра опухолей различного происхождения.

Апробация работы. Результаты работы были представлены на XIV, XVI, XVII, XVIII и XIX международных конференциях «СПИД, рак и общественное здоровье» (Санкт-Петербург, 2005, 2007, 2008, 2009, 2010); III, IV и VI Российской конференции по фундаментальной онкологии «Петровские чтения» (Санкт-Петербург, 2007, 2008, 2010); на международной конференции Frontiers in Cancer Prevention Research (Балтимор, США, 2005), на международной конференции SMBE 2010 (Society for Molecular Biology and Evolution) (Лион, Франция, 2010).

Публикации. По материалам диссертации опубликовано 12 работ.

Объем и структура диссертации. Диссертационная работа состоит из «Введения», «Списка сокращений», «Обзора литературы», «Материала и методов», «Результатов», «Обсуждения», «Выводов», «Списка литературы», состоящего из 211 источников. Работа изложена на 148 страницах машинописного текста и содержит 26 рисунков и 6 таблиц.

МАТЕРИАЛ И МЕТОДЫ

В данной работе изучали геномный локус человека, соответствующий кластеру Hs.633957 базы данных UniGene (http://www.ncbi.nlm.nih.gov/sites/entrez?db=unigene).

Образны опухолевых тканей. Замороженные образцы опухолевых тканей, удалённых во время хирургического вмешательства, были любезно предоставлены доктором Колюбаевой С.Н. из Военно-Медицинской Академии им. Кирова, Россия. В работе было использовано 28 образцов, включавших опухоли молочной железы, матки, шейки матки, яичника, лёгкого, бронха, желудка, яичка, краниоспинального стыка и лимфомы. Во всех случаях от пациентов было получено информированное согласие на использование их материала в исследовании.

Клеточные линии. В работе были использованы следующие линии клеток человека: Panel (карцинома поджелудочной железы) и СаСо2 (карцинома толстой кишки). Для проведения работы клеточные линии растили в культуральных флаконах на среде DMEM, содержащей 10% сыворотки телёнка и антибиотик, при 37°С, 5% С02.

Выделение РНК. Выделение тотальной РНК из опухолевых тканей и клеточных линий проводили по стандартной методике с использованием изотиоционата гуанидина (Chirgwin et al, 1979).

Концентрацию РНК определяли на спектрофотометре Ultrospec® 3100 pro. Качество препаратов РНК оценивали по соотношению оптических плотностей А2бо/А28о и электрофорезом в 1%-ном агарозном геле по соотношению количества 28S и 18S рРНК (Sambrook et al, 2001). Выделенную РНК обрабатывали ДНКазой I, свободной от РНКазы ("Sigma"). Наличие в образце РНК примесей ДНК определяли с помощью ПЦР с праймерами к гену домашнего хозяйства GAPDH, а в качестве матрицы использовали препарат РНК.

Синтез кДНК проводили с помощью набора Revert Aid® First Strand cDNA Synthesis Kit ("Fermentas", Литва) с использованием гексануклеотидных или олиго-с!(Т) праймеров согласно рекомендациям производителя. Полученную кДНК хранили при -20°С до использования.

Коммерческие образцы кДНК. В работе использовали коммерческие панели кДНК производства "Clontech", США и "BioChain", США. Наборы кДНК производства "Clontech" включали наборы кДНК нормальных тканей Human МТС™ Panel I и Human МТС™ Panel II, набор кДНК тканей иммунной системы Human Immune System МТС™ Panel, набор кДНК тканей пищеварительной системы Human Digestive System МТС™ Panel, набор кДНК фетальных тканей Human Fetal МТС™ Panel и набор кДНК опухолей Human Tumor МТС™ Panel. Всего 43 образца из 25 нормальных органов и тканей. Данные образцы кДНК не содержат примесей геномной ДНК и нормализованы по экспрессии четырех генов "домашнего хозяйства" клетки. Образцы нормальных тканей представляют собой суммарный препарат кДНК от разных доноров (от двух до пятисот пятидесяти). Набор Human Fetal

МТС™ Panel содержит образцы кДНК органов и тканей плода, взятых со сроков беременности 16-36 недель. Набор Human Tumor МТС™ Panel содержит образцы кДНК полученные из опухолей человека, ксенотрансплантированных бестимусным мышам.

Препараты производства "BioChain" содержат образцы кДНК отдельных первичных опухолей, свободны от примесей геномной ДНК и нормализованы по экспрессии одного гена "домашнего хозяйства" клетки. Всего было использовано 47 образцов кДНК из опухолей двадцати восьми локализаций.

Качество всех препаратов кДНК проверяли методом полимеразной цепной реакции (ПЦР) с использованием праймеров к гену «домашнего хозяйства» GAPDH (прямой: 5'-TGAAGGTCGGAGTCAACGGATTTGGT-3', обратный: 5'-

CATGTGGGCCATGAGGTCCACCAC-3').

Подбор праймеров. Праймеры 7MallF и 7MallR для детекции Hs.633957-специфического транскрипта методом ПЦР подбирали к наиболее протяженной последовательности кластера Hs.633957 на момент начала исследования (идентификационный номер AI346735.1, GenBank) в сотрудничающей лаборатории в Институте биоорганической химии им. Шемякина и Овчинникова РАН. Все остальные праймеры подбирали с помощью программы Primer3Plus (Untergasser et al., 2007). Последовательности праймеров, специфических к локусу Hs.633957, приведены в таблице 1. Последовательности праймеров, использованных для межкластерной ПЦР, приведены в таблице 2.

Таблица 1. Последовательности праймеров, использованных в данной работе для

Название Последовательность 5'- -3'

7MallF GGTCTTTACTCCCATTCAA

7MallR CTCCTGTCATTCACTCCG

ВХ119057F1 CAGGTTCTTCAGCCAGGAAG

BX119057R1 CTCTGCTTCCTCTTCCGTTG

BX119057F2 GTGGCGCCTCAGCCACAATC

BX119057R2 CAGGGAGCTTGTGGTTTCTC

ВХ119057R3 GCCTCAGCCACAATCGTAAT

R7MF GGTCTTTACTCCCATTCAACGGAAGAG

R7MR CCTCCTGTCATTCACTCCGAGACGC

R7MFN CATTCAACGGAAGAGGAAGCAGAGC

R7MRN CATTCACTCCGAGACGCAGCAGC

R7M3 GATGTTCTGCTTGGTTATTTAC

R7M3N GAGCTCCAACATGAATTAAAAGT

R7M5 GACTGGGAGTGAGAAGGAGC

R7M5N GGAGTGAGAAGGAGCGGAG

3gspl CTCGCTAACCACCAAGGCGGTCC

3gsp2 CCAGTCCTCCACGCGTGGA

5gspl GCTGAGAGTGAATTCGGGGTGCAG

5gsp2 IGCTGCTGCGTCTCGGAGTGAATC

Таблица 2. Последовательности праймеров, использованных для межкластерных ПЦР

Название Последовательность 5'- -3' Номер кластера, содержащего последовательное ть

AA232990F1 CGGCATAGGTCACGTAGGTT Hs.634012

AA243851F1 CAGAAGGAGGCGCTATTGTT

A1962473F1 CTGTCCTTCTGTGTGCTGGA Hs.42896

AI962473R1 GATGGCTCCACTGACTCCTC

ELFN1R1 GAGGTGCCTGCACTCTCAG

AI418255F1 GAATGTGGTCCTACGTGCAA Hs.605008

AA077731F1 CCCTCGCACTCACAAATACA Отдельные EST, не входящие в кластеры.

AA077543F1 TTCCCTCACAGAAAGCCACT

AA077783F1 GGTTACAGAGGGGAGGTTCC

AA077941F1 GGGAAAGGCTGTGTGATGAG

AA680192F1 TGAGGGGACTGAGGCTAAGA

CB105081F1 CTTCTCCACCCTCCAGACAG

BY799952R1 CATTGCAGCAGGTTTTCTTG

BY799952F1 AGATGGGCTGAGAGGAAGG

Детекцию Н8.633957-специфических фрагментов в образцах кДНК проводили с помощью ПЦР с праймерами 7MallF и 7MallR.

Межкластерная ПЦР. Под «межкластерной ПЦР» в данной работе мы понимаем амплификацию фрагмента гипотетической РНК, включающей последовательности локуса Hs.633957 и соседних транскрибируемых участков генома. ПЦР-амплификацшо проводили с различными комбинациями праймеров, указанных в табл. 2.

Определение концов транскрипта Hs.633957 производили с использованием подхода RACE (Rapid Amplification of cDNA Ends), позволяющего амплифицировать неизвестные 5'-и З'-концы кДНК, за счёт пришивания к этим концам неспецифических адаптерных последовательностей и использования их в качестве сайта посадки второго праймера при ПЦР. В работе были использованы 2 разных набора производства "Clontech", США: Marathon™ cDNA Amplification Kit и SMART™ RACE cDNA Amplification Kit. Оба набора использовали в сочетании с Advantage 2 PCR Kit ("Clontech", США), согласно рекомендациям производителя.

Продукты RACE разделяли гель-электрофорезом, окрашивали бромидом этидия и визуализировали в УФ свете. При наличии ампликонов их вырезали, встраивали в вектор pGEM-T Easy ("Promega", США), трансформировали полученным вектором бактерий E.coli (штамм DH10BR) методом электропорации и высевали их на селективную агар-содержащую среду LB. Скрининг клонов на наличие плазмиды с искомой вставкой проводили методом

7

ПЦР с использованием стандартных праймеров М13. В качестве матрицы брали живые клетки E.coli из колоний. Часть амплификата использовали для гель-электрофореза, оставшуюся часть переосаждали ацетатом аммония и этиловым спиртом и секвенировали на приборе MegaBACE™ 1000 ("GE Healthcare Life Sciences", США) с использованием оригинальных реагентов и рекомендованных условий.

Выравниваиие нуклеотндных последовательностей и определение ОРС осуществляли в программе BioEdit (Hall, 1999).

Интернет-ресурсы, использованные в работе. В работе использовали ресурсы интернет-сервисов NCBI (http://www.ncbi.nlm.nih.gov/), UCSC Genome Browser (http://genome.ucsc.edu/index.html), Primer3Plus (http://www.bioinformatics.nl/cgi-

bin/primer3plus/primer3plus.cgi), The Vienna RNA Websuite и сервера Mfold института Бёрнета (http://mfold.burnet.edu.au/).

РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ

Общая характеристика локуса lis.633957. По результатам выравнивания последовательностей кластера Hs.633957 с геномом человека локус Hs.633957 расположен на участке р22.3 хромосомы 7. Его общая протяжённость составляет 3 642 п.н., он имеет два экзона, в области второго экзона расположен повтор L2b семейства повторов L2 класса LINE протяжённостью 326 п.н. По данным сервиса RepeatMasker 3.2.7, его последовательность достаточно сильно модифицирована по сравнению с предковым повтором, нуклеотидные различия составляют 33,5%, делеции - 8,3%, инсерции - 9,2%. На самой границе с локусом Hs.633957, у З'конца второго экзона, расположен повтор AluJo класса SINE. Размер повтора 166 п.н., расхождение с предковым повтором 19,3%, делеции 0%, инсерции 0,6%. В интроне содержатся повторы класса SINE, простые повторы и повтор класса ДНК-транспозонов.

Экспрессия локуса Hs.633957 в органах и тканях человека. Экспрессию локуса Hs.633957 в различных органах и тканях человека выявляли методом ПЦР на матрице соответствующих образцов кДНК. Результаты выявления экспрессии локуса в нормальных органах и тканях представлены в таблице 3. Результаты выявления экспрессии локуса в опухолях представлены в таблице 4.

Таблица 3. Результаты выявления Н8.633957-специфической РНК в нормальных органах и тканях взрослого человека и плода ____

Ткань/орган Hs.633957-положительные образцы/ общее количество образцов Количество доноров на образец Ткань/орган Hs.633957- положительные образцы/ общее количество образцов Количество доноров на образец

Мозг 0/2 4 Тощая кишка 0/1 6

Легкое 0/2 2-4 Прямая кишка 0/1 6

Сердце 1/2* 16 Подвздошно-слепая кишка 1/1" 19

Селезенка 0/3 6-11 Подвздошная кишка 1/1" 8

Тимус 0/3 9-18 Яичник 0/2 14

Лейкоциты периферической крови 0/3 550 Простата 0/2 32

Лимфатический узел 0/1 12 Яичко 0/2 45

Миндалевидная железа 0/1 5 Плацента 0/2 10

Костный мозг 0/1 74 Скелетная мышца 0/2 35

Почка 0/2 14 Фетальный мозг 1/1" 10

Печень 3/3* 4 Фетальное сердце 0/1 13

Поджелудочная железа 0/2 20 Фетальная печень 0/2 32

Тонкий кишечник 0/2 32 Фетальная почка 1/1" 17

Ободочная кишка 1/5" 5-19 Фетальиое лёгкое 0/1 38

Слепая кишка 1/1" 29 Фетальные мышцы 0/1 13

Двенадцатиперстная кишка 0/1 30 Фетальная селезенка 0/1 17

Пищевод 0/1 39 Фетальный тимус 0/1 17

Желудок 1/1" 7

Низкий уровень сигнала Уровень сигнала на пределе чувствительности метода

Таблица 4. Результаты выявления Нз.633957-специфической РНК в опухолях различных локализаций__

Локализация опухоли №.633957-положителы1ые образцы / общее количество образцов Локализация опухоли Hs.633957-положительные образцы / общее количество образцов

головной мозг 1/2 мочевой пузырь 2/2

молочная железа 7/8 матка 5/5

легкое 5/6 фаллопиевы трубы 1/2

ободочная кишка 4/4 яичко 3/3

простата 2/2 мочеточник 2/2

яичник 5/6 желчный пузырь 1/1

поджелудочная 0/2 прямая кишка 1/1

железа

пищевод 1/2 кожа 0/1

желудок 3/3 мышцы 1/1

тонкий кишечник 2/2 надпочечник 0/1

печень 0/2 лимфомы 7/8

почка 1/2 щитовидная железа 0/1

околоушная железа 1/1 тимус 0/1

селезёнка 1/1 шейка матки 6/6

бронх 1/1 краниоспинальный стык 1/1

Как видно из таблицы 3, в нормальных органах и тканях человека локус Hs.633957 либо экспреесируется на низком уровне, либо не экспрессируется вообще. С уверенностью можно говорить только о его экспрессии в печени, сердце и желудке, хотя и для этих органов уровень амплификации специфического фрагмента был низкий. Поскольку в работе были использованы пулированные образцы кДНК, полученные от разных доноров, то искомая РНК может быть выявлена даже при её наличии только в одном образце из пула. Низкий уровень сигнала при амплификации специфического фрагмента может быть обусловлен наличием искомой РНК только в небольшой части пулированных образцов, низким уровнем экспрессии локуса в органе или ткани, или экспрессией в небольшой доле клеток изучаемого органа или ткани. Исходя из имеющихся данных мы пока не можем различить указанные варианты.

В отличие от нормальных органов и тканей мРНК Hs.633957 была выявлена практически во всех рассмотренных опухолях (Таблица 4), при этом уровень сигнала амплификации искомого фрагмента был значительно выше, чем в нормальных тканях. Полученные данные свидетельствуют об активации экспрессии локуса Hs.633957 в опухолевых клетках. Учитывая, что в лейкоцитах периферической крови здоровых людей экспрессия локуса выявлена не была, мРНК Hs.633957 потенциально может быть использована как маркёр циркулирующих в крови раковых клеток.

Определение первичной структуры транскриптов. Первичную структуру РНК локуса Hs.633957 определяли методом RACE с использованием коммерческих наборов Marathon™ cDNA Amplification Kit и SMART™ RACE cDNA Amplification Kit ("Clontech", США). Дополнительно использовали межкластерную ПЦР. По совокупности полученных в нашей работе экспериментальных данных и данных базы UniGene составили схему, отражающую возможные формы транскриптов локуса Hs.633957 (рис.1).

Рисунок 1. Схема вариантов транскрипции и процессирования РНК локуса Hs.633957. Возможные сайты инициации транскрипции обозначены стрелочками, сайты полиаденилирования подписаны «АААААА», альтернативные З'-сплайс-акцепторные сайты обозначены CAI, СА2 и САЗ. Масштаб не соблюдён.

Определение основной сплайсинговой формы РНК. Для определения основной сплайсинговой формы РНК Hs.633957 примерили ПЦР с праймеры к концам транскрипта. В результате на электрофореграмме для большинства образцов наблюдали две полосы размером около 600 и 700 п.н. (рис.2). Данные полосы соответствуют РНК-продуктам локуса Hs.633957 со сплайсингом по СА2 (700 п.н.) и САЗ (600 п.н.). Интенсивность полосы 600 п.н. всегда была значительно выше, на основании чего можно сделать вывод, что основной сплайсинговой формой РНК Hs.633957 является форма со сплайсингом по САЗ. При анализе экспрессии локуса в органах и тканях человека были использованы праймеры, фланкирующие область второго интрона. В результате этого мы могли дискриминировать сплайсинговые формы РНК с вырезанием и сохранением второго интрона. Ни в одном случае мы не наблюдали РНК-продуктов с вырезанным вторым интроном. Таким образом, среди РНК-продуктов локуса Hs.633957 преобладают ВХ119057-подобные сплайсинговые формы, характеризующиеся сплайсингом по третьему 3'-акцепторному сайту второго экзона и с сохранением второго интрона.

Анализ открытых рамок считывания. Получив представление о структуре РНК Hs.633957 мы провели поиск открытых рамок считывания (ОРС) в её последовательности с использованием программы BioEdit. Мы искали ОРС начинающиеся с кодона метионина ATG, заканчивающиеся стоп-кодонами TGA, ТАА и TAG, и кодирующие белки размером более 50 а.к.

Было выявлено 2 ОРС, удовлетворяющих заявленным критериям. ОРС-1 кодирует потенциальный белок размером 62 а.к. с последовательностью MGLRSFSLPVLWCMPPSWLKNLHQPPLRLGSSLLSFTPRRSSVAPRALPALHPEFTLSPHLV *. ОРС-2 кодирует потенциальный белок размером 53 а.к. с последовательностью MLELLLPLQEQELCVLVTAVASQGRRGAQQPGLDRLGPRCARAGMRLLCFLFR*.

Сравнение аминокислотных последовательностей ОРС-1 и ОРС-2 с известными белками проводили с использованием алгоритма blastp, реализованного на сайте Национального

сервера биотехнологической информации (N0131, http://www.ncbi.nlm.nih.gov/). Гомологичных белковых последовательностей обнаружено не было ни у человека, ни у других организмов.

Рисунок 2. Электрофореграмма продуктов амплификации кДНК локуса Hs.633957, полученных методом ПЦР с использованием праймеров к концам транскринта. Реакцию ПЦР проводили па матрице кДНК из опухолей следующих локализаций: 01 -мозг, 02 - лёгкое, 07 - желчный пузырь, 09 - желудок, 10 - тонкий кишечник, 11 -толстый кишечник, 12 - прямая кишка, 16 - матка, 17 - уретра, 24 - гланды, 26 -околоушная железа, 29 - селезёнка, 30, 31 - лимфомы. Образец контрольной ПЦР без матрицы на рисунке не представлен.

Анализ вторичной структуры РНК. Вторичную структуру РНК Hs.633957 предсказывали используя интернет-ресурсы The Vienna RNA Websuite (Gruber, et al., 2008) и Mfold (Zuker, 2003). Оба алгоритма предсказали сходные вторичные структуры, которые содержат шпильку, напоминающую предшественника миРНК (пре-миРНК) (рис.3). Шпилька состоит из 75 нуклеотидов, в том числе, 26 пар комплементарных нуклеотидов, имеет концевую петлю из 8 нуклеотидов, участок миРНК, содержащий 21 пару нуклеотидов, базальную петлю (5 выпетливающихся нуклеотидных оснований) и базальный столбик, содержащий 7 п.н.

Если предположить, что разрезание первичной РНК ферментом Drosha, а затем пре-миРНК ферментом Dicer происходит по обозначенным на рисунке позициям, что не

противоречит имеющимся литературным данным о действии этих ферментов, то последовательность направляющей нити зрелой миРНК 5'-

UCCUGGUCACUGCUGUGGCAUC-3', а побочной - 5'-UGCCCAGCAGCCAGGACU-3'.

Базальная петля Побочная нить

/ / Dlcer p-s

Droshd. i щъ ч

VJ^sL-T-^h !

460 / \ u 1

I \ Концевая петля

Базальный столбик «Зерно» Направляющая нить

Рисунок 3. Строение предсказанной пре-миРНК, закодированной в РНК ВХ119057. На рисунке обозначены основные элементы пре-миРНК и предполагаемые сайты разрезания белками Drosha и Dicer.

Поиск потенциальных мишеней предсказанной миРНК проводили сравнивая последовательности направляющей и побочной нитей пре-миРНК, заключённые между концевой базальной петлями, с известными мРНК. Для этого использовали алгоритм blastn, реализованный на сайте NCBI. Участки, комплементарные направляющей нити, были обнаружены в мРНК генов DPYS (22 нуклеотида со 2 по 23, 1 неспаренный), SNX20 (17 нт), CBLC (16 нт). Участок, комплементарный побочной нити, был обнаружен в мРНК гена PPAPDC (17 нт)

Наиболее вероятной мишенью обнаруженной миРНК мы считаем мРНК гена дигидропиримидиназы (DPYS), поскольку наблюдается практически полная комплементарность 22 нуклеотидов целевой нити миРНК и участка мРНК DPYS на границе с З'-нетранслируемой областью. Первое нуклеотидное основание мишени - аденин, что характерно для миРНК (Lewis, et al., 2005). Более того, девятый нуклеотид миРНК не имеет комплементарной пары в мишени, а нам известно, что наличие неспаренных оснований в положениях 9-11 необходимо для выполнения миРНК функции подавления трансляции белка (Selbach, et al., 2008). Таким образом, предсказывается идеальное взаимодействие миРНК и мишени в мРНК DPYS, что подтверждает предположение, что локус Hs.633957 - это не что иное, как ген миРНК.

Изучение регуляторных участков локуса. Промоторную область локуса Hs.633957 выявляли анализируя данные интернет-ресурса UCSC Genome Browser по модификациям гистонов в различных клетках. Мы обнаружили, что в клетках эндотелия пупочной вены HUVEC первый экзон локуса ассоциирован с модификациями гистонов H3K4mel, H3K4me2, НЗК4шеЗ и НЗК27ас, которые характерны для открытого хроматина и промоторных областей генов. В линии клеток хронической лейкемии К-562 первый экзон локуса попадает в область, где гистон НЗ моно-, ди- и три-метилирован по лизину 4, ацетилирован по лизину 9 и 27, а хроматин ассоциирован с РоШ. Хроматин всего локуса подвержен монометилированию по лизину 9 гистона НЗ, монометилированию лизина 20 гистона Н4 и триметилированию лизина 27 гистона НЗ (рис.4).

13

щ дат*?! i - 7-м,1 54™ , t

!i7«j2«S8 liWlMl I ITS

It747$80

C^GOS 4 Ho^ if .iaf -O'.t K^'J^i imntum i-i-l

prosii

S'tCO':?? msii^am Chir-

¿нет* н i jitro.'.^ f c^is,

ШЖЯС ■ ^ - ' v.- ' : fy ' Pffaks '

tac-05>e Hi«!W " ':" t ^ Cftlf t Г' ■■ : ИЗ* V- ' - • - - V

Положение окна Координаты,хром. 7 Hs6i3957mod 1 2

3

4

5

6

7

8

9

10 11

Рисунок 4. Распределение участков модификаций гистонов в районе локуса Hs.633957 в клетках линии К-562. 1 - связь хроматина с фактором CTCF; 2 - монометилирование НЗ по лизину 4 (H3K4mel); 3 - диметилирование НЗ по лизину 4 (НЗК4ше2); 4 -триметилирование НЗ по лизину 4 (НЗК4шеЗ); 5 - ацетилирование НЗ по лизину 9 (НЗК9ас); 6 - монометилирование НЗ по лизину 9 (НЗК9ше1); 7 — ацетилирование НЗ по лизину 27 (НЗК27ас); 8 - триметилирование гистона НЗ по лизину 27 (НЗК27шеЗ); 9 -триметилированис 113 по лизину 36 (НЗКЗбшеЗ); 10 - мономстилированис Н4 по лизину 20 (Н4К20ше1); 11 - Связь хроматина с РоШ. Схема составлена с помощью веб-утилиты http://genome.ucsc.edu.

Триметилирование лизина 27 гистона НЗ преимущественно ассоциировано с закрытым хроматином, остальные модификации - с открытым активным хроматином и промоторными областями генов. Двойственное состояние хроматина, для которого характерны как активирующие, так и подавляющие транскрипционную активность генов модификации гистонов, называется бивалентным. Оно характерно для генов развития в эмбриональных стволовых клетках и генов быстрого ответа. Считается, что такое состояние позволяет клетке быстро активировать или инактивировать ген при соответствующих условиях. Для бивалентного хроматина также характерна связь с РНК-полимеразой II, находящейся в состоянии ареста на промоторе гена.

Полученные данные свидетельствуют о наличии промотора в области первого экзона локуса, поэтому на участке 7 хромосомы от -1000 до +500 п.н. от точки старта транскрипции (ТСТ) локуса Hs.633957 мы провели поиск наиболее распространённых мотивов коровых эукариотических промоторов: консенсусных последовательностей ТАТА-бокса (ТАТААА), ССААТ-бокса (ССААТ) и GC-бокса (GGGCG). Значимость обнаруженных мотивов оценивали по позиционной матрице весов (position-specific weight matrices) Ф. Бучера (Р. Bucher) (Bucher, 1990). Мы обнаружили один мотив ССААТ и несколько GC-боксов, но только один GC-бокс, расположенный на участке от -10 до -6 от ТСТ удовлетворял критериям отбора. На основании полученных данных можно заключить, что локус Hs.633957 имеет собственный GC-бокс-зависимый промотор.

Для выявления дополнительных регуляторных элементов локуса Hs.633957 мы анализировали данные интернет-ресурса UCSC Genome Browser по ассоциации хроматина

различных клеток с транскрипционными факторами. Мы обнаружили, что в некоторых линиях клеток, в частности, в летках К-562 (рис.5), с участком первого экзона ассоциирован сложный комплекс белков, включающий транскрипционные активаторы с-Мус, МАХ, E2F4 и GATA-2, ДНК-зависимую РНК-полимеразу Pol II, транскрипционные репрессоры E2F6, SETDB1 и ZNF263, а также фактор YY1, способный как активировать, так и подавлять транскрипцию, в зависимости от белкового окружения.

Положение окна

mistsn И'" - J, ?■»«, 1 U?? ¡-»¿' »)

1:7'M I Г/Ч'-irtö" j: ! 17+-!вт \ [ f; Координаты, яром 1

frm> ei&t o.o

-------- Hs633957mod

EMCiKJE ".it Г >OHi FäiitQP fc l'rfi'.ri; i t'^i pf.j Ct.lt' - * ГО'! li< Ss-itnP-'OHV 'S '

£*даэе it' Ё:, Cntp-ma ■с ЙЖ ösäii>

A

СЖОШ. ТГВЭ . Y»>»,'UCS/H«rv«r a s

ЕЖЖ€ im, VI I» /ЦСО «игжасы^

енсжс TFÖS, УЙ 'fr/UCP/HW - о Colf-pg^ lf'0 sn )

в«« tm, "*** «wh

«СйИ У* ItAXßAUtvtra CfttF-мга P»««» <Wi in ИМЯМ» c*tBÖ

ЕНОТЖ TT8S, У» !• <u«»>ur < СГ>!»-»»ч| <•«**» <*2Wi№3 in ШЮ» <Mi1s> ¥

sfsS

Б

в

Г

Д

Е Ж 3 И

Рисунок 5. Распределение участков связывания хроматина с транскрипционными факторами в районе локуса Hs.633957 в линии клеток К-562. Связывание с: А - с-Мус, Б - E2F4, В - E2F6, Г - GATA-2, Д - Мах, Е - Ро12, Ж - SETDB1, 3 - YY1, И - ZNF263. Схема составлена с использованием интернет-ресурса http://genome.ucsc.edu

В клетках HeLa-S3 и HUVEC также наблюдали связь хроматина в районе первого экзона локуса Hs.633957 с различными транскрипционными факторами. Состав этих факторов варьировал, но во всех случаях неизменной оставалась ассоциация с с-Мус и Мах. Мы провели поиск известных мотивов, с которыми связываются с-Мус и Max (Blackwell et al., 1993), в районе от -1000 до +500 п.н. от ТСТ и обнаружили, что в начале интрона на участке размером около 110 п.н., расположенном через 90 п.н. после конца первого экзона (около 180 п.н. после ТСТ) сосредоточено сразу 7 сайтов связывания с-Мус и Мах. На эту же область приходится наибольшая плотность сигнала связывания с-Мус и Мах по результатам иммунопреципитации хроматина с последующим секвенированием, собранным на интернет-сайте UCSC Genome Browser, что свидетельствует об активности данной области в клетках. Полученные данные убедительно свидетельствуют о наличии с-Мус-Мах-зависимого проксимального промоторного элемента на этом участке.

Филогенетический анализ локуса Hs.633957. Чтобы получить общее представление о консервативности локуса мы составили карту расположения его консервативных участков используя алгоритм PhastCons (Siepel, et al., 2005), реализованный в веб-утилите Human Genome Browser (Рис.6). Оказалось, что наиболее консервативной частью локуса является участок первого экзона, сохраняющийся практически у всех позвоночных. Второй экзон, напротив, не имеет консервативных участков.

масштаб Хромосома 7 Hs.6339S7mod

mitiz *ti$ra*»ftt t COr>i«rv*r fW <*4

fV >t»ftt* C«vwv»t !W> »v

JLaJs

Консервативность среди приматов

^ тле

Консервативность среди млекопитающих

К

л

Консервативность среди позвоночных

Рисунок 6. Карта расположения консервативных участков локуса Hs.633957. Пики отражают вероятность негативной селекции по каждому положению в интервале от О до 1. На схеме затенён участок 1 экзона.

Более детальный сравнительный анализ геномов сорока четырёх видов позвоночных показал, что обнаруженный нами элемент корового промотора GC-бокс впервые появляется в ряду приматов у мартышки. У прочих позвоночных он отсутствует. с-Мус-зависимый промоторный элемент, содержащий у человека 7 сайтов связывания Мус и Мах, также впервые появился у приматов, причём мы обнаружили, что в ряду приматов количество этих сайтов растёт. У тупайи такой сайт только один, у мышиного лемура - 3, у мартышки - 4, у макака - 6, у орангутана - 7, гориллы - 6, шимпанзе - 7. Полученные данные свидетельствуют о формировании у приматов нового Мус-Мах-зависимого проксимального промотора.

Последовательность, ортологичная повтору L2b, расположенному в области второго экзона локуса и содержащему обнаруженную нами шпильку пре-миРНК, обнаруживается в геномах млекопитающих начиная с тупайи — млекопитающего, долгое время относившегося к приматам, а сейчас входящего в отряд тупайеобразных. При этом, участок, ортологичный пре-миРНК Hs.633957, у тупайи сильно отличается от человеческого. При моделировании вторичной структуры ортологичного участка гипотетической РНК тупайи не образуется характерной шпильки пре-миРНК. Только начиная с мартышки в ряду приматов, последовательности, ортологичные пре-миРНК Hs.633957, приобретают способность формировать характерную вторичную структуру. В то же время, у некоторых обезьян (макак, горилла) ортологи пре-миРНК утратили способность формировать данную структуру из-за наличия замен и делеций. Интересно отметить, что сайт-мишень миРНК Hs.633957 в гене DPYS в ряду приматов впервые наблюдается у мартышки, как и сама миРНК.

Полученные данные свидетельствуют о том, что локус Hs.633957 приобрёл возможность формирования миРНК у предков подотряда Haplorrhini в результате приобретения характерной шпилечной структуры и участка комплемснтарности с мРНК гена-мишени. В дальнейшем локус продолжал эволюционировать. У общего предка человека и шимпанзе пре-миРНК Hs.633957 приобрела свой современный вид, характерный для человека.

1. Транскрибируемый локус Не.633957 является геном, кодирующим миРНК и характеризующимся повышенной экспрессией в опухолях.

2. Ген Нз. 633957 имеет четыре точки старта транскрипции, а его РНК-продукт - четыре варианта сплайсинга и две возможных точки полиаденилирования.

ВЫВОДЫ

3. Доминирующим РНК-продуктом данного гена является ВХ119057-подобная форма РНК со сплайсингом по третьему З'-сплайс-акцепторному сайту первого интрона, с сохранением второго интрона и дисталыюй точкой полиаденилирования.

4. Экспрессия гена Hs.633957 регулируется GC-бокс-содержащим коровым промотором и проксимальным с-Мус-зависимым промоторным элементом.

5. Ген Hs. 633957 впервые появился до расхождения приматов и тупайеобразных, а его регуляторные и функциональные элементы сформировались у общего предка человека и мартышки, т.е. до расхождения обезьян Старого и Нового света.

СПИСОК РАБОТ, ОПУБЛИКОВАННЫХ ПО ТЕМЕ ДИССЕРТАЦИИ

Статьи:

1. Krukovskaja L.L, Baranova A, Tyezelova Т, Polev D., Kozlov A.P. Experimental study of human expressed sequences newly identified in silico as tumor specific // Tumour Biol. 2005. V. 26. p. 17-24.

2. Полев Д.Е., Носова Ю.К, Круковская Л.Л, Баранова A.B., Козлов А.П. Экспрессия транскриптов, соответствующих кластеру Hs.633957, в тканях и опухолях человека // Молекулярная биология. 2009. Т. 43. С. 97-102.

Тезисы докладов на конференциях:

1. Andrei P. Kozlov, J. Nosova, L. Krukovskaja, D. Polev, V. Kobzeva, D. Golovina, G. Volgareva Expression of novel tumor-specific DNA sequences in epithelial tumors // Proceedings of the Frontiers in Cancer Prevention Research Conference. Baltimore, MD, USA: AACR, 2005. p. 132, abstract №C3.

2. Круковская Л.Л, Носова Ю.К., Полев Д.Е., Баранова A.B., Галачьянц Ю.П., Самусик H.A., Козлов А.П. Изучение экспрессии девяти ассоциированных с опухолями пуклеотидных последовательностей в нормальных и опухолевых тканях человека // Русский журнал "СПИД, рак и общественное здоровье". Тезисы 16-ой Международной конференции "СПИД, рак и общественное здоровье". Санкт-Петербург: Биомедицинский центр, 2007. С. 85.

3. Круковская Л.Л, Носова Ю.К, Полев Д.Е., Баранова A.B., Галачьянц Ю.П, Самусик H.A., Козлов А.П.. Изучение экспрессии девяти опухолеассоциированных нуклеотидных последовательности в нормальных и опухолевых тканях человека И Русский журнал "СПИД, рак и общественное здоровье". Тезисы 17-ой Международной конференции «СПИД, рак и общественное здоровье». Санкт-Петербург: Биомедицинский центр, 2008. С. 21.

4. Круковская Л.Л, Носова Ю.К, Полев Д.Е., Козлов А.П. Экспериментальное подтверждение опухолеспецифической экспрессии четырёх нуклеотидных последовательностей, выявленных in silico // Вопросы онкологии. Тезисы 4й Российской конференции по фундаментальной онкологии "Петровские чтения". Санкт-Петербург: ФГУ НИИ онкологии им. Петрова H.H. Росмедтехнологий, 2008. С. 14.

5. Круковская Л.Л, Носова Ю.К, Полев Д.Е., Козлов А.П. Экспрессия шести опухолеспецифических нуклеотидных последовательностей в образцах опухолей человека // Вопросы онкологии. Тезисы 3-ей Российской конференции по фундаментальной онкологии "Петровские чтения". Санкт-Петербург: ФГУ НИИ онкологии им. Н.Н.Петрова, 2007. С. 16.

6. Носова Ю.К., Кобзева В.К., Полев Д.Е., Круковская Л.Л., Павлова Л.С., Козлов А.П. Анализ экспрессии нуклеотидных последовательностей кластеров Нб.67624, Ш. 133294, Не. 133107, Из.426704, №.202247, Ш. 104073 в опухолях шейки матки // Русский журнал "СПИД, рак и общественное здоровье". Материалы 14-ой Международной конференции "СПИД, рак и общественное здоровье". Санкт-Петербург: Биомедицинский центр, 2005. С. 27.

7. Полев Д., Козлов А. 115.633957: транскрипционный шум или функциональная РНК? // Вопросы онкологии. Тезисы 6-й Российской конференции по фундаментальной онкологии "Петровские чтения". Санкт-Петербург: ФГУ НИИ онкологии им. Петрова Н.Н., 2010. С. 38.

8. Полев Д., Круковская Л., Козлов А. Вероятная функция эволюционно нового гена с опухолеспецифической экспрессией // Русский журнал "СПИД, рак и общественное здоровье". Тезисы 19й международной конференции "СПИД, рак и общественное здоровье". Санкт-Петербург: Биомедицинский центр, 2010. С. 35.

9. Полев Д.Е., Круковская Л.Л., Носова Ю.К., Козлов А.П. Определение границ транскрипта кластера №.633957 // Русский журнал "СПИД, рак и общественное здоровье". Тезисы 18-ой Международной конференции "СПИД, рак и общественное здоровье". Санкт-Петербург, 2009. С. 37.

10. Полев Д.Е., Носова Ю.К., Машарский А.Э., Круковская Л.Л., Козлов А.П. Определение полноразмерных нуклеотидных последовательностей опухолеспецифических транскриптов из кластера Нб. 104073 // Русский журнал "СПИД, рак и общественное здоровье". Тезисы 16-ой Международной конференции "СПИД, рак и общественное здоровье". Санкт-Петербург: Биомедицинский центр, 2007. С. 94.

Подписано в печать 20.09.2010. Формат 60x90/16 Бумага офсетная. Печать офсетная. Усл. печ. л. 1,25 Тираж 100 экз. Заказ 397

Отпечатано в типографии ООО «Адмирал»

199048, Санкт-Петербург, В. О., 6-я линия, д. 59 корп. 1, оф. 40Н

Содержание диссертации, кандидата биологических наук, Полев, Дмитрий Евгеньевич

Список сокращений и обозначений.

Введение.

Глава 1. ОБЗОР ЛИТЕРАТУРЫ.

1.1 Геном человека.

1.2 Регуляция транскрипции генов.

1.2.1 Регуляторные элементы генов.

1.2.2 Регуляция транскрипции генов за счёт метилирования ДНК.

1.2.3 Регуляция транскрипции генов за счёт модификаций хроматина.

1.2.4 Роль клеточного протоонкогена с-Мус в регуляции транскрипции генов.

1.3 Некодирующие РНК.

1.3.1 История обнаружения миРНК.

1.3.2 Функции миРНК.

1.3.3 Основные признаки миРНК.

1.4 РНК-маркёры опухолей.

Глава 2. МАТЕРИАЛ И МЕТОДЫ.

Глава 3. РЕЗУЛЬТАТЫ.

3.1 Результаты анализа структуры кластера Нэ.633957 базы данных ипЮепе

3.2 Результаты экспериментальной проверка экспрессии локуса Ш.633957 в нормальных и опухолевых тканях.

3.3 Определение первичной структуры транскриптов локуса №.633957.

3.4 Определение основной сплайсинговой формы РНК.

3.5 Анализ открытых рамок считывания.

3.6 Анализ вторичной структуры РНК.

3.7 Поиск потенциальных мишеней предсказанной миРНК.

3.8 Изучение регуляторных участков локуса.

3.9 Модификации хроматина в районе локуса Hs.633957.

ЗЛО Связь хроматина в районе первого экзона локуса Hs.633957 с транскрипционными факторами.

3.11 Идентификация сайтов связывания транскрипционного фактора с-Мус

3.12 Филогенетический анализ локуса Hs.

3.13 Поиск гомологичных транскриптов.

3.14 Происхождение повторов L2 и AluJo в локусе Hs.633957.

3.15 Происхождение шпильки пре-миРНК Hs.

Глава 4. ОБСУЖДЕНИЕ.

4.1 Локус Hs.633957 транскрибируется с образованием различных форм транскрипта, но имеет одну доминирующую форму.

4.2 В локусе Hs.633957 закодирована миРНК, потенциально способная регулировать экспрессию гена DPYS.

4.3 Экспрессия локуса Hs.633957 обусловлена Мус-зависимым промотором, специфическим для приматов.

4.4 Структурная и регуляторные области гена миРНК Hs.633957 произошли de novo у приматов.

4.5 Последовательность Hs.633957 как онкомаркер.

Введение Диссертация по биологии, на тему "Молекулярно-генетическая характеристика последовательности HS.633957 человека"

В' 2001 году двумя независимыми группами исследователей были опубликованы черновые данные по секвенированию генома человека (Lander et al., 2001; Venter et al., 2001); в 2003 году завершился проект по расшифровке генома человека The Human Genome> Project. На сегодняшний день полностью отсеквенировано уже несколько индивидуальных человеческих геномов (Levy et al., 2007; Wheeler et al., 2008; Bentley et al, 2008; Wang et al., 2008; Ley et al., 2008; Ahn et al., 2009; Kim et al., 2009; McKernan et al., 2009; Drmanac, et al., 2010). Согласно данным по секвенированию размер гаплоидного генома человека составляет около 3*109 п.н., из которых только 5% относится к белок-кодирующим областям (Lander et al., 2001), тогда как транскрибируется 74-93% всего генома человека (Birney et al., 2007). Очевидно, что^ основная часть транскриптов не кодирует белки. Возможно, они имеют некие регуляторные функции, но какие именно, в большинстве случаев мы не знаем, поэтому аннотация транскрибируемых участков генома человека остаётся актуальной задачей.

Одним из неаннотированных транскрибируемых участков генома человека является локус Hs.633957, ставший объектом данного исследования. Предпосылкой его изучения явились теоретические работы А.П. Козлова, в которых он развивает гипотезу об эволюционной роли опухолей в возникновении новых клеточных типов, получившей недавно название «эволюция путём дифференцировки опухолевых клеток» (Kozlov, 1979, 1996, 2010; Kozlov et al., 1992; Козлов, 1976, 1983, 1987, 2008). Согласно этой гипотезе, неоплазмы предоставляют пространство и ресурсы для экспрессии и апробации новых генов, которые не могут проявится в нормальных тканях в силу отлаженной там регуляции экспрессии. Одним из основных следствий данной гипотезы является предсказание активации экспрессии множества молчащих участков генома в опухолях. Данное следствие в дальнейшем получило подтверждение.

В 2001 г. была опубликована статья с описанием нового подхода к поиску нуклеотидных последовательностей с онкоспецифическим характером экспрессии посредством анализа общедоступных баз данных клонотек кДНК (Baranova et al., 2001). Новизна подхода заключалась в том, что, вместо попарного сравнения опухоль-норма для каждой ткани, сравнивали все клонотеки кДНК, полученные из всех типов опухолей, со всеми клонотеками кДНК из всех возможных нормальных тканей. Всего для сравнения было использовано порядка 2 млн. последовательностей из 4 ООО клонотек кДНК. В результате был выявлен целый ряд последовательностей с опухолеспецифической экспрессией, которые потенциально могут быть онкомаркерами широкого профиля. Часть полученных результатов была подтверждена экспериментально методом ПЦР на панелях кДНК из различных нормальных и опухолевых тканей (Krukovskaja et al., 2005; Palena et al., 2007; Круковская и др., 2008).

Среди последовательностей с выраженной опухолевой экспрессией был локус, соответствующий кластеру Hs.l04073 по классификации базы данных UniGene. Данный кластер содержал 6 EST (от англ. Expressed Sequence Tag -ярлык экспрессирующейся последовательности), полученных из опухолевых клеток. Он был описан в базе как «транскрибируемый локус», поскольку входящие в него последовательности не кодируют белки, а их роль в организме не описана. Впоследствии, в ходе реструктуризации базы данных, кластер был расформирован, а основная часть составляющих его EST была перенесена в кластер Ils.633957. Далее под локусом Hs.633957 мы будем понимать участок 7 хромосомы человека, с которым выравниваются нуклеотидные последовательности EST, входящие в кластер Hs.633957 базы данных UniGene. Основной, представительной, последовательностью кластера мы считаем EST

ВХ119057, имеющую идентификационные номера ВХ119057.1 и 01:27841546 в базе данных вепВапк (http://www.ncbi.nlm.nih.gov/sites/entrez?db=nucleotide). Под транскриптом (РНК) №.633957 мы будем понимать РНК-продукт локуса №.633957.

Характер экспрессии локуса Не.633957 вызывает к нему практический и теоретический интерес. Перед нами встали следующие вопросы: действительно ли локус экспрессируется только в опухолях и может быть использован как онкомаркер, за счёт чего это происходит, какова структура транскриптов локуса, кодирует ли он белок и может ли он иметь какую-то функцию в организме?

Целью данной работы является молекулярно-генстическая характеристика локуса человека, соответствующего кластеру №.633957 базы данных ишОепе.

В соответствии с целью были поставлены следующие задачи:

1. Определить полную нуклеотидную последовательность РНК-продукта локуса №.633957

2. Выявить возможные альтернативные РНК-продукты данного локуса

3. Описать регуляторную область локуса №.633957

4. Определить, в каких органах и тканях экспрессируется локус №.633957

5. Провести филогенетический анализ последовательности локуса №.633957

6. Определить функцию локуса 118.633957

Заключение Диссертация по теме "Генетика", Полев, Дмитрий Евгеньевич

Выводы

1. Транскрибируемый локус №.633957 является геном, кодирующим миРНК и характеризующимся повышенной экспрессией в опухолях.

2. Ген Ш. 633957 имеет четыре точки старта транскрипции, а его РНК-продукт — четыре варианта сплайсинга и две возможных точки полиаденилирования.

3. Доминирующим РНК-продуктом данного гена является ВХ119057-подобная форма РНК со сплайсингом по третьему З'-сплайс-акцепторному сайту первого интрона. с сохранением второго интрона и дистальной точкой полиаденилирования.

4. Экспрессия гена Нб.633957 регулируется ОС-бокс-содержащим коровым промотором и проксимальным с-Мус-зависимым промоторным элементом.

5. Ген Ня. 633957 впервые появился до расхождения приматов и тупайеобразных, а его регуляторные и функциональные элементы сформировались у общего предка человека и мартышки, т.е. до расхождения обезьян Старого и Нового света.

Благодарности

В заключение я выражаю благодарность своему научному руководителю А.П.Козлову за предоставленную возможность выполнить данную работу, за оказанное содействие и руководство. Я благодарю Круковскую Л.Л. и Носову Ю.К. за содействие и поддержку при выполнении работы, Машарского А.Э. за помощь в секвенировании, Мурашёва Б.В. за ценные советы, а также весь коллектив «Биомедицинского центра» за создание дружеской атмосферы в лаборатории. Отдельно выражаю признательность доктору Чуди (С. Tchudi) из Йельского университета за предоставленную возможность выполнить часть работы в его лаборатории. Часть работы была выполнена при финансовой поддержке гранта Международного центра Фогарти (Fogarty International Center) (грант №D43TW1028).

Заключение

В данной работе мы изучали локуе №.633957, который привлёк наше внимание, поскольку по данным, полученным т яШсо, транскрибируется опухолеспецифически. В ходе экспериментальных исследований мы показали, что в норме РНК-продукт локуса можно детектировать методом ОТ-ПЦР только в небольшом количестве органов взрослого человека (печень, сердце и некоторые отделы желудочно-кишечного тракта), при этом уровень экспрессии локуса в этих органах на пределе чувствительности метода. В то же время, мы обнаружили, что локус №.633957 транскрибируется в большинстве доступных для исследования опухолевых тканей человека, а уровень его экспрессии в опухолях значительно превышает уровень экспрессии в норме.

Результаты анализа регуляторных последовательностей локуса №.633957 свидетельствуют о том, что его экспрессия определяется, в первую очередь, коровым промотором, содержащим ОС-бокс, и Мус-зависимым проксимальным промотором. Наличие Мус-зависимого проксимального промотора может являться причиной повышенной экспрессии локуса в опухолях.

Мы выяснили, что существет несколько альтернативных форм РНК-продукта локуса Не.633957, но одна из них всегда преобладает над остальными. На основании результатов структурного анализа транскрипта №.633957 мы предположили, что в нормальных тканях человека РНК №.633957 имеет регуляторную функцию, а именно - она является предшественницей миРНК, регулирующей трансляцию мРНК гена ОРУ8.

Возможность формирования вторичной структуры РНК, необходимой для образования предсказанной миРНК, возникла в ходе эволюции у общего предка обезьян Старого и Нового света, причём вместе с коровым и проксимальным промотором, и, возможно, сигналом терминации транскрипции. Одновременно у предков обезьян возник сайт-мишень в гене ОРУБ.

Таким образом, описанный нами локус представляет собой не что иное, как эволюционно новый регуляторный ген приматов, кодирующий миРНК.

Библиография Диссертация по биологии, кандидата биологических наук, Полев, Дмитрий Евгеньевич, Санкт-Петербург

1. Заридзе Д. Канцерогенез. Москва: Научный Мир, 2000. 420 с.

2. Киселева Н., Киселёв Ф. Деметилирование ДНК и канцерогенез. // Биохимия. 2005. Т. 70, № 7. С. 900-911.

3. Козлов А. Генная конкуренция и возможная эволюционная роль опухолей и клеточных онкогенов // Теоретические и математические аспекты морфогенеза. Москва: Наука, 1987.

4. Козлов А. Опухоли и эволюция // Вопросы онкологии. 2008. Т. 54, № 6. С. 695-705.

5. Козлов А. Принципы многоуровневого развития организмов // Проблемы анализа биологических систем. Москва: МГУ, 1983.

6. Козлов А. Регуляторные механизмы как выражение и результат эволюции конкурентных отношений между генами // Солёностные адаптации водных организмов. Ленинград: АН СССР, 1976. С. 237-248.

7. Круковская JL и др. Изучение экспрессии транскрипционного фактора Brachyury(T) в нормальных и опухолевых тканях человека // Вопросы онкологии. 2008. Т. 54, № 6. С. 739-743.

8. Полев Д. и др. Экспрессия транскриптов, соответствующих кластеру

9. Hs.633957, в тканях и опухолях человека // Молекулярная биология. 2009. Т. 43,i1. С. 97-102.

10. Самусик Н., Галачьянц Ю., Козлов А. Анализ эволюционной новизны последовательностей, экспрессирующихся в опухолях // Экологическая генетика. 2009. Т. 2, № 7. С. 26-37.

11. Ahn S. et al. The first Korean genome sequence and analysis: full genome sequencing for a socio-ethnic group // Genome Res. 2009. V. 19, № 9. P. 1622-1629.

12. Ai W., Liu Y., Wang T.C. Yin yang 1 (YY1) represses histidine decarboxylase gene expression with SREBP-la in part through an upstream Spl site // Am. J. Physiol. Gastrointest. Liver Physiol. 2006. V. 290, № 6. P. G1096-1104.

13. Altschul S.F. et al. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs // Nucleic Acids Res. 1997. V. 25, № 17. P. 33893402.

14. Altschul S.F. et al. Protein database searches using compositionally adjusted substitution matrices // FEBS J. 2005. V. 272, № 20. P. 5101-5109.

15. Ambros V. et al. A uniform system for microRNA annotation // RNA. 2003. V. 9, № 3. P. 277-279.

16. Ameres S.L. et al. Target RNA-directed trimming and tailing of small silencing RNAs // Science. 2010. V. 328, № 5985. P. 1534-1539.

17. Baek D. et al. The impact of microRNAs on protein output // Nature. 2008. V. 455, №7209. P. 64-71.

18. Baker M. et al. The molecular detection of micrometastatic breast cancer // Am. J. Surg. 2003. V. 186, № 4. P. 351-358.

19. Balch C. et al. Epigenetic "bivalently marked" process of cancer stem cell-driven tumorigenesis // Bioessays. 2007. V. 29, № 9. P. 842-845.

20. Baranova A.V. et al. In silico screening for tumour-specific expressed sequences in human genome // FEBS Lett. 2001. V. 508, № 1. P. 143-148.

21. Benson D.A. et al. GenBank: update // Nucleic Acids Res. 2004. V. 32, № Database issue. P. D23-26.

22. Bentley D.R. et al. Accurate whole human genome sequencing using reversible terminator chemistry // Nature. 2008. V. 456, № 7218. P. 53-59.

23. Bentwich I. et al. Identification of hundreds of conserved and nonconserved human microRNAs // Nat. Genet. 2005. V. 37, № 7. P. 766-770.

24. Bernstein B.E. et al. A bivalent chromatin structure marks key developmental genes in embryonic stem cells // Cell. 2006. V. 125, № 2. P. 315-326.

25. Bernstein B.E. et al. Genomic maps and comparative analysis of histone modifications inhuman and mouse // Cell. 2005. V. 120, № 2. P. 169-181.

26. Bieda M. et al. Unbiased location analysis of E2F1-binding sites suggests a widespread role for E2F1 in the human genome // Genome Res. 2006. V. 16, № 5. P. 595-605.

27. Birbe R. et al. Guanylyl cyclase С is a marker of intestinal metaplasia, dysplasia, and adenocarcinoma of the gastrointestinal tract // Hum. Pathol. 2005. V. 36, № 2. P. 170-179.

28. Birney E. et al. Identification and analysis of functional elements in 1% of the human genome by the ENCODE pilot project // Nature. 2007. V. 447, № 7146. P. 799-816.

29. Blackwell Т.К. et al. Binding of myc proteins to canonical and noncanonical DNA sequences // Mol. Cell. Biol. 1993. V. 13. № 9. P. 5216-5224.

30. Blackwood E.M., Kadonaga J.T. Going the distance: a current view of enhancer action // Science. 1998. V. 281, № 5373. P. 60-63.

31. Blanchette M. et al. Aligning multiple genomic sequences with the threaded blockset aligner // Genome Res. 2004. V. 14, № 4. P. 708-715.

32. BLAST: Basic Local Alignment Search Tool Электронный ресурс. URL: http://blast.ncbi.nlm.nih.gov/Blast.cgi (дата обращения: 11.09.2010).

33. Boyle A.P. et al. F-Scq: a feature density estimator for high-throughput sequence tags // Bioinformatics. 2008. V. 24, № 21. P. 2537-2538.

34. Boyle A.P. et al. Fligh-resolution mapping and characterization of open chromatin across the genome // Cell. 2008. V. 132, № 2. P. 311-322.

35. Brand A.H. et al. Characterization of a "silencer" in yeast: a DNA sequence with properties opposite to those of a transcriptional enhancer // Cell. 1985. V. 41, № l.P. 41-48.

36. Bucher P. Weight matrix descriptions of four eukaryotic RNA polymerase II promoter elements derived from 502 unrelated promoter sequences // J. Mol. Biol. 1990. V. 212, № 4. P. 563-578.

37. Buck M.J., Nobel A.B., Lieb J.D. ChlPOTle: a user-friendly tool for the analysis of ChlP-chip data // Genome Biol. 2005. V. 6, № 11. P. R97.

38. Butler J.E.F., Kadonaga J.T. The RNA polymerase II core promoter: a key component in the regulation of gene expression // Genes Dev. 2002. V. 16, № 20. P. 2583-2592.

39. Campos E.I., Reinberg D. Histones: annotating chromatin // Annu. Rev. Genet. 2009. V. 43. P. 559-599.

40. Carninci P. et al. Genome-wide analysis of mammalian promoter architecture and evolution //Nat. Genet. 2006. V. 38, № 6. P. 626-635.

41. Carninci P. et al. The transcriptional landscape of the mammalian genome // Science. 2005. V. 309, № 5740. P. 1559-1563.

42. Carrithers S.L. et al. Guanylyl cyclase C is a selective marker for metastatic colorectal tumors in human extraintestinal tissues // Proc. Natl. Acad. Sci. U.S.A. 1996. V. 93, № 25. P. 14827-14832.

43. Cartwright P. et al. E2F-6: a novel member of the E2F family is an inhibitor of E2F-dependent transcription // Oncogene. 1998. V. 17, № 5. P. 611-623.

44. Cazalla D., Yario T., Steitz J. Down-regulation of a host microRNA by a Herpesvirus saimiri noncoding RNA // Science. 2010. V. 328, № 5985. P. 1563-1566.

45. Chang Y.S. et al. Mosaic blood vessels in tumors: frequency of cancer cells in contact with flowing blood // Proc. Natl. Acad. Sci. U.S.A. 2000. V. 97, № 26. P. 14608-14613.

46. Chen C. et al. MicroRNAs modulate hematopoietic lineage differentiation // Science. 2004. V. 303, № 5654. P. 83-86.

47. Cheng J. et al. Transcriptional maps of 10 human chromosomes at 5-nucleotide resolution// Science. 2005. V. 308, № 5725. P. 1149-1154.

48. Cheung H. et al. DNA methylation of cancer genome // Birth Defects Res. C Embryo Today. 2009. V. 87, № 4. P. 335-350.

49. Chiaromonte F., Yap V.B., Miller W. Scoring pairwise genomic sequence alignments // Pac Symp Biocomput. 2002. P. 115-126.

50. Chirgwin J.M. et al. Isolation of biologically active ribonucleic acid from sources enriched in ribonuclease // Biochemistry. 1979. V. 18, № 24. P. 5294-5299.

51. Cifiientes D. et al. A novel miRNA processing pathway independent of Dicer requires Argonaute2 catalytic activity // Science. 2010. V. 328, № 5986. P. 16941698.

52. Clamp M. et al. Distinguishing protein-coding and noncoding genes in the human genome // Proc. Natl. Acad. Sei. U.S.A. 2007. V. 104, № 49. P. 19428-19433.

53. Coolen M.W. et al. Consolidation of the cancer genome into domains of repressive chromatin by long-range epigenetic silencing (LRES) reduces transcriptional plasticity //Nat. Cell Biol. 2010. V. 12, № 3. P. 235-246.

54. Crawford G.E. et al. DNase-chip: a high-resolution method to identify DNase I hypersensitive sites using tiled microarrays // Nat. Methods. 2006. V. 3, № 7. P. 503509.

55. Crawford G.E. et al. Genome-wide mapping of DNase hypersensitive sites using massively parallel signature sequencing (MPSS) // Genome Res. 2006. V. 16, № i.p. 123-131.

56. Cullen B.R. Viruses and microRNAs // Nat. Genet. 2006. V. 38 Suppl. P. S25-30.

57. DAlessio J.A., Wright K.J., Tjian R. Shifting players and paradigms in cell-specific transcription // Mol. Cell. 2009. V. 36, № 6. P. 924-931.

58. Darzacq X. et al. Cajal body-specific small nuclear RNAs: a novel class of 2'-O-methylation and pseudouridylation guide RNAs // EMBO J. 2002. V. 21, № 11. P. 2746-2756.

59. Davey C.A. et al. Solvent mediated interactions in the structure of the nucleosome core particle at 1.9 a resolution // J. Mol. Biol. 2002. V. 319, № 5. P. 1097-1113.

60. Diederichs S., Haber D.A. Dual role for argonautes in microRNA processing and posttranscriptional regulation of microRNA expression // Cell. 2007. V. 131, № 6. P. 1097-1108.

61. Dimitri P. et al. Constitutive heterochromatin: a surprising variety of expressed sequences // Chromosoma. 2009. V. 118, № 4. P. 419-435.

62. Drmanac R. et al. Human genome sequencing using unchained base reads on self-assembling DNA nanoarrays // Science. 2010. V. 327, № 5961. P. 78-81.

63. Dunn B.K. Hypomethylation: one side of a larger picture // Ann. N. Y. Acad. Sci. 2003. V. 983. P. 28-42.

64. Dynan W.S., Tjian R. The promoter-specific transcription factor Spl binds to upstream sequences in the SV40 early promoter // Cell. 1983. V. 35, № 1. P. 79-87.

65. Emami K.H., Navarre W.W., Smale S.T. Core promoter specificities of the Spl and VP16 transcriptional activation domains // Mol. Cell. Biol. 1995. V. 15, № 11. P. 5906-5916.

66. Euskirchen G.M. et al. Mapping of transcription factor binding regions in mammalian cells by ChIP: comparison of array- and sequencing-based technologies // Genome Res. 2007. V. 17, № 6. P. 898-909.

67. Fava T.A. et al. Ectopic expression of guanylyi cyclase C in CD34+ progenitor cells in peripheral blood //J. Clin. Oncol. 2001. V. 19, № 19. P. 3951-3959.

68. Fernandez P.C. et al. Genomic targets of the human c-Myc protein // Genes Dev. 2003. V. 17, №9. P. 1115-1129.

69. Fire A. et al. Potent and specific genetic interference by double-stranded RNA in Caenorhabditis elegans//Nature. 1998. V. 391, № 6669. P. 806-811.

70. Gallant P., Steiger D. Myc's secret life without Max // Cell Cycle. 2009. V. 8, №23. P. 3848-3853.

71. Gardiner-Garden M., Frommer M. CpG islands in vertebrate genomes // J. Mol. Biol. 1987. V. 196, № 2. P. 261-282.

72. Gardner P.P., Vinther J. Mutation of miRNA target sequences during human evolution // Trends Genet. 2008. V. 24', № 6. P. 262-265.

73. Gartel A.L., Kandel E.S. miRNAs: Little known mediators of oncogenesis // Semin. Cancer Biol. 2008. V. 18, № 2. P. 103-110.

74. Gaszner M., Felsenfeld G. Insulators: exploiting transcriptional and epigenetic mechanisms //Nat. Rev. Genet. 2006. V. 7, № 9. P. 703-713.

75. Gaudet F. et al. Induction of tumors in mice by genomic hypomethylation // Science. 2003. V. 300, № 5618. P. 489-492.

76. Gilmour D.S. Promoter proximal pausing on genes in metazoans // Chromosoma. 2009. V. 118, № 1. P. 1-10.

77. Giresi P.G. et al. FAIRE (Formaldehyde-Assisted Isolation of Regulatory Elements) isolates active regulatory elements from human chromatin // Genome Res. 2007. V. 17, №6. P. 877-885.

78. Giresi P.G., Lieb J.D. Isolation of active regulatory elements from eukaryotic* chromatin using FAIRE (Formaldehyde Assisted Isolation of Regulatory Elements) // Methods. 2009. V. 48, № 3. P. 233-239.

79. Gold P., Freedman S.O. Specific carcinoembryonic antigens of the human digestive system // J. Exp. Med. 1965. V. 122, № 3. P. 467-481.

80. Grad Y. et al. Computational and experimental identification of C. elegans microRNAs //Mol Cell. 2003. V. 11, № 5. P. 1253-1263.

81. Grishok A. et al. Genes and mechanisms related to RNA interference regulate expression of the small temporal RNAs that control C. elegans developmental timing // Cell. 2001. V. 106, № 1. P. 23-34.

82. Gruber A.R. et al. The Vienna RNA websuite // Nucleic Acids Res. 2008. V. 36, № Web Server issue. P. W70-74.

83. Guccione E. et al. Myc-binding-site recognition in the human genome is determined by chromatin context //Nat. Cell Biol. 2006. V. 8, № 7. P. 764-770.

84. Gucnther M.G. et al. A chromatin landmark and transcription initiation at most promoters in human cells // Cell. 2007. V. 130, № 1. P. 77-88.

85. Guttman M. et al. Chromatin signature reveals over a thousand highly conserved large non-coding RNAs in mammals // Nature. 2009. V. 458, № 7235. P. 223-227.

86. Hall T. BioEdit: a user-friendly biological sequence alignment editor and analysis program for Windows 95/98/NT // Nucl. Acids. Symp. Ser. 1999. V. 41. P. 95-98.

87. Hammond S.M. et al. An RNA-directed nuclease mediates post-transcriptional gene silencing in Drosophila cells // Nature. 2000. V. 404, № 6775. P. 293-296.

88. Han J. et al. Molecular basis for the recognition of primary microRNAs by the Drosha-DGCR8 complex// Cell. 2006. V. 125, № 5. p. 887-901.

89. Hargreaves D.C., Horng T., Medzhitov R. Control of inducible gene expression by signal-dependent transcriptional elongation // Cell. 2009. V. 138. № 1. P. 129-145.

90. Hon G., Wang W., Ren B. Discovery and annotation of functional chromatin signatures in the human genome // PLoS Comput. Biol. 2009. V. 5, № 11. P. el000566.

91. Houghton R.L. et al. Transcriptional complementarity in breast cancer: application to detection of circulating tumor cells // Mol. Diagn. 2001. V. 6. № 2. P. 79-91.

92. Hsu S. et al. miRNAMap 2.0: genomic maps of microRNAs in metazoan genomes //Nucleic Acids Res. 2008. V. 36, № Database issue. P. D165-169.

93. Hutvagner G. et al. A cellular function for the RNA-interference enzyme Dicer in the maturation of the let-7 small temporal RNA // Science. 2001. V. 293, № 5531. P. 834-838.

94. Hutvagner G., Zamore P.D. A microRNA in a multiple-turnover RNAi enzyme complex // Science. 2002. V. 297, № 5589. P. 2056-2060.

95. Jenuwein T., Allis C.D. Translating the histone code // Science. 2001. V. 293, №5532. P. 1074-1080.

96. Jinek M., Doudna J.A. A three-dimensional view of the molecular machinery of RNA interference // Nature. 2009. V. 457, № 7228. P. 405-412.

97. Jolliff K., Li Y., Johnson L.F. Multiple protein-DNA interactions in the TATAA-less mouse thymidylate synthase promoter // Nucleic Acids Res. 1991. V. 19, № 9. P. 2267-2274.

98. Jones D.T.W. et al. Tandem duplication producing a novel oncogenic BRAF fusion gene defines the majority of pilocytic astrocytomas // Cancer Res. 2008. V. 68, №21. P. 8673-8677.

99. Jurka J. Repbase update: a database and an electronic journal of repetitive elements // Trends Genet. 2000. V. 16, № 9. P. 418-420.

100. Juven-Gershon T., Kadonaga J.T. Regulation of gene expression via the core promoter and the basal transcriptional machinery // Dev. Biol. 2010. V. 339, № 2. P. 225-229.

101. Kalakonda N. et al. Histone H4 lysine 20 monomethylation promotes transcriptional repression by L3MBTL1 // Oncogene. 2008. V. 27, № 31. P. 42934304.

102. Kapranov P. et al. Large-scale transcriptional activity in chromosomes 21 and 22 // Science. 2002. V. 296, № 5569. P. 916-919.

103. Karlic R. et al. Histone modification levels are predictive for gene expression // Proc. Natl. Acad. Sci. U.S.A. 2010. V. 107, № 7. P. 2926-2931.

104. Kenneth N.S., White R.J. Regulation by c-Myc of ncRNA expression // Curr. Opin. Genet. Dev. 2009. V. 19, № 1. P. 38-43.

105. Kent W.J. BLAT—the BLAST-like alignment tool // Genome Res. 2002. V. 12, № 4. P. 656-664.

106. Kent W.J. et al. The human genome browser at UCSC // Genome Res. 2002.i1. V. 12, № 6. P. 996-1006.

107. Kim J. et al. A highly annotated whole-genome sequence of a Korean individual //Nature. 2009. V. 460, № 7258. P. 1011-1015.

108. Kim T. et al. Widespread transcription at neuronal activity-regulated enhancers //Nature. 2010. V. 465, № 7295. P. 182-187.

109. Kollmar R. et al. Start site selection at the TATA-less carbamoyl-phosphate synthase (glutamine-hydrolyzing)/aspartate carbamoyltransferase/dihydroorotase promoter // J. Biol. Chem. 1994. V. 269, № 3. P. 2252-2257.

110. Kouzarides T. Chromatin modifications and their function // Cell. 2007. V. 128, №4. P. 693-705.

111. Kozlov A. et al. The maximal expression of mammalian genome, the complexity of tumor-specific transcripts and the cloning of tumor-specific cDNAs. Bethesda, MD: AIDS Res Hum Retroviruses, 1992. V. 8(5). P. 671-951.

112. Kozlov A.P. Evolution of living organisms as a multilevel process // J. Theor. Biol. 1979. V. 81, № 1. P. 1-17.

113. Kozlov A.P. Gene competition and the possible evolutionary role of tumours // Med. Hypotheses. 1996. V. 46, № 2. P. 81-84.

114. Kozlov A.P. The possible evolutionary role of tumors in the origin of new cell types // Med. Hypotheses. 2010. V. 74, № 1. P. 177-185.

115. Krukovskaja L.L. et al. Experimental study of human expressed sequences newly identified in silico as tumor specific // Tumour Biol. 2005. V. 26, № 1. P. 1724.

116. Laimins L., Holmgren-Konig M., Khoury G. Transcriptional "silencer" element in rat repetitive sequences associated with the rat insulin 1 gene locus // Proc. Natl. Acad. Sci. U.S.A. 1986. V. 83, № 10. P. 3151-3155.

117. Lander E.S. et al. Initial sequencing and analysis of the human genome // Nature. 2001. V. 409, № 6822. P. 860-921.

118. Lee D. et al. Functional characterization of core promoter elements: the downstream core element is recognized by TAF1 // Mol. Cell. Biol. 2005. V. 25, № 21. P. 9674-9686.

119. Lee I. et al. New class of microRNA targets containing simultaneous 5'-UTR and 3'-UTR interaction sites // Genome Res. 2009. V. 19, № 7. P. 1175-1183.

120. Lee J.S., Galvin K.M., Shi Y. Evidence for physical interaction between the zinc-finger transcription factors YY1 and Spl // Proc. Natl. Acad. Sci. U.S.A. 1993. V. 90, №13. P. 6145-6149.

121. Lee R., Feinbaum R., Ambros V. A short history of a short RNA // Cell. 2004. V. 116, № 2 Suppl. C. S89-92, 1 p following S96.

122. Lee R.C., Feinbaum R.L., Ambros V. The C. elegans heterochronic gene lin-4 encodes small RNAs with antisense complementarity to lin-14 // Cell. 1993. V. 75, № 5. P. 843-854.

123. Lee Y. et al. The nuclear RNase III Drosha initiates microRNA processing // Nature. 2003. V. 425, № 6956. P. 415-419.

124. Lettini A.A. et al. Epigenetic remodelling of DNA in cancer // Histol. Histopathol. 2007. V. 22, № 12. P. 1413-1424.

125. Levy S. et al. The diploid genome sequence of an individual human // PLoS Biol. 2007. V. 5, № 10. P. e254.

126. Lewis B.P., Burge C.B., Bartel D.P. Conserved seed pairing, often flanked by adenosines, indicates that thousands of human genes are microRNA targets // Cell. 2005. V. 120, № l.P. 15-20.

127. Ley T.J. et al. DNA sequencing of a cytogenetically normal acute myeloid leukaemia genome // Nature. 2008. V. 456, № 7218. P. 66-72.

128. Li S., Pan C., Lin W. Bioinformatic discovery of microRNA precursors from human ESTs and introns // BMC Genomics. 2006. V. 7. P. 164.

129. Liang G. et al. Distinct localization of histone H3 acetylation and H3-K4 methylation to the transcription start sites in the human genome // Proc. Natl. Acad. Sci. U.S.A. 2004. V. 101, № 19. P. 7357-7362.

130. Ludwig J.A., Weinstein J.N. Biomarkers in cancer staging, prognosis and treatment selection //Nat. Rev. Cancer. 2005. V. 5, № 11. P. 845-856.

131. Lynch P.J., Rusche L.N. A silencer promotes the assembly of silenced chromatin independently of recruitment // Mol. Cell. Biol. 2009. V. 29, № l.P. 4356.

132. Ma L., Weinberg R.A. MicroRNAs in malignant progression // Cell Cycle. 2008. V. 7, № 5. P. 570-572.

133. Maity S.N., de Crombrugghe B. Role of the CCAAT-binding protein CBF/NF-Y in transcription // Trends Biochem. Sci. 1998. V. 23, № 5. P. 174-178.

134. Mattick J.S. Makunin I.V. Non-coding RNA // Hum. Mol. Genet. 2006. V. 15 Spec No l.P. R17-29.

135. McKernan K.J. et al. Sequence and structural variation in a human genome uncovered by short-read, massively parallel ligation sequencing using two-base encoding // Genome Res. 2009. V. 19, № 9. P. 1527-1541.

136. Mendes N.D., Freitas A.T., Sagot M. Current tools for the identification of miRNA genes and their targets // Nucleic Acids Res. 2009. V. 37, № 8. P. 24192433.

137. Meyer N., Penn L.Z. Reflecting on 25 years with MYC // Nat. Rev. Cancer. 2008. V. 8, № 12. P. 976-990.

138. Mikkelsen T.S. et al. Genome-wide maps of chromatin state in pluripotent and lineage-committed cells //Nature. 2007. V. 448, № 7153. P. 553-560.

139. Montgomery M.K., Xu S., Fire A. RNA as a target of double-stranded RNA-mediated genetic interference in Caenorhabditis elegans // Proc. Natl. Acad. Sci. U.S.A. 1998. V. 95. № 26. P. 15502-15507.

140. Moss E.G., Lee R.C., Ambros V. The cold shock domain protein LIN-28 controls developmental timing in C. elegans and is regulated by the lin-4 RNA // Cell. 1997. V. 88, № 5. P. 637-646.

141. Mourelatos Z. Small RNAs: The seeds of silence // Nature. 2008. V. 455, № 7209. P. 44-45.

142. Nechaev S. et al. Global analysis of short RNAs reveals widespread promoter-proximal stalling and arrest of Pol II in Drosophila // Science. 2010. V. 327, № 5963. P. 335-338.

143. Nezos A. et al. Detection of circulating tumor cells in bladder cancer patients // Cancer Treat. Rev. 2009. V. 35, № 3. P. 272-279.

144. Palena C. et al. The human T-box mesodermal transcription factor Brachyury is a candidate target for T-cell-mediated cancer immunotherapy // Clin. Cancer Res. 2007. V. 13, № 8. P. 2471-2478.

145. Philipsen S., Suske G. A tale of three fingers: the family of mammalian Sp/XKLF transcription factors // Nucleic Acids Res. 1999. V. 27, № 15. P. 29913000.

146. Pogribny I.P., Beland F.A. DNA hypomethylation in the origin and pathogenesis of human diseases // Cell. Mol. Life Sci. 2009. V. 66, № 14. P. 22492261.

147. Pokholok D.K. et al. Genome-wide map of nucleosome acetylation and methylation in yeast // Cell. 2005. V. 122, № 4. P. 517-527.

148. Pollard K.S. et al. Detection of nonneutral substitution rates on mammalian phylogenies // Genome Res. 2010. V. 20, № 1. P. 110-121.

149. Pugh B.F., Tjian R. Transcription from a TATA-less promoter requires a multisubunit TFIID complex // Genes Dev. 1991. V. 5, № 11. p. 1935-1945.

150. Raj G.V., Moreno J.G., Gomella L.G. Utilization of polymerase chain reaction technology in the detection of solid tumors // Cancer. 1998. V. 82, № 8. P. 14191442.

151. Rajewsky N. microRNA target predictions in animals // Nat. Genet. 2006. V. 38 Suppl. P. S8-13.

152. Reinhart B.J. et al. The 21-nucleotide let-7 RNA regulates developmental timing in Caenorhabditis elegans // Nature. 2000. V. 403, № 6772. P. 901-906.

153. Rhead B. et al. The UCSC Genome Browser database: update 2010 // Nucleic Acids Res. 2010. V. 38, № Database issue. P. D613-619.

154. Rinn J.L. et al. The transcriptional activity of human Chromosome 22 // Genes Dev. 2003. V. 17, № 4. P. 529-540.

155. Ritter D.I. et al. The Importance of Being Cis: Evolution of Orthologous Fish and Mammalian Enhancer Activity // Mol Biol Evol. 2010.

156. Robertson A.G. et al. Genome-wide relationship between histone H3 lysine 4 mono- and tri-methylation and transcription factor binding // Genome Res. 2008. V. 18, № 12. P. 1906-1917.

157. Rollins R.A. et al. Large-scale structure of genomic methylation patterns // Genome Res. 2006. V. 16, № 2. P. 157-163.

158. Rosenbloom K.R. et al. ENCODE whole-genome data in the UCSC Genome Browser //Nucleic Acids Res. 2010. V. 38, № Database issue. P. D620-625.

159. Rozowsky J. et al. PeakSeq enables systematic scoring of ChlP-seq experiments relative to controls //Nat. Biotechnol. 2009. V. 27, № 1. P. 66-75.

160. Ruggero D. The role of Myc-induced protein synthesis in cancer // Cancer Res. 2009. V. 69, № 23. P. 8839-8843.

161. Sambrook J., Rüssel D. Molecular Cloning: A Laboratory Manual. Зий изд. Cold Spring Harbor, N.Y.: Cold Spring Flarbor Laboratory Press, 2001.

162. Sandelin A. et al. Mammalian RNA polymerase II core promoters: insights from genome-wide studies //Nat. Rev. Genet. 2007. V. 8, № 6. P. 424-436.

163. Saunders A., Core L.J., Lis J.T. Breaking barriers to transcription elongation // Nat. Rev. Mol. Cell Biol. 2006. V. 7, № 8. P. 557-567.

164. Schröder C.P. et al. Detection of micrometastatic breast cancer by means of real time quantitative RT-PCR and immunostaining in perioperative blood samples and sentinel nodes //Int. J. Cancer. 2003. V. 106, № 4. P. 611-618.

165. Schübeier D. et al. The histone modification pattern of active genes revealed through genome-wide chromatin analysis of a higher eukaryote // Genes Dev. 2004. V. 18, № 11. P. 1263-1271.

166. Schulz W.A., Hoffmann M.J. Epigenetic mechanisms in the biology of prostate cancer // Semin. Cancer Biol. 2009. V. 19, № 3. P. 172-180.

167. Selbach M. et al. Widespread changes in protein synthesis induced by microRNAs //Nature. 2008. V. 455, № 7209. P. 58-63.

168. Shen C. et al. The detection of circulating tumor cells of breast cancer patients by using multimarker (Survivin, hTERT and hMAM) quantitative real-time PCR // Clin. Biochem. 2009. V. 42, № 3. P. 194-200.

169. Siepel A. et al. Evolutionarily conserved elements in vertebrate, insect, worm, and yeast genomes // Genome Res. 2005. V. 15, № 8. P. 1034-1050.

170. Smale S.T., Kadonaga J.T. The RNA polymerase II core promoter // Annu. Rev. Biochem. 2003. V. 72. P. 449-479.

171. Smalheiser N.R., Torvik V.I. Mammalian microRNAs derived from genomic repeats // Trends Genet. 2005. V. 21, № 6. P. 322-326.

172. Stark A. et al. A single Hox locus in Drosophila produces functional microRNAs from opposite DNA strands // Genes Dev. 2008. V. 22, № 1. P. 8-13.

173. Stark A. et al: Identification of Drosophila MicroRNA targets // PLoS Biol. 2003. V. 1, № 3. P. E60.

174. Stark M., Gonen N., Assaraf Y.G. Functional elements in the minimal promoter of the human proton-coupled folate transporter // Biochem. Biophys. Res. Commun. 2009. V. 388, № 1. P. 79-85.

175. Stole V. et al. A gene expression map for the euchromatic genome of Drosophila melanogaster // Science. 2004. V. 306, № 5696. P. 655-660.

176. Suzuki M.M., Bird A. DNA methylation landscapes: provocative insights from epigenomics //Nat. Rev. Genet. 2008. V. 9, № 6. P. 465-476.

177. Szulwach K.E. et al. Cross talk between micro RNA and epigenetic regulation in adult neurogenesis // J. Cell Biol. 2010. V. 189, № 1. P. 127-141.

178. Szutorisz H., Dillon N., Tora L. The role of enhancers as centres for general transcription factor recruitment // Trends Biochem. Sci. 2005. V. 30, № 11. P. 593599.

179. Taganov K.D., Boldin M.P., Baltimore D. MicroRNAs and immunity: tiny players in a big field // Immunity. 2007. V. 26, № 2. P. 133-137.

180. Tay Y. et al. MicroRNAs to Nanog, Oct4 and Sox2 coding regions modulate embryonic stem cell differentiation //Nature. 2008. V. 455, № 7216. P. 1124-1128.

181. Thiel G., Lietz M., Hohl M. How mammalian transcriptional repressors work // Eur. J. Biochem. 2004. V. 271, № 14. P. 2855-2862.

182. Thomas R.K. et al. High-throughput oncogene mutation profiling in human cancer//Nat. Genet. 2007. V. 39, № 3. P. 347-351.

183. Ting A.H., McGarvey K.M., Baylin S.B. The cancer epigenome—components and functional correlates // Genes Dev. 2006. V. 20, № 23. P. 3215-3231.

184. Tol J. et al. Circulating tumour cells early predict progression-free and overall survival in advanced colorectal cancer patients treated with chemotherapy and targeted agents // Ann. Oncol. 2010. V. 21, № 5. P. 1006-1012.

185. Trojer P., Reinberg D. Facultative heterochromatin: is there a distinctive molecular signature? // Mol. Cell. 2007. V. 28, № 1. P. 1-13.

186. Tsouma A. et al. Circulating tumor cells in colorectal cancer: detection methods and clinical significance // Anticancer Res. 2008. V. 28, № 6B. P. 39453960.

187. Untergasser A. et al. Primer3Plus, an enhanced web interface to Primer3 // Nucleic Acids Res. 2007. V. 35, № Web Server issue. P. W71-74.

188. Varlakhanova N.V., Knoepfler P.S. Acting locally and globally: Myc's ever-expanding roles on chromatin // Cancer Res. 2009. V. 69, № 19. P. 7487-7490.

189. Venter J.C. et al. The sequence of the human genome // Science. 2001. V. 291, №5507. P. 1304-1351.

190. Vogelstein B., Kinzler K.W. Cancer genes and the pathways they control // Nat. Med. 2004. V. 10, № 8. P. 789-799.

191. Wang J. et al. The diploid genome sequence of an Asian individual // Nature. 2008. V. 456, № 7218. P. 60-65.

192. Wang Z. et al. Combinatorial patterns of histone acetylations and methylations in the human genome //Nat. Genet. 2008. V. 40, № 7. P. 897-903.

193. Weber M. et al. Distribution, silencing potential and evolutionary impact of promoter DNA methylation in the human genome // Nat. Genet. 2007. V. 39, № 4. P. 457-466.

194. Wheeler D.A. et al. The complete genome of an individual by massively parallel DNA sequencing // Nature. 2008. V. 452, № 7189. P. 872-876.

195. Wightman B., lia I., Ruvkun G. Posttranscriptional regulation of the heterochronic gene lin-14 by lin-4 mediates temporal pattern formation in C. elegans // Cell. 1993. V. 75. № 5. P. 855-862.

196. Wilson A.S., Power B.E., Molloy P.L. DNA hypomethylation and human diseases // Biochim. Biophys. Acta. 2007. V. 1775, № 1. P. 138-162.

197. Wong S., Witte O.N. The BCR-ABL story: bench to bedside and back // Annu. Rev. Immunol. 2004. V. 22. P. 247-306.

198. Wu H. et al. Alternative processing of primary microRNA transcripts by Drosha generates 5' end variation of mature microRNA // PLoS ONE. 2009. V. 4, № 10. P. el566.

199. Xu J. et al. METHODS, COMPOSITIONS, AND KITS FOR THE DETECTION AND MONITORING OF COLON CANCER: naV. W0/2008/030559 USA.

200. Yamada K. et al. Empirical analysis of transcriptional activity in the Arabidopsis genome // Science. 2003. V. 302, № 5646. P. 842-846.

201. Yang H., Mizzen C.A. The multiple facets of histone H4-lysine 20 methylation // Biochem. Cell Biol. 2009. V. 87, № 1. P. 151-161.

202. Yie S. et al. Detection of survivin-expressing circulating cancer cells (CCCs) in peripheral blood of patients with gastric and colorectal cancer reveals high risks of relapse // Ann. Surg. Oncol. 2008. V. 15, № 11. P. 3073-3082.

203. Zeller K.I. et al. Global mapping of c-Myc binding sites and target gene networks in human B cells // Proc. Natl. Acad. Sci. U.S.A. 2006. V. 103, № 47. P. 17834-17839.

204. Zeng Y., Cullen B.R. Efficient processing of primary microRNA hairpins by Drosha requires flanking nonstructured RNA sequences // J. Biol. Chem. 2005. V. 280, № 30. P. 27595-27603.

205. Zeng Y., Yi R., Cullen B.R. Recognition and cleavage of primary microRNA precursors by the nuclear processing enzyme Drosha// EMBO J. 2005. V. 24, № 1. P. 138-148.

206. Zhang H. et al. Single processing center models for human Dicer and bacterial RNase III // Cell. 2004. V. 118. № 1. P. 57-68.

207. Zhou X. et al. Characterization and identification of microRNA core promoters in four model species // PLoS Comput. Biol. 2007. V. 3, № 3. P. e37.

208. Zuker M. Mfold web server for nucleic acid folding and hybridization prediction //Nucleic Acids Res. 2003. V. 31, № 13. P. 3406-3415.