Бесплатный автореферат и диссертация по биологии на тему
Структура псевдогена из семейства генов бета-субъединицы Na+,K+ -АТФазы
ВАК РФ 03.00.03, Молекулярная биология
Автореферат диссертации по теме "Структура псевдогена из семейства генов бета-субъединицы Na+,K+ -АТФазы"
А К А Д Е М И Я
НАУК
СССР
ОРДЕНА. ТРУДОВОГО КРАСНОГО ЗНАМЕНИ ИНСТИТУТ БИООРГАНКЧЕСКОИ ХИМИИ ИМ. М.М. ШЕМЯКИНА
На правах рукописи
БЕССАРАБ Дмитрий Александрович
УДК 577.152.361*3:577.123.5
Структура псевдогена из семейства генов р-субъединицы на+,К+-АТФазы
Специальность - 03.00.03 - Молекулярная биология
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата биологических наук
Москва 1991
Работа выполнена в ордена Трудового Красного Знамени Институте биоорганической химии им. М.М. Шемя:::ша АН СССР
Научный руководитель: кандидат химичэских наук
Монастырская Г.С.
Официальные оппоненты: доктор биологических наук П.М. Рубцов ■ кандидат химических наук A.D. Америк
Ведущая организация: Всесоюзный научно-исследовательский институт генетики и селекции промышленных микроорганизмов Минмедпрома.
Защита состоится "1991 г. в -УО^Час.
на заседании Специализированного совета Д 002.35.01 при Институте биоорганической химии им. М.М. Шемякина АН СССР по адресу: 117871, ГСП-7, Москва, В-437, ул. Миклухо-Маклая 16/10.
С диссертацией можно ознакомиться в библиотеке Института биоорганической химии им. М.М. Шемякина АН СССР.
Автореферат разослан "-/b"" <xsnSie.tJL 1991 г.
Ученый секретарь Специализированного совета ИБХ им. М.М. Шемякина АН СССР / кандидат химических наук
В.А. Несмеянов
ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность проблемы. Иа+.К^-АТФаза - интегральный мембранный белок, присутствующий во всех клетках животных и осуществляющий сопряженный с гидролизом АТФ трансмембранный перенос ионов На+ и К* против градиента электрохимических потенциалов. - Через создание трансмембранных ионных градиентов Ма+,К+-АТФаза > участвует в регуляции таких разнообразных процессов, как проведение нервного импульса, поддержание водно-солевого баланса, пролиферация и диффзренцировка клеток. Яа^МС^-АТФаза состоит из двух' типов субъединиц: каталитической а-субъединицы (молекулярная масса ~110 кДа) и р-субъединицы (молекулярная масса "35 кДа), представляющей собой сиалогликопротеш. Роль р-субъединицы к настоящему времени не выяснена.
В Институте Сиоорганической химии им. М.Ы. Шемякина АН СССР проводятся комплексные структурно-функциональные исследования генов Иа+ .К^-АТФазы. Было установлено, что каталитическая а-субъеднница представлена несколькими изофэрмами, кодируемыми различными генами, составляющими семейство генов а-субъединицы На+,К+-АТФазы. К началу настоящей работы отсутствовали данные о генах р-субъединицы человека. В связи с этим представлялось актуальным исследовать последовательности генома человека, гомологичные гену р-субъединицы Ла1" .К^-АТФазы. Работа стала возможной благодаря наличию информации о структуре кДНК р-субъединицы 1Та+,К+-АТФазы из почек свиньи, определенной в ИБХ им. М.М. Шемякина АН СССР.
Цель работы. Целью настоящей работы был анализ нуклеотидных последовательностей генома человека, гомологичных кДНК р-субъединицы Иа+,К+-АТФазы свиньи.
Ч'-. Научная новизна и практическая ценность работы. В результате проделанной работы установлено существование семейства генов р-субъединицы ,К*"-АТФазы человека, которое содежит не менее, чем один ген и один псевдоген. В результате анализа первичной структуры геномной ДНК человека, содержащей последовательности псевдогена р-субъединицы .К^-АТФазн, выявлены две
различающиеся последовательности, обладающие признаками процессированных псевдогенов. На основании сравнительно-структурного анализа оценено время образования, процессированного псевдогена р-субъединицы На+,К+-АТФазы человека.
-г -
Полученные результата могут быть использованы при исследованиях экспрессии гена 6-субъедштцы На+,К+-АТФазы, определении хромосомной локализации и изучении популяционного полиморфизма.
Объем работы. Диссертационная работа изложена на 53 страницах машинописного текста и состоит из введения, обзора литературы, обсуждения результатов, экспериментальной части, выводов и списка щгафуекой литературы (132 ссылки).
СОДЕРЖАНИЕ РАБОТЫ
1. Скрининг геномных банков.
В ходе исследования проанализированы два геномных банка, полученные Алликкетсом Р.Л. и Гришиным A.B. из ДНК спермы человека (одного донора). Для получения банка геномную ДНК подвергали частичному гидролизу рестриктазой Sau 3AI. Полученный гидролизат был разделен на фракции центрифугированием з градиенте концентрации хлорида натрия, и фракции, содержащую фрагменты 10-20 тыс.п.о., клонировали по BsniHI-сайту вектора ЯЕМБЬЗ. Банки содержали 1.0-3.0x1 С? независимых клонов, что достаточно для клонирования уникальных последовательностей ДНК генома человека. Банки рассевалн на чашки Петри диаметром SO мм с плотностьв ~3:с104 фаговых бляшек на чашку. В качестве хозяина использовали штаммы Esherichia coli DP 50.
1.1. Анализ геномных банков*.
В работе был использован один из наиболее часто применяемых методов идентификации рекомСинантных бактериофагов X, несущих определенные последовательности эукариосической ДНК, гибридизация 1л situ фаговых бляшек со специфическими ДНК-зондами, каченная ? . С каждой из чашек Петри, на которые высевали банк, снимали по 2-3 реплики на нитроцэллалозные фильтры ВА85, которые после стандартной обработки, гибридизовали с радиоактивным зондом, прэдставлякщим собой кДНК ß-субъединицк
"Данный этап работы был выполнен совместно с Никифоровой H.H.
Ка+,К+-АТФази из почек свиньи. Полная нуклеотидная последовательность этой кДНК была установлена в 1936 году в Институте биоорганической химки им. М.М. Шемякина АН СССР.
Анализ пергичных структур кДНК ß-субъединиц, выделенных из почек свинья и клеток человека линии Heia CKawakami ct.al. 1986], показал, что уровень гомологии между ними составлял 91,45». Поэтому для скрининга геномных библиотек, содержащих ДНК человека, можно било использовать кДНК р-субъединицы На+,К+-АТФазы из почек свиньи (рис. 1). Для получения меченого зонда использовался метод статистической затравки.
0 200 лоо 600 800 1000 1200 1л00
И-1-1-1-1-1-1-Г-
р р р r pep р
svv з sss s
tuu a tat t
1 II (II I I( I I I -i'-"""'""1""?—......•' .. — -'•'• •'" .......- pNßSl
Рис. 1. Рестринтная карта кДНК р-субъединицы На1" .К1" -АТФэзы из почек свиньи [Овчинников и др., 1986]. Данная кДНК была использована в качестве гибридизацаонного зонда (рИ(531) для скрининга банков геномной ДНК человека.
В результате скринирования первого банка было выявлено 8 независимых, положительных сигналов (клоны ШфНН), а скрининг второго банка выявил 9 таких сигналов (клоны AUKßKH). Каждую из полученных гибридизухвдихся зон выкалывали, элюировали и рассовали . с меньшей плотностью ("5 тыс. БОЕ на чашку Петри диаметром 90 мм). Для получения индивидуальных клонов достаточно было 2 - 3-х Чрассевов. Выделение ДНК индивидуальных рекомбинантных фагов осуществляли по методу Ямамото с некоторыми модификациями. После определения примерной концентрации ДНК и размеров вставок с помощью электрофореза в 0,8-1 % агарозном геле проводили подробное их картирование* . • Картирование фаговой ДНК осуществляли двумя независимыми методами: с использованием полного гидролиза несколькими рестриктазами, узнающими гексануклеотидные последовательности (такими как EcoRI, BamHI, HindHI, Sali) с последующим электрофорезом, переносом на
"Данный этап работы был выполнен совместно с Ушкаревым Ю.А.
нейлоновые фильтры и гибридизацией с радиоактивным зондом ph*p31, и с использованием частичного гидролиза каждой из этих рестриктаз с предварительным мечением одного из сов-концов молекулы ДНК бактериофага A. [a-32P]ûGTP при помощи фрагмента КленоЕа ДНК-полимеразы I E.coli.
Анализ полученной разными методами информации позволил построить рестрпктше карты рекомбинантных фагов, часть из которых приведена на рисунках 2 и 3.
Все проанализированные клоны по своим рестриктным картам были условно отнесены к двум типам: тип RH11 и тип RH4. На рисунке 2 представлены рестрпктные карты клонов, отнесенных к типу RH11. Клоны \ККрШ11 и ШфЫН12 имели большую область перекрывания, что подтверждалось сходством рестриктных карт. HindiII-BamHI-фрагмент клона ЯККрШ12, размером 1,2 т.и.о., был использован в качестве зонда для "chroœosome walking" ("прогулки по хромосоме"), в результате чего был выявлен клон ШфМН10-1, который содержал аналогичный фрагмент. Клоны ANKpHHI 0-1 • и • АЖрШГГ не перекрывались ^шлсжение клона ШфМН7 установлено на основании данных "о" первичней структуре его фрагментов и при сопоставлении наших данных с данными Lane et.al. [1989]. Тип RH4 был предстазлен несколькими клонами, имеющими большую область перекрывания (рис. 3).
2. Предварительный анализ первичной структуры участков генома человека, гомологичных кДНК р-субъединицы На+,К*-АТФазы.
Нуклеотидную последовательность определяли модифицированным методом Сзнгера, в котором используется меченая [7~32Р]АТФ олигонуклеотидная затравка.
Анализ первичной структуры рестрикциокных фрагментов клонов ЛЖРЕН11 и ДЖрН12 показал, что данные клоны содержали последовательности, гомологичные кДНК р-субъединицы Ка+,К+-АТФазы свиньи, соответствующие 5'-концевому фрагменту. Уровень гомологии составлял 97,33. . Области, гомологичные кДНК, прерывались негомологчными участками, ограниченными каноническими сайтами слайсинга. Данные результаты позволили предположить, что клоны ЯЖршп и ШрИН12 содержат фрагменты -гена р-субъединицы Na+,К+-АТФази. К моменту, когда было сделано это заключение, была опубликована структура гена р-субъединицы Na+,К+-АТФазы человеческих лейкоцитов [Lane et.al. 1989]. Сопоставление наших данных с данными bane et.al. [1989] позволило установить, что клоны ШфНН11 к ШфМН12 содержат последовательности первого и
ШИНН11
XNK6MH12
ШфМНЮ-1
(А)
1—I 1 Т.П.О.
ANKßMHT
S н I I
о.б S н
_l_L
3.5
Е В J_b
0.9
Е В
J_fc=
0.6 3.5 0.9
5 Н ВН Е Y-—II I
В HB
л.а
0.5 1.1 1.7
(Б)
В HB
Е _1_
л.в 0.5 1.1 1.7 1.1 1.2
Н Е ЕННЕ В J_I
1.2 1.2 З.б
2.1 1.9 0.5
s в
НЕВНЕ ВНЕ Н HB
-Ь-У V 'II_I I I
о.8 3.8 1.3 2.8 1.0 0.8 1.2 1.2 0.6
RH11
МН12
МН10-1
МН7
'ис. 2. Рекомбинантные клоны типа RH11, содержащие фрагменты гана ä-субъединицы Ыа+,К+-АТФазы человека. (А) Схема перекрывания слонов. (Б) Рестриктные карты. Буквами обозначены рестриктазы: В - BamHI, Е - EcoRI, Н- HindlH, S - Sali. ■ J - зона,
ибридизующаяся с зондом pNß31, --------- - участок перекрывания
тонов ЛЖРМН12 и ШфМН10-1 (см. пояснения в тексте). Клоны iNKßMHI 0-1 и ЛДКрмнт не перекрываются, их взаимное расположение, остановлено на основе сопоставления первичной структуры ибридизукщихся фрагментов со структурой кДНК ß-субъединицы и Iэнных Lane et.al. [1989]. Цифрами обозначены размеры фрагментов ¡" тысячах пар оснований. Размеры рестрикционных фрагментов длиной юнее 500 п.о. не указаны.
- б -
ш
АЛК6МН19_
ЛЖ8НН6_
ШВДШТ
1 1 т.п.о.
(Б)
Б _к=
Б _к=
5.8
5.5
н в .1 .!■-
ЕНЕ
=ш_
нв
0.5 1.3
3.5
2.1
н в
ЕНЕ
Н В У
0.5 1.3
Б В
ЕНЕ
н
3.5
Н В НЕ У II
2.1
Н Б
I I
1.л 0.5 1.3
В Н В. ЕНЕ 11
3.5
2.1 0.9
3.5
0.8
Н Н В НЕ I У II
Н Б
I I
о.б 0.5 1.3
3.5
2.1 0.9
3.5
0.8
ЫН19
НН6
НН4
ЕН7
Рис. 3. Рекомбинантные клоны тша ЕН4, содержащие фрагменты ДНК, отличающиеся по первичной структуре от функционального гена р-субъедашицы Ка+ .К^-АТФазы человека. (А) Схема перекрывания клонов. (Б) Рострлктша карты. Обозначения такие же, как на рис. 2-
второго экзонов гена ß-субъединицы, а также то, что гомологичные кДНК области (первичная структура которых была определена) BareHI-EcoRI -фрагмента (5,2 т.п.о.) клона ШфНН7 содержат последовательности пятого и шестого экзонов гена. Это также укрепило предположение о том, что клон ЛККрМН10-1 (EcoRI-фрагмент, 1,9 т.п.о. и ЕсоН1-Е1пс11П-фрагм9нт, 0,2 т.п.о.) должен содержать центральную часть гена р-субъединицы Ыа+,К+-АТФазы, то есть последовательности третьего и четвертого экзонов. Такое предположение основано на данных о перекрывании клонов ANKßMHI2 и ЛЖрмН10-1 (рис. 2). Таким образом, было сделано заключение, что клоны типа RH11 содержат фрагменты гена р-субъединицы Ка+,К+-АТФазы человека.
Анализ первичной структуры Hlndlll-BamHI-фрагментов (0,5 т.п.о.) клонов МЖрШ4 и ÄNKßHH7, отнесенных к типу RH4 (рис. 3), показал, что их нуклеотиднне последовательности гомологичны последовательности кДНК (зрелой мРНК) р-субъединицы Na+,K+-AT-5a3H человека, однако в отличие от клонов типа RH11 лишены интронов. Наличие кодонов терминации трансляции в рамка считывания и многочисленных мутаций свидетельствовало об утрате данными последовательностями функции кодирования этого белка. На основе таких предварительных данных было сделано предположение о том, что клоны ÄMßRH4 и ШСрНБ7 содержали последовательности псевдогена р-субъединицы Na+,K+-AT5a3H человека.
3. Анализ первичной структур! псевдогена р-субъединицы Ыа+,К+-АГФазы человека.
3.1. Нуклеотиднне последовательности фрагментов геномной ДНК человека, родственные кДНК р-субъединицы Na+, К^-АТФазы.
Стратегия секвенирования ра с трикциошшх фрагментов клонов AKKßRH4 и АЖрНН7, гибридизупцихся с кДНК р-субъединицы • Na+,K+-AT®a3H из почек • свиньи, представлена на рис. 4. При получении фрагментов для клонирования с целью их последующего секвенирования кромв рестриктаз использовали метод делеций экзонуклеазой Ва131.
Таким образом, была определена первичная структура Sall-BamHI-фрагмента (1912 п.о.) клона ИйфНН4 и ВатН1-ЕсоН1-фрагмента (2438 п. о.) клона ANKßEHT. Нуклэотидная последовательность Sall-BamHI-фрагмента клона ШфШ4 была обозначена ATP1BL1, а нуклеотидная последовательность BamHI-EcoRI-фрагмента клона XNKßRH7 - ATP1BL2. Первичная структура участка ДНК, находящегося с 3'-конца от SalI-BamHI-фрагмента клона ХЖрВН4, не определена.
300 600 ооо 1200 1500 1800 2100 2400 2тс0 зооо п.о.
Т
Т
т
а а 3 11а и и о
I I I
I I
- - ШфНЕ4
о
р. и а 3 н л айняя
з в ltss 1 г г
а л и у а а и а а аа
I Н I В I I I I III II Е
- - ШфВН7
Рис. 4. Стратегия сзхсвеяирования рестрикционных фрагментов рэкомбинантных кконов, содержащих последовательности псевдогена р-субъединицы -АТФазы человека. Указаны сайты узнавания
только тех расхриктаз, которые использовались для переклонирования зз фаговый вектор. Стрелками указаны направление саквенироваяия и длина последовательности, определенной в случаэ
каждого субклона М13. - —------- участки последовательности
субклонов, получзнных методом делэцкй экзонуклэазой Ва131. Остальные обозначения такие на, как на рис. 2.
Нуклеотиднке последовательности ATP1 ВЫ к ATP1BL2 представлены на рис. 5 и б.
Обо последовательности, ATP1BL1 и ATP1BI2, внсокогомологичкы друг другу, величина гомологии составляет 99,2%, а их гомология с кДНК р-субъединицы Na+ -АТФазы человека из клеток HeLa* составляет 89.8%. Данные последовательности лишены интронов. Анализ первичной структуры последовательностей ATP1BL1 и ATP1BL2 и сравнение их со структурой кДНК ß-субъединицы из клеток HeLa позволил выявить в составе этих последовательностей области, соответствующие 5'- и 3'-некодируюцим областям и кодирующему району мРНК р-субъединицы Иа+,К+-АТФазы человека.
3.2. Участки последовательностей ATP1BL1 и ATP1BL2, соответствующие кодирующему району мРНК.
Схема расположения последовательностей ATP1BL1 и ATP1BL2 относительно кДНК р-субъединицы Na+,К1"-АТФазы человека из клеток HeLa представлена на рис. 7. Последовательность ATP1BL2 содержит область размером 915 п.о. которая соответствует кодирующему району мРНК (кДНК) р-субъединицы Na+,^-АТФазы. Данная область ограничена тринуклеотидами ATG (положение 137) и TGA (положение 1049), соответствующими кодонам инициации и терминации трансляции. У ATP1BL1 размер соответствующего участка составляет 887 п.о. Тринуклеотид АТС, соответствующими кодону инициации трансляции, находится в положении 1028.
Гомологии последовательностей кДНК, ATP1BL1 и ATP1BI2 в области, соответствующей кодирующему району мРНК, приведены в таблице 1. В данном районе последовательности АТР1BL1 и АТР1BL2 отличаются не только от кДНК, но и дат от друга. Характеристика .различий ATP1BL1 и ATP1BL2 в данной области (положения 210, 311, 338 , 367 , 854 , 905 , 920; координаты :сДНК) дана в таблице 2 •..(раздел 3.6).
3.3. Участки последовательностей ATP1BL1 и ATP1BL2, соответствующие 5'-некодирующему району мРНК.
Область ATP1BL1, соответствующая 5'-некодирующему району мРНК, представлена полностью. Точка нарушения гомологии между последовательностью гена [Lane et.al., 1989] и AIP1BL1 находится
* При расчете гомологии брали участки последовательностей АТР1ВЪ1 и АТР1В12, соответствущие участку кДНК р-субъединицы Иа+,К+-АТФазы человека из клеток НеЬа с 1 по 1008 нуклеотид.
САТСТСАССАСАСТССААСС ТССОССТССТСССТТСААСТ САТТСТССЮССТСАОССТС 60 СССАетАСТТСССАтСАС СТСССТССТАССАТСССССС СТААТТТТТТТТСТАТТТТТ 120 АСТАСАСАТСССООТСАСС АТСТТАСССАССАТССТСТС САТСТССТСАТСТТСТСАТС 180 СТСССТССТТОГССТСТСАА АСКСТСССАтТАСаСАТ САСССАСТССССССАСССАС 240 СТСАСААТАЮТСАААСАА ААТСТСААААТАСТААТТСА МАААССТСАТСТССААТСТ 300 ССТААСАТОТСТТАТАТАСА ТСАТССТССТАААААТАСАТ СТССАССАСАААААОССТТА 360 СТТСОАСАААТТТАТАААСТ ТТОГСААААСАТААСАТАТТ ТАААСССТТТТСАТСАСТАС 420 АТАСТТС С С АСААААТАТТТ СТСАТСАМАССААСТТТСТ ССААМТССТТАМТСТТМ 480 тСТСТТСААССААТАСТА ТСАССИТСААСТТСТССАС ТТААССАСТСАААСАААТАС 540 ААССТСАтТССТСАСТТС ТССТТСТАСАСТССАТТТСА СТССТТТАССАСТгаТАСТС 600 ССДТТТТТТСАССТСАССАТ ТСАДААА!ЕТСАААА2С0ААА ТИТТСТаААТААСААСАСС 660 САССТСТСААССАСТАтГ САМСАСТСАОТСССТТАСА АААТТАССТТТТОСТССАС.А Г20 ССГТАТТТтаСТТААГССАг ТСАОТСТААААТТАСАОССС АЛААСАСТССтАЛТАСАА Т80 ААСгаАСТСТССКТСААСТ САТТОЮААСАСТАСАТЛСАТ ТАТТТСААТСАААаТААТСТ 840 САСТСАСОТтТСТАСТТС ССАТССТСТТААААСТТТАА САСААССАСТСАСАТССССА 900 СТСССАСТССТСТОТССТСТ СТССССАСАСССАССОСАСА САСААТСАС-СААСАССТСАС 560 АСААСАСиАССССТОССССС ААСССССССАСССТТОССАС ТСОСССАОСТССТСАСС'ГСС 102С ТаТТСОСАТСАССТС-САСОА ААОССААТСАССАССССАОТ ТССААСЛААТТСТТСТССАА 108С СТСАСАСААСААССАС-Тет ТАСССАООАССССТСЙСАОТ ТССТТТААСАТСАТТСТАТТ 114С СТАСАТААТАТИТАТСИСТ СССТСАСтеССАТСЕГСАТС ССААТОАТССААСТССТССТ 120С ССТСАССАЮАОТОААТТТА ААСССАСАТАТСАСЛАСССС АТАТСАООАСОССАССАССА 126С ТТААСАСАСАТТАСТСАСАТ ССАССАСАСтеАААТТСССТ ТТСАТССТААТСАТСССААС 132С САСТСТСАСССАТАТСТССТ СААСОТАСТТАССТ-ГССТСС АШСПСАААЪАТТСАССО 138С САСААОСАТСАСАТСгАТТТТ ТСААААТТСТСАСААТСТСС ССАСТСААСССАААСААССА 144С СОАСАСТТТААТСААСААТС АССТСАСССААЛСетСЮСА САТТСААССтАСТСССТС 150С ССАААТТССТСТССАтАА Т'иАСААААСТТАСАССТАСС ААСАОООСАМССАСАТСТТ 156С АТТАТАААССТСААСЮАСТ ТСТАСССТТСАААССТААСТ СТССССАСААТСАОТССТТС 162С САСАСТТАСССАОТСАТСАА МАТААСССАТСТСТСТГТС СТетТОАСТССАСТСССТАО 168С СААСАТСААОАТААССАТАА АААТАСАААТСТССАСТАТ'Т ТТССАСТССССАССТАССТТ 1Т4С ССТТТТССТСТССАСААТТА ТСССГАСТАТСССАААСТСС ТССАОСССАААТАССТССАС 180С ССТСТС-СТТССТСТАСАСТТ САССАСССТТАССАТСОАСА СТСАААТТССССТАСТОТАА 186С АССАСАТСйТСАСААСАТТС СССАСАСТСАСАААОАТССТ ТТТОАСССАТСС 1512
Рис. 5. Нукдеотадная последовательность АТР1ВЫ, . обладающа? признаками процессированного псевдогена р-субъедишщы Ка+,К+-АТФазь человека.
GGATCCGCAGTGGCAGTGGT GTGTCCIGTCTGCGGAGAGC CAGGCCAGAGACAATGAGCA 60 ACACCTCAGAGAACACGAGG GCGTGCCCGAAGCCACCCAC CCTTCCGACTGCGGCAGCTG 120 CTGACCCCCTGTTGCCATGA CCTGCAGGAAAGCCAATCAG GAGGGCAGTTGGAAGAAATT 180 CTTCTGGAACTCAGAGAAGA AGGAGTTTTTAGGCAGGACT GGTGGCAGTTGCTTTAAGAT 240 CATTCTATTCTACATAATAT TTTATGGCTGCCTGACTGGC ATCTTCATCGGAATGATCCA 300 AGTGGTGCTGCTCACCATCA TGAATTTAAACCCACATATG AGAACCACATATCAGGACCC 360 CACCAGGATTAACACAGATT TCTCAGATCCACCAGACTGA AATTGCCTTTCATCCTAATC 420 ATCCCAAGCACTGTGAGGCA TATGTGCTGAACGTAGTTAG GTTCCTGGAAAAGTACAAAG 480 ATTCAGCCCAGAAGGATGAC ATGATTTTTGAAAATTGTGA CAATGTGCCCAGTGAACCCA 540 AAGAACGAGGAGACTTTAAT CAAGAATGAGGTGAGCGAAA GGTCTGCAGATICAAGCTTG 600 AGTGGCIGGGAAATTGCTCT GGATTAAATGACAAAACTTA CAGCTACGAAGAGGGCAAAC 660 CACATGTTATTATAAAGCTC AAGTGAGTTCTAGGCIICAA ACCTAAGTCTCCCGAGAAIG 720 AGTCCTTGGAGACTTACCCA GTGATGAAGTATAACGCATC TGTGTTTCCTGTTCAGIGCA 780 CTGGCTAGCAAGATGAAGAT AAGGATAAAAATAGAAATGI GGAGTATTTTGGACTGGGCA 840 CCTACCTTGGITTTCCTCTG CAGAATTAATCCCTACTATG GCAAACTCCTGCAGCCCAAA 900 TACCTGCAGCCTCTGCTTGT TGTACAGTTCACCAACCTTA CCATGGACACTGAAATTCGC 960 CTAGTGTAAAGCAGATGGTG AGAACATTGGGCACAGTGAG AAAGATGGTTTTCAGGGАТС 1020 CTTTGATGTAAAAATTGAAG TTAAGAGCTGATCACAAGCA CAAATCITTCCCGCTAGCCA 1080 TTTAATAAGTTTAAAAAAAG ATACAAAAGCCTGITAGTCT TGAACAAACTGTCATATCTA 1140 TGGGACCTACACTTAAAGCA TAATCTATATGCTTTACACT TGCTTTCTGCATTTAATTGG 1200 TTAGAATGTAATTAATGTAA ACTAAAGTGTAGCAATAGCA ACAAAATATTCTACTGTAAA 1260 TGACAAAAGAAAAATTGAGC CTTGGGATGTGCCTCATTTT TACTGCAAATTATGATTCCA 1320 TAAGTGACCTTGTAAGCAGT GTTTCTGGCCCCTAAGTATT GGCCTCCTATATTTTATTTA 1380 ATGTATAGTACTATAGGTGC ATACTCTGGTCCTTTTTCAA GCCATGTGTTATCGTATGTG 1440 TTTTGTACXTTATGTGAGCA GGTTTTGCTGTCCAAGGTGT AAATATTCAACGGTACTTCG 1500 AATGGGAATGAAACTGGCAT GGTCTTTTTTTTTTTTTTTT TTGGGCTCTTTCAAAGATAA 1560 TGGCCCATCA4TGAGCATCT TTAACATATTCTATAGTCTT TTCCTGTGGTGTTAGGTCTT 1620 AGTTTATTATTATTTTTTGT CGTGGGAATGGGACAGGGAT TTGTCATGGGGGAACTGCCG 1680 TTTAAATTTTAAGTGACACT ACAGAAAAACACAAAAAGGT GATGGGTTGTGTTGTGCTTG 1740 rTTTGAATGCTGTCTTGACA TCTCTTCCCTTGTCCTCTAG TATGTTCTAAAGCTGTGTCT 1800 SAGATCTGGATTTGCCCATC ACTTTGGCTAGTGACAGGCC TAATAAATTTGCTTIGTACA 1860 ГТТТСТТТТАСТТТССТТТТ TTCCTTTCTGGGGGGATCAT GCTGATGGCTGTGTCTTTAT 1920 1AGTGTTTTAACCATTTTCA TGGTGGAAGAATTTTTTATT TATGCAGTTGTACAGTTTTA 1980 TTTTTTTCTGCAAGAAAAAG TGTAGTGTATGAAATAAACC ACAGTCACTTGTTTGAAAAT 2040 UATCTTTATTTTGAACTTT ATACAAAGCAATGCAGTACT CCATAGACTGGTGTAAAATG 2100 PTTTGTACTATGCAAAGTCC ATGTTCTAATAATTGCCAGG AGTACAGTGCTCTTGTTGAT 2160 3ATGTATTCAGTCAAGTTAA AACAATGGACAATAAAAGAA TGAATACATGAAAAAAAAAA 2220 LACAGAAGACATCTGCAGCA GATATATTITCCAAGCCCAA CCTATAGTTCCAGAAGTGTT 2280 ?TTCAGATTTCCATGCAAGT GCAGAGGAAATTTACATATT TCAAAAICCATTAAATAGIG 2340 ¡AGTTGAGCAGCTTTCTCCT GACTTCAATTCGAAGTGATT AGTCGTCAATGTAAGAAGAT 2400 ICTAAAAGGCAAATATCAAC AAGAATTTCATAGAATTC 2438
Рис. 6. Нуклеотидная последовательность ATP1BL2, обладающая ризнаками процессировэнного псевдогена р-субьединицы иа+,К+-АТФазы человека.
ATG (127) ТСЛ(ЮЗС) КДНК —I-1-
ATG (1028)
ATP1 ВЫ ->-
ATG(13T) TGA(1049) ATP1BI2 —1-1-
Рис. 7. Схема расположения последовательностей ATP1BL1 и ATP1BI2 относительно кДНК р-субъединицы Na+,К*"-АТФазы человека из клеток Hela.
Таблица 1. Сравнение последовательностей ATP1BL1, АТР1В12 и кДНК р-субъединицы Ка+ .íf-АТФазы человека из клеток Hela*.
Область структуры Гомология с кДНК AIP1BL1 ATP1BL2 Гомология АТР1В11 и ATP1BL2
Кодирующая . 90,2% 89,8% 99,2%
5'-кекодирующая 59,5% 61 ,7% 97,1%
3' -нскодируицая — 85,9% —
в положении -142 (рис. 8 (А>). По данным lane et.al. [1989] ген р-субъединицы Ка+,К*"-АТФазн человека имеет несколько точек инициации транскрипции, ближайшая к 5'-концу находится на расстоянии 370 п.о. от точки нарушения гомологии с АТР1В11. Длина участка АТР1ВЫ 'от первого нуклоотида до точки нарушения гомологии с геном составляет 886 п.о.
Точка нарушения гомологии между последовательностью гена и ATP1BI1 соответствует одному из минорных сайтов инициации транскрипции гена р-субъединицы, находящемуся в положении -142 [lane et.al., 1989]. На основании этого можно предположить, что инициация транскрюта-прэдшествешика АТР1В11 произошла именно в этой точке.
АТР1В11 содержит фрагмент геномной ДНК (886 п.о.), фланкирующий с 5'-конца последовательность, гомологичную кДНК р-субъединицы. В его составе не обнаружено участков, которые соответствуют консенсусу промоторов эукариотических генов.
* АТР1В11 не содержит область, соответствующую З'-некодирумцему району кДНК.
(Л)
р ТССТССТССТСССТТСССТССТССССССССССТСТС—ССАСТСССАСАСССССАССССС
I I II II III I I II ИМИ III ШШ III
ВЫ ТТТАТСТАСТТСССАТССТСТТАААА-СТТТААСАСААОСАСТС—АОАТССССАСТССС л849 _ а
т-120
Р АССССССССТССТСССТССАСАСАСССАССССССАСААССССАССССССС--АСАСвАС
II II I ИМИ ]||| ПИППМН III! III! I I ММ II ВЫ АСТОСТСТСТССТСТСТССССАСАСССАССССАСАСАСААТСАССААСАССТСАСАСААС
л909 7-63
Р СССАСССССССССССССАСССАСССАСССТССССАСССССССАССТССТОАССССССАТС
I III II II II ММ ММММ I III ММММММММ II I
ВЫ ДССАСС-ССТСССОССААСССССССАСССТТССОАСТСССССАССТССТСАССТСОТСТТ
л969
Р (ЗССАТС
МММ
ВЫ СССАТй
л1 029
(В)
т8135 т8153
р ААТААААСААТСААСАСАТТССТ--------:-------СОТСЮТ---САТТСАСТСТ
ШМММШИ ММ I I II III I I
ВЬ2 ААТААААОААТСААТАСАТСААААААААААААСАСААСАСАТСТССАОСАСАТАТА--Т
л2190 Ж
т8195
Р ТСТСТАААТОТСССААССТСТйАСТТСТТТАСТТТССАСАССАСТААТТАТССААСАТСТ
I II II ММММ I 11111 I II II II ММ I
Б1г ТТТССААС---ССОААССГАТАС---------ТТССАСА—АСТСТПТТС—АСАТТТ
^гглг
78255
Р ТСААС-ААСТАТТСААС
I I ММ II ВЬ2 ССАТССААСТССАСАОО "2290
Рис. 8. Сравнеыиэ последовательностей АТР1ВХ1 и АТР1В12 со структурой гена р-субъединицы На+,К+-АТФазы человека. Обозначения: ж - точки нарушения гомологии с последовательностью гена. Пунктиром показано отсутствие нуклеотидов в соответствующих положениях, вертикальными линиями - совпадение структуры. Гептануклеотида, которые могут быть короткими прямыми повторами, подчеркнуты. (А) Выравнивание АГР1ВЫ (ВЫ) и 5'-концевой области гена (р). (Б) Выравнивание АТР1В1г (ВЬ2) и З'-кошювой области гена (р).
Сравнение структуры 5'-концевой области ATP1BL1 с последовательностями ДНК приматов банка GeneBank с целью обнаружения гомологии с какой-либо кодирующей белок последовательностью дало отрицательный результат. Участок последовательности АТР1ВЫ, ограниченный положениями 79 и 315 обладает 34" гомологией с консенсусной последовательностью Alu-повтора [Britten et.al., 19883.
Область ATP1BL2, соответствующая 5'-концевому некодирующему району мРНК имеет размер 136 п.о. и на всем протяжешш сохраняет гомологию с последовательностью гена. В данном районе последовательности ATP1BL1 и ATP1BI2 отличаются не только от кДНК, но и друг от друга. Характеристика различий ATP1BL1 и ATP1BL2 в данной области (положения 71, 79, 85, 117; координаты кДНК) дана в таблице 3 (раздел 3.6).
3.4. Область ATP1BL2, соответствующая 3'-некодирующему району мРНК.
Последовательность ATP1BL2 содержит область размером 1171 п. о., соответствующую 3'-некодирующему району мРНК
ß-субъедюощы, а также участок геномной ДНК (216 н.п.), фланкирующий эту область с 3'-конца. В области, гомологичной кДНК, выявлен пентануклеотид ААТААА, соответствующий консенсусу сигнала полиаденилирования и встречающийся в четырех положениях (1842 , 2013 , 2038 , 2191), через 14 п.о. после последнего из которых расположен поли-(А)-участок из 12 п.о. Четыре сигнала полиаденилирования имеются в З'-некодирущих областях гена и кДНК ß-субъединицы Ка+,К+-АТФазы. Данная область ATP1BL2 насыщена мутациями (раздел 3.5), ее гомология с соответствующим районом кДНК составляет 85,9%. Точка нарушения гомологии между геном [Lane et.al., 1989] и ATP1BL2 находится в положении 8153 (рис. 8, (Б)).
3.5. Две последовательности с признаками процессированных псевдогенов.
Вопрос об экспрессии ATP1BL1 и ATP1BI2 на уровне РНК не ясен. В 5'-концевой части ATP1BL1 не найдено последовательностей соответствующих консенсусу промоторов РНК-полимеразы II. Область ATP1BL2, соответствующая 5*-концевому некодирующему району мРНК имеет размер 136 п.о. и превышает размер данного района кДНК всего на 10 п.о. Однако не исключено, что промотор, способный обеспечить транскрипцию ATP1BL1 и (или) ATP1BL2, может находиться в составе фрагментов геномной ДНК, прилегающих с 5'-фланга к ATP1BL1 и ATP1BL2.
Обе последовательности, ATP1 ВЫ и ATP1BL2, насыщены мутациями в районе, соответствующем кэдирущей области мРНК, и поэтому не способны обеспечить синтез полипептида р-субъединицы. На рис. 9 представлено выравнивание последовательностей кДНК р-субъединицы Иа+,К+-АТФазы человека из клеток HeLa, ATP1BL1 и ATP1BL2.
Сравнение ATP1BL1 с кДНК р-субъединицы На+.К1"-АТФазы человека возможно лишь на участке от 1-го до 1008-го нуклеотида кДНК из-за отсутствия данных о последовательности, являющейся продолжением АТР1В11 с 3'-конца. При таком сравнении (рис. 9) было выявлено 128 нуклеотидных замен (73 транзита и 55 трансверсий), из них 83 замены (55 транзиций и 28 трансверсий) расположены в районе АТР1ВЫ, соответствующем кодирующей области мРНК (кЛНК) р-субъединицы. В сравниваемой области АТР1ВЫ выявлено 9 инсераий и 3 делеции пары оснований. Из 9 инсерций 5 - инсеции одного нуклеотида, 3 - инсерции двух нуклеотидов и одна инсерция четырех нуклеотидов. В области АТР1ВЫ, '-соответствующей кодирующей области мРКК (кДНК) выявлено две инсерции (инсерция одного нуклеотида и инсерция четырех нуклеотидов), а также две делеции пары оснований.
При длине сравниваеггых участков 2200 н.п. между АТР1В12 и кДНК выявлено 208 нуклеотидных замен (114 транзиций и 94 трансверсии), 85 из них (57 транзиций и 28 трансверсий) расположеш в районе ATP1BL2, соответствующем кодирующей области мРНК (кДНК). Кроме замен, имеются инсерции и делеции. В области ATP1BL2, соответствующей кодирующей области мРНК имеется 3 инсерции (две инсершш одного нуклеотида и одна инсерция четырех нуклеотидов). В этой не области выявлено три делеции пары оснований. Всего идентифицировано 16 инсерций, 8 из них - инсерции одного нуклеотида, 4 - двух, 2 - четырех, 1 - семи и 1 - девяти ■нуклеотидов. Из 12 выявленных делеций Б - делеции одной пары оснований, 2 - делеции двух пар оснований и по одной делеции "трех, четырех, пяти, шести и девяти пар оснований.
Ряд особенностей структуры ATP1BL1 и ATP1BI2 позволили сделать вывод о тем, что обе последовательности обладают признаками проиессированных псевдогенов.
Во-первых, обе последовательности имеют терминирующие кодоны в трансляционной рамке считывания для полипептида 6-субъедпницы На+,К+-АТФазы. В последовательности АТР1ВЫ обнаружено 10 стоп-кодонов, а в последовательности ATP1BL2 - 20 стоп-кодонов (рис. 9), не включая тринуклэотид TGA, соответствующий кодону тормипации трансляции функционального гона р-субъединицы. Причиной П0ЯВЛЭ1П1Я стоп-ксдонов, Еероятпо, являются делэции,
ß gaATtC-atGotaaAtTGcTG-G—aaGgCTGCGtctctgCtG—tgGtGtCAgTtoogg 54 BL1 agATcCgcaGtggcAgTGgTGtGtcctGtCTGCGgagagcCaGgccaGaGaCAaTgagca 951 BL2 ggATcCgcaGtggcAgTGgTGtGtcctGtCTGCGgagagcCaGgccaGaGaCAaTgagca 60
ß AtgCCTCAtcG-cCAgG—GGCGcGCCgC—AGCCaCCCACCCTcCgGACcGCGGCAGCT 109 ВЫ AcaCCTCAgaGaaCAcGs-GGCGtGCCgCgaAGCCgCCCACCCTtCcGACtGCGGCAGCT 1010 BL2 AcaCCTCAgaGaaCAcGagGGCGtGCC-CgaAGCCaCCGACCCTtCcGACtGCGGCAGCT 119
AAA
ß GCTGACCcGCcaTcGCCATCgCCcGCgGGAAAGCCAAgGAGGAGGGCAGcTGGAAGAAAT 169 ВЫ GCTGACCtGCtgTtGCCATGaCCtGCaGGAAAGCCAAtGAGGAGGGCAGtTGGAAGAAAT 1070 BL2 GCTGACCcGCtgTtGCCATGaCGtGCaGGAAAGCCAAtGAGGAGGGCAGtTGGAAGAAAT 179
А
ß TCaTCTGGAACTCAGÂGAAGAAGGAGTTTcTgGGCAGGACcGGTGGCAGTÎGGTTTAAGA 229 BL1 TCtTCTGGAACTCAGAGAAGAAGGAGTTTtTaGGCAGGACQGGTGGCAGITGGTTTAAGA 1130 BL2 TCtTCTGGAACTCAGAGAAGAAGGAGTTTtTaGGCAGGACtGGTGGCAGTTGGTraAÁGA 239
А
ß TCcTTCTATTCTACgTAATATTTTATGGCTGCCTGgCTGGCATCTTCATCGGAAccATCC 289 BL1 TCaTTCTATTCTACaTAATATTITATGGCTGCCTGaCTGGCATCTTCATCGGAAtgATCC 1190 BL2 TCaTTCTATTCTACaTAATATTTTATGGCTGCCTGaCTGGCATCTTCATCGGAAtgATCC 299
v341
ß AAGTGaTGCTGCTCACCATCAgTGAAÏTTAAgCCCACATATCAGgACCgagT----GG-C 344
ВЫ AAGTGgrGCTGCTCACCATCAgTGAATTTAAaCCCACATATCAGaACCgcaTatçaGGaC 1250 BL2 AAGTGgIGCTGCTOACCATCA-TGAATTTAAaCCCACATATCAGaACGacaTatcaGGaG 358
A A
ß CCCgCCAGGATTAACACAGATTcCTCAGATCCAGaAGACTGAAATTtCCTTTCgTCCTAA 404 BL1 CCCaCCAGGATTAACACAGATTaCTCAGATCCAGcAGACTGAAATTgCCTTTCaTCCTAA 1310 BI2 CCCaCOAGGATTMCACAGATTtCTGAGATCCAGcAGACTGAAATTgCCTTTCaTCCTAA 418
А
ß TGATCCCAAGagCTaTGAGGCATATGTaCTGAACaTAGTTAGGTTCCTGGAAAAGTACAA 464 BL1 TGATCCCMGcaCTgTGAGGCATATGTgCTGAACgTAGTTAGGTTGGTGGAAAAGTACAA 1370 BI2 TGATCCCAAGcaOTgTGAGGCATATGTgCTGÄACgTAGTTAGGTTCCIGGAAAAGTACAA 478
ß AGATTCAGCCGAGAgGGATGACATGATTTTTGAAgATTGTGgGgATGTGGGCAGTGAACC 524 ВЫ AGATTCAGCCCAGAaGGATGACATGATTTTTGAAaAITGTGaCaATGTGCCCAGTGAACC 1430 BL2 AGATTGAGCCCAGAaGGATGACATGATTTTTGAAaATIGTGaCaATGTGGCCAGTGAACC 538
ß gAAAGAACGAGGAGACTTTAATCAtGAAcGAGGaGAGCGAAAGGTCTGCAGATTOAAGCT 584 BL1 cAAAGAACGAGGAGACTTTAATCAaGAAtGAGGtGAGCGAAAGGTCTGCAGATTCAAGCT 1490 BL2 cAAAGAACGAGGAGACTTTAATCAaGAAtGAGGtGAGCGAAAGGTCTGOAGATTCAAGCT 598
ß TGAaTGGCTGGGAAATTGCTCTGGATTAAATGAtgAAACTTAtgGCTACaAAGAGGGCAA 644 ВЫ TGAgTGGCTGGGAMTTGKtCTGGATTAAATGAcaAAACrTAcaGCTACgAAGAGGGGAA 1550 BI2 TGAgTGGGTGGGAMTTGCTCTGGArTAAATGAcaAAACTTAcaGCTACgAAGAGGGCAA 658
ß ACCgtgcaTTAITATAAAGCTCMccGAGTTCTAGGCTTCAAACCTAAGcCTCCCaAGAA 704 ВЫ ACCacatRTTATTATAAAGCTCAAfitGAGTICrAGGCraCAAACCTAAGtCTCCCRAGAA 1610 BL2 ACCacatgTTAmTAAAGCTCAAgtGAGTTCrAGGCnCAAAGCTMGtCTCGCgAGAA 718
P TGAGTCCTTGGAGACTTACCCAGIGATGAAGIATAACcCAaaTGTccTTCCcGTTCAGTG 764 BL1 TGAGTCCTTGGAGACTTACCCAGTGATGAAGTATAACgCAtcTGTgtTTCCiGTTCAGTG 1670 BIS TGAGTCCTTGGAGACTTACCCAGTGATGAAGTATMCgCAtcTGTgtTICCtGTTCAGTG 778
ß CACTGGCaAGCgAGATGAAGATAAGGATAAAgtTgGAAATGTGGAGTATTTTGGACTGGG 824 ВЫ CACTGGCtAGCaAGATGAAGATAAGGATAAÁaaTaGAAATGTGGAGTATTTTGGACTGGG 1730 BL2 CACTGGCtAGCaAGATGAAGATAAGGATAAAaaTaGAAAIGTGGAGTAraTTGGACTGGG 838
ß CAaCTcCCcTGGTTTTCCTCTGCAGtATT-ATCCgTACTAIGGCAAACTCCTGCAGCCCA 883
ВЫ CAcCTaCCtTGGTTTTCCTGTGCAGaATI-ATCCcTACTATGGCAAACTCCTGCAGCCCA 1789
BI2 CAcGTaCCtTGGTTTTCCTCTGCAGaATTaATOCcTACTATGGCAAACTCCTGCAGCCCA 898
ж
P AATACCTGCAGCCcCTGCTgGccGTACAGTTCACCAatCTTACCATGGACACTGAAATTC 943
ВЫ AATACCTGCAGCCtCTGCTtGctGTACAGrTCACCAgcCTTACCATGGACACTGAAATTC 1849
BL2 AATACCTGCAGCCtCTGCTtGttGTACAGTTCACCAacCTTACCATGGACACTGAAATTC 958
ж ж
p GCaTagAGTGTAAgGCgtAcGGTGAGAACATTGGGtACAGTGAGAAAGAccGTTTTCAGG 1003 ВЫ GCcT—AGTCTAAaGCagAtGGTGAGAACATTGGGcACACTGAGAAAGAtflGTTTTCAGG 1907 BI2 GCcT—AGTGTMaGCagAtGGTGAGAACATTGGGcACAGTGAGAAAGAtgGTTTTCAGG 1016
ß GAcgt 1008 BL1 GAtcc 1912 BL2 GAtcc 1021
Рис. 9. Множественное выравнивание нуклеотидных последовательностей кДКК ß-субъединипд Na+-АТФазы человека из клеток HeLa (ß), ATP1BL1 (ВЫ) и ATP1BL2 (BI2). Последовательность яуклэотидов в местах отсутствия гомологии с кДНК из клеток Hela приводится строчными буквами. Обозначения: ATG - тркнуклеотид, соответствующий кодону инициации трансляции функционального гена, atea - инсерция 4 нуклеотидов, общая для ATP1BL1 л ATP1BL2. Стоп-кодоны подчеркнуты пунктиром. Стрелками указаны нуклэотида, представляющие отличия мазду ATP1BL1 и ATP1BL2.
инсерции и нуклеотидаые замены.
Во-вторых, у оОеих последовательностей отсутствуют интроны, имеющиеся у функционального гена р-субъединицы. Сравнение нуклеотидных последовательностей хромосомного фрагмента гена (З-субъединицы Na+.^-АТФазы человека и ATP1BL1 (рис. 8, (А)) показало, что гомология между ATP1BL1 и геном исчезает в точке, соответствующей началу транскрипта, который считывается с функционального гена (положение -14-2, координаты гена). В случае ATP1BI2 подобное сравнение проводили только для 3'-концевых областей, так как длина 5'-концевой области ATP1BL2 оказалась недостаточной. Сравнение 3'-концевых областей функционального гена и ATP1BL2 (рис. 8, (Б)) показало, что значимая гомология между геном и ATP1BL2 исчезает в точке, соответствующей концу транскрипта, считываемого с функционального гена (положение 8153, координаты гена) и расположенной непосредственно перед поли-(А)-участком ATP1BL2.
В-третьих, в последовательности ATP1BL2, непосредственно с З'-конца от точки, где исчезает значимая гомология между геном и ATP1BL2, расположен поли-(А)-участок длиной 12 н.п. (положение 2210).
Таким образом, указанные особенности структуры ATP1BL1 и ATP1BL2 могут свидетельствовать об участии зрелой мРНК р-субъединицы Na+.К^-АТФазы человека в образовании данных последовательностей. Насыщенность ATP1BL1 и ATP1BL2 мутациями, препятствующими экспрессии, и родственность мРНК позволяют сделать вывод о том, что данные последовательности представляют собой процессированный псевдоген (или псевдогены) р-субъединицы Na+,К+-АТФазы человека.
Короткие прямые повторы, фланкирующие процессированнне псевдогены, богаты адениновыми нуклеотидами и располагаются непосредственно с 5'-конца и З'-конца от точек нарушения гомологии между геном и псевдогеном. Соответствующие области ATP1BL1 и ATP1BI2 были проанализированы с целью выявления прямых повторов. В положении 679 ATP1BL1 и положении 2220 ATP1BL2 (рис. 8) расположены гептануклеотиды ААСАСАА и AACAGAA. Ввиду отсутствия данных о последовательностях, являющихся продолжением ATP1BL1 с З'-конца и AIP1BL2 с 5'-конца, можно лишь предполагать, что обнаруженные гептануклеотидные блоки выполняют роль прямых повторов.
3.6. Сравнение последовательностей ATP1BL1 и ATP1BI2.
У последовательностей ATP1BL1 и ATP1BI2 при сравнении с кЦНК
р-субъединицы 1Та+,К4"-АТФазы человека из клеток НеЪа выявлен ряд общих особенностей. Это правде всего сходное распределение нуклеотидннх замен по длине последовательностей (рис. 10), одинаковые в большинстве случаев положение и характер замен, делеций и инсерций. Из последних необходимо отметить инсерцкю четырех нуклеотидов (между 341 и 342 нуклеотидами; координаты кДНК р-субъединицы), наличие которой является достаточным условием для сбоя трансляционной рамки считывания полипептида р-субъеданицы Иа+.К^-АТФазы (рис. 9). Однако последовательности АТР1ВЫ и АТР1В12 не идентичны. Между АТР1В11 и АТР1В12 имеется 11 отличий, которые охарактеризованы в таблице 2, а на рис. 9 показаны стрелками.
Таблица 2. Отличия последовательностей АТР1ВЫ и ATP1BL2, выявленные при выравнивании с кДНК р-субъединицы Na+,К+-АТФазы человека из клеток Hela tKawakami et.al.,1985].
Координаты кДНК р-субъединицы ATP1BI1 ATP1BI2 кДНК .
70-71 А, инсерция AG , инсерция _
79 G ~ 1 делеция гл u
85 G, замена А А
117 т. замена С С
210 С т, замена С
311 G ~ 1 делеция " G
338 G А, замена G
367 А, замена т, замена С
854 - А, инсерция -
905 С Т. замена С
920 ч G, замена А А
Четыре отличия (инсерция одного нуклеотида, одна делеция пары оснований и две нуклеотидных замены) расположены в 5'-сторону от АТС кодона. Еще четыре отличия (одна делеция пары оснований и три нуклеотидных замены), расположены в области, соответствующей первому, второму и третьему экзонвм функционального гена р-субъединицы. Последовательности АТР1 ВЫ и АТР1В12 не отличаются в области, ограниченной положениями 321 и 912 (координаты АТР1В12). Данная "консервативная" область исследуемых последовательностей соответствует экзонам функционального гена,
Число замен
Рис. 10. Распределение нуклеотидных замен в последовательностях АТР1ВЫ (А) и АТР1В12 (Б) при сравнении с кДНК р-субъединицы Ма+,К+-АТФазы человека из клеток НеЬа. Точками отмечено количество замен на каждые 20 нуклеотидов кодирующей области кДНК.
содержащим информации об аминокислотной последовательности структурных доменов р-субъединицы, расположенных с наружной стороны плазматической мембраны. Интэрасно отметить, что имеющаяся у обеих последовательностей инсерция 4 нуклеоткдов расположена в области, соответствующей второму экзону функционального гена. Второй экзон гена р-субъедикицы содержит информацию об аминокислотной последовательности трансмембранного домена белковой молекулы. Три отличия (инсерция одного нуклеотида и две нуклеотидных замены), имеется между последовательностями AIP1BL1 и ATP1BL2 в области, ^соответствующей участку шестого экзона, кодирующего С-концевую часть р-субъединицы.
4. Гипотеза о происхождении АТР1ВЫ и ATP1BL2.
Черты сходства первичной структуры АТР1ВЫ и ATP1BL2, такие как сходное распределение нуклеотидных замен по длине последовательностей (рис. 10), наличие одинаковой инсерции 4 п.о., сходство рестрикных карт клонов AJJXPRH7 и ШфЕН4, содержащих последовательности ATP1BI1 и ATP1BL2, можэт указывать на общее происхождение данных последовательностей. Отмеченные черты сходства и различия могут быть объяснены как аллельностью ATP1BL1 и ATP1BL2, так и существованием в геноме человека не менее двух процессированных псовдогенов р-субъединицы Иа+,К+-АТФззы, имеющих общую эволюционную историю.
В случае аллэльности АТР1ВЫ и ATP1BL2 можно говорить о наличии в геноме исследованного индивида только одного ретропсевдогена, различающиеся последовательности которого представлены в гомологичных хромосомах, одна из которых получена от отца, а другая от матери.
Однако нельзя исключить возможность существования двух ретропсевдогенов, один из которых является копией другого. Наличие большого числа ретропсевдогенов показано для многих „мультигенных семейств.
Если семейство генов р-субъединицы 1Га+,К+-АТФазы человека содержит не менее двух процессированных псевдогенов, то один из этих псевдогенов мог возникнуть вероятнее всего в результате дупликации фрагмента геномной ДНК (хромосомного локуса), содержащего другой псевдоген. Иначе говоря, матричная РНК, транскрибированная с древнего гена р-субъединицы (или гомологичного ему 'в случае семейства генов) дала начало процессированному псевдогену, например, АТР1ВЫ. Другой псевдоген, например, ATP1BL2, образовался в результате дупликации участка генома, содержащего ATP1BL1. Тогда сходство первичной
структуры, прежде всего одинаковая для последовательностей обоих псевдогенов инсврция 4 п.о., указывает на их родственность, а имеющиеся разлитая между последовательностями АТР1В1И и АТР1В12 возникли уже после такой дупликации.
5. Время образования псевдогена р-субъединицы На+,К''-АТФазы человека.
Время образования и скорость зволхции псевдогена АТР1В12 были рассчитаны на основе множественного выравнивания последовательностей АТР1В12, кДНК р-субъединицы Иа+,К+-АТФазы человека из клеток НеЬа и кДНК р-субъединицы из почек свиньи, используя метод, описанный Ы ег.а1. [19813. Метод заключается в анализе нуклеотидных замен, выявляемых в результате выравнивания. На основании количества замен, выявленных при выравнивании последовательностей псевдогена и гена (кДНК) одного организма (человека), и количества замен, выявленных при выравнивании последовательностей этого же псевдогена и гена (кДНК) другого организма (свиньи) (время дивергенции двух организмов известно), вычислялась скорость эволюции псевдогена и время его образования. Сходные результаты были получены при использовании для выравнивания также последовательностей кДНК р-субъединицы Ыа+,К+-АТФазы ската и крысы. Расчеты показали, что образование ретропозона, обладащего признаками псевдогена р-субъединицы На+,К+-АТФазы человека, произошло около 24 миллионов лет назад. Полученное значение для скорости эволюции псевдогена (3,3x10-9 замен на сайт в год) было использовано для расчета времени расхождения последовательностей АТР1ВЫ и АТР1В12, которое составило около 1 миллиона лет.
- 23 -ВЫВОДЫ
1. В - банке геномной ДНК человека обнаружены два типа последовательностей, гомологичных кДНК- р-субъединицы ?Га+,К+-АТФазы из почек свиньи.
2. Ка основании сравнительного анализа нуклеотидных последовательностей, отнесенных к разным типам, идентифицированы ген и псевдоген из семейства генов р-субъединицы Ка+,К+-АТФазы человека.
3. Проведен анализ нуклеотидных последовательностей фрагментов геномной ДНК, содержащих псевдоген, и выявлены две последовательности с признаками процессированного псэвдогона р-субъединицы На+,К+-АТФазы человека.
4. Оценены скорость эволюции и время образования процессированного псевдогена р-субъединицы На+,К+-АТФазы человека.
Основные результаты диссертационной работы изложены в
следующих публикациях:
1. TJslikaryov Yu.А., lionastyrskaya G.S., Broude N.E., NiklXorova N.N., Bessarab D.A., Orlova M.Yu., Petrukhin K.E., Kodyanov H.N., Sverdlov E.D. Human Na+ .X4"-ATP азе genes, p-subunit gene family contains at least one gene and one pseudogene// FEES
' be«. 1989. V. 257. H. 2. P. 439-442.
2. Ушкарев Ю.А., Монастырская Г.С., Броуде Н.Е., Никифорова Н.Н., Бессараб Д.А., Орлова М.Ю., Петрухин К.Е., Модянов Н.Н., Свердлов Е.Д. Гены Na1" ,КГ-АТФазы человека. Семейство генов и псевдоген р-субъединицы// Докл. АН СССР. 1990. Т. 312. N 2.
' . С. 495-499.
- Бессараб, Дмитрий Александрович
- кандидата биологических наук
- Москва, 1991
- ВАК 03.00.03
- Исследование фосфорилирования Na, К-АТФазы протеинкиназой А
- Na, K-атфаза человека. Семейство генов каталитической субъединицы
- Построение карты генома Mycoplasma gallisepticum
- Исследование механизма сопряжения синтеза АТФ и протонного транспорта АТФ-синтазой из пурпурной бактерии Rhodobacter capsulatus
- Новый ген семейства ион-транспортирущих АТФаз