Бесплатный автореферат и диссертация по биологии на тему
Структура и эволюция гена son человека
ВАК РФ 03.00.03, Молекулярная биология
Автореферат диссертации по теме "Структура и эволюция гена son человека"
.1 Ju > * ••
российская академия наук
ШСТ1ГГУТ МОЛЕКУЛЯРНОЙ БИОЛОГИИ имени S.A. ЭНГЕЛЬГАРДГА
на правах рукописи . УДК 577.212
ШМСКОВСКШ
Валерий Викторович
СТРУКТУРА И ЭБОЛЩИЯ ГЕНА son ЧЕЛОВЕКА
Специальность - 03.00.03 молекулярная биология
Автореферат диссертации на соискание ученой степени кандидата биологических наук
МОСКВА 1992
Работа выполнена в В.А- Эвгелъгардта РАН
Институт© молекулярной биологии иыэни
| I ■
Научный руководитель доктор биологических наук И.М. Чумаков
Официальные оппоненты:
члэн-карреспондеЕТ РАН
| доктор биологических наук _ В.Г. Дебабов
кандидат биологических наук П.Г. Георгиев
, Ведущая организация - Институт биологии гена РАН
С7х
Защита состоится г- в часов
на заседании Специализированного совета Д 002.79.01 при Институте молекулярной биологии РАН по адресу: 117984, Москва, ул. Вавилова, 32
С диссертацией ■ ¡¿окно ознакомиться в библиотеке Института
молекулярной биологии РШ. гу ,
Афтореферат разослан "¿С." /¿¿^и^ 1992 г. ...........
/Ученый-секретарь Социализированного совета канд. хим. наук А.М. Крицын
РОССМ^СКАЯ БИБЛИОТЕКА,
ЯЛРАКТЕП1СТШСА РАБОТЫ
Актуальность проблемы.
Тавдзквые повторы шкрохо предстазлезы в геноме эукариот, б том числе в генсмэ человека. Многие локусы генома, содэряащие тапдэмныэ повтора, являются гнпервариабельныки (варьирует число мономеров таядемных повторов). Частота новообразования аллелей в областях тандемных псзтороэ кокет составлять до нескольких процентов на генерацию, что определяет исключительную роль дупликаций и делений мономеров тандемных повторов в эволяции генома. Высокая скорость эволюции областей тандемных повторов, определявшая высокий уровень гетерогенности популяций по количеству мономеров тандемных повторов в этих областях, обуслсчила вифокое использование зондов на основе последовательностей повторяющихся единиц в судебной медицине для идентификации личности и определения различиях уровней родства.
Такдемные повторы обнаружены как в Еэкодируицих, так и э кодирующие участках ДНК, в которик они могут составлять большую часть открытых рамок считывания. Нэжторые генк, содэржшгте "•аадвмные повтора в кодкрукдай часта, вызывают особый интерес из-за предполагаемой рели гк белковых продуктов в развитии и поддержания определенны! патологических состояний.
Несмотря на очевидную теоретическую и .практическую важность понимания механизмов образезавяя и ээслвции тандемных повторов, эти кечдттазмы по прежнзму сстгится неясными. * Одни:.; из наиболее эффективных квчодов изучения этих механизмов является слредслзпие шрвзинзй структуры тандэиетх повторов к посл&дупций аюга пуклеоткцвах последовательностей, козвсдяеящЗ виягить хареэтернне черты структуры швторяггпгася областей, генома.
Использование в качестве модели для иэучэакя механизмов образования и эволэции танде'анх повторов кодирующих участков гваома позволяет также примесить полученную иаформацис о структуре генов для зняенвения функций их белковых продуктов.
РаСота по изучении гена-son была начата в Лаборатории молекулярных основ онкогенеза Института молекулярной биологии и продолжена в группе картирования и сэхвенирования генома человека. Первый клон кДЯК ■ гена' con был выделен в результате гизридизашонного скрининга библиотеки кДКК эмбриона человека при шюш гена К51 крысы в качестве пробы. Анализ первичной структуры ДНК этого хлона <1,3 kb) выявил наличие в ходируззцэй части гена son ооласти совершениях тавдешшх повторов. Учитывая актуальность проблем, связанных с механизмами образования к эволюции таядвмнкх повторов» а также возможность использования нуклеатидшй последовательности гена son для выяснения возможных функций его оэлкового продукта, било принято решение о дальнейшем изучении структуры гена son. Заключительше этапы представляемой реботк выполнялись з рамках ГНТП Теизм человека". .
Цели -л задачи есслэдованик.
Первой цельв экспериментальной части данной работы явилась расшифровка первичной структуры кодируидей части гена son человека.
Анализ полученной нуклеотиднюй последовательности показал, что кодирующая часть гена зоп содержит по крайней мере шесть о&яастей совершенных тандемных повторов, что делает ген исклзчэтельншл объектом для изучения фактороз, влияывдх на мультипликацию ДНК и пооледушую эволюции повторов. В настаящэе время актиано дискутируется роль двух основных факторов, влиявших ка мультипликацию ДНК нуклеотидннх 'последовательностей мультиплицированных фрагментов и ш геномной локализации. Для изучения роли этих факторов был проведен второй этел исслодовааий.
Цельэ второго этапа экспериментальной работы стало клонирование и сенвенирование зоп-родственного локуса гегома человека, гезшгн&я локализация которого отличается от локализации rsss son.
Научная ковнзка'а пряютгчзехая денаость работа. Б годе выполнения раЗота впервые определена первичная структура транскрипта гена sor. (EMBI acó. no. Х63753) и часть
последовательности альтернативного трансхрипта (EMBL асо. no. Х63751).
Анализ нуклэотидных последовательностей показал, что кодирухщ&я часть гена son содержит по крайней мере шесть областей совершенных тандемных повторов, причем нуклеотидные последовательности повторяющихся единиц каждой области не имеют значимой гомологии с нуклеотадными последовательностями повторявшихся единиц других областей.
Анализ предполагаемых аминокислотных
последовательностей показывает, что аминокислотные последовательности повторявшихся единиц одних участков тандемных повторов являются консервативными, в"то время как в других участках жесткой консервации не наблвдается. Анализ выявил также присутствие мотивов, отвечающих у некоторых ЦЩ-пцязырчЕпих бвлков за сикэенс-незавтаимое связывание с ДНК. Аминокислотные последовательности повторяющихся единиц, содеряащих эти. мотивы, консервативны, что подтверждает предположение о наличие у son-Оелка ДЮС-связывакщей активности.
Определена первэтная структура son-родственного локуса (EMBL acc. по. Х63754). Локус, являвшийся, вероятно, псевдогеном, содержит на 3'-конце участка, гомологичного гену аоп, поли (А) тракт и фланкирован прямыми 22-нуклеотидными повторами, что, видиио, указывает на его происхождение в результате ретропозиции.
Гомология нуклеотияных - последовательностей гена и псевдогена составляет. 96Ж, однако в оОласти повторов псевдогена отсутствувт 5 мономеров, присутствующих в гомологичной области гена зоп.
Наличке в нуклеотидяой последовательности гена зоп по крайней мере шести областей совершенных танде*гных повторов с дагомологичияыи последовательностями повторяющихся единиц r-i мультипликация мономеров в гвне son при еэ отсутствии в псевдогене соответствуют представлениям о превалирующей роли геномной локализации в мультипликации ДНК.
Апробация работы. Работа была доложена на заседании объединенного научного коллоквиума группы картирования и
секвенирования генома человека и KHK "Молекулярные основы дафференцировки и развития". Основные результаты исследований докладывались на. второа всесоюзной конференции "Геном человека - 91", Переславль-Залесский, 1991.
РЕЗУЛЫАХЫ РДбСЯЫ И ИХ ОбСТЕДЕЗНЕ
Нухлеотвдваз последовательность клонов кДНК гена son.
Первый клон кДНК гена son длиной 1,3 kb был выделен ранее п результате гибридгаационаого скрининга ' библиотеки хДНК эмбриона человека при помощи гена К51 крыса в качестве пробы. Содержащийся в нем фрагмент " гена son Оыл секвенировад (Бердичевский и др., 19BS). При выполнении представляемой работы пробы на основе этого клона были использованы для скрининга библиотеки кДНК из плаценты человека. В результате проведенных циклов рбскриниьга библиотеки кДНК эмОриош человека с исппльаованием в качестве проб 5'-концевых участков вновь выделенные фрагментов кДНК человека (использовались радаоактигано-мэчэшыа РНК-зонды (рибопроба) и ДНК-зонды, полученные в результате ник-траноляции и полимеразной реакции) было получено несколько * кланов, содержавших фрагменты последовательности гена son. Б результате секвенирования этих фрагментов (по методу Сэягера, с радиоактивно меченными дезокоинуклбозвдтрифосфатами) и соединения нуклеотидных последов ательностей при помощи программы DMASIS была получена последовательность траяскрипта гена son челозека длиной 5675 п.и., обозначенная son-a (рис. 1,2а).
Последовательность son-a включает 5' копцезуд не кодирующую область длиной 414 а.н., открытуш рамку считывания длиной 4569 п.н. и 3' концевую некодирувщуп область длиной 692 п.ы. йлыэ протлжонниэ открыты© рамки считывания в последовательности отсутствуют. Кодируемая мелил транскрштоы белок состоит из 1523 аминокислот, рассчетная масса белка составляет приблизительно 170 KDa.
При проведении последнего цикла реокринивга библиотеки кДНК плаценты человека было также выделено насколько клоноэ
' «ta
Piro 1. Структура последовательностей sorv-a, son-b и псегдогева аол-р. Показала точка дивергенции последовательностей son-a и son-b, первый AIG кодон к тер'зтатрунъъй 1Т-Д кодоя наибольшей открытой рзкхк с^гтывания son-a. •Области совершенных тандеирнк поБторов последовательностей son-a (R), Е2, R3, R4) и эол-b (BR1, ВВ2) обоэЕачепы прямоугольником. Показана структура области Н4 son-s и гомологичной эй области повторов последовательности эоп-р. Стрелкам в последовательности son-p обозначены лрк,чые 22~Е^-клеатидЕне повторы, фленкирукцие эсп-гомологи>!ный участок.
•orj-Ъ
í ATS6CC 1
7 ССАв*АТСССАТАТАТТАвСТТСТААСАСС г
37 АТБ8At ACCC АТАТчТТАвС ДТССА АСАСС 3
•• 67 AT&8АСТССС А А АТ6СТА6С6ТССА АСАСС А—
97 ATS8 АСТССС Ав АТ5СТАБСАТСС ААСAGC 9 lt
127 АТбвАСТСССАВАТВТТАвСвТСТАеСАСС в I
157 АТвб ACTCCCV8 АТЗТТ А6С ААСТ А6СТСС 7—
187 АТСвАСТСССАДАТВCTА8С6ТССААСАСС в—
2Í7 АГввАСтсссАвАтестдесдтссААСАсг 9 U
247 А ТСвДСТСССАбАТ8ТТА8С6ТСТASCA СС 10 )
277 АТ6САС7СССАЗАТ«ТГД6СААСТА6СТСС 11—
307 АТбвАСТСССАгАТеГГАвСААСТАбСТСС 12
337 АТС8 АСТСССА6 АТБТГ АБСА АСТАбСАСТ 13
367 АТбаАСТСССАбАТвТГАбСААССАСТТСС 14
397 АТВВАСТСССЛбАТВТТАйСААСХАеСТСС 13
427 АТ8вАСТСССАедТБТТА&СААСС&вСТСС 18
457 AT6S АСТССС AS ATSTT ASCA АСС ASCTCC 17
487 АТбвАСТСССАбATSTTAGCAАССАвСАСС 18
317 АТбвАТГСТС/3АТеТТАбСААССASCACC 13
547 ATfcfcACTCCCAS АТ8ТТ АвС А-СТ А8СТС А £0
377 АТ86АТТССС^ЭАТвТТАССАТСТЬБСАСТ 21
«07 4T6BACTCTCAAA"JXTTA3CTTCT03CACC 22
037 А Тв 8 АТБСТС Ав АТ6 ГТA6CETCTSбТАСС 23
667 АТ5БА;вСССASATST7ASCSTCT А6ТАСС £4
897 С А АС АТТС7вСТАТ6ТТ888ТТ 5 А А А А ТСТ ?3
727 ССТ
730 SATCCC АТ АвСТТ ASCTCA6
731 6 АТССТТ АСА6 8ТТАБСТСАв
«rr-в 772 БАТСССТАТА56ТГВ66ССАТ
7S3 бАССССТАТАвАЛТлеГГСАТ
1 6SC6668SCAAC6 АС ASC6C JB6 ABTTSCCS666CAS ССТТС6 6 ГSАСТЗ 914 вАТвСТТACASCTÍАЗЧАСАА
31 ббвТбССАгЛвТТвССАбб&ССгсСГГСвбСКАСГАббБСАСТБбАбТТа B2S 6ACCCTTATASATTA5RCCAT
101 T£S3S££ASCC7578£CAACJ5WSr.ACT AGA3176CCT ВЧ5СЛСГСАТ 6АТСССТАСАВАСТААСТ5СТ
151 66САасГеч63САСГ6вА8ПСТСбеебСА8ТСГвВ68СА6СТввАЗСАС 877 6 АТС ССТАТ AS6 АТ6ТС АССТ
гох TiiSAeCirrrGSSGCASCCUreSCA«CASeSST8C7eSAST76tCASee ese Att А СССТАС Ав 6 А7А6САССС
231 CA6CCT6666C6CCA6ASnECSr6g€CA6CCTgT86CAACT6T6SC»CT 919 АбвТССТ АТ AS ААТА6С АССС
301 e6ASATCTCT6TTCAe^CT«CGT6ACAjkCArCS5A6CT3TCAAC6ATSA 940 A6S СС АТ АТ АбвТТ А&САССТ
334 CCSTETC£CAS"iUCCTSGAS^ecCCTCeAC6ACASC6CT6eAArcCTA7AA 951 ASACCCCTCA757TASCATCT
403 TAC 932 А6АС5ТТС7АТвЧТ5АТв7ССТАТ5СТВСА
BfcACGTTCC
419 АТвАТбТСДТСТТаС 8ДАС9СТСТ 1
439 AtüATSTOT TaT 5ASC5STC7 С
4Ь0 A7SATSTCC ССТАТв вСТЗААСвСТСТ Э Al
487 А Т*> АТвТС АбССТлС BASCSCTCT 4 fil
511 АТБДТВТСАбССТАС CASCSCTCT 3 BZ
333 AT5ATSTCÜ ¿GTAT® СГГ&АвСбСТСТ 6 AS
S62 A TS А ГвТС АбСТТА Т 6ААСВС7СС 7 ВЗ
506 А Тв A f6ТС ДССТТаТ CAACSCTCC В 84
81Э АТ5АТ6ТСС ССААТС «СТвАТСйЛГСТ 9
63"? VTCATCTCC ATS 665BCTeACCS€TCt 10
664 Al 5 AI ÍTVGTC AT АСГСТйСЛСТСАССЧвТ CT 11 C1
•537 ATPATC7CATC5TAl.TCTSCiÍCr6ACCSATCT 12 СЭ
7 ЭО АТВАТЗТСАТСТТАТлСТ SCT6A7CGTTC* 13
780 ATBATfTCT АТв SCXCTBaT TCTTACACC
730 S*T 7CTTACACT
8АСACATA7A СASA6
6САТА7АТ86Тв
639 CCACCTTrwr?aCTSi.*6ASCCreCAACAATS í
6t»2 CCACC6TTSiCCACCTiA>*&5fCC.\£CAAT8.\CA г
е&з ¿САССАТГбССТССТйАбвАгССАССАбАбввТ 3
зга CCA^ATT^CCACTSASCAeTCAfSCATTAiCA 4
9G1 6СТ6/иААТАСГТвЗСС7АС»^^6ТЧСС*(САТ7АССАТСТ^
s061 СА6СА97вССТАСТ6АТТЛГ7САЯ№ГСАССЛ7СЛВДГС0СГСА >Г1ТГЛЗТАТ^АЧА5&СТоСТ375АС ГБТТССА6ЛЛССАСПАССАвЛе'ССА6ААТС
11G1 ГГСААПА^ЗТТААСА^СТГ^^^ТЗМЧТА^АЗСАбАЛбАгСАТО
1251 АТбТСАбСТаААЛ^СТЗГ^АеС^ГСАГАбГСГС^ТЗТТАТСГ«^
1381 ААРТЛТС ГАг АТС" ГТ I ТСС АСС А 6Т ААСТ А*ТСП АСТР
Рис- 2* а- НуЕйеотядшв последовательности зоп-а и son-b. Последовательности содержат разные 3' -концевые участки; в&читя с 406-го нукл^отида son-a и,соответственно, 1021-то нуклеотида 3on-bf нуклэотидыые последовательности идентичны. Области повторов внроваонн,
б
J403 СТебСАвАБАбСАТТ 1
1420 LTESA6CC5CCASCCAT6erTECC 2
1444 CCA5AETCT7C*6CTAT6esTeTC з
Í46" CTGSABTCTTCESCTGTGACCSTC 4
143Ü СТббАбТСТТСБАСТбТбАСТВТС г
151E CTS6AG ГСТТССАСТСТААСТеТС С
1П45 CT6SAGCCTTCe6TT6TeACT6TC 7 icceGAeccTccTBTTGTsecT а
Í3P3 SAgCC.A6ACTCTSTTtóCATT Э *
1006 CCTGT6CCM5TTBTTTCTEC6 10
1627 С76БА6ССГ7СТ6Т6ССТ 6ТТ 11
164S CTGGAACCAfiC<S6TCTCA 6ТС 12
1669 г.ттс аасстт ст ат с атт етт :з
1С9Э TCASAACCATCTCTTTCT TTC iЛ
1711 С A"? S A AT С 6 LZT 6Т Б АСА6ТТ 15
1732 TC.A4ASCCTS:T6TC АСА6ТС 15
17СЭ TCASASCA6ACTCAASTA ATA 17
1774 ССААГГГбАСбТбССТАТАСАСТП^ЛСАССААТбАТАСГСбАА-СТА^ТАТСАТеТСАТСАСАГЕТТАТеАААебДАТТААТСТАТ^СТСТСбТбАТ-.АкА
1В74 TTCrrSCTCCASAeATT54CATSCA6BA6ATTBCAT7ECA^CAG5TSAAÖAACCACATl^AS6AACACCTBAAASGTSACTTTTACbAAAGrCAArA
1374 Т6 GT Aï А А А Т AT Л 3 А СС ТТЛ A TATААATA G ТС А ТТТ ААТТ ВС Т A A AG А в Ат 6 S АА С А7 А АТАГ А 6Т STSTC СТЕС7С 6 ТА С ТАЬТСС ТВ TT Р S GGA AAT Т
£07 A 65T8AA6A&AAAATTTTSCCCACCAGT6ASACTAAACA6CÊCACAÊTATTÇ6ATAC2TACCJTeSTwTt*6T6AASCTSAT6CA66A6AAACTCTATC7T
21/A CTACT6STC СТТТ7 Б С ТС 7 £ ßА А СС7 8АТ6 СА А СА 90ААС 7Л F 7АА S S ST A TT Ê AATTT ACC AC AS OA7 С 7 A^ C7CA T7A ETTA А ТА А А ТА ТвА ТС T
2274 ТБАтДТСТТТААСТАСТСААбАТАСГеААСАТбАСАТгбТААТААтССАССАеТССТАеТббТИТАвТеААеСТЯАГАТТеААбееССТТТбССТ
£374 ССТ A A AG A Т АТТС АТСТТ Б ATTÍ А С С AT CT ААТ A AT А А СС TT f5TT AS ТЛА В 6 * ТА СА 6 АА£ААСС ATÏ ACCTGTA A A AS A3 Аб Т Б АСС А Б АС A AT А Б С А G
2474 CCTTSCTCA6CCra»s»ASAAASTACTESAReA6AAAAA5AASrACCTCCCCCTCCTAAASA^CACTCTCTeAnCAS6ATrrrCTSCCAíTATTeA6eA
2574 ТАТТААТсААССА ^ATTTAGTGASACCSTT АСТТС"ТААЛбАСАТС0ААС5ТСТТАСАА'5КТГА6АвСТ6вГАТТвАА56АССТТТАСТТ6САА9ТбАТ
*~'4 £TT65AC6TgACACATrT6CTSCCA^Ctr.ôPTTKTAAÛTAGTATSCCA6AAA6A6C7tСАЛЦЛГГСГГГТТСА6А»&АААААОАТ6АТТАТеАА* TTГПТ
?Т/< TMAAGTrAAeSACACIL4i:fe*w»AAAAvCAA3A.VAAAUfceAACCOrsATAAv46^A6AAAC»6iJ№AAAASASATCCTCArrTAAGATCTCöAA€TAA
2874 S СБ TT СС АА AT С TT С TS АА^ АС А А АТСА СБЕ A V3U öT АС ~ А37 6A AT С 7С€ TTC 7А G S 6С А А 6 A AAßAS АТСА.ТСТ A AST СС А А6Т CT СA 7ß р СТС ТС А >
ES74 A<4AC6rrCACS^TCAC6TTCAAGAC3r4e6AS?!AeAASCAS':A6ATCAAGA,»''",AAASTCTASA6eAA:»AAeA"rtTe7ATC»AAAßABAAbX5rAAAACAT
ЗЭ?4 CTCvAAA(?CACA6ATCCAA5TCTAeu$AAAvAAAAA6AAAAACArCAASCTCCA6eGATAACC9AA.S?ACAm
3t 4«? A6 ACCT С С ААБТС 6 AACC i
?16& CC AA ST С STC 6 6 A5 Тс 66 A ST С At ACT Z 31»Э CCA*6TC67CGACeAA66TCTA6ATtT6T6667A6AAGAA6GAGCTTTA6CATrTCC 3 «1 3Z5v ССAA6L С Б СС fi С AS СС БС А С С 4 M
•3271 СССАбССгССеСАбССвСАСС 5 hz
ccoAsccsccecAsocecAcc ь
сссАссссссвслессесАсс 7 t>4
333 < CCCASCCSCCGÍA6CCCCACC e Ь5
32S5 ССТАБС ÛST ССБAB С CGC A CC S t6
?376 CCAAGCCeCCSSASAA£ATCAACSTCT5T36T AA6&ASAC6AA5CTÎ ГА6Т ATCT CA ÍC
2" ¿35 CC AST С ASATT AA Ç С C6 ¿T СЛАБAАС АСССТГ M CAA 6 AA S CTTTAbCAP AT CT i J
?487 CCCATCCSTCETAA/kASATCCASSTCTTCTCAACCAeCCAe 43
3429 ATCACCCAAACGTClGMU3ATTr&3ATMB«CTCAAT7ACTT6AAATAG
252S СС А А А С ^ Т A A A ûCCT 6 f Л СС. Т С С А ССТ AC Т AT АО TT £ AC A A AS ï Т GCT АА* А Л G ТС А » ôA 65 A SCT ACTA TASAA бAAC TA ACTSA5 AA AT ST AАЛСA ß A
35cC Г C3 СА СAG AG T A A Аб Л AP AT~ AT ß ATGTAAT A ST S АЛ7 А АА СС ТС ATG ПТС G G ATCAACAS SA AS AAC A£,5CTCr.TTTTT A7C AT CAT С CC TTTA А Л CT 272a CAST'» AATTT AÄ ACCT ATTTTTTT С AA TCT6 A A î ATTCC T Б С A€CAAAACCAAC TSC АССАААААСССЛ 6CTAA - ATTA Л С АЛЛ Л GААТТС ССТ £ TAT С A
ЭВ29 Т СТВ (5 АТСТС АА £ АТС «В АЛА AA AG AA6CÔG AT»6T 87TT AT 6 GAS AA7 G Б STT CCTPTS6A С АААДЯТ З&Т «AASАЛАACAAAG ATE AT С /«7 A AT 6ТТТ
3925 ÎCACCASCAATrr6CCCTCAGA£CC7S*B3ACA?C7CTACAeCAAT64ST3AA^
4028 АБ'ЛАТСАоСАТбТТАМТАСАбСТСАГСАЛАЗЗАТГб^бССТбббСТСАБСТбА^^ТГГАТТССТ^бССАвТТ^АСАббААйТ* ÍASSASTACA66'íT
4123 TT 6 АС А С A A G* А " AGTTR 6С С A AT Î.CTÇP Т£ CA А6ССТ S fi АТТ АЛА А А 6в АТС A -à TTC 7ТА AG А6С A6CCCCSG 7*АС Т S б А 66 A AT® G S А& ССЗТТТ
4223 TQATCA6AMAATR63TT£6A:jA&AA6-A~AABGATTA5GAAAAAAaUAe^^
4bSa ТСТТ STTÊCAGTASCACAAAGASCACA <A*.3AS3TCTeS~AACrTC7CT6CTß0AATCAAA3ATCTI^CA3PCAAACAT~CT6T6TCTeCTnG'»TBeAG
4428 - АТСТБ7ААТААААБА^ЗТ?ВСЛАСС/ХСТ5ААТТГСТАТ75{ГГССАТ6А7А5ТОССССТ~АТС.^
452В б А AGf 6Г. TT AC*Î AÔ CC CA G 777T SC CAB СССТААТA AG АА CGАТСС ТААA S С С ACAG С &SCT A CT ВТ BSTTCTTCA 4 S СA ATG S £ С C7TC TACCA »A6S A
4328 С С T С A Vß 3 ¿ 7 АА T G £ A C7TG CTTC Авб ASTCCCY £ AC &ï A S A T A 6 ATT ft A S БТТТТ A 7AAÎ AA TCATTT С A?*ATTTT AC TCT CC AT С A С A AT 6 T AT7T С
4723 СТлТТГААТ6ТТ6ТАААТАТТТвССА*ТТ7ААоАСАТТ6Г6ГА<»Л^вСААТСТ6ТАААААС^ТСТС^
ТТААССА7ЛСАе35ТТТ7|5ГГАТБТТТАТА7ТСТТТАССТТА8Т6АТ5ТАТТТБТТТМЭТ6вСТ^
4928 NvTC TTC A G Г6 T S 6 AAT P TTA ААТЯA wSCTTTTA T A CT fiT ATTTTCTAСТДТ6АТ6ТААCTCCCCTTCCTT AТЗвСТ A P6C7 ACT 6T A A С A C7"T G CCT ß T AA
ноге TCA-5TeA*.3^0C7GTeCACCTí "TACTATTTC'CAi.TSrôTT-T^CTEGACAS A7A^T¿C"Cr-».STST7ATrEAEóTSATCAACA7CTcTTÚÍ А^ЛЗ^СС
?í2a 7ААТССАССЛТСТССССТСАААА7ТГТЗТАв^С5%ТСТАААААбАААСТ^5ТАТбТТВТетЬАТВАТСА5САСГААЗТССТбСАТТССТ5ТТАААЗ"САС
агга ТТевЗТСАТАА6АА55еАеТААААААТ9ААеТСТ6АСтАВЛ/ТТС7АТТБ6СДСАг:ВССАА8ТАСАТПАтТбеСАПгАБТТ6»еАТАТАгТтАС
ТТТСЛТ5ТСГЬТТТТеААТТ7СА >C7A^A~CTA6aTAC*XSTA>AATÍ АТААТТАА^АТО^ТеТАА^АА^ГТАТСТАА^ААААТТЕС-
З^ЗВ АТТТГ?ТТСА"ТАТ1»АвАААЧГ«АлМЗТТТАТЗТТААТТТТ7лв5&ТСТРАТАвААТЛТТТСАТвТбТАТТЛСАвТ^
Ь^ге ААС »TTATTTTCf AAASCUAA6CC:C."JU7ACAA.\rTT£rrCTSCAATAAAAAAAAAAA 3 '
Рис. 2, а. Продс/тжевиз'
ВОП-&
1 МА
3 PESHIL6SJT 13 MEXHILßaST 23 KDSQMIAEKT
зз MDSSMLaarr
43 HDSQMIASSI 53 MDSQMLfflSS 63 MDSQMUarr 73 HESQMUaiT 83 MDSQMLÍSKT 93 MDSQMbSSSS 103 MDSGMUBSS
из MDscMLsasr
123 KDSQMLÄTSS 133 MDSQHtÄtSS 143 MDSQHL8SES 1S3 MDSffilLCTSS 163 MDSQMbÜSST 173 KDSQMLÄ2ST 183 MBSQKLÄSSS 193 MDSQHLfiSST 203 MDSQMLáSST-213 MDAQMLáSST 223 MDASMLfiSSr 233 QDS-AMbGSZS
243 P
244 DPYKLftQ 251 DPiTRLAQ 258 DPVRLGH
265 DPÍRLGH 272 DAYRLGQ 279 DPmXSH
266 DPYRLTP 293 DPYRMSP 300 RPYRIAF 307 RSYHIAJ 314 KPYKLA? 321 RPLHIAS 328 RRSWMMSIA
1 2 •3
4
5
6
7
8 9
10 11 12
13
14
15
16
17
18
19
20 21 22
23
24
25
AERS
Рио. 2,6. Предполагаемая аминокислотная последовательность son-a и son-b. Области повторов выровнены. Поскольку предполагаемая кодирующая часть последовательности аоп-а начинается с 415-го нуклеотида и последовательности совпадает-начиная с 406-го нуклеотида son-a, то кодируемый son-a белковый продукт является урезанным вариантом продукта, кодируемого последовательностью son-b.
1 MMS2T ERS 1
9 MMS Y ERS 2
16 HMSK1 AEES 3 Al
25 HHS3S ERS 4 El
33 HMSS? EES 5 B2
41 MMSffl AEES 6 A2
50 MMS5I ERS 7 B3
53 MMS4Y ERS 8 B4
66 MMSRi ADRS 9
75 MMS a GADKS 10
84 MMSSÍSAADHS 11 C1
95 MMSSTSAADRS 12 C2
IOS КЫЗЕТ TADRS 13
116 MMS И AAD STi 14
D SYT
DIÍTE íxmv
139 PFLBfEEPFTM
150 РРСЕРЙЕРРМТ
161 PPEPFEEPPEG
172 PAbFIEQSilil
192
202
212
222
232
242
AESOTOTEVTSIPSx^SQPEPPVSQSEISEPSAVPTOYSVaASDPSVLVEE&AV'rVPE 252 262 272 2B2 232 302
PPPEPESSITLTPV^iWAEEHOTVPEñPVTCMVSETPAMSAEPCTLAGEPPVMSETAE
312 322
TFDSMHASGHVASKVSTSLLVPAVTTFV
S
2
3
4
5
6
1 Рис. 2,0. Продолжение.
8 9 10 11 12
13
14
15
16 17
472 482 492 502 512
IPTEVAIESrPMILESerMSSHVMKGIHLSSGDQII«APEIGMQSIAMSGEEPHAEEHLK 522 532 542 552 562 572
GDFYESmGIHIDMINSHLIAîaMEœ^TVCAAGrSPVGEIGEmU^SETKQRCTIJïr 532 592 602 812 622 632
YPGVSEADAGETLSSTGPFALEPDATGTSKGIEFTTASTLSL\niSTDVDLSLTTQDTEHD 642 652 662 S72 682 692
MVIISTSPSGGSEAPIEGPLPAI^IHUJIiSNNSLVSmKTEEPIPraESDQTIAALLSFK 702 712 722 732 742 752
ESSGGEKEVPFPPKETI/PDSGFSAÍJ ZEE)! NEADLVEPIitPKDMHJliTSIiRAGI EGPLLAb 762 772 782 792 802 312
DVGPJ5RSAASPWSSMPER¡\SESSSEEKDDYEIFUKVrorHEKSÍKNKHRI)KGEKEKKRD 822 832 842 852 B62 872
PHUISRSKRSKSSEmSiœKTSESKSUARKRSSKSKSHRSQTIîSKRSIŒERRSSRSRSK
682 892 902 912
SRGraSVSKEKKÍHSPKHRSKSREEKKOffiSSRmRKTraA
914 KSET 1
918 PSRKSR3 HT 2
927 PSHHKRSRSVGP-RRSFSIS 3 al
946 PSRRSET 4 M
953 PSHKSRT 5 Ъ2
960 PSRESKT 6 ЬЗ
967 PSPJSRT 7 M
974 PSKRSRT 8 ъь
981 PSKRSKT " 9 Ъ6
988 PSBRRESRSWBRESFSIS 10 з2
1007 PVHLRESRTPLRRR FSItS 11
1025 PIRRERSRSSERGRS 12
ю4з 1055 1069 1079 1089 1099
Ч PKPbTDIjDKAfiíXEIAKAN/JUÜÍCAKAGVPIiPPKLKPAPPjPTITEKVAKKSGGATIEELT
1109 1119 1129 113S 1149 1159
EKCKQIA3SlffiœDVXV£«îDm'SDEEE£EPPI^}^FKI£EFZ?IFÎr:iiIIAAAKPTPPK lloS 1179 1189 1199 1209 1219
S3VTI.TKEKPVSSGSQffiffiKEAES,^GEWVPV®CHGEEHEDI>I№FSSíJIJ'SE3VDISrA 1229 1239 1249 1259 1269 1279
HSEMÎ^QKI^SE>'!A!^I'EAKSMIJCïAC^UDAWAQIJNSIPGi^GSTGVQVLTGE9LAN 1289 1292 1309 1319 1329 1Э39
TGAQAWïmxjFU^PVTG-SMGAV^
1349 1S59 1369 1379 13B9 1399
VAVGERAQKRSGNFSAAMKMS3Kl^/SAUffiIGffiCï®Ke^^
1409 1419 1429 1433 1449 1459
ЭТЫ NGSAYÔPSFASPHKEHAMT/yiTWIÂi^GMPôïîiiAHAiASGVPHVDTÎLîlFYNN 1469 1479 1489 1439 1509 1519
HraiLLCITMYFLFlWVMWQFKTI^EKQSreiSPC-ro^
1529 1539 1549 1559 1569 1579
DVFV
331 LAESI
338 ÎÏEPPAMAA
344 PESSAMAV
352 ' LESSAVTV
360 LESSTVTV
368 LESSTVTV
376 LEPSWTV
384 PEPPWA
391 EPDSVT1
398 PVPWSA
405 LEPSVP V
412 LSPAVS V
419 LQPSMI V
426 SEPSVS V
433 QESTV TV
440 SEPAV TV
446 SEQTQ V
462
кДНК, рострикцизввый анализ которых. показал, что структура их 5' концевых участков сильно отличается от структуры 5*-концевых участков выделенных ранее клонов, в то время как рестрикцшэнвая аарта их 3*-концевой, части .полностью соответствовала рестринционвой карте последовательности аоп-а. Выла определзна первичная структура одного из этих клонов, обозначенного sori-b (по методу Сэвгера, с использованием радиоактивно меченных
дазоксинуклеозидтрифоефатов, или флюоресцентно меченных праймеров на секвенаторах фирмп Applied Bloaystems). Нуклеотидаая последовательность зоп-b представлена на рис. 2,а. Последовательность имеет длину 3,3 Из, причем открытая рамка считывания проходит от начала до конца фрагмента. Сравнение последовательностей son-a и son-b показало, что они содержат разяаэ 5'-концевые участии, в то время как начиная с 406-го вуклеотида son-a и, соответственно, ^1021-го нухлеотида son-b, последовательности идентичны (рис. 1;2,а). Наличие абсолютна идентичного участка длиной 2361 нуклеотид в обеих последовательностях при расхождении 5*-концевых участков позволяет предположить, что рассматриваэмка последовательности принадлехат двум разным транскриптам гена aor¡, образованным в результате альтернативного сплайсинга. Поскольку предполагаемая кодирующая часть последовательности son-a начинается с 415-го нуклеотида, то кодируемый ею белковый продукт является урезанным вариантом продукта son-b (рис. 2,6).
Повторы. Наиболее интересной особенностью нуклеотидной и аминокислотной последовательностей гена son является наличие областей совершенных таддемных повторов (рис. 1;2,а). Области повторов расположены между нуклеотидаыи ¿03-783 (R1), 829-960 (Н2), 14,05-1773 (КЗ) и 3148-3527 £R4) son-a и составляют более одной пятой длины последовательности. В последовательности son-b кроме трех областей повторов, идентичных повторам san-a, присутствуют тазша две дополнительные области повторов,, расположенные между нухлеотидами 1-726 (ВРИ) и 730-1012 (BR2). Некоторые области состоят из мономеров равной длины с практически
to
идентичными нузслеотидннми последовательностями - BR1, BR2, Й2. Другие области - R1, R3, R4 - состоят из повторяющихся единиц различной длина со значительно дивергировавшими , последовательностями, хотя некоторые их фрагмента,, как, например, первая половина R3 или центральная часть R4 могут рассматриваться как самостоятельный области повторов с практически идентичными мономерами.
В процессе формирования областей повторов гена son происходила как мультипликация единичных мономаров, так и " мультипликация блоков мономэров. Хорошей иллюстрацией данного принципа формирования гандемных повторов является, например, структура области BRI, в которой присутствует как идентичные мономеры <11, 12 и 15, 16,17) так и идентичные тэтрамеры [4-7] и [8-11] (рис. 2,а).
Сравнительный анализ нуклэотадных и аминокислотных последовательностей повторяющихся . единиц выявил консервативность аминокислотных последовательностей некоторых участков тандемвых повторов. Так, например, в области R1 повторы одного типа (Аа В или С) кодируют идентичные аминокислотные последовательности (рис. 2,6), в то время как нухлэотиднне последовательности большинства из них различается (рис. 2,а). Консервация аминокислотных последовательностей отчетливо выявляется, например, при анализе структуры повторов типа а области R4: нуклеотидные последовательности al и а2 содержат 15 различий, в то время как в аминокислотных последовательностях присутствует лгшпь одна замена. Консервативными могут быть такие отдельные участки аминокислотных последовательностей мономеров. Так, например, все типы повторявшихся единиц области R1 содержат \ консервативный мотив J5S3'. ..HS, ь то время как аминокислотные последовательности центральны! частей мономеров значительно различаются. Коноэрвативные серины и аргинины кодируются разними триплетами (варьирувгг последние буквы триплетов ). Консервация аминокислотных последовательностей указывает, вероятно, па важную роль рассматриваемых участков в функционировании белкового продукта гена son. Консервация аминокислотных последовательностей не была обнаружена,
например, в первых пяти повторах области R3. в которой лишь три из одиннадцати нуклеотидннх замен являются синонимическими.
Консервация мотива ' MMS...RS в аминокислотных последовательностях всех довторяпцихся единиц области R1 подтверждает наше .предположение о том, что инициация трансляции происходит о одного из АГО кодонов первого AUG дублета открытой рамки считывания. Интересно отметить, чго, несмотря на наличие большого количества ДТС триплетов в начале открытой рамки считывания, ни один из кодонов не фланкирован G в положении +4. Кроме того, лишь вторые AIG кодош дублетов фланкированы пурином (А) в положении -3. Поскольку мРНК, инициаиторный кодон которых не фланкирован ни пурином в положении -3, ни G в положении +4 крайне редки, трансляция, вероятно, начинается со второго кодова дублета. Кластэр AUG кодонов может выполнять регуляторнне функции при трансляции.
Гочолоиш с ДЛК-свяаииаетттш белвсанн. Предполагаемая аминокислотная после до зательнос ть son-белка содержит участок (аминокислоты 816-1043), имэиций гомологию с ДНК-связывавдими белками. Этот участок содержит область R4 и предшествующую ей область дивергированных повторов. На рио. 3 представлен один из возможных вариантов выравнивания последовательностей son-белка, трех гистоноа спермы и двух вирусных оалков, у которых предполагается наличие ДШС-свяэывапцей актиэносги. RBRS и RS мотивы, как предполагается, представляют собой участки сиквенс-независимого связывания ДНК. Интересно, что _ гоксамер, присутствующий в галлине и бэлкв VL96 мультиплицирован в гене son. Анализ аминокислотного состава рассматриваемого участка воп-белка выявил высокое содержание сврива (28.51%) и аргинина (38,16*). Большое количество серила и аргинина присутствует танже в составе всех белков, представленных на рисунке - галлиза2 (16,392; 59,02%), протамина японского перепела (14,29«;64,29г), протамина спермы каракатицы (11,542;56,415), Е2 белка папилломавируса человека тш 5
soa-a SallineZ Prot JQ SF-1 СГ EZpap5
852
ШШЖ
B73
son-a
874 KSBBSUSKEKBKBSPKHSSKSEEfiKBXBSSSJSBMBlilVaA
son-a son-a son-a . fiallineZ Prot JQ £Zpap5
soa-a UL96
SallineZ
314 918 9Z?
94S
1
Z
3 al
4 M: 5 bZ
sen-a 969 PSBBSBT 6 ЬЗ
son-a 96? PSKBSBT 7 Ь4
son-a 974 PSBBSRT 3 Ь5
son-a S81 PSffilSKT 9 Ь6
sciji-a 988 FSEBBESRSUimitSiSIS 19 aZ
son-a 188? PvlLlUSBlTbHBR-FSRS 11
son-a 1625 FIBBSBSBSSERGBS 1Z
Рис. 3. Сравнение фрагмента предполагаемой аминокислотной последовательности белкового продукта гена зоп с последовательностями ДЖ-связнвапцих белков - галлипа2, протамина японского перепела, протамина спермы каракатицы, Е2 белка папилломавируса человека тип 5, VL9G белка ирисовируса тип I.
(участок 246-340) (28,422;30,53S), У196 белка иридовируса тип I (участок 420-560) (26,24216,31«). Интересно также, что рассматриваемый участок son-Селка, как и два вирусных белка, является пролиы богатым (6,14; 6,32 и 24,82%. соответственно).
Таким образом, в результате первого этапа исследований было показано наличие .в кодирующей части гена son по крайней мере шести областей совершенных тандемньгх повторов, что делает ген исключительным оОь&ктом для изучения факторов, влияющих на мультипликацию ДНК и последующую эволвдип повторов. В настоящее время активно дискутируется роль двух основных факторов, влияющих на мультипликацию ДНК -нуклеотидных последовательностей мультиплицированных фрагментов и их геномной локализации. Для изучения роли этих факторов был проведен второй этап исследований.
Одним из наиболее перспективных подходов при исследовании роли геномной локализации и' нуклеотидной последовательности з мультипликации ДНК представляется сравнительный анализ структуры областей повторов родственных: генов', имэехцих различную геномную локализацию. -Действительно, если родственные гены образуются в результате дупликации общего гена-предшественаиса, то, по крайней мере Еа начальном этапе раздельной эволюции, их нуклеоткднне последовательности будут идентичны, и, следовательно, различия в структуре повторяющихся областей будут связаны не с различиями в первичной структуре, а с влиянием других факторов, в том -числе, вероятно, геномной . локализации. Поэтому целью второго этапа экспарименгальгой работы стало клонирование и секвенирование аоп-родствезного локуса генома человека, геномная локализация которого отличается от локализации гена eon.
В результате гибридизационного скрининга геномной • ^ библиотеки га лейкоцитов человека в вэкторэ pYAC4 при помощи ' пробы на основе З'-ковдезого участка последовательности son-a (Hlnd III фрагмент, 3418-5643), проведенного И.М. Чумаковым в Институте полиморфизма гонома человека (СЕРН,
Parla) бчло *зндчлянэ несколько клонов. Один из выделенных клонов, YAC 347Е4, локализованный в отличие от гена son на первой хромосома (по данным И-М. Чумакова, гея son локализуется на хромосома 21 band 22.11, son-родственный локус YAC 3Î4E4- - на хромосоме lq21, личное сообщение) длиной около 300 to, был использован для приготовления плазмидной библиотеки. ДШ YAG 37424 была отделена от дрожжевых громосом при помощи электрофореза в обращенном электрическом полз, вырезана из легкоплавкой агароэы, рестрицирована Bam HI и лигироваиа с вектором pTZ 19R для приготовления плазмидной библиотеки.
В результате гибридизациснного скрининга плазмидной библиотеки с пробой на основе последовательности гона son была выделена рекомбинакхнвя плазмида, содержащая вставку длиной около 7,5 тн. Выделенная последовательность была субКлонирована и частично секвенирозана (при помощи флуоресцентно мечэнных праймэроз на секвенаторак фирм Applied Biosystems и Pharaaola). Ниже приводится анализ полученной нуклеотэдаой последовательности.
Анализ яузсюотидаой последовательности аоп-гоиодоютноЗ области YAC37/E4. Выла секвенировава последовательность длиной 3376 иуклеотидов (EMBL ас. no. Ï63754), прилежащая к одному из Bam HI сайтов рехомбкнантной плазмиды. Последовательность содержит фрагмент длиной 2473 нуклеотида, гомологичный последовательности гена son, оканчивающийся. поли(А) трактом <рис. 1).* Гомология рассматриваемой последовательности с геном son начинается • с 193-его нуклеотида (3160-ый нуклеотид последовательности son-a) и заканчивается ns 2655-ом нуклеотида (5377-ой нуклеотид sorï-а); гомология составляет 96?.. Рассматриваемый фрагмент содержит 27 терминирующих кодонов, отсутствующих в открытой рамке считывания гона son. Наличие лоли(А) тракта в конце области гомологии с геном son, а тайне наличие прямых 22-нуклеотидных повторов, фланкирупвдк гоп-гомологичнув область, указывают на то, что •, рассматриваемый зсп-гомологичный фрагмент (псевдоген son, scri-p) образовался в результате встраивания в геном обратного транс крипта гзна
son.
Вероятно самым интересным результатом является отсутствие в последовательности воп-р пяти совершенных тандемных повторов, присутствущих в области R4, последовательности son-a (рис. 1, 4). Наиболее последовательным представляется слздущее объяснение этого различия. Поскольку 'в последовательности гена son присутствуют несколько областей совершенных тандемных повторов, то, в соответствии с современными представлениями о механизмах мультипликации ДНК, можно предположить, что локус, в которой расположен ген son, является горячей точкой митотической рекомбинации. По существующим представлениям два основных фактора могут определять функционирование горячих точек рекомбинации - локализация области в геноме и еэ ауклеотидзая последовательность. Отсутствие значимой гомологии нуклеотидных последовательностей повторяющихся единиц из разных областей повторов гена sor. согласуется с современными данными об отсутствии общего консенсуса в последовательностях всех миниоателлитов генома. (Некоторые последовательности содержат схокие GC-богатне мотивы, однако большая часть этих повторов была выделена в результате гибридизации с пробой на основе GC-богатой "коровой" последовательности.) Вероятно, нуклеотидвне
последовательности мономеров тандемных поЕторов имеют некоторые особенности, однако кэ вполне ясно, какие именно характеристики первичной структуры являются принципиальными. В связи с этим представляется, что первостепенное значение для функционирования горячих точэк рекомбинации имеет геномная локализация. Это положение подтверждается данным; по преимущественно прителомерноыу -расположен™ тандемннх повторов, а такие данными о наличии в прителомэрвкх участках кластеров тандемных. повторов. Воли данные представления верны, то различия в числе тандемных повтороэ гена и псавдогбна могут объясняться тем, что после возникновения поеэдогена в геЕв зоп продавалась мультипликация мономеров, в то время как в псевдогане, имекцеы другую локализации, мультипликации повторов не происходило.
SOIt-p
1S3 CGAAAC
199 C&V.CTTCCrrCAC-AGrrCGGAGTCATACr . 1
226 (XAAGOTGraSACGLViGGTCTAffraTr^^ 2 a1
283 CCAAGCCGCCGQAGCCACACC 3 b
304 CCC^GCXGCCAGAGMGATCMAGICTffrGCT^ 4 a2
251. CCAATCAGATTMiGGCr&TCtA&ACACCCTIGAGAAGM GGTTTAGCAGATCT 5
415 aXATCOTTCGTAAMGATCCaAGTC TTCTGAAGAA 6
aoa-a
3148 AGAGCTCGMGTCGAACC 1
3166 (XtóGTCGTCGGAGTCGGÍ.GTCATACT 2
3193 СХ^СТгаЖЖЙСОМССТСТАСАХСТСТСйСТАСМСААСИССТПТАССЬТТТСС 3 al
3250 CCfiAGCCGCCGCAGCCGCACC 4 Ъ1
3271 CCCAGCCtíCCGCAGCCGCACG • 5 Ъ2
3292 CCCAGCCGCCGCA'aCCGCACC 6 ЪЗ
3313 CCGAGQCGCCGCAGCCGCACC - 7 Ъ4
3334 CCCAGC03CCGGASCaX»CC 8 Ъ5
3355 CCTAGCCXJTCGfiASOCGCACC ' 9 ЪЗ
3376 ttMGCCGCCGCAOMMTCMOT^ 10 а2
3433 CCACTTCAGAlTtóGGCuAIX^fWiCACCCTTAAQAftGAAG СП7АС-САСАТСГ 11
3407 CCCAXCOri'CCTÍUMCarCCAGGTC TTCISAACGAG 12
Рко. 4. Структура области повторов R4 son-а и области повторов псевдогена son.
Данное предположение согласуется с некоторым! другими фактами. В настоящее время начинает утверждаться представление об ассоциированности высокой частоты неэквивалентного обмена с трслскр15пционной активностью локусов. Поскольку для закрепления псэвдогена в геноме последующие поколений его образование должно было произойти в линиях полоз к 2 клэток и/или в бластомерах до расхождения линий половых и соматических клэток, то, следовательно, транскрипт гена эоп присутствовал в какой либо (или в нескольких) из этих групп клеток. Очевидно, что мультипликация мономэров закрепляется в геноме лишь з том
случае, если ока происходит в тех же группах клеток, поэтому вполне вероятно, что в данном случае также наблюдается ассоциация высокой частоты неэквивалентного обмена с экспрессией локуса.
Можно предложить также и иные варианты эволюции гена и псевдогека. Можно -.допустить, что тандемные повторы, отсутствующие в псевдогенэ, были элиминированы в процессе эволюции псевдогена. В этом случае сохранение повторов в гене может битв отнесено, в частности, на счет стабилизирупаего отбора. Следует отметить, что все остальные повтори области R4 в псевдогене сохранены (рис. 4). Можно предположить, что в результате работы рекомбинационных механизмов были элиминированы повтори с максимальной гомологией " последовательностей повторяыцихся единиц. Поскольку локалгаация псевдогена в геноме в данном контекста может рассматриваться как случайная, то предположение. о работе рекомбинационных механизмов, приводящих к изменению числа тандемвых повторов, монет рассматриваться как соответствупаэе гипотезе о роли нуклеотидкой последовательности в инициации рекомбинации.
вывода
1. В ходе выполнения работы определена нуклеотидная последовательность транскрипта гена son человека и часть последовательности альтернативного тренскрипта.
2. Анализ нуклеотидных последовательностей показал, что кодирующая часть гена son содержит да крайней мере шесть областей совершенных тавдемных повторов. Таким образом, одной из основных тенденций эволюции гена son являлась внутригекная мультипликация последовательностей.
Мономеры разных областей повторов не имеют между собой значимой гомологии.
3. Анализ предполагаемых аминокислотных последовательностей выявил консервативность последовательностей повторяющихся единиц о дави участков тандемных повторов и отсутствие жесткой консервации в других участках. На основании данных анализа можно выделить функционально важные участки
белкового продукта гена зоп.
4. Анализ выявил присутствие мотивов, отзечаицих у некоторых ДНК-связывакщих белков за сиквенс-нззависимое связывание с ДНК. Аминокислотные последовательности повторяющихся единиц, ■содержащих "эти мотивы, консервативны, что подтверждает предположение о наличие у son-белка ДНК-связываищэй активности.
5. Определена первичная структура асп-родственного участка, геномная локализация которого (iq21> отличается от локализации гена son (21q22.11). son-родственный участок, явлпнцийся, вероятно, псевдогэном, содержит на 3' концэ поли(А) тракт и фланкирован прямыми 22-нухлэотиднамл повторами, что, видимо, указывает на его происхождение в результате ретропозиции. Гомология нуклеотидных последовательностей гена и псевдогена составляет 96S.
В области повторов псевдогена отсутствуют 5 мономеров, присутствующих в гомологичной области гена son.
6. Обнаружение в кухлеотиднсй последовательности геЕа son нескольким областей совершенных трядэыных повторов с негомологичными последовательностями мономеров, а твк»:е наличие в гене eon мультипликация мономеров, отсутствующей в псзэдсгене3 соответствуют представлениям об определяющей роли геномной локализации в мультипликации ДНК. В рамках рекомбинационгюй гипотезы образования тандемных повторов полученные даяине могут расматриваться как подтверждение определяющей роли геномной локализации в функционировании горячих точек рекомбинации, а локус хромосомы 21 q23.ll, в котором расположен гея son, может рассматриваться как горячая точка рекомбинации.
СПИСОК РАБОТ, ошшликсзанных ПО теме ДИССЕРТАЦИИ 1.В.Е. Блнскоэекий, Ф.Б. Бердичевский, A.B. Ткаченко, М.Е. Белова, И Л*. Чумаков. Яодируицая часть последовательности малого тракекрипта гена son содержит четыре области соверазнаах тзвщемшгх повторов. /J Молекулярная биология, Т. 26, 793- 806; 1992.
2. B.B. Блискозский, A.B. Кириллов, B.M. Захарьев , И.М. Чумаков. Ген son человека: большой, и малый траискршты содежат разные 5'-концевые последовательности. // Молекулярная биология, Т. 26, 807-812; 1992.
3. В. В. Блиоховский. Тандемные повторы ДНК в геноме' позвоночных: структура, возможные механизмы образования и эволюции. // Молекулярная биология, Т.26, 5, 965-932, 13Э2.
4. В.В. Блискрвский, А.Е. Кириллов, К.С. Спирин, В.М. Эахарьев, И.М. Чумаков. Псевдогон son нэ содержит пяти повторяющихся элементов области совершенных ■ тавдемных повторов, приоутствуших в гомологи-гаой последовательности гена son. // Молекулярная биология, Т.37, 1, 1993.
5. Блисковский В.В., Бердичэвский Ф.Б., Чумаков И.М. Участки генома человека, содержащие аналоги онкогенов и ретровирусов. 4. Первичная структура mos -родств окзгого участка АО локуса ORAgpS. // Биоорган, химия, 1389, T.Í5, 484-451.
6. TKaobsnko A.V., Eucfiman V.l.., Bliskovsky V.V., Shvets Yu.P., Eisselev L.X. Exona I and VH of the gens (Ker10) encoding human keratin 10 undergo structural rearrangements within repeats. // Gens IIS (1992), 245-251.
Т. B.B. Блисковский, ¿.В. Кириллов, К.С. Спирин, И.М. Чумаков, В.М. Захарьев. Повторявшиеся элементы нуклеотидной последовательности гена son. // Материалы второй всесоюзной конференции "Геном человека - 91", Переславль-Зелесский, 1991,с. 64
8. A.b. Ткаченко, В.Л. Бухмап, В.В. Блиснозогий, Ю.П. Швец, Л.Л. Киселев. ' Sksoís J и VII гона кератина Í0 человека подвергаются структурным перестройкам в обласги повторов. // Материалы второй всесоюзной конференции "Геком человека -91", Пареалавль-Залесоккй, 19Э1.с, Б6-57
9. L.X. Kisselev, I.K. Chuaakov, P.B. Berüiobavalíy, 7.7. Blls£ovs2qr, H.E. Belora.// Maaaalian mos-related ¿ansa. Ins Highlighta oí modern bloohemiatry, VSP, Dtrecht, lohyo. Vol. 1, pp. 541-549, 1989
- Блисковский, Валерий Викторович
- кандидата биологических наук
- Москва, 1992
- ВАК 03.00.03
- Структура и эволюция гена аоп человека
- Клеточные гены, родственные генам вируса саркомы молони
- Mos-родственные нуклеотидные последовательности в геноме высших эукариот
- Разаботка и использование эффективности системы ретровирусного переноса и экспрессии генов в клетках млекопитающих
- Картирование генома американской норки (Mustela vison)