Бесплатный автореферат и диссертация по биологии на тему
Структура и эволюция гена аоп человека
ВАК РФ 03.00.03, Молекулярная биология

Автореферат диссертации по теме "Структура и эволюция гена аоп человека"

российская академия наук

ИНСТИТУТ МОЛЕКУЛЯРНОЙ БИОЛОГИИ имени В.А. ЭНГЕДЬГАРДГА

на правах рукописи УДК 577.212

БЛКСКОВСКИП Валерий Викторович СТРУКТУРА И ЭВОЛЮЦИЯ ГЕаЧ эоп ЧЕЛОВЕКА

Специальность - 03.00.03 молекулярная биология

Автореферат диссертации на соискание ученой степени кандидата биологических таук

москва 1993

Работа выполнена в Институте молекулярной биологии' галош В.А. Энгелъгардта РАН

Научный руководитель доктор биологических наук И.М. Чумаков

Официальные оппоненты:

член-корреспондэкт РАН

доктор биологических наук В.Г. Дебабов

кандидат биологических наук П.Г. Георгиев

Ведущая организация - Институт биологии гена РАН

Защита состоится в ¿Г часов

на заседании Специализированного совета Д 002.79.01 при

Институте -молекулярной биологии РАН по адресу: 117984, Москва, ул. Вавилова, 32

С диссертацией-можно ознакомиться в библиотеке Института молекулярной биологии РАН. Афтореферат разослан ¿^<¿¿^/'1992 г._

УчедыйгСБкретарь Специализированного совета канд. хим. наук А.М. Крицын

ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность проблемы.

Тавдемные повторы пвтрокс предстаэлезы в геноме эукариот, в том числе в генсмэ человека. Многие локуеы генома, содэрхащие тавдэмные повтора, являются гипервариабельннми (варьирует, число мономеров тандемннх повторов). Частота новообразования аллелей в областях тандемных позторов может составлять до нескольких процентов на генерации, что определяет исключительную роль дупликаций и делэций мономеров тандемных повторов в эволюции генома. Высокая скорость эволюции областей тандемных повторов, определяицая высокий урозень гетерогенности популяций по количеству мономеров тандемназ. повторов в этих областях, обусловила широкое использование зондов на основе последовательностей повторявшихся единиц в судебной медицине для идентификации личности и определения различных уровней родства.

Тандемные повтори обнаружены как в пзкодирупцих, так и в кодируйте юс участках ДНК, в которых они могут составлять большую часть открытых рамок считывания. Кэзсоторне генк, содэрхсащ-те ",апде;дпю повторы в кодируемой частя, вызывают особый интерес иэ-за предполегаекой роли их белковых продуктов в развитии и поддержании определенных патологических состояний.

Несмотря на очевидную теоретическую и ^практическую важность понимания механизмов образования и эвслиции тандемных повторов, эти механизмы но прежадагу остажтся неясными. 'одним из наиболее эффективных, методов изучения этих механизмов является определенна шрвзмнгй структуры таядэмннх повторов и послбдутеий анализ нуклеоткдЕнх последовательностей, ¡оозвелягпцй выявить гарезстерЕнэ черты структуры повторяшккся областей генома.

Иссольяовешиэ э хачестве модели для изучения механизмов образования и эвелзции тандэжгых цззтораз кодирующих участков генома позволяет така® пркмеыт. полученную информации о структуре генов для эняснЕения функций их белковых продуктов.

Работа по изучению гена son была начата в Лаборатории молекулярных основ онкогенеза Института молекулярной биологии и продолжена в груше картирования и сэквенирования генома человека. Первый клон кДНК • гена' son был выделен б результате гиЭркдизециошого скрининга библиотеки кДНК эмбриона человека при помощи гена К51 крысы в качестве проба. Анаша первичной структуры ДНК этого клона (1,3 kb) выявил наличие в кодирукщеЯ части гена son области совершениях тандемных повторов. Учитывая актуальность проблем, связанных с механизмами образования и -эволюции тандемных повторов, а также возможность использования нукпестидЕой последовательности гена son для выяснения возможных функций его озлхозого продукта, было принято решение о дальнейшем изучении структуры гена зоп. Заключительные этапы представляемой работы выполнялись з рамках ГНГП "Гевом человека".

Цели z задача исследов ания.

Первой цзлыз экспериментальной части данной работы явилась расшифровка первичной структуры кодирующей части гена son человека.

Анализ полученной нуклеотидной последовательности показал, что кодирующая часть гена зоп содержит по крайней мере шесть областей совершенных тандемвих повторов, что делает ген исключительным объектом для изучения факторов, влияещих на мультипликации ДНК и последующую эволюции повторов. В нестояща б время актизно дискутируется роль двух основных факторов, влиякщкх на мультипликации ДНК нуклеотидных поопедоБатольностей мультиплицированных фрагментез и 'их геномной локализации. Для изучения роли этих факторов бал проведен второй этап исследований.

Цельэ второго этапа экспериментальной работы стало клонирование и сенвеяирование аоп-родственного локуса генома человека, гезоаная локализация которого отличается от локализации гена son.

Научная новизна и практическая ценность работы. В ходе выполнения работы впервые определена перзичаая структура трокскрипта гена son (EMBX. асо. no. Х63753) и часть

последовательности альтернативного транскрипта (ЕМВ1 асо. no. Х63751).

Анализ нуклэатидных последовательностей показал, что кодирующая часть гена son содержит по крайней мэре шесть областей совершенных тандемных повторов, причем нуклеотидные последовательности повторяющихся единиц каждой области не имеют значимой гомологии с нуклеотидными последовательностями повторявшихся единиц других областей.

Анализ предполагаемых аминокислотных

последовательностей показывает, что аминокислотные последовательности повторяющихся единиц одних участков тандемных повторов являются консервативны!.®, в то время как в других участках жесткой консервации не наблюдается. Анализ выявил также присутствие мотивов, отвечавших у некоторых ДНК-^чязыппктпих белков за сиквенс-незавиоимое связывание с ДНК. Аминокислотные последовательности повторявшихся единиц, содержащих эти. мотивы, консервативны, что подтверждает предположение о наличие у son-Оелка ДКК-связывающей активности.

Определена перв:*чная структура аоп-родственного локуса (ЕМВ1 аос. no. Х63754). Локус, являющийся, вероятно, псевдогеном, содержит на З'-конце участка, гомологичного гену зоп, поли(А) тракт и фланкирован пряными 22-нуклеотидными повторами, что, видимо, указывает на его происхождение в результате ретропозиции.

Гомология нухлеотидных - последовательностей гена и псевдогена составляет 96%, однако в области повторов псевдогена отсутствуют 5 мономеров, присутствующих в гомологичной области гева зоп.

Наличие в нуклеотидной последовательности гена son по кр&йкей мере шести областей совершенных тандемных повторов с пегомологичрыми последовательностями поаторяпцихся единиц и мультипликация мономеров в гена eon при ее отсутствии в псевдогена соответствуют представлениям о превалирующей роли геномной локализации в мультипликации ДНК.

Апробация работы. Работа была долскена на заседании объединенного научного коллоквиума группы картирования и

секвестрования генома человека и KHK "Молекулярные основы дифференцировки и развития". Основные результаты исследований докладывались на. второй всесоюзной конференции "Геном человека - 91", Переславль-Залесский, 1991.

РЕЗУЛЬТАТЫ РАСОТЫ И ИХ СЮСТЗДЕНИЕ Нухлеотидвая последовательность клонов кДНК гена son. Первый клон кДНК гена son длиной 1,3 Из был выделен ранее в результате пйриддаационаого скрининга ' библиотеки кДНК эмбриош человека при помощи гена К51 крысы в качестве пробы. Содержащийся в нем фрагмент ' гена son был секвенировал (БердичеЕСкий и др., 1983)'. При выполнении представляемой работы пробы на основе этого клона были использованы для скрининга библиотеки кДНК иа плаценты человека. В результате проведенных циклов рбскрининга библиотеки хДБК эмбриона человека с использованием в качестве проб Б'-концевых участков вновь выделенные фрагментов кДНК человека (использовались радиоактивно-мечеппыэ РНК-зонды (рибоххроба) и ДНК-зонды, полученные в результате них-трансляции и полимерагной реакции) было получено несколько клонов, содержавших фрагменты последовательности гена son. В результате секвенирования этих фрагментов (по методу Сэнгера, о радиоактивно меченными дезокоинуглеозидтрифосфатами) и соединения нуклеотиднык последовательностей при помощи программы DNASIS была получена последовательность транскрипта гена son человека длиной 5675 п.н., обозначенная sarr-a (рис. 1,2а).

Последовательность scn-a включает 5' копцезуг некодирутацуи область длиной 414 д.н., открытую рамку считывании длиной 4569 п.н. и 3' концевуи некодируицуЪ область длиной 692 п.ы. Иныо протяженные открыты© рамки считывания в последовательности отсутствуют. Кодируемый малым транскриптом белок состоит из 1523 аминокислот, расочетвая масса балка составляет приблизительно 170 kDs.

При проведении последнего аж:ла реокрининга библиотеки кДКК плаценты человека было также выделано несколько клонов

Pito 1. Структура последовательностей scn-a, son-b и псепдогена зоп-р. Показана точка дивергенции последовательностей ?оп-а -л son-b, первый АТС кодон и тврз'кируппий ПГ"-А кодон какбользей открытой peían-: счетнвания son-a. 'Обласш совершенных тавдекных поьтсров последовательностей =оп-а (Н1, R2, R3, п4) и son-b (BRI, BBS) обозначены прямоугольником. Показана структура области R4 зог.-а и гояологи"еоВ ой области повторов последовательности зоп-р. Стрелками в гюслздавательности яоп-р оООЕяа'тзкы лря;^ые 22-кухлеотигвые повторы, фяенккругщие scn-гомсшсги'пшЯ участок.

•оп-ь

1 АТввСС 1

7 ССАвААТСССАТАТАТТАвСТТСТААСАСС 2

37 АТвв Ай ДССС АТАТАТТАвСАТССААСАСС 3

- 67 АТ66 астссс а а лтестАбсстгсА ас асс -. 4—

97 АТ5вАСТСССА8 А76СТАБСАТССААСАСС 3 г

127 АТВ6АСТСССАвА78ТТА6С8ТСТАвСАСС в 1

137 АТвбАСТСССА6АТЗТГА6С ААСТАвСТСС 7—

187 АТввАСТСССАААТБСТАбСвТССАДСАСС в—

217 АТвбАСТСССАвАТеСТАбСАТССАлСАСС 9 I

247 АТ£вАСТСССАвАТвТТАВСбТСТАбСАСС 10 !

277 АТббАСТСССАЗАТвТТАбСААСТАвСТСС 11—

307 АТ6 ВАСТСССА8 АТ5ТТ А8СААСТА8СТСС 12

337 АТвв АСТССС Аб АТ5ТТА6СА АСТА6САСТ 13

ЭЙ7 АТевАСТСССАвАТвТГАБСААССдеТТСС 14

397 АТВВАСТССС -Л АТВТТАвСААССАвСТСС 13

427 АТ68АСТСССАб АТбТТАвСААССАвСТСС 18

437 *7ВВАСТСССА«АТ6ТТА8СААССА6СТСС 17

4в7 1Т6в АСТССС А6АТ6ТТА6СА АСС АВС АСС 18

317 АТ8вАТГСТС*8АТ6ТТА6СААССА6САСС 19

547 АТ86АСТСССА8 АТвТТАбСА ДСТЛвСТСА го

577 АТвв АТТСССАЗ АТеТТАС.САТСТЬвС АСТ 21

607 АТбв АСТСТСАААТЕТТ АЗСТТСТввСАСС 22

С37 А Твб АТ5СТСАвАТвТТАбСЕТСТввТАСС 23

667 АТ66А >6СССАбАТ£ТТлеС8ТСТА6ТДСС 24

637 СААелТТСТбСТАТеТТббвТТСААААТСТ ?3

727 ССТ

730 5 АТССС"* А Т А 65ТТ А6СТС Аб

731 вАТССТТАСАвеТТАвСТСАЙ

«Ж-« 772 6 АТСССТАТА 96ТТВевССАТ

753 в АССССТАТАВАТТАбГГС АТ

1 йЗСвбб 6 б С ААС 5аС АССБСЯбАвТТйССбЗввСАбСС ТТС 56 Г 6 АСТ6 814 5 А ТВСТ7А САБЕТТАовА»АА

31 ввбТ6ССАЗА8ТТВССА668СТгесГГС66СААСТА65еСАСТбвА6ТТа 833 в АСССТТ АТАб АТТАЧвСС ДТ

101 тсбЗвбСАбсстбТбоСААазеббСАстАвАптзссте^гс^стсАТ 8АТСССТАСАвАСТААСТССТ

131 беслбС7ечбзсАСТбвАвпсгсбвевСАйтсгв8б5САбствбАЗСАС 877 6АТССС7АТАввАТ67САССТ

201 7У5А5СТТТТС&6БСА6С'СТС1вССААСА6вС5ТвС7В£А6ТТ5ССАй»в 8Э9 АвАСССТАСАввАТАвСАССС

221 СА5сстебебсесг.А5А5Ттвхта«есАвсс1СТ9бСААСтетбесяст 919 А66ТССТ АТАв ААТАвСА&СС

301 66*6АТСТСТ6ТТСА6"ГСТ5»В6Т6АСЛЛСАТСБ€А6С73ТСААС6АГ6А 940 А6БСС АТАТАввТТАвСАССТ

331 ссететсесАешсстбСАепессстсеАсеАСАбСбств^ААТСстАТА» 951 АбАСссствлтаттАвСАТст

403 ТАС эза АбАСвП'СТАТвАТ8АТ57С^Т/.Т5СтеСА

6ААС5ГТСС

419 А ТВ АТ6ТС АТСТГ *С 8ААС8СТСТ 1

438 АТСАТ6ТСТ ТАГ 5А££££ТСТ С

440 АТВАТЕТСС ССТАТв вС76ААС6СТСТ 3 А1

487 АТ«АТ5ТСА6ССТЛС 8А6С8СТГГГ 4 В1

511 АТ6 АТбТСА6ССТАС 8Л6С8СТСТ 3 82

333 АТвАТСТСС ССТАТв СТВАвЕбСТСТ в А2

562 АТ6АГ5ТСА6СТТАТ 6АДССС7СС 7 вЗ

£В5 ЬТвАСеТСАССТТАТ &ААС6СТСС 8 84

61Э АТбАТбТСС ССААТС 6СТ8*ТСЗЛГСТ 9

атсатстсс А7* ебжгг&АСсветст ¿о

ЬБ4 АТЗАТСТУСТСАТАСТСТйСвСТСАССедтСТ 11 гл

•597 АТС А ТС ТС АТС 5Т А(,ТСТ&££*Сте А£С£ АТСТ 12 С2

710 АТеАТвТСАТСТТАТАСТ 8СТС А ТС6ТТСА 13

780 АТСАТРТСТ АТв вСЖСТвАТ ТСТТАСАСС

790 САТ ТСТТАСАСТ

8АСАС АТА7АСА8 А6

6САТАТАТ66Т6

829 ссАСсттт^пстсствА^йисссссААСАлтз :

£62 ССАССеТГРССАССТВА^^СдССАлТКЛСА 2

833 ссАССАТтеестсстбАСТ<дсгАССАСАСб5Т э

зге ГСАвСАТТКССАСТвАвСЩТСДбСАТГА^СА 4

ЭС1 6СТбАЛЛЛТЛСТТв-ССТ*>6А<;бТ^СА*а

1061 САеСЛЧТВССТАСТ64тГПЛ^П53'СЛЬСДТСА31,ТСССТСА»'ГТГГАЗТАТГАЧАВ£СТгСТС;ТаАС ГЙТГССАвААССАССАССАйА^ССАЧАЛТе

1131 Т7СААТТА::5ТТААСА^СТГ1*«АСТС7ЕСАЧТ^ТА^САе^

1Й51 А7ВТСАЗСТ$ААССААГтег*ЛАееАТСА^еСеГСГ75тТеТСАеАРА^

1381 ААеТАТСГАСАТ(;ГГТ5Т75СГТССАЕСАвТААСГА':ТССАС7е

Рис- 2. а, Нуклеотвдные последовательности аоп-а и боп-Ь. Последовательности содержат разные 31 -концевые участки; начиная с 406-го ыукл^отида эоп-а и,соответственно, 1021-го нухслеотида зап~Ь, нуклвотидные последовательности идентична. Области повторов выровнены.

1403 STS6CA6AGAGS ATT 1

1420 сгезАессбссАвссАТвег.гбсс г

1444 2CASA6TmCA5CTATeS-T6TC Э

14бв CTG6A6TCTTCBBCTETSACceTC 4

14ЭС СТббАбТСПСбАСТбТелСТбТС т.• •

15 iE CT 6 6 AßT СТТСС ACTGTAACT6TC С

1Г.4С СТв&А6ССТ7СЁб7ТбТеАС7бТС ?

ссевАбзстсствттствест а

Í5P3 6А6ССЛвАСТСТ6ТТ*.ССАТТ s

lees сстетессАвттвтттстегв

J627 CT Ç 5А6С СТТ СТвТ ÊC CT БТТ «

1648 СТвЗААССАвСвеТСТС* ETC дг

J 669 Г.7ТСААССТТСТАТСАТГ БТТ 13

1ESO ТС*ВААССАТСТеТТТСТ «TTC Î4

171Í С A" S A AT С 6 АС7 БТ 6 АСАБТ7 15

1732 TC'ASACCCTSCTçTC ACASTC 15

17D3 TCA5A6CAGAC7CAASTA ATA 17

1774 CCAACTßAG6TGGCTATAS\ETC^ÄJ4Ct,AATßA7ACT'C6AA'"CTA',;TATCATCTCATCACAT£TTAT€;AÄAe6AATTAftTCTATwCTCTr6TGAT^AAA

JB74 TTCrreCTCCA6ASATTS?CATSCkSSASArr£CATTECA11CA65T3AASAACCACATGC^ASSAAC*CCTCAAASGTSACmTACSAAASTGAArA

1974 TESTA7AAA7A7A 3ACCTTAATATAAATASTCATTTAATT6CTAAAS4SA'r63AACAT*ATAPA6T5T5TCCTBCTP67AwTAbTCCT6'rrFGSSAAATT

£074 'tí6TSAA6AtóAAAAmTSCCCACCASTSAaACTAAACA6C6CACAeTArr06ATA^TACCCTeST^A6TWA6CT6ATSCAe6AeAAACTCTATCTT

Si/A CTACTeSTCCTTrT6CTCTe6AACCTSATBCAACABGAACTASTAAS€8TATTSAATTTACCACA£S*7C7A'TTCTCA?TTTA5TTAATAAATAT8ATCT

2274 Т0АГГТАТС7ТТААСТАСТСАА6АТАС7РААСАТБАС*ТвВТААГААТГТССАС^^

Г374 ССТААА5ЛТА77САТСГТЁАТТТА ССА7ГТААТААТААССТ7£77А£7ЛДВ&АТ4£464А£ААССДТТЛГСТСТААААБАёАБТ&Д?СА£АСААТД£СА£

2474 ССТТ6СТСА6ССГ7»ЛА6ААА67ЛС766АР6А6ЛААААЗАА67АССТСССССТСС7ААА1А^САСТ€^Т6АТТСА36АТТ"ГТС7БССААТАТТБАБ6А

2574 7 ATTААТС A ASC Л ~ АТТТ А 57 G A SA CCSTT АСТ7 С СТА A fifi АСA7G6 А AC 5ТС TT А С АА'ССТТA 6ACCT 6SJATTB AAS G А GC TT Т А СТТ6С A AßT 6 AT

->ЪЦ ETTSêACGTS АС АС AT^6CTGCCA~C^b?TTfeT ААСТ AST ATGCC А 6А A AéASCT i CMSAGTCTTCTTCASAôGAAAA AG АТ6АТТАТ6 A A' TT Т Т Т С

Z? J< ÏAAAAG ГГААСВАСАСТ^АСйямААЛАА'СААЗАЛААА! АЯ?АЛССЬТВАТАА\^6Ъ^АСАААЗа6£Л5ААААЗ^

2874 SCg TTC С AA A î С TT С TP A A Ç АС A A A ТС/ С 6C A A'ÎCG ГАС "î A 3 Г£ A A ТС TCÊ ТТСТА G SSCAASA AASA5 АГСАТСТА A S ТССAAG T CTCA ТС ^ CTC T СA ~

2274 A^ACGTTCACS" rCAC5TTCAAGAC3^AÇÇÀE^A5AAi3CA5CA6A.TCAACAT'AAAS7ZTAGA6EAATAA£AYCTB7ATCAA.*.AGA6AAEC3"AAAAGA7

3074 CTCCAAA?^ACACATCCAA3TCTA?«SAAASAAAAASAAAAAGATCAAUCTCCASSS AT AACC •i A Ai ^AC ASTT

314Ü A6AGCTCCAA£TC6AACC 1

?1БЬ CCAA oT С STC ß S AST C6S AST С AT ACT Z

3is»3 ССА»5ТПБ1С6АС6АА66ТСТА2АТСТ£Т6€67А6^5ААБ&А8СТТТА5САТТТСС 3 ai CCAA6CC ВС С ftC ASC С SC A CC 4 f»l

9271 CCCAECCSCCGCACCCeCACC 5

12SI DC DA GZ£ BCCSCA ECCCCACC 6

cccascccccsoxccscacc 7 im

523 ' CCCASCCGCC6&A6CCCCA'ùC В US

3255 CCTASCCeTCCSASCCCCACC 9 t6

5376 С СAASCC 6C С6БAS АА £ATCAACSTCT 6T36T AAS.'AC AC S A A SCT7 ПASTAT C7C A 10 iC.

S £33 0CASTCASATT4ACCCe*.TCAAeAÄCACCCTTAA«A«.<iAAe СГТТА&САР ATCT 1 i

?437 CCCATCCSTCCTAAAASATCCAGBTCTTCTCAACCABECAe 12

342S ATCACCCAAACSTClGACASATTTbCATAASSCTCAATTACTTSAAATAGX/UAJCT^

?52S CCAAAC"TA\APCCT6C»C<r.TCCACCTACTATA¿TT£A5AÁAúi Т?СТААА*АСТСАЛ&ЛБС45С7ЛСТАТА5ААЗААСТА1СТЗА5ААА73ТААЛСАЙЛ

3S2E TCuCACASAGTAAAeAAFATrATBATeTAATASTBAATAAACCTCATG ГГТСЗбАТСААСАбВААЗААГАЛССТСЗТТТТТАТСАТСАТСССТТТАА/.СТ

"723 САСТЪ*АТТТЛААССТАТТГТТГТСААТ;;ТЬАА1 ATTGCTPCASCAAAACCAACTCC^ 3629 TC70GA7CTCAA£ATC36AAAAAACAA6CSf»ATKST6YTTAT66AfcAATS66TTCCT6TSWGAA*^

S92ô ÎC АС С A S С M T TT 6 CC CTC AS A& ÜC ? ^ ? 6 3 АС АТС 7 СТЛСА£ С AAÎ W ЗТЗ А А - S 3"> ~ ACTTtCTC.4 J AA^ X SA С TCAG TC 46 A AT Б С A7TT P АТС TT В А

<2 029 АВССАТОАоСА7ЁТТАЛАТАеА6С7САССЛ*ДВЗЛТ7£ vrBCCTߣßCTCAGC76A407CTA77CC^

41£5 TT 9 >.C АС А А Б А А V A 5TTBG С - A AT ACT В РТЕ СС J A ABC CT SS АТТ А/.Л A A S 6 АТС A S TTC ГГ АА.6 АСС Л6СССС35ТлЛС Т 3 & А Б БА А76 б АА К СС5 ТТТ

AZîQ ТЗАТСА6АЛ *AATi,c'3"7ê6A'îAÉAAS îA~AA5ô*TT&G€AA/^AACAAA£A%9GCAAC&£56AACCCATCCTAJTT£ATTTC

432Э TCTT£»TT£CAGTa5SACAÍ.AC АЗСАСААААЗА6^7СТеё~ААС7ТСТСТ6СТ8СААТСААДЗАТСТСТСАгГ^АЛСАТ^

4428 - A7CT67AATAAAAFА AC 3 Т вЗ СА С СЛСС Т 5АлТТГ С Î ATT 5STCH А7 SATA 3 TG ССССТ2АТСЛТСВСХАчС АТТТ7С7С7ТТЛ3 й S ТATTGATА ААТ S

4328 SA А6Г6С П'АССАС СССА £?77ТГ»> CCASCCCT AATÄ АСАлССАТССТАААЗССА CAS^AeCTACtfiTSiiTTLTTCA *6С AATGSCCC7TG ГА ГС A -A SGA

4 32в ССТСАТеЗЛААТЕСЛСТТССПСАЧбАЬТСССТСАСеТАВАТАбАТ^

4723 С7~ТТТЛ АТБТТ6ТААА7АТТТ«£САЧ7ТТ^»аСАТ7ЬТ5«А>»А^э£ААГСТ67АА*А^ iCT AT

432e.v TTА А С С ATАОA ôB S ÏTTT J Ti AT6TTT AT ATT OTT T ACC TT AST 6AT3 7АТТТ 5TTTAA ST6 3CT AACATCCAAA С " AC 7 à TT ТС Л A S3 С А ТС А Б A S Т/, Д 4923 ХТСТТСЛ5ТГГ0&АиЁ7ТААА7АЛСгСГГтТАСТГГАТт

Я020 TC4STeA/.¿'SECTST3CACCTípTACT#TT7C* СААТ55£7Т^Т«СТ35АСАвА7ААТй€?СГ-».К75ТГДТ7оАС573АТСАА2А7СТСТТССА^А~?^

?Í23 TAATCCACC/TCTCCCC7CAAAATTTTSTAf'wèTjTCTAAAAA&AAAST'îôrATGrrS'reî OATtí»TCA6CA£T*A57CC7BCATT"CTSTTAAA5,:Cí.C

ягго 7T6GS7CA7A АВААО5СЛЭ7ААА^ ААТвАА5ТСТ6АСт#вЛ^ТТС7АТТ86САСАГ5ССАА5ТАСАТТГАСТАТ6ВСАТГСА5ТТ6'»6А7АТАЗТТТТАС

53Z9 ТТТ С AT6TGÎ АТТТТ6 А АТТТС Ч*5С7АГ^АССТА6 АТАС ACS Т AAA А Т^АТААТТААА АТС^Т ВТ АД А Аг ÎTATC TAA'AAAATTGGCAA'Í.AüCCACV

5428 АТ7ТТ?тТСА*,ТАТ|5лдайАА^ТТААМ37ТТА73Т7ЛАТГТТТАВ5ЭТС ГбАТА5ААТЛ.ТТТСАТвТ6ТАТТЛСД9Т357АТТСАТАТВСТАТ6ТСТСТА

Ь-ге А .'.С ГГТАТТТТСЛ АААг:ТТААВССССЛАА7АСААЛГТТС;СТЗСААТААААААААААА 3 '

Fi-tc. 2, а. Продотаениз *

1 3 13 23 33 43 53 63 73

аз

93 103 113 123 133 143 153 163 173 183 193 203 213 223 233

243

244 251 258 265 272 279 286 293 300 307 314 321 328

есш-Ь

МА

PESHILASIT METHIbSSrr MDSQMtASXT M&SQMXAarF MDSQMLASST MDSQMLfiSSS

MDSQML8®T

MCSQMLfíSST

MDSQMLÍSST

MDSQML8SS5

HDSQMLSSSS

MDS0MW3ST

MDSQMbSTSS

MDS815LÍ3SS

MDSQMUQSS

MDS0MLÉ3SS

hdsqmleesx

MDSQMLfiEST

MBSQMLSSES

MDSQMLfiSST

MDSQMLÍSST-

mdaqmlásst

MDAQMLSfiST

QDSAMbGESS

P

DPYRLAQ DPÍELAQ DPYRLGH DPYRLGH DAYRLGQ DPYRLGH DPYRLTP DPYKMSP RPYRI&P ESYEIAP RPYKLAP FPLMIAS RRSMMMSIñ

1 2 ■ 3

4

5

6 7 6 9

10 11 12

13

14

15

16

17

18

19

20 21 22

23

24

25

AERS

Рис. 2,6. Предполагаемая еминокислотная последовательность son-a и son-b- Области повторов выровнены. Поскольку предполагаемая кодирующая часть последовательности аоп-а начинается с 415-го нуклеотида и последовательности совпадает начиная с 406-го нуклеотида аоп-а, то кодируемый son-a белковый продукт является урезанным вариантом продукта, кодируемого последовательностью son-b.

1 шет EES 1

9 MMS У EES 2

16 MMSPM AEKS 3 Al

25 MHsaar ERS 4 Б1

33 MMSSI BES 5 B2

41 MMS» AERS 6 A2

50 MMSSÍ ERS 7 B3

53 mmssy ERS 8 b4

66 MMSSH ADRS 9

75 MMSH gadr3 10

84 mhisjysaadrs 11 C1

95 mksmsaadrs 12 C2

106 KMSS7 TADRS 13

116 MMS H AAD SYT 14

139 150 161 172

192

D SÍT ГОУТЕ AYMV

PFlEñSEPPTM PPITPSEPPMT РРЕРРЕЕРРЕО PAbfTEQSALT

202

1

2

3

4

212

222

232

242

ftENTVffTOTSIPS2^Sl№EP?VSQSEISEPSAVPTDYSVKASDPSVLVSEAA^'r/PE 252 262 272 282 232 302

PPPEPESSITLTPVSSáWAEEHSVVPESPVTCMVSETPAMSAEPTVIjAGEPPVMSETAE

312 322

TFDSMRASGHVASEVStSIiVPAVrrPy

X 2

3

4

5

6

7 Рис. 2,6. Продолжение.

8 9

10 11 12

13

14

15

16 17

472 482 4Э2 502 512

1РТетА1Е5ТРМХЬЕЕ31М35т/МХа1НЬ35СМ1ГЛРЕ1СМеЕ1ЛЬН£СЕЕРНАЕЕНЬК 522 532 542 552 562 572

532 592 602 612 622 632

УРСТ5К№АСЕТЬ85ТарРА1^ВАТСТ5КаХЕтА5ТЬБи?ЯШ5У1)ЬЗЬТТа1ЛЕШ> 642 652 662 672 682 692

МУ I1 ЗТЗРЗССЗЕАР1ЕСР1Л'А1Ш1Н1Л)ЬРа1гаЬУЗК111ЕЕРГг7КЕЗ]0аТ1ААЬЬ8РХ 702 712 722 732 742 752

ЕБ5(КЕК^РРРККГЬ?ВЗаР8АН1ЕЕ11НЕА0ШгРЬЪРКРНЕ51.ТБЬКА012СРЬГлАВ 762 772 762 792 ■ 802 812

822 832 842 852 862 872

РНЫЩЕЗКХЙКЗЗШКЗНКетЗЕЗКЗХШШЙЗХбКаПЕеТШВЮ^ЛЖЗЗКЗКЗХ

882 892 902 912

ВКСКЕЙ'/ЗКЕИШгЗРКНЕЗКЗЯЕНККЖБЗЗШШЕПтА

914 КЗКГ 1

918 РбЕНЭНЗ НТ 2

927 РБНЖР-ЗКЗУСРККЗРЗ! г 3 а1

946 ренкзет 4 Ы

953 РЗПЕЗЕТ 5 Ь2

960 РЗЕИЗЕТ 6 ЬЗ

967 РЗКНЗЯТ 7 Ь4

974 рзшгзкт 8 Ь5

981 РЗННЗКГ 9 Ь6

9В8 10 а2

1007 руншгзкгрышг ЕЙПЗ 11

1025 12

1049 1059 1069 1079 1089 1099

?КР1Л,ВЬВКАеи.Е1АКАКААА1ЯАКАС\Ф1^РКЬа>АРРРТГгЕКЛ'АККгССАТ1ЕЕЬТ 1109 1119 1129 1133 1149 1159

KKCKQIAЭS¡CËЗ)ЬPVXVДK®IГ^'SI)FJЖ£EPPIГУHKPFKI£EFK?IF5'йIÍ^IAAAKPTPPK 11Ь9 1179 1189 1199 1209 1219

ЕаТО^ТЕЕУЭТБСС ЗЩКККЕАС5'ЛГ(Ж'гУ?\'Е1йгеЕЕНЕВОШГГ5БНЬРЯЕР\'Г>1 БТА 1229 1239 1Я49 1259 1269 1279

Х269 - 12СЭ 1309 1318 1323 1339

1349 1359 1389 1379 1369 1399

УА7аЕКАвЕР£Сет5ААИК1Я53ЕКР73ШЖ1СЬТ^

1409 1419 1429 1433 1449 1459

1469 147Э 1489 1499 1509 1519

нрыььсптттлтшмаистьсккезтатзге^

1529 1539 1549 1559 1569 1579

ТУГРЧ

331 1АЕ31

336 ЬЕРРАМАА

344 РЕБЗАМАУ

352' ЬЕБЗАУТУ

360 ьеззтуту

368 ЬЕЗЭТУТУ

376 ЬЕРЗУУТУ

384 РЕРРУУА

391 ЕРЮЗУП

398 РУРУУЗА

405 ЬЕРБУР V

412 ГДРАУг V

419 МРБМ1 V

426 БЕРЗУЗ V

433 ЗЕЕТУ ТУ

440 БЕРАУ ТУ

446 ЗЕОТЙ V

462

кДНК, рсстрикционный анализ которых показал, сто структура их 5' концевых участков сильно отличается от структуры 5"-концевых участков выделенных ранее клонов, в то время как рестрикцшнная карта их 3*-концевой, части . полностью соответствовала рестрищионной карте последовательности аоп-а. Выла определена первичная структура одного из этих клонов, обозначенного aon-b (по методу Сэнгера, с использованием радиоактивно меченных

дезоксшуклеозидари£осфатов, или флюоресцентно меченных праймеров на секвеваторах фирмк Applied Blosystema). Нуклеотидная последовательность зоп-b представлена на рис. 2,а. Последовательность имеет длину 3,3 Kb, причем открытая рамка считывания проходит от начала до конца фрагмента. Сравнение последовательностей son-a и son-b показало, что они содержат разные 5'-концевые участки, в то время как начиная с 406-го вуклеотида son-a и, соответственно, ^1021-го нуклеатида aon-b, последовательности идентичны (рис. 1;2,а). Наличие абсолютно идентичного участка длиной 2351 ауклеотид а обеих последовательностях при расхождении 5'-концевых участков позволяет предположить, что расскатриваэмко последовательности принадлежат двум разным транскрштам газа son, образованным в результате альтернативного сплайсинга. Поскольку предполагаемая кодирукцая часть последовательности son-a начинается с 415-го нуклеатида, та кодируемый ею белковый продукт является урезанным вариантом продукта son-b (рис. 2,6).

Повторы. НаиОолео интересной особенностью нуклеотидной и аминокислотной последовательностей гена son является наличие областей совершенных тандэмных повторов (рис. 1 ;2,а). Области повторив расположены между пуклеотидами 403-783 (R1 ), 829-960 (R2), 1405-1773 (R3)-и 3148-3527 (R4) son-a и составляют более одной пятой длины последовательности. В последовательности son-b кроме трах областей повторов, идентичных повтора« son-a, присутствуют такие две дополнительные области повторов, расположенные между взгалеотидами 1-726 (ВРИ) и 730-1012 (ВВ2). Некоторые области состоят из мономеров равной длины с практически

идентичными нуклеотидными последовательностями - BR1, BR2, В2. Другие области - R1, ВЗ, R4 - состоят из повторяющихся единиц различной длинн со значительно диаергировавшими последовательностями, хотя некоторые их фрагменты,, как, например, первая половина R3 или центральная часть R4 могут рассматриваться как самостоятельные области повторов с практически идентичными мономерами.

В процессе формирования областей повторов гена son происходила кая мультипликация единичных мономэров, так и мультипликация блоков мономеров. Хорошей иллюстрацией данного принципа формирования тандемных повторов является, напримэр, структура области ВЙ1, в которой присутствуют как идентичные мономэры (11, 12 и 15, 16,17) так и идентичные тетрамеры i4.-71 и (8-111 (рис. 2,а).

Сравнительный анализ нуклеотадных и аминокислотных последовательностей повторяющихся единиц выявил консервативность аминокислотных последовательностей некоторых участков тандемных повторов. Так, например, в области R1 повторы одного теша (А, В или С) кодируют идентичные аминокислотные последовательности (рис. 2,6), в то время как нуклэотидные последовательности большинства из них различаются (рис. 2,а). Консервация аминокислотных последовательностей отчетливо выявляется, например, при анализе структуры повторов типа а области R4: нуклеотидные псслэдовательности al и а2 содержат 15 различий, в то время как в аминокислотных последовательностях присутствует лишь одна замена. Консервативными могут быть также отдельные участки аминокислотных последовательностей мономеров. Так, например, все типы повторявшихся единиц области R1 содержат консервативный мотив iBSS...RS, ь то время как аминокислотные последовательности центральных частей мономеров значительно различаются. Конезрвативннэ серины и аргинины кодируется раэннмк триплетами (варьируют последние буквы триплетов). Консервация аминокислотных последовательностей указывает, вероятно, на важную роль рассматриваемых участков в функционировании белкового продукта гена eon. Консервация аминокислотных последовательностей не была обнаружена,

i 1

например, в первых пяти повторах области R3, в которой лишь три из одиннадцати нуклеотидзых замен являются синонимическими.

Консервация мотива MMS...RS в аминокислотных последовательностях всех повторялцется единиц области R1 подтв ерждает наше .предположение о том, что инициация трансляции происходит с одного из AUG кодонов первого AUG дублета открытой рамки считывания. Интересно отметить, что, несмотря на наличие большого количества AIG триплетов в начале открытой рамки считывания, ни один из кодонов не фланкирован G в положении +4. Кроме того, лишь вторые АТС ко доны дублетов фланкированы пурином (А) в положении -3. Поскольку мРНК, инициаиторпый кодон которых не фланкирован ни пурином в положении -3, ни G в положении +4 крайне редки, трансляция, вероятно, начинается оо второго кодона дублета. Кластер AUG кодонов может выполнять регуляторнне функции при трансляции.

Гоыологня с ДНК-связыяашщяыи балкаии, Предполагаемая аминокислотная последовательность son-белка содержит участок (аминокислоты 816-1043), имеющий гомологии с ДНК-овязывааздими белками. Этот участок содержит область R4 и предшестЕукцуи ей область даваргированных повторов. На рис. 3 представлен один из возможных вариантов выравнивания последоватэльноствй son-белка, трех гистонов спермы и двух вирусных белков, у которых предполагается наличие ДНК-связывесщей активности. RRRS и ES мотивы, как про дполагае тся, представляют собой участки сиквено-дазавиоимого связывания ДНК. Интересно, что гоксамер, присутствующий в галлше и белке V196 мультиплицирован в гене son. Анализ аминокислотного состава рассматриваемого участка аоп-белка выявил высокое содержание серит (28.51%) и аргшиза (38.16Х). Большое количество еарика и аргинина присутствует также в состава зсэх белков, представленных на риоузнэ - галлина2 (i6,39S;5S,02X>, протаминс японского перепела (14,25%,-64,29%), протакиза спермы каракатицы (11,542;56,412), Е2 Селка папипломавируса человека тип 5

son-« 6alline2 Prot JQ SF-1 CF ZZpapS

852

373

son-a

874 HSEí!SUSK2XJ!KHS?}!KñS]í3ñEñl!ñKHSSSSDHB}!TüHft

son-a son-a son-a . 6alllnc2 Prot JQ S2pap5

son-a

UL96

6allins2

914 910 927

946

1

2

3 al

4 M; 5 Ь2

SO!)—ü 969 PSBBSB7 6 ЪЗ

son-a 967 PSRBSBT 7 Ь4

son-a 974 PSRBSBT 3 Ь5

SOIS—ü 381 PSBBSBT 9 ЪБ

son-a 388 PSRRBRSRSUU3BSSFS IS 18 aZ

son-a íes? PUHLEBSBTFLBBR-FSJJS 11

son-a 1025 PISSEBSBSSEBSBS 12

Рис. 3. Сравнение фрагмента предполагаемой аминокислотной последовательности белкового продукта гена зоп с последовательностями ДНК~связыванцих белков - галлипаЗ, протамина японского перепела, протамина спермы каракатицы, Е2 белка папилломавируса человека тип 5, 71.95 белка иридовируса тгш I.

(участок 246-340) (28,42%;3Q,53£), VI96 белка иркдовируса тип I (участок 420-560) (26,24X16,31%). Интересно также, что рассматриваемый участок son-белка, как и два вирусных белка, является пролин богатым (6,14; 6,32 и 24,82% соответственно).

Таким образом, в результате первого этапа исследований было показано наличие .в кодирухщей части гена son по крайней мере шести областей совершенных тандемных повторов, что делает ген исключительным объектом для изучения факторов, влиянцих на мультипликацию ДНК и поело душцуш ззолюциш повторов. В настоящее время активно дискутируется роль двух основных факторов, влияицих на. мультипликацию ДНК нуклеотидаых последовательностей мультиплицированных фрагментов и их геномной локализации. Для изучения роли этих факторов был проведен второй этап исследований.

Одним из наиболее перспективных подходов при исследовании роли геномной локализации и' нуклеотидной последовательности з мультипликации ДНК представляется сравнительный анализ структуры областей повторов родственных генов, имэвдих различную геномную локализацию. • Действительно, если родственные гены образуются в результате дупликации общего гена-предшественника, то, по крайгей мере ш начальном этапе раздельной зволздии, их нуклеотидные последов ателыюсти будут идентичны, и, следовательно, различия в структуре повторявшихся областей будут связаны Ее с различиями в первичиой структуре, а с влиянием других факторов, в том числе, вероятно, геномной локализации. Поэтому цельгэ второго этапа экспзриыентальпой работы стало клонирование и секвенирование эоп-родственного локуса генома, человека, геномная локализация которого отличается от локализации гена son.

В результате гийридизационного скрининга геномной • библиотеки из лейкоцитов человека в векторе рТДС4 при помощи ' пробы на основе З'-копцезого участка последовательности son-a (Hind III фрагмент, 3418-5643), проведенного И.М. Чумаковым в Институте полиморфизма генома, человека (СЕРН,

Parla) было "зыделяно несколько клонов. Один из выделенных клонов, YAC 347Е4, локализованный в отличие от гена аоп на ■ первой хромосома (по данным И.М. Чумакова, ген son локализуется па хромосоме 21 band 22.11, son-родственный локус YAG 374Е4 - на хромосоме lq21, личное сообщение) длиной около 300 kb, был использован для приготовления плазмидной библиотеки. ДНК YAC 37ДЕ4 была отделена от дрожжевых хромосом при помощи электрофореза в обращенном электрическом поле, вырезана из легкоплавкой агарозы, рестрицирована Bam HI и лигиравана с вектором pTZ 19R для приготовления плазмидной библиотеки.

В результате гибридизационного скрининга плазмидной библиотеки с пробой на основе последовательности гена son была выделена рекомбияантная плазмида, содержался вставку длиной около 7,5 тв. Выделенная последовательность была субКлонирована и частично сзквенлрована (при помощи флуоресцентно меченных праймераз на секвенаторах фирм Applied Biosystems и Pharmacia). Ниже приводится анализ полученной нуклвотадной последовательности.

Анализ нуклеотадеой последовательности еоп-гоиаяогичной сбласта YAC374E4. Была секвенирована последовательность длиной 3376 пуклеотидов (ЕМВ1 ас. no. Х63754), прилежашдя к одному из Bam HI сайтов рекомбинантноЯ плазмиды. Последовательность содержит фрагмент длиной 2472 нуклеотида, гомологичный последовательности гена son, окэнчиваисцийся. поли(А) трактом (рис. 1).- Гомология рассматриваемой последовательности с геном son начинается - с 193-его нуклеотида (3160-ый нуклеотид последовательности son-a) и заканчивается на 2635-ом пуклеотиде (5377-ой нуклеотид son---ч' - •. а); гомология составляет 967.. Рассматриваемый фрагмент содержит 27 торминируицта кодонов, отсутствующих в открытой рамке считывания гона аоп. Наличие шзли(А) тракта б конце области гомологии с гоном аоп, а также наличие прямых 22-нуклеотидных повторов, фланкирупцнх son-гомологичнрв область, указывают на то, что ■ ,. рассматриваемый scn-томологичяый Фрагмент (ссездоген sen, зсп-р) образовался з результата встраивания в геном обратного транскршта гена

son.

Вероятно самим интересным результатом является отсутствие в последовательности son-p пяти совершенных тандемных повторов, присутствупцих в области FU последовательности son-a (рис. 1, 4). Наиболее последовательным представляется следующее объяснение этого различия. Поскольку ' в последовательности гена son присутствуют несколько областей совершелвых тондамных повторов, то, s соответствии с современными представлениями о механизмах мультипликации ДНК, мояшо предположить, что локус, в котором расположен ген son, является горячей точкой митотической рекомбинации. По существующим представлениям два основных фактора могут определять функционирование горячих точек рекомбинации - локализация области в геноме и еа эуклеотидная последовательность. Отсутствие значимой гомологии нуклеотиднгн последовательностей повторятоихся единиц из разных областей повторов гена son согласуется с современными данными об отсутствии общего консенсуса в последовательностях всех минисателлитоЕ генома. (Некоторые последовательности содержат схожие GC-богатые мотивы, однако большая часть этих повторов была выделена в результате гибридизации с пробой на основе GC-богатой "коровой" последовательности.) Вероятно, цуклеотидные

последовательности мономеров тандемных повторов имеют некоторые особенности, однако не вполне ясно, какие именно характеристики первичной структуры являются принципиальны?-®. Е связи с этим представляется, что первостепенное значение для функционирования горячих точек рекомбинации имеет геномная локализация. Это пэлохсэние подтзержд&отся' данными по преимущественно прителомерному расположению тандемных повторов, а таю;® данными о валичии в притсломерннх учасуках кластеров тандемных повторов. Если данные представления верны, то различия в числе тандемных повтороз х'ена к пезвдогбна могут объясняться тем, что после возникновения поездогеыа в гене зол продожалась мультипликация мономеров, в то время как в псевдогзие, имеющем другую локализацию, мультипликации повторов не происходало.

80П-Р

193 CGMAC

199 CCMGTCGTCAGACTCGCAGTC&TACT . 1

226 CCAASTCGTCGACayiGCTCTAGmT^^ 2 al

283 CCAAtXXGCCGGAGCCACACC 3 b

304 СССМС(Х1СХЙСШ1ШЗАТЙМ0ТСТСП'Ж 4 a2

361. CCMTCAGATTMGGC^TCMGMCACCCrrGAGAAGM GGITTAGCAGATCT 5

415 CCCiTCCGTGjrAAAAGATCCAAGfTC TTCTGAACAA 6

son-a

3148 AGAGCTCGAAGTCGMCC . 1

3166 CCAAGTCGTCGGAGTCC-GAGTCATACT 2

3193 CX^GTCCnraAaJAAGGTCTAOTCOT^ 3 al

3250 CCAAGCCGCCGCSGCCGCACC 4 Ъ1

3271 CCCAGCCGCCGCAC4XGCACC 5 Ъ2

3292 CCCAGCCGCCGCAGCCGCACC 6 ЪЗ

3313 GCCAGCCGCCGCAGCCCKACC 7 Ъ4

3334 (XCAíKXGCCGGAGCCGCACC 9 Ъ5

3355 CXTTAGCCGTCGflAGCCGCACC ' 9 Ъ5

3376 (XMGCCGCCXKJAGAAGATCMGCT^Xn'GGTMGMGACGMGCTTCSCTATCTCA 10 a2

3433 (raffrCAGanAAGOX»T^GtóC^a;a^(VÍA(mAG GTrrAGCAGATCT 11

3487 CCCATCCOTCGTAAAAGATCCAGSTC TTCTGAACGAG 12

Рис. Д. Структура области повторов R4 son-a и области повторов псэвдогена son.

Данное предположение согласуется с нехоторнмт другими фактами. 3 Еастояаев время начинает утверждаться представление об ассоциированности высокой частота неэквивалентного обмена с транскр'.пзциояной актийксе-гыи локусов. Поскольку для закрепления псевдогена в геноме последдаздих поколений его образование должно было произойти в линиях половых клеток и/или в бластомерах до расхождения линий половых и соматических клзток, то, следовательно, тракскрипт гена зоп присутствовал в какой либо (или в нескольких) из этих груш клеток. -Очевидно, что мультипликация мономеров гакрепляется в геноме лишь н том

случае, если она происходит в тех же группах клеток, поэтому вполне вероятно, что в данном случае также наблидается ассоциация зксоксй частоты неэквивалентного обмена с экспрессией локуса.

Можао предложить также и иные варианты эволюции гена и псевдогена. Можно -допустить, что тандемные повторы, отсутствующие в псевдогена, были элиминированы в процессе эволюции псевдогена. В. этом случае сохранение повторов в гене может сыта отнесено, в частности, на счет стабилизирупцего отбора. Следует отметить, что все остальные повторы области R4 в псевдогеке сохранены (рис. 4). Можно предположить, что в результате работы рекомбинационных механизмов были элиминированы повторы с максимальной гомологией " последовательностей повторявшихся единиц. Поскольку локалззация псевдогена э геноме в данном кснтексто может рассматриваться как случайная, то предположение о работе рекомбинационных механизмов, приводящих к изменению числа тандемных повторов, может рассматриваться как соответствушзе гипотезе о роли нуклеотидной последовательности в инициации рекомбинации.

ВЫВОДЫ

1. В ходе выполнения работы определена нуклеотидная последовательность транскрипта гена son человека и часть последовательности альтернативного транскрипта.

2. Анализ нуклеотидных последовательностей показал, что кодируется часть гена son содержит по крайней мере шесть областей совершенных тандемных повторов. Таким образом, одной из основных тенденций эволюции гена son являлась внутригенная мультипликация последовательностей.

Мономеры разных областей повторов не имеют между собой значимой гомологии.

3. Анализ предполагаемых аминокислотных последовательностей выявил консервативность последовательностей повторяющихся единиц одних участков тандемных повторов и отсутствие жесткой консервации в других участках. На основании данных анализа можно выделить функционально важные участки

белкового продукта гена son.

4. Анализ выявил присутствие мотивов, отвечавдих у некоторых ДНК-связывашщих белков за сиквенс-неэависимое связывание с ДНК. Аминокислотные последовательности повторяющихся единиц, ■содержащих "эти мотивы, . консервативны, что подтвэрэдаэт предположение о наличие у son-белка ДНК-связывакщей активности.

5. Определена первичная структура зсгг-родственнсго участка, геномная локализация которого (lq21> отличается от локализации гена son (21q22.11). эоп-родстзеяЕЫЙ участок, являшцийся, вероятно, псевдогеном, содержит на 3' концэ поли(А) тракт и фланкирован прямыми 22-нуклеотидными повторами, что, видимо, указывает на его происхождение в результате ретропозиции. Гомология нуклеотидных последовательностей гена и псевдогена составляет 962.

В области повторов псевдогена отсутствуют 5 мономеров, присутствующих в гомологичной области гена son. 5. Обнарукекие в куклеот-идной последовательности гена son нескольких областей совершенных тандемных повторов с негсмологичными последовательностями мономеров, а также наличие в гене son мультипликации мономеров, отсутствующей в псездсгеЕе, соответствуют представлениям об определяющей роли геномной локализации в мультипликации ДНК. В рамках рекомбинационнэй гипотеза образования тандемных повторов полученные данные могут расматриваться как подтверждение определяющей роли геномной локализации в функционировании горячих точек рекомбинации, а локус хромосомы 21 q22.ll, в котором расположен ген son, монет рассматриваться как горячая точка рекомбинации.

СПИСОК РАБОТ, ОПУБЛИКОВАННЫХ ПО ТЕМЕ ДИССЕРТАЦИИ 1.8.Б. Блисксвский, Ф.Б. Бердичевский, A.B. Ткаченко, М.Е. Белова, И.К.Чунаков. Кодирующая часть последовательности малого транскрипта гена son содержит четыре области совершенных тандемных повторов. // Молекулярная биология, Т. 26, 4, 793- 806; 1992.

2. B.B. Блисковский, A.B. Кириллов, B.M. Захарьев , И.М. Чумаков. Ген son человека: большой и малый транскрипты содежат разные 5'-концевые последовательности. // Молекулярзая биология, Т. 26, 4, 807-812; 1992.

3. В.В. Блиоховский. Тандемны© повторы ДНК в геноме' позвоночных: структура, возможные механизмы образования и эволюции. // Молекулярная биология, Т.26, 5, 965-982, 13Э2.

4. В.В. Блисковский, A.B. Кириллов, К.С. Спирин, В.М. Захарьев, И.М. Чумаков. Псевдсгон son не содержит пяти повторяющихся элементов области совершенных. телдемных повторов, присутствующих в гомологичной последовательности гена son. // Молекулярная биология, Т.37, 1, 1993.

5. Блисковский В.В., Бердичэвский Ф.Б., Чумаков И.М. Участки генома человека, содержащие аналоги онкогенов и рэтровирусов. 4. Первичная структура nos-родственного участка АО локуса 0RAgp5. // Биоорган, химчя, 1989, т. 15, 484-451.

6. Tkaohenko A.V., Buohman V.I,., Bllskovaliy V.V., Shvets Yu.P., Kisaelev L.l. Exona I and VII cf the gene (КегЮ) encoding human keratin 10 undergo structural rearrangements within repeats. // Gene 116 (1992), 245-251.

Т. B.B. Блисковский, A.B. Кириллов, К.С. Спирин, И.М. Чумаков, В.М. Захарьев. Повторяхщяеся элементы нуклеотидяой последовательности гена son. // Материалы второй всесоюзной конференции "Геном челозека - 91", Переславль-Залесский, 1991,с. 64

8. A.B. Ткаченко, В.Л.. Бухмап, З.В. Влискозокий, Ю.П. Швец, Л.Л. Киселев. • Зкзонн I и VII гона кератина 10 человека подвергаются структурным перестройкам в области повторов. // Материалы второй всесоюзной конференции "Гоном человека -91", Пэреславль-Зелесский, 199Í.с, 56-57

9. L.L. Kleaelev, 1.Ы. Chtmakov, P.E. Berdiohavsliy, V.V. Bliskovñky, H.E. Eelova,// Maanalien mos-relaied gansa. In: Highlights oí modem biochemistry, VSP, Utrecht, lokyo, Vol. 1, pp. 541-549. 1989