Бесплатный автореферат и диссертация по биологии на тему
Структурно-функциональная организация 5'-концевого участка гена CD4 рецептора
ВАК РФ 03.00.15, Генетика

Автореферат диссертации по теме "Структурно-функциональная организация 5'-концевого участка гена CD4 рецептора"

РГ6 од

На правах рукописи

О . ' > ; ■ и." '->

СИДОРОВ АЛЕКСАНДР ВИКТОРОВИЧ

СТРУКТУРНО-ФУНКЦИОНАЛЬНАЯ ОРГАНИЗАЦИЯ 5'-КОНЦ,ЕВОГО УЧАСТКА ГЕНА С04 РЕЦЕПТОРА.

Специальность 03.00.15 — Генетика

Автореферат диссертации на соискание ученой степени кандидата биологических наук

Москва — 1996

Работа выполнена в лаборатории экспериментальной иммунологии Научно-исследовательского института вирусных препаратов Российской Академии Медицинских Наук

Научный руководитель:

доктор биологических наук В. В. Зверев

Официальные оппоненты:

доктор биологических наук, профессор В. Г. Митрофанов доктор биологических наук, профессор М.М. Гараев

Ведущее учереждение:

Институт молекулярной генетики Российской Академии Наук

Защита диссертации состоится 29 мая 1996 года в 13 часов на заседании Диссертационного совета Д 002.85.01 при Институте биологии развития им. Н.К. Кольцова Российской Академии Наук по адресу: ул. Вавилова, 26

С диссертацией можно ознакомиться в библиотеке Института биологии развития РАН

Автореферат разослан 29 апреля 1996 года.

Ученый секретарь Диссертационного совета кандидат биологических наук

Е.В.Волина

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ.

Актуальность проблемы. Одним из наиболее опасных и быстрораспрос-

граняющихся в последнее время вирусных заболеваний является инфекция, шзываемая вирусом иммунодефицита человека (ВИЧ-инфекция), получившая в {эазе клинических проявлений название СПИД (синдром приобретенного имму-юдефицита). Со времени появления этого заболевания число заболевших, ю официальным данным на 1994 год, составляло более 3 миллионов чело-¡ек, а число инфицированных ВИЧ превышало 15 миллионов человек. Этиоло--ический агент СПИД - вирус иммунодефицита человека (ВИЧ), относящийся к :емейству ретровирусов (подсемейство Ьеп1тппае), был открыт в 1983 оду. Специфической мишенью для этого вируса служат хелиерные Т-тнмфопиты, в которых происходит размножение вируса. Кроме того, показа-ю, что моноциты и макрофаги также могут быть инфицированы ВИЧ.

Рецептором для ВИЧ на чувствительных к вирусу клетках служит 304-дифференцировочный антиген (С04 рецептор), с которым взаимодействует юверхностный гликопротеин gpl20 ВИЧ.

Зрелая молекула С04 рецептора имеет молекулярную массу 55 кД и :остоит из внеклеточного сегмента (372 аминокислоты), представляющего :обой четыре тандемно расположенных иммуноглобулинподобных домена, тра-1смембранного (23 аминокислоты) и цитоплазматического (38 аминокислот) участков. Кроме того, как большинство мембранных белков, С04 рецептор шоет лидерный пептид размером в 23 аминокислоты.

Ключевая роль в процессе взаимодействия С134 рецептора с др120 ВИЧ финадлежнт первым двум иммупоглобулинподобным доменам С04. Первый им-луноглобулинподобный домен С04 имеет около 40: гомологии с вариабельными участками легких цепей иммуноглобулинов и аналогичную пространствен-|ую структуру.

С04 рецептор экспрессируется на поверхности хелперных Т-шмфоцитов (50-70% всех циркулирующих лимфоцитов), моноцитов и макрофа-оп. Этот гликонротеин играет важнейшую роль в антигензависимой Т-:леточной активации, участвуя, таким образом, в формировании клеточно-о иммунного ответа. Одним из главных свойств Т-лимфоцитов, экспресси->ующих С04 рецептор, является способность взаимодействовать с мишенями, 1есущими молекулы II- го класса главного комплекса гистосовместимости. Тредлолагается, что молекулы СЭ4 рецептора, обладая адгезивными свойст-;ами, связывают неполиморфный участок антигенов П-го класса и, таким |бразом, стабилизируют комплекс между этими молекулами, несущими или не 1есущими пептидный антиген, и рецептором Т-клетки. До недавнего времени читалось, что Т-клетки, экспрессирующие С04 рецептор, могут выполнять

в иммунной системе либо хелперную, либо индуцирующую функции, то есть либо проводить сигналы активации к В-лимфоцитам, либо индуцировать Т-лимфоциты, несущие С08-дифференцировочный антиген, для выполнения последними цитотоксической функции. Сейчас функции С04 рецептора представляются более широкими, так как обнаружены цитотоксические С04+ клетки, которые могут играть регуляторную роль в иммунной системе. Поскольку, моноклональные антитела на различные участки молекулы СЭ4 рецептора по разному влияют на все эти функции, можно говорить о том, что СЭ4 рецептор играет полифункциональную роль в иммунной системе.

Как уже говорилось, молекула С04 служит рецептором для ВИЧ, и взаимодействие вирусного гликопротеида др120 и СБ4 является ключевым моментом в патогенезе ВИЧ-инфекции. Высокий аффинитет связывания вирусного белка с С04 рецептором обусловливает прикрепление и проникновение вирусных частиц в клетку и индуцирует дисфункцию и истощение неинфици-рованных СБ4+ Т-лимфоцитов через широкий круг различных механизмов.

Если аминокислотная последовательность и структура самого СП)4 рецептора, относящегося к суперсемейству иммуноглобулинподобных белков, известна и достаточно хорошо изучена, то в мировой литературе, до последнего времени, не было никаких данных о нуклеотидной последовательности и структурной организации гена, ответственного за синтез этого белка. Получение такой информации могло бы дать новые сведения об эволюции и механизмах экспрессии гена С04 рецептора, в частности, и всего суперсемейства иммуноглобулинподобных белков в целом. Исходя из этого, нами были проведены попытки клонирования и изучения структуры гена, ответственного за синтез С04 рецептора.

Цели и задачи исследования. Основной целью настоящего исследования было изучение особенностей структуры и экспрессии гена, ответственного за синтез С04 рецептора.

Для достижения поставленных целей в ходе работы было необходимо решить следующие задачи:

1. Клонировать участки гена СБ4 рецептора и определить нуклео-тидную последовательность клонированых фрагментов этого гена.

2. Провести компьютерный анализ нуклеотидной последовательности и сравнительный анализ с имеющимися последовательностями генов иммуноглобулинподобных белков.

Научная новизна работы. В результате выполнения настоящих исследований получены новые данные имеющие как теоретическое, так и практическое значение.

Получена геномная библиотека ДНК и клонированы участки гена ответственного за синтез CD4 рецептора Т-лимфоцитов человека. Впервые

зпределена нуклеотидная последовательность 5'-концевого участка гена ÜD4 рецептора, включающего в себя три первых экзона и интрона гена CD4 эецептора, получены данные о структуре этого участка гена.

Идентифицирован новый, ранее не описанный длинный концевой ювтор (LTR) эндогенного ретровируса HERV-K. Впервые установлено, что \lu повторяющиеся последовательности могут встраиваться в LTR эндогенных ретровирусов. Показано, что интроны гена CD4 содержат открытые рамки считывания и участки альтернативного сплайсинга для близкородственных белков. Предложена новая вторичная структура Mu-повторяющихся элементов ДНК-

Практическая ценность работы. По материалам диссертации оформ-тяется патент Российской Федерации. Полученные рекомбинантные формы CD4 эецептора могут применяться для аффинной очистки вирусных антигенов *р120 и gpl60 ВИЧ из вирусных лизатов с целью приготовления диагности-теских тест систем и возможных вакцинных препаратов.

Основные положения, выносимые на защиту.

1. Клонирование и определение нуклеотидной последовательности <ДНК CD4 рецептора Т-лимфоцитов человека, конструирование и экспрессия а E.coli рекомбинантных производных CD4 рецептора.

2. Клонирование участка геномной ДНК Т-лимфоцитов человека (13,1 г. п.н.), включающего в себя 5'-концевой фрагмент гена CD4 рецептора и определение его нуклеотидной последовательности.

3. Анализ нуклеотидной последовательности клонированного /частка гена С04-рецептора, включающего в себя первый, второй и третий жзоны; первый, второй интроны и часть третьего интрона этого гена, /становлено, что первые три экзона гена С04-рецептора кодируют нетранс-шруемый участок мРНК, лидерный пептид и большую часть первого иммуно-•лобулинподобного домена С134-рецептора.

4. Анализ структуры экзонов гена С04-рецептора. Обнаружено, ito нуклеотидная последовательность, кодирующая первый иммуноглобулин-юдобный домен С04-рецептора, прерывается интроном, что крайне нехарактерно для белков иммуноглобулинового суперсемейства и дает новые пред-¡тавления об эволюции интронов в целом.

5. Анализ структуры интронов гена С04-рецептора. Установлено, ito нитроны гена С04-рецептора содержат 14 Alu-повторов ДНК в прямой и обратной ориентации, которые могут принимать участие в эволюционных 1роцессах и регуляции генов иммуноглобулинподобных рецепторных белков.

В интронах гена Сй4-рецептора обнаружен новый HERV-K элемент и рамю считывания для белков с высокой степенью гомологии с белком BCGF i белками DAF и СОМ5 из системы комплемента, с участками альтернативной сплайсинга.

Апробация работы. Результаты работы были доложены на 3-ей между народной конференции "СПИД, рак и родственные проблемы", май 1995 г. Санкт-Петербург; на внутриинститутской конференции в НИИ вирусных препаратов РАМН, 3 апреля 1996 г., Москва.

Публикация работ. Основные положения диссертации отражены в ( опубликованных научных работах и 5 тезисах конференций, оформляетсз патент РФ.

Объем и структура диссертации. Диссертация состоит из введения обзора литературы, описания материалов и методов, описания результато) и их обсуждения, заключения, выводов и списка цитируемой литературы Диссертация изложена на 129 страницах машинописного текста, содержи-20 рисунков, 2 таблицы. Библиография включает 194 названия.

Собственные исследования.

Перед началом настоящей работы в литературе имелись данные тольк< о нуклеотидной последовательности мРНК С04-рецептора Т-лимфоцитов человека. Данных о нуклеотидной последовательности гена, кодирующего это-белок, не было. Однако, было известно, что этот ген, так же как и reí мыши для белка L3T4 (аналог человеческого С04-рецептора), имеет протяженность около 33 т.п.н. Поэтому для идентификации клонированных участков гена CD4 нами была клонирована кДНК. С04-рецептора и определена е< первичная структура, после чего было синтезировано 8 пар олигонуклеоти-дов, комплементарных различным участкам кДНК СЭ4-рецептора.

2. Клонирование фрагментов гена CD4 рецептора и определение

нуклеотидной последовательности 5'-концевого участка гена CD4 рецептора.

Из крови здорового донора по обычной методике была получена фракция лейкоцитов. Из этой клеточной фракции фенольным методом была выделена суммарная клеточная ДНК- ДНК была обработана рес-триктазой Sau3A в условиях неполного гидролиза и полученные фрагмента очищены в градиенте сахарозы. Очищенные фрагменты ДНК размером 10-2Í т.п.н. клонировали в вектор EMBL, обработанный рестриктазой BamHI. По

Лра1 ВкрИЭ ШпДШ В91П ЙГ1И НЬ«1111 ВавН1 Н1™П11 В»*Н1 8а11

II II 1 I I 1 I I

2152 3001

0 1800 2000 3000 ,-,-,-,-

впа! В<г1ННео1 |!1лР11 Хиа1 Хпа1 Р=ЛП1 Вкр12в1 НМН1

; 1 п 1 I ц 1 I >

М1аЭ10

на

1 4 111

ВдШ I мав1 СГг1В1 ЕсоШ АоаХ БаИ 1 1

Нсо I Н1пЛ1П I ТаЧ1 Нсо1 ВапН I

1 _1 1 I I _ 1

ЕсоБЫ 11а II

I 11 Ь I_1

ЩткПП Мсо1 Еэр1 мае1 Хва1 ШпРП Мсо1 Н1п<1Ш

I_I I 1__11_1 1 В

Рис. 2. Рестрикционная карта и схема определения нуклеотидной последовательности участка гена С04-рецептора.

3 верхней части рисунка СП025 - фрагмент гена С04 рецептора;

В,С,П),Е,Р,0 - субклонированные фрагменты гена С04 рецептора; оризонтальными стрелками показано направление определения [уклеотидной последовательности; вертикальными стрелками показаны участки узнавания ферментов рестрикции; цифрами показан размер фрагментов гена С04 рецептора в нуклеотидах.

лученную библиотеку геномной ДНК использовали для поиска и клонированш различных генов, в том числе и для гена С04 рецептора. Для поиска фрагментов гена С04 рецептора использовали клонированную нами кДНК этог< гена и набор синтетических олигонуклеотидов, комплементарных отдельные участкам кДНК- В результате скрининга был отобран ряд клонов, имевши; гомологию с синтетическими олигонуклеотидамн и кДНК С04 рецептора. Нас в первую очередь, интересовал 5'-концевой участок гена С04 рецептора, кодирующий ВИЧ-связывающий фрагмент С04 рецептора и, возможно, несущий некоторые регуляторные элементы гена. Поэтому для определения нукле отидной последовательности был отобран клон, получивший название С0025, который содержал последовательность ДНК размером около 15 т.п.н. Этот фрагмент ДНК гибридизовлся с кДНК СЭ4 рецептора и синтетическими олигонуклеотидамн, комплементарными участкам кДНК, кодирующими лидерный пептид и первый иммуноглобулинподобный домен СЭ4 рецептора.

Рестрикционная карта и схема определения нуклеотидной последовательности вставки геномной ДНК из клона СБ025 показаны на рис.2. Для определения нуклеотидной последовательности клонированная ДНК была суб-клонирована на ряд более мелких фрагментов, обозначенных заглавными буквами на рис.2. Нуклеотидная последовательность фрагментов А, В, С, О и Р была определена методом Максама-Гилберта. Рестрикционные фрагменты для определения нуклеотидной последовательности метили с двух концов соответствующим [-32Р](МТР при помощи фрагмента Кленова ДНК-полимеразы I, расщепляли соответствующей рестриктазой и очищали с помощью электрофореза в полиакриламидном геле. На рис. 2 показаны точки начала и направление определения нуклеотидной последовательности. Фрагмент Е С0025 был очищен и инкубирован с нуклеазой ЕхоШ в течении 0, 30, 60, 90 и 120 сек. После обработки нуклеазой Б1 в стандартных условиях полученные фрагменты ДНК размером 650, 900, 1300, 1650, 1850 и 2159 нуклеотидов были клонированы в 5ша1 сайт векторной плазмиды риС19. Нуклеотидную последовательность полученных фрагментов определяли методом Сэнгера с использованием универсальных олигонуклеотидных праймеров. Фрагмент О был субклонирован на 4 субфрагмента, как показано на рис.2. Все 4 субфрагмента после обработки фрагментом Кленова ДНК-полимеразы I были клонированы в плазмиды риС18 и р1ГС19 в 5та1 сайт. Нуклеотидную последовательность клонированных субфрагментов определяли методом Сэнгера с использованием универсальных праймеров. Полученную нуклеотидную последо-вательнось вводили в компьютер для обработки и полной сборки. Полученная нуклеотидная последовательность 5'- концевого участка гена С04-рецептора приведена на рис.3.

101 actaccactaatggaatctttcttgccatctttttcttgccgcttaacagtggcagtgacactt7gactcctgatttaagcctgattctgcttaactttt 201 tcccttgactttggcattttcactttgacatgttccctgagagcctggggggtggggaacagctccagctggtgacgtttggggccggcccaggcctagg 301 gtgtggaggagccttgccatcgggcttcctgtctctcttcatttaagcacgactctgcagaaggaacaaagcaccctccccactggctcctggttgcaga

401 gctccaagtcctcacacagatacgcctgtttgagaagcagcgggcaagaaagacgcaagcccagaggtaaggtggtcagactcggcttccttccccggag

501 ctgagagggaggggaacgtggggcagatgcacaggaatgtgctctgcccagngtctgcccacagctctggccaccttctcttgcatttctcttggaact

601 ggtcatgagcagcgatttcccactggaactgtgagcttccagaggtcagagactgtgctagactcctctctgcagccccagcgtgcacagctcagtgtcc

701 agagcaatgggtgctccttagaggagtagtgacctaaatagcaagatcagagagggagtgaagactggagactatcccaggctgggaaaggcgtggaagg

801 caactagtcgtgggcagtggaggggagaagactggaagaggggaaaagaggagaaaaagagtgaagaaggggagggaaaaaattagaaagaataaataaa

901 tataaggtgggaggaaacctataaaaaagaaatgatgaggaaaaacataaaaacaagaaaaagagcaaaagaagtggaatctagtctagagaaaattctt

1001 gcaaaaccaattttcctaacgggacaatctccaaaaattgacaccaaatatcatacttgcagcatttcataagtcgcatgatctatgtaatagtctcttt 1101 taactaccttttgtgtttctgtgtgtatttttaaatttttgtctgcttctttgctcttttaagatttttgaacaatgtctaaaggcacttctactctagt

1201 tagctttaaaatgattcatgaaataggaaagctaaaattctcagaaagtgttgaaactgagcttttgcgtatgaattgccctaaaagttgcagatacata

1301 tctttagataaatatgtcatttaagaaacggattcgaaaagaattggtggtaggggtctcatgaggccgggagagttacagaaggatgtgcagcccctcc

1401 tgggcctggcagggtgtgagggagagtgaggactcactgtccctcctgaagggaagccctgtgccatctcagcctttccgcf.ctcagacctttccagccc

1501 ctgagacctcatggccttgaagccgtgctatccccagtgtcctctgctttcccctcataggcttcttctgggagagaggttïcctggggtacgttctgat

1601 ccctcaaaacggaaaggccctgttctcaataattcaaagatttcactctgagtgggatagtgcttcctgaatgccctgctcttgtggtggacatttttat

1701 cggggcaaggctaagagcagggcctgatgggggaagtcactgctacttcacattttgaccaataattccttgtgctgtatcagatgctgtaggctgatac

1801 aaaatggccgccgccctcaaagtcagatgaaagagcccctgaggacagcgttagagacactcgggagatgatttccctctttcaatgtgggagcacttac

1901 ataggagaggtctatatctagataaaaactcctcccaccactggtgctagacagagcttgggggcagccctaggctctgaccctggccgtaatggcgggg

тмиттттттшмт#ттттт§т

2001 tggtgctgagggcaattggctagaccaattgtcttgcacgttttattttttattattatttttgagacggagtctcgctctcttgcccaggctggagtgc

ттттттштттт§#мттттттттттттмтттмт#ттт

2101 aatgacgtgatctccactcactgcagcctccacctcctgggttcaagcgattctcctgcctcagcctcttgagtagctgggattacaggagcccaacacc

тттт#тттт#тттт§т§мтттт#11мтттттттшттттм

2201 acgcccggctactttttgtatttttagtagagaccaggtttcactatgttggacaggctggcctcaaactcctggcctcaaatgatccgcccgccttggc

тттм#тттт#ттмтт#мт

2301 ctcccaaagtgctggcattacagacgtgagccaccatactgggccagtcttgcacattttagacactcaataaatgtttgttgaatgaaatacctgtgat

ттттттмтттмяттттмтшттмттмтттттттммт

2401 gggccgggcgtggtggcccacaccagtaatcccagccctttgagaggccgaggcaggaggatggcttgaacctgggagtttgagaccagcctgggcaaca

тттттттттмтттттттттмтттттттттмнттщ 2501 tggtgaaacccccatctctacaaaccccacaaaagttagctgggcatggtagtgtgtgcctgtggttccagctacttgggaagctgaggtgggaggattg

2601

2701

2801

2901

3001

3101

3201

3301

3401

3501

3601

3701

3801

3901

4001

4101

4201

4301

4401

4501

4601

4701

4801

4901

5001

ттт»#тттмтттютттт«тмтттштт«»штт

CTTGAGCCTGGGAGACGGAGGCTGCAGTGAGGCCTGACTGTGCCACTGCACTCCAGCCTGGGCGAGAGTGAGGCCCTGTCTCAAMTAACTtTGATGAAG GTGGGGAATCAGAAGTAGGTGGGCAGGGGTCTGGGTTTGCAAGGCTCTGAGTTTGAGCTCTGTTCTGTACCTTTGAGGGGATGAGGGAAGGAGGGTGGGC ACGGTTCCCCCGATGTGGGTGTC7GAGGCGAAGAAGAGGATGGCGGAGGTTGCAGCCACCAACCACAAGAGTTCCTTAGAGGGGTCACAGTCTCTAGGAA GTTTATAGGAAGCTAGTCAGCAGTAGAGAGGGTGAACGCGGTGGGGCACATCCCGCGGCTGGGCTTGAGTGGGCTGCTTGGGGGTTATGGGGAGAAGATA AAAGTGCCTGTGGGACCACAGACTCTCGCTGTGGTGGAGCTGGGCCCTCTTACCCTCCCAAGCCTCGCCCCTCATCCCATCCCTGGGGGCCAGGGGTGAG GGCGGCAGGAACCTCAAGGCTCTGAGAAAGTGCGTGGTGTGTGTTGCCATTTTGGTCTCTTCTCTTTCTCAGTCTCTCTTTGCCTCACTTTGGATCTATG CTCTGTGCA7CTGTCTTGCTTCTCAGAATTTCTTCTTTTCCTCTTTTTTTGTACTACCCTGCGCTTTGTGTGTGATTGTGGATTGTGTGTGCATAGCTGT TGCTTTAACAAGCTGCTCCAGGTCTCTCTCTCCCACATCTTTCCCTCCCCTCCTCCCTTGAGGCTCTGTGCATTCTGGGGAACTCTGTCCATTTCCCTTT GTCCATGTGTCCCTCCCACCCTGCAGCCGGCTCCCTCACATCCACCCTGGGCTGCAGGCGTGCTCGGCAGGCTCCCCACAGATCAAAGCTTGTCCAGGGT CTGCATTGCTGCCAAAGGCCAGGAGGACTGTGTACAGACCGGAAGGAGCTAGAGCTTAGTGGCAGCCTGAGAGGGGAAGCTGAAAAAGGAGAAGAGGCAA GGGGCATTCCAGGGGAGCCCGGGAGAGCCAGCACGGCCGCCTGGTATATGAGGCAAAGAGGAAGACAGACACAGACACAGGGAGCTGCAGGCTGGGGGCA TAAGCTGGGGGCTGGGAAGCATAGATACAGAAATGCACAGATGTGAGCTGAGAAGCAAGGAGGGAGAGAGAGAGACAGAAAGAGAGAGAGAGACGTGCCA GGGCTTGAGGGACCAGAGAGCCCTCCCAGCCTCTCTCGGAGTGCTGGTATACAGGATGCTACCGTACTAGGGTAAGACACCTCTGGGGACGCTGAGTATG GGAATCAAAGGCCAGATCTCTGGGGTGGCAGCGGAAGCCCAAAGCACCAAAGCAAGCATGCTGGAAACCCACAGCCTCCTCCACTTAGCAGAGCCTTGGG GTGAGATGAGGCAGAACAGGGAGCTGGAGGCAGGGAGGTGGCTGTCTGCACATACCTCAGGACCATGGAGCTGGGGGAGTCAAAACAGCCACCATATGGG GAAGGGTCAAGAATGCCTCTAGTCTTCCCCAGGCATCTTATCAGGGTAAGCTGAATTTGGACCCCAGAGAAGGGATATCGTTTATGGAGACTTCCCCTCT TTCATCCCCTGCTCACCAAGGACCCAGTCAGTCTGGGATGGGGGACAGTGGGAACCACTCTTTGGTATGAGGCTACTCCTATTCTACTCTTCTCACTGCA GCCTTCCCCTAGATGCCTCCCATCTGCATGCTAACCTGTAAACACTTCACCATCACTGGTGGCTAGTCTCCCTTCCTCCTTTTTCAGAAACCTCCTTCCT

GACCTCTTTTCTTCCTACTTCCCCGGTTTAAACAAAATTGTATCTATCTATCATCTATCTATCTATCTATCTATCTATCTATCTATCTATCTATCTTTTT

ттммттттттмтмштттштттттттттмштттм*

TTTTTTTGAGACAAAATCTCACTCTGTCGCCCAGGCTGTAGTGCAGTGGCACTACAAGTAATCCCAAGTAGCTGAGATTACAGGCGCCCGCCACCATCCC

CAGCTAATTTTTTTGTATTTTTAGTAGACACGGGGGTTTCATGATGTTGGCCAGGCTGGTCTCAAACTCCTGGCCTCAAGTGATCTGCCTGCCTCGGCCT

тттмттттшмтттттт*

CCCAAGGTGCTGGATTATAGGTATGAGCCACCACACACGACACCCGGCTTCTATCTATCTATCTATCTATCTATCTATCTATCTATCTATCTATCACCTA

################################

rCTATCTAATCTATCTATATCTGTCTATCTATCTTTATGTATCTATCTTATCTATTGATCTATCTATCTTTTTTTTTTTTTGAGACAGAGTCACTCTGTC

тттттшттютттттттштшюттт*т»*тттмтттт*

l\CCCAGGCTGGAGTGCAG7GGCACGATCTCGGCTCACTGCAACCTCCGCCTCCCGGGTTCAAGCGATTCTCCTACCTCAGCCTCC7CAGTAGCTGGGACT

тшттмт*мтттттттттттмттмттттттмтттш

i\CCCACCACCACTCCTGGCTAATTTTTGTATTTTCAGTAGAGATAGGGTTTCACTATGTTGGCCAGGCTGGTCTCCAACTCCTGACCTAAAGTGATCCAC

5101 CCACCnSGTTTCCCÁÁ/WTGCTM

тттттт§тюмтт»#иттттттштшмттт*тттиттти

5201 cccaggctggagtgcagtggcgtgatttcggctcactgcaacctccgcctcccgggttcaagtgattctcctgcctcagcctcccaagtagctgagatta

т#тмтттт1мт11тттмт«тттттттттт#штттттю#11т

5301 cagacgtgcgtcaccatgcccagctaatttttgtatttttagtagagatgggatttcactatgttggccaggctggtctcgtactcccgacctcaggtga 5401 tccacttgccttggcctcccaaagtgctggaattacaggtgtgagccactgcatccggccttatatatctatcttgtctgtctgactgtctaatctaatt 5501 catctattttatctgtttatcttatctatcatctatttatctaatctatctgtctgtatgtctgttttttttttgttttttttttttttttgagatagag

m#mmMimmm#mMmm#mmmmmmmMmmmmMMm#mmmm##Ȓ#

5601 tcttgctctgtcgccgaggctggagtgcggtggcgcgatctcagctcactgctgaacctccgcctcctgggttctaagcgattctcctgcctcaatcttt

#тт§тмтттт§тттттт§тттштшшттт*т#т#тт#ттт i

5701 ggagtagctgggattacaggcccgtaccactgtgcccggctaattttgtatttttagtagagaagggtttcaccatgttggtcaggcttgtattgaactc со

ют#т«мттт#и##мт##мм#ттпятмтттттт*тт '

5801 ctgacctcaggtgatctacccgcctaagcctcccaaagtgctgggagtacaggtgtgagccactgtgtctgtccctaaatgtctgtctctatctatctat

5901 ctatctatctatctatctatctatctatctatctaatctatctttctgtctaacctaatctattttatctatcttattcatcatctatctaatctgtctg

6001 tatgtttatctaatctatttacctaatctatcaatctatcatctaatctatctaatctgtctatctmtctattttatctatctatctatctgtccatcc

6101 atctatctacctacctgtctatctcaagcacctaccacgtattaagccctggctacctcctcttccaggcagatggagtaactggaggcagctaacaaag

6201 atggagtcacttttcttatcttctcctaaaccaccgtaagaggaccaagcccccacaccttctgagtgccccattcctctccacagattgtgtcttagtg

6301 cccagcaggaaacacagtccacctcccatggttcaagagattgtagaaagggggttattcacataggttaagggaatcaatcaatttgaagcacagacac

6401 tattaacagcaggaagagtcctgaagaagtgaaaatggtgtttctggaacccagagagtgcttgcactctggataaggggccaccccacagaagctgtgg

6501 aggggcagggctgcaggtgaggatgaacacacagctattgacagaaaatatgcccagggcagggatagagtaggaaaaatatcccagcttctttccccca

6601 cccttccatctcatctctgaaaggcacttcccactggccagccccgactggtgctggagggcaagagagcctatgagccatgtgtggctgtcagcccctt

6701 ggtggagagccacagacaggatggagagtggctggcagggccccgtggagatgaacagcttggattggggcgactgggcttcatccaggctgggctggat

6801 gtgtgcatacatttcagtgacccgttttagaaacagaattaatatggtgaatagagaaagaagaaatcagtgactttcgctcctccatacaattcaattt

6901 ggcttaagttagccaaagccataccaagtcctctctctatgtctcagctgctgccaggcttgtggtggccacacagctggctagactgtcatctctgtcc

7001 tcaaggggctcaagctagaggaggagagttgagaaaccaaatcactatacacaaagtagaaggtggaacacacccaggagcatgtcaacggggtgctgtg

7101 ggacttcagagtaggcagatcgtcaccaagcttcaacggcaaagatgccactgggggaaagaaggaccaagcttggaagacagagtaagtctggaggcaa

7201 gatcttgtctcaccagcaggggccaggtccatggtgacaccttccccaggcagtcacctctctgagcccactttatatcctaggcctggattcaaagaca

7301 cttgagccctgctccagccttcctttgaggtgctatcttggtgcctttcctataatcactgctccagtcccatgtcatctggtccccagttaccacatca

7401 agcttcccgaagctccacacagaccatgccacatctttaccaaaaaatcagcagtgggtcccctcacctccaggacaaagctccagctcttcgacctgcc

ттттмтмтмтттшттт

7501 TGTCAATATTTGCAATCACTGCCTGCACAAATTAGCTGGGTGTTGTCATGAAAGGATCACTTGAGCCCAGGAGTTCCAGGCTGCAATGACCTATGATTGA

ттмттттттмтттттттмтттттшмттт*

7601 ACCACTGCACTCTGGCCTGGGTGACAGAGTGGATCTAAACTAAAAATAAAAAGATTTACAGTCAAGCCTCAAAGGCTTTTCCCATACCTTCTTCCACCAT 7701 CACCTCCCTGAGCCCTCTCTTTCCTCCGAAGCCTCCTCGCACATCCCTACCACCTTTGCACACCTCAGAATGGGGACACCTCTCCCCTTTCCTCTCCATC 7801 TAACTTATGGTTTTCAAACTTGAGCGTGATCAGTTACCTGGAGATTTGTGAAAACCCAGATGACTAGACCCACCCCCAGTTTCTGATTCAGCAGGTCTGG 7901 GGTGGGGCCGAGGATCTGCATTTCTAACAAGTTCCCAGGTCATGTTGCCGCTGCTACTGATCCAGGACTTTGGGAATCGTTCTTCTAATCTACAGCTGTC 8001 CATTCCCCATGGTCCATTCAGAiGCCTCTCTGCCCTGCCCCCACCACCCCCAGTCTCGCCTGTCTGCCAAGCGCACAGGAAACTCTCCTTCATCCAAACCC 8101 TGGACCAACGCCTTCTGCTTGGCCCACTCAGAGGCCTTGTAGGGTTGGTCTGATATTGGACAGAGAAATGGCCCTCTGCTCTTTCTCCCCTGACCTCTCT

8201 GAAGGGGGCCTGCCCCTCCACACCTGTGGGTATTTCTCGCAAGGTGGAGACAAGAGACTGAGAAAAGAAATAAGACACAGAGAAAGTATAGAGGAATAAA ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++■+++++

8301 AGTGGGCCCAGGGGACCGGCGCTCAGCAAGTGAGGACCTGCACCGGTGCTGGTCTCTGAGTTCCCTCAGTATTTATTGATCACTATCTTTACTATCTCCG

++++++++++++++++++++^+++++++++++++++++++++++++4-++++++++++++++^

8401 CGAGGGGAATGTGGTGGGGCTATAGGGTGAAGGTGAGGAGAGGGTCAGCAGAAAAACATATGAGCAAAGACTCTGTGTCATAAATAAGTTTAAGGAAAGG +++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++^

i

8501 TGCTGTGCCTGGATGTGCTAGATTTATGTTTAACTTTACACAAACATCTCAGTGTAGTAAAGAGTAACAGAGCAGTATTGCCGCCATGATGTCTCGCCTC S

8601 CAGACATAAGGCAGTTTTCTCCTCTCTCAAAATAGAATGTATGATCGGTTTTACACCGGGTCATTCCATTCCCAGGGACGAGCAGGAGACAGATGCCTTC ++++++++++++++++++++++f+4++++++++++++++++++++++++++M++++++++++++++

8701 CTCTTATCTCAACCGAATAGAGGCCTTCCTCCTTCACTAATCCTCCTCAGCACAGACCCTTTACGGGTGTCGGGCTGGGGGGCTGTAAGGTCTTTCCCTT

8801 CCCATGAGGCCATATCTCAGGCTGTCTCAGTGGGGGGAAACCTGGACAATACCTAGGCTTTCTCGGGCAGGGGTTCCTGCGGCCTTCCACAGTGCATTGT +++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

8901 GTCTCTGGTTAATAGAGAACGGAGAATGGTGATGACTTTCACCAAGCACACTGCCTGCAAGAACTTTTCTTTTTTTTTTTTTTTGAGACAGAGTCTTGCT ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

тмттттттттмтмтмтттштттттммтт*ттттт

9001 CTGTCGCCCAGGCTGGAGTGCAGTGGCGCGATCTCGGCTCACTGCCACCTCTGCCTCCCGGGTTCACGCCATTCTCCTGCCTCAGCCTCCCGAGTAGCTG

ттттттмтттттттммт»ттттшштмтттттт§тт

9101 GAACTACAGGCGCCCGCCACCACGCCCGGCTAATTTTTTTGTATTTTTTTAGTAGAGATGGGGTTTCACCGTGTTCACCAGGATGGTCTCGATCTCCTGA ++++++++++++++++++++++++++++++++++++++++++++++++4+++++++++++^

9201 CCTCATGATCCGCCCGCCTTGGCCTCCCAAAATGCTGGGATTACACGTGTGAGGCAAGAACTTTT1AAAAGIGCAIL11ülliLftüLU. IAb«illhIIHM

9301 ACCTTGATTCAATACAGGACATGTTTTTGTGAGCACAGGGTTGGGACAAAAGTTACAGATTAACAGCATCTCAAAGCAGAACAATTTTTCTTAGTACAGA +++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++^^

9401 TCAAAATGGAGTTTCTTATGTCTTCCTTTTTCTACATAGACACAGTAACAATCTGATCTCTCTTTCTTTTCCCCATACCTCTCACGCTGTATCAGGCCCC

+++++++++++++++++++^4^+++++++++++++++++++++++++++++++++++

9501 AATTCTTGGGAACGTCACCTTAGAACTGTCCCACACATTTCTACAGCCACÏTGGCTCAGGCCCTTTGCTGACCAGSATGGTTGCAGTTCTGCCTTÏGGTG 9601 CCTCGCCTCCTCCAGTTCTTTCACTCAGCAGCTGCAGGGGTCCACGTGGCAAATCTAATAATCTTCTTCTCTATAGAAAATCCTCTGCTGGCTCTCTAGT 9701 GCCCAGGATCCAGTCCCAGCATCTCAGCACGGCCTTCAAGCATTTCCACGTCCTGGCCTGGCTCCATGGTCTCCCCGCCAATTTGCCACCTTCTCCATGC 9801 ATCCTTTTCTGATCCCCTCCTCACTCATCCCAGCAAAGAACCCCCTCCTGGCCTGAGCATAGCATTTCGTGGTGTGTATCTCAGAGCATCCAGTTAGGGG 9901 TGTGCAAGTTTACTTTGTTACTGGCTGATGTTGTGAAGTCCCAAGTTGTTGGTGCCGCAAACAAAAAATTGGACATGACACACACAAATAGCAAAGCAGC 10001 AAAAGTTTATTAAGCACAGTACGATCCACTATGGATCAAGGATGACCTGCGAATGGTATCAGCATCACTTTGCTATATTTCATGGCCTTTTCTATGTGTT 10101 TTTTTTCTCTTTTTCCTCAAGCTGCCTAAGCTTTAGCCAGCATGTGCCTTTTGATTGACAGGTGGGTTGCTTAGTTTCTTGGCCTCTGTGTGTTTACGTG

10201 TCATTTCCTTCCCATAGTTTTAAGTACATGCATGATATGCACTCTGTAGGCATGAACCTTAAGTAGCTAATTACTATACGGGGTCATTTTGAGGATATCT

ттмтммтмтшмт#т####мт#тттттттттттт#тт#ттм

10301 TTTCTCTGTAGTACATGTGCATCTTTTTTTGCAGTGGTGCAATCTTGGCTCACTGCAACCTCCTCCTCCCTGGTTCAAGTGATTCTCCTGCCTCAGCTTC

mmmmmwmmm»mmmmmmmm#mmmmmmmmm#mmmm#mm

10401 CTAAGCACCTGAGACTACAGGTACATGCCACCACGCCCGGCTAATTTTTGTATTTTTAGTAGAGATGGGGTTTCACCATGTTGGCCAGGCTGATCTCGAA

10501 CTCCTGACCGCAAGTGATCCACCCACCTCGGCCTCCCAAAGCACTGGGATTACAGGCATGAGCCACTGCACCCAGCCTAGTATATGCCCATCTCTTAGGA 10601 GCTGCTCCTAACTGGTTTGGTTTGGATCTAGCCAGCCATGGGGCTCCTTATTCACTTATTTATCTTCTGTTTTTGCTCACCTGCCTCTTTCTCTTGCTTC 10701 TGCTCCTACTCATTCCTTCCTTAATCCAACCTCCAATTCCCTCTGCTATTCTCCTGCCTCAAGTTCACTAGGCTGGCTGCAAGGGTCCTGAGGGAGAGGT

10801 TGTGTATCGCCCCTGTATACTCCAGGTCCAGTAAATGTTTGCTGACTAATGATTGGCATTTCCCTCAGGCCCTGCCATTTCTGTGGGCTCAGGTCCCTAC

***********************************MetTrpArgGl yValProPheArgHi sLeuLeuLeuVal LeuGl riLeu 10901 TGGCTCAGGCCCCTGCCTCCCTCGGCAAGGCCACAATGAACCGGGGAGTCCCTTTTAGGCACTTGCTTCTGGTGCTGCAACTGGGTAAGTTCTCAGACCT 11001 GGGGTCTCAATCAGATGGCGTGGGAGGAAAGGCAAAGGTGGAGGATGGGGTAGAGGGGGACAGCGGCGACACTGAGACCTGACTCCTTTCTTTTCCACTT

AI aLeuLeuProAl aAl aThrGl nGl ylysLys Val ValLeuGlyLysLysGl yAspThrVal Gl uLeuThrCysThrAl aSerGl nLysLysSerl 1 e 11101 AGCGCTCCTCCCAGCAGCCACTCAGGGAAAGAAAGTGGTGCTGGGCAAAAAAGGGGATACAGTGGAACTGACCTGTACAGCTTCCCAGAAGAAGAGCATA

Gl nPheHi sTrpLys AsnSer AsnGl ni 1 eLysI 1 eLeuGl yAsnGl nG1 ySerPheLeuThrLys 11201 CAATTCCACTGGAAAAACTCCAACCAGATAAAGATTCTGGGAAATCAGGGCTCCTTCTTAACTAAAGGTAGGGTTGCCTGGCTCCCCATCCAGGGAGGAA

11301 AACACACTATGGAGTGAAAGCCTTTGGTGTCTGAGATCTGGTCTTAGTTAAACTCTGGGATCCCAGAGGGCTTGGGTTGACAGAAACTCAGTGGCATTCT

11401 TATCCAGAGTTTCTCTACACCAACTGCTGGTGGCCCAGGGAAAGGTGGTATGTGAATTTCAATATTTTAATATTTAATATTCATGAACTTATTTTAGTGA

###############################

11501 GTTTTAGAACAATCACTATCACTTAAAACCCGTGATTTCTTGAGTATTGTTGCTACAGACCTATGTAGATAATACTTTGCACAGTGACTCATATGTATAA

ттмтштттт*мштттттттмштттттттттт#ттт

11601 TCCTAGCACTGTGGGAGGCTGAGGCCGGAGGATTGCTTGAGTCCAGGAGTTCAAGACCAGCCTGAACAACATAGTGAGACTCTGTCTCTATGAAAAAAAA

## mmmmmmmmmmmmmmmmmmmmmmmmmmmmmm

11701 AATATATATATTTTTTTTGGAGACAAGGTCTAGTTCTATCACCCAGGCTCCAGTGCAGTGGTGTGATCTCGGCTCACTGCAATCTCCACCTCCCAGGCTC

тттт#ттт§тттттттттттттттютштт#*ттттш

11801 AAGTCATCATCCCACCTCAGCCTCCCAAGTAGCTGGGACTACAGGCATGCACCACCATGCCAGGCTAATTTTTTGTACTTTTAGTAGAGACAGAGTTTCA

тттмшшёмттттттттттмшттттшмттттттмт

11901 CGGTGTTGGCCAGGCTGGTCTTGATCTCCTGACCTCGTGATTTACCCTCCTTGGCCTCCCAAAGTGCTGGGATTACAGGCGTGAGTCACTGTGCCCGGCC

#mm тюшммттттттттттттттттттштм

12001 CAGAATCATTTTTTTCTACTTTTTTTTTTTTGAGGCAAACTCTCGATCTGTTGCCCAGGCTGGAGTGCAGTGGGCATGATCTTGGCTCACTGCAAGCTCT

ттшттттттттттттшмтттшттт#тмютюттмт

12101 GCCTCCCAGGTTCAAGCAATTCTCCTGCCTCAGCCTCCTGAGTAGCTGGGACTACAGGCGTGTGCCACCATGCCCGGCTAATTTGCGTATTTTTAGTAGA

ммттмтттмттмтттюттмттттттттитттттт*

12201 GACCGGTTTTCATCATATTGGCCAGGCTGGTCTTCAACTCCTGACCTCAAGTGATTCTCCCACCTTAGCCTCCCAAAGTGCTGGGATTACAGGCATGAGC 12301 TACTGCACTTGGCCTTTTCTCCTGGTTTTAAAACTATTATATGCTCATTACAAAATATTTGGTCAATGAAGAAAAGAATATGGAAGAAAATCAAATGCAT

тмттт»*тттмтммтмт

12401 аСДТАСТТСТАССАСТСАСАаАТАТССТСТССТААСАПТТСАТТбАТТТТСТТССААТСТТТТТТТТТТТТТТТСТТТТТСАЕАСАЗСйТСТСАСТСТа

тт#т#мттттттттмттшт#тттттттттттттттт

12501 СТССССАСССТССАСТАСАЕТСССЛТСАССАСААСАСАТСЛСАСССТСАЛСТСАССТТСССАСТТСАСССТТСССАВТАССТСССАСТАСАйЕТССАССС

тФтт##»тштмтттюм#ш##т11##шттт#11*тт№#тттттттт

12601 САССАТСТТСАССТААТТТТТТАСТТТТТвТАСАСАТСАСАСТТСАССАТСТТ6СТСА66СТССТСТТ6ААТТССТАС6СТТАА6ТСАТСТТСССССТТТ

ттяттттттттмятмтятт

12701 бвССТСССАААСТбСТбССАТТАТАСйТАТСАСССАСТССАТБТССССТАТТТТСТТССАСТбТТСТТССбССТПСАйААТАТТАТАТАСАТААТТАССТ 12801 АААТСАТАТСАТАСТСТАТАТАССТТТТТТССТАСТССТТССТТААСТТАТАТСАТААТСАбАСТАССААТТАТТАЗАСТТТТТТТСТТТТТТТТСАЗАС

тмтм#мттт#ттттт#тм#ш#11#тшттттт№мтт№мтттм 12901 С6А6ТСТС6БТСТСТСАССТА6ССТССАСТССААТ6СССС6АТСТСАбСТСССТбСААССТСТСССТСССАСЕТТСААбСААТТСТСССТСАбССТСССС

тттмтттттмтяттхтмтятмттттттшммттштттт

13001 АбТАаСТЗСбАСТАСАеАСАСбТаССАССАТеСССАССТААСТТТТТТАТТТТТТТАТТАСАаАСАаССТТССАССАТССТАССАССАТСаТСТСААТСТ ##################################

13101 стссасттсстсатссбттсасстссабетссас - 13133

Рис.3. Нуклеотидная последовательность 5'-концевого участка гена С04 рецептора. Экзоны обозначены звездочкой или аминокислотной последовательностью, данной в транслируемой области трехбуквенным кодом выше нуклеотидной последовательности. А1 и-повторяющиеся элементы (#) и НЕЯУ-К элемент (+) обозначены выше и нихе нуклеотидной последовательности, соответственно.

3. Локализация гена CD4 рецептора на хромосомах клеток моноцитоидной линиии U937.

Используя фрагменты гена CD4 рецептора в качестве зонда была исследована локализация гена CD4 в хромосомах двух клонов моноцитоидныэ клеток человека U937, содержащих по две 12-х хромосомы, на которой локализуется ген CD4.. После гибридизации ДНК хромосом двух клонов ir situ было обнаружено, что зерна серебра локализуются в районе pll-plS хромосомы 12. Ни для одной другой хромосомы двух клонов не обнаруженс превышения зерен серебра над уровнем фона, что свидетельствует о том, что короткое плечо хромосомы 12 не участвовало в перестройках хромосом. В обоих клонах доля клеток, содержащих метку в районе pll-pl2, существенно не различалась (73,2 и 70,2%, соответственно). Гибридизация позволила уточнить расположение этого гена на 12-й хромосоме - между участками 12р11 и 12р12.

4. Анализ структурно-функциональной организации и регуляторных элементов Ъ'-концевого участка гена CD4 рецептора.

Структура секвенированного участка гена CD4 рецептора схематично приведена на рис.4. При анализе нуклеотидной последовательности установлено, что она включает в себя первые три экзона и первые двг интрона гена CD4, а так же часть третьего интрона и прилегающий к первому экзону участок геномной ДНК-

Первый экзон гена С04-рецептора (455-465 нуклеотиды на рис.3) содержит 11 нуклеотидов из нетранслируемого участка мРНК С04-рецептора. Второй экзон (10869-10983 нуклеотиды), размером 114 нуклеотидов, содержит 66 нуклеотидов нетранслируемого участка мРНК и 48 нуклеотидов, кодирующих первые 16 аминокислот лидерного пептида СЭ4-рецептора (рис.3). Размер первого интрона гена, таким образом, составляет 10404 нуклеоти-да. Третий экзон гена CD4-peuenTopa (11112-11277 нуклеотиды) отделен от второго экзона интроном размером 119 нуклеотидов и содержит последовательность (21 нуклеотид), которая кодирует последние 7 аминокислот лидерного пептида и 144 нуклеотида, кодирующих первые 48 аминокислот первого иммуноглобулинподобного домена С04-рецептора. Нуклеотидная последовательность первого иммуноглобулинподобного домена прерывается третьи интроном протяженностью по крайней мере 1815 нуклеотидов. Аналогичный интрон в свое время был обнаружен и в гене, кодирующем L3T4 рецептор мыши. Наличие интрона в середине последовательности иммуноглобулинпо-

Repeats LT R - Exons

ЕЖОМ1 ( 12345 H ERV IIqqj

I-1-1-1-f——I-1-1-1-!-1-f

Alu __J___ _ wm JJJÄ.

repeatsl 2 34 56 7 8 9 1012~1

Рис.4. Структура 5'-концевого участка гена CD4 (схема). Показан размер клонированного участка в т.п.н.; экзоны обозначены прямоугольниками и римскими цифрами; регуляторные элементы (Alu- и GATA-последователыюсти, LTR HERV-K элемент) обозначены стрелками, указывающими направление считывания, и пронумерованы.

эбного домена нехарактерно для белков этого типа. До сих пор не обна-ужено ни одного гена иммуноглобулинов и иммуноглобулинподобных белков, меющих интрон в этой позиции. Все иммуноглобулиновые функциональные эмены кодируются всегда одним экзоном размером около 300 пуклеотидов.

Высокий уровень гомологии между С04 рецептором, 1..3Т4 и другими ммуноглобулинами говорит о том, что гены этих белков появились в ре-мьтате дупликации, которая произошла относительно позже в эволюции /нерсемейства иммуноглобулинов. Очень трудно объяснить наличие этого ¡характерного интрона, используя общепринятую гипотезу о том, что ин-)0ны эволюционно остаточны и формируются перемещением экзонов. згласно этой гипотезе, ген С04 рецептора должен был бы иметь родовой змеи, из которого эволюционировали все гены суперсемейства иммуногло-глинподобных белков, и терял бы интрон. Поэтому, более вероятным собы-(ем представляется инсерция интрона в экзон иммуноглобулинподобного мена во время эволюции С134, до процесса дивергенции человек -1ызуны. Это может быть важным для понимания отдельных этапов эволюции 1К генов этого суперсемейства в частности, так и нитронов в целом.

4.1. Промоторная область гена CD4 рецептора.

Ранее было показано, что промотор гена CD4 рецептора мыши локали зуется на расстоянии 90-60 нуклеотидов от первого экзона по направлени) к 5'-концу гена {-90 область). Этот участок является специфичным дл связывания с ядерным белком NF-CD4 (Nuclear Factor-CD4), фактором, за пускающим транскрипцию. Анализ нуклеотидной последовательности области соответствующей промоторному участку гена CD4 рецептора, показал, что районе основного промотора гена произошла потеря классического "TAT. бокса" и сохранился только участок связывания с ДНК-полимеразой 1 (331-340 нуклеотиды, рис.3). Тем не менее, согласно нашим предваритель ным данным и данным некоторых авторов именно участок, отстоящий на 100 120 нуклеотидов от первого экзона, отвечает за эффективную транскрипцш этого гена. В этой области (321-331 нуклеотиды, рис.3) рядом с участко] связывания с ДНК-полимеразой II, находится нуклеотидная последователь ность, полностью гомологичная консенсусу ETS (External Transcriptioi Sequence), узнаваемая белком-регулятором транскрипции, активно экспрес сирующимся в CD4+ клетках. Эти данные могут говорить о том, что ET¡ специфические транскрипционные факторы могут играть основную роль контроле экспрессии гена CD4 рецептора, взаимодействуя с классически! участком связывания в промоторной области гена.

Кроме того, в промоторном участке гена CD4 рецептора был найде] целый ряд тканеспецифических детерминант регуляции, т.е. функциональны: участков для ДНК-связывающих белков, участвующих регуляции транскрипци! и определяющих ее тканеспецифичность (TCF1, LBP1, TCF2, NF-IL6, GATA LVa, АР2, NF-uEl, Е2а, Т-антиген). Поскольку CD4 рецептор экспрессиру-ется в различных типах клеток, это может иметь важное значение для регуляции транскрипции его гена в различных тканях при различны; условиях.

4.2. Характеристика ретротранспозона, локализованного в гене CD4 рецептора.

Внутри первого интрона гена CD4 рецептора мы обнаружили последовательность, соответстветствующую элементу LTR HERV-K (Long Terminal Repeat of the Human Endogenous Retroviral element, K-type - длинный концевой повтор человеческого эндогенного ретровирусного элемента; 8199-9475 нуклеотидные остатки, рис.3), который находится в ориентации, обратной гену CD4. Эта последовательность не содержит ни открытых рамок

cd4_ourr

cd4rev

ltr-4rev

HSHERVKC

HSERVKB2

HSMHDQ3L

HSMHDQ5L

PTLAA

ltr-3rev

HUMERVKA

HUMERVKA1

HSHERVKB

HSHERVKD

H5HERVKA

.....> repeat HERV - 17 -

GAGAGGTATGGGGAAAAGAAAGAGAGATCAGATTGTTACTGTGTCTATGTAGAAAAAGGA

.......G.

------.G.

.......G.

------.G.

------.G.

.......G.

------.G.

------. G.

.......G.

------.G.

------.G.

------GG.

. T. G,

. GA..

,C.......----...........G.A.T

..............С.......T.......A......G. A. T

С.........G.................G. А......G. A. T

С...........................G........G. A. T

С...........A...............G........G. A. T

. C.

.G.. .G.. ■ TT.

.A.

.. A...............G........G. A. T

.G................G........G. A. T

..............C. A. G.----.G......

. G... G... G........G......GGG... T

60 60 50 54 54 54

.G........G. A. T 54

.G........G. A. T 54

.G........G. A. T 54

54 54 50 46 54

cd4_ourr

cd4rev

ltr-4rsv

HSHERVKC

HSERVKB2

HSMHDQ3L

HSMHDQ5L

PTLAA

1tr-3rev

HUMERVKA

HUMERVKA1

HSHERVKB

HSHERVKD

HSHERVKA

GRE ENHANCER

дада********

AGACATAAGAAACT- - CCATTTTGATCTGTACTAAGAAAAATTGTTCTGCTTTGAGATGC 118

..............--............................................ 118

108 112 112 Ш 111 .T. 112 .T. 112 .T. 112 .T. 112

. G.. . --. . ......T....... ... C... ... с........

.......G. . G... - -. . ......T....... ...C... ... с.........

.......G- . G... - -.. ......T. A..... .....G.. ... c... ... с.......T.

.......G- .G...--.. ......T....... .....C.. ...c... ...С... G.....

. G.. G.. . G.. G.. . G.. G.. . G.. G.. . G.. GT.

. T.... . T.... .T. A.. .T. A.. . T____

---- 107

........... -............................................ 104

, ..GG..G...TTT.......T..................С......С. ..G. ..С. 114

cd4_ourr

cd4rev

Ur-4rev

HSHERVKC

HSERVKB2

HSMHDQ3L

HSMHDQ5L

PTLAA

ltr-3rev

HUMERVKA

HUMERVKA1

HSHERVKB

HSHERVKD

HSHERVKA

cd4_ourr

cd4rev

1tr-4rev

HSHERVKC

HSERVKB2

HSMHDQ3L

HSMHDQ5L

PTLAA

ltr-3rev

HUMERVKA

HUHERVKA1

HSHERVKB

HSHERVKD

HSHERVKA

TGTTAATCTGTAACTTTTGTCCCAACCCTGTGCTCACAAAAACATGTCCTGTATTG-AAT 177

..............CC. A. С..............TG.. G. G......G. .À. G.. .-.C. 167

..............CC. ACC...............G. .G.......GG____G. C.-.C. 171

A. G.. C.. ACC........С......T. TG........G____G. CAA. С. 172

С......T.TG........G____G. CA-, С.

.......T.TG........G____G. CA-. С.

С......T.TG........G____G. CA-, С.

С......Т. TG........G____G. CAA. С.

С......T. TG....G. ..G. ...G.CA-.C.

С......T. TG....G...G. ...G.CA-.C.

С......T. TG........G____G.CA-.C.

..........G........G........-...

.........A... Г

.........A... г

...........G г

.........A. G. г

.........A. G., г

.........A. G. г

.........A. G г

.A____С..........

. ... G. ... A. G. , г

ACC. ACC. ACC. ACG. ACC. ACC. ACC. A.C.

. T.

A. G.. C.. ACC...............T. T.

...............T........T.. . G...............T.......AT.. . G. TG.... A.......TA____TG. T.... -

.. GA... G.......TA.....G. T.... -

. GG. .. . A.......TA.....G. T.... -

.. G A. .. A.......TA.....G. T____-

.. G.... A.......TA..... G. T.... -

.. G.... G.......TA..... G. T... GG.... G.......TA..... G. T... G.. G.... A.......TA......AT.... -

... A. A......C.. T......C. T... G.. G.... A.......TA..... G-T.... A.

170

170

171

172 171 171 165 163

173

....G____G.CC-.C.

ALU-8

CAAGGTTTAATGGATCTAGGGCTGCGCAA-GATGCACTTTTAAAAAGTTCTTGCCTCACA. .236

................. 236

. .TG. ...GTTG...................212

. .TG. ...GTT...----------------------------216

. .TG____GTT......................217

. .TG. ...GTT....................215

. .TG. ...GTT...----------------------------215

..TG. ...GTT...-------------- 216

.. TG____GTT......................217

.. TG____GTT... -...................216

.. TG----GTT.........................216

.. TG____GTT...............................210

. .TG. ...GTT.. С-----------------------208

..TG.... GTT...----------------------------219

- 18 -

ALU-8 с 224 no 516 (292 нуклеотида) ===========> repeat

cd4_ourr GCGACAGAGCAAGACTCTGTCTCAAAAAAAAAAAMAAGAAAAGTTCTTGCAGGCAGTGT

.. A.... ..A. .CA. 232 236

HSHERVKC .........-.......... ....................C..A.G.. .CA.____

HSERVKB2 .................... .........-..........C.GA. G.. ..A..... • CA. 237

HSMHDQ3L .................... HSMHDQ5L.................... PTLAA ................... ....................C.GA. G.. ...........-......--C. GA. G.. ....................C. GA. G.. ..A.____ ..A..... ..A..... .CA. • CA. . CA. 235 235 236

ltr-3rev.................... ....................CTG A. G.. ..A..... • CA. 237

HUMERVKA......----.......... HUMERVKA1.................... HSHERVKB.................... HSHERVKD -- ................. ................----C. GA. G.. --------------------C.GA. G.. ....................C. GA. G.. ..A..... ..A..... .. A.. T. • CA. .CA. .CA. . A. 236 236 230 228 239

HSHERVKA.................... ...........-........C. GA. G.. ..A..... • CA.

cd4_ourr GCTTGGTGAAAGTCATCACCATTCTCCGTTCTCTATTAACCAGAGACACAATGCACTGTG 596

cd4rev ltr-4rev . HSHERVKC . HSERVKB2 . HSMHDQ3L . HSMHDQ5L . PTLAA ltr-3rev . HUMERVKA . HUMERVKA1. HSHERVKB . HSHERVKD . HSHERVKA .

. .T.

CAT. CCT. CCT. CCT. CCT. CCT. CCT. CTT.

.............................................A....... 596

A. G- -.... TG........TAA.... G. G.. C.... G...........T.. CA 290

A. G.. С.... G.......G А..

A. G. A. G. A. G. A. G. A. G.

• T.

A.............C.. C. TAA..

A. G...........C.. C. TAA..

A. G...........C.. C. TAA-.

A. G...........C.. C. TAA..

A. G........---С. .C. TAA..

A. G.........TGC.. C. TAA..

A. G...........C.. C. TAA..

A. G...........C.. C. TAA..

A. G........A.. C.. C. TAA..

A... A. G.

..G. G.G. ..G. ..G. ..G. ..G.

..A-.. .. AA-. ..A--.. AA-. .. AA-.

A.G..C....G.......AA-.

A. G.. C.... G.......AA-.

A. G.. C.... G... T... A-,.

.. С____С____A.... TG.........G......G----

......C.. C. TAA.. G. A. G.. C.... G............

. .C. ..C. ..C. --CA . .C.

..C. ..C. ..C.

296 296

294 289 292

295 295 295 289

..CA 288 290

cd4_ourr GAAGGCCGCAGGAACCCCTGCCCGAGAAAGCCTAGGTATTGTCCA- GGTTTCCCCCCACT 655

cd4rev .............................................-........

ltr-4rev.......A.... G... T......AG......... T..........A. C.... T.

HSHERVKC............G. ..T.....TAG.......-............A......T.

HSERVKB2 A...........G...T.....TAG.......-............A......T.

HSMHDQ3L............G...T.....TAG.......-............A......T.

HSMHDQ5L............G...T.....TAG.......-............A......T.

PTLAA ............G. ..T.....TAG.......-............A......T.

ltr-3rev......T.....G. ..T.....TAG.......-............A......T.

HUMERVKA............G— T.....TAG.......-............A......T.

HUMERVKA1............G...T.....TAG.......-............A......T.

HSHERVKB............G...T.....TAG.......-............A......T.

HSHERVKD ... A........G... T......AG........... G........A........

cd4_ourr GAGACAGCCTGAGATATGGCCTCATGGGAAGGGAAAGACCTTACAGCCCCCCAGCCCGAC 715

cd4rev ........................................................................................................................715

ltr-4rev .T.....................G.................G..C.T........A.A.. 408

HSHERVKC .T.. T.. T.... A..........................G. G.. C. T..........................414

HSERVKB2 .T.. T.. T.... A..........G.................G.. CAT.......A.. A.. 414

HSMHDQ3L .T.. G.. T.... A..........G.................G.. CAT..........................412

HSMHDQ5L .T.....T.... A..........G.................G..C.T.........T... 407

PTLAA .T.. T.. T.... A..........G.................G.. C. T..........................410

ltr-3rev .T.. T.. T.... A..........G.................G.. C. T..........................413

HUMERVKA .T.. T. .T.... A..........G.................G.. C. T..........................413

HUMERVKA1. T.. T.. T.... A..........G.................G.. C. T..........................413

HSHERVKB AT.. T.. T.... A.........TG.................G.. C. T..........................407

HSHERVKD.......................G......A.......T.....CAT..........................407

HSHERVKA ...................................................................290

cd4_ourr ACCCGTAAAGGGTCTGTGCTGAGGAGGATTAGTGAAGGAGGAAGG----CCTCTATTCGG 771

cd4rev .......................................

ltr-4rev....................................A.

HSHERVKC.................................AG. A .

HSERVKB2.................................AT. A..

HSMHDQ31 .................................A.. A..

HSMHDQ5L.................................AT. A.

PTLAA 1 tr-3rev HUMERVKA HUMERVKA1 HSHERVKB HSHERVKD ...A. HSHERVKA -----

.A.

...T. ...T.

A.

.A.. A.

. AT. A........

.A.. A........

. A.. A.......

. AT. A........

____A.... G...

AAGC..

----.T

CATG.. AATG.. CATG.. AATG.. CATG.. AATG.. AATG. . AACA..

T. G. AA T. G. A. -. G. A. -... A. -.G. A. -.G. A. -. G. A. -. G. A. -.G. A. T. G. A. T. G. A.

771 467

470 473

471

466 469

472 472 472

467 460 290

cd4rev ltr-4rev HSHERVKC HSERVKB2

PTLAA

HSHERVKA

TATA-BOX ## TTGAGATAAGAGGAAGGCATCTGTCTCCTGCTCGTCCCTGGG-AATGGAATGACCCGGTG

.. C____ .........GT. . CT.. G..... ____T. T. A...

... A.., ,. A.. T...... .....c..... ____T. T.....

......G... ......C... ......A.., ......C. A... ......CT____ .....c..... .....c..... .... T. T. A.. A ____T. T. T.. A

......C... ..A...... ... C... .....TC..... .....c..... ____T. T____A

......C... ...... CT____ .....c..... ____T. T____A

......C... ......c..... .....c..... ____T. TT... A

......c... ......CT____ .....c..... ____T. T____A

!......C.. . ......CT____ .....c..... ____T. T____A

____A. C.. . ......r._____ .....c...... ____T. T. A. ..

..........................................-.........T. T. A...

830 830 522

530 533

531 526 529

532 532 532

290

G

TATA-BOX U3_R

##### 1

cd4_ourr TAAAACC-GATCATA- CATTCTATTT----TGAGAGAGGAGAAAACTGCCTTATGTCTGG 884

cd4rev .......-.......-..........................................................................884

1 tr-4rev......AAA........ G........A--C.....T.... A.......T......G--------579

HSHERVKC.......C... TG.. - T____C.. C. A--C.....T.........ACAT____G. G--------587

HSERVKB2.......C... TGA. -.....C.. C. A- - C.....T... GA............G. G--------590

HSMHDQ3L.......C... TG.. -TGC.. C.. C. A--C.....T... GA............ G..G--------588

HSMHDQ5L.......C. ..TG..-TG. ..C..C.A--C.....T.A.GA...-.C......G.G.... 582

PTLAA .......C. ..TG. .-TGC..C. .C. A--C.....T... GA.____C......G. G________586

ltr-3rev A... C.. -... TG. .-.G...C..C. A--C.....T... GA.....C......G. G--------588

HUMERVKA.......C... TG.. - TGC.. C.. C. A--C.....T... GA.....C......G. G________589

HUMERVKA1.......C... TG.. - TGC.. C.. C. A- - C.....T... GA.....C......G. G.... 589

HSHERVKB.......C... TG.. -TG... C.. C. A--C.....T... G......CA.....G. G.... 584

HSHERVKD____G.. . C. .. TC. CA. . GT. C. ATTC. A.. . T..........C.. TC. G.. G.. A. 578

HSHERVKA.................-...........-.....................-................290

- 20 -

cd4_ourr AGGCGAGACATCATGGCGGCAATACTGCTCTGTTACTCTTTACTACACTGAGATGTTTGT

cd4rev ............................................................

1tr-4rev ...T..A....GC..................T. A.----

HSHERVKC ... T.......GC.... A.............T. A. ---

-.G. -.G.

-AG. -AG. -GG. -AG.

■ T. .A. .A. • A. .A.

HSERVKB2 ... T. G.....GTG... A...........TC.. A. ---

HSMHDQ3L ... T. G... C. GCG... A...........T... A. ---

HSMHDQ5L ...T.G.....GTG...AA..............A.---

PTLAA ... T. G... C. GCG... A...........T... A.----

1 tr-3rev ... T. G.....GCG... A...........T... A. ---

HUMERVKA ... T. G... C. GCG... A...........T... A. ---

HUMERVKA1... T. G... C. GCG... A...........T... A.--------AG.. T.

HSHERVKB .. .T. G.... GGCG... A.............T. A.--------GG.. T.

HSHERVKD .... A... T.. GC.... A.......................G.................. 638

HSHERVKA.........................-.................................- 290

-AG. GT..........A.

-AG. .T..........A.

.....A.

.....A.

944 944 631

639 642

640 634 638

640

641 641 636

cd4_ourr GTAAAGTTAAACATAAA--------TCTAGCACATCCAGGCACAGCACCTT- TCCTTAAA 995

cd4rev ...................................................-................995

ltr-4rev.......С.........TCTGGCCTA. GTC. T.... A..............-....C... 690

HSHERVKC ... TGTGC. С. TCA.. T........................ С......T.. -. T.....С 676

HSERVKB2 .. GT. TSC. Т. ТС.............-...........А.........T. GA.----Т. С 681

HSMHDQ3L .. GT. TGC. Т. ТС.........................А.........Т. АА..... Т. С 679

HSMHDQ5L ..GT.TGC. Т. ТС. :..-'--............................Т.АА.....Т.С 672

PTLAA .. GT. TGC. Т. ТС.........................А.........Т. АА..... Т. С 677

1 tr-3rev ..GT.TGC. Т. ТС....-.......-...........-А.........T.GA.T. ..Т.С 679

HUMERVKA .. GT. TGC. Т. ТСС........................А.........Т. АА..... Т. С 680

HUMERVKA1.. GT. TGC. Т. ТСС........-...............А.........Т. АА..... Т. С 680

HSHERVKB .. GT. TGC. Т. ТС...................................T. АА. T... T. С 674

HSHERVKD____С.. G.....A. TC--TGGCCTA. GT.......TG____T.. T.....-.....G.. 695

HSHERVKA......................................................ACACTC 296

cd4_ourr CTTATTTATG AC AC AGAG-TCTTTGCTCATATGTTTTTCTGCTGACCCTCTCCTCACCTT 1054

cd4rev ..................-..........CG............................. 1054

1tr-4rev..................A..........C....G..C...............C....A. 750

HSHERVKC ... G..............АСА.... ТС.. С.......С..

HSERVKB2 ... G. С.....TG.. А. САС.....Т... CG.....G...

HSMHDQ3L А.. G. С.....TG.. А.. АС.....Т... С......G...

HSMHDQ5L ...G.C.. PTLAA A..G.C..

......С... ТА.

......С... ТА.

......С... АА.

Т.... ТС... ТА.

736 741 739 732

737

739

740 740 734 714 356

.. TG.....AG.....Т... CG.....А____

A. TG.. А.. АС... G. Т.... G.....G................С... АА.

1 tr-3rev ... G. С.....TG.. А.. АС.. С.. Т... CG.....G................СТ.. TG.

HUMERVKA А.. G. С.....TG. CA.. AC.....T... CG.....G................С... АА.

HUMERVKAIA.. G. С.....TG. CA.. AC.....T... CG.....G................С... АА.

HSHERVKB ... G. С.....TG.....AC... СС.... CG.....А..........T.... ТС... ТА.

HSHERVKD......С.... T. A... TT.........................................

HSHERVKA TGCC. AGGAA. AC.....AC.....T... CT.....A..........T.. CTTC... TA.

POLY A-SI TE ******

cd4_ourr СACCCTATAGCCCCACCACATTCCCC-TCGCGGAGATAGTAAAGATAGTGATCAATAAAT 1113

cd4rev ..........................-..................................................................1113

ltr-4rev T.........T..TG......C....... T. С.....G... G....................................809

HSHERVKC T.......T. T.. TG......C.... - . GT. T.....G... G.....A.......................795

HSERVKB2 TGT. T. G. G A... TGA.____С____-.. T......A. С ACCCACG. A.......................800

HSMHDQ3L TGT. T. G. G A... TGA..... C.... -.. TTC.... A. С ACCC АСА. A.......................798

HSMHDQ5L T. T. T... GA... TG......C....... T. T.... A. CACCCA. A. A.......................791

PTLAA TGT. T. G. GA... TGA..... C....... TT.....A. CACCCACG. A.......................796

1 tr- Зге V TGT. T. G. G A... TGA.....C.... -. .T. A.... A. CACCCACG. A........................798

HUMERVKA TGT. T. G. G A .. TGA..... C.... -.. TTT.... A CACCCACAGA.......................799

HUMERVKA1 TGT. T. G. G A .. TGA..... C.... -.. TTT.... A. CACCCACAGA.......................799

HSHERVKB T. T.....GA... TG......С____-G..........-.............-..............762

HSHERVKD...............---......................---..................................714

HSHERVKA TGT... - AT. A... TG. CA. A .... C.. TGC.... A CAC--...................396

JJ5

cd4_ourr ACTGAGGGAACTCAGAGACCAGCACCGGTGCAGGTCCT-CACTTGCTGAGCGCCGGTCCC 1172

cd4rev 1 tr-4rev .. HSHERVKC .. HSERVKB2 .. HSMHDQ3L .. HSMHDQ5L .. PTLAA

1tr-3rev ..

HUMERVKA .. HUMERVKA1. .

A...

A... A.. A.. A.. .

A .. A...

.....GG..

.. TG. TG., G. TG.. - -G. TG. G.

A. С......

T. С.... A.

----GG.A.

----GG.A.

----GG.A.

G. TG..-------GG.A.

G. TG.. G. TG..

-------GGTA.

-------GG.A.

G. TG..-------GG.A.

.. CTGTA.. .. C.. TA.. .. C.. TA.. .. C.. TA.. .. C.. TA..

.. C.. TA.. . . C.. TA..

.. C.. TA.. .. C.. TA. .

A.....T....

... T... A... .. A... T.. Л .. A... T... T .. AT.. T..

.. A... T... T .. A... T... T .. A... T... T . . A. . . T. . . T

1172 869 855 853 851 844 849

851

852 852

HSHERVKB .......-.................................................... 762

HSHERVKD........-................................................... 714

HSHERVKA------------------------------------------------------------ 396

R

cd4_ourr CTGGGCCCACTTTTATTC--CTCTATA-CTT--TCTCTG-TGTCTTATTTCTTTTCTCAG 1226

cd4rev ..................--.......-...--......-........................................1226

1 tr-4rev TG..C. A.. G.. C. T............A... TGC.....С......С............С 921

HSHERVKC ..С.. G........C..--T.......-...TG......-.....-С..........................910

HSERVKB2 .С......С... А. Т. СТТТ........... TG......-......-.........CA.. 910

HSMHDQ3L . С.. .T.. С... А.Т.СТТТ.......-...TG......-......-.......С.. А.. 908

HSMHDQ5L........С... А. Т. СТТТ.......-... TG......-......-..........А.. 901

PTLAA .С... Т. .С... А. Т. СТТТ.......-... TG......-......-.......С.. А.. 906

1 tr-3rev........С... А. Т. СТТТ........... TG......-......-.........CA.. 908

HUMERVKA . С... T. . С.. . А. Т. СТТТ........... TG......-......-.........CA. А 909

HUMERVKA1. с... Т. . С. . . А. Т. СТТТ.......-... TG......-......-.........CA. А 909

HSHERVKB-------------------------------------------------------------------------762

HSHERVKD-----------------------------------------------------------------714

HSHERVKA-------------------------------------------------------------------396

----> repeat HERV

cd4_ourr TCTCTTGTCTCCACCTTGCGAGAAATACCCACAGGTGTGGAGGGGCAGGCC--CCCTTCA 1284

cd4rev ...................................................--..............1284

ltr-4rev ...T. ..A.-......GAT......С....................T....---.... G. 977

HSHERVKC.....С. . . -.....CGA.......С. A.......................AC..............969

HSERVKB2.....CA.-........AT......С.....................AC.. AC..............969

HSMHDQ3L.....C...........А....... С.....................AC.. AC.... A.. 967

HSMHDQ5L .....CA.-.......AA.......С.....................AC.. AC..............960

PTLAA .....C. . -........A.......С.............T.......AC.. AC.... A.. 965

ltr-3rev.....C. .-.......AA.......С.....................AC. .AC..............967

HUMERVKA.....C... -.......A.......С.............T.......AC.. AC____A.. 968

HUMERVKA1.....C... -.......A.......С.............T.......AC.. AC.... A.. 968

HSHERVKB...........................................................................762

HSHERVKD.......-......-........-........—..................................................714

HSHERVKA--------------------------------------------------------------396

Рис. 5. Сравнительный анализ нуклеотидных последовательностей длинных концевых повторов эндогенных ретровирусов. При сравнении последовательностей точка обозначает совпадение, черточка - делецию. Показаны глюкокортикоидзависимый элемент (GRE) и энхансер; "TATA-бокс"; участок полиаденилирования; U3/R и R/U5 области. Нуклеотидная последовательность встроенного Alu-повтора 8 не приведена.

считывания для ретровирусных белков, ни "классического" пуринбогатог участка на 5'-фланкирующей последовательности З'-LTR, ни тРНК, связывг ющего участка, т.е. является "отдельным" LTR. Приведенный на рис. сравнительный анализ нуклеотидной последовательности обнаруженного LT HERV-K элемента с другими, имеющимися в международном бани аналогичными последовательностями, показал, что это новый, ранее в описанный в литературе элемент, относящийся к HERV-K подсемейству.

Характерной особенностью обнаруженного нами LTR HERV-K, являете встраивание в него Alu-повторяющегося элемента (224-516 нуклеотидь рис.5), что является пока уникальным, ранее не описанным событием. Рол HERV элементов в геноме человека до конца не выяснена, однакс известно, что они могут экспрессироваться в клетках различных опухоле{ В некоторых случаях они могут принимать участие в перестройках геномг являясь одной из движущих сил эволюции, а так же в регуляции экспресси ряда генов. Анализ нуклеотидной последовательности обнаруженного нам LTR HERV-K показал, что он содержит целый ряд генетических элементо! которые теоретически могут принимать участие в эспрессии клонированног нами гена. Так, на расстоянии 87 - 94 нуклеотида от начала ретротранс позона находится энхансер, определяющий зависимость транскрипции о глюкокортикоидов (GRE; рис.5). Трудно сказать, насколько эти последова тельности функциональны, однако известно, что в некоторых линиях опухо левых, клеток экспрессия HERV элементов стимулируется стероидными гормо нами.

Так же, как и все другие HERV элементы, CD4 HERV-K содержи ТАТАА бокс и классический сигнал полиаденилирования (рис.5). Кром того, последовательность обнаруженного LTR HERV-K. содержит еще целы; ряд участков связывания с белками, принимающими самое активное участи в тканеспецифичной регуляции экспрессии генов. Это, прежде всего, пос ледовательность, участвующая в связывании белка р53 (158-161 нуклеотиды, рис.5), фактора ингибирующего развитие опухолей и обладаю щего свойствами как активатора, так и ингибитора транскрипции ETSl-последовательность (195-205 нуклеотиды); участки связывания NF IL6; АР2; Т-антигена и др. Мы не проводили эксперименты по изучении функциональной активности генетических элементов, обнаруженных в LT1 HERV-K элементе, и поэтому не можем пока говорить о их роли в регуляцш экспрессии клонированного нами гена. Однако, интересен уже сам фак' такой высокой концентрации регуляторных элементов в гене CD4 рецептора.

4.3. Анализ Alu-повторяющихся элементов в гене CD4 рецептора.

Внутри секвенированного фрагмента гена CD4 рецептора мы обнару-1ли 14 Alu-повторяющихся элементов, 8 из которых кластеризованы в два iKyca. Все Alu-повторы локализуются в интронах (рис.4) и составляют лее 50% всей нуклеотидной последовательности клонированного участка на CD4 рецептора. Такой концентрации Alu-повторов до сих пор не обна-живалось ни в одном гене. Три Alu-повтора, обозначенные на рис. 4 под 1мерами 2, 7 и 10, находятся в прямой ориентации, остальные 11 в об-тной, так называемой, транскрибируемой ориентации. Гомология между наруженными Alu-повторами и общей (Aiu-консенсусной) последователь-'Стью составляет от 70 до 90%, Роль Alu повторяющихся элементов в теме человека в настоящее время до конца не выяснена. В литературе име-гся данные об участии этих генетических элементов в гомологичной ре-мбинации, в результате которой происходят делении генетического мате-ала между Alu-повторами и перестройки самих повторов. Кроме того, то показано, что некоторые гены (например, ген орнитин-бета-1инотрансферазы) могут экспрессироваться в дефектной форме за счет траивания между экзонами Alu-повтора и использования участков альтер-тивного сплайсинга, находящихся внутри Alu-повтора. В этом отношении айне интересны обнаруженные нами в некоторых Alu-повторах открытые мки считывания для белков с высокой степенью гомологии с белками BCGF актор роста B-лимфоцитов), СОМ5 (пятый компонент системы Комплемента) DAF (dekay accelerating factor), также относящегося к системе Компле-нта. Рамки считывания этих гипотетических белков находятся внутри вертированных Alu-попторов, обозначенных на рис.4 под номерами 5, 8, 9, и 11.

На рис. 6 представлены данные сравнительного анализа гомологии жду белками из открытых рамок считывания Alu-повторов и белками BCGF, ^F, и СОМ5. Открытые рамки считывания для белков, гомологичных DAF и )М5, распологаются на той же нити ДНК, что и ген CD4 рецептора, а рам-для белка, гомологичного BCGF, на комплементарной нити ДНК. Как вид-из рисунка, процент гомологии очень высок и составляет: для белка IGF 65% и 74% гомологии с белками из А1и4- и А1и9-повторов, соответ-зенно; для белка DAF 53% и 57% гомологии с белками из А1и8- и ull-повторов, соответственно; для белка СОМ5 70%, 66% и 64% гомологии белками из Alu5-, Alu8- и Alull-повторов, соответственно. Причем, в тке BCGF и гипотетических белках из Alu-повторов 4 и 9, также как и Alu8 и DAF, совпадают терминирующие кодоны.

BCGF IKKERLWLGPVAHTYNPSTLGGRGGWITRGQEFKTSLANMVEPCLY*

Älu 4 K..IDICP.T...AC......NQ.....L...LE.....I.K.Y..* А

A1u 9 ----YTR.. А___АС... А.........С.... EI......К.Н..*

DAF GSRPVTQAGMRWCDRSSLQS-RTPGFKRSFHFSLPSSWYYRH Alu 4 Q. HS.....VQ. H. LG... PPP-.....FSYL.. I____0. -AI u 8 E. CS. A... VQ. R. LG.. PPLP.... TPFSCL......N... Б

Alu 11 R. SSI... PVQ... LG____PP-. RL. S. S. L......D...

C0M5 TSGMQSLALSPRLECNGKISGHC-KLRLPGSSDSPASASQVAGITGTHHHAQPT

Alu 5 FFLRW.... L.....S. V.. A.. -N.................E.. DVR.... LI

Alu 8 FFLR........... S. A.. A.. -H. С____RH......R... T.. AR... RLI В

Alu 11 FFWR. G. V.....Q. S. V.. A.. -N. H.....HH. T.......Т.. M.... RLI

Alu. 14 FFLRR.. G.........A.. AR. -N. С.....N. -.... R... Т. D. С.... L.

Рис. 6. Сравнительный анализ открытых рамок считывания из

Alu-повторов с BCGF (А); DAF (Б) и С0М5 (В). Аминокислотная последовательность дана в однобуквенном коде; Буквами показаны аминокислотные замены; (*)- терминирующий кодон; (-) - отсутствие аминокислоты; (.) - совпадающие аминокислоты.

Интересно, что А1и8-повтор, который локализуется внутри Ь' НЕИУ-К элемента, содержит две открытые рамки считывания для белков, г мологичных БАР и С0М5 (рис. 7). Кроме того, этот А1и-повтор содерж несколько участков альтернативного сплайсинга, которые теоретичес; могут участвовать в переключении синтеза мРНК для одного белка мРНК для другого белка. То, что некоторые А1и-повторы могут содержать открытые рамки считывания для белка, высокогомологичного С-концево! домену белка СОМ5, нет ничего удивительного, т.к. известно, что нукл отидная последовательность, кодирующая этот домен в нормальном ге: человеческого белка СОМ5, также располагается внутри А1и-повтора. Г белка ОЛИ, как показано, может синтезировать два белка (ЭАР1 и ЭАР2) ) механизму альтернативного сплайсинга, сайты для которого находят! внутри А1и-последовательности. Данные о хромосомной локализации эт! генов в литературе отсутствуют, поэтому в нашем случае можно предпол; гать не только случайную гомологию или "молчащие", измененные в проце( се эволюции копии генов, но и возможность их полиморфизма, тем боле что все элементы, необходимые для эффективной транскрипции этого учас-ка генома, присутствуют в ЬТ1? НЕ1?У-К элементе, в который включ* А1и8-повтор. Что касается белка ВСйР, то до сих пор не было данных том, что экзоны этого гена могут локализоваться в ретропозонах, т.

* *

C0M5CQ --F--F--L--R--Q-S-L—A--L--S--P--R--L--E--C--S--G--A--I Alu8 TTTTTTTTTTGAGACAGAGTCTTGCTCTGTCGCCCAGGCTGGAGTGCAGTGGCGCGATC DAFCO -E--S--C--S--V--A--Q--A--G--V--Q--W--R--D--

COM5 -S--A--H--C--H--L--C--L--P--G--S--R--H--S--P--A--S--A--S-Alu8 TCGGCTCACTGCCACCTCTGCCTCCCGGGTTCACGCCATTCTCCTGCCTCAGCCTCC DAF L--G--S--L--P--P--L--P--P--G--F--T--P--F--S--C--L--S--L--

COM5 -R--V--A--G--T--T--G--A--R--H--H--A--R--L--I--#

Alu8 CCAGTAGCTGGAACTACAGGCGCCCGCCACCACGCCCGGCTAATTTTT DAF P--S--S--W--N--Y--R--R--P--P--P--R--P--A--N--#

Рис. 7. Локализация открытых рамок считывания

в Al ü8 повторе гена С04-рецептора. COM5CD и dafcd - белки гомологичные С0М5 и DAF, соответственно; (*) - потенциальные участки сплайсинга; (#) - терминирующий кодон.

| нуклеотидная и аминокислотная последовательность определена по :ледовательности кДНК. Несмотря на высокий уровень гомологии между

ютетическими белками из А1и-повторов и ВСОР ничего нельзя сказать о ;ой-либо их функциональной активности. Тем не менее, наличие внутри 1-повторов регуляторных элементов и фрагментов генов, лишний раз 1тверждает гипотезу о том, что мобильные генетические элементы, меня -(ие свою локализацию, активно участвуют как в эволюционных перестрой: генома, так и в экспрессии отдельных генов.

Участие А1и-нонторяющихся элементов в регуляции экспрессии под-рждают данные о том, что А1и-повторы ДНК могут связываться с нукле-1мами в процессе транскрипции некоторых генов. Для такого взаимодей-ия ДНК А1и-повтора должна иметь определенную шиилькообразную иторич-э структуру с участками, доступными для связывания с белками, входн-ми в нуклеосому. Такие структуры ранее предлагались, однако, они •ли быть использованы только для некоторых подсемейств А1и-повторов.

предлагаем свою гипотетическую структуру А1и-повтора, которая ержит четыре шпилечных структуры, по две в каждом из мономеров -повтора (рис.8). Особенностью этой структуры является то, что она :яется консенсусной для всех известных в настоящее время -повторяющихся элементов, т.е. нанесение любых нуклеотидных замен из гих А1и-повторов не приводит к изменению самой структуры, так как ктически все замены носят компенсаторный характер. Насколько функци-

C-T

T А

C-A

G*C

1 «

G*C

C*G

T |

C*G

A*T

C*G

T*A

G*C

C*G

AA*T

>| (<-

CC*G

T T*A

С С C*G

G T CGC*GT

A G 1 1

A G CTC*GC

С T C*G

T С C-A

А C*G G*C

C*G G*C

T*A G*C

G*C T*AT

A-C т 1

C*G C*GT

C*GT A*T

T | G-T 1 с

C*GT С А A*T

G-T A*T G*C G*C

А G 1 А C*G C*G

G*C G*C AC*G G*C

C*G G*C 1 1 TA*TC

AC*G T*A CC-A ( (

1 1 G*C A-C TC*GT

СС-А CTA*TT C-AT T*A

G*C 1 т G T C*G

С-AT CGC*GG C*GA C*G

G T C*G C*G T |

C*GA C*G C*G G*C

C*G G*C A*T C-A

C*G C-A G*C C*G

G T C*G C*G T*A

G*C T*A T*A C*G

3' - CC*GTGAAACCCTCCGGC*GATGATTTTTATGTTTTTAA*TGAGCCCTCCGA*TTTTTTTTTTT-5'

Рис. 8. А Возможная вторичная структура Alu-повтора 5 в прямой (I) ориентации. Стрелками показан промотор для РНК-полимеразы III; знаком (*) обозначены взаимодействующие нуклеотиды.

6-А

А Т

Б-Т

СЧ

1 N

с*с

йЧ

А 1

СС

Т*А

С*С

А*Т

с*с

ТТ*А

- — >| |<-

А А*Т

й й

С А БСа*СА

Т С 1 1

Т С САС*СЕ

Б. в А 6*С

А в Б-Т

С*С

А*Т

С*С А*ТА

т-с А 1

с*с Э*СА

Б*СА Т*А

А 1 С-А 1 с

й*СА в Т Т*А

С-А Т*А с*й СЧ

Т С 1 т С*С

С*С сч СЧ

С*С С*в 1 I АТ*А6

ТС*С А*Т св-т | |

1 1 С*Б Т-в АС*СА

БС-Т САТ*АА С-ТА А*Т

! а С А

в- ТА ЕСй*СС Б*СТ

С А С*С А 1

й*СТ в*с

Т*А Б-Т

Б-Т СЧ

С А 6*С А*Т

А*Т А*Т

5' - СС*САСТТТСЕСАССССС*СТАСТАААААТАСАААААТТ*АСТСЕС6АСССТ*ААААААААААА- 3'

Рис. 8. Б. Возможная вторичная структура А1 и-повтора 5 в обратной ориентации. Обозначения такие же, как и на рис. 8А.

ональна такая структура, сказать в настоящее время невозможно, одна все исследованные нами Alu-повторы, принадлежащие к различным cyôrpj пам, могут иметь такую структуру.

Высокая концентрация Alu-повторов и наличие LTR HERV-K элемент; первом и втором интронах гена CD4 рецептора представляют большой ин-рес еще и потому, что эти элементы являются наиболее предпочтительны участками для встраивания провирусной ДНК в геном инфицируемой клет при ВИЧ-инфекции.

4.4. Другие регуляторные элементы, локализованные в гене CD4.

Кроме Alu-повторов и LTR HERV-K элемента в первом интроне ге CD4 рецептора между ALu3 и А1и6 мы обнаружили кластер GATA - последо! тельностей. Отдельные GATA-участки встречаются внутри промоторной с ласти и внутри HERV-элемента. Однако, только повтор А1иЗ фланкирован каждой стороны тринадцатью тандемно расположенными GATA-участками. Вс го же в этой области GATA- участков более 100. Показано, что участ GATA играют важную роль в транскрипции ряда генов, кодирующих бел иммунной системы. Эти последовательности служат участком связывания д белков, специфически активирующих энхансеры, а, значит, и экспрессию нов в клетках, не относящихся к Т-популяции. Однако, для выполнен этой функции достаточно одного GATA-участка. Наличие же целого класте этих элементов может, на наш взгляд, лишний раз свидетельствовать высокой транскрипционной активности клонированного участка гена.

Исследование механизмов регуляции экспрессии гена CD4 рецепто имеет важное значение в плане понимания процессов развития Т-клето Известно, что пролиферация и дифференциация лимфобластоидных клеточн! линий являются составной частью иммунного ответа организма. На опред ленной стадии созревания предшественников Т-лимфоцитов происходит ] дифференцировка на CD4+ и CD8+ Т-клетки, выполняющие разные биологиче* кие функции. Наличие большого числа потенциальных регуляторов экспре! сии в исследованном нами фрагменте гена CD4 рецептора может помочь дальнейших исследованиях, направленных на выяснение тонкого механиз> регуляции дифференциации Т-лимфоцитов.

ВЫВОДЫ

1. Клонирована хромосомная копия гена Сй4-рецептора Т-лимфоцитов товека. Уточнена локализация этого гена на 12-н хромосоме в районе >12-12р11.

2. Впервые определена нуклсотидная последовательность ■концевого участка гена CD4 рецептора, включающая промоторную тасть, три первых экзона и интрона гена.

3. Показано, что последовательность, кодирующая первый иммуногло-тиннодобный домен CD4 рецептора, прерывается протяженным интроном, з является нетипичным для белков, родственных иммуноглобулинам.

4. Описаны регуляторные элементы промоторной области гена '4 рецептора и локализоиан участок ETS (Externa! Transription juence), предположительно участвующий в тканеспецифической экспрессии >го гена.

5. Описан новый длинный концевой повтор человеческого эндогенно ретровирусного элемента, интегрированный в первый интрон гена CD4 ¡ептора, и локализованы его участки, способные участвовать в регуля-и транскрипции этого гена.

6. Впервые показано, что Alu-повторяющиеся элементы ДНК человека гут включаться в длинные концевые повторы эндогенных ретровирусов.

Список работ, опубликованных по теме диссертации.

\. Сидоров A.B., Здановский А. Г., Зверев В. В., Пугач A.B., люшова В.В. Гибридный полипептид S304, фрагмент ДНК NS304, антивирус-1 активность полипептида. // Заявка на патент РФ N 94022863/13 1581) от 14.06.94.

2. Зверев В.В., Сидоров A.B., Недоспасов С.А., Малюшова В.В., ^лова И.А., Анджапаридзе О.Г., Блинов В.М. Нуклеотидная последова-!ьность двух экзонов гена CD4 рецептора Т-лимфоцитов человека. // 1росы вирусологии. 1995. N3. С.248-251.

3. Сидоров A.B., Зверев В. В., Здановский А. Г., Пугач A.B., люшова В.В., Анджапариджзе О.Г. Противовирусное действие рекомбинант-х рецепторотоксинов на основе дифтерийного токсина и CD4 рецептора тимфоцитов человека. // Вопросы вирусологии. 1994. N1. С.6-10.

4. .A.G. Zdanovsky, M.V. Zdanovskaia, A.V. Sidorov, V.V. lushova, V.V. Zverev, O.G. Andzhaparidze, V.G. Debabov. Construction I expression in E.coli of hybrid genes composed of sequences encoding

diphtheria toxin and human CD4 receptor. // Gene. 1994. V.139. P.77-82.

5. Сидоров А.В., Здановский А.Г., Шухмина H.P., Зверев Е Анджапаридзе О. Г. Стабильность и вирусингибирующее действие реком нантных рецепторотоксинов па основе CD4 рецептора Т-лимфоцитов чело! и дифтерийного токсина. // Вопросы вирусологии. 1995. N3. С.272-275.

6. Зверев В. В., Шахов А.Н., Недоспасов С. А., Пугач А Сидоров А.В., Малюшова В.В., Анджапаридзе О.Г. Клонирование и экспр сия в клетках. Е. coli фрагментов гена CD4 рецептора Т-лимфоцигов че века. // Мол. генетика, микробиология и вирусология. - 1991. N 1. 16-18.

7. Zverev V., Malushova V., Sidorov A., Zdanovsky A., Bli V., Korneeva M., Pugach A., Yankovsky N., Andjaparidze O. Inhibition the infectivity of HIV by different recombinant forms of CD4. Abstracts of the Sixth international conference on AIDS, San Francis USA.. 1990 (20-24 June).V.l. Th.A.252, P. 181.

8. Zverev V., Sidorov A., Zdanovsky A., Malushova V. Zdanovska M., Shukhmina N., Andjaparidze O., Pille E., Melnikova Inhibition of the infectivity of HIV by different forms of Ct diphteria recombinant immunotoxines. - VIII Internationa) Conference AIDS. Amsterdam, The Netherlands. 19-24 July, 1992. V.3, PuA 62i P.45.

9. Pashkova Т., Revasova E., Sidorov A., Zverev V., Karan E. CD4-receptor as a marker of cell suscebility to HIV1. // 2-nd Inti national conference on AIDS, cancer and human retroviruses. S Petersburg, Russia, 29 Nov.-03 Dec., 1993, P.36.

10. Зверев В. В., Малюшова В. В., Сидоров А. В., Пугач А.] Шухмина Н.Р., Пилле Э.Р., Мельникова Н.Л., Анджапаридзе О.Г. Против вирусное действие рекомбинантных форм CD4 рецептора Т-лимфоцитов чел века. // Вопросы вирусологии. 1994. N2. С.56-59.

11. Zverev V., Nedospasov S., Udalova I., Sidorov i Malushova V., Blinov V. Nucleotide sequence and structure of the 5'-e part of the gene of CD4 receptor. // 2-nd International conference i AIDS, cancer and human retroviruses. St.-Petersburg, Russia, 29 Nov.-i Dec. 1993. P. 12.

12. Zverev V., Nedospasov S., Udalova I., Sidorov A., Malusho V., Blinov V. Structure of the retroviral element and Alu-repeats the gene of the CD4 receptor. // 3—nd International conference on AID cancer and related problems. St. Petersburg, Russia, May 22-26, 199. p. 29.