Бесплатный автореферат и диссертация по биологии на тему
Нуклеотидная последовательность и структурная организация генов С-гордеинов ячменя
ВАК РФ 03.00.15, Генетика

Автореферат диссертации по теме "Нуклеотидная последовательность и структурная организация генов С-гордеинов ячменя"

РОССИЙСКАЯ АКАДЕМИЯ НАУК ЙНСТЙТУТ ОБЩЕЙ ГЕНЕТИКИ ИМ. Н.И.ВАВИЛОВА

На правах рукописи

УДК: 577.214.622:582.542.1

Саянова Ольга Владимировна

НУКЛВОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ Й СТРУКТУРНАЯ ОРГАНИЗАЦИЯ ГЕНОВ С-ГОРДЕИНОВ ЯЧМШ.

(ОЗ.ОО.15 - генетика)

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата биологических наук

Москва - 1992

0

/

Работ« шш« к лабораторий иишкулярша генатяк» и генетической шошнарии растений Института обадЛ: гм»тшиг им. Н.И.Вавилова РАН.

Научный руководитель:

доктор биологических наук Е.В.Ананьева

Официальные оппоненты:

доктор биологических наук;

профессор Э.С.Пирузян

квндидат биологических наук В.Г.Лунин .

Ведущая организация:

Центр "Биоинженерия" РАНЛ.

Защита диссертации состоится "/^ " /¿О35 1992 года в час. на заседании специализировашюго Ученого совета ДСС2.49.01 в Институте оОщ^йгенетики им.Н.И.Вавилова РАН по адресу: 117809, Йосква*,ЬьЗЗЗ, ул. Губкина, 3.

С диссертацией шжно ознакомиться в библиотеке Института.

Автореферат разослан _"__;_1992 г.

Ученый секретарь специализированного совета кандидат биологических наук

Г.Н.Полухина

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ.

Актуальность темы.

Исследование механизмов регуляции функционирования генов, для которых характерна временная и тканевая специфичность экспрессии, является одной из фундаментальных задач молекулярной биологии растений. Гены запасных белков, для которых отчетливо выражены, оба тала регуляции, являются хорошей модельной системой. Для ясного понимания механизмов специфической регуляции этих генов необходимо знание структурной организации как можно большего количества геномных копий генов запасных белков-. Сравнение нуклеотидных последовательностей, изучение отдельных ?пементов этих последовательностей позволит локализовать регуляторные участки и получить точную картину функционировния этих генов.

Запасные белки ячменя - гордеины - составляют более 50 * бежа эндосперма. Большая часть запасных белков представлена В- и С-гордеинами. Полинептиды каждой из этих групп кодируются семействами, состоящими из нескольких десятков генов, рас -положенных в двух локусах на хромосоме 5 (Кгв1з et а1, 1985).

Гордеины имеют несбалансированный аминокислотный состав: они бедны незаменимыми аминокислотами, особенно лизином. В перспективе изменение состава или увеличение синтеза гордеи-нов, обогащенных этими аминокислотами, возможно, позволит улучшить питательную ценность зерна.

Использование современных методов молекулярной биологии ускоряет проведении исследований в данном направлении и позволяет приступить к детальному анализу представителей различных семейств генов запасш.л Оелков, их структуры, временной и пространственной экспрессии и ее регуляции.

Цель работы.

1. Клонирование последовательностей генов С-гордеююв.

2. Определение первичной структуры генов С-гордеинов.

3. Выявление функциональных и структурных особенностей

генов С-гордеинов на основе сравнительного анализа последовательностей клонированных и охарактеризованных ранее

генов.

4. Построение физических карт клонов, содержащих последо-

вательности генов С-гордеинов.

Научная новизна и практическая значимость работы.

Клонированы 4 новые последовательности генов С-гордеинов. Впервые определена нуклеотидная последовательность полноразмерного гена С-гордеина и его окружения. Получена новая информация по структуре и организации генов С-гордеинов.

Представленные в роботе даиные могут быть использованы для роиошш задачи улучшения питательных качеств запасных белков ячменя путем целенаправленного измонения их аминокислотного состава, а такхе увеличания синтеза нужных белков путем получения трансгенных растений, содержащих гены запасных Оелков с заданными свойствами.

Апробация работа.

Материалы диссертации были представлены на Всесоюзной конференции по биотехнологии зерновых культур, Алма-Ата, 1988; на Мнлейдам симпозиуме "Генетические исследования и образование", Дели, 1991; на VI Международном симпозиуме "Генетика ячменя", Хелсинборг, 1931 и на проблемном семинаре "Молекулярные и клеточные основы генетических процессов" ИОГен РАН, Москва, 1992.

Структура и объем диссертации.

Диссертация состоит из введения, трех глав, заключения, выводов и списка литературы. Она изложена на 125 страницах, содержит 32 рисунка, две таблицы и библиографический список из 164 наименований.

ОПИСАНИЕ СОДЕРЖАНИЯ РАБОТЫ.

I. Гены запасных белков ячменя.

Запасные белки ячменя и других злаков подразделяют на группы на основании сходства их аминокислотных последовательностей: группа высокомолекулярных проламщюв (о - гордеины), группа проламинов, не содержащих эн-группы (С-гордеины), и группа проламинов, содержащих сн-группы (В-и т-гордеины). 95 % всей гордеиновой фракции приходится на В- и С-гордеины, которые кодируются семействами тесно сцепленных генов.

Структурные гены, кодирующие полипептида в-, с- и

D-гордеинов расположены в коротком плече пятой хромосомы, в локусах, обозначенный, соответственно, ног г, ног i и

Ног з.

Блоттинг-гибридизацией по Саузерну было показано, что семейство генов ног i локуса представлено 3-8 членами, а Ног 2 локуса - примерно 30 членами. (Rasmussen, Brandt, 1986; Forde et al, 1985).

В настоящее время имеются данные о нуклеотидннх последовательностях одного геномного клона С-гордеина xhori-14, который оказался псевдогеном (Entwistie, 1988), и укороченных с 5'- конца КЛОНОВ КДНК рсР387 (Forde et al, 1985) И рс hori-з (Rasmussen, Brandt, 1986). Отсутствие полноразмерного функционально-активного гена С-гордеина, относящегося к группе бедных серой малокопийных проламинов, является существенным недостатком в системном изучении генов запасных белков. Поэтому, нашей задачей стало клонирование последовательностей генов С-гордеинов, определение их структуры и организации.

2. клонирование генов С-гордеинов.

Отбор геномных клонов с генами С-гордеинов проводили из двух неамплифицировашшх геномных библиотек ячменя, одна из которых была получена на основе вектора аемвы и содержала фрагменты ДНК, возникшие при частичном расщеплении геномной ДНК ячменя эндонуклеазой ecori, а другая была любезно предоставлена проф.Роде из ФРГ и содержала продукты частичного расщепления ваизл. В качестве зонда использовали КДНК клона С-гордеина рсР°87 (Forde et al, 1985).

В результате скринирования I05 клонов было получено 10 положительных клонов. 4 из них были очищены, повторно гибри-дизованы и использованы для дальнейшего анализа. Три клона -АСН1, хенз, А.СН4 , были выделены из библиотеки, содержащей ecori-фрагменты ДНК ячменя; один клон - асн5 был получен из библиотеки ваизл-чйрагментов. Блоттинг-гибридиззцией ' по Саузерну было показано, что последовательности, гомолопг-пше кДНК С-гордеина содержатся в рестрикционных HindimJparMeH-тах разных размеров: 1,5; 1.7; 2.1: 2.5 тпн.

з

При гибридизации кДНК клона рсрзв7 с геномной ДНК ячменя сорта М564, гидролизованной эндонуклеазой рестрикции Н1п<ии, выявляются фрагменты сходных разиеров:1,7; 2,1; 2,3; 2,5 ттш. Наиболее сильная гибридизация при этой наблюдалась с фрагментом длиной 2,1 тон. В этой связи для дальнейшей работы был выбран фаговый клон лен«, который содержит н1гкпи-фрагдант длиной 2,1 тпн, гибридиэугсдайся с кДНК рсР387. Этот фрагмент клонировали в векторе рмгзв1иоесг1ьв(-) и использовали для определения нуклеотндаой последовательности методой Сэнтера (Рис. I).

1«- 3200 ш

ТАТА оокс

8ЛОШВТ-300 , АТС ТАС сигналы полиА

ЕсоВД

_ _ I АТС ТАС ------ —

-ксрйх а ь__________ii ва»н1

1 и 1Г И "" Т НИИГМ 11 Н1п<111Х Асс1Т

_« Н1п«1И1Р»«

Рис. г. Рестпшшзонная карта в стратегия секвениро-вания гена С-гордеина из клона хсн<». Горизонтальными стрелками обозначены направления чтения в протяженность секвешрованных участков. Занашен-ным прямоугольником показана структурам часть гева дтс - стартовый кодон, тас - етоп-кодои.

Анализ последовательности показал, что клон содержит промоторную, кодирупцую и з'-нетранслируемую области. Надо отметить, что работа с ЭТИМИ клонами в клетках Escherichia coli затруднена из-за наличия в кодирующей области многочисленных прямых та ¡темных повторов. Клонированный nindin-фрзгмент оказался короче соответствующего фрагмента клона ленч на 200 mi. Долепил была картирован,! в кодирующей области гена внутри Psti-фрагмента длиной 650 пн, который содержит основной блок повторяющихся мотивов.

Для того, чтобы определить нуклеотидную последовательность полноразмерной кодирующей области, мы клонировали EcoRi-фрагмент ДНК длиной 3.2 тип, содержащий ген С--гордеина из клона лет, в векторе pMi juiuoscrtpt( < ). Из итого клона были получены субклоны, содержащие кодирующую область без делеций, область, прилегающую к промотору и 3'-фланкирующую область (Рис. I).

Блоттинг-гибридизация no Саузерну показала, что при расщеплении ДНК клона лен4 и плазмидного клона рснР770, содержащего кодирующую область, рестриктаэой Psti, в обоих клонах выявляется идентичный psti-фрагмент длиной 770 пн (Рис. 2).

I 2 Tim I 2

А Б

Рис. 2. Гибридизация по Саузерну ДНК фагового клона асн4 (I) и плазмидного рснР77о (2), гидролизованных Рвш, с кодирующей областью клона кДНК рсрзз7. В качестве маркеров длин использовались Рзъ1-фрагменты фага а (2,8; 0,8 тли).

А. Электрофореграмма.

Б. Радиоавтограф.

GAATTCACAA ATTTGCCGTA CATTTTGAAG ATTATATAGC TATCATAATT 50

TCTAGAGTTG CATAAAATGC GAAGAGACAC TGTCCCAAAG AGACCATGCG 100

AAACTCAACA TAGATGCATC GTTTGATCCT TGACTCATAT CAGGGTGTTT 150

TTGGAGCGGT GATAAAGGGT AACAATGTAA AATTCTTTGC AGATACACAT 200

GGGAAGGTTG ATTCCAGTTA TAATGCTTTT ATAGTAGANC CCCTATCCTG 250

aacgtttcgt ctaaatc'wï CACATATGAG CGGATGCAAT AAATTTGAGA 300

tcaatcagoa taatatagaa GVGATCACTA CCATCAAAGA GGGGAGCTTG 350

tcgttcattc caactgctat ГГГТСЛТСЛС ТСЛТАТЛ"ПТ_ACGCCCTTAG 400

астттластс АТЛТААТТТА ATGAACCCCG TTATATGGAA ACCAACCATC 450

tttgtacatg AA1TGCCTAG ACTGGATATA TATTCCCCTC CTAATCTTTT 500

CTTACAGTCT ACCCTTGAGG AAATTGTCCC CATGGTTGTA AAAATGCGAT 550 GATTCTTATG AATGAATAAA GGAGATTGAA GTTTTAAAAA АСЛТССТЛСЛ 600 TCCAACACGG ATAATATATT AATTITAGTG TGACCAACAC TAATTTTAAT 650 AAAAGCTTAC AAACTTAATC CCACTCAAGC TATGCCTÀTC""TGGATATGAC 700 TACATAAAGT AGAGCATCAC AAACTAAATT CCAAAAAGAG GCAAAATCTG 750 GATTAATGTG TGTAGTGTÄÄ~AGTGAAAAAA TGAGTCATCA TTCATTATCA 800

850 900 950 1000 1050

1100

agcatgcctt acaacgagac gatacgtgca acaaaaagca ACTATGATGA

GCAATCCAAA ATCACACAAG" Ttaaagtagta CTACCAAATA caacatacca

AACGATTAGT TGGATAATCT TAGGACTACr TTTTCAAAAA CAAAGGGCAà

GGATGAAATT ATACCATÁCC ATGACAGCfnTTXSSTSjvACA TGCACCATCA

TGÓTTGCCCT ccatcatcca AACTGCACAC ACCAAGATCA CAAACATCAA

M К t F L T

ТТССЛАСААА GCAATAGTAA CCACAAATCC AACATGAAGA ccttcctcac

F V L L A H V M 6 I V T T A H Q

CTTTGTCCTC CTTGCCATGG TQATGAGCAT CGTCACTACC GCT ACGCAAC

L N P S S Q E L Q S P Q Q S Y l q

taaaccctag cagccaagag TTGCAATCAC CACAACAATC ATATCTCCAG

Q P V P Q N P Y L P Q Q P P t> V Q

CAGCCATATC CACAAAACCC ATATCTACCG СААСААССЛТ TTCCAGTCCA

Q P F H T P Q Q Y F P Y L P S Б

gcaaccgttt cacacacccc aacaatattt CCCCTATCTA CCAGAGGAAT

L S P Q У Q I P T P L Q P 0 Q P F

TGTCTCCCCA ATATCAAATA CCAACCCCCC TACAACCACA ACAACCATTC

P Q Q P Q Q P L P R P Q Q P F P W

CCCCAACAAC CACAACAACC TCTTCCTCGG CCCCAACAAC CATTCCCCTG

1150

1200

1250

1300

1350

qpq qpf pqpq qpi pyq gcaaccacaa caaccatttc cccagcccca АСЛАССААТТ ccctaccaac 1450

pqqp f h q qpq q i i s qqp CACAACAACC ATTCAACCAG CAACCACAAC AAATAATATC CCAGCAACCA 1500

QQP FPQQ PQQ PFP QPQQ caacaaccat tcccccaaca"accacaacaa ccttttcctc agccccaaca 1550

pfp wqp qqpf pqp qqp accattcccc tggcaaccac aacaaccatt tccccagcct caacaaccat 1600

fplq pqq pfp wqpq qpf ttcccctgca accacaacaa ccattcccct ggcaaccaca acaaccattt 1650

pqp qqpi a h q pqq pfsf ccgcagcccc aacaacctat tgcgcaccaa ccacaacaac cattctcgtt 1700

sqq pqq pfpl qpq qpf ctcgcagcaa ccacaacaac cattccctct gcaaccgcaa caaccattcc 1750

pqqp qqp fpq qpqq iif cccaacaacc acaacaacca tttccccaac aaccacaaca aataaïtttc 1800

qqp qqsy pvq pqq p f p q cagcaacccc aacaatcata ccctgtgcaa cctcaacagc catttcctca 1050

pqp vpq q r p q q a s plq accccaacca gtcccccagc aacgacccca acaagcatcc cccctacaac 1900

pqqp fpq g se qiip qqp cccaacaacc atttccccag g3atcagaac лалтлаттсс ccagcaacct 1950

qqp fplq phq pyt qqti caacaaccat tccctctgca gccacaccaa ccatatacac ласааасслт 2000

H S M V

ttggagtatg gt(|y^tcat caggggccta tgaagcgaca agttgtaata 2050

rtaaatgggt ggatcatcat cctttagtca acggagtgtt taatgtaatg 2100

vtgatawata fjstgatgtg caccatcatg tgtaaccccg acctatacta 2150

îttcaaatga gaataaajaga caaagaaagt tcttgtcaca aggacagtgc 2200

pcgtaattat taaattngtg ccatatttag atttîciacc ctaactacah 2250

rttgagtgat atccattatc tgcctattta tgatgtgaag tcctatgagc 2300

ггаасатаат taacggttga tagcttggtt tgaattgaat tattagcaaa 2350

raaggagtaa ttaataaïtg caaattatcc cttcgatgtc tagccataçg 2400

lattgtgtga ccttatcgtt tgtaatgatt ctagattgta catatacatt 2450

tcctaattg ttgagtgaca tatgaagcaa catatggtga ccgaccactg 2500

gtctcgggtg taaatctcag тассасстгт atatcgaggg gagtgagatc 25

atgatgactt cgtgtggaat tttgtagtta tttaaatag'j' ttctaaaatg 26

gaccggttgc tcatattaga aaatatgggc ttgcgccata tcgagttttt 26

ggwütggac aagatgaagg gatgattgaa tttatgcctt ctatttctct 27

tgcacatgaa acttgagatt gaatatggtg gcattacaag ttacttacag 27

aagttccata gactaattat gtccacctag tatagctacc caatggtcgg 28 aagctt

Рис. 3. Нуклеотидная и аминокислотная последовательное С-гордеина лам. Горизонтальными стрелками отмече прямые и инвертированные повторы, вертикальной стрел» обозначено наиболее вероятное место отщепления сигнал! го пептида. Подчеркнуты: элемент "-300", салт-, лс боксы, вставки в З'-нетранслируемой области, я-конце! уникальная последовательность. татл-6окс, терминируни кодсн и сигналы полиадени.'шровзния обведены.

3. Определеше первичной структуры гена С-гордеина хам

Стратегия секвенирования. использованная при оцределе] полной нуклеотидной последовательности гена С-гордеина xci приведена на Рис.1. Там же отражена общая структура reí С-гордеина.

3.1. Анализ кодирующей области.

Общая длина последовательности гена С-гордеина и фла. кируицшс его участков составляет.2820 пн (Рис. 3). Обнар жена одна протяженная открытая рамка считывания, в котор закодирован полшептид длиной 310 аминокислот. Она начин ется с atg кодона и имеет длину 930 пн. Подобно другим ген проламинов злаков, ген С-гордеина xciu не имеет интронов.

Первые 19 аминокислот являются, по всей видимости, си налъным пептидом, который отщепляется после остатка аланин Аминокислотные остатки с 1-го по 20-й гидрофобны,- после ин циирующего atg кодона следует заряженный остаток лизина, ч вместе составляет основные характеристики сигнального пеш да (Heijne, 1977).в таком случае зрелый белок содержит 2 аминокислоту.

За последовательностью предполагаемого сигнального пептида следует уникальная последовательность rqlhps (Рис. 4). Она идентична н-концевой части полкпепткда С2-гордеина

(Schmitt, Svendsen, 1980), НО ОТЛИЧЭеТСЯ ОТ ТЗКОВОй КЛОН8

Ahori-i4, делецией шести аминокислот и двумя аминокислотами заменили.

MKTFLTFVLLAbUMSIVTTARQUVPSHQELQSPQQPFLKQQSYLQQP Ahor 1-14 л*********** ************* *** * * * ********

KXTFLTFVUJ14VMSIVTTARQLKPSSQELQSP------QQSYLQQP ACH4

********************* *****

RQLNPSSQELQSP'------OQPYI/X2P С2-Г0РД6ЙН

Рис. 4. Сравнение и-концевих аминокислотных последовательностей генов лпоп-14, асн4 и-полипептида С2-гордеинз. Жирным шрифтом выделены последовательности сигнального пептида, подчеркнута уникальная н-концевая последовательность. Звездочками указаны идентичные аминокислоты, пропусками - делегированные .

90 * всей аминокислотной последовательности гена асн4 составляют повторящиеся блоки октапептида pqqfpqq, называемые еще кор-последовательностями или мотивами. Такие же мотивы обнаружены у дедуцированных аминокислотных последовательностей псевдогена и частичшх клопов кДНК С-гордеинов

(Forde et al, 1985; Rasraussen, Brandt, 1906).

На рис. 5 приведено сравнение аминокислотных последовательностей гена С-гордеина лсн4, псевдогона Ahori-i4 и клонов кДНК рсР387 и рс hon-".. Для каждого полилептида гомологичные повторящиеся единицы расположены в виде столбца. Это позволило нам сделать вывод, что все сравниваемые последовательности гомологичны; но имеют ряд отличий. Кодирующая область гена Ahori-i4 прерывается стоп-кодовом тле в положении 481. Амбер-кодон находится в 5-ом положении октапептида и должен был бы, учитывая строение кор-последовательности мотива, соответствовать кодону фенилаланина (ТТТ). Именно этот триплет наблюдается в соответствующем положении в гене асн4 и формула повторяйцегося октапептида остается неизменной.

kxtfltf'ví.lakahsi v'íta mktfbtmaamw-s jvtta.

RQLííPSHQELQS RQLNPSSQELQS

PQQPv'LK. ........

. QQSYLQQ PQQSYLQQ

...PYPQQ ...PYPQN

...PVL.. ...PYL..

................PQQPFPV.

PQQPFPT. .QQPF1IT.

PQQFFPYL PQQYFPYL

................PKELSP.Q

PQQTFP.P YQIPTPLQ

SQQPNPLQ PQQPFPQQ

PQQPFPLQ PQQPLPR.

PQ. P________PQQPFPWQ

PQQPFP.Q PQQPFP.Q

PQQPHPQQ PQQPIPYQ

PQQPFPRQ PQQPFNQQ

PQQIVPQQ PQQ1ISQQ

PQQPFPQQ PQQPFPQQ

PQQPFP.Q PQQPFP.Q

PQQPFSWQ PQQPFPWQ

PQQPFLQ. PQQPFPQ.

PI.QI.+ PLQ PQQPFPLQ

AQQPFPLQ PQQPFPWQ

PQLPFF.Q PQQPFP.Q

PQQPIGQQ PQQPIAIIQ

PKQPLLQQ PQQPFSFS

PQQTIPQQ ......QQ

PQQPFPLQ PQQPFPLQ

PQQPFPQQ PQQPFPQQ

PQQPLFQQ PQQPFPQQ

PQQIISQQ PQQIIFQQ

PQQPFPLQ ........

PQQPFP.Q PQQSYPVQ PQQSYPVQ

P.QPFPQ. PQQPFPQ. PQQPFPO-

......EQ PQPVPQQR • PQPVPQQR

PQQAFPLQ PQQASPLQ POQÍ.SPLQ FPQ

PQQPFPEE PQQPFPQG PQQPFPQG PQQPFPQQ

SEQXI... SEQII... SEQII...........

TQQPFPLQ PQCí..... PQQPFPLQ PQQPFPLQ

PQQLFPQQ ........ P.QPFPQQ PQQPFPQQ

PQQPLPQ. ........ PQQPLPQ. PQQPFPQ.

PQQPFRQL ........ PQQPFPQQ PQQPFRQQ

PKYIIPQQ ........ AQLIIPQQ AQLIIPQQ

PQQPFLLQ PQQPFPLQ PQQPLPLQ PQQPFPLQ

PHQ..........PHQPYTQQ PHQPYTQQ P11QPYTQQ

PQQPYAQQ .............. ......

DIWSDIALLG TIWSHV TIWSHV TIWSMV

Дhorl-14 ЛСН4 • pcP387 pe horl-3

Рис. 5. Сравнение аминокислотных последовательностей клонов

АСН4, Ahorl-14, рсР387 И рс horl-З. ДЛЯ КЭЕДОГО белка ГОМОлогичные повторявдизся мотивы расположишь в виде колонки. Жирным шрифтом выделены аминокислотные остатки, идентичные остаткам в соответствующих повторах полипептида асн4. Внутренний стоп-кодон в клоне Ahori-i4 обозначен +.

С-конг.-зая уникальная последовательность полипептида лен«; жоит значительно болызее сходство с продуктами экспроссирукцк-чся: генов, чем с дедуцированным продуктом нол-чащего гена. При сравнении мотивов, расположенных ближе к С-коицеьоЯ части аминокислотной последовательности , выявляется высокий уровень гомологии клонов^кДНК и клона ЛСН4. Об этом свидетельствует тот факт, что 47 аминокислот 3'-части кодирующей области лС1К полностью идентичны таким еэ аминокислотам клона кДНК рсР387. Интересно, что эта область повторяющихся последовательностей содержат сильно вкрозденше повторы и имеет невысокую гомологию (56 %) с аналогичной областью псевдогена. Она прерывается делецией четырех блоков повторов в гене лСН4,' после чего снова следует участок практически 100 %-й гомологии с клоном рсГ387, а также с клоном рс ьоп-з.

С-ко ниц аминокислотной последовательности зог-г.с-ь-уа! ацеит,:иЛ1 такому же С-концу клонов кДНК. .

Учитывал, что ген С-гордсина лСН4 имеет большее сродство к ¡слону рсР367, но не идентичен ему, можно сделать вывод, что он кодирует неизвестный еще полшептид и является новым выделенным геном С-гордеина.

Делеция 47 аминокислот в области повторов гена АСН4 моетт указывать на то, что события такого рода, как инсерции отдельных блокоз или триплетов, являются основным источником полиморфизма семейства С-гордеиноз.

3.1.1. Аминокислотный состав гена аСН4.

Анализ аминокислотной последовательности показал, что наиболее часто встречаемыми аминокислотами являются глутамин (104 остатка) и яролин (87 остатков) (Табл. I). Они составляют в сумме 62 % всех аминокислот. Следующими в списке часто употребляемых аминокислот е гене аСН4 идут фенилалания (8,0 %), лейцин (5,0 % ), изолейцин (3,5 %), серии (4,1 %) и валш (2,2 %). В отличие от молчащего гена , дедуцированная последовательность аминокислот гена асн4 содержит только один остаток лизкна ( 0,2 %), что полностью соответствует аминокислотному составу полипептида сг-гордеша.

Таблица I. АМИНОКИСЛОТНЫЙ СОСТАВ ГЕНА С-ГОРДЕИНА

сокращенное обозначение аминокислот Содержание

абсолютное 4

АХА л 3 0,96

лея N 3 0,96

СУБ с 0 0

оьу в 2 0,6

Н1г н 3 0,96

НЕТ н 4 1,7

ши ь 15 5,0

РКО р 87 28,0

ТНК т 8 2,5

туй у 9 2,9

лка и 3 0,96

АЭР 0 0 0

сш а 104 33,0

в 4 1,7

1ЬЕ X 11 3,5

ьуз к 1 0,3

ГНЕ р 25 8

БЕИ г 13 4,1

тар к 4 1,7

уаь v 7 2,2

3.1.2. Предпочтительность использования кодонов.

Наблвдается предпочтительность использования кодонов X некоторых аминокислот-. Это касается, рревде всего, глутамиЕ пролина, а гаюке тирозина и треонина (ТаОЛ, II). Триплетом кодируется 84 % глутамина, 50 % -прошш кодируются триплеа сса. Остальные 50 % распределяются еее, еет и ссс трг летами. На ттт кодон приходится 77 56 тщ&гёйна, §9 % треовкЕ кодируются асс кодонои.

Тзблща 2

ЙСШЖКЗСВАНИЕ ГОШИОЗ В ГЕНЕ С-ГОРДЕНИА ХСН4

РНЕ 11 SER 1 TKR 7 crs 0

РНЕ 14 SER 2 TYR 2 CYS 0 с

т

л LEO 0 SER 4 ochre 0 opal 0 A T

0 LEU 2 SER 2 amber 1 TRP 4 G P

р LEU 2 PRO 12 HIS 0 ARG 0 T e

в LEU 2 PRO 27 HIS 3 ARG 0 С T

с

а LEU 5 PRO 43 GUI 80 ARG 1 A ь

я LEU 4 PRO 16 GLN 16 ARG 1 G я

ILE 4 THR 1 ASN 0 SER 1 T

б ILE 2 THR 5 ASH 3 SER 3 С б

А

У ILE 5 THR 2 LYS 0 ARG 0 A У

к MET 4 THR 0 LYS 1 ARG 1 G к

в VAI 0 ALA 1 ASP 0 GLY 0 T в

а VAI 4 ALA 1 ASP 0 GLY 0 С а

G

VAI 0 ALA 0 GLU 2 GLY 1 A

VAI 3 ALA 1 GLU 2 GLY 0 G

Т I с | л !• G вторая О у к а а

з.'2. з'-нетранслируемая область.

3'-нетранслируемая область клона хсн4 (Рис. б) содераит два потенциальных сигнала полиаденилирования. По отношению к терминируодему кодону трансляции они занимают то же положат нке, что и в клонах кДНК, и разделяются между собой 49 ну-клеотидами.

На расстоянии 40 нуклаотидов от второго сигнала полиаденилирования находится последовательность аттааа. Ыоено предположить, что это третий сигнал полцаденилирования, в котором произошла точховзя мутация, в результате которой адешш Сил Заменен тиьшном. Через II нуклеотидов от предполагаемого третьего сигнала полиаденшшровэшя находится практически совершенный инвертированный повтор длиной 9 нуклеотидов. По-следователь-ность, им образуемая, позволяет формировать вторичную структуру по типу ешелькн, которая мокет иметь важное значение для терггинацик транскрипции е/еле полиаденшшрования транскрипта .

Интересно отметить, что в клетках яивотных возмогший сигнал полиадзвилировання часто сопровождается гуаышовыы куклео-гидом. Это наблюдается и в гене С-гордеина аСН4.

При сравнении с последовательностью молчащего гене аьоп- 14 в З'-нетранслируемой области гена хсн4 выявляется две ьставки (Рис.6) длиной 157 и 23 пн. В базе данных сепе-вапк не обнаружено последовательности, гомологичной вставке в 157 пн. В настоящее время она является наиболее значительной документированной перестройкой в непосредственном окружении генов гордеинов ячменя, которые отличаются высокой степенью эволюционной консервативности. Примечательно, что вставка фланкирована короткими прямыми повторами длиной 5 пн, и имеет в своем составе последовательности, гомологичные кор-юследовательности энхансера 8У40.

Представляет интерес природа вставки длиной 157 пн. В геноме человека и обезьяны имеются короткие последовательности из - зоо -150 пн, которые получили название А1ш- и В1-семейств.

Поскольку удвоение группы нуклаотидов в сайтах интеграции - характерная черта всех перемещающихся элементов про- и эукариот, считается, что прямые повтора по сторонам от А1и1-и В1- последовательностей указывают на их способность к транспозициям.

Исходя из вышесказанного, ш сделали предположение, что ышщщщая нами вставка в 157 пн, фланкированная прямыми повтораш, ШШ.1 относиться к семейству перемещающихся элементов.

д д*с***ССС**-*-Т*** — ЧГЛА/ГоЯ*****А**************С*Т****

в стсс ".с|---тсатслсссссста-тсаасссасаасттстлатастааатссст

С А А А А А А---А-АААААААААЛААА-АААААААА ***

Д А'!1-* * * А А АС А ТС* А А А А* А АС-Т* А А А А А СС * * * * * Т* * * * С * *С+ * * * * * *

в ссатсатслтсстттастсаасосастстттаа-тстаатслтсатаКатаааЕ

£ ааааааааааа**ааааааааааа*аааааааа-**аааа**ааа******а**

д ааа;а а а*а а аа а а а ааааааа^*аааааааааа*аа***** лес*****-— -*

Н ТСЛТСТС.СЛССАТСАТСТСТЛАСССССАССТАТАСТАСТТСЛА—ЛТСАС!ЛАТА

£ ААЛААЛАЙ** ААААААА АА А А аа А А А АСА А АА А А* А А** А** А--А •> А А * А А А А

Д * А АДАА-АА А А-АА--АА А АА ААА АА** АДА*Д** ******Т***СС***

Б ^Ч-СА-САЛАСАЛАСТТСТГСТСЛСМССАСАСТССТССтЯттНА-Ата

а С А* * А АА А А А« А* А А А • АА АА А АС* * »А*Т*Л*,*****С<,***С******

и НСЧ'СССАТА1ЦГТАСЛТТГГСААСССТ*ААСТАСАК1Ц1МГСАСТСАТА'ГССАТТАТ

Л *АД**АА4Л»*»»*Д**А***С»*«******»Д**»«АХ*****Т*****ТС»*

В СТСССТЛТТТЛТСЛТСТаААСТССТЛТСАСССТАЛСАТААТТААСССТТСАТАС

'Д ДА АА А АА А*А *«*А *АААААА А А А А А А А А А А А АТддА ^ » А А А А А А А А А А А

в -СГГССГГГСААЭТЧ^ЛАТТАТТАССАААТАЛССАСТААТТААТААТТССАААТТ

Д А А А'ГА А А А АДА Ад А А * АТ*С* * * * * « С * * * * * * . . . .

в дтсССТТССАТСТСТАСССАТА^СААаП'ДТСТ^АССТа'АТССТТТСТААТСАТТ

в стаса1п'СТАСАТАТАСАГт>ССТАА'п'СТТСАСТСАСАТАТСААССААСАТА

В ТССТСАСССАССАСТССТСГСОССТСТАМТСТСАбТАССАССТТТЛТАТССАС

д _ С»*ССА*******С****С»**С

В ССЙАСТС ЛСЛТСАТСАТСАСТТсЬтСТОСАА,тП>аТАСГГЛ'Г1ТАААТАСТТТ

Рисч б. Сравнение, 3'- нэтранслируемых областей геномных КЛОПОВ \horl-14 (А), ХСН4 (В) и клона КДНК рс Ьог1-3 (С). Звездочками обозначены идентичше нуклеотиды, стрелками -прймно и инвертированные повторы. Подчеркнуты вставка и последовательности, гомологичные кор-последовательяости энхаисэра эу40. сгоп-кодоны и сигналы полиаденюшрования обведены.

3.3. 5'-накодг?уидая область гена аснл.

Анализ Б'-некодирупцей области гена С-гордеина АС114 показал, что в ней имеются все консервативнее рогуляторные элементы, характерные для генов проламшюв (Рис. 3). Это прежде всего tata- и caat-óokcü, а также agga-Gqkc и элемент "-300". В прошторной области гена аСН4 элемент "-300" расположен между нуклеотидами 757 и 786 относительно atg кодона. Он содержит последовательность, которая гомологична кор-послодоватильности энхансера sv40 , а именно tgtaaact. Похожий мопш gtaaagt, прсдставлошшй 7 raí, находится в положении 870 и отсутствует у многих промоторов проламинов. саат-Оокс и agga-бокс дуплицированы. Основываясь на том, что последовательности, необходимые для экспрессии генов, должны быть консервативны для большой группы генов с одинаковым типом экспрессии, проводилась работа по детальному сравнению 5'-фланкирующих областей ряда генов проламинов (Рис. 7).

4. Гибридизация фрагментов ДНК клонов С-гордеинов с тотальной ДНК ячменя.

Для изучения ближайшего окружения генов С-гордеинов, полученных нами из двух библиотек, была поставлена гибридизация HindXll-фраГМеНТОВ ДНК клонов АСН4, АСНЗ, АСН4 И ЛСН5 с

меченой тотальной ДНК ячменя сорта М564 (Рис. 8). Показано, что в . клоне хСН5 имеется высокоповторяпцаяся нуклеотидная последовательность, которая находится в Шпат-фрагменте длиной 3000 пн. Это еще одно указание на то, что гены С-го-рдеинов имеют разное окружение: фланкирующие их нуклеотидные последовательности содержат специфичные по длине и степени копийности в геноме вставки.

5. Построение физических карт клонов, содержащих гены С-гордеинов.

Для построения физических карт использовался метод перекрестной гибридизации фрагментов ДНК фаговых клонов с

-600 -500 -400 -300 -200 -loo -1 пн I_I_1_1_I_I_L

В-гордеин PBKR1B4

tgtaaag

caat tata

atg

а/р-глиадин

pw8233

ЗеИН221 pMLl

атс

tgtaaag caat tata tgtaaag caat tata

atg

3chhz19 ZG99

i] атс

tgtaaag caat agga tata

С-горденн

АСН4

т-гордеш

tgtaaag

tgtaaag

caat tata

Ш

agga caat agga tata

атс

Рис. 7. Диаграмма, показывающая положение консервативных последовательностей в 5•-некодирупцей области разных генов проламинов. Затемнены участки 80-92 * гомологии, заштрихованы - 74 % гомологии, незакра-шени - 56-62 % гомологии. Буквами указаны кор-последовательности, характерные для наиболее консервативных участков ДНК.

Рис.8. Гибридизация по Саузерну Hindiи-фрагмевтов ДНК ячменя геномных клонов хснх (2), аснз (з), асН4 (4), ХСН5 (5 > с тотальной ДНК ячменя. Контролем гибри-дизациислукила тотальная ДНК ячменя сорта Ы564. В качестве маркеров длин использовала Psti-фрагменгы фага А ( 5,0; 4,0; 2,8; 1,1 TЩ ).

А. Электрофореграмма. Б. Радиоавтограф.

различными участками гена С-гордеина. ДНК гидролиэовали одной ели совместно двумя эвдонуклеазами рестрикции.

lCH4

18000 ТЛЯ

10 В

DT

EcoRl

fcoRI EcoRl BamHl Bamlll EcoRl-,. , EcoBl Pstl JPstll

в \ 1_L_J Г t 1,1t i прав,

тп-и , —^-Ы^^Щшт

Patl Bamlll e,_.»r,» r'.BamHl „ T .„

iCH3

Sindlll T'

Hindin

tHindllI BamHl

17 800 ТПН Pstl

EcoRl

16 В

eoRl EcoRl _ I

| Patl Patl EcoRl Pstl I Pstl EcoRl p __ pa"l i + i 4 * H , EcoRl

EcoRl

прав

1Л.

t

Hindi11

t t

Uindlll T | Hindlll BamHl

Hindlll

t

Hindlll

ПЛ.

I

ICH1

14 800 ТПН

ив

EcoRl

1—-

Pstl _L_

1)1' Hindin

Pstl

EcoRl X J, EcoRl

EcoRl

Т^ШШ^г-,-^

-4-

прав.

BamHl

t

Hindlll

ПЛ.

BamHl

- кодирующая область

- промоторная область

- з'- нетранслируемая область

- 5'- фланкирующая область

Рис. 9. Физические карты геномных клонов хсн4, хснз и xchi.

выводы

1. Клонированы 4 нуклеотидные последовательности reí ячменя, гомологичные гену С-гордеина. Показано, что они и» разные физические карты, при этой структурная организация ыологичных последовательностей высококонсервативна.

2. Определена нуклеотвдная последовательность полно! мерного гена С-гордеина и фданкирувдих его областей о( длиной 2800 пн. Обнарувена óдна протяженная открытая рг считывания длиной 930 пн, кодирующая потенциальный полит ткд из 310 аминокислот. Первые 19 аминокислот соотввтсть сигнальному пептиду; 90 % зрелого полипептида составляют вторяющиеся блоки, кодирующие октапептид Pro-cin-Gin-r Phe-Pro-Cin-Gin. Кодирупцая область не имеет нитронов.

- В 5'- нетранслируемой области выявлены регуляторные участ содержащие элемент "-300", caat-, agga- и tata- боксы.

- 3' - нетранслируемая область имеет 2 сигнала полиаденили вания и прямой инвертированный повтор, позволяющий Форш вать шпилечную структуру, важную для терминации транскрипцв

'3. Во фланкирующих нуклеотидных последовательностях нарушены специфичные по длине и степени копийности вставки клоне АСН5 обнаружена высокоповторяпцаяся нуклеотидная пос довательность размером порядка 3000 пн. В клоне ясн4 имее вставка в 3' - нетранслируемой области длиной 150 пн, флан рованная короткими прямыми повторами, что мо свидетельствовать о ее принадлежности к семейству перемещ щихся элементов. Вставка имеет в своем составе последовате Ности< гомологичные корчюследовательности энхансера SV40. уйМяетсЯ первой охарактеризованной перестройкой в б летай ókpyióíma генов гордеинов ячменя, которые отличаются вы со степенью эволюционной консервативности.

'4. Обнаружены заветные различия длин кодирующих облас клош^Ьэнши 'гёйЬв: 930 пн в Клойо асн4; 200 и 1000 пн в к не аснЬ;; ;5ÓÓ 'tík 'й уКЛбнв achí И 600 йн в клоне achs , что ляется юДек^ВДййй 'бсновой полймор^зЫа размеров С-гордеин

5. Кпой Vüfó 'ЩЬ ijetíü СнРорДеШа, расположен

по отношению друг к другу :ti¿ "ГоДойа К Голове''. : первое свидетельство того, что 'Ш гордейнов Moryf fcecüo

гатьсй ь неиосреяственной близости друг от друга в пределах локуса джкной I? 800 ш.

Список работ, оауОйякввзнвкж со теме диссертации:

1. Давлетова Ш.К, Желют Л.Г, Саянова О.В., Шахмано» Н.Б., Ме-хедов С.Л., Ананьев Е.В. Клонирование генов запасных белков ячменя. Тезисы докладов Всесоюзной конференции по биотехнологии зерновьи культур. Алма-Ата► 1988, с. 56.

2. Davietova Sh., Zhelnin L., Sayanova O., ShaKaanov N., Kek-hedov S., Ananijev E. Cloning; of barley storage protein genes. Proceedings of the /II Congress of Eucarpla, abstracts, 1989.

3. Саянова O.B., Мехедов С.Л., Ананьов Е.В. Выделение и характеристика клонов с генами запасных белков ячменя. В сборнике "Молекулярные механизмы генетических процессов". Москва, ИОГен 1990.

4. S.Kekhedov, О.Sayanova, N.Cheneres julc, D.Belostotsky, R.Young, E.Ananiev. Genetic engineering approaches to iaprou* nutrition quality of seed protein in barley. Abstracts, of Golden Jubilee symposium on "Genetic Research and Education:current trends and the next fifty years. New Delhy, 1991, Ill, p. .858.

5. S.Mekhedov, O.Sayanova , E.Burketbaev, T.Khokhlova, E.Ana-niev. cloning and study of the structure of barley storage proteins genes. Proceedings of the Sixth International Barley Genetics Symposiuii, Helsingborg, 1991, v.-I, p. 154 - 156.

6. Мехедов С.Л., Саянова О.В., Буркитбаев Е.М., Хохлова Т.А., Ананьев Е.В. Клонирование и определение нуклеотидной последовательности гена С-гордеина ячменя. Тезисы докл. стенд, сообщ. 1-го Всесоюзного симпозиума "Новые методы биотехнологии растений", Пущино, 1991, с. 20-22.