Бесплатный автореферат и диссертация по биологии на тему
Информационный анализ генов тРНК, его связь с происхожденим генетического кода и структурной организацией генома
ВАК РФ 03.00.02, Биофизика

Автореферат диссертации по теме "Информационный анализ генов тРНК, его связь с происхожденим генетического кода и структурной организацией генома"

РГО Од

РОССИЙСКАЯ АКАДЕМИЯ НАУК ИНСТИТУТ ХИМИЧЕСКОЙ ФИЗИКИ имени Н. Н. СЕМЕНОВА

На правах рукописи

ЧАЛ ЕЙ Мария Борисовна

ИНФОРМАЦИОННЫЙ АНАЛИЗ ГЕНОВ тРНК, ЕГО СВЯЗЬ С ПРОИСХОЖДЕНИЕМ ГЕНЕТИЧЕСКОГО КОДА И СТРУКТУРНОЙ ОРГАНИЗАЦИЕЙ ГЕНОМА

03.00.02 — биофизика

Автореферат диссертации на соискание ученой степени кандидата биологических наук

Москва 1993

Работа выполнена в Отделе кинетики химических и биологических процессов Института химической физики РАН.

Научный руководитель: кандидат биологических наук,

старший научный сотрудник Е. В. Короткое

Официальные оппоненты: доктор физико-математических наук, профессор В. Г. Туманян доктор биологических наук О. В. Евграфов

Ведущая организация: Институт молекулярной генетики РАН

Защита состоится « Лб » 199 3 Г.

в « // » часов на заседании специализированного Совета Д.002.26.07 при Институте химической физики РАН по адресу: 117977, г. Москва, ул. Косыгина, 4.

С диссертацией можно ознакомиться в библиотеке Института химической физики РАН

Автореферат разослан «<АО »

1993 г.

Ученый секретарь Специализированного совета, кандидат химических наук

М. А. Смотряева

Общая характеристика работы. В настоящее время стремительно нарастает объем информации о последовательности иуклсстидов в ZUik И РНК разнообразных биологических видов. Крупнеядие банки данное пуклестидных последовательностей созданы в Японии (ргпл, Европе (EM6L1 и Америке (GenBanH. В связи с успехами методик .СКЕСННро-вания стало возможным в ближайшие 10-15 лет определить полную пос-

п

ледовательность ДНК человека, геном которого оценивается в 3*10 основания. Соответствующие научные программа "Геном человека" приняты в во всех развитых в научном отношении странах, в том числе и в нашей стране (Watson s.o., t<?«»o; Баев A.A., Мирзабеков А. Д. .193?).

Однако, когда длина ухе известных последовательностей составляет МИЛЛИОНЫ пар основания. (Uatorman li.,lt'?0!, одних только'экс -периментальных методов анализа генетического материала становится недостаточно, чтобы получато все более полное представление о структурной, функциональной организации и эволюции генома. 3 сzr-.vi с этим, компьютерный анализ генетических последовательностей получил широкое распространение во всем мире.

Если посмотреть на геном любого биологического вида кзк на программу его развития и осуществления жизненных функции, ¡плисан-иуо и отлаживаемую самой природой на протяжении всея истории развития жизни на Земле, становится понятным, что сравните?' >:!»• компьютерный анализ генетических последовательностей как однто вида, так и различных видов позволяет взглянуть на биологическую эволюцию со стороны генома. Именно поэтому, сейчас особоо з:мч! ¡ию приобретают новые методы сравнительного анализа ДНК, поэсолл^жш выявлять самые ранние эволюционные образования в геноме. Та кии является информационный метод анализа ДНК, который расширяет понг. тие подобия последовательностей, основанное на их гомологии, и выявляет "скрытые" от обычных методов анализа взаимосвязи, учитывав все возможные совпадения основания между последовательностями .

Коль и задачи исследования. Основная цель настоящего исследования состояла о проведении анализа эволюционной дивергенции генов тРНК различных биологических видов, как имевших одинаковую амино -кислэтпуо специфичность, так и целых множеств генов тРНК различной аминокислотной специфичности; а также в проведении поиска "неканонических" (т.е. не имеющих существенной гомологии с генами тРНК! тРНК-подобных последовательностей в геноме человека, основываясь на результатах анализа эволюционной дивергенции последовательное -тея генов тР1К.

Конкретные задачи исследования включали:

1. Построение, с применением теории нечетких отношений (Татига 5., 1971), глобальной классификации генов тРНК одинаковой аминокислотной специфичности из банка данных еиве., отражавшая возможные эволюционные связи между тРНК из различных видов;

2. Построение схемы взаимосвязей между множествами генов тРНК различной аминокислотной специфичности, отражающей эволюцию генетического кода и эволюционный порядок образования множеств тРНК строго

.определенной аминокислотной специфичности .

3. Поиск тРНК-подобных последовательностей ' в геноме человека . . !!аучно-практическая новизна. Предложен новый подход к построению филогении любых последовательностей ДНК и РНК на основе ана -лиза преобладающих мутационных замен оснований при эволюционной дивергенции последовательностей .

Впервые была построена обобщенная схема взаимосвязей между множествами генов тГНК различной .аминокислотной специфичности, определяющая исходную точку в образовании генов тРНК - лизиновую тГКК, и указывавшая на вероятное вхождение в дреянм» систему трансляции вместе с лизином еше четырех аминокислот: турьей,суз.

Епервие было показано существование "неканонических" тРНК-по-добных последовательностей в геноме человека, не имеющих существ-

енноя гомологии с генами тРНК. Впервые обнаружено, что больиинство .таких последовательностей находится в кодирующих районах renov.a.

IIobuc алгоритмы обработки матриц, предложенные автором при построении глобальной классификации генов тРНК били реализованы в виде комплекса программ для персональной ЭВМ. Разработан«ия комплекс позволяет классифицировать лобые объекты, мера относеиия между которыми определена, и получать графическое изображение взаимосвязей между объектами .

Основные положения, выносимые на защиту.

1. Глобальная классификация генов тРГ'. одинаковой аминокислотной специфичности из различных видов. Поиск приоритетных замен оснований при эволециопноя дивергенция нуклеотилних последовательностей - ношя подход к" построению их филогении .

2. Обобщенная схема взаимосвязей между множествами генов тРНК различной аминокислотной специфичности. Лизиносые тРНК - исходное множество образования тР!1К новой аминокислотной специфичности.

3. Существование "неканонических" тРНК-подобны/. последовательностей в геноме человека .

Апробация работы. Результаты работы были доложены на конференциях по ГНТП "Геном человека" (Переспавль-Залесския,1990;Черноголовка, 19931; на . Всесоюзном симпозиуме- "Молекулярные механизмы генетических проиессов"(Москва.1990 M на 24 Ежегодном конгрессе Европейского обаества генетики человека (Эльсинср.19921; на конкурсе на лучыуп работу по биологии в Отделе кинетики химических и биологических процессов Института химической, физики РАН в 19SI и 1092 г.г. ■"'-•.. ,

Публикации. Основные положения диссертации опубликованы б б печатных работах. . .

Структура и объем диссертации. Материал диссертации, состоя -имя из введения, обзора литературы .описания математических »-:то -

дов, использованных о работе, 3-х глав собственных исследования, обсужсния it выводов, изложен на 200 страницах машинописного текста, вклвчая 12 таблиц и 30 рисунков. Список использованной литературы состоит из 216 наименования.

СОДЕРЖАНИЕ РАБОТЫ . '

1. Информационный подход к выявлению сходства генов тРНК и их глобальная классификация.

Га нее последовательности тРНК были использованы для построения филогенетических деревьев (Larue P. ct al.,1979J Cedergren R. ot , Гатнер В. А. с соавт., 1935 ). Еиравнивание последовательностей -ГНК в отих работах происходило согласно общим структурным элементам тГНК: стержням клеверного листа, антикодоиу, петлям, с.~г,-концу и инвариантным осиопанням; или проводилось гомологичное выравнивание. Е диссертации использовался более общий подход к анализу последовательностей генов тРНК, основанный на поиске мак -сииалыюи взаимной информации между ними, при сканировании одной последовательности относительно другой, независимо от совпадения структурных элементов. Такой подход позволяет оценить более слох -ние взаимосвязи между последовательностями, учитывая все возможные пары совпадений основания, а не только гомологичные совпадения аа, тт,сс и gg. Одновременно проводился целенаправленный поиск взаимосвязей, при котором пурины и пиримидины не различались между собой и обозначались одинаково: л-ca-gj, т-ст^сз. Основная задача нас -тоямсго раздела состояла в обобщении результатов поиска взаимосвязей: построении, с применением теории нечетких отношения, глобальной классификации генов тРНК одинаковой аминокислотной специфичности из банка данных emcl-s fntcncio Е. et т.е. класси -Фик&шш, объединявшей ядерные гены тГНК и гены тРНК клеточных ор -ганелл: хлоропластов и митохондрий, и отрадапшей возможные эволв -циош'.ые связи между тГНК. , .

Методы.

Анализ сходства между генами тРНК проводился по уровню заимной информации между ними, как это было описано раннее (Е-В. оротков.1990J. При сравнении двух последовательностей ДНК обозначим их как послеш^тельности 1 и 2) заполняется мг трица овладений И размерностью 4»4. столбцы которой соответствуют нук -еотидам a,t,c,g последовательности 1 (соответствующий индекс толбца j =1,2,3,4 1. а строки - тем же нуклеотидам, но на последовательности 2 (соответствующий индекс строки i = 1,2,3,4j. Тогда лемент матрицы м , например, при 1=2 и будет равен числу овладений нуклеотидов типа т на последовательности 2 с нуклеоти -ами типа г на последовательности 1. Аналогично для других пар со-падении. Обозначим

4 4 4 4

Z "а • яо = Лаа • L - T"i. = Т.т-J m

j=i i*i 1=1 j=i

огда взаимная информация между двумя сравниваемыми последователь-остями ДНК определяется как:

4 4 4 4

I "> ^ ^"(»jjlnrajj - ^m^^lnnij - jln» j * LlrL (2)

¿"lj'l " j = l

ри анализе последовательностей по пуринам и пир<?ыидипаи запол -

яется матрица совпадений м размерности 2»2, и по формулам анало-

ичным (1) и (2) вычисляется взаимная информация. Величина 21

аспределена как случайная величинах2 (Кульбак С-,1957). Число

тепенея свободы распределение Тс? определяется из размерности атрицы совпадения r«k как Ci—1l*Ck-iJ. Это позволяет оценить ве-оятностъ случайного образования взаимосвязи (сходства) между по-ледовательностями j и 2, используя стандартное распределение "X.2. оличество генов, имеонихся в банке данных, которое было проанали-ировано, представлено в таблице 1. Все последовательности генов

ТАБЛИЦА 1.

Количести гении тГКК , связывании» идну из 1У аминокислот , которое Сило проанализировано. _

N аминокислота число генов тРНК И аминокислота число генов тРНК

1. LEU 5В 11. LYS зв

-у SEP 47 12. GLY 37

Z. PRO 34 13. CYS 17

4. MET 60 14. APG 52

5. II E 28 15. HIS 32

6. ASM 25 16. ALA 34

7. РНЕ 43 17. ASP 36

Е. TYP 25 1В. GLU 34

о. THP 34 19. VAL 40

10. ТРР 27 20. GLN -

тРНК одного множества сравнивались между собой. Мерой отношения между парой элементов множества (парой генов тРНК) служила удвоенная взаимная информация между ними. В диссертации приведен . вывод

критического уровня взаимной информации 21„_, обеспечивавший веро-

■ кр

ятность случайных взаимосвязей между последовательностями менее 5% Значения критического уровня взаимной информации при поиске взаимосвязи между генами тРНК 21'^'«бо для 2<<?> и для")С2(1>.

кр кр

Классифицируя гены тРНК из различных видов одного множества.

считали, что .связь между ними существует, если величина 21> 21 |

кр

если 21 <21кр - связь отсутствует. Матрица р отражала наличие связей между генами тГПК 1 и ^ этого множества. При наличии связи при ее отсутствии Такая матрица симметрична и

представляет собой четкое отношение (Чи) между генами данного множества. Рассматривая степень сходства между генами, переходили к нечеткому отношению (НО) между ними. Степень сходства для каждой пары генов тРНК одного множества определяли как отношение найден -ноя взаимной информации к теоретически максимально возможной г

21

(41.

,.(4)

" чо

г. в L

,(2 I

(5)

„.(21

1.1 L .

ml п

(61

Здесь t-mjn-">in<'-1,L2>, Lj и l2 -длины генов тРНК. 2.е и 1.4 -максимально возможная удвоенная взаимная информация на одно осно -

вание для"Х5(9) иХ?'1'» соответственно. Таким образом, НО. характеризуется как R(i,j> для всех генов множества. В настоя -' тем разделе классификация конечного множества генов тРНК проведена с помощью алгоритма транзитивного замыкания матрицы нечетких отношения эквивалентности (Tamura s. et ai.,19711. Транзитивное замы -кание матриц НО позволило получить более упорядочение ) картину взаимосвязей генов тРНК в каждом множестве, следующую из выполне -ния свойства транзитивности для всех элементов (генов tPHKI i, j, is тожества s R<i,i:) limine r(i,j), r<j,i:1 J. Тогда как исходное нечеткое отношение R на данном множестве может и не обладать свойством транзитивности.

Анализ матрицы транзитивного НО проводился с разбиением НО на <L- уровни. оС- уровнем нечеткого отношения R называется обычное 40 R^ , определяемое для всех вС i- о следующим образом :

iR^J <*■> R(i,j» Ï. oí, (71

В нашем случае о 4 1. Размер шага между oL- уровнями 0.05 бил выбран как наиболее удобный для дальнейшего анализа и геометрической интерпретации матрицы НО В виде дендрограммы.

Для каждого множества были заполнены две матрицы : матрица НО сходства последовательностей генов в 4-буквеннои алфавите!Х?<9> I и матрица сходства по пуринам и пиримидином. Графически такие матрицы НО были представлены для шести множеств генов тРНК. связыва-авщих аминокислоты« asp, trp, ala, his, glu, тш(Чалей m.б., Короткое Е. В., 1991 ). На рис.1 показаны дендрограммы Х2(9) и а>

ASP

для тГНК . Анализ изменения степени сходства между генами тРНК: Ao6-¿(X.2<l>'-оС(Х3<9'' , при переходе от дендрограммы Х.2'9' к дендрограмме Х2<1' позволил в целом оценить различие между ден-дрограммами. Результаты сравнительного анализа для перечисленных выше шести множеств генов тРНК представлены на рис. 2(а-е).,

Обсуждение.

сИ.МмНани

хоЬасит

^ I ! |

и 1.± __1.... .1 1 1

<,00 С.»' Й 1С ¡.71 0,4

1,11

а5 р

рис.1.

Дондрограммы сходства для множества генов тРНК' отражаете возможные эволюционные связи между ними . Цифры н дендрограммах соответствуют порядковому номеру' гена анализируемом множестве генов тРНКА5Р . а - сходство между генам тРНК определялось в 4-буквенном алфавите (2 < 9)) 5 б - сходств между генами тРНК определялось в 2-буквенном алфавите (^2(1П

ю

-о.ч -о.г о-в о.г оч« -о.и -о.г о.о о.г о.аа

Рис.2.

Число изменения n в изображении взаимосвязей генов тРНК на дгнлрограмме'^г(11 по сравнений с дендрограммоя^£2(9) в эавчси -мости от изменения .значения сбгуровня, на котором взаимосвязи были впервые обнаружены! а - множество генов tPHKglüi б - множество ге-

THR тер

нов тРНК i в - множество генов тРНК i г - множество генов тРНК813! д - множество генов tPHKalai е - множество генов tPHKasp.

При рассмотрении рис.2, видно, что на дендрограмме сходство гёиов тРНК в большинс гве случаев ("75 % I определяется на более высоком оСгУРоане, что соответствует большему числу N с ¿ >о. Известно, что транзиции происходят в тРНК приблизительно в 2 раза чаше, чем трансверсии (i.»ru® в. et »:.,i97?l. То, что поиск сходства генов тРНК по пуринам и пиримидина» ( I наряду с

гомологичными совпадениями основания вклпчает епв и транзииии, no-

li

эволяет увидеть большее сходство последовательностей, свидетельствующее о более близкой эволюционной связи между ними, чем это прослеживалось в дендрограмме "Х.2<9> • Следовательно, дивергенция ге -нов тРНК сопровождалась эволюционным отбором нуклеотидных замен в направлении транзиция. Переходы же с понижением степени сходства могут быть связаны либо со случайными процессами, либо с какими-то иными приоритетными заменами основания при дивергенции генов. Строго говоря, приоритетные замены оснований в процессе видообра -аования могут быть различны и с течением эволюции изменяться.

На примере сравнения дендрограмм "Х.2<9' и"Х.2<1> для множес -

дер

тва тРНК (рис.1 > видно, как при увеличении степени сходства между генами тРНК па дендрограмме "Х.2<1> в большинстве случаев качественная картина взаимосвязей изменяется. Следовательно, построение филогенетического дерева для отдельного множества генов невозможно без построения схем, отражавших все возможные варианты нуклеотидных замен. Поэтому дендрограммы сходства генов тРНК, представленные в этом разделе работы, являются взаимодополнением друг друга, но не даст истинной картины эволюционных связей между тРНК. Полученные дендрограммы следует рассматривать как классифи -кационные схемы, которые могут оказать помощь в построении глоба -льной филогении генов тРНК.

Существует мнение, что гены тРНК не могут быть использованы для построения глобальной филогении из-за малой длины и высокой кон -сериативиости структуры (Сойсгдгоп ^ а1., ). В диссертационной работе применен более расширенный подход к анализу генов тРНК на основе взаимной информации, когда при анализе ДНК учитываются все 16 элементов матрицы сравнения И, а не только 4 элемента главной диагонали, отражавшие гомологичные совпадения, что значи -тельно повышает информативность анализа. Кроме того, анализ сходства последовательностей по пуринам и пиримидииам позволяет в

некоторых случаях выявить более древние взаимосвязи между последовательностями, чем это мохно сделать из анализа гомологии.

2. Эволюция генетического кода.

В этом разделе работы были проанализированы взаимосвязи между множествами генов тРНК различной аминокислотной специфичное.и. Так как тРНК является молекулами-адалторами в системе трансляции био -информации, такой анализ непосредственно касается вопросов эволюции генетического кода и порядка вовлечения аминокислот в процесс биосинтеза белка.

Этим вопросам всегда уделялось достаточно внимания. Из более ранних публикация отметим работу Крика (Crick f.,1?ьвгде выдвигалась гипотеза о случайном "замораживании" генетического кода- в некоторый момент его развития под влиянием эволюции белковых молекул, когда дальнейшее вовлечение новых аминокислот отрицательно сказывалось на физиологических свойствах белков. В этой работе высказывалась мысль о существовании примитивной системы трансляции, содержавшей малое число (возможно три или четыре) аминокислот. Гены тРНК также рассматривались в связи с эволюцией генетического кода (Ct?dergren et. ai.,i°eol. Однако, авторы работы не решали проблему в ее полном объеме, а ограничились анализом связи тРНК -носителей нескольких антикодонов, не разделяя эволюцию антикодонов (что равнозначно кодонов) и более позднюю эволюцию видов.

Tax как коэволюция всех компонентов системы трансляции нашла отрахепие в нуклеотидной последовательности гена тРНК, и все гены тРНК одинаковой аминокислотной специфичности несут в себе обшие характеристические черты, цель второя части исследования заключалась в построении схемы взаимосвязей между отдельными множествами генов тРНК различной аминокислотной специфичности-

Методы.

Для проведения сравнительного анализа генов тРНК различной

аминокислотной специфичности из множеств, представленных в табли -це 1, были исключены митохондриалыше гены тРНК, так как в митохондриях обнаружены исключения из универсальности генетического кода (Льюин Б.,10871. Попарное сравнение генов тРНК из двух различных, множеств проводилось также, как описано в разделе 1 автореферата. В результате сравнительного анализа для каждой пары множеств были заполнены две матрицы, элементами которых являлись значения удвоенной максимальной взаимной информации 21, найденной в попарном сравнении генов эти): множеств в 4-буквениом алфавите - матрица "Х_2(21;<?|, и по пуринам и пиримидинаи - матрица2Ш I.

Далее англизировали значения элементов матрицы сравнения между множествами. В случае Х2(2Ц9) все возможные значения 21 были разбиты на 46 интервалов. Принадлежность'элемента матрицы сравне -ния одному из этих интервалов рассматривалась как событие . В

л

случаеХ' 'aun значения 21 разбивали на 21 интервал. Число интервалов разбиения определялось точностью вычислительной техники .

Пусть Oj - вероятность того, что при сравнении двух генов тРНК различной аминокислотной специфичности произойдет одно из события Aj для случая 'Х,2'21'0'• м " число испытания, которое совершается при поиске такого события, вероятность события а. в одном испытании обозначим тем же символом, что . и само событие. Значение вероятности определяется как

2 . ... Aj -"X <21 ;9> - ~Х_<21 (61

/ / /

где 21 и 21 - левая и правая границы интервалов разбиения.

Пусть f5 - экспериментальная частота события й(, а г, - его теоретическая частота. Оценки приведены в диссертации. Мерой отклонения полученной матрицы сравнения между множествами от случайной матрицы является величина I <

г г

x"*«E!vnii "Zvnv . 401

l-l i^l

г=46 ДЛЯ СЛучая"Х?<21!9>, г-21 ДЛЯ Случая Тс? <21 я > - К,..,-* 1\,»п, , где л^ н л, - численности двух сравниваемых множеств генов тГНК . Било показано (Кульбак С.,1367), что величина 21 распределена как х2 с (г-1| - числом степеней свободы. Это позволило в качестве мери взаимосвязи между множествами генов тРНК различной аминокис-I лотной специфичности выбрать величину^ , не зависящую от размерности матрицы сравнения :

b

21

-----кл (11)

К

При проведении вычислений, полагали к0 «24*24"57б, так как среднее число генов в каждом множестве равнялось 24. Поскольку анализ взаимосвязей генов тРНК проводился как с помощью распределения так и <21 s 1), то для построения адекватно сравнимых между собой схем взаимосвязей, в обоих случаях был сделан переход от распределения к нормальному распределение s

»]_ =1/ 2^' - V 2г-1 (12)

Случайная величина имеет приближенно стандартное нормальное распределение (Королек B.C. с cojaBT., 1965К

В результате всех попарных сравнений множеств генов тРНК различной аминокислотной специфичности были заполнены две матрицы .взаимосвязи между' множествами, элементы которых представляли собой величину аргумента нормального распределения^., , не зависящую от числа генов в каждом множестве.

Результаты.

С помощью алгоритма наибольшего подобия (Короткое Е.В.,1992) по обеим'матрицам были построены схемы взаимосвязей между множествами генов тРНК. Первая, представленная на рис.3 - 'обобщенная схема взаимосвязей, полученная на осноье анализа всех 16 возможных пар совпадении оснований между последовательностями генов тРНК < ' - г! °1 ). Вторая схема (рис.4) отражает лишь одно из направлё-

Рис.з. 'Обобщенная схема взаимосвязей между множествами генов тРНК

Рис.4. Схема взаимосвязей между, «генами тРНК различной аминокислотной специфичности, отражающая эволюционную дивергенцию генов тРНК преимущественно через транзиции. !£>

ния создания генов тРНК различной аминокислотной специфичности -эволюционную дивергенцию оснований преимущественно через транзиции (~)(^<2Н1)). Схема на рис.4 показывает взаимосвязи между отдельными подмножествами генов, а не множествами в целом, и поэтому имеет частный характер.

Каждому множеству генов л РНК одинаковой аминокислотной специфичности на рис.3,4 соответствует круг, диаметр которого обратно пропорционален силе взаимосвязи генов этого множества между собой, то есть пропорционален величине 1/ Таким образом, диаметр

круга наглядно отражает дивергированиость генов одинаковой амкно -кислотной специфичности друг от друга, или иными словами : диаметр круга отражает "размытость" множества. Стрелка между кругами указывает на множество, с которым имеется наибольшая взаимосвязь. В некоторых случаях, для построения непрерывной схемы были указа,,и вторые по величине взаимосвязи между множествами. На рис.3 это взаимосвязи I азм—м-уэ , азр—>и_е и туя—>тнр. На рис.4 -

взаимосвязи ' ТНГГ"\л£"> и туя---м1ет.

Длина каждой стрелки на. рис.3,4 обратно пропорциональна силе взаимосвязи между данной- парой множеств, т. е. определяется величиной Сила связей внутри и между множествами указана

рядом с соответствующими кругами и стрелками .

Обсуждение.

Как можно видеть из рис.3 в центре схемы находится множество лизиновых тГНК, которое, возможно, является самым древним: Множества тГНК, образованные относительно недавно, наиболее близко расположены к лизиновому мн'ожеству. Более древние множества тРНК располагаются по краям схемы. С удалением от центра с?семы "размытость" множеств (диаметр'круга) увеличивается, т.е. сила взаимо -связи генов в самих множествах уменьшается, что также указывает на их более древнее происхождение. Исходя из полученной схемы, можю

\->

выделить множества тРНК, связывающих аминокислоты cys, ser, tyr и leu, как наименее подобные со всеми остальными множествами. Возможно, предшественники этих тРНК, либо они сами, входили в древнее систему трансляции. Можно предполагать, что и аминокислоты cys, ser, tyr, leu и lys также входили в эту систему.

Современные кодоны аминокислот lys, cys, tyr, ser и leu таковы, что за исключением одного leu-кодона сии, они не могли бы об -раэоп.-ться друг из друга путем классической инверсии на двунитевой ДНК- Тогда как для каждого современного кодона любой аминокислоты имеется единственный кодон другой аминокислоты, как бы образован -ный путем классической инверсии один из другого. Инверсия leu-код-одонов uua и cija приводит к кодонам uaa и yag, соответственно. Инверсия ser-кодона иса образует кодон терминации uga. Такии образ -ом, белковый синтез пептидов из, выявления как наиболее древних, пяти аминокислот мог определяться строго одной из двух нитей ДНК.

Особо отметим тот факт, что современные кодоны аминокислоты

лизин « ааа и aag. Это позволяет предположить , что первичный ген

представлял собой poiy(A) или poiy(R) - последовательность РНК или

» i ■ • ДНК-tТогда примитивный лиэииовыя адалтор (предшественник древней

LY5 *

тРНК 1 можно представить как двойной poiy(A)poiy(U) - спиральный < комплекс, с которым благодаря стереохимическому'соответствие, связывается аминокислота Oys. Возможность такого процесса была экспериментально показана (Отрощенко В.А., 19671.

3. тРНК - подобные последовательности в геноме" человека.

В последнее время появились работы,- свидетельствующие о раз -личных функциях тРНК-подобных последовательностей, не умеющих го -мологии с генгчи тРНК, чья пространственная структура может быть узнаваема специфичными для тРНК ферментами. Например, показано влияние тРНК-подобной структуры, расположенной в 3'-нетранслируе -

моя области мГИК, на интенсивность трансляции в зукариотических клетках, а также на стабильность «ГИК в клетке (GniH" t>.р., t. Найдено подобие пространственной структуры глталитического корч сплайсинга нитронов группы I митохондрий с третичной структурна тРНК, причем структура каталитического кора узнается аи'.шоацетили--ругошей синтетазой (Guo О.,Lambowit. A.M. , !. Поэтому задачей заключительного исследования, проведенного в диссертационной работе, являлся поиск тРНК-подобных последовательностей (и: имеющих существенной гомологии с .генами тРНК)в геноме человека кап возио;«-ных, не известных на сегодняшний день, функциональных сайтов. Такие последовательности могут быть либо , очень древними cr.or.iMi расселения г-энов тРНК по геному человека либо последовательностями эволюционио не связанными с генами тРНК, но cnocc5ruv.ii формировать пространственные структуры, обладающие некоторыми чертами сходства

с тРНК. ;

Методы.

Для поиска тРНК-подобных последовательностей в геноме человека, в каждом из указанных в таблице 1 множеств генов тРНК, на ос -ново проведенной в первом разделе работы классификации, били отобраны наименее сходные гены тРНК из различных видов, обгош числом 47; Поиск тРНК-подобных последовательностей проводили сканированием последовательностей генов тРНК по клонам человека, содержаться в банке данных embl-22, с шагом в одно основание. ОСтая длина всех сканированных клонов составляла около 10.000.000 оснований. Сканирование генов тРНК с учетом скоррелирооаниости нуклеотидов ДЙК проводили как в прямом виде (5^—так и в- инвертированном 5^1, т.к. инверсии на двунитевой ДНК достаточно частое яг, -лепие. Метод анализа взаимосвязи последовательностей нуклеиновых кислот, учитывавший корреляцию оснований был предложен ранее, (Коротков Е.В.,1002).

Па каждом шаге сканирования заполнялась патрица совпадений оснований м«.-.,"'1. вместе с которой рассчитывалась матрица случай -них совпадения иежду последовательностями N<4,4) :

• »(1) Г

ПИ..)! -------------------------------(13)

I-

■1 4 4 4-

гдо :, .¡> , х») - длина

3-1 ¡-1 »=1 .1=1

анализируемого участка взаимосвязи. Матрица отклонения экспериментальных совпадений от случайных :

.Л ма,.р - (И)

Далее рассматривались два события. Событие а соответствовало паре пуклеотидов. совпадение которых максимально отличалось от случай -.пого; событие а - остальным 15 парам оснований. Обозначив событие а кс.:; 1, а событие а как 0. для двух сравниваемых последовательностей оснований строили последовательность совпадения из единиц и нулей. • ■ .

Чтобы учесть скоррелированность нуклеотидов в ДНК на глубину не менее, чем в 3 основания рассчитывалась величина в

I, = - <1.+1-1:>1г><1.+1-к) (15) .

"С- ОС

где т^1 - экспериментальные частоты встречаемости цепочек,,

составленных из 1 и 0, - их теоретические частоты. I. - длина

последовательности совпадений. Формула (15) применима и в случае

■ 2

к 4 3. Ее личина 21,, распределена также, как случайная величина^ с одной степенью свободы, что позволяет оценить вероятность случайного отклонения последовательности совпадения от любой произвольней последовательности из.1 и 0. • '

На следующем шаге анализа, в событие а включали еще (¡дну пару совпадения нуклеотидов, имеющую второе по величине отклонение от случайного. Событие а соответствовало оставшимся .14 парам основа -

ний. Снова строилась последовательность совпадения, и определялась величина при к = 3. Подобные шаги повторялись до нахог-дония максимального значения I,,. Поиск тРНК-подобных последовательностей осушгствлялся таким образом, чтобы число случайных последователь -ностей Не превышало 5-'. от всех найденных. Этому соответствует зна-. чения 21ц 40.

. Результаты. -

I

В результате проведенного поиска били выявлены 39 тГЖ-г.одсб-ных последовательностей в клонах из генома человека, содержаюхся в банке данных емвц-зз. Как мои;о видеть из таблицы 2, в кодирующих районах (экзонах и мГНК) обнаружено значительно больсс пос/.сдо-

/ /

вательностей - 56, чем в некодируюших, районах (нитронах и: 5' . 3'-фланкирующих областях! - 34.

Взаимосвязь генов тРНК и подобных им последовательностей из

генома человека осушест влялась "неканоническим" образом : чер-з

определенные неслучайные совпадения пар оснований (событие Л, см.

методы). Для найденных случаев взаимосвязей ужо нельзя сказать

определяется ли подобие последовательностей гомологией или комллс-

ментарностью, так как и гомологичные и комплементарные совпадения

ТАБЛИЦА 2.

Число тГНК-подобиих последовательностей, найденных в клонах из генома человека.

направление гена тГШ кодирующие районы некодируюшие районы повтори граница код./псксд.

5'----> 3' 28 17 п 1

З.'т—-- 5' 26 17 1 2

56 34 3 6

всего 39 последовательностей

оснований равноправно со всеми остальными совпадениями определи)?

вид взаимосвязи . ,

' Обсуждение.

Интересным случаем '.'неканоничесиого" подобия'является оСнс.ру'

женное подобие гена тР!!К-А5р хлоропластов табака и последозатсль-

¡¡ОСТИ ПрйЕСГС i!0!!0i!2pa ALll-пОВТОра II-ТИПЗ Gal ago crasslceudatus.

rrr.iirsudstus к Homo sapiens - представители одного отряда приматов и имеет очень сходные геномные последовательности. Поэтому можно уверенно полагать, что и для alu-повтора человека аналогичный случая имеет место. Как известно, ALU-повтор состоит но двух подобных мономеров и, как полагают, образовался путем дупликации одного из них (ui 1 и Е.,1<?32). Показано, что левый мономер лш-повтора Gaisgo эволюционировал от гена 7SL-PHK, приобретя несомненное сходство с генами тРНК (oi-sda и. ,19°о). Здесь впервые обнаружено, что существует подобие »г правого мономера АШ-повтора, ¡¡о в в и до более сложной взаимосвязи последовательностей, чем гомология или соответствие по пуринам и пиримидина».. Подобие определяется парами совпадений оснований г gcatctta

ACGGTTCT

Несколько тГНК-подобных последовательностей найдено в ¡¡скодируюш1х районах ДНК, на расстоянии не более 260 оснований от первого транслируемого экзона (рис.51. Обосновано предполотть, какуо роль играют в процессе транскрипции эти последовательности, пока но представляется возможным. Недавно было показано специфическое связывание глутами'иил-тРНК синтетазы человека с з'-нскодируо-¡»111 районом coбcтвc¡l¡loя мРНК. Область связывания совершенно не гомологична тГНК6"и человека, ив своей вторичной структуре имеет не более двух идентичностей со структурой тРНК; тем не менее связывание происходит столь же прочно, как и со специфичной тРНК' (Schray е. .¡'nipprrs r. ,i««?i J. Предполагается, что'^связывание фермента с мРНК могвт оказывать влияние как на'ее трансляцию так и на дегра -дацию мГНК. Еозможно, это же имеет место для найденных "неканонических" тРНК-подобных последовательностей в з'-неКс.Жруюших райо -нах мРНК, ДНК и РНК (9 последовательностей I. ■ / ;

Пятнадцать "неканонических" посл'едоватфлышстей были обнару -жены в интронах (рис.61. Имеется основание полагать, что эти пос -

тгс:4глт:стсглотслттлосА»АтсгсггстстсАсссссл-йбсссссг:сттслАТ7сссебТАтоослА

. * *

0ТССАЛСТ6

OOCOHhC СОЬПАÜiWTA l

CASATCT0T

0VA3 ТРНК«^ D. «#|«M9*»tcr

CAT-ЬОКСу тата-К*С

Г*'5, ГЕМ «Ю/ШПОПРОТСМНА а И

ftftOAOrar^TtTMTgCTAö-ViCAGAA^TTCA^CTTT^ITCTTAGTTCCAGTCTnAGTftCTCrTCCCA

10ТСТТйЛССТСАОСТТСТОСССА1Ж)СГЛС»ТСЧ:ТСИМ?ТСТССАА.^

/) I 1 А с о « с с с

. ПС»Ю8НкС С08ЛАД£№»Л i

1ГАСОТСААС

. СЬРЛЗ TPMC N*vro*p*r» <

-flT : -Vfr

alu m.u m-u

1 3DOO 4<XX> AOOO

Гие.б« гем оыёго прсдасстасн««са кортюсотропиьа и ьста-л»гжггрсг*»«а i горист юв гиюеиэа .

G6CC0T 6А TCS Т А ТА6Т Pft ТАСТACT С"? CC6T Т6 Т GGCCGCAGCAA1XT ССвТТСв Г ATCCPACT САССССАССА СССААССССТАСАТСАССАТСАЙСААС * т AüHÄCiwaiCAOAATAAGGATCTCTtAA^TC.^TST^CCTA

/friCGGTftT iGCCC ГТААСТ1 JGGCC rt^-OGC^ACTCTtjcGCC-jc ГЙСС *TTGGTG.jrct jf^TaCCCT

СССОКАвОС№САйСССААТ TTCCAT TAATTACCeAACÄ^ftCAftACTTCTACTClGGCCTCWCACCAGC

V

e.T. •

T С А в С в Т 1

основные соепАдомя i

С т а А в в Т

вТСААТСАС

осно»«с СХШЛАДОМЯ s

I тРНК*18 Нам »*pl«

ТАСССввАА

Н I I. Н> М II—--'

1 ЬОО IOQO 1500 IA?«

ß тев^СТвЕЖИКД H=CT>El«*H4ECXiJ-0 КРОСС-fl^ PC ТЭУМ1К£ГО ЛНТИГТНА КЗ ПЕЧЕНИ

J-7

тг

7

Ita рисунхдх »срхпАя поелелоедтельмость иуклеотидо» соответствует гону TttlK, H**st& ^последе я&телыюети кэ Г0}юн4 человека.

гтэмо логичная единица , соотеоствумада клеточю-свяэувавиену допей/ rem

"""•иьронсктина типа m . экзаиы 6 и 7 . nFMME4Vfne : ОДИНАКОВЫМИ ПГЯНОТГОЛЬНИК АМИ отменены последовательное™ . оьразуиииг стебли втсричисо структуры -грнк .

Гис.в.

ледовательности, наряду с членами ALu-семаЛства повторов, могли бы служить сайтами связывания аминоацил-тГНК синтетаз, так как было показано участие тирозил-тГНК синтетазы-в сплайсчнге митохондриа-

лышх ИНТрОИОВ (AHns P.A.,Lambowitz A.M.,1987) И ТО, ЧТО фСрмеНТ

стабилизирует каталитический кор сплайсинга,'узнавая в нем сходство С пространственной структурой ТГНК (Guo Q.,Lambo\iit= A.M.,19ü2l Большинство "неканонических" тРНК-подобных последовательностей было найдено в кодирующих района« ДНК и РНК. Интересно, что такие последовательности часто находятся вблизи правой или левой границы кодирующего района: на расстоянии всего лишь 10 - 20 оснований. тРПК-'лодобние последовательности как бы отмечают собой сигнальные пептиды; функциональные домены белкс-з (рис.Tis а также лежат на пересечении границы кодирующих и некодирующих районов. В двух случаях пересечения границы в тРНК-подобных последовательностях удалось идентифицировать канонический левый (донорный) сайт, сплайсинга, соответствующий границе стержня и петли во вторичной структуре тРНК (рис.Б). Приведенные примеры расположения тРНК-по-добных последовательностей в кодирующих районах, позволяют пред -положить, ч*о выявленные последовательности используются для того, чтобы подчеркнуть структурно^фуикционалыше особенности как г ор ■* ганизации генов, так и их белковых продуктов.

ВЫВОДЫ.

1. С помощью теории нечетких отношений проведена классифи -

кация 6 множеств генов тРНК одинаковой аминокислотной

специфичности из различных -видов- Анализ дендрограмм,

отражающих эволюционные связи между генами тРНК -каждого

мнояЕСтва, показал, что наряду с'преобладающей эволюцион-

t

ной дивергенцией оснований последовательностей генов тРНК посредством транзиций существуют и другие преимуществен -ные замены оснований, сопровождающие процесс видосбразо-

вания.

2. Показано, что эволюционирование генов тГНК ыитохоидрип происходит обособлено от ядерных генов и генов тГКК хлоропластов.

3. Построена обобщенная схема взаимосвязей между множествами гонов тРНК различной аминокислотной специфичности, выяв -

' -ляп1!ия литшптшг тРНК как исходное множество молекул-ада-

пторов в эволюции системы трансляции -

4. Впервые обнаружены "неканонические" тРНК-подобние после -довательности в геноме человека, которые преимущественно находятся в кодирующих районах .

Основные положения диссертации опубликованы в работах :

1. Чалея М.Б. .Короткое Е.В.- Информационный подход к выявлению сходства генов тРНК и их глобальная классификация//Изв.Лгад.наук ГАН,сер. 6ИОЛ.-1ЭЭ1.-N.6.-с.015-027.

2. Чалой М.Б..Коротков Е.В тРНК-подобные последовательности в клонах из генома человека//Тезисы докладов Всесоюзного симпозиума "Молекулярные механизмы генетических процессов".Москва.1900.-

с.65 66.

3. Коротков Е.В.,Чалея М.Б.Новый тип зеркальной симметрии и новое, широко распространенное семейство mpi повторов, в геноме человека// Тезисы докладов Первой Всесоюзной конференции "Геном человека". Москва.1000.-о.118-119.

4. Chaley М. В., Kor ot I'.ov Е. V. tPMA-1 i I; 5 structures in human jrnnnn// . Th^^ic of r.-pwi; o-f 31-th Annual mpr-ting of European Society, at

human gonc-t i oz .El Ei norp, Denmark. IOQ2. -p.

5. Korntl;nv t.. Chsl су M. P. Evnlut*. опзгу origin pf gcnctic rrcidc//

Ihid. '. • •

6. ДолГунова С. И., Наумов-H. А. .ЧалеЯ U. Б. Программная модель класси-; фикатора на персональной ЭВМ/'Прспринт ИПМ ГЛН.Москва-1992.- п.84 — 32 с.

2"5 -