Бесплатный автореферат и диссертация по биологии на тему
Множественное выравнивание и анализ гомологии в надсемействе P450
ВАК РФ 03.00.04, Биохимия
Автореферат диссертации по теме "Множественное выравнивание и анализ гомологии в надсемействе P450"
РОССИЙСКАЯ АКАДЕМИЯ МЕДИЦИНСКИХ НАУЗС
ИНСТИТУТ БИОЛОГИЧЕСКОЙ.И МЕДИЦИНСКОЙ ХЯЯИИ
На правах рукописи УДК 577. 15. -013. 1. -35
ДЕГТЯРЕНКО Кирилл Наумович
МНОЖЕСТВЕННОЕ ВЫРАВНИВАНИЕ И АНАЛИЗ ГКЯПОГИИ В КАЛСЕМЕЙСТВЕ Р450
(03.00.04 - биологическая химия)
Автореферат диссертации на соискание ученой степени кандидата биологических .чаук
ИОСХГ;/ - 1932
Работа в-лслпгва ь Институте биологической и медицинской ххнг.к ?А'.
/• . Научные руководители:
доктор биологических наук, профессор В. Ю. Уваров; академик РАМН, профессор А. И. Арчаков
Официальные оппоненты:
доктор биологических наук Г- И. Еачианова кандидат физико-математических наук А. А. Горик
Ведущая организация:
/
Институт бкоорганическок хЯмии Академии наук Беларуси (г. Минск).
Заиита состоится " " 1992 г. в ' часов
на заседании специализированного Ученого совета Д. 001. 10. 01 при Институте биологической и медицинской химии РАНН по адресу: 119832, Москва, ул. Погодинская, д. 10, корпус А.
С диссертацией можно ознакомиться в библиотеке Института.
Автореферат разослан " - " 1992 г.
Ученый секретарь специализированного совета,
кандидат биологических наук Павлихина Л. В.
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность проблемы. Монооксягоназные системы, содержащие гемопротеины надсемейства Р450, открыты в животных, растениях, грибах и бактериях. Эти системы демонстрируют редкое многообразие субстратов и катализируемых реакций, различны по внутриклеточной локализации, способам переноса и переносчикам электронов на Р450. К настоящему времени идентифицированы более 160 разных генов, кодирующих Р450. Аминокислотные последовательности Р450 из разных семейств обладают низкой степенью сходства (некоторые из них имеют не более 10% совпадающих остатков) и отличаются по длине (иногда более чем на 100 остатков). Несмотря на такое разнообразие, общий план строения молекул всех Р450, по-видимому, одинаков (1'2'3, Tretiakov et al., 1939*4).
Одной чя проблем, связанных с анализом псслсдзпзтельпсстей Р4 50, можно назвать классификацию. В настоящее время номенклатура Р450, разработанная Nebert et al. 5 и основанная на гонологии последовательностей, получила широкое распространение и постепенно вытесняет тривиальные наименования Р450. Однако эта классификация не свободна от ряда существенных недостатков. Gotoh6 применил более совершенный и объективный иерархический метод для сравнения последовательностей Р450. Тем не менее, критеркз деления Р450 на сеигйства я подсемейства на основе сравнения только аминокислотных последовательностей не разработаны, следовательно, это деление не формализовано.
Другая проблема, кмеющая много общего с проблемой классификации - моделирование процесса молекулярной эволюции Р450. В отличие от классического филогенеза, сочетание слоевых механизмов специализации Р450 - удвоения и конзерсин геноз, влдозой
Ис).еоп. 'С. Р- S Strobel, II. W. (1933) J.Bioí.Chem. 2S3, 6038-6050.
" CHiZoaivs, С. А. £ Kstvin, W. Т. (1991) Eur. J. Biocbex. 198, 307-315.
r.or-h, 0. (1292) J. tiol. Chsm. 257, 83-30.
Ссмляг, с? кечешгю ( см. s зякскэ nySssxacaC (стр. 13).
Bebwt. Т). К. , Jl3ls.or., D. г.. , «"con, К. 3. , Estabrcok, К. W. , 'eycstix*t, R. , Pv¡jii -Rariya:;-., , González. Г. J. , cuangerich, " r'. , Guusslus, Г. C. , Johr>ssn, £. F. , tooar. J. C. , Sato, R., •«si «man. IT. 4 П. J. (1391) DNZ Celi Slol. 10, 1-14.
С (1992) Xn Archa5:cv, í„ I. ar.d Boch"5Tiova, G. I. (cds) " "r '■■"'' ггь of 7tii Xnz ".■•Tiatic.nnl Conferirte г oa Biochejítistry and ;>.— '<-,• íif Cj'ío.-nro-pc P-Í5C. i:-:CO-TííC, №>г.сс-)'. pp. 606-021.
днффгренцкровкг, горизонтального переноса генов - и конвергенции создает в высшее степени запутанную картину.
Еще одна проблема - моделирование пространственной структуры Р450 - также связана со сравнением последовательностей. Сегодня известна трехмерная структура единственного Р450 - водорастворимого генспротеина F450ca« из бактерии Pseudomonas put ida''. При отсутствии другой информации такое моделирование может опираться только на сравнение исследуеных последовательностей с Р450с»» и аппроксимацию его структур на гомологичные участки. В недавних работах по моделированию трехмерной структуры Р450 , (8*9'10, Uvarov et ai. , 1992 ) было достигнуто только локальное оптимальное выравнивание эукариотического P4S0 с Р450сш. Например, неизвестно, какую конфорнацгао имеют участки, вообще отсутствующие у Р450саш, т. е. "вставки" ж мембраносвязанный фрагмент.
Итак, налицо ряд глобальных нерешенных проблем, тесно связанных с анализом гомологии в надсекействе Р450: проблема классификации, проблема реконструкции процесса молекулярной эволюции Р450, проблема моделирования пространственной структуры Р450. Мы надеемся, что настоящая работа внесет хотя бы небольшой вклад в их решение.
Цель работы заключается в построении глобального множественного выравнивания известных аминокислотных последовательностей Р450 и оценке относительных расстояний между ними. Для. ее осуществления необходимо было решить ряд задач:
- выбрать алгоритм и параметры для построения глобального множественного уравнивания аминокислотных последовательностей Р450 в полностью автоматическом режиме;
- с помощь» хножественного выравнивания построить консенсусные последовательности для семейств и подсемейств Р450, а затем
- построить множественное выравнивание полученных консенсусных последовательностей семейств (подсемейств) Р450;
7 Poulos, T. L., Finzel, B.C. S Howard, A. J. (1987) J. Hol. Biol. 195, 687-700.
8 Graham-Lorence, S. , Khalil, M. W. , Lorence, M. . Mendelson. C. R. S Simpson. E. Ä. (1991) J. Biol. Chem. 266, 11939-11946.
9 Morris, G. M. S Richards, W. G. (1991) Biochem. Soc. Trans. 19, 793-795.
10 Zvelebil. ÄJ.J. M.. Wolf, C. R. and Sternberg, M. G. E. (1991) Protein Engineering 4, 271-282.
- провести сравнение консервативных докенов Р450 (локальное множественное выравнивание);
- построить эволюционное дерево для надсемейства Р450.
Научная новизна и практическая значимость работы. Множественное выравнивание с иерархической кластеризацией аминокислотных последовательностей Р450 проводилось в полностью автоматической режиме, без какого-либо предшествующего или последующего ручного редактирования. Последовательности выравнивались с использованием четырех альтернативных матриц замен. В результате проведенного анализа было показано, что в надсемействе Р450 последовательности группируются в определенные устойчивые кластеры независимо от типа используемой матрицы замен и порядка последовательностей в списке ("сильная иерархия"). В то же время имеются неустойчивые группы Р450 ("слабая иерархия").
Предложен и обоснован нетод множественного выравнивания консенсусных последовательностей устойчивых групп гомологичных белков (например, семейств или подсемейств). Получены консенсускые последовательности для семейств и подсемейств Р450, которое можно рассматривать ;:ак последовательности, наиболее близкие к предшественникам .■ данных групп. Впервые проведеяо множественное выравнивание 22 консэнсусных последовательностей (под)семейств Р450 к 21 уникальной последовательности Р450, на основании которого построено принципиально новое эзолюциокное дерево надсемейства Р450. Существенно новым является то, что скорость эволюции для зтого дерева определяется скоростью эволюции консервативных подпоследовательностей Р450.
Предложен" и обоснован метод дифференциального (локального) сравнения консервативных ■участков белковых последовательностей на Ч основе множественного выравнивания, который может использоваться для :;сследозаняя эволюции структурных и функциональных доиенов гомологичшлх белкой. С поиощью этого метода было проведено дифференциальное сравнение 5 консервативных участков Р450.
АттроСаииг. р?-лоты. Осноъгые результаты исследований докладывались на Есоссюзкой конфзрекцгя "Ш.то^грои Р--450 и ксдифчкацяя макромолекул" (Ялта, 1989) и на VII Международной конференции "Биохимия и биофизика кктохрокя Р-450" (Москва, 1991). Апробация диссертации состоялась 16 сентября 19?.Я r. lia совместном заседании
учебно-научного комплекса кафедру биохимик нгдикс-бислогическсгс факультета Российского Государственного университета ии. Н. И.Пирогова к Института биологической и медицинской химии РАКН.
Публикация. По материалам диссертации опубликовано'7 печатных работ.
Объем и структура работы. Диссертация изложена на 155 страницах, включая 6 таблиц и 33 рисунка, и состоит из введения, разделов: "Обзор литературы" (главы "Понятие о гомологии", "Алгоритмы парного и множественного выравнивания биологических текстов", "Методы построения эволюционных деревьев", "Надсемейство Р450"), "Натериалы и метода", "Результаты и обсуждение", выводов, благодарностей и списка цитируемой литературы.
МАТЕРИАЛЫ И МЕТОДЫ
Программы множествеиного выравнивания биологических текстов с иерархической кластеризацией MUI/TALIN .для персонального компьютера IBM РС/ХТ/АТ была любезно предоставлена нан автором, Florence, Corpet11.
Пакет программ множественного выравнивания CLUSTAL для IBM РС/ХТ/АТ-совместямого персонального компьютера любезно предоставили нам авторы, Paul M. sharp S Desmond G. Higgins12'13.
Матрицы счетов финального выравнивания, полученные с помощью программы MULTALIN, были далее использованы для определения величин парных гонологий. Для множества (выровненных) последовательностей
(а , az.....ан) » соответствующей последнему выравниванию матрицы
счетов TL> где Г, j - счет Быравнивания с а^ a Tt ^ } -диагональные элементы матрицы Т, т. е. максимально возможные счеты для данных последовательностей, парную гомологию определяли как
я =
Чтобы получить максимальные величины гонологии, перед построением матрицы TL (после финального выравнивания) штраф за делецию приравнивали нулю.
Для вычисления относительных расстояний рассчитывали матрицу
Corpet, F. (1988) Nucleic Acids Res. 16, 10881-10890.
12 Higgins. D. G. S Sharp, P.M. (1988) Gene 73, 237-244.
13 Higgins, D. G. S Sharp, P.M. (1989) CABIOS 5, 151-153.
счетов UL из финального выравнивания, используя соответствующую патрицу расстояний внесто натрицы сходства и штраф за делецию, равный нулю. Расстояние, соответствующее наибольшему счету U из U , принимали-за единицу. Таким образом,
* - ik-.
i.j и
max
Относительные расстояния между последовательностями, как и расстояния между остатками в матрице расстояний, не являются евклидовыми.
Для создания рандомизованных списков последовательностей, перетасовки полученных матриц счетов и графической визуализации их как матриц парных гомологии или расстояний нами были использованы программы RANDOM, REBUILD и GRAFPRRT для IBM PC/XT/AT, любезно предостазленныэ я модифицированные автором, Т. А. Хулгксзой14.
РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ
Множественное выравнивание и кластеризация аминокислотных последовательностей Р450.
147 полных аминокислотных последовательностей Р4 50 были выровнены с помощью программы множественного выравнивания MULTALIN (см. Материалы к методы). В четырех независимых циклах выравнивания использовались матрицы сравнения MD15, MR16, MG (генетических расстояний17) и ЮТ (единичная матрица сравнения18). На персональном компьютере класса IBM AT (20 КГц процессор i386) инициализация, то есть попарное сравнение всех последовательностей, заняла около 100 пин, и каждая итерация, включая собственно множественное выравнивание, построение новой матрицы счетов и иерархическую кластеризации, заняла около 60 нин. Для последнего выравнивания в чка:;гдом цик.чо били попучены соответствующие матрицы идентичности
14 7. А. Кулик? Ба.. Институт Иодкцянекой Техники МЗ РФ, Москва.
15 Dsyhoff, М. О. , Schwartz, U.K. Я Orcutt, В.-С. (1978) In Dayhoff, М. О. (ed) Ktlzs of Protein Sequence and Structure, Natl. cloned. Res. FouncTtion. Vlashington, DC. Vol. 5, Suppl. 3, pp. 345-352.
1 Risler, J. L. , Delormc, ¡И.О., Delacroix, H. G Henaut, A. (1988) J. Hoi. Biol. 204, 1019-1029.
17 Feng, D.-F. . Johnson. K. S. S Doolittle, Я. (1S35) J.Mol.Evcl. 21, 112-125.
!G Doolittle, R. (1981) Scicnce 214. 149-159.
(Т1) и расстояний (Td). преобразованные затеи с помощью программы GRAFPART в графгческие карты. При вычислении матриц идентичности и расстояний штргф за пробел приравнивался О.
Полученные дендрограммы во всех четырех случаях имеют похожие топологии. Почти все бактериальные Р450, а также CYP55 (Fusarium oxysporum) принадлежат к одной большой ветви (B-классу), все Р450 эукариот и CYP102 (Bacillus megaterium) - к другой ветви (Е-классу). Всегда образуют отдельные кластеры семейства {CYP1, СУР2, СУР17, СТР21, CYP71}; (CYP3. CYP4, CYP6, CYP52); {CYP7, CYP51); {CYPH, CYP27}; {CYP19}. CYP2, самое обширное семейство Р450, всегда делится на следующие устойчивые кластеры подсемейств: {CYP2A, 2В. 2G); (CYP2C, 2Е, 2Н); (CYP2F); {CYP2D} ; (CYP2J). Последние два подсемейства всегда лежат несколько отдельно от "типичных" представителей CYP2. CYP1A1 форели всегда образует ветвь, отдельную от остальных представителей подсемейства CYP1A. Среди Р450 "бактериальной" ветви всегда наиболее обособлен CYР104 (Agrobacterium Cumefaciens). Такая топология очёнь похожа на топологию эволюционного дерева Gotoh6. Однако между дендрограмнами имеются и отличия, иногда существенные.
На основании анализа таких отличий (они подробно обсуждаются в диссертации) были высказаны некоторые соображения, имеющие, на наш взгляд, самостоятельную научную ценность.
Влияние стартовой кластеризации на последующее множественное выравнивание. Как известно, кластеризация в процедуре прогрессивного множественного выравнивания - не только один из результатов, но и средство получения выравнивания. Следовательно, вообще разные топологии будут приводить к разным результатам выравнивания. Кроме того, задача подбора "наилучшей" матрицы явно распадается на две задачи (с неопределенным приоритетом): подбора матрицы для нагбзяее корректного выравнивания и подбора матрицы для наилучшей кластеризации. Например, выравнивание можно проводить с помощью матрицы >3} и некоторого ненулевого штрафа за пробел, а для кластеризации пользоваться только идентичностью и не штрафовать пробелы. Ряд экспериментов со сменой натриц сравнения иллюстрирует критическую роль именно стартовой кластеризации в последующей множественном выравнивании. Такое "поведение" последовательностей в процессе прогрессивного множественного выравнивания наводит на мысль о том, что тюлученные на практике деревья имеют природу локальных минимумов, в которых процедура как бы "зацикливается", не доходя до глобального минимума ("истинного" дерева).
"Сильная" и "слабая" иерархия в надсенействе Р450. Интересно, что структура описанных выше стабильных кластеров в наибольшей степени устойчива и к изменению порядка последовательностей в списке, и к сиене матрицы и величины штрафа за пробел, собственно, именно сильная иерархия, а совсем не формальный "процент идентичности", должна лежать в основе классификации, в том числе и деления на семейства и подсемейства. Сложнее обстоит ситуация в случае слабой иерархии. Так, взаимное расположение пяти больших кластеров "Е"-ветви, как и всех семейств "В"—ветви, достаточно неустойчиво. К слабой иерархии приводит малая разница в длинах древних ветвей. Установить же точно, какая из древних ветвей самая древняя, по-вкдимоку, невозможно. С другой стороны, кластеризация последовательностей внутри "стабильных" групп также может происходить различными способами и может рассматриваться как другой пр^!:зр слабой иерархии, обусловленный малсй разницей в длинах коротких ветвей.
Множественное выравнивание консенсусных последовательностей Р450.
Использование консенсусных последовательностей позволило как ускорить процедуру множественного выравнивания, так и сильно облегчить анализ его результатов. Действительно, вместо полного набора последовательностей были выровнены 22 консенсуса для (под) семейств19 (CYP1A1, tä2. 2ä, 2В, 2С,~ 2d. 2ё. 2F, 2Н, за, 4ä, 4В, б£, 7, НА, 11В, 17, 19, 21, 27, 51, 52), и 18 уникальных последовательностей: CYP1A1 форели. CYP2G1 крысы, CYP2J1 кролика, CYP.4C1 таракана, CYP53 Aspergillus niger, CYP55 Fusarium oxysporum, CYP56 Sacciiaromyces cererisiae, • CYP71 авокадо, CYF101 и CYP108 Pseudomonas putida, CYP102 и CYP106 Bacillus megaterium, CYP103 и CYP104 Agrobact-erium tumefaciens, CYP105A, 105B, 105C Streptomyces griseolus и CYP107 Saccharopolyspora erythraea (Streptomyces erythraeus). т.е. едикствэкных представителей СЕоего семейства или подсемейства. Исключение было сделано для семьи CYP1A, так как два гена, CYP1A1 к CYP1A2, икзят явных: ортолого,? у млекопитающих, поэтому были построек! однсенсускые последсзгтел-.кости CYP1A1 и СХР1А2". С другой сторонь:, СХР1А1 форели сильно отличается от всех остальных последовательностей этого подсемейства CYPl/i и рассматривалась отдельно.
Консенсуснив последовательности для семейства (подсемейства) обозначен!! с помощью горизонтальной черты над синзолом семейства (подсэкейства), кгпринер: CYP19, CYPllA и т. п.
CYP2A -
ra Í2G1 —
CTP2B -
CYP2F -
CYP2H -
CYP2E -
CYP2C -CYP2D
rab2J -
CYP1A1 -r
СУР1А2 J
trolAl -
CYP17 -CYP21 avo71
CYP19 -
Aní53 -
CYP3A -CYP6
Bdí iC -
CVP4A -CYP4B
В we 102 -
CYP11B -
CYP11A -CYP27 CYP7
See56 -
СУР52 -CYP51
FoxSS -
SgrlOSB -SgrIOSA -SsplOSC -
Serl07 -
PpulOl -
ВшеЮб -
Aíul03 -
PpulQS -
iltul04 -
Рис. 1. Кластеризация, полученная при множественном выравнивании 22 консенсусных последовательностей .. для • (под) семейств Р450, и 1£ уникальных последовательностей Р450. Консенсусы для семейства (подсемейства) обозначены с помощью горизонтальной черты над синволом семейства (подсемейства). Сокращения: ¿nit Aspergillus niger; леи: Agrobacteritim cumefaciens; avo: авокадо; Bme: Bacillus megateium; Bdi-. Blaberus discoidalis (таракан) ; Fox: Fusarium oxysporum; Ppu: Pseudomonas putida; rab: кролик (rabbit); rat: крыса (£3t); See: Saccharomyces cerevisiae; Ser: Saccharopolyspora erythraea; Sgr: Streptomyces griseolus-, Ssp: Streptomyces species; tro: форель (trout).
Кластеризация, полученная при множественной выравнивании этого набора, в общем повторяет картину дня полного набора. Однако несколько отличий представляются принципиальными. Так. Р450 дрожжей образовали стабильный кластер (СУР51, СУР52 и. СУР56). Кластер (СУРЗА, СУР4, СУР6А, ...}, "потеряв" СУР52, "приобрел" последовательности СУР56 и СУР102. Далее, распался еще один "стабильный" кластер (СУР7, СУР51). Как правило, СУР7 занимает периферическое положение в Е-классе и, по-видимому, представляет собой отдельную древнюю ветвь Р450 (рис. 1).
- Необходимо подчеркнуть основные "положительные" (+) и "отрицательные" (-) особенности множественного выравнивания с использованием консенсуса по сравнению с выравниванием полного набора:
(+) Равное представительство в выборке всех подсемейств;
(+) Уменьшение "шума случайных совпадений";
(-) Потеря части информации;
(+) Малое время выполнения. Вообще потеря информации; которая происходит на стадии формирования консенсусной последовательности, может быть весьма значительной, причем это не связано с числом последовательностей в данном семействе или подсемействе. Напринер, мембраносвязанные И-концевые участки Р450 семейства СУР52 являются высоковариабельными, поэтому консенсусная последовательность для этих участков очень "рыхлая". Потеря части информации всегда представляется неизбежным злом, платой за очистку сигнала от шума. Однако в биологии существенно не количёство, а ценность информации. Более того, потеря информации происходит и е реальном эволюционной процессе. Поэтому становится очевидным преимущество сравнения именно консенсусов как наиболее , достоверных нотивов последовательностей-предшественников данных Чгрупп. Остается только пожалеть, что почти половину использованных последоватэльностей в нашей выборке составляют как раз уникальные Р450, а не консенсусы.
Существует одно принципиальное отличие между консенсусами, полученными для семейств, содержащих единственный ген (например, СУР7, 17, 19, 27, 51) и консенсусами мультигенных (под) семейств, особенно таких сложных, как СТР2Д. 2В. 2С, 2В. ЗЛ, 4А. 3 первом случае различия между последовательностями обусловлены, очевидно, чисто видовой, а не функциональной специализацией Р450 (поэтому множественное выравнивание последовательностей из таких семейств
можно использовать для реконструкции филогенеза), как правило, видовые отличия ферментов высших животных ограничены поверхностно-расположенными участками, непосредственно не связанными с функцией катализа (в том числе антигенным дегермкнантами). Иная картина наблюдается в случаях внутривидовой специализации, связанной с множественными видоспецифичныни дупликациями и конверсиями генов Р4505. Ортологические сопоставления в таких (под)семействах невозможны: число генов различно у разных видов, неизвестно, какой ген среди множества дупликаций более древний и т. д. Кластеризация в мультигенных (под)сенействах достаточно сложна, причем Р450 как разных видов, так и одного могут существенно отличаться именно по каталитической функции. Консенсусы как "первого", так и "второго рода" можно рассматривать как наиболее близкие к гипотетической пра-последовательностн данного (под)семейства.
нчни был получен другой набор консенсусных последовательностей для нульткгенных подсемейств (внутривидовые консенсусы). Затем полученные консенсусы снова выравнивались. Таким образом, было достигнуто равное представительство всех видов в выборке (для данного подсемейства). На основании таких выравниваний строятся новые чонсенсусы (уже "второго порядка"). . Анализ такого выравнивания показывает, что, несмотря на ряд внутривидовых различий, существуют участки консенсуса, специфичные именно для Р450 одного вида. В принципе, такой подход можно распространить к для сравнения консенсусов разных подсемейств. Однако дивергенция Р450 ка подсемейства произошла, по-видимому, задолго до появления современных видов - 200-400 клн. лет. тому назад20. Поэтому внутривидовые изменения в генах разных подсемейств можно считать независимыми.
Дифференциальный подход к эволюции консервативных участков Р450.
Простей подход, оаисанкый никс, позволяет извлечь дополнительную кнформацкэ и? глосалького инокесхвгнаого уыразнкванкя. Как правило, посладовЕмепъкостк гоиологичнчх белке» разделить па б-локк,
одни кз котспжх могут быть отнесены к *-о:;серветкя.-2.гк, « другие - -к варнабся>>:а»п. В кноаествъакок пцрав7-:-вз':;п; И посЕедь^атеаъыгСтэ?
длг!М 1., г.ггер.;гааиас ряд йусоки-енсяо! мчныэс учле»ко* 7 . Р...... Гс
с о О ": и с - " у. Ччэ >: дп я ьы
.5 сслгахаг,
Г. |7. (19Е71 Лшз. Явг. ВХосЬслх. 5С, 545-993
I 'I I И I а=аа...а...а ...а...а I г 1 1»р-1 J
I г- ! | и 1
1 г 1 1»р-1 }
. . Ь . . . Ь . . . Ь .
к к+г-1 I.
т = т т . . .т . . . т . . . тл . . . т
1 г 1 1+Р-1 J к ктг-1 ь
каждую "стопку" таких участков можно рассматривать как отдельное множественное выравнивание М последовательностей. Построение натркц счетов для каждого такого набора приведет к построению новых деревьев, причем кластеризация последовательностей Р может существенно отличаться как от кластеризации 0, так и от кластеризации последовательностей в глобальном выравнивании. Для этой процедуры не требуются новые выравнивания, так как последовательности уже выровнены.
Такой • дифференциальный (локальный) подход к сравнению биологических последовательностей представляется достаточно перспективным. С позиций теории нейтральности молекулярной эволюции, скорость эволюции белка лимитируется скоростью эволюции консервативных участков21. Тогда деревья, построенные для консервативных участков (которые могут составлять достаточно небольшую часть белковой молекулы), отражают процесс эволюции белка более правдоподобно, чем деревья, построенные для целых последовательностей.
Из уже полученных глобальных множественных выравниваний было выделено несколько высококонсервативных участков Р450. Для них также были рассчитаны величины гомологии и расстояний. Были рассмотрены "срезы" множественного выравнивания Р450, соответствующие следующим участкам структуры Р450сат: (I) ■£-участок: с357 и проксяпальная (Ь) спираль [348-378]; (2) ^-участок: фрагмент дистальной (I) спирали [251-267]; (3) Х-участок: спираль К [275-296] ; (4) (З-участок: 33- и |34-структуры [295-343]; (5) Б2)-участок: спирали С и й [105-144] Как и для полных последовательностей Р450, здесь нетрудно заметить кластеризацию по семействам и подсемействам, более того, для консервативных участков эта кластеризация сильнее выражена. В то же время очевидно, что скорости эволюции в разных консервативных участках неодинаковы. Так, Х-участок семейства СУР2 четко обособлен (даже от ближайших
21 Кхшига, М. (1991) Ргос. ЯаС1. АсасГ. Яс!. ЦБА 88, 5969-5973.
семейств), тогда как семейства CYP11, CYP3, CYP4 и CYP52 образуют ясно различимый кластер. Для 2-участка наблюдается обратная картина: кластер (CYP3, CYP4, CYP52) лежит дальше от CYP11. чем семейства кластера (CYP1, CYP2, CYP17, CYP21) друг от друга. В отличие от К- и ^-участков, в р-участке никакие семейства не образуют выраженных кластеров, а также яснее видна неоднородность внутри CYP2. Ь'Ю- и 5-участки по характеру кластеризации семейств и подсемейств занимают промежуточное положение между 0-участком, с одной стороны, и К- . и .^-участками, с другой. Даже на уровне высококонсервативных участков В-Р450 представляют, собой весьма разнородную группу. Таким образок, сильная и слабая иерархии по-разному выражены в разных консервативных участках Р450.
Некоторые предположения относительно эволюции надсемейства Р450.
"Сильный" характер иерархии кластеризации последовательностей Р450 в нультигенных (под)семействах наводит на мысль, что все расстояния между любым представителем (под) семейства X и любым представителем (под)семейства Y должны быть одинаковы. Наблюдаемый на практике разброс расстояний сильно зависит от выбора параметров сравнения (например, матрицы замен, штрафа за пробел) и порядка последовательностей в списке, к тому же знание его ничего нв прибавляет к нашему понинанхю эволюции надсемейства Р450. Следовательно, необходимо максимально абстрагироваться как от межвидовых, гак и от внутривидовых различий, которые появились, очевидно, после этой дивергенции. Далее, большинство из ныне существующих белков являются высокоспециализированными продуктами эволюционного процесса, нэ исключено, что к тупиковыни ветвями, а не промежуточными, быстро эволюционирующими формами. Именно неустойчивость промежуточных форм благоприятствует дивергенции. Ясно, что сравнение специализированных форм разных (под)семейств далеко не то яь; самое, что сравнение последовательностей-предшественников.
Информацией о первичной структуре предшественнике!! какого-либо -(иод) секь2сгва Р45С кы не располагае;:. Часть этой одогнко. аеклтекг в коясэнсусздз последовательвостя::. Пэ£ консекиусг.к подразумевается некоторая абстрактна«, никогда ае суБвстсизздза и в природе последовательности, которая может считаться, "центром ткжестк" данной ьыборки по^лодовательноитей. В отакчпе с: -лэьгэясуса, пра-последоватслькостм реально существовал«.
однако не сохранились. Нет никаких доказательств гого, что "центр тяжести" для данного- (под)семейства (т.е. консенсус) совпадает с пpa-пocлeдoвaтeJfьнocтью. Тем не менее мы склонны считать большинство консервативных остатков, . вошедших в консенсус, консервативными и для предшественника данного (под)семейства. Подчеркнем, что знание всех остатков пра-последовательностей и не обязательно. Согласно одному из положений теории нейтральности, функционально менее значимые участки молекулы белка (или целые белки) эволюционируют быстрее, чем более значимые. Таким образом,, скорость эволюции белка лимитируется консервативными участками, то есть фактически определяется скоростью эволюции консенсуса!
От этого положения остается сделать один шаг к обоснованию дифференциального анализа эволюции консервативных участков. В саном деле, деление нолекулы белка на фундаментальные блоки - домены естественно приводит к мысли о независимой, по крайней мере до некоторого момента, эволюции белков-предаественников йоменов22. Впрочем, ничто не препятствует доненам и после объединения их предшественников в одну полипептидную цепь эволюционировать с различными скоростями. В нашей работе, анализируя место СУР102 среда других гемопроаеинов, мы исследовали последовательность только "гемового" домена этого белка; для определения его места среди других ИАОРН-зависимых Р450 редуктаз, естественно, нужно взять последовательность только "флавинового" домена. Аналогично можно подойти и к эволюции собственно Р450. Р450саш, например, обладает слишком сложной структурой, чтобы можно было допустить нысль о формировании аналогичного белка, минуя стадию более коротких "строительных блоков". Выявление таких блоков само по себе представляется интересной проблемой (см., например, 0ед1уггепко е КиШоэтга, 1992 ). Эволюция отдельных структурно-функциональных ^ доменов Р450 еще совершенно не изучена, и мы предполагаем, что тщательные исследования в этой области могут дать очень интересные результаты. То, что топология дендрогранм, полученных отдельно для разных консервативых участков последовательностей Р450, различна, очевидно, свидетельствует о различных относительных скоростях эволюции этих участков. В зависимости от того, какой участок выбран для такого исследования, наши представления об иерархии внутри надсемейства Р450 могут меняться.
22 Coggins, J. R. S Hardie, D. G. (1986) In Hardie, D. G. S Coggins,
Молекулярная эволюция Р450 не тождественна филогенезу. Скорости эволюционного процесса для различных подсемейств Р450 различны, что совсем неудивительно - собственно, почему эволюция ферментов с широкой субстратной специфичностью, отвечающих за . метаболизм ксенобиотиков, и высокоспециализированных форм, "работающих" с одним эндогенным субстратом, должна идти с одинаковой скоростью? Путь, пройденный современным бактериальным ферментом, ножет быть не менее длинным, чем у его гомолога из "высших" организмов. В надсемействе Р450 многие бактериальные гемопротеины почти так же далеки друг от друга, как и от эукариотических Р450. Если считать, что образование мультидоменных белков путем слияния генов, изначально кодирующих разные полипептидные цепи, 'представляет собой
23
прогресс , то венцом эволюции Р450 следует признать именно бактериальный СУР102 из В. тедагегхит - химеру Р450 и НАПРН-Р450 редуктазы.
Интересно, что кластер (СУРЗ, СУР4, СУР6, СУР56, СУР102) содержит Р450 такого разного происхождения, как млекопитающие (СУРЗ. СУР4), насекомые (СУР4С, СУР6), грибы (СУР56) и бактерии (СУР102); в то же время кластеры (СУР19) и (СУР7} представлены только последовательностями позвоночных; {СУРН, СУР27} содержат Р450 митохондрий млекопитающих, а {СУР51, СУР52, СУР56) - только Р450 дрожжей. (СУР1, СУР2, СУР17, СУР21) также представлен только генопротеинами позвоночных, хотя СУР71 (высшие растения) всегда примыкает к этому кластеру. Кроме того, гены ■ СУР4 содержат до 12
24
нитронов - зго максимальное известное количество интронов среди генов Р450 эукариот. Принимая во внимание, что селективная потеря
25,26
интронов часто происходит в процессе эволюции , а предшественники прокариот и эукариот, вероятнее всего, имели интроны, впоследствие утраченные большинством прокариот и низшихи эукариотами27, мы предположили, что гены СУР4 сохранили наиболее "архаичную"
Hardie, D. G. £ Coggins, J. R. (19E6) In Hardie, D. G. S Coggins, J. R. (eds) Multidomain Proteins - Structure and Evolution. ElsevJiîr Science Publishers B. V. , Amsterdam, pp. 333-344.
Kiiürs h. , Sinioka, N.. Kfttsunaga, E. G Gonzalez, F. J. (1389) D:U. b, 502-51Î..
** Gilbert. » (ÎS£S) Scicncc 22S, 823-324.
26 irebert. D.W., Jonas, J. E. . Owens, J. £ Puga, A- (1388) In King, t.'Z- , Vhsc.,-1, K. S. r, Korrison. K. (eiîs. ) Oxidases and Related Réaox System. A. P.. Lins, Inc. , Kcw York, pp. 557-576.
" Doolistl*. T. (JS73) f/atL-r- 272, 58Î.
структуру сред* известиях эукаркотическях гонов Г450. Напротив, гены СГР1А сохранили только б интронов и, по-видимому, образуют наиболее "продвинутое" семейство среди Р450 позвоночных.
Кутацронный процесс принципиально стохастичен, и даже неслучайному закреплению отбором подвергаются случайно возникшие изменения; вряд ли возможно установить, почему закрепилась именно
¡crosporidia
Slime
Entamoeba! Extreme Halophi!
Methanosarcina Methanobacteriales Methanococcaies Thermococcales Thermoproteus' Рут
Green non-sultur bacter»; "
[Grarft-positives
Purple bacteria |Cyanobacteria]
jFlavobacterla
acteria rmotogales
Рис. 2. Глобальное филогенетическое дерево живых организмов, построенное на основании сравнения последовательностей рРНК32. Названия групп (царств) организмов, для которых получены последовательности Р450, выделены рамхами. В надцарстве Archaea, в отличие от Bacteria и Eucarya, не известно ни одной последовательности Р450.
- IS -
зга первичная структура, а не другая. С другой стороны, эволюция на этой может и не остановиться. Согласно теории нейтральности, большая часть "точечных" мутаций имеет нейтральный характер и не подвергается давлению естественного отбора28. Тем самым эти мутации не имеют прямого отношения к образованию принципиально новых белков, 2io белки тем не менее изменяются. Нейтральность мутации может исчезать при изменении условий - тем самым нейтральные мутация представляют в скрытом виде материал для отбора21.
Работы по направленному мутагенезу и сравнение функций некоторых аллельных вариантов Р450 показали, что иногда замена единственного остатка в активном центре Р450 существенно изменяет каталитическую функцию29'30'31. С другой стороны, многочисленные Р450 с близкими функциями (например, аллельные варианты или члены одного подсемейства) демонстрируют толерантность к гораздо большему числу огнен - очевидно, нейтральных.
3 заключение следует отметить, что все известные сегодня последовательности Р450 представляют лишь малую часть суиествуюдэго-в природе разнообразия этих гемопротоинов. Например, у высших растений известна единственная последовательность - CYP71 из авокадо. Гены Р450 были выделены только из бактерий родов Agrobacteriuni, Bacillus, Pseudomonas и Streptomyces.
Последовательности Р450 получены только для иести больших ветвей глобального филогенетического дерева живых организмов32, а. к;;енно ;кяеоти:х. растений, грибов, гран-положительных бактерий, флавобактерий и цканобактерик (рис. 2). До сих пор ничего не известно о ток, обладают ли архоб&ктеркк Р450-содзрх:ащикк ноноокскгеказнынк системами, хотя, судя по некоторый мэтаболкческим путк.ч, каловерсятно, чтобы в этом надцарстве живых организнсз таких систем из было'6. Ясно, что без- змаякя новых последовательностей F450 кз разных групп жквых организмов наш:; предстаЕлзнкя оС оволйцк» этого надсекейстза будут оставаться госьме. рагрознекпикк.
Kiau-ri, Ii. (1VC<S) Kattzrv 7-X:, 62i-62fc.
L'iiiöi.arj, L. ff iieciehi, К. (1S?&) Uature 335, 632-S3i.
ai^Va, , Siii7,.-.su, , Kir::no, JC. , «ateno, K. , Fujii.-Kuriy-.i.vi,
v. , г.. s ;->,-v:ics, 7. L. (ivii'j Piocheaistry Сг. бу'В-г/з".
K-rCU ic, 1С. K. , bnifour, z. i. , йе'Жолг, G. Y. , Grissa, С. W. , r.'-.
V., . E. J. , Hp.J?.n, J. W. , >r.-Y«ns, J. C. b»,d №t3.j»s£-7.
wbf'j.is.- ;. r.r.i t.iir. с. .: üocst. с. "л. (1<?аг) Pro-. ■;.
- 19 -ВЫВОДЫ
1. Проведены циклы множественного выравнивания с иерархической кластеризацией для 147 полных аминокислотных последовательностей Р450 в полностью автоматической режиме с использованием четырех различных матриц замен. Выделены наиболее устойчивые кластеры последовательностей Р450, образующиеся в каждом цикле.
2. Предложен и обоснован нетод множественного выравнивания консенсусных последовательностей семейств (подсемейств). Получены, консенсусные последовательности для 22 семейств и подсемейств Р450, которые можно рассматривать в качестве моделей последовательностей-предшественников данных групп. Проведено множественное выравнивание 22 консенсусных последовательностей (под)семейств Р450 и 21 уникальной последовательности Р450, на основании которого построено принципиально новое эволюционное дерево надсемейства Р450.
3. Предложен и обоснован метод дифференциального сравнения консервативных участков белкоЕых последовательностей на основе множественного выравнивания. Метод может использоваться для исследования эволюции структурных и функциональных доненов гомологичных белков. Провёдено дифференциальное сравнение 5 консервативных участков Р450.
СПИСОК ПУБЛИКАЦИЙ ПО ТЕМЕ ДИССЕРТАЦИИ
Третьяков, В. Е., Дегт'яренко, К. Н. , Уваров, В. Ю. , Арчаков, А. И., Третьякова, Л. 3. , Вареница, А. И. (1989) Структурная организация и расположение цитохромов Р450 в мембране. Молекулярная биология т. 23, вып. 5, 1321-1331.
Tretiakov, V. Е. , Degtyarenko, К. N. , Uvarov, V. Yu. S Archakov, A. I. (1989) Secondary Structure and Membrane Topology of cytochrome p450s. Arch. Biochem. Biophys. 275, 429-439.
Archakov, A. I. , Degtyarenko, K. N. S Lisitsa, A. V. (1992) Common Motifs in Microsomal Cytochrome P450 N-terninal Membrane Fragments. J. Basic Clin. Physiol. Pharmacol. 3, " Suppl. , 97-98.
Degtyarenko, K. N, (1992) Multiple Consensus Alignment and Local Alignment Study of P450 Protein Sequences. Ibid. , 207.
Degtyarenko, K. N. S Archakov, A.I. (1992) Hierarchical Clustering of Cytochromes P450. In Archakov, A. I. S Bachmanova. G. I. (eds) Proceedings of 7th International Conference on Biochemistry and Biophysics of Cytochrome P-450, INCO-TNC, Moscow, pp. 724-726.
Degtyarenko, K.N. S Kulikova, T. A. (1992) Module Structure of Cytochromes P450. Ibid. , pp. .727-729.
Uvarov, V. Yu. , Degtyarenko, K. N. , Sotnichenko, A. I. , Vodovozova, E. L. , Molctkovsky, J. G. , Bcrgslson. L. D. , Archakov, A. I.Stier, A. S Krüger. V. (1992) The Spatial Organization of Cytochrome P450LM2 in Membrane. Ibid. , pp. 739-742. -
/
• Пэдт.ссно s печати
*жр&гуТ.:юго № СССР
- Дегтяренко, Кирилл Наумович
- кандидата биологических наук
- Москва, 1992
- ВАК 03.00.04
- Протеомный индекс надсемейства цитохромов Р450
- Общее и частное в структурной организации белков надсемейства цитохромов Р450
- База знаний по цитохромам Р450: разработка и применение
- Структурно-функциональные мотивы в последовательностях цитохромов Р450
- Применение иерархического подхода для выявления структурно-функциональных взаимосвязей в надсемействе цитохромов Р450