Бесплатный автореферат и диссертация по биологии на тему
Исследование некоторых закономерностей в организации вторичной структуры глобулярных белков
ВАК РФ 03.00.03, Молекулярная биология
Автореферат диссертации по теме "Исследование некоторых закономерностей в организации вторичной структуры глобулярных белков"
РГ Б ОД
1 з г
НАЦЮНАЛЬНА АКАДЕМIЯ НАУК УКРА1НИ . 1НСТИТУТ М0ЛЕКУЛНРН01 Б10Л0ГП ТА ГЕНЕТИКИ
На правах рукопису УДК 577.112 + 371.24
МАЛЬЧЕНКО СЕРГ1Й ЗАХАРОВИЧ
ДОСЛ1ДЖЕННЯ ДЕЯКИХ ЗАКОНОМ 1РНОСТЕЯ В ОРГАН13АЦП ВТ0РИНН01 СТРУКТУРИ ГЛОБУЛЯРНИХ Б1ЛК1В
Спец1альн1сть 03.00.03 - молекулярна 01олог1я
Автореферат дисертац1I на адобуття наукового ступеню кандидата бЮлоПчних наук
Ки1в - 1995
Дисертац1ею е рукопис.
Робота виконана у лабораторП бЮ1нженерП 1нституту молекулярно! б!олог11 та генетики HAH УкраГни.
Науковий кер1вник - кандидат б1олог1чних наук
Н.О. Чащ1н
Науковий консультант - Кандидат ф1эико-математи-
чних наук В.1.Дан1лов
0ф1ц1йн1 опоненти - доктор б1олог1чних наук
Ю.Л. Радавський
кандидат б1олог!чних наук 0.1. Корнелюк
Пров1дна орган1зац1я - 1нститут б!ох1м11 1м. О.В.Пал-лад1на HAH Укра!ни, м.Ки!в
Захист в1дбудеться
1995 р. о
год. на
эас1данн1 спец1ад1зовано1 ради Д.016.11.01 1нституту молекулярно! 61олог11 та генетики HAH УкраГни га адресою: 252143, Ки1в-143, вул. Заболотного, 150.
3 дисертац!ею можна ознайомитися в б!бл1отец1 1нституту молекулярно! б1олог11 та генетики HAH Укра!ни ва адресою: 252143, Ки1в-143, вул. Заболотного, 150.
Автореферат роз1 слано
Ж <0/
1995 р.
Вчений секретар спец1ал1зовано! ради кандидат б1олог!чних наук
Л.Л. Лукаш
- 1 -
ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ
Актуальность проблеми. Вивчення просторово! структури б!лк1в вхдгграе важливу роль в р1шенн1 Фундаментальних та прикладных питань молекулярно'1 61ологП, 61ох1м11 та 51оФ1-зики. 0дн1ею з найважлив1ших проблем в ц!й област1 е проблема передбачення структури б!лк1в, тобто встановлення в!дпо-в1дност1 м1ж ам!нокислотною посл!довн1стю б!лкових ланцюг!в та 1х ун!кальним просторовим укладанням.
На сьогодн! в!дсутн1 точн1 теоретичн! схеми та практичн1 розробки для прямого передбачення третинной структури б!лк1в за аМнокислотною посл!довн1стю. В зв'язку з цим зд1йснюють-ся спроби р1шення ц1е'1 проблеми через передбачення вторинно! структури б1лк1в. Проте за останн! 10 рок!в точн1сть метод!в передбачення вторинно! структури зросла всього лише на 10% 1 складае в середньому 65% (табл. I). Тому на сьогодн!шн1й час продовжуеться пошук та розробка нових п!дход1в 1 алгоритм1в для вир!шення ц!е! проблеми, зокрема 1з застосуванням експе-ртних систем.
Передбачення вторинно! структури б!лк1в за !х первинною посл!довн1стю мае самостшне значения та широку область практичного застосування при виэначенн! функц!онально важливих д1лянок б!лк1в з нерозшифрованою просторовою структурою, при встановленн! спор!дненост1 первинних та вторинных структур, для визначення налехност! передбачного б!лка до конкретно! Функц1оналыю1 або структурно! родини. Р1шення це! проблеми в!дкривае нов1 можливост! для сучасно! б!отехнологП та 61л-ково1 1нженер11 при використанн! б1лк!в з заданою просторовою структурою та визначеними якостями.
Мета та завдання досл!дження. Метою даной роботи е вивчен-ня та виявлення законом!рностей, властивих вторинн1й структу-pi глобулярных б1лк!в, на ochobI 1снуючих баз даних просторо-вих структур, а також розробка пакет1в прикладних програм для передбачення вторинно! структури б!лк!в.
Для досягнення поставлено! мети необх!дно було розв'язати наступи! завдання:
1) провести пор!вняльний анал1з !снуючих ыетод1в передбачення вторинно! структури б1лк!в та спробувати визначити причини недостатньо високо! завбачно! сили даних метод!в;
2) удосконалити та адаптувати метод, в!домий в облает! експертних систем як GUHA метод (generation of unary hypote-ses automatically - автоматичне утворення унарних г!потез>, для передбачення вторинно! структури глобулярних б1лк!в, та програмно реал1зувати цей метод для IBM PC сум1сних компыо-тер!в;
3) проанал!зувати гомо- та гетерогенн1 коротк! повторюю-чиеся посл1довност! ам!нок!слот на предмет виявлення потен-цшних инфоршщйних залишк1в;
4) на конкретному приклад! бактер!альных 5-мет1лцитозин мет1лтрансфераз (ЕС 2.1.1.73) продемонструвати пристосован-н!сть модиф!кованого GUHA методу та ряду розроблених ориг!-нальних програм для доел!дження функц!ональних сайт!в б1лк1в та 1х сп1вв1дношення з просторовою структурою б!лка.
Наукова новизна та практична ц!нн!сть роботи. В процес! проведених досл!джень отримано наступи! результата:
- проанал1зовано причини недостатньо! завбачно! сили ic-нуючих метод!в передбачення вторинно! структури б!лк1в, та запропоновано моклив! шляхи подальшого прогресу в зб1льшенн!
- з -
точност! передбачення вторинно! структура;
- на основ! анал!зу схожост! первинних посл!довностей 61-лк1в вперше визначено точн! меж! сп!впадання вторинно! стру-ктури при визначеному в1дсотку гомолог!! первинних посл1дов-ностей як для гомолог!чних, так i для негомолог!чних б1лк1в;
- показано, що !снують групи аы!нокислот, як! мають тен-денц!ю до утворення визначено! вторинно! структури. При ви-р!вюованн! гомолог!чних посл!довностей та визначенн! !х стру ктури дан! амшокислоти виграють критичну роль, демонструючи здатн!сть практично при однаковому контекст! руйнувати коро-тк! регулярн! структури;
- на основ! модиф!кованого GUHA методу створена програма розрахунку вторинно! структури глобулярних б!лк1в для IBM PC сум!сних компьютер!в !з середньою точн!стю передбачення 68%;
- використовуючи розроблений нами модиф!кований GUHA метод, метод пошуку зразк!в та ряд ориг1нальних програм, в сайт-вп1знаючому домен! мет!лтрансфераз вперше виявлено п'ять мотив!в у первинн!й посл1довност! цих фермент!в та показано !х сп1впад!ння з $ункц!ональними мотивами на вторин-н!й структур!, а також показано наявн!сть в сайт-вп1знаючому домен! мет!лтрансфераз в-а-в структурного домена, який при-сутн!й на багатьох ДНК-зв'язуючих б!лках.
Апробац!я роботи. Матер1али дисертацП допов!далися на М1жнародних конференц!ях "Моделирование и компьютерные методы в молекулярной биологии и генетике" (Новосибирск, 1990), "Bioinformatics in the 90's" (Maastricht, The Netherlands, 1991), "FEBS'92" (Dublin, UK, 1992), "Protein engineering and beyond" (Miami, USA, 1993), на ceMiHapi Над1онального агротехн!чного 1нституту (INRA, Paris, France, 1991).
Особистий внесок автора. В робот! наведено реэультати
досл1джень, виконаних безпосередньо автором.
ПублгкацП. За темою дисертацИ опублшовано 7 робот.
Структура та об'ем дисертацЦ. Дисертацгя складаеться з наступних розд!л!в: вступу, трьох глав - "Огляд л1тератури", "Матер!али та метода", "Результата та обговорення", виснов-к1в та списку використано"! л1тератури, який включае 105 616-л!ограф1чних посилань. Роботу викладено на 111 стор1нках. ма-шинопису, вона ы1стить 7 таб.лиць, 13 малюнк1в.
0СН0ВНИИ 3MICT РОБОТИ.
У вступ! обгрунтовано актуальн1сть теми дисертацИ, викладено мету та завдання, в1дображено наукову новизну та пра-ктичну uiHHicTb досл!джень.
В пердий глав! "Огляд л!тератури" розглянуто сучасн! уяв— лення про структурну орган1зац1ю глобулярних 63jik1b, надано опис та анал1з !снуючих метод1в передбачення вторинной стру-ктури 61лк1в. На основ! анал!зу л1тературних даних зроблено висновок, що найб!льш точне передбачення вторинно! структури б!лк!в досягаеться за допомогою комб1нованих метод!в або ек-спертних систем (табл.1). Однак, нав1ть наст1льки склада! метода анал!зу вторинно! структури не п1д1ймаються в точ-ност1 передбачення вшце 70%. Для визначення можливих причин даного процесу проведено пор1вняльний анал!з метод1в передбачення. Узагальнюючи дан!, отршан! р!зними методами, можна вид!лити наступи! законом!рност1:
1) Показана статистично значима переважн!сть знаходження ам!нокислот, дуплет!в та д!лянок б!лка в визначенн!й конфор-мацП.
Z) 3 результат!в досл1даень виходить, що зустр!чаються д!лянки б!лка, як! несуть визначене !нформац!йне навантажен-
-5ч
Таблиця I. Точн1сть передбачення, яку розраховано для трьох конформац!й в сучасних методах передбачення вторинно! стру-ктури б1лк1в.
Статистичн! метода
Чоу-Фасмана 51
GOR (Гарн1е та iH.) 55
GORIII (Пбрат та 1н.) 63.3 Метода схожост! посл1довностей
Ншикава та Оои 60
CBiT 59
JleßiK та Гарн1ер ' 63 .
Метода, заснован1 на Ф1зичних моделях
Бью та' iH. 59
Л1м 56
Ф1лькешптейн-Пт1цин 63
Холли та Карплюс 63.2 Метода шаблон1в
Тоха та 1н. . 62
Руман та Водак 64 Комб1нован1 метода
Нейронна с!ть (Кнеллер та 1н.) 64.3
COMBINE (Бью та 1н.) 65.5
Соловйов та 1н. 63
Нишкава та iH. 67.4
GUHA метод (Братусь та 1н.) 68
- 6 -
ня в детерм1нацИ вторично! структура.
В останньому розд1л! глави "Огляд л1тератури" розгляда-ються загальн1 властивост! бактер1альних 5-мет1лцитозин ме-т!лтрансфераз та обговорюеться сайт-вп!знаючий домен метЗлаз як модельна система для дослЗдаення Функц1ональних сайт1в глобулярних б1лк1в та 1х сп1вв1дношення з просторовою структурою.
Глава "Матер1али та методи" складаеться з двох частин.
2.1. Банки даних та первкнн! посл1довност!.
Для вивчекня та виявлення закоком1рностей, властивих вто-ринн1й структур! б1лк!в, використували 1нФормац1ю про вто-ринну структуру 108 б3.лк!в (20.000 аьанокислотних залишк1в) з рентгеноструктурним дозволом меншм,н1к 0.2 нм. Дан1 про вторинну структуру бз.лк1в отримано з Брукхевенського банку даних просторових структур б!лк1в.
Для досл!дження функц1ональних сайт1в б1лк!в та 1х сп1в-в1дношення з просторовою структурою, 26 посл!довностей 5-ме-т1лцитозин мет!лтрансфераз отримано з банку даних БЮ^-РЮТ Европейсько! молекулярно-бл.олог1чно1 лабораторИ,верс1я 18.0.
2.2. Програыне забезпечення.
Анал1з первинних посл!довностей та вторинно! структури 61ж1в проводився з використанням ориг!нальних авторських програм, а також програм, доступних через базу даних ЮЗ_БО-гаАВЕ (ЕМВЬ).
Для вир1вшовання первинних посл!довностей та визначення гомолог1чних район1в в б!лках використали програыу ШЬТАЫМ (Корпет,1988); в випадку анал!эу банка даних вторинних структур для пошуку гомолог!чних д1лянок та 1нформац1йних фрагменте б!лк1в - ориг1нальцу програму ВапкБеагсЬ.Ориг1налъний
метод пошуку образ1в використовувався для передбачення б!л-кових сайт!в. Передбачення вторинно! структури глобулярних б!лк!в эдхйснювалося з використанням модиф!кованого вША метода.
Глава "Результата та обговорення" складаеться з п'яти частин.
3.1. Модиф1кад1я ИЩА метода для передбачення вторинно! структури глобулярних б1лк1в.
Для передбачення вторинно! структури б!лка використували метод, в1домий в област1 експертних систем як виНА метод. Ран1ш було показано, що в традиц1йному США ыетод1 перепус-калися важлив! знания за рахунок неповного визначення критериев перев!рки на важлив!сть знания. Вдосконалення США методу м!стилося в розробц! таких критерПв визначення важли-вост1 знания, коли задовольняеться основний принцип !ндукцП - висновок ус1х суттевих знань. Суть методу полягае в насту-пному. Припустимо, досл1джувана предметна область подана ем-п1р1чними даними у вигляд! таблиц! 1 дано два стани предмет-ног облает:., як! описуються за формулами Р1 та Р2. Кожна Формула описуе конкретний стан предметно! облает!. Використо-вуючи таблицм еш1р1чних даних, п!драховуеться 1) к1льк1сть ус!х спостережень, як1 м1стять два стани; 2) к!льк!сть ус!х спостережень, як! м1стять один стан; 3) к1льк!сть ус1х спостережень,як! м1стять шший стан. П1сля обробки отриманих частот за одним з показник!в, можна перев!рити г1потезу про взаемозалежн!сть даних стан!в. Якщо Формула Р1 описуе мету досл!дження,а Р2 проб!гае множину стан1в предметно! облает!, то можна отримати множину стан!в, пов'язаних з метой досл!д-ження. Як1сть г!потез, що добираються.залежить в!д критер!ю,
який застосовуеться. В дан!й робот1 вибрано точний критер!й перевхрки на незалежн1сть двох ознак (критер!й Ф1шера). Точ-не значения критер!я Ф1шера називають критичним р1внем. Кри-тичний р1вень в1дпов1дае 1мов1рност1 помилковост! дано! ri-потези, тому, чим меншим е критичний р1вень, тим 1мов1рн1шим е взаемозв'язок м!ж станами гЗлотези. Цей факт використано при прогнозуванн! вторинно! структури. Зд1йснено програмну реал1зад!ю модиф!кованого GUM методу для IBM PC сум!сних компьютерiB та зроблено адаптац1ю.даного методу для передба-чення вторинно! структури глобулярних б!лк1в. Вторинна структура класифгкована за трьома конформац!ями: а-сп1раль (h), в-складка (е) та нерегулярна структура (с). Таким чином, кожному ам!нокислотному залишку в1дпов!дае один з трьох ста-н!в вторинно! структури (h,e,c). Завдання передбачення вторинно! структури б!лка Формулюется наступним чином. Припус-тимо, задано дЗишнку б1лка з т.залишк1в i треба визначити, в яку структуру вбудовуеться i-й залишок дано! д!лянки. Для цього з банку ,даних залучаються' все посл1довност! довяиною т, як! м!стять на i-му м1сц1 заданий ам1нокислотний залижок. Дал1 в 1-е м1сце кожно! посл1довност1 зам1сть залишка заноситься значения вторинно! структури цього залишка. Отриман! посл1довност1, записан! одна за одною, створюють таблиц» ем-п1р!чних даних, i-й стовбчик яко! екладаеться з значень вторинно! структури залишку, який визначаеться. 1ни1 стовбц1 складають в!дпов1дн1 залипши (всього - m стовбчик1в). Якщо в якост! стану мети Р1 задати стан а-сп1раль, тод! модиф1кова-ний GUHA метод запропонуе вс! комб1нац1! контекстних залии-к!в, як! пов'язая! з вбудовою 1-го залишка в а-сп!раль. Ана-лог!чно отримуються результата для 1ншх значень вторинно!
структури. в п!дсумку Формуеться множила г!потез вбудови да-ного залишка на вторинну структуру. Критерш передбачення такий: значения вторинно! структури, що прогнозуеться, таке, котре дае найменше значения критичного р!вня на ус1х отрима-них г!потезах. Передбачення для б!лка довольно! довжини зд1-йснюеться посл!довним прогнозуванням кожного залишка в контекст! (т-1) вадпов1дних залишив.
Для практичного запровадження методу необх1дно визначити параметри: т-довжину посл!довност1 залишк1в; 1-розположення залишка, який прогнозуеться. Емп1р1чним шляхом встановлено наступи! оптимальн! значения: т = 5 та ! =.1. Для визначення точност! передбачення тестувались вс1 108 б1лк1в з бази да-них вторинних структур. Прогнозуемий б!лок вилучаеться з за-гального наборау. Оц!нка точност! передбачення за окремими конформац!йними станами розраховувались за формулою (Гарн!е, Робсон, 1989): <5э = 1/2[(Тз+ /Те) + (Тз-+/Тз-)], де э - кон-Формац!йний стан (Ь,е,с); (Те) - к!льк1сть залилпав в структур! б за даними рентгеноструктурного (р/с) анал!зу; (Тэ+) -к!льк1сть залишк1в в структур! в, як1 сп1впадають за перед-баченням з даними р/с анал1за; (Тэ-) - к!льк1сть залишк!в, як1 не входять до структури б за даним р/с анал!зу; (Тэ-+) -к1льк1сть залишк!в, що не входять в структуру э та сп1впада-ють за передбаченням з даними р/с анал1за. Загальна досто-в1рн1сть оц1шовалася за формулою: (} = [ (ТЬ+) + (Те+) + (Тс+)]/!•!, де N - загальна к:льк!сть залкик!в. Середня точн!сть передбачення за використаним в робот! банком даних складала для а-сп1рал! - 74 %, в-складки - 67 нерегулярно! структури -71 % та загальна для трьох конформац!й - 68 %.
3.2. Розробка метода пошуку зразк!в для передбачення б!л-
кових сайт!в.
Для передбачення б!лкових сайтов в основному використову-ються три метода - консенсус, метод вагових матриць та пошук патернхв (иаблон!в). Найб1лына точн!сть передбачення сайт1в досягаеться при використанн! методу вагових матриць та скла-дае 80-90% íctishvej: та 30-40% помилкових передбачень сайту. Критичним елементом в метод! вагових матриць е виб!р л1м!ту-ючого вагового коеФ1ц1енту, який не е м!н!мальним для дано! множини посл!довностей. Це дозволяе значно скоротити к!ль-к1сть помилкових передбачень, але в той же час зменшуе к!ль-к!сть 1стиних передбачень.
Наш розроблено ориг1нальний метод передбачення б!лкових сайт1в на основ! об'еднання метод1в вагових матриць та пошу-ку патерн1в, який названо методом пошуку образ!в. Важливим елементом даного метода е вбудована експертна система, яка зд!йснюе анал!з результат!в, що отриман! за допомогою ваго-во! матриц! та пошуку патерн!в. Точн!сть передбачення сайт!в при використанн! метода пошуку образ1в складае 95-100% !сти-них та 0-5% помилкових передбачень сайта, що дозволяе досить точно вид!ляти сайт, який ц1кавить досл1дника, з будь яко! множини посл1довностей. Дании метод було використано для точного передбачення л!во! та право! межи сайт-вп!знаючого домена 5-мет1лцитозину метилаз.
3.3. Анал1з коротких ам!нокислотних посл!довностей, що повторюються, та пошук !нформац!йних сайг!в б!лк!в.
Для пошуку 1нформац!йних сайт!в б1лк!в нами проведено оц!- нку статистичних характеристик б1лкових посл!довностей та анализ ix стр!чання на вториннш структур! на основ! бази даних з 108 б!лк1в, отриманих з Брукхевенського банку даних.
- и -
В дан1й робот! п!д гомогенними повторними посл1довностяыи розум!- ються посл1довност! типу Хп, де Х-одна з природних ам!нокислот; п - ступ!нь повторност!. П!д гетерогенними пов-торними посл!довностями розум!еться посл!довн!сть типу (ХУ)п, де Х,У -два р1зних залишки з 20 природних ам!но-кислот, п - ступ!нь повторност!. Гетерогенна повторна посл!довн!сть утворюеться при об'еднанн! трипептид1в типу ХУХ та УХУ. Для оц!нки !нформад1йного значения коротких посл!довностей, як1 повторвються, використовувалася така стратег!я - посл!довн!сть вважалася !нформац!йно значимою для конформацИ, якщо вс! залишки з ц!е1 посл!довност! зна-ходилися в дан1й конФормацИ. Якщо ж посл!довн1сть з таким же ам1нокислотним складом визначалася ! в !ни!й конФормацИ, тод! досл!джувана посл!довн!сть вважалася !нформад1йно незначимою.
У випадку анал!за гомогенних повторюючихся посл!дов-ностей, ступ!нь повторност!, виявлений нами у використан!й баз! даних, складав в!д 2 до 4, тобто визначен! посл!довнос-Т1 типу XX, XXX та ХХХХ (дипептиди, трипептиди та тетрапеп-тиди), в1домост1 про зустр!чаем1сть котрих на вторинн!й структур! подан! в табл.2. Анал1з даних таблиц! виявляе ряд ц1кавих факт!в. По-перже, при зб!лыаенн! довжини повторних посл!довностей вид1ляються чотири ал!фатичних залишка - в, А, V та Ь, як1 мають високу здатн!сть до створення нерегулярно 1 конформадИ, а-сп!рал! та в-складки, в!дпов1дно. Подруге, нами знайдено 13 залижк!в з повним набором якостей, необхузних для утворення Функц!ональних сайт!в б!лк1в (г1д-рофобн1 та г!дроФ!льн!, негативно та позитивно заряджен!) та з тенденц!ею знаходитися переважно в одн!й з трьох основних
Таблиця 2. Дан! про стр1чання посл!доностей типу X у вто ринн!й структур! б!лк!в.
Пептид Вторинна структура К!льк!сть в БД 1нформа- '
тивн!сть
Дипептид
СС ее.сс.ес.ЪЬ
ММ hh.cc,ее,ее
НН сс,Ы1
ТО hh.hc.cc
РР ЬЬ,ее,Ьс,ес,сс
РР сс,hh.ee
09 ee.ee, се, Кс, ch.ec
Трипептид
Ш} ссс,ссе,сее
ААА ЫЛ.ссс.Ыю.еес
III еее.еес
УУУ еее,сее,еес
БЭЭ ссе,сЫ1,еее,сее,еес,
есс.ссе,
ТТТ ссс,еес,еее,сее
Ш, hhh.eeQ.c9e,есс
РРР ссс
МЖ ссс.еее
ЛШ ссс
ББО ссс
ЕЕЕ ЫЛ ■
ККК ЫЛ.ссс.ссЬ
УЬПГ ссс,сее,еес
Тетрапептид
СООО сссе
АААА ЬЫЛ
ТШ сеее
БЭЗЭ сссс,сеее,еесс
ША сеее
5 111 Е*
13 2 2 1 Н*
4 2 СН
5 11 НС 15 3 2 2 1 Н* 31 1 1 С*
14 7 3 2 1 1 1 СНЕ
11 1 1 СЕ
14 4 2 2 Н*
1 1 ЕС 6 2 1 ЕС 9 3 2 11 С* 1 1
2 2 11 СЕ 9 3 11 Н*
I С
II СЕ
1 С 4 . С
2 Н 2 11 НС
III СЕ
1 С
1 Н
2 Е 111 СЕ 1 Е
БД -база даних; Н(н), Е(е) ! С(с) - а-сп!раль, в-складка 1 нерегулярна структура. »Структура мае преважне значения, од-нак в цьому же контекст! ыожуть зустр!чатися й !нш! структури.
- 13 -
конформац1й вторинно! структури.
В випадку анал1за гетерогенних повторних посл1довностей нами виявлен! наступи! 1нФормац1йн1 характеристики эалишк1в (табл.3): 1) залижи в, А та V е найсильн1шими (за тенденц!-ею до утворення визначено! конформац!!) в сво!х структурних трупах триплет1в; 2) виявлено 1нформац1йно значущ! залипши для а-сп!рал! - А,Е та Г; в-складки - V; нерегулярно! структури - в, О, Р, К та N. Ц! дан! повн1стю сп!впадають з аналогичною !нформац!ею, отриманою для гомогенних посл!довнос-тей, як1 повторюються. Таким чином, можна зробити висновок про те, що !снуе ряд залишк!в, (табл. 2, 3), як! несуть 61-льше !нформац!йне навантаження в детерм!нацИ вторинно! стру ктури як для гомо- так ! для гетерогенних повторних посл!до-вностей залишк!в. Так! ам!нокислоти було нами названо 1Фор-мац!йно значимими.
Отриман! дан! про !Формац1йно значим! ам!нокислоти можна . використовувати при анал!зуванн! гомолог!! посл!довностей б!лк!в та сп!впад!ння !х вторинних структур, налриклад, для вивчення впливу даних ам!нокислот на утворення або руйнуван-ня коротких елемент!в вторинно! структури б!лк!в. Для цього необх!дно було провести анал!з гомолог!! посл!довностей б!лк!в та сп!впад!ння !х вторинних структур.
3.4. Анал!з гомолог!! посл!довностей б1лк!в та сп!впад!н-ня !х вторинних структур.
На сьогод!шн1й день сильне заперечення проти метод!в пе-редбачення гомолог!! посл!довностей м!ститься в робот! (Кабал, Сандер, 1983), в як1й показано, що 1дентичн1 пентапеп-тиди можуть знаходитися одночасно в р1зних конформац1ях вторинно! структури з !мов!рн!стю, яка перевищуе випадкове сп!-
Таблиця 3. Дан! про стр!чання трипептидов типу ХУХ 1 УХУ, як! утворюють регулярну посл!довн!сть типу (ХУ)
Структура (трипептид) К!льк!сть в БД 1 2 1нфорыатив-
н!сть
1 2 3 4 5
а-сп!раль
АМА АСА АЕА АИА АУА 2 1 7 2 4 16 5 +
ЬАЬ ЬОЬ 4 1 5 2
1С1 1М 1Р1 1 1 1 3 3
ш шч 1 1 2 2
тмт 2 2 .1
МУМ МБК МОМ МВД 1 2 1 1 5 '4 7
скс 1 1 1
БИ) 1 1 1
ЕЬЕ ВДЕ ЕНЕ ЕУБ 3 3 1 1 8 4 - +
сгьэ ОЕО овд ОР<З 2 1 1 1 5 4 ?
КОК КУК 1 1 2 1
ми йог вдк шг 1 2 1 2 6 . 4 7
НАН НТН 1 1 2 2
УСТ! МРМ 1 1 2 2
РАК РЬР РМР рта1 3 1 1 2 7 4 +
ТОУ 4 4 1
РРТ • 1 1 1
Ш» 1 1 1
в-складка
ЬНЬ 1 1 1
1А1 1М1 Ш1 1 1. 1 1 4 п О 7
У1У У<ЭУ т 3 2 1 6 3 +
Т1)Т ТРТ 1 1 2 2
мтм мкм 1 1 2 2
сис 1 1 1
ОНО " 1 1 1
К1К КИК КРК 2 1 1 4 3 7
ко* гш 1 1 2 2
НУН НРН 1 1 2 2
Продовження табл.3
1 2 3 4 5
FRF FHF FYF 1 1 1 3 3 ?
YTY YCY YFY 1 1 1 3 3 ?
NYN 1 1 1
Нерегулярна структура
GLG GIG GTG GMG GQG GKG 5 5 4 2 3 5 37 10 +
GRG GWG GFG GPG 5 2 3 3
LCL 1 1 1
SES SQS SRS SWS SPS 2 3 1 1 2 8 5 ?
TET TWT TPT 1 1 4 6 3
MGM MCM 1 1 2 2
CYC 1 1 1
DGD DSD DTD DCD DED 9 1 2 1 2 25 10 ■t-
DQD DWD DYD DPD DND 3 1 1 3 2
ESE ENE 3 1 4 2
QSQ QPQ 1 2 3 2
KSK KHK KFK KNK 3 3 4 1 11 4 ?
RIR RER RPR 1 1 1 3 3
HGH HEH HKH 1 1 1 3 3
WPW 1 1 1
FDF FPF 4 1 5 2
YVY YSY YEY 2 2 1 5 3
PGP PAP PLP PIP PSP PTP 1 1 8 2 2 2 25 13 +
PMP PDP PQP PKP PHP PWP 1 2 2 2 1 1
PYP 1
NGN NSN NCN NDN NEN NQN 1 3 1 1 3 1 11 7 +
NKN 1
В рядках 1 i 2 вкаэано загальну к!льк1сть трипептид!в да-
ного типу в БД та к!льк1сть тип!в трипептидов в БД для дано! ам!нокислоти, в!дпов1дно. В ряку "1нФормативн1сть" знаком "+" позначено яскраво виражену тенденцию до утворення визначено! структури; знаком "?"- можливий вплив залишк!в цього типу на детерм!нац1ю вторинно! структури. Для оц!нки 1нформативности кр!м загально! к1лькост! трипептид1в в БД важливе значения мае к!льк1сть тип1в трйпептид1в.
впадшня. Для пояснения результатов автори запропонували г1потезу високо! конформавдйно! адаптивност1 коротких пеп-тщив. В межах ц!е! г1потези висунуто три припущення: 1) 1с-нують 1дентичн1 пентапептиди, конФормац1я яких повн!стю виз-начаеться навколишн1м ам1ноквдлотним контекстом; 2) 1снують ддентичн! пентапептиди, конформащя яких не залежить в!д контекста; 3) 1дентичн1сть пентапептид1в не в!дображуе схо-ж!сть вторинних структур або еволюц!йну спор1дненн!сть 63.Л-к!в, як1 пор1внюються. Для падтвердження сво!х висновк!в автори наводять 25 при1слад1в 1дентичних пентапептщив, 13 з яких п1дтверджують перше припущення., а 12 - друге. Викорис-товуючи розроблену нами програму ВапкБеагсЬ, проведено пошук та анал!з 1дентичних пентапептид1в в баз1 даних з к1льк!стю ам!нокислот, в два рази перевищуючою таку в робот! Кабана та Сандера. Наш знайдено 143 1дентичних пентапептида з негомо-лог!чних б1лк!в, конформац!я яких з однаковою 1мов1рн1стю була схожою та в1дм!нною. Також вил!дено 162 пентапептида в гомолог!чних б3.лках, конформац1я яких повн!стю Здентична. Досл1дження цих приклад!в демонструе, що , як в випадку не-сп!впад1ння конформад!й, так I в випадку 1х сп!впад1ння, фактором, який визначае конформац!ю, е наявн!сть в найближчо-му оточенн1 (я5 залишк1в) пентапептид!в 1нформац1йно значи-мих амЗяокислот. Ми припускаемо, що "конкурентна боротьба" м!ж 1нформац1йно значимими ам1нокислотами, як! детерм1нують визначену конФормац!ю, в основному визначае локальную, вто-ринну структуру д!лянки б!лка.
Отриман! дан1 св!дчать про те, що локальна вторинна структура (ддлянки б1лка довжиною до 15 залишк!в) визна-чаеться в основному наявн!стю 1нФормац1йно значимих ам!но-
кислот. Одним з критичних елемент1в в методах передбачення вторинно! структури на ochobí гомолог!! посл1довностей е визначення точних меж в1дпов!дност! гомолог!! посл!довностей та схожост! !х вторинних структур.Тому настушпш кроком було вивчення вгашву 1кФормац1йно значимых ам1нокислот на конфор-мац1ю д!лянок б!лка довжиною б!льйою, н!ж 15 залишк!в.
Вс! метода передбачення вторинно! структури на основ! гомологи посл1довностей засновал! на простому принцип1: ко-Potkí пептида з високим ступеней гомолог!! повинн! мати схожу вторинну структуру. Однак, до цього часу було зроблено т!льки одну спробу (Стернберг, Иолам, 1990) визначити, нас-к!лыш короткими повинн! бути пептиди та яким високим повинен бут и ступ1нь гомолог!!. Узагальнюючи отриман1 дан!, ми прийшли до висновку: для Фрагмент!в б!лк!в довжиною в!д 20 до 262 залишк!в ступ!нь гомолог!! 25% е недостатньою для того, щоб вони мали !дентичну конформац!ю. Нами проведено анал!з (з обл!ком .впливу !нФормац!йно значимих ам!нокислот на утворення вторинно! структури) д!лянок б!лк!в довжиною в!д 15 до 200 залишк!в з1 ступеней гомолог!! >25% на предмет визначення точних меж (у в!дсотках) в!дпов!дност! гомолог!! посл!довностей та схожост! !х вторинних структур. На основ! отриманих даних визначен1 наступи! меж!: для Фрагмент1в, ступ!нь гомолог!! яких не перевищуе 30% - вторинна структура не сп!впадае; з гомолог!ею в!д 30 до 47% - вторинна структура частково сп!впадае, з гомолог1ею вице 47% - практично по-вне сп!впад!ння вторинно! структури . Також було виз-начено б!лки, як! нами названо "самогомолог!чними" б!лками. Вони складаються з к!лькох високогомолог!чних блок1в, що ма-ють !дентичну вторинну структуру (мал.1А,В,0). При об'еднан-
А. Лектин (аглют!н1н)
RCGEQGSMECPmCCSQYGYCGMGGDYCGKGCQDGACWTSK 1-43 *** * **** ****** ** * •*** *** * *
RCGSQAGGATCPNNHCCSQYGHCGFGAEYCGAGCQGGPCRADI 44-86 • **** #* **** ****** ** * *•** *** * * *
KCGSQSGGKLCPNNLCCSQVîGSCGLGSEFCGGGCQSGACSTDK 87 -129 ** • **••* ** *** **** * •** ***** *
PCGGDAGGRVGTNNYCCSAGGSGGIGPGYCGAGGQSGGCDG 130-170 hhhh EE EE HHHH
В. Кальц1й-зв'яэуючий бъпок
TEEQIAEFKEAFSLFDKDGDGTITTKELGTVMRSLGQNPTEAELQD 1-47 * •*** •****»■* *• ** ** *■ *:;• DTDSEEEIREAFRWDKI«ÑGYISAAELRHVimü,GÉaaTDEETOÉ 74-119 hhhHHHHHHHHHHH ЕЕ НННННННННН ННННННННННН
MINEVDADGNGTIDPPEFLTMMARÖÖC 48-73 ** * • **■* •;• **• **
MIREAÑIMDGQVÑYEEFVQMMT А 120-143 EEHHHHHHHHhhhhh
С. Имуноглобул1н FAB (людська мйелома)
DYVGQGTPVTVSSASTKGPSVFPLAPSSKSTSGGTAALGCLVK 114-156 **• ***** * * * * * * ■*
DYFP.. QPVTVSWNSGALTSGVHTFP. AVLQSSGLYSLSSVVT 157-196 еееЕЕее ееЕЕЕ ее ЕЕЕЕЕЕЕЕЕе
D. Гама-криетал1н
GKITFYEDRGFQGHCYÉCSSDCPNLQPYFSRCN..SIRVDSGCWM 1-45 ** * * * • *** ** * •*■***
FR№IYEroDFR(K№SEITDDCPSLQDRFHLSÉVHSLNVLEGSW 88-133 ЕЕЕЕЕее еееЕЕЕЕ hhhhh ЕЕЕЕЕЕ ЕЕЕ
. LYERPNYQGHQYFLRRGDYPDYQQVíMGFNDS IRSCRLIPQHTGT 46-87 *** * * *•** ** *•* * •* * - *
LYEMPSmRQYliRPGÉYRRYLDWGAMAKVGSLRRVMDFY 89-176 ЕЕЕЕ ЕЕЕЕЕЕЕ ЕЕЕ НННН ЕЕЕЕе
Е. Цитохром СЗ
еее еее ЫЛЪ ее ее
АРКАРАШЬКЮКГКОРУУИШЗТНКАУКСЙССННРУКОКЕЖОКСАТАаСНБКМОКК 1-59
* * ** * - *
0КЗАКаУУНА1Ш0КСТКРКЗСУ0СНЬЕТА0АГ)ААКККЕЬТССКСЗКСНЗ 60^108
Р. Феродоксин
ее ч
АУУВГОЗС1АС<ЗАСКРЕСРУКП0С31 1-27 **#* ** * ***
УА1БАЕЗСГОССЗСАЗУСРУСАР№ЕО 28-54 ЬЬЬЬЬ ее
Мал 1. Пор1вняння посл1довноотей, як1 мають рхзку ступ1нь гомологи, та !х вторинних структур: А, В, Б - самогоыо-лог1чн1е 61лки з дво- 1 чотирисиметричною структурою гомо-лог1чних блок!в; С- гомолог1чний блок; Е, Р - дупл!кац1я Фунгадональных сайт1в. Символами Е 1 Н позначено сп1вп1д1ння а-складки та в-сп1рал1 в ус!х вир1внених посл1довностях в однакових позиц1ях; е 1 И - структури присутяк1 присутн1 т!льки в одному з вир1внених б!лк!в. На Е та Г элемента вторинних структур (е,Ь) позначено над в1днов1дними хм посл1довностями; символами "*" 1 позначено в1дпов1дно 1дентичн1 та Фунгайонально схож1 аьйнокислоти; вертикальною стр!лкою - можливий вплив 1нформац1йно значимих амЗлоккслот на утворення 1 руйнування локально! вторинно! структури в вщпавнених посл!доностях. Ступень гомологи послщовностей
Дор1внюе - для А - 60-70%; В - 63%; С - 37%; О - 47%; Е -22%; К - 44%. Цифри в К1нц1 посл!довностей, як1 пор1вню-. ються, в1дпов!дають позицП Фрагмента в б!лку.
н! таких блок!в утворюеться симетрична структура б!лка (як в первинн!й посл1довност!, так 1 у вторинн!й структур!),що мо-же мати б!олог!чне значения для зб!льшення спор!дненност1 при зв'язуванн! з субстратом, або константи зв'язуванкя э субстратом за рахунок зб!льшення к1лькост! активних сайт!в.
3.5. Анал1з сайт-вп1знаючих домен!в 5-мет1лвдтозин мет!л! трансфераз з використанням розробленого пакета програы.
Практичне запровадження модиф!кованого ОМА методу та анал!зу !нформац1йних сайт!в б1лк!в було зд!йснено на приклад! анал!зу сайт-вп!знаючих домен!в мет1лтрансфераз. Показано 1х сп!впад!ння з Функц!ональниш мотивами у вторинн!й структур! цих фермент!в, виявлене на основ! сум1сного перед-бачення вторинно! структура домен1в.
Для анал!зу вар!абельних домен!в було отримано 26 посл!-довностей 5-мет1лцитозин мет1лаз з банка даних БМ^Б-РЮТ. Визначення вар1абельних домен!в проведено за допомогою розробленого наш метода пошуку образ!в шляхом пошуку УШ-го та 1Х-го консервативних блок!в, п!сля чого ам1нокислотна по-сл!довн!сть ы1ж ними приймалася за посл!довн1сть вар!абель-ного домена. За допомогою цього же методу визначен! п'ять консервативних блок!в (субдомен!в) усередин! вар!абельного домена (таблиця 4), вторинна структура яких визначена за допомогою модиФ1кованого виНА методу та використання стратегII !нформац!1них сайт!в б!лк!в.
Вс1 п'ять субдомен1в демонструють консервативн!сть на р!-вн! вторинно! структура 61лка 1 асоц!йован1, в основному, з в-структурою. Однак, перший субдомен мае наступну передбачну вторинну структуру:
гега^г.гппптшннннншшшгггпг^^ , де Н - а-сп!раль;
Б-в -складка; С - нерегулярна структура. Таку стуктуру знай-
»
Таблиця 4. П'ять консервативних субдомен!в, знайдених у ва-р1абельному домен! 5-мет1лцитозин мет!лтрансфераз. В квадратных дужках позначено залишки, як! стр1чаються в дан!й по-зщ11 субдомена. Символ X - залшок, циФри в дужках п!сля символу X означають ступ3.нь повторност! або до в кину штерва-ла м1ж сус!дн1ми залишками.
Субдомен Посл1довн1сть
1 [У1Ь]Х(3)[УЬ]Т[Ра]Х(4)К[ЕН]Х(0,1)<3[НЕ]Х(3)Р Х(0,1)К[0Е][Ш]аХ(1)РХ(2,3)[У1][ВН]Х(6)У
2 [1Ж]Х(3)[;ге}[ВШ]ХТ[У1Ь]Х[ЗТА]ЗХ(5)[Ы]Н
3 [У1Ь]ЬЕХ(2>УХ(2)КУ[У1]Х(0,1)ЬХ(2)[ОЕа]Х(1,2)
ршзхь
4 00ХЪХ(8,9)ЕУГЗТА]Х(2)ГБЕ]Е0Е]Х[Ь1]Х(2,3)[1Я] [0Е]Х[РО]ЕХ(3,4)[0Е]Х(2)Р[У1]
5 аХ[У1][ВН]Х(2)СХ(6)т(3)С[УЪ][ЗА]РТ[Ы]Т[ТЗ] Х( 1,2)0X0
дено на багатьох ДНК-зв'язуючих б!лках та означено як в-а-в структурний домен або складка Россмана (Россман та iH., 1974). Таким чином, вперше в сайт-вп!знаючому домен! 5-ме-т!лцитозин мет!лаз знайдено мотив, в1дпов1дний в-а-в структурному домену ДНК-зв'язуючих б!лк1в.
висновки'
1. Удосконалено та адаптовано метод, в1домий в облает! експертних систем як GUHA метод. На основ! цього методу створено програму розрахунку вторинно! структури б!лк!в для IBM PC cyMicHHX компьютер!в. Середня точн!сть передбачення модиф!кованого GUHA метода для трьох конформац!й вторинно! структури склала 68%, що е одн!ею з самих високих в сучасних методах передбачення вторинной структури 61лк1в.
2. Показано, що !снують групи "!нформац!йно значимих" ам!нокислот, як1 мають тенденц!ю до утворення визначеной вторинно! структури - А, Е, та F - а-сп!рал1; V - в-складки; G, D, К, Р та N - нерегулярно! конФормацП. Вош мають пов-ний набор ф!зикох1м!чних якостей (г!дроф!льн!сть, г!дро-Фобн!сть, позитивний та негативний заряд), нео.бх!дних для створення Функц1ональних сайт1в. •
3. Встановлено, що посл!довност! довжиною в!д 20 залижк!в та вице з! ступеней гомологИ до 30%, як правило, не мають схожо! вторинно! структури, з! ступенем гомолог!! в!д 30 до 47% - частково гомолог!чн!, вице 47% - мають практично повн!стю сп!впадаючу вторинну структуру.
4. При вир!внюванн! гомолог!чних посл!довностей та визна-ченн1 Ix структури важливу роль в!д!грають "!нформац!йно значим!" ам!нокислоти, здатн! при практично однаковому кон-
- 23 -
текст! руйнувати коротк! регулярна структури.
5. На приклад! 6актер!альних 5-мет!лцитозин мет1лтрансфе-раз продемонстровано пристосованн1сть модифгкованого GUHA -методу та ряду ориг!нальних програм для дослвдкення Функц!-ональних сайт1в глобулярних б1лк!в та "ix сп1вв!дношення з просторовою структурою бхлка.
6. В сайт-вп!знаючому домен! 5-мет1лцитозин мет!лтрансфе-раз вперше виявлено п'ять Функц1ональних мотив1в, як! коре-люють з консервативниш елементами прссторово! структури цих ФерментiB. -
7. Показано присугтсть в сайт-вп13наючому домен! мет1л-трансфераз в-а-в структурного домена, знайденого у багатьох
ДНК-ЗВ'ЯЗУЮЧИХ 6iXiKiB.
Основний зм!ст дисеотацН опублшовано в роботах:
1. Мальченко С.3.,Чащин H.A. Предсказание вторичной структуры белков // Биополимеры и клетка. -1992. -Т.8. -N 4. -С. 21-30.
2. Мальченко С.З., Чащин H.A. О некоторых закономерностях в организации пространственной структуры белков // Биополимеры и клетка. - 1993. -Т.9. -N'1. -С.3-9.
3. Братусь A.B., Мальченко С.З., Чащин H.A. Предсказание вторичной структуры белков модифицированным GUHA-методом // Биополимеры и клетка. -1993. -Т.9. -N 5. -С.61-66.
4. Чащин H.A., Братусь A.B., Мальченко С.З. Использование GUHA- метода для предсказания вторичной структуры белков // Междунар. конФ. "Моделирование и компьютерные методы в молекулярной биологии и генетике". Тез.докл. - Новосибирск, 1990. -С.129.
5. Maltchenko S.Z., BratusA.V., Chashchin N.A. Anew method for the prediction of secondary protein structures with using of se- lfstuding expert system // Internat, conf. "Bioinforma- tics in the 90's". Abstr.papers. - Maastricht. - 1991. - p.13.
6. Maltchenko ß.Z. Conservative subdomains in target regontion domain domain from m5C methylases // Internat, conf. "FEBS'92". Abstr.papers. - Dublin. - 1992. -p.104.
7. Maltchenko S.Z. The target recognition domains from methyltra- nsferases of II class have a common subdomains // Proc.1993 Miami Bio/Technology Winter Symposium. Miami Short Reports. - Miami. -1993. -V.3. - p.46.
Аннотация
Мальченко С.З. Исследование некоторых закономерностей в организации вторичной структуры глобулярных белков. Диссертация на соискание степени кандидата биологических наук по специальности 03.00.03 - молекулярная биология, Институт молекулярной биологии и генетики НАН Украины, Киев, 1995. Защищается семь научных работ, которые содержат результаты изучения и выявления закономерностей, присущих вторичной структуре глобулярных белков, из имеющихся на сегодшшний день баз данных пространственных структур. На основе полученных данных разработан пакет прикладных программ для предсказания вторичной структуры глобулярных белков. ■ Ключов! слова:, вторинна структура б1лк1в, гомолог1я посл!до-вностей, 5-метащитозин метилтрансФерази, Функц1ональн1 ыо -тиви 61лк1в, експертна система.
Maltchenko S.Z. The studying of some regulatories in the secondary structure organization of globular proteins. Dissertation is defended as a candidat work for the biological sciences, spetiality of 03.00.03 - molecular biology, Institute of Molecular Biology ..and Genetics NAS of Ukraine, Kiev, 1995.
The seven scientific articles that contain a result of studying and revealing of regulatories peculiar to a secondary structure, of globular proteins based on a currently available protein spatial structure databases are defended in the thesis presented. The software package has been worked up for a globular protein secondary structure prediction based on a data obtained.
П1дписано до друку I3.OI.95p фориат 60x84/16 ПапPp дтогк. Умов, дтогк. л. 1,0. Тираж 100 приц!рняк. Заказ №8?
'Надруковано ЦУОП ДЯГТП "Плодвинконсерв" и. КиХв , Саксаганеького,!
- Мальченко, Сергей Захарович
- кандидата биологических наук
- Киев, 1995
- ВАК 03.00.03
- Исследование равновесных и кинетических промежуточных состояний на пути самоорганизации глобулярных белков
- Изучение особенностей структуры лизин-богатых гистонов пшеницы
- Распределения дипольных моментов в пространственных структурах биополимеров и их связь с функционированием биологических макромолекул и их комплексов
- Механизм гибели свободнорадикальных состояний в белках
- Спиновая диффузия как метод исследования динамики глобулярных белков