Бесплатный автореферат и диссертация по биологии на тему
Анализ конформаций аминокислотных остатков в глобулярных белках. Предсказание левой спирали типа полипролин II
ВАК РФ 03.00.02, Биофизика

Содержание диссертации, кандидата физико-математических наук, Власов, Петр Константинович

Оглавление.

Введение.

Актуальность проблемы.

Цель и задачи исследования.

Глава I.

1.1. Обзор работ по исследованию левоспиральной конформации в белках

1.2. Методы предсказания вторичной структуры белковой цепи по её аминокислотной последовательности.

1.3. Предсказание вторичной структуры белковой цепи, - развитие методов

1.4. Предсказание участков левоспиральной конформации в белковых цепях.

1.5. Предсказание вторичной структуры, - эпоха стагнации

1.6. Используемые банки пространственных структур белков

1.7. Тестовые выборки PDB - формирование и использование.

1.8. Представление и обработка белковых данных по структурам белков.

Глава II.

II. 1. Конформационные характеристики аминокислотных остатков.

II.2. Конформации отдельных аминокислотных остатков.

Глава III.

III.1. Вторичная структура белков и регулярные пространственные структуры

111.2. Встречаемость различных типов регулярной конформации в белках.

Левая спираль как элемент регулярной конформации и вторичной структуры.

111.3. Распределение участков вторичной структуры по длинам.

111.4. Аминокислотный состав участков вторичной структуры.

111.5. Особенности изменения конформации а-спирали по позициям спирали.

111.6. Распределение остатков по диапазонам значений параметров спирали.

111.7. Тенденция участков левой спирали к продолжению.

Глава IV.

IV. 1. Встречаемостей олигопептидов различной длины в банке PDB и его подвыборках.

IV.2. Конформационная статистика тетрапептидов.

IV.3. Тетрапептиды с высоким предпочтением определённой конформации.

IV.4. Тетрапептиды с предпочтительной конформацией «смешанного» типа.

IV.5. В коей мере аминокислотная последовательность белков составлена из олигопептидных фрагментов с высокой конформационной стабильностью?.

Глава V.

V.I. Алгоритм предсказания вторичной структуры аминокислотной последовательности, основанный на конформационной статистике олигопептидов.

V.2. Тестирование алгоритма предсказания вторичной структуры.

V.3. Предсказание левоспиральной конформации как качественно новый результат в изучении вторичных структур.

Введение Диссертация по биологии, на тему "Анализ конформаций аминокислотных остатков в глобулярных белках. Предсказание левой спирали типа полипролин II"

Актуальность проблемы

Бытует убеждение, что вторичная структура белковой цепи и механизмы её образования и стабилизации представляют интерес как сами по себе, так и как определенный уровень в иерархии структуры белка и процесса сворачивания белка в глобулу (фолдинга). Между тем, несмотря на более полувека исследований вторичной структуры, проблема далека от своего решения как с точки зрения чистой, так и прикладной науки. Действительно, практическая задача предсказания вторичной структуры может считаться решенной, когда точность предсказания достигнет точности определения вторичной структуры. С другой стороны нет однозначной физической теории, которая объясняла бы формирование вторичной структуры с позиций фундаментальной науки. Самое существенное, что до сих пор нет ни частного метода предсказания конформации типа полипролин II, ни общего метода пригодного для предсказания всех трех типов вторичной структуры (а, р, и polyproline И), основывающегося на аминокислотной последовательности белковой цепи.

В настоящее время установлено, что существуют три основные регулярные конформации полипептидной цепи в белках, как глобулярных так и фибриллярных [1-5]. Это правая а-спираль и левая спираль типа полипролин II, а также структуры типа параллельного или антипараллельного Р~слоя, которые могут рассматриваться как вырожденный случай спирали. Эти регулярные конформации входят в понятие вторичной структуры (причём в это понятие порой включаются и другие конформации, не являющиеся регулярными структурами в отличие от структур трёх типов, упомянутых нами [3-5]), формируются на основе первичной структуры и образуют третичную структуру. Так, вторичная структура типа PPII служит составной частью коллагена, молекула которого представляет из себя тройной комплекс спиралей такого типа. Другие фибриллярные белки построены на основе вторичных структур типа а-спирали и p-структуры. Третичная структура глобулярных белков в той или иной степени строится из фрагментов вторичной структуры [3-5]. Все три типа вторичной структуры могут быть элементами так называемых супервторичных структур.

Исследованию вторичной структуры посвящено большое число работ, начало которых пришлось ещё на 70-е годы 20-го века [6-12]. Их целью является понимание физических основ реализации того или иного типа структуры, или, по крайней мере, феноменологическое описание экспериментально наблюдаемой картины вторичных структур. Такого рода знания и/или результаты статистических исследований структурных банков данных позволяют разрабатывать методы предсказания вторичной структуры по аминокислотной последовательности. Существует большое число методов, позволяющих с достаточно высокой точностью (около 80%) предсказывать участки а-спирали и [3-структуры (о методах предсказания вторичных структур подробно рассказывается в разделе 2 главы I данной диссертации).

Вместе с тем, до сих пор не создано метода, предсказывающего места локализации участков типа левой спирали PPII. Между тем доля таких участков, как показано в нашей работе и во многих других исследованиях [13-40], достигает величины порядка 15-20% в общей выборке белков, и необходимость в разработке соответствующих методов очевидна. В то же время очевидна и трудность предсказания участков такого типа вторичной структуры. Фрагменты, имеющие конформацию этого типа, имеют, как правило, малую длину; суммарная доля таких фрагментов не столь велика. Короткие фрагменты вторичной структуры вообще, безотносительно от типа вторичной структуры, предсказываются с меньшей достоверностью чем длинные. Кроме других факторов это, очевидно, связано с тем, что преимущество для предсказания той или иной, в том числе регулярной, конформации над другими конформациями для коротких отрезков полипептидной цепи незначительно, это преимущество накапливается для длинных фрагментов, тем более что степень уникальности последовательности резко возрастает с ее длиной. Существуют и другие трудности, связанные с высокой степенью лабильности конформации типа PPII, о которых подробнее будет сказано ниже.

В связи с перечисленными трудностями мы предприняли попытку разработать новый более результативный метод предсказания вторичных структур, основанный на процедуре разбиения последовательности на перекрывающиеся олигопептиды. Проведенный анализ естественным образом затем применяется при создании шаблона вторичной структуры для последовательностей, для которых осуществляется предсказание. Попытки применить статистику аминокислот и олигопептидов для анализа и предсказания вторичной структуры белка предпринимались еще в 70 гг. [41-43] Но они не дали определенных результатов, по всей очевидности, в связи с малыми объемами банков данных в то время. В самые последние 4 годы число структур в PDB возросло на порядок, и в распоряжении исследователей имеется уже около пятнадцати тысяч структур белков и их комплексов. Справедливости ради следует упомянуть, что количество известных существенно различных белковых последовательностей и структур на порядок меньше - около полутора тысяч. А банк PDB переполнен большим количеством сходных (гомологичных) белковых цепей, имеющих и близкие третичные структуры.

В дальнейшем изложении понятия конформации и вторичной структуры будут неоднократно использоваться в одном смысловом контексте, - как подразумевающие соответствие наборов двугранных углов аминокислотных остатков некоторым областям карты Рамачандрана, в свою очередь, соответствующим основным типам вторичной структуры - а-спирали, р-слою и левой спирали типа поли-Ь-пролин-П. Указание конформации некоторого участка цепи производится нами безотносительно от его (участка) длины, и даже один аминокислотный остаток может подразумеваться как образующий а-спираль, Р-слой и левую спираль типа поли-Ь-пролин-П.

Цель и задачи исследования

Главной целью проведённой работы было изучение конформационных свойств аминокислотных остатков, составляющих полипептидные цепи белков, и использование выявленных свойств в решении задачи предсказания вторичной структуры белковых цепей.

Дополнительный интерес вызван конформационными свойствами коротких последовательностей аминокислотных остатков, - олигопептидов, - как составных частей белковых цепей. Понимание, при каких длинах набор аминокислотных остатков уже способен проявлять конформационную предпочтительность, важно для выявления физических механизмов, ответственных за формирование и поддержание структуры белка.

Полученные результаты использовались при определении и реализации нового метода предсказания вторичной структуры цепи по её аминокислотной последовательности, позволяющего в числе прочих предсказывать и структуру левой спирали типа полипролин II, составляющей значительную долю регулярных конформаций белковых цепей. Оценка частоты встречаемости структуры такого типа в пространственных структурах глобулярных белков также значилась среди целей работы.

Все проведённые исследования нашли своё отражение в представленном детальном описании работ, выполненных в рамках диссертационного проекта.

Заключение Диссертация по теме "Биофизика", Власов, Петр Константинович

Выводы

1. Часто встречающиеся (характерные) конформации остатков цепи белка.

На карте двугранных углов выделены области, характерные для различных типов вторичной структуры. В частности, принято считать основными два типа вторичной структуры: а-спирали (ср ~ -65° \|У ~ -45°) и p-структуры (ср ~ -120° х|/ ~ +110°). Но имеется и плотно заполненная область левой спирали (ср ~ -60° ~ +150°)! Нами показано, что частоты встречаемости остатков в области левой спирали и в p-структуре примерно равны. Это опровергает звучащие утверждения о несущественном наличии левоспиральной конформации в белках и демонстрирует обоснованность введения классификации конформаций по трём основным типам: а-спирали, Р-структуры, левые спирали.

2. Конформационные особенности олигопептидных фрагментов.

Для всех возможных 160000 тетрапептидов были составлены таблицы конформаций составляющих их остатков. Получены частоты появления каждого остатка (с 1-го по 4-тый) тетрапептидов в каждой из трёх основных областей конформационной карты: а-спирали, Р~ структуры и левых спиралей типа полипролин II. Для каждой из трёх основных вторичных структур сформированы списки «предпочитающих» их тетрапептидов. Впервые показано наличие тетрапептидов, предпочитающих левоспиральную конформацию.

3. Предсказание левой спирали, типа полипролин II.

Наличие данных о предпочтительных конформациях тетрапептидов позволяет создать алгоритм предсказания конформации белковой цепи по её аминокислотной последовательности. Тестирования работы этого алгоритма на белковых цепях, составляющих банк PDB-Select дало следующие результаты:

- для а-спиралей верно предсказываются ~ 70% позиций,

- для Р-структур точность ~ 65%,

- для левых спиралей точность ~ 60%.

Впервые достигнута столь высокая точность именно для левоспиральных участков цепи.

Заключение

Научная новизна

Несмотря на обширные исследования конформации полипептидных цепей в белках и конформаций боковых радикалов аминокислотных остатков, ранее не предпринимались попытки провести подобный анализ на всём многообразии представленных в публичном доступе структур белков и их комплексов. Поэтому ранее полученные данные о конформационных свойствах аминокислотных остатков, олигопептидов и целых белковых цепей зачастую отражали свойства небольшой группы белков, служивших объектом исследования. Мы впервые собрали обобщающую статистику конформаций для всех остатков, составляющих все белковые цепи из банка данных PDB, в котором воедино собрана вся информация о структурах, полученная мировым сообществом за все года исследования биополимеров.

Отсутствие методов, позволяющих успешно предсказывать участки структуры левой спирали типа полипролин II, представляло не только заметное неудобство в задачах аннотации белковых цепей, но и давало повод для спекуляций о возможной неоправданности выделения таковой конформации в отдельный класс вторичных структур глобулярных белков. Предъявляемая нами статистика встречаемости конформаций различных типов в белках, а также метод предсказания левой спирали, дающий хорошие результаты не только для неё самой, но и для других вторичных структур, позволяют со всей ответственностью заявить о левой спирали как о самостоятельном типе конформаций белковой цепи, стабилизируемым последовательностью аминокислот.

Практическое значение работы

Основными сферами практического применения полученных нами результатов представляются следующие: выявленные конформационные свойства аминокислотных остатков и олигопептидных фрагментов белковых цепей позволяют оценить вклад локальных взаимодействий в формирование структуры белка, сделать выводы о том, какие именно из таких взаимодействий играют главную роль в поддержании структуры белковой цепи, разработанный алгоритм предсказания вторичной структуры уже используется на практике, как для общей аннотации белковых цепей, так и, главным образом, для разметки участков левой спирали типа полипролин II, - наборы олигопептидных фрагментов, обладающие особенно ярко выраженной конформационной стабильностью и хорошо предсказуемыми свойствами, можно использовать в задачах практического синтеза искусственных пептидов с заданными структурными и/или функциональными характеристиками.

Библиография Диссертация по биологии, кандидата физико-математических наук, Власов, Петр Константинович, Москва

1. Finkelstein A.V., Ptitsyn О.В. A theory of protein molecule self-organization. J. Mol. Biol., 103, pp. 15-24(1976).

2. Шульц Г., Ширмер P. Принципы структурной организации белков. М.: Мир (1982).

3. Kuwajima К., Semisotnov G.V., Finkelstein A.V., Sugai S., Ptitsyn O.B. Secondary structure of globular proteins at the early and the final stages in protein folding. FEBS Lett., 334, pp. 265-268 (1993).

4. Проблема белка: T.2. Пространственное строение белка / Ред. Т.И. Соркина. М.: Наука (1996).

5. Branden C-I., Tooze J., Introduction to protein structure, Garland Publishing Inc., NY (1999).

6. Pauling L., Corey R.B. Two hydrogen-bonded spiral configurations of the polypeptide chain. J. Am. Chem. Soc., 72, p. 5349 (1950)

7. Pauling L., Corey R.B., Branson H.R. The structure of proteins: Two hydrogen-bonded helical configurations of the polypeptide chain, Proc. Natl. Acad. Sci. USA, 37, pp. 205-234 (1951).

8. Pauling L., Corey R.B. Configurations of polypeptide chains with favored orientations around single bonds: Two new pleated sheets, Proc. Natl. Acad. Sci. USA, 37, pp. 729-740 (1951).

9. Linderstrom-Lang K.U. Proteins and enzymes. Stanford (Calif.), Stanford Univ. Press, pp. 93-112(1952).

10. Metropolis N.A., Rosenbluth A.W., Rosenbluth N.M., Teller A.H., Teller E. J. Chem. Phys., 21, p. 1085 (1953).

11. Kausmann W. Adv. Protein Chem., 14, pp. 1-63 (1959)

12. Kotelchuck D., Scheraga H.A. The influence of short-range interactions on protein conformation. I. Side chain-backbone interactions within a single peptide unit. Proc. Natl. Acad. Sci. USA, 61, pp. 1163-1170 (1968).

13. Sreerama, N., Woody, R.W. PROTEINS: Structure, Function and Genetics, 36, 400-4061999)

14. Adzhubei, A.A., Eisenmenger, F., Tumanyan, V.G., Zinke, M., Brodzinski, S., Esipova, N.G. J. Biomol. Struct. And Dynamics, 5, 689-704 (1987)

15. Adzhubei, A.A., Eisenmenger, F., Esipova, N.G., Lobachov, V.M., Makarov, A.A., Tumanyan, Y.G. Biophysical Journal, 59, 614a (1991)

16. Adzhubei, A.A., Sternberg, M.J. J. Mol. Biol., 229, 472-493 (1993)

17. Adzhubei, A.A., Sternberg, MJ. Protein Sci., 3,2395-2410 (1994)

18. Blanch E.W., Morozova-Roche L.A., Cochran D.A.E., Doig A.J., Hecht L., Barron L.D.2000) J. Mol. Biol., 301, 553-563.

19. Srinivasan, M., Wardrop, R.M., Gienapp, I.E., Stuckman, S.S., Whitaacre, C.C., Kaumaya, P.T. J. Immunol., 167, 578-585, (2001)

20. Kelly, M.A., Chellgren, B.W., Rucker, A.L., Troutman, J.M., Fried, M.G., Miller, A.-F., Creamer, T.P. Biochemistry, 40, 14376-14383, (2001)

21. Poon, Chi-Duen, Samulski, E.T. (2000) J. Am. Chem. Soc., 122, 5642-5643.

22. Rucker, A.L., Creamer, T.P. (2002) Protein Science, 11, 980-985.

23. Stapley, B.J., Creamer, T.P. (1999) Protein Sci., 8, 587-595.

24. Бажулина, Н.П., Королев, C.B., Морозов, Н.Ю., Рогуленкова, В.Н., Есипова, Н.Г. (1994) Биофизика, 39, 746-748.

25. Власов, П.К., Килосанидзе, Г.Т., Украинский, Д.Л., Кузьмин, А.В., Туманян, В.Г., Есипова, Н.Г. (2001) Биофизика, 46, 573-576.

26. Ghose, R., Shekhtman, A., Goger, M.J, Ji, H, Cowburn, D. (2001) Nat. Struct. Biol., 8, 9981004.

27. Gill, A.C., Ritchie, M.A., Hunt, L.G., Steane, S.E, Davies, K.G. Bocking, S.P., Rhie, A.G.O., Bennett, A.D, Hope, J. (2000) The EMBO Journal, 19, 5324-5331.

28. Lazarev, Yu.A., Lobachov, V.M, Grishkovski, B.A, Shibnev, V.A, Grechishko, V.S., Finogenova, M.P., Esipova, N.G., Rogulenkova, V.N. (1978) Biopolymers, 17, 1215-1234.

29. Есипова, Н.Г., Лобачев, B.M., Рогуленкова, B.H., Макаров, А.А., Шибнев, В.А., Финогенова, М.П. (1984) Молекулярная биология, 18, 725-735.

30. Makarov А.А., Esipova N.G., Pankov Yu.A., Lobachov V.M, Grishkovsky B.A. BBRS, 1975,67, 1378-1383.

31. Макаров А.А., Есипова Н.Г., Панков Ю.А., Лобачев В.М., Гришковский Б.А. Биофизика, 1976,21,233-237.

32. Макаров А.А., Есипова Н.Г., Панков Ю.А., Гришковский Б.А., Лобачев В.М., Сухомудренко А.Г. Молекулярная биология, 1976, 10, 704-712.

33. Макаров А.А., Есипова Н.Г., Панков Ю.А., Лобачев В.М. Биофизика, 1976, 21, 754755.

34. Есипова Н.Г., Рамм Е.И., Лобачев В.М., Воробьев В.И. Биофизика, 1976, 21, 582-584.

35. Рамм Е.И., Корякина Н.И., Писаченко А.И., Лобачев В.М., Есипова Н.Г., Буриченко В .К., Воробьев В .И., Лазарев Ю.А. Биофизика, 1977, 22, 32-37.

36. Макаров А.А., Лобачев В.М., Панков Ю.А., Есипова Н.Г. Биофизика, 1981, 26, 941952.

37. Makarov А.А., Esipova N.G., Lobachov Y.M., Grishkovsky B.A., Pankov Yu.A. Biopolymers, 1984, 23, 5-22.

38. Лобачев B.M., Макаров A.A., Аджубей И.А., Есипова Н.Г. Биофизика, 1992, 37, 861867.

39. Makarov А.А., Lobachov Y.M., Adzhubei I.A., Esipova N.G. FEBS LETTERS, 1992, 306, 63-65.

40. Аванов, А.Я. Липкинд, Г.М., Кочетков, H.K. (1982) Биоорганическая химия, 8, 616620.

41. Lim V.I. Algorithms for prediction of alpha-helical and beta-structural regions in globular proteins J. Mol. Biol., 88, pp. 873-894 (1974).

42. Chou P.Y., Fasman G.D. Prediction of protein conformation. Biochemistry, 13, pp. 222-245 (1974).

43. Beghin F., Dirkx J. Proceedings: A simple statistical method to predict protein conformations Arch. Intern. Physiol. Biochim., 83, pp. 167-168 (1975).

44. Matthews B.W. Comparison of the predicted and observed secondary structure of T4 phage lysozyme. Biochim Biophys. Acta, 405, pp. 442-451 (1975).

45. Gamier J., Osguthorpe D.J., Robson B. Analysis of the accuracy and implications of simple methods for predicting the secondary structure of globular proteins. J. Mol. Biol., 120, pp. 97-120(1978).

46. Lewis P.N., Scheraga H.A. Predictions of structural homologies in cytochrome с proteins. Arch. Biochem. Biophys. 1971, 144, pp. 576-583.

47. Kabat E.A., Wu T.T. Further comparison of predicted and experimentally determined structure of adenylate kinase. Proc. Natl. Acad. Sci. USA, 71, pp. 4217-4220 (1974).

48. Kabsch W., Sander Ch. Dictionary of protein secondary structure: pattern recognition of hydrogen-bonded and geometrical features. Biopolymers, 22, pp. 2577-2637 (1983).

49. Kabsch W., Sander Ch. On the use of sequence homologies to predict protein structure: identical pentapeptides can have completely different conformations. Proc. Natl. Acad. Sci. USA, 81, pp. 1075-1078 (1984).

50. Garratt R.C., Taylor W.R., Thornton J.M. The influence of tertiary structure on secondary structure prediction; Accessibility versus predictability for (3-structure. FEBS Lett., 188, pp. 59-62 (1985).

51. Deleage G., Roux B. An algorithm for protein secondary structure prediction based on class prediction. Protein Eng., 1, pp. 289-294 (1987).

52. Frishman D., Argos P. Seventy-five percent accuracy in protein secondary structure prediction. Proteins, 27, pp. 329-335 (1997).

53. Gromiha M.M., Selvaraj S. Protein secondary structure prediction in different structural classes. Protein Eng., 11, pp. 249-251 (1998).

54. Ptitsyn O.B., Finkelstein А.У. Theory of protein secondary structure and algorithm of its prediction. Biopolymers, 22, pp. 15-25 (1983).

55. Scheraga H.A. Effect of side chain-backbone electrostatic interactions on the stability of alpha-helices. Proc. Natl. Acad. Sci. USA, 82, pp. 5585-5587 (1985).

56. Ptitsyn, O.B., Finkelstein, A.V. Prediction of protein secondary structure based on physical theory. Histones. Protein Eng., 2, pp. 443-447 (1989).

57. Swindells M.B., MacArthur M.W, Thornton J.M. Intrinsic phi, psi propensities of amino acids, derived from the coil regions of known structures. Nat. Struct. Biol., 2, pp. 596-603 (1995).

58. Gromiha M.M., Ponnuswamy P.K. Prediction of protein secondary structures from their hydrophobic characteristics. Int. J. Pept. Protein Res., 45, pp. 225-240 (1995).

59. Gibrat J.F., Gamier J., Robson B. Further developments of protein secondary structure prediction using information theory. New parameters and consideration of residue pairs. J. Mol. Biol., 198, pp. 425-443 (1987).

60. Needleman S.B., Wunsch C.D. A general method applicable to the search for similarities in the amino acid sequence of two proteins. J. Mol. Biol., 48, pp. 443-453 (1970).

61. Zvelebil M.J., Barton G.J., Taylor W.R., Sternberg M.J.E. Prediction of protein secondary structure and active sites using alignment of homologous sequences, J. Mol. Biol., 195, pp. 957-961 (1987).

62. Barton G.J., Sternberg M.J.E. Evaluation and improvements in the automatic alignment of protein sequences. Protein Eng., 1, pp. 89-94 (1987).

63. Rost B. Twilight zone of protein sequence alignments. Protein Eng. 12, pp. 85-94 (1999)

64. Barton G.J., Sternberg M.J. A strategy for the rapid multiple alignment of protein sequences. Confidence levels from tertiary structure comparisons. J. Mol. Biol., 198, pp. 327-337 (1987).

65. Levin J.M., Pascarella S., Argos P., Gamier J. Quantification of secondary structure prediction improvement using multiple alignments. Protein Eng., 6, pp. 849-854 (1993).

66. Salamov A.A., Soloveyev V.V. Prediction of protein secondary structure by combining nearest-neighbor algorithms and multiple sequence alignments. J. Mol. Biol., 247, pp. 11-15 (1995).

67. Geourjon C., Deleage G. SOPMA: significant improvements in protein secondary structure prediction by consensus prediction from multiple alignments. Comput. Appl. Biosci., 11, pp. 681-684 (1995).

68. Cuff J.A., Barton G. Evaluation and improvement of multiple sequence methods for protein secondary structure prediction. Proteins, 34, pp. 508-519 (1999).

69. Rost В., Sander C. Improved prediction of protein secondary structure by use of sequence profiles and neural networks. Proc. Natl. Acad. Sci. USA., 90, pp. 7558-7562 (1993).

70. Rost В., Sander C. Combining evolutionary information and neural networks to predict protein secondary structure. Proteins., 19, pp. 55-72 (1994).

71. Jones D.T. Protein secondary structure prediction based on position-specific scoring matrices. J. Mol. Biol., 292, pp. 195-202 (1999).

72. Pollastri G., Przybylski D., Rost В., Baldi P. Improving the prediction of protein secondary structure in three and eight classes using recurrent neural networks and profiles. Proteins, 47, pp. 228-235 (2002).

73. Lacroix E., Viguera A.R., Serrano L. Elucidating the folding problem of alpha-helices: local motifs, long-range electrostatics, ionic-strength dependence and prediction of NMR parameters. J. Mol. Biol., 284, pp. 173-191 (1998).

74. Cuff J.A., Clamp M.E., Siddiqui A.S., Finlay M., Barton G.J. Bioinformatics, 14, pp. 892893 (1998).

75. Wolf E., Kim P.S., Berger В., Protein Sci.,6, pp. 1179- 1189 (1997).

76. Rost B. Methods Enzymol., 266, pp. 525-539 (1996).

77. Wako H., Blundell T.L. Use of amino acid environment-dependent substitution tables and conformational propensities in structure prediction from aligned sequences of homologous proteins. J. Mol. Biol, 238, pp. 682-708 (1994).

78. Rost В., Sander C. Prediction of protein secondary structure at better than 70% accuracy. J. Mol. Biol, 232, pp. 584-599 (1993).

79. Sreerama, N. Woody, R.W. Biochemistry, 33, 10022-10025 (1994).

80. Gamier J., Gibrat J.F., Robson B. GOR method for predicting protein secondary structure from amino acid sequence. Methods Enzymol., 266, pp. 540-553 (1996).

81. McCammon J.A., Wolynes P.G., Karplus M. Picosecond dynamics of tyrosine side chains in proteins. Biochemistry, 18, pp. 927-942 (1979).

82. Nemethy M.S., Pottle M.S., ScheragaH.A. Energy Parameters in Polypeptides. IX. Updating of Geometric Parameters, Nonbonded Interactions and Hydrogen Bond Interactions for the Naturally Occurring Amino Acids. J. Phys. Chem., 87, pp. 1833-1851 (1983).

83. Eisenberg D., McLachlan A.D. Solvation energy in protein folding and binding. Nature, 319, pp. 199-203 (1986).

84. Li Z., Sheraga H.A. Monte Carlo-minimization approach to the multiple-minima problem in protein folding. Proc. Natl. Acad. Sci. USA, 84, pp. 6611- 6615 (1987).

85. Pickersgill R.W. A rapid method of calculating charge-charge interaction energies in proteins. Protein Eng., 2, pp. 247-248 (1988).

86. Abagyan, R., Totrov, M. and Kuznetsov, D. ICM a new method for protein modeling and design: applications to docking and structure prediction from the distorted native conformation. J. Сотр. Chem., 15, pp. 488-506 (1994).

87. Honig B. Protein folding: from the Levinthal paradox to structure prediction. J. Mol. Biol., 293, pp. 283-293 (1999).

88. Abagyan R.A., Totrov M. Ab Initio Folding of Peptides by the Optimal-Bias Monte Carlo Minimization Procedure. J. Comp.Phys., 151, pp. 402-421 (1999).

89. Wang Z.X. Assessing the accuracy of protein secondary structure. Nat. Struct. Biol., 1, pp. 145-146 (1994).

90. King R.D, Sternberg M.J.E. Identification and application of the concepts important for accurate and reliable protein secondary structure prediction. Protein Sci., 5, pp. 2298-2310 (1996).

91. Mazur A.K, Abagyan R.A. New methodology for computer-aided modelling of biomolecular structure and dynamics. J. Biomol. Struct. Dyn., 6, pp. 815-845 (1989).

92. Kilosanidze GT, Kutsenko AS, Esipova NG, Tumanyan VG. Use of molecular mechanics for secondary structure prediction. Is it possible to reveal alpha-helix? FEBS Lett. 2002, 2; 510(l-2):13-6.

93. Siermala, Juhola and Yihinen, On preprocessing of protein sequences for neural network prediction of polyproline type II secondary structures. Computers in Biology and Medicine, 31,385-398 (2001)

94. Rost В., Sander C., Schneider R. Redefining the goals of protein secondary structure prediction. J. Mol. Biol., 235, pp. 13-26 (1994).

95. Baldi P, Brunak S, Chauvin Y., Andersen C.A.F, Nielsen H. Assessing the accuracy of prediction algorithms for classification: an overview. Bioinformatics, 16, pp. 412-424 (2000).

96. King R.D., Ouali M, Strong A.T, Aly A., Elmaghraby A, Kantardzic M, Page D. Is it better to combine predictions? Protein Eng., 13, pp. 15-19 (2000).

97. Rost, B, Sander, C. Third generation prediction of secondary structure, in Webster, D. (Ed.), Protein Structure Prediction: Methods and Protocols, pp. 71-95, Humana Press, Clifton, NJ. (2000).

98. Rost B. Review: Protein Secondary Structure Prediction Continues to Rise. J. Struct. Biol., 134, pp. 204-218 (2001).

99. Bonneau R, Baker D. Ab initio protein structure prediction: progress and prospects. Annu. Rev. Biophys. Biomol. Struct., 30, pp. 173-189 (2001).

100. Zhang C-T, Zhang R. A Refined Accuracy Index to Evaluate Algorithms of Protein Secondary Structure Prediction. Proteins, 43, pp. 520-522 (2001).

101. Weissig H., Bourne P. E. Protein structure resources Acta Cryst., D58, pp. 908-915 (2002).

102. Laskowski R. A. PDBsum: summaries and analyses of PDB structures. Nucleic Acids Res., 29, pp. 221-222 (2001).