Бесплатный автореферат и диссертация по биологии на тему
Компьютерное предсказание регуляторных сайтов в полных геномах
ВАК РФ 03.00.02, Биофизика
Содержание диссертации, кандидата физико-математических наук, Витрещак, Алексей Геннадьевич
Общая характеристика проблемы.1-.
ГЛАВА I. Введение.3
I. Предсказание вторичной структуры РНК характеристика проблемы и сущестувющие подходы).3
II. Механизмы регуляции экспрессии генов, в которых участвует вторичная структура мРНК.12
ГЛАВА 2. Описание программы поиска вторичной структуры РНК по паттерну.27
ГЛАВА 3. Предсказание регуляции рибосомальных белков.36
ГЛАВА 4. Построение аттенюаторов транскрипции аминокислотных биосинтетических оперонов.44
ГЛАВА 5. Анализ регуляции синтеза рибофлавина (RFN элемент).
Модель регуляции.51
ГЛАВА 6. Предсказание регуляции экспрессии генов метаболизма аминокислот.70
Грам-положительных бактерий (Т-box сигналы).
Выводы.
Введение Диссертация по биологии, на тему "Компьютерное предсказание регуляторных сайтов в полных геномах"
Актуальность темы. Предсказание регуляции экспрессии генов является важным разделом компьютерной генетики. Актуальность этой темы обусловлена значительным ростом количества расшифрованных геномов и отставанием экспериментальной науки от темпов секвенирования. В настоящее время доступно более 50 полных геномов бактерий и несколько сотен геномов секвенируются в различных центрах и станут доступными в ближайшем будущем. Методы сравнительной геномики позволяют предсказывать оперонную структуру и механизмы регуляции экспрессии генов в этих геномах. Результаты последних лет показывают, что большую роль в регуляции экспрессии генов играет вторичная структура РНК и поэтому актуально предсказание такого рода регуляции в разных функциональных системах для широкого ряда бактерий. Особенной актуальностью обладает предсказание регуляции генов с неизвестной функцией. Информация, полученная методами сравнительной геномики, важна как сама по себе, так и для планирования экспериментов.
Цель работы. Предсказание регуляции экспрессии генов, обусловленной вторичной структурой РНК, у ряда бактерий на основании сравнительного анализа. Предсказание и анализ регуляции у экспериментально неизученных бактерий.
Научная новизна и практическая значимость. Разработана программа поиска вторичной структуры РНК по паттерну, который строится с использованием выборки экспериментально известных вторичных структур РНК, выполняющих регуляторную функцию. Рассматривались различные системы, в которых вторичная структура РНК играет регуляторную роль. Было проведено предсказание сайтов регуляции и анализ оперонной структуры генов для большого числа секвенированных геномов. Задача массового предсказания регуляторных систем, в которых регуляция осуществляется вторичной структурой РНК, актуальна для экспериментальной науки. В этой связи, для целого ряда бактерий были предсказаны регуляторные системы (Т-box регулон, рибофлавиновый регулон, аттенюаторы транскрипции аминокислотных биосинтетических оперонов, регуляторные структуры РНК рибосомальных белков). Кроме того, те же системы были расширены за счет новых генов, у которых находились регуляторные сайты в уже изученных экспериментально геномах. Найденные регуляторные сайты перед генами с неизвестной функцией представляли особый интерес. В этой связи интересна система (Т-box), в которой на основе анализа вторичной структуры РНК предсказывается не только регуляторный механизм экспрессии потенциальных аминокислотных транспортеров с неизвестной функцией, но и специфичность этих транспортеров по аминокислоте.
Особый интерес представляет система синтеза и транспорта рибофлавина, регулируемая RFN-элементом. В данной работе было не только проведено предсказание регуляции у большого ряда бактерий, но и предложен регуляторный механизм. Кроме того, у некоторых бактерий были найдены новые транспортеры, находящиеся под рибофлавиновой регуляцией.
Всё выше сказанное составляет практическую значимость работы и является поводом для экспериментальной проверки.
Апробация работы. Результаты работы представлялись на Московском семинаре по компьтерной генетике (2001), на межлабораторных семинарах ИППИ РАН и ГосНИИГенетика (1998-2001 гг.), на международных конференциях "Artifical Intelligence and Heuristic Methods for Bioinformatics" (Сан Миниато, Италия, 2001), "Meeting of HHMI International Research Scholars" (Ванкувер, Канада, 2001), на 1-й и 2-й международных конференциях "Bioinformatics of Genome Regulation and
Structure" (Новосибирск, 1998 и 2000), на 1-й, 2-й и 3-й международных конференциях "Проблемы управления и моделирования в сложных системах" (Самара 1999, 2000, 2001), на международной школе "Teoretical biophysics" (Москва, 1998), на школе-конференции "Горизонты физико-химической биологии" (Пущино, 2000).
Объём и структуры диссертации. Диссертация изложена на 101 странице машинописного текста и состоит из введения и 5 глав. Введение содержит общий обзор литературы. В каждой главе содержится обзор известных экспериментальных данных, а затем описываются и обсуждаются оригинальные результаты.
Заключение Диссертация по теме "Биофизика", Витрещак, Алексей Геннадьевич
выводы
1. Разработана компьютерная программа поиска вторичной структуры РНК по паттерну.
2. Предложены регуляторные сайты в Haemophilus influenzae перед генами, кодирующими рибосомальные белки.
3. Построены аттенюаторы транскрипции для ароматических биосинтетических аминокислотных оперонов у-протеобактерий.
4. Предсказана регуляция генов рибофлавинового синтеза и транспорта у большого числа бактерий. Впервые показана регуляция гена ribH2 у а-протеобактерий и нескольких Pseodomonas spp. Найдены новые возможные транспортеры флавинов, impX (.Desulfitobacterium halfniense и Fusobacterium nucleatum) и pnuX (актинобактерии). Предложен новый механизм регуляции рибофлавиновых генов, в котором RFN-элемент участвует как в регуляции транскрипции, так и в регуляции трансляции.
5. Предсказаны регуляторные вторичные структуры мРНК (Т-Ьох сигналы) перед генами, кодирующими аминоацил-тРНК синтетазы и ферменты биосинтеза аминокислот в Грам-положительных бактериях. Семейство регулируемых Т-box сигналами генов было значительно расширено за счет предсказания регуляции у новых генов. Кроме того, предсказана специфичность по аминокислоте у ряда транспортеров с неизвестной функцией. На примере Т-Ьох сигналов показано пересечение предсказываемой регуляции с другими известными механизмами регуляции. Кроме того, на примере Т-Ьох сигналов показаны оперонные перестройки в различных бактериях при сохранении регуляции, осуществляемой вторичной структурой РНК.
СПИСОК РАБОТ, ОПУБЛИКОВАННЫХ ПО ТЕМЕ ДИССЕРТАЦИИ
1. Витрещак, А.Г., Бансал, А.К., Титов И.И., Гельфанд, М.С. Компьютерный анализ регуляторных сигналов в полных бактериальных геномах. Инициация трасляции оперонов рибосомальных белков. Биофизика. 1999. Т. 44. С. 601-610.
2. Витрещак, А.Г., Гельфанд, М.С. Компьютерный анализ регуляторных сигналов в бактериальных геномах. Аттенюаторы оперонов метаболизма ароматических аминокислот. Молекулярная биология. 2000. Т. 34. С. 545552.
3. Panina, Е.М., Vitreschak, A.G., Mironov, А.А., and Gelfand, M.S. Regulation of Aromatic Amino Acid Biosynthesis in Gamma-Proteobacteria. J. Mol. Microbiol. Biotechnol. 2001. V. 3. P. 529-543.
4. Vitreschak AG, Rodionov DA, Mironov AA, Gelfand MS. Regulation of riboflavin biosynthesis and transport genes in bacteria by transcriptional and translational attenuation. Nucleic Acids Research. 2002. V. 30(14) P. 3141-51.
5. Витрещак, А.Г., Миронов, A.A., Гельфанд, М.С. Компьютерное предсказание вторичной структуры РНК. Программа RNApattern, поиск вторичной структуры по образцу. В материалах 3-й международной конференции "Проблемы управления и моделирования в сложных системах", Самара, 2001, стр. 623-625.
6. Vitreschak, A.A. Computer analysis of regulation of genes, encoding aminoacyl-tRNA synthetases and amino acid biosynthetic proteins in Gram positive bacteria: Т-box RNA regulatory element. Prediction of regulation of new genes, including amino acid transporters. In the abstracts of International School "Artifical Intelligence and Heuristic Methods for Bioinformatics", Italy, San-Miniato, October 1-11, 2001, P. 63.
7. Panina E.,Vitreschak, A., Mironov A, Gelfand M. Bioinformatics approach to analysis of regulation of aromatic amino acids biosynthesis in Bacillus/Clostridium group. In the proceedings of the third International Conference on Bioinformatics of Genome Regulation and Structure, Novosibirsk, July 14-20, 2002. V. 2. P. 32-35.
8. Vitreschak, A.G., Rodionov D.A., Mironov A.A., Gelfand M.S. Regulation of bacterial riboflavin genes by a conserved RNA structural element. In the proceedings of the third International Conference on Bioinformatics of Genome Regulation and Structure, Novosibirsk, July 14-20, 2002. V. 2. P. 44-46.
9. Gelfand, M.S., Laikova, O., Mironov, A.A., Novichkov, P.S., Panina, E.M., Rodionov D.A., Vitreschak, A.G. Comparative analysis of bacterial patterns. In the abstracts of Meeting of HHMI International Research Scholars. Vancouver, Canada, June 20-23, 2001, P. 75.
10. Vitreschak, A.G., Bansal, A.K., Gelfand, M.S. Comparative approach to analysis of regulation in complete genomes: attenuators of aromatic amino acid operons of gamma-proteobacteria. In the proceedings of the first International Conference on Bioinformatics of Genome Regulation and Structure, Novosibirsk, August 7-11, 2000. V. 2. P. 55-56.
П.Витрещак, А.Г., Гельфанд, M.C. Сравнительный подход к анализу регуляции в полных геномах: аттенюаторы ароматических аминокислотных оперонов гамма-протеобактерий. В материалах школы-конференции "Горизонты физико-химической биологии", Пущино, Май, 2000, С. 231.
12. Vitreschak, А.А, Gelfand, M.S. Comparative approach of regulation in complete genomes: attenuators of aromatic amino acid operons of gamma-proteobacteria. В материалах 2-й международной конференции "Проблемы управления и моделирования в сложных системах", Самара, июнь, 2000, С. 141-142.
13. Gelfand, M.S., Vitreschak, A.G., Mironov, А.А. Information interactions and regulatory patterns in bacterial genomes. В материалах 1-й международной конференции "Проблемы управления и моделирования в сложных системах", Самара, июнь, 1999, С. 101-105.
14. Vitreschak, A.G., Bansal, А.К., Gelfand, M.S. Conserved RNA structures regulate initiation of translation of Escherichia coli and Haemophilus influenzae ribosomal protein operons. In the proceedings of the first International Conference on Bioinformatics of Genome Regulation and Structure, Novosibirsk, August 24-31,1998. V. 1. P. 229.
15. Vitreschak, A.G., Gelfand, M.S. Conserved RNA structures regulation initiation of translation of Escherichia coli and Haemophilus influenzae ribosomal protein operons. In the abstracts of Theoretical biophysics international school, Moscow, June 15-20, 1998. P. 105.
Библиография Диссертация по биологии, кандидата физико-математических наук, Витрещак, Алексей Геннадьевич, Москва
1. Asano К, Mizobuchi К.Сору number control of Inclalpha plasmid ColIb-P9 by competition between pseudoknot formation and antisense RNA binding at a specific RNA site. EMBO J. 1998 Sep 1;17(17):5201-13.
2. Athanasopoulos V, Praszkier J, Pittard AJ.Analysis of elements involved in pseudoknot-dependent expression and regulation of the repA gene of an IncL/M plasmid. J Bacteriol. 1999 Mar;181(6):1811-9.
3. Babitzke P, Gollnick P. Posttranscription initiation control of tryptophan metabolism in Bacillus subtilis by the trp RNA-binding attenuation protein (TRAP), anti-TRAP, and RNA structure. J Bacteriol. 2001 0ct;183(20):5795-802. Review.
4. Billoud B, Kontic M, Viari A. Palingol: a declarative programming language to describe nucleic acids' secondary structures and to scan sequence database. Nucleic Acids Res. 1996 Apr 15 ;24(8): 1395-403
5. Cerretti DP, Mattheakis LC, Kearney KR, Vu L, Nomura M. Translational regulation of the spc operon in Escherichia coli. Identification and structural analysis of the target site for S8 repressor protein. J Mol Biol. 1988 Nov 20;204(2):309-29.
6. Chamberlin M., Baldwin RL, Berg P. An enzymically synthesed RNA of alternating base sequence: physical and chemical characterization. J. Mol. Biol. 1963; 7(4):334-349.
7. Chopin A, Biaudet V, Ehrlich SD. Analysis of the Bacillus subtilis genome sequence reveals nine new Т-box leaders. Mol Microbiol. 1998 Jul;29(2):662-4.
8. Comay E, Nussinov R, Comay O. An accelerated algorithm for calculating the secondary structure of single stranded RNAs. Nucleic Acids Res. 1984 Jan 11 ;12(1 Pt l):53-66.
9. DeHoff BS, Lee JK, Donohue TJ, Gumport RI, Kaplan S. In vivo analysis of puf operon expression in Rhodobacter sphaeroides after deletion of a putative intercistronic transcription terminator. J Bacteriol. 1988 Oct; 170(10):4681-92.
10. Delorme C, Ehrlich SD, Renault P. Regulation of expression of the Lactococcus lactis histidine operon. J Bacteriol. 1999 Apr;181(7):2026-37.
11. Du H, Yakhnin AV, Dharmaraj S, Babitzke P. trp RNA-binding attenuation protein-5' stem-loop RNA interaction is required for proper transcription attenuation control of the Bacillus subtilis trpEDCFBA operon .J Bacteriol. 2000 Apr;182(7):1819-27.
12. Elliott MB, Gottlieb PA, Gollnick P. The mechanism of RNA binding to TRAP: initiation and cooperative interactions. RNA. 2001 Jan;7(l):85-93.
13. Freier SM, Kierzek R, Jaeger JA, Sugimoto N, Caruthers MH, Neilson T, Turner DH. Improved free-energy parameters for predictions of RNA duplex stability. Proc Natl Acad Sci USA. 1986 Dec;83(24):9373-7.
14. Friden P, Newman T, Freundlich M. Nucleotide sequence of the ilvB promoter-regulatory region: a biosynthetic operon controlled by attenuation and cyclic AMP. Proc Natl Acad Sci USA. 1982 0ct;79(20):6156-60.
15. Gardner JF. Regulation of the threonine operon: tandem threonine and isoleucine codons in the control region and translational control of transcription termination. Proc Natl Acad Sci U S A. 1979 Apr;76(4):1706-10.
16. Gelfand MS, Mironov AA, Jomantas J, Kozlov YI, Perumov DA. () A conserved RNA structure element involved in the regulation of bacterial riboflavin synthesis genes. Trends Genet. 1999 15: 439-42.
17. Gelfand MS. Recognition of regulatory sites by genomic comparison. Res Microbiol. 1999 Nov-Dec;150(9-10):755-71. Review.
18. Gendron N, Putzer H, Grunberg-Manago M. Expression of both Bacillus subtilis threonyl-tRNAsynthetase genes is autogenously regulated. JBacteriol. 1994 Jan;176(2):486-94.
19. Gish K, Yanofsky C. Evidence suggesting cis action by the TnaC leader peptide in regulatingtranscription attenuation in the tryptophanase operon of Escherichia coli. J Bacteriol. 19951. Dec;177(24):7245-54.
20. Grandoni JA, Zahler SA, Calvo JM. Transcriptional regulation of the ilv-leu operon of Bacillus subtilis. J Bacteriol. 1992 May; 174( 10):3212-9.
21. Gregory RJ, Cahill PB, Thurlow DL, Zimmermann RA. Interaction of Escherichia coli ribosomal protein S8 with its binding sites in ribosomal RNA and messenger RNA. J Mol Biol. 1988 Nov 20;204(2):295-307.
22. Grundy FJ, Henkin TM. The S box regulon: a new global transcription termination control system for methionine and cysteine biosynthesis genes in gram-positive bacteria. Mol Microbiol. 1998 Nov;30(4):737-49.
23. Gultyaev AP, van Batenburg FH, Pleij CW.The computer simulation of RNA folding pathways using a genetic algorithm. J Mol Biol. 1995 Jun 30;250(1):37-51.
24. Henkin TM, Glass BL, Grundy FJ. Analysis of the Bacillus subtilis tyrS gene: conservation of a regulatory sequence in multiple tRNA synthetase genes. J Bacteriol. 1992 Feb;174(4):1299-306.
25. Jacobson AB, Zuker M. Structural analysis by energy dot plot of a large mRNA. J Mol Biol. 1993 Sep 20;233(2):261-9.
26. Jaeger JA, Turner DH, Zuker M. Improved predictions of secondary structures for RNA. Proc Natl AcadSci USA. 1989 0ct;86(20):7706-10.
27. Jaeger JA, Turner DH, Zuker M. Predicting optimal and suboptimal secondary structure for RNA. Methods Enzymol. 1990;183:281-306.
28. Jordan BR Computer generation of pairing schemes for RNA molecules. J Theor Biol. 1972 Feb;34(2):363-78.
29. Keener J and Nomura M // Escherichia coli and Salmonella. Cellular and Molecular Biology /
30. Neidhardt, F.C., Ed., Washington DC: ASM Press, 1996. V. l.Ch. 90. P.1417-1431.
31. Keller EB, Calvo JM. Alternative secondary structures of leader RNAs and the regulation of the trp,phe, his, thr, and leu operons. Proc Natl Acad Sci USA. 1979 Dec;76(12):6186-90.
32. Kolla V, Chakravorty M, Pandey B, Srinivasula SM, Mukherjee A, Litwack G. Synthesis of abacteriophage MB78 late protein by novel ribosomal frameshifting. Gene. 2000 Aug 22;254(12.:209-17.
33. Kolter R, Yanofsky C. Attenuation in amino acid biosynthetic operons. Annu Rev Genet. 1982;16:113-34. Review.
34. Blanc H, Lang AS, Beatty JT. Transcript cleavage, attenuation, and an internal promoter in the
35. Makarova KS, Mironov AA, Gelfand MS. Conservation of the binding site for the arginine repressor in all bacterial lineages. Genome Biol. 2001;2(4):RESEARCH0013.
36. Malmgren C, Engdahl HM, Romby P, Wagner EG. An antisense/target RNA duplex or a strong intramolecular RNA structure 5' of a translation initiation signal blocks ribosome binding: the case of plasmid Rl. RNA. 1996 0ct;2(10): 1022-32.
37. Mansilla MC, Albanesi D, de Mendoza D. Transcriptional control of the sulfur-regulated cysH operon, containing genes involved in L-cysteine biosynthesis in Bacillus subtilis. J Bacteriol. 2000 Oct;182(20):5885-92.
38. Michiels PJ, Versleijen AA, Verlaan PW, Pleij CW, Hilbers CW, Heus HA. Solution structure of the pseudoknot of SRV-1 RNA, involved in ribosomal frameshifting. J Mol Biol. 2001 Jul 27;310(5): 1109-23.
39. Miranda-Rios J, Navarro M, Soberon M A conserved RNA structure (thi box) is involved in regulation of thiamin biosynthetic gene expression in bacteria. Proc Natl Acad Sci USA. 2001 Aug 14;98(17):9736-41.
40. Mironov A, Kister A. RNA secondary structure formation during transcription. J Biomol Struct Dyn. 1986 Aug;4(l):l-9.
41. Mironov AA, Kister AE. A theoretical analysis of structural restructuring during formation ofsecondary RNA structures. Mol Biol (Mosk). 1989 Jan-Feb;23(l):61-72. Russian.
42. Mironov AA, Koonin EV, Roytberg MA, Gelfand MS. Computer analysis of transcription regulatorypatterns in completely sequenced bacterial genomes. Nucleic Acids Res. 1999 Jul 15;27(14):2981-9.
43. Moffat JG, Tate WP, Lovett PS. The leader peptides of attenuation-regulated chloramphenicolresistance genes inhibit translational termination. J Bacteriol. 1994 Nov;176(22):7115-7.
44. Muto Y, Oubridge C, Nagai K. RNA-binding proteins: TRAPping RNA bases. Curr Biol. 2000 10:19.21.
45. Nargang FE, Subrahmanyam CS, Umbarger HE. Nucleotide sequence of ilvGEDA operon attenuator region of Escherichia coli. J Immunol. 1980 Jun;124(6):2738-46.
46. Nussinov R, Jacobson AB. Fast algorithm for predicting the secondary structure of single-stranded RNA. Proc Natl Acad Sci USA. 1980 Nov;77(l 1):6903-13.
47. Perkins, J. В., and J. G. Pero. 2001. Vitamin biosynthesis, p. 279-293. In A. L. Sonenshein, J. A. Hoch, and R. Losick (ed.), Bacillus subtilis and its relatives: from genes to cells. American Society for Microbiology, Washington, D.C.
- Витрещак, Алексей Геннадьевич
- кандидата физико-математических наук
- Москва, 2002
- ВАК 03.00.02
- Применение методов сравнительной геномики к анализу геномов прокариот и эукариот
- Исследование механизмов регуляции транскрипции и сплайсинга с использованием вычислительных методов анализа последовательностей ДНК и РНК
- Компьютерный контекстный анализ последовательностей ДНК мобильных генетических элементов
- Анализ нуклеотидных последовательностей геномов ВИЧ-1, выделенных в России
- Анализ регуляторных геномных последовательностей с помощью компьютерных методов оценок сложности генетических текстов