Бесплатный автореферат и диссертация по биологии на тему
Формальные языки для представления биохимических процессов
ВАК РФ 03.00.04, Биохимия

Автореферат диссертации по теме "Формальные языки для представления биохимических процессов"

На пртюиршописи

Тарасов Денис Станиславович 0030Бв584

Формальные языки для представления биохимических процессов

03.00.04 Биохимия 05.13.18 - Математическое моделирование, вычислительные методы и комплексы программ

Автореферат ■диссертации на соискание ученой степени кандидата биологических наук

Казань, 2007

003068584

Работа выполнена на кафедре генетики ГОУ ВПО '"Казанский государственный университет им В.И. Ульянова-Ленина», г. Казань.

Научный руководитель:

кандидат биологических наук Акберова Наталья Иванована

Официальные оппоненты:

доктор биологических наук Чернова Ольга Александровна

доктор технических наук Латыпов Рустам Хафизович

Ведущая организация:

Институт биологии гена РАН, г. Москва

Защита состоится 26 апреля 2007 г. в 13 ч 00 мин. на заседании диссертационного совета Д. 212.081.08 при Казанском государственном университете по адресу г. Казань Кремлевская 18

С диссертацией можно ознакомиться в Научной библиотеке им. Н.И. Лобачевского Казанского государственного университета

Автореферат разослан марта 2007 года

Ученый секретарь диссертационного совета, доктор биологических наук

З.И. Абрамова

Актуальность темы

В настоящий момент существует тенденция к расширению использования формальных языков для представления биологических знаний разного рода (исходных экспериментальных данных, гипотез, теорий). Другими словами имеет место процесс кодификации знаний -перевода информации в форму, пригодную для компьютерной обработки. Эта тенденция обусловлена рядом причин.

1. Проблема хранения и поиска информации. Централизованные базы данных биологической информации, будут наращивать свои объемы, и их роль будет постоянно возрастать. Типичная на сегодня стратегия работы с этими базами "найти информацию -> загрузить к себе в компьютер -> проанализировать" становится с ростом объемов данных непрактичной. Поэтому в базы данных будут посылаться не запросы на определенные сведения, а программы, производящие анализ данных на месте и передающие только конечные результаты. Эти операции невозможны, если данные представлены только на естественном языке.

2. Моделирование биохимических процессов. Предсказание эффектов взаимодействия различных лекарственных препаратов in vivo, изучение регуляции каскадных и циклических процессов, выяснение механизмов развития наследственных заболеваний - это далеко не полный перечень точек приложения компьютерного моделирования в биохимии. Для того чтобы модель была понятна компьютеру, необходимо использовать формальный язык.

4. Классификация и систематика. Классификация организмов на основе последовательности ДНК является важнейшим методом в современной биологической систематике. Большинство методов подобного рода ориентируются на сравнение одного короткого фрагмента ДНК у различных организмов Этот подход может давать некорректные результаты, поскольку короткий фрагмент-ДНК не отражает всю совокупность признаков, присущих организму. Поэтому необходимо производить сравнение больших областей ДНК с точки зрения их значения для того или иного организма. Количественное применение такого метода требует наличия способов формального описания «смысла» фрагментов генома, их связи с фенотипом, что, в свою очередь создает потребность в средствах формального описания фенотипических признаков.

5. Обработка результатов эксперимента. В молекулярной биологии происходит рост объемов экспериментальных данных. Для обработки данных необходимы программные средства. Часто для этой цели

применяются готовые программные пакеты с закрытым кодом. Их использование становится причиной "отчуждения" научного работника от научного процесса, когда собственно сам процесс обработки данных и формирования выводов оказывается скрытым от исследователя внутри "черного ящика" программного пакета. В результате снижается степень понимания исследователем методов обработки данных, а сами эти методы применяются неправильно, поскольку компьютерные программы не способны сами выбрать подходящие средства анализа информации. Как следствие, падает уровень научной работы. Такая ситуация создает необходимость в создании специального языка программирования, ориентированного на обработку биохимических данных, который исследователи могли бы использовать в повседневной работе. 6. Понимание информационной природы живого. Ряд авторов предлагает рассматривать живую клетку как вычислительное устройство или совокупность вычислительных устройств, выполняющих программу, записанную на клеточном языке. В этом случае для понимания функционирования живой клетки необходимо изучить архитектуру клетки как вычислительного устройства, а также выяснить принципы построения клеточного языка. Это требует создания некоторого формального языка описания программ для клеточного вычислительного устройства.

Вышеизложенное демонстрирует потребность в разработке новых формальных языков для молекулярной биологии, которые были бы пригодны одновременно для создания баз данных, моделирования биохимических реакций, биологической систематики и создания программ обработки данных. Очень желательно, чтобы все эти свойства сочетались в одном языке, или, существовало бы семейство языков, объединенных принципами построения и сходным синтаксисом. Необходимость унификации .средств -формального -представления биохимических знаний для всех указанных выше целей, а также соображения теоретического характера, высказанные рядом авторов, приводят к заключению о том, что перспективным является представление биохимических знаний в форме вычислительных процессов, записанных в виде программ на особом языке. Цель работы

Решение проблемы создания средств формального представления биохимических знаний, пригодных для разработки баз данных, моделирования биохимических реакций и создания программ обработки биохимических данных.

В соответствии с поставленной целью определены задачи диссертационной работы:

1. Изучить основные существующие языки программирования общего назначения и формальные языки, применяемые для моделирования биохимических реакций, с целью выявить набор свойств, которыми должен обладать специализированный формальный язык для представления и обработки биохимических знаний.

2. Изыскать принципы построения формального языка для представления и обработки биохимических знаний.

3. Разработать спецификацию для формального языка, или семейства языков, предназначенных для представления и обработки биохимических знаний, моделирования биохимических реакций и представления описаний живых организмов с целью создания более точных биологических систематик.

4. Реализовать интерпретатор для специфицированных языков, который мог бы осуществлять моделирование биохимических процессов по их описанию, представленному на разработанном языке, а также мог бы выполнять программы обработки экспериментальных данных.

5. Проверить функционирование языка и интерпретатора путем моделирования нескольких биохимических процессов, применения языка для создания систематических описаний некоторой группы живых организмов и написания программы для обработки экспериментальных данных.

Научная новизна

Впервые предлагается семейство формальных языков, предназначенных для представления биохимических знаний, моделирования биохимических реакций и представления описаний живых организмов с целью создания биологических систематик, основанное на принципах организации клеточного языка, полученных в результате построения и изучения модели функционирования клеточного вычислительного устройства.

Впервые предложена модель архитектуры клеточного устройства и языка описания клеточных программ. Построен язык высокого уровня (СБРЬ), принципы организации которого повторяют принципы организации клеточного языка. Создан интерпретатор программ на языке

CDPL, позволяющий моделировать биохимические системы, записанные с помощью CDPL.

Впервые рассматривается использование представления описаний микробиологических объектов по морфологическим и биохимическим признакам в форме программ на специализированном (разработанном в данной работе) объектно-ориентированном языке программирования.

Впервые предлагается использовать классификацию программ для систематики биологических объектов. Рассмотрены возможности применения принципов объектно-ориентированного программирования для систематики биологических объектов. Разработан специализированный язык ConceptSystem для составления программ-описаний микробиологических объектов, создан интерпретатор данного языка и создана интерактивная среда разработки таких программ. Практическая значимость работы

1. Интерпретатор языка CDPL может использоваться:

1.2. Для моделирования как отдельных биохимических реакций, так и сложных взаимодействий. 1.3 В учебном процессе:

1.3.1. Для иллюстрации функционирования биохимических

систем

1.3.2.Для иллюстрации принципов кинетики ферментативных реакций

2. Новый метод представления описаний биологических объектов и построения систематик может быть использован для уточнения существующих биологических классификаций.

3. Язык ConceptSystem можно использовать для создания программ

обработки экспериментальных данных. Апробация работы

-Результаты работы докладывались на - международных конференциях Bioinformatics of Genome Regulations and Structure'2002 и 2004, Moscow Conference on Computational Molecular Biology, 2003.

Кроме того, результаты работы докладывались на 6-ой (2002) 7-ой (2003). 8-ой (2004) и 9-ой (2005) Пущинских школах-конференциях молодых ученых «Биология - наука XXI века», секция «Математическая биология», и ХП Международной конференция студентов, аспирантов и молодых ученых «Ломоносов 2005». Публикации

По теме диссертации опубликовано 28 печатных работ, в том числе 17 тезисов конференций, 4 трудов международных конференций, 6 статей в

научных журналах (в. т. ч. 1 в издании, рекомендованном ВАК), 1 зарегистрированная программа для ЭВМ. Объем и структура диссертации

Диссертация состоит из введения, трех глав, заключения и списка литературы, изложена на 117 страницах. Список литературы содержит 103 наименования. Работа содержит 55 рисунков и 2 таблицы.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Введение

Во введении обосновывается актуальность проблемы, сформулированы цели и задачи, дан краткий обзор содержания диссертации, перечислены полученные новые результаты исследования.

Первая глава

Первая глава представляет собой обзор литературы по теме работы. Она состоит из трех разделов.

В первом разделе рассматриваются понятия теоретической информатики, лежащие в основе данной работы. Разъясняются такие понятия, как «формальный язык», «представление информации», «интерпретация», «абстрактная машина». Далее рассматриваются их приложения к молекулярной биологии: понятие о клеточном языке и моделирование биохимических реакций как дискретных процессов.

Во втором разделе дается обзор основных парадигм программирования на примере четырех различных языков. Рассматривается, как в этих языках решаются задачи обработки данных биохимического эксперимента, моделирования молекулярно-биологических систем и создания баз данных биологической информации.

Третий раздел - посвящен обзору существующих формальных языков для представления биохимических процессов.

Вторая глава. Язык описания молекулярно-биологических систем и его интерпретатор для моделирования биохимических процессов.

Во второй главе излагается разработанная модель архитектуры клеточного устройства и описывается созданный на ее основе язык описания клеточных программ СРБЬ.

Известно, что любая информационная система может быть рассмотрена с двух точек зрения. Первый подход имеет дело с физической организацией системы, а второй - с е'е логической

организацией. Живая клетка как информационная система тоже может быть рассмотрена с двух точек зрения.

Ряд авторов предлагает рассматривать живую клетку как вычислительное устройство или совокупность вычислительных устройств, выполняющих программу, записанную на клеточном языке. Живая клетка содержит программу в форме последовательности нуклеотидных звеньев ДНК. Практически использовать эту форму для представления биохимических знаний неудобно. Проводя аналогию с компьютерами, можно сказать, что ДНК содержит своеобразные "машинные коды", описывающие низкоуровневые операции клеточных механизмов. Однако можно предположить, что существуют клеточные языки «высокого уровня», в которых части ДНК-кода организованы в более крупные семантические единицы.

Изучив принципы логической организации клеточного языка, мы можем построить искусственный язык высокого уровня, выражения которого в равной степени пригодны для чтения человеком и компьютером и который по своей природе хорошо подходит для представления биохимических знаний.

Чтобы изыскать принципы построения такого языка, нужно сначала создать модель архитектуры клеточного вычислительного устройства, а затем сформулировать принципы языка, оптимально подходящего для программирования этого устройства.

Модель архитектуры клеточного устройства Построенная модель клеточного устройства изображена на Рис 1. Ее организация определяется следующими принципами:

1. Нуклеиновые кислоты, белки и другие внутриклеточные компоненты образуют клеточное вычислительное устройство, состоящее из пулов данных, активных компонентов и пассивных

• Компонентов.

2. Активные компоненты представлены процессами и метапроцессами. Клеточное вычислительное устройство может содержать несколько активных компонентов.

3. Процессы и метапроцессы являются источником активности в системе.

4. Активные компоненты содержат одновременно данные и программы, записанные на специальном клеточном языке в форме их химической структуры.

5. Процессы могут связывать, трансформировать и освобождать любые компоненты. Это происходит в соответствии с их встроенными программами

6. Метапроцессы активируются наличием или отсутствием определенных процессов. При активации метапроцессы могут запускать дополнительные процессы в соответствии со своими встроенными программами.

7. Все компоненты помещены в пулы данных. Компоненты из различных пулов не могут прямо взаимодействовать, но они могут перемещаться из одного пула в другой специальными процессами._

Внешний пул данных

Рис 1. Модель архитектуры клеточного устройства.

Язык описания клеточных программ СРРЬ Принципы организации:

1. Функционирование клеточного вычислительного устройства описывается программой, записанной на языке описания клеточных программ СРБЬ.

2. Программы на СРБЬ содержат несколько частей. Эти части отвечают за описание начального состояния пула значений, типы данных, а также за встроенные программы для процессов и метапроцессов.

3 Существует прямое соответствие между сущностями языка и компонентами живой клетки.

4. Программы на СРБЬ обычно имеют декларативную и процедурную интерпретацию. Каждое выражение внутри встроенной программы активных компонентов имеет форму <действие>:- <условие>. Интерпретатор СРРЬ и моделирование биохимических процессов

Возможность использования интерпретатора СРБЬ лучше всего пояснить на простом примере.

Химическое уравнение типичной ферментативной реакции выглядит следующим образом:

Е + К

ki.

к

вк

-1

к.

Е + Р

Здесь К- субстрат, Е- фермент, (ЕК) - комплекс фермента и субстрата, Р - продукт, kbk_i - константы скорости прямой и обратной реакций образования ЕК, к2 - константа скорости образования Р.

Соответствующая CPDL программа выглядит так (после //комментарии):

//Объявления //Субстрат // Продукт // Фермент //Содержание пула в начале //Субстрат, концентрация 1 //Фермент, концентрация 0.1 tEnzyme process рЕ (tSubstrate,tProduct) //Описание функционирования фермента

,bound(S,P,kl):-. not bound(P) - //Связывает субстрат, со.скростью kl transform(S,P,k2) :- bound(S). //Превращает связанный субстрат в продукт

re!ease(_,P). // освобождает продукт releasees,_,k_l). //освобождает субстрат со скоростью к_1 end.

Declare

tSubstrate = basic tProduct = basic tEnzyme = process Pool

(l):tSubstrate(free) (O.l)-.tEnzyme(free)

Результаты работы программы изображены на Рис 2 и 3

Рис. 2. Результаты выполнения программы на СБРЬ. Концентрация компонентов системы в зависимости от времени.

0 3 04 0 5

концентрация К

Рис 3..Результаты выполнения программы на СРБЬ. Зависимость

концентрации продукта от скорости реакции_

Помимо описания простой ферментативной реакции, пригодность разработанного языка была исследована путем описания с его помощью регуляции лактозного оперона, каскадной регуляции фага лямбда.

Сравнение CPDL с другими языками описания биохимических моделей.

В последние годы активно разрабатываются языки описания биохимических моделей, такие как SBML и CellML. Эти языки являются производными популярного стандарта XML. Хотя теоретически информация представленная на этих языках доступна для прочтения человеком, с практической точки зрения, разбирать описания на этих языках затруднительно. Таким образом, данные языки являются в большей степени стандартами для автоматизированной обработки, они написаны для «выполнения машинами», а не для прочтения людьми. Языки типа SBML представляют интерес для специалистов по компьютерному моделированию и программистов, создающих программные пакеты, работающие с данными, представленными в SBML формате.

В отличие от этих языков, CPDL является концептуальным инструментом для людей, прежде всего для практических биохимиков. В отличии от громоздкого XML-описания CPDL программа компактна и легка для восприятия. Она имеет одновременно декларативную и процедурную семантику. Таким образом, CPDL подходит для формулировки идей о функционировании биохимических систем, передачи этих идей другим людям, т.е. является прежде всего средством мышления и общения. Одновременно CPDL является исполняемым языком, т.е. программы на нем могут быть выполнены на компьютере.

Третья глава. Применение разработанных языковых средств для классификации организмов по биохимическим и морфологическим признакам.

Язык ConceptSystem

Представленный в предыдущей главе язык CPDL хорошо v подходйт для -описания биохимических- процессов, но. плоха пригоден для построения баз данных и обработки экспериментальных биохимических данных. Поэтому на основе CPDL был разработан язык ConceptSystem, в котором предусмотрены средства для выполнения этих задач.

Язык ConceptSystem был применен для формализации описаний биохимических и морфологических признаков грибов рода Trichoderma, что дало возможность развить новый подход к систематике данной группы организмов.

Формальное описание биохимических и морфологических признаков организма с помощью языка программирования.

Основным способом описания признаков организма или таксона до настоящего времени является описание на естественном языке, т.е. в форме последовательности предложений, записанных на (русском, английском или другом) языках общения людей. В то же время, известно, что любое описание характеристик вида должно включать в себя описания характеристик различных стадий жизненного цикла. Большинство существующих способов и форматов описания напоминает мгновенные фотографические снимки - срезы всех характеристик в определенные моменты времени. Такие описания не отражают достаточно полно специфику изучаемого организма.

Как говорилось ранее, живая клетка может быть рассмотрена как вычислительное устройство. В этом случае последовательную смену жизненных стадий можно описывать как развертывание вычислительного процесса, выполняемого под управлением клеточного компьютера. Для задания последовательности действий (последовательности вычислений) используются программы, записанные на специальных языках. Программы являются более компактным и естественным способом представления вычислительного процесса, чем последовательное описание всех состояний системы. Кроме того, содержание программы не зависит от конкретной стадии развития.

Основываясь на этом, мы можем построить язык программирования, предназначенный для представления описаний живых организмов. С помощью такого языка возможно не только представить динамику развития морфологических и физиологических характеристик отдельных организмов, но также и представить свойства абстрактных систематических единиц - видов и таксонов высших порядков.

Использование_принципов_объектно-ориентированного

программирования для • представления описаний - и систематики биологических объектов

Если мы сопоставим объектно-ориентированное программирование (ООП) и биологическую систематику, то можем идентифицировать некоторые соответствия. Любая существующая биологическая система может быть представлена средствами ООП. Чтобы понять эти соответствия, обратимся к рисунку 4, на котором представлен фрагмент биологической классификации в форме диаграммы классов. Любому таксону может быть сопоставлен класс, определяющий общие характеристики данного таксона (табл 1).

ООП может быть оболочкой, «оберткой» для любой существующей систематики. Конвертация любой систематики в ООП дает ей все преимущества использования формального языка без ущерба гибкости подхода. С другой стороны, возможно построение чистых 00 -систематик, основывающихся на принципах представленного подхода и использующих возможности ОО, для которых к биологических систематиках нет аналогов (например, множественное наследование).

Трчдадарма ..

Число: РадиусКщщнии

ТипЁетатсе ■ -

Рост {: - Радиус.+ Прнрост) Ёетзпение[) Сгюроебммвание(}

У

^^УГ........ ; --ГН

ТипЭксудвтз:Э«мат

6ь(Двйвн»еЭ*суН0та{)

\

X

_________■

Ть-.пПшмекгл: Пигиеш

Вы£ влениеГЬ™ентз{)

КультурзМИ

! РадчуС"5

; ТипВетзления »"Регулярное"

Рис 4, Наследование классов и биологическая систематика. «Трихолерма» является абстрактным классом с атрибутами и методами, всех организмам рода ТпсЬо(1епш> Классы Вид Т1 и Вид_Т2 являются подклассами «Триходерма», определяющими дополнительные атрибуты. Классы Внд_Т1 и Вид_Т2 являются видами с точки зрения биологической систематики, поскольку из них могут образовываться конкретные экземпляры (КультураЯэ 1) Таблица 1. Соответствие понятий биологической классификации и ООП

Биологическая классификация ООП

Таксон Класс

Вид Пеабстрактный класс, который может иметь экземпляры.

Таксон высших порядков Абстрактный класс

Организм Экземпляр класса

Для представления описаний и классификации биологических объектов был разработан специальный объектно-ориентированный язык Сопсер18уз1ет, который был применен для описания и классификации микроскопических грибов рода Тпс1юс1егта.

Применение разработанного языка для описания и классификации грибов рода Тгю1ю<1егта

Существует множество групп живых организмов, систематика которых находится в процессе постоянного изменения. Одной из таких групп являются грибы рода Тпс1ю(1егта. Грибы рода Тпскойегта представляют ценность для применения в различных областях, в частности, для биологической защиты растений против грибных возбудителей болезней.

Предлагаемый в настоящее работе способ описания базируется на рассмотрении развития организмов рода Тг1с1гос1егта как последовательности деления и дальнейшей специализации отдельных клеток

Описание представляет собой программу, которую необходимо задать исходной клетке (споре) чтобы получить ее развитие сначала в колонию ТНскойегта, а в итоге снова в спору. Такое описание является естественным, поскольку отражает реальное положение вещей и позволяет разделить признаки на свойственные единичным клеткам и появляющиеся в результате взаимодействия большого числа клеток. Описание-программа следует логике развития самого организма, а не логике проведения наблюдений, особенностей экспериментов и исторических обстоятельств, нередко оказывающих влияние на обычные текстовые описания.

С использованием предложенных методов были построены программы описания и классификация для 10 изолятов грибов рода ТпеЬоёегта. На Рис.5, приведен пример фрагмента систематики, полученной с использованием описаний-программ и принципа множественного наследования. Буквами К,Ь,М,М,0,Р,С)Д,8,Т обозначены конкретные изоляты Тпс1юс1егта.

Для сравнения на рисунке 3.3. приведен один из существующих вариантов «стандартной» биологической классификации Тпскойегта, который содержит 19 абстракций на 10 экземпляров из них 10 видов и 1 род и 8 промежуточных таксонов. Различные по смыслу таксоны имеют одинаковые названия (ТпсЬос1егта - одновременно род и секция). При этом рисунок не содержит никакой информации о смысле различий между таксонами.

00-версия классификации (рис 6) содержит 11 абстракций на 10 экземпляров из которых имеется 9 видов 1 род и 1 промежуточный таксон. Между тем, как можно видеть из рисунка, 00-классификация описывает взаимоотношения между рассматриваемыми организмами более подробно. В частности, в «стандартной» версии виды к которым относятся изоляты Т, Б и Я поставлены в один ряд и дальнейшая информация об их взаимоотношениях отсутствует, в то время как в 00-версии класс TExPig (Я) является наследником класса ТР1§шеа1ес1 (8) и

ЗАКЛЮЧЕНИЕ

Разработан язык С0Р1., обладающий способностью представления информации о метаболических путях в прокариотической клетке и отдельных метаболических путей в эукариотической клетке. Создан интерпретатор языка СОРЬ, пригодный для моделирования биохимических реакций и их регуляции.

Предложен новый способ описания биохимических и морфологических признаков живых организмов, основанный на принципах объектно-ориентированного программирования. Установлена предпочтительность описаний, полученных таким способом, по сравнению с принятыми в настоящее иремя описаниями на естественном языке.

Предложен новый метод построения биологической систематики, использующий принципы объектно-ориентированного

программирования.

Разработан язык Сопсер1йуз1ет для представления Описания биологических объектов и создания программ обработки экспериментальных биохимических данных.

Создан интерпретатор, выполняющий программы на языке Сопсер1Яук1ст

выводы

1. Проведенное сравнение существующих формальных языков и их применения к биохимическим задачам показало, что формальный язык биохимии должен обладать свойством биологической конгруэнтости - понятия и конструкции языка должны соответствовать биохимическим сущностям (объектам и процессам). В своей основе этот язык должен быть объектно-ориентированным языком программирования с поддержкой баз данных на уровне языка, сильной типизацией, интуитивно понятным синтаксисом и содержать средства обработки больших массивов данных (подобно имеющимся в языках АРЬ и I)

2. Рассмотрение живой клетки как вычислительного устройства позволяет изучать архитектуру такого вычислительного устройства и соответственно построить язык программирования, оптимально подходящий для программирования такого устройства.

3. В работе разработана и представлена спецификация семейства из двух языков СРБЬ и СопсергЗузгет. Язык СРБЬ построен исходя из модели архитектуры биохимического вычислительного устройства и позволяет компактно описывать различные биохимические процессы. СРБЬ обладает простым и понятным синтаксисом, так что смысл программы на нем может быть понят практикующим биохимиком без длительного обучения и тренировки. Сопсер18узгет является развитием идей СРБЬ и основывается на тех же принципах, однако в него введены практические модификации, позволяющие использовать.его для создания баз данных и программ обработки экспериментальных данных.

4. Разработан эмулятор биохимического вычислительного устройства, способный выполнять СРБЬ программы. Разработан интерпретатор языка ConceptSystem вместе с графической оболочкой, поддерживающей интерактивный режим работы.

5. На языке СРОЬ были описаны процессы протекания простой ферментативной реакции, регуляции лактозного оперона и литического каскада фага лямбда. С помощью языка

ConceptSystem были написаны программы анализа данных о генетической структуре популяции, а также создана база данных программ, описывающих изменение морфологических и биохимических признаков гриба рода Trichoderma, что позволило сформулировать новый подход к его систематике.

ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ

1. Тарасов Д.С., Формат представления биологических описаний гриба и его применение на примере рода Trichoderma/Д.С. Тарасов, Р.И. Тухбатова, Н.И. Акберова, Ф.К. Алимова//Вестник Татарстанского отделения российской экологической академии,-

2005,- Т. 24,- №2.- С. 44-49

2. Тарасов Д.С. Молекулярно-биологическое устройство -принципы организации//Д.С. Тарасов, Н.И. Акберова//Ученые записки КГУ, серия естественные науки.- 2005,- Т. 147,- кн. 2,- С. 180-196

3. Тарасов Д.С. Увеличение интеллектуальных ресурсов научного исследования в биологических областях/Д.С. Тарасов, Н.И. Акберова//Ученые записки КГУ, серия естественные науки,-

2006.-T.-148.-kh 1.- С. 138-155

4. Тарасов Д.С. Применение принципов объектно-ориентированного программирования к описанию и классификации биологических объектов на примере грибов рода Trichoderma/J\.C. Тарасов, Н.И. Акберова, Р.И. Тухбатова, Ф.К. Алимова//Ученые записки КГУ, серия естественные науки.- 2006,- Т. 148,- кн. 3.- С. 125-148

5. Тарасов Д.С. Виртуальные машины для исследования молекулярно-биологических процессов/Д.С. Тарасов, Н.И. Акберова/УГеоресурсы.-2006.- Т.21.-№. 4.-С. 45-48

6. Tarasov D.S. Virtual machine technology for studying living cells/ D.S. Tarasov N.I. Akberova//Georesources.- 2006,- in print.

7. Тарасов Д.С.Молекулярно-биологическое вычислительное устройство: архитекутра и язык управления/Д.С. Тарасов, Н.И. Акберова//Новая Геометрия Природы,- Казань.- 2003,- С. 341250

8. Тарасов Д.С.Применение концепции молекулярно-биологического устройства для создания современных обучающих программ нового поколения/Д.С. Тарасов, Н.И. Акберова//Новая Геометрия Природы,- Казань.- 2003.- С. 332-334

9. Tarasov D.S.A Language for modeling generic régulation in prokaryotes/D.S. Tarasov, A.Y. Leontiev , N.I. Akberova //4th International conférence of bioinformatics and genome régulation and structure.- Novosibirsk.- 2004.- P. 146-149

10. Tarasov D.S.Architecture of cell device/D.S. Tarasov, A.Y. Leotiev, N.I. Akberova//Third International conférence of bioinformatics and genome régulation and structure.- Novosibirsk.- 2002.- P. 216-218

11. Акберова Н.И.Исследование симметрийной структуры геномов вирусов HSV/H.H. Акберова, Д.С. Тарасов //Первая всероссийская Internet-конференция "Компьютерное и математическое моделирование в естественных науках".- Тамбов.- 2001.- С. 23

12. Акберова Н.И.Компьютерный дизайн ПЦР-праймеров различной специфичности/Н.И. Акберова, Д.С. Тарасов //Четвертая всероссийская Internet-конференция "Компьютерное и математическое моделирование в естественных науках".-Тамбов.- 2002,- С. 32

13. Акберова Н.И.Метод симметрийного моделирования структуры ДНК-текстов/Н.И. Акберова, А.Ю. Леонтьев, Д.С. Тарасов//Первая всероссийская Internet-конференция "Компьютерное и математическое моделирование в естественных науках".-Тамбов.-2001,- С. 24

14. Тарасов Д.С.Архитектура клеточного устройства и гибридные биокибернентические системы/Д.С. Тарасов, Н.И. Акберова//7-ая Пущинская школа-конференция молодых ученых.- Пущино,-2003.- С. 256

15. Тарасов Д.С.Компьютерный дизайн праймеров для ПЦР/Д.С. Тарасов, Н.И. Акберова//П научная конференция молодых ученых, аспирантов и студентов научно-образовательного центра

,-ЖГУ.-Казань.-2001,- С. 91

16. Тарасов Д.С.Молекулярно-биологическое вычислительное устройство и клеточное киберпространство/Д.С. Тарасов, Н.И. Акберова//8-ая Пущинская школа-конференция молодых ученых "Биология - наука XXI века".- Пущино.- 2003.- С. 24

17. Тарасов Д.С.Объекто-ориентированная система описания, классификации и моделирования биологических объектов и ее применение к грибам рода Trichoderma/Д.С. Тарасов//ХП Международная конференция студентов, аспирантов и молодых ученых "Ломоносов",- М,- 2005.- С. 40-41

18. Тарасов Д.С.Организация базы знаний для молекулярно-биологических исследований/Д.С. Тарасов, Н.И. Акберова //IV Научно-практическая конференция молодых ученых и специалистов Республики Татарстан.- Казань,- ,2001 с. 110

19. Тарасов Д.С.Применение новых достижений молекулярной биологии при проектировании современных устройств микроэлектроники/Д.С. Тарасов, Н.И. Акберова//Новые методологии проектирования устройств микроэлектроники,-Владимир.- 2002.- С. 75-76

20. Тарасов Д.С.Технологии молекулярной биокибернетики: использование системы CDPL/CDS в конструировании ПЦР-амплификаторов/Д.С. Тарасов, Н.И. Акберова //III Научная конференция молодых ученых, аспирантов и студентов научного-образовательного центра КГУ "Материалы и технологии XXI века",- Казань.- 2003.- С. 84

21. Тарасов Д.С.Язык описания клеточных программ CDPL-1 и его применение/Д.С. Тарасов, Н.И. Акберова , А.Ю. Леонтьев//6-ая Пущинская школа-конференция молодых ученых "Биология -наука XXI века".- Пущино,- 2002.- С. 195-196

22. Tarasov D.S.The model of molecular biological computational device and its application to automatic genome annotation/D.S. Tarasov, N.I. Akberova, A.Y. Leontiev//International Moscow conference on computational molecular biology.- M.- 2003.- P. 225-226

23. Тарасов Д.С. Компьютерное моделирование структурно-функциональной огранизации ori-сайтов бактерий/Д.С. Тарасов, Н.И. Акберова//12-я международная конференция "Ферменты микроорганизмов", Казань.- 2001,- с. 83-84

24. Тарасов Д.С. Регуляция и контроль инициации репликации: лингвистический подход/Д.С. Тарасов, Н.И. - Акберова, А.Ю. Леонтьев//Материалы XL международной научной студенческой конференции «Студент и научно-технический прогресс»:Биология.- Новосибирск.- 2002.- С. 149-150

25. Леонтьев А.Ю. Алгоритм построения образа функциональных областей генома/А.Ю. Леонтьев, Д.С. Тарасов//Материалы международной научной конференции, посвященной 70-летию образования зооиженерного факультета. Казанская государственная академия ветеринарной медицины,- 2000 - С. 203-205

26. Тарасов Д.С. Язык представления описания морфологии грибов на примере Trichoderma/Д.С. Тарасов, Р.И. Тухбатова//9-ая Пущинская школа-конференция молодых ученых "Биология -наука XXI века",- Пущино.- 2005,- С. 331.

27. Шишкин A.B. Построение нетривиальной классификации грибов рода Trichoderma/A.B. Шишкин, Р.И. Тухбатова, Д.С. Тарасов// 9-ая Пущинская школа-конференция молодых ученых "Биология -наука XXI века",- Пущино,- 2005.- с. 223.

28. Тарасов Д.С. Интерпретатор языка CONCEPTSYSTEM//nporpaMMa для ЭВМ. Зарегистрирована в Реестре программ для ЭВМ 18.01.2007. Свидетельство о регистрации № 2007610350

Тарасов Денис Станиславович 420008, Казанский государственный университет, Биолого-почвенный факультет Факс: (843) 2387121 E-mail: dtarasov@mntech.rii

Подписано к печати 22.03.07. Размер бумаги 60x80 1/16. Печать на RISO. Усл. печ. л. 1,5. Заказ № 67. Тираж 100.

С готового оригинал - макета отпечатано в множительном участке ГПП «Аэрон».

Содержание диссертации, кандидата биологических наук, Тарасов, Денис Станиславович

Введение

Глава 1. Обзор литературы И

1.1. Предварительные замечания.

1.1.1. О терминологии

1.1.2. О распространённых заблуждениях.

1.2. Формальные языки и вычислительные процессы, их роль в биохимических исследованиях.

1.2.1. Формальные языки.

1.2.2. Вычислительные процессы

1.2.3. Вычислимость

1.2.4. Непрерывная и дискретная биохимия.

1.3. Сравнение различных языков программирования с точки зрения их приспособленности для решения задач биохимического исследования.

1.3.1. Использованные программы.

1.4. Процедурные, императивные языки.

1.4.1. Обработка данных: вычисления по формуле

1.4.2. Модель лактозного оперона.

1.4.3. База данных Тпс1юс1егта.

1.5. Функциональные языки.

1.5.1. Вычисление генетического расстояния по формуле

1.5.2. Модель лактозного оперона.

1.5.3. База данных Тпск>с1егта.

1.6. Логическое программирование.

1.6.1. Вычисление генетического расстояния по формуле

1.6.2. Модель регуляции лактозного оперона.

1.6.3. База данных ТпсЬоёегта.

1.7. Объектно-ориентированные языки.

1.7.1. Расчет генетического расстояния по формуле.

1.8. Специализированные языки для описания биохимических процессов

1.8.1. БВМЬ.

1.8.2. Биохимическая абстрактная машина (ВЮСНАМ)

1.8.3. Стохастическое 7г-исчисление.

Глава 2. Язык описания молекулярно-биологических систем и его интерпретатор для моделирования биохимических процессов

2.1. Архитектура клеточного устройства.

2.2. Язык описания клеточных программ СРБЬ.

2.2.1. Предварительные замечания.

2.2.2. Принципы организации:.

2.2.3. Типы данных.

2.2.4. Пул данных.

2.2.5. Процессы.

2.2.6. Факты.

2.2.7. Правила.

2.2.8. Метапроцессы.

2.3. Моделирование простой ферментативной реакции с помощью СРБЬ.

2.4. Двухсубстратная ферментативная реакция на СРБЬ

2.5. Модель реакции с аллостерическим ингибированием.

2.6. Моделирование регуляции лактозного оперона с помощью СРБЬ

2.7. Расширение СРБЬ. Язык СРБЬ/НЬ.

Глава 3. Применение разработанных языковых средств для кодификации организмов по биохимическим и морфологическим признакам

3.1. Предварительные замечания.

3.1.1. Биологическая конгруэнтность.

3.2. Спецификация языка ConceptSystem.

3.2.1. Алфавит.

3.2.2. Ключевые слова.

3.2.3. Литералы.

3.2.4. Объекты.

3.2.5. Методы.

3.2.6. Сайты связывания (переменные экземпляра).

3.2.7. Связывание объектов и отсылка сообщений.

3.2.8. Предопределенные классы.

3.2.9. Модификаторы.

3.2.10. Динамические классы.

3.2.11. Пример: вычисление генетического расстояния по формуле на языке Сопсер18у^ет.

3.2.12. Реализация интерпретатора ConceptSystem.

3.3. Применение Сопсер13у81ет:кодификация описаний грибов рода

Тпс1юс1егта и алгоритмическая систематика.

3.3.1. Объектно-ориентированное программирование (ООП) и систематика.

3.3.2. Тпскойегта - краткие сведения о модельном объекте

3.3.3. Кодификация описаний видов

3.3.4. Систематика Тпскойегта как классификация программ

3.3.5. Сравнительная оценка качества ОО-систематик.

Введение Диссертация по биологии, на тему "Формальные языки для представления биохимических процессов"

Если мы рассмотрим историю применений математики в биологии, то придем к выводу, что они центрируются вокруг создания инструментов математической интерпретации экспериментальных данных[1]. Будучи сами по себе полезными эти инструменты несут в себе неизбежные внутренние ограничения. В отличие от физических законов биологическим закономерностям обычно нельзя придать лаконичную математическую формулировку[2]. Таким образом, в биологии приобретаемое знание обобщается преимущественно в форме теорий и гипотез, выражаемых с помощью естественного языка (т.е. языка общения людей). В течение долгого времени эта форма была адекватна для решения большинства теоретических и прикладных задач, стоящих перед биологическими науками.

В настоящее время необходимость формализации биологических знаний очевидна по следующим причинам:

1. Прежде всего, обращает на себя внимание рост объемов экспериментальных данных. В настоящий момент гигабайтные объемы уже не являются необычными для результатов, получаемых в ходе одного эксперимента. В будущем, с широким внедрением беспроводных датчиков, собирающих данные двадцать четыре часа в сутки, можно ожидать многократного увеличения информационных потоков [3]. Даже данные "скромных" размеров в десятки и сотни килобайт невозможно обрабатывать без средств автоматизации, таких как распространенные электронные таблицы Excel и некоторые пакеты статистического анализа. Однако эти средства автоматизации и предоставляемые ими возможности являются рудиментарными и обречены на исчезновение в ближайшем будущем.

2. Централизованные базы данных биологической информации, будут наращивать свои объемы и их роль будет постоянно возрастать. В то же время, очевидно, что типичная на сегодня стратегия работы с этими базами "найти информации» загрузить к себе на компыотер-> проанализировать" становится с ростом объемов данных непрактичной, поскольку существуют ограничения на размер информации, которая может быть передана через Интернет. Соответственно в базы данных будут посылаться не запросы на определенные сведения, а программы, которые будут производить вычисления и анализ данных на месте и передавать только результаты [4]. Эти операции невозможны в том случае, если данные представлены исключительно в форме публикаций на естественном языке.

3. В случае, когда размер исходных данных превышает определённую величину, неизбежно возникает ситуация, когда даже объем промежуточных обобщений и гипотез, необходимых для продолжения исследования, становится больше того, который может быть эффективно обработан человеком в разумные сроки. Это приводит к неправильному выбору направления дальнейшей работы, напрасному расходу средств и усилий и в итоге к выводам, находящимся в противоречии с уже собранными данными. Традиционные формы представления результатов в форме графиков и таблиц с текстовыми пояснениями не дают практической возможности произвести исчерпывающую проверку на внутреннюю согласованность исходных данных, промежуточных обобщений и окончательных выводов.

4. В то же время появление средств автоматизированного анализа данных и даже интеллектуальных систем автоматизированного выдвижения и проверки гипотез [5] становится причиной "отчуждения" научного работника от собственно научного процесса, когда собственно сам процесс обработки данных и формирования заключений оказывается скрытым от исследователя внутри "черного ящика" программного пакета. В результате уровень научной работы резко снижается поскольку, во-первых, снижается степень понимания исследователем методов обработки данных, а во-вторых, сами эти методы часто применяются неправильно, поскольку компьютерные программы, не знакомые с контекстом проводимых исследований, не способны сами выбрать наиболее подходящие средства анализа информации. Для преодоления сложившегося противоречия необходимы новые средства представления знаний и процессов, которые могли бы дать исследователю возможность заглянуть внутрь "черного ящика" обработки данных.

Превращение знаний в кодированное представление в форме данных и программ получило название кодификации. При этом кодификация это не просто представление научных знаний как данных (например в форме БС^Ь-таблиц).

Кодификация - это представление знаний (в частности знаний о динамических процессах) в форме, допускающей сохранение, выполнение, автоматический поиск и анализ.

Кодификация биологических знаний - метаболических и сигнальных путей, а также биологических процессов, выражающихся во взаимодействии большого числа дискретных компонентов (например, при делении клетки), представляет собой глобальную задачу биологии на два ближайших десятилетия[6].

Рядом авторов предположено, что компьютерная программа может быть способом формулировки биологических теорий, гипотез, и законов [7].

В настоящее время идея использования компьютерных программ как средства представления биологических знаний приобретает все больше сторонников. Основная масса работ здесь проводится в области представления моле-кулярно - генетических процессов.

Мы можем рассматривать живую клетку как физико-химическую систему, которая в некоторой степени обладает возможностью к обработке информации. Но мы можем занять и другую позицию, согласно которой клетка представляет собой, прежде всего информационную систему, на которую работают физические и химические процессы [8, 9]. Действительно уже достаточно давно известно, что любая информационная система может быть рассмотрена с двух точек зрения: "инженерной" - имеющей дело с ее физической реализацией и "точки зрения программиста", рассматривающей ее логическую организацию [10].

До недавнего времени логической организации живой клетки не уделялось достаточно внимания[11], однако в настоящее время ее изучение считается задачей не менее (а иногда и более важной) нежели изучение физической структуры. Поиск формальных языков, которые могут точно и лаконично описывать сложные биологические процессы и, в перспективе, программировать эти процессы, представляет собой одну из основных задач системной биологии [9].

Необходимость выражать полученные знания и гипотезы с применением разных языков программирования помогает исследователю достигнуть более глубокого понимания проблемы и часто взглянуть с другой стороны, увидеть новые важные аспекты, которым до сих пор не придавалось значения. Кроме того, свободное владение языками программирования освобождает мышление из рамок, заданных существующими пакетами анализа данных. Исследователь приобретает возможность ставить вопросы, требующие для ответа произведение нестандартных операций над большими объемами данных.

Системная интеграция предполагает создание средств формального представления информации и оперирования с ней не только на молекулярно-генетическом уровне. Однако вопросы представления морфологических, физиологических и экологических знаний в виде компьютерных программ практически не изучены.

Формальный язык необходим также для целей молекулярно-генетической систематики живых организмов. Классификация организмов на основе последовательности ДНК является важнейшим методом в современной биологической систематике. В настоящее время большинство методов подобного рода ориентируются на сравнение одного короткого фрагмента ДНК у различных организмов. Этот подход может давать некорректные результаты, поскольку короткий фрагмент ДНК не отражает всю совокупность признаков, присущих организму. Поэтому необходимо производить сравнение больших областей ДНК (в идеале - целых геномов) с точки зрения их значения для того или иного организма. Количественное применение такого метода требует наличия способов формального описания "смысла"фрагментов генома, их связи с фенотипом, что, в свою очередь, создает потребность в средствах формального описания фенотипических признаков, и их связи с соответствующими биохимическими процессами.

Вышеизложенное демонстрирует потребность в разработке новых формальных языков для молекулярной биологии, которые были бы пригодны для создания баз данных, моделирования биохимических реакций, биологической систематики и создания программ обработки данных.

Очень желательно, чтобы все эти свойства сочетались в одном языке, или, по крайней мере, существовало бы семейство языков, объединенных принципами построения и сходным синтаксисом.

Создание и развитие таких языков тормозится рядом факторов.

1. Теоретические предпосылки стали очевидны относительно недавно.

2. Широкое распространение готовых пакетов прикладных программ привело к тому, что знакомство ученых-биологов с программированием, теорий информации и вычислительной техникой в целом снизилось. Существование коммерческих пакетов прикладных программ создало ложное впечатление о том, что широкому контингенту исследователей эти знания просто ни к чему, достаточно знать компьютер на уровне пользователя прикладных программ. Это не только противоречит идеям, высказанным на заре компьютерной революции ее основателями [12], но и не соответствует опыту, полученному в 80-х годах, когда распространение компьютеров и средств программирования среди молекулярных биологов привело к получению большого числа принципиально новых результатов.

Целью настоящей работы явилось решение проблемы создания средств формального представления биохимических знаний, пригодных для разработки баз данных, моделирования биохимических реакций и создания программ обработки биохимических данных.

В соответствии с поставленной целью определены задачи диссертационной работы:

1. Изучить основные существующие языки программирования общего назначения и формальные языки, применяемые для моделирования биохимических реакций, с целью выявить набор свойств, которыми должен обладать специализированный формальный язык для представления и обработки биохимических знаний.

2. Изыскать принципы построения формального языка для представления и обработки биохимических знаний.

3. Разработать спецификацию для формального языка, или семейства языков, предназначенных для представления и обработки биохимических знаний, моделирования биохимических реакций и представления описаний живых организмов с целью создания более точных биологических систематик.

4. Реализовать интерпретатор для специфицированных языков, который мог бы осуществлять моделирование биохимических процессов по их описанию, представленному на разработанном языке, а также мог бы выполнять программы обработки экспериментальных данных.

5. Проверить функционирование языка и интерпретатора путем моделирования нескольких биохимических процессов, применения языка для создания систематических описаний некоторой группы живых организмов и написания программы для обработки экспериментальных данных.

На защиту выносятся следующие положения:

1. Живая клетка может быть рассмотрена как вычислительное устройство, управляемое программами на клеточном языке.

2. Архитектура такого вычислительного устройства может быть проанализирована, и найдены принципы языка, хорошо подходящего для программирования такого устройства.

3. Формальный язык, построенный на принципах, полученных в результате изучения архитектуры клеточного устройства, может быть эффективно использован для кодификации биохимических знаний.

4. Использование различных языков программирования для представления биологических процессов способствует более глубокому пониманию данного процесса.

5. Оправданным является дальнейшее изучение влияния формальных языков представления на исследования биохимических процессов

Заключение Диссертация по теме "Биохимия", Тарасов, Денис Станиславович

Основные результаты работы:

1. Разработан язык СРБЬ, обладающий способностью полного и корректного представления информации о метаболических путях в прокариотиче-ской клетке и отдельных метаболических путей в эукариотической клетке.

2. Создан интерпретатор языка СРБЬ, пригодный для моделирования биохимических реакций и их регуляции.

3. Предложен новый способ описания биохимических и морфологических признаков живых организмов, основанный на принципах объектно-ориентироЕ программирования. Установлена предпочтительность описаний, полученных таким способом, по сравнению с принятыми в настоящее время описаниями на естественном языке.

4. Предложен новый метод построения биологической систематики, использующий принципы объектно-ориентированного программирования.

5. Разработан язык ConceptSystem для представления описания биологических объектов и создания программ обработки экспериментальных биохимических данных.

6. Создан интерпретатор, выполняющий программы на языке Сопсер18уз1еш Полученные результаты имеют практическую значимость:

1. Интерпретатор языка СРБЬ может использоваться:

• Для моделирования как отдельных биохимических реакций, так и сложных взаимодействий.

• В учебном процессе: Для иллюстрации функционирования биохимических систем. Для иллюстрации принципов кинетики ферментативных реакций

2. Новый метод представления описаний биологических объектов и построения систематик может быть использован для уточнения существующих биологических классификаций.

3. Язык Сопсер18уз1ет можно использовать для создания программ обработки экспериментальных данных.

По результатам работы можно сделать следующие выводы:

1. Проведенное сравнение существующих формальных языков и их применения к биохимическим задачам показало, что формальный язык биохимии должен обладать свойством биологической конгруэнтности - понятия и конструкции языка должны соответствовать биохимическим сущностям объектам и процессам). В своей основе этот язык должен быть объектно-ориентированным языком программирования с поддержкой баз данных на уровне языка, сильной типизацией, интуитивно понятным синтаксисом и содержать средства обработки больших массивов данных (подобно имеющимся в АРЬ и ,1).

2. Рассмотрение клетки как вычислительного устройства позволяет изучать архитектуру такого вычислительного устройства и соответственно построить язык программирования, оптимально подходящий для программирования такого устройства.

3. В работе разработана и представлена спецификация семейства из двух языков: СРБЬ и ConceptSystem. Язык СРБЬ построен исходя из модели архитектуры клеточного устройства и позволяет компактно описывать различные биохимические процессы. СРБЬ обладает простым и понятным синтаксисом, так что смысл программы на нем может быть понят практикующим биохимиком без длительного обучения и тренировки. ConceptSystem является развитием идей СРБЬ и основывается на тех же принципах, однако в него введены модификации, позволяющие использовать его для создания баз данных и программ обработки результатов эксперимента.

4. Разработан эмулятор биохимического вычислительного устройства, способный выполнять СРОЬ программы. Разработан интерпретатор языка ConceptSystem вместе с графической оболочкой, поддерживающей интерактивный режим работы.

5. На языке СРБЬ описаны процессы протекания простой ферментативной реакции, регуляции лактозного оперона и литического каскада фага лямбда. С помощью языка Сопсер18уз1ет написаны программы анализа данных о генетической структуре популяции, а также создана база данных программ, описывающих изменения морфологических и биохимических признаков модельного объекта (гриба рода Тпс1юс1егта), что позволило сформулировать новый подход к его систематике.

Библиография Диссертация по биологии, кандидата биологических наук, Тарасов, Денис Станиславович, Казань

1. Mishra, B. Systems biology automata and languages // B1.S 2004. — 2004.

2. Trevors, J. Chance and necessity do not explain the origin of life / J. Trevors and D. Abel // Cell Biology International. Vol. - 28. - Pp. 729-739.

3. Butler, D. Everything,everywhere / Declan Butler // Nature. — Vol. — 440. — Pp. 402-405.

4. Szalay, A. Science in an exponential world / Alexander Szalay and Jim Gray // NATURE. Vol. - 440. - Pp. 413-414.

5. Brent, R. Can computers help to explain biology? / Roger Brent and Jehoshua Bruck // Nature. Vol. - 440. - Pp. 416-417.6. 2020 Science Group,. Towards 2020 Science. 2005.http://research.microsoft.com/towards2020science/.

6. Wolfram, S. New Kind of Science / Stephen Wolfram.— Wolfram Media, 2002.-P. 1197.

7. Ji, S. The cell as the smallest dna-based molecular computer / S. Ji // Biosystems. — Vol. — no., 3. — Pp. 123-133.

8. Cardelli, L. Abstract machines of systems biology / Luca Cardelli // Transactions on Computational Systems Biology. — Vol. — 3. — Pp. 145-168.

9. Amdahl, G. Architecture of the ibm system-360 / G. Amdahl and G.A. Blaauw and F.P. Brooks // IBM J. of Research and Development. — Vol. — 8. — Pp. 87101.

10. Tarasov, D. Architecture of cell device // Proceedings of the International Conference on Bioinformatics of Genome Regulation and Structure'2002. — Vol. 3.- 2002.-Pp. 216-218.

11. Engelbart, D. Augmenting human intellect: A conceptual framework: Tech. rep. / Douglas Engelbart.- Menlo Park, California 94025: STANFORD RESEARCH INSTITUTE, 1962.

12. Abelson, H. Structure and Interpretation of Computer Programs / Harold Abelson and Gerald Jay Sussman and Julie Sussman. MIT Electrical Engineering and Computer Science Series. — Cambridge, Massachusetts: MIT Press, 1985. Pp. xx+542.

13. Wing, J. Computational thinking. — 2005. ittp://www.cs.cmu.edu/afs/cs/usr/wing/www/ct-paper.pdf.2005.

14. Matsuno, K. Molecular semantics and the origin of life / Koichiro Matsuno // BioSystems. Vol. - 42. - Pp. 129-139.

15. Rocha, L. M. Evolution with material symbol systems / Luis Mateus Rocha // Biosystems. Vol. - 60. - Pp. 95-121.

16. Yockey, H. P. Origin of life on earth and shannon's theory of communication / Hubert P. Yockey // Computers and Chemistry. — Vol. — 24. — Pp. 105-123.

17. Gurari, E. An Introduction to the Theory of computation / Eitan Gurari. — Computer Science Press, 1989. — P. 314.

18. Hopcroft, J. E. Introduction to Automata Theory, Languages, and Computation. / J. E. Hopcroft and R. Motwani and J. D. Ullman. — New York: Addison Wesley, 2001. P. 521.

19. Harel, D. Statecharts: a visual formalism for complex systems / D. Harel // Science of computer programming. — Vol. — 8. — Pp. 231-274.

20. Russell, B. The Principles of Mathematics / Bertrand Russell. — 2 edition. — London: George Allen and Unwin, 1937.

21. Irvine, A. D. Russells paradox / A. D. Irvine // The Stanford Encyclopedia of

22. Philosophy. — Summer 2004. http://plato.stanford.edu/archives/sum2004/entries/russell-paradox/.

23. Zach, R. Hilberts program / Richard Zach // The Stanford Encyclopedia of

24. Philosophy. 2003. littp://plato.stanford.edu/archives/fall2003/entries/hilbert-program /.

25. Godel, K. On formally undecidable propositions of principia mathematica and related systems / K. Godel // From Frege to Godel: A Source Book in Mathematical Logic. 1967. - Pp. 592-617.

26. Turing, A. M. Computability and lambda-definability / A. M. Turing // Journal of Symbolic Logic. — Vol. — 2. — Pp. 153-163.

27. Kleene,. Recursive predicates and quantifiers / Kleene // Martin Davis, The Undecidable. — New York: Raven Press, 1965.

28. Turing, A. M. Systems of logic based on ordinals / A. M. Turing // Proceedings of the London Mathematical Society. Second Series. — Vol. — 45. — Pp. 161-228.

29. Durand-Lose, J. Abstract geometrical computation for black hole computation // MCU. — Vol. 3354 of Lecture Notes in Computer Science. — Springer, 2004. Pp. 176-187.

30. Shagrir, 0. Super-tasks, accelerating turing machines and uncomputability / Oron Shagrir // Theor. Comput. Sci- Vol.- no., 1-3.- Pp. 105-114.http://dx.doi.org/10.1016/j.tcs.2003.12.007.

31. Siegelmann, H. T. The simple dynamics of super turing theories / Hava T. Siegelmann // Theor. Comput. Sci- Vol.- no., 2.- Pp. 461-472.http://dx.doi.org/10.1016/S0304-3975(96)00087-4.

32. Longo, G. Computer modelling and natural phenomena // Proceedings of the European Software Engineering Conference. — Helsinki, Finland: 2003.

33. Garay, L. J. Quantum gravity and minimum length / Luis J. Garay // International Journal of Modern Physics A.— Vol.— 10.— P. 145.http: //www.citebase.org/abstract?id=oai:arXiv.org:gr-qc/9403008.

34. Calmet, X. Minimum length from quantum mechanics and classical general relativity / Xavier Calmet and Michael Graesser and Stephen D. H Hsu // Physical Review Letters.- Vol.- no., 21.- P. 211101.http://link.aps.org/abstract/PRL/v93/e211101.

35. Minsky, M. Tech. Rep.: AIM-647 / Marvin Minsky: MIT Artificial Intelligence Laboratory, 1981.

36. Fredkin, E. Digital mechanics: An informational process based on reversible universal CA / E. Fredkin // Physica D. Vol. - 45. - P. 254.

37. Schmidhuber, J. A computer scientist's view of life, the universe, and everything / Jiirgen Schmidhuber / / Lecture Notes in Computer Science.- Vol.- 1337.- Pp. 201-208. http://link.springerny.com/link/service/series/0558/bibs/1337/13370201.htra.

38. Chance, B. The kinetics of the enzyme-substrate compound of peroxidase. 1943 / Chance, B // Adv Enzymol Relat Areas Mol Biol Vol. - 73. - Pp. 323. — Biography.

39. Gillespie, D. Exact stochastic simulation of coupled chemical reaction / D.T. Gillespie // J. Phys. Chem. 1977. - Pp. 2340-2361.

40. Turner, T. E. Stochastic approaches for modelling in vivo reactions / T. E. Turner and S. Schnell and K.Burrage // Computational Biology and Chemistry. Vol. - 28. - Pp. 165-178.

41. Grima, R. A systematic investigation of the rate laws valid in intracellular environments / Grima, R and Schnell, S // Biophys Chem.— Vol. — no., 1.— Pp. 1-10.

42. Berry, H. Monte carlo simulations of enzyme reactions in two dimensions: fractal kinetics and spatial segregation / Berry, Hugues // Biophys J. — Vol. — no., 4.-Pp. 1891-1901.

43. Jones, M. P. The Hugs 98 user manual. — 1999. — Available fromhttp://www.haskell.org/hugs/.

44. Vaught, A. Gnu Fortran — it's free crunch time / Andy Vaught // ACM Fortran Forum. — Vol. — no., 3. — Pp. 13-14.

45. Diaz, D. The GNU prolog system and its implementation // SAC (2).— 2000. Pp. 728-732.

46. Amzi!,. Amzi! prolog + logic server. — 2003. http://www.amzi.com.50. von Neumann, J. First draft of a report on the EDVAC: Tech. rep. / J. von Neumann: University of Pennsylvania, 1945. —

47. The report that got von Neumann's name associated with the serial, stored-program, general purpose, digital architecture upon which 99.99% of all computers today are based.

48. Page, C. The professional programmers guide to Fortran 77 / Clive Page. The Professional programmers guide to-. — pub-PITMAN:adr: Pitman Publishing Ltd., 1988.-P. 180.

49. ANSI X3J3/S8.115,. Fortran 90.- 1990.

50. Adams, J. C. Fortran 90 Handbook Complete ANSI ISO Reference / Jeanne C. Adams and Walter S. Brainerd and Jeanne T. Martin.— McGraw Hill, 1992. P. 740.

51. Hudak, P. Conception, evolution and application of functional programming languages. / P. Hudak // Gomp. Surveys. — Vol. — no., 3. — Pp. 359-411.

52. Church, A. The Calculi of Lambda Conversion / A. Church. — Princeton, N.J.: Princeton University Press, 1941. — Vol. 6 of Annals of Mathematics Studies. — P. 108. — Reprinted by Klaus Reprint Corp., New York in 1965.

53. McCarthy, J. Recursive functions of symbolic expressions and their computation by machine, part 1 / J. McCarthy // Comm. A.C.M.— Vol.— 3. Pp. 184-195.

54. Hart, T. Tech. Rep.: AIM-39 / T. Hart and M. Levin: MIT Artificial1.telligence Laboratory, 1962. ftp://publications.ai.mit.edu/ai-publications/pdf/AIM-039.pdf.

55. Steele, Jr., G. L. COMMON LISP: the language / Guy L. Steele, Jr. Second edition. - 12 Crosby Drive, Bedford, MA 01730, USA: Digital Press, 1990. -Pp. xxiii + 1029.

56. Kelsey, R. Revised5 report on the algorithmic language Scheme / Richard Kelsey and William Clinger and Jonathan Rees editors] // Higher-Order and Symbolic Computation.— Vol.— no., 1.— Pp. 7-104.— Also appeared in SIGPLAN Notices 33:9, September 1998.

57. Haskell 98 Language and Libraries, the Revised Report. — CUP, 2003. — P. 272.

58. Malpas, J. Prolog: a Relational Language and Its Applications / John Malpas. Prentice-Hall, 1987. - P. 460.

59. McCarthy, J. Programs with common sense / John McCarthy // Semantic information processing. — MIT press, 1968. — Pp. 410-418.

60. Robinson, A. A machine-oriented logic based on resolution principle / Alan Robinson // Journal of the ACM. Vol. - 12. - Pp. 23-41.

61. Hewitt, C. PLANNER: A language for proving theorems in robots // IJCAI. — 1969.-Pp. 295-302.

62. Colmerauer, A. The birth of Prolog / A. Colmerauer and P. Roussel // SIGPLAN Notices. Vol. - no., 3. - Pp. 37-52.

63. Warren, D. H. D. Tech. Rep.: 309 / David H. D. Warren: SRI International, 1983.

64. Warren, D. H. D. PROLOG: The language and its implementation compared with LISP / D. H. D. Warren and L. M. Pereira and F. Pereira // SIGPLAN Notices. Vol. - no., 8. - Pp. 109-115.

65. Rosenblueth, D. A. Syntactic recognition of regulatory regions in Escherichia coli / Rosenblueth, D A and Thieffry, D and Huerta, A M and Salgado, H and Collado-Vides, J // Comput Appl Biosci — Vol. — no., 5. — Pp. 415-422.

66. Dong, S. Gene structure prediction by linguistic methods / Dong, S and Searls, D B // Genomics. Vol. - no., 3. - Pp. 540-551.

67. Birtwistle, G. M. Simula Begin / G. M. Birtwistle and O.-J. Dahl and B. Myhrhaug and K. Nygaard.— Philadelphia: Studentlitteratur Auerbach, 1973.-P. 391.

68. Dahl, O.-J. The birth of object orientation: the Simula languages // Essays in Memory of Ole-Johan Dahl.— Vol. 2635 of Lecture Notes in Computer Science. — Springer, 2004. — Pp. 15-25.

69. Dahl, O.-J. Simula: An ALGOL-based simulation language / O.-J. Dahl and K. Nygaard // Communications of the ACM. — Vol. — no., 9. Pp. 671-678.

70. Dahl, O.-J.,. Publication: S-2 / Dahl, O.-J. and Bj0rn Myhrhaug and Kristen Nygaard. — Oslo, Norway: Norwegian Computing Center, 1968.

71. Goldberg, A. Smalltalk 80: The Language and its Implementation / A. Goldberg and D. Robson. Addison-Wesley, 1983. - P. 736.

72. Kay, A. Technical Report: SSL-76-6 / A. Kay and A. Goldberg. Palo Alto (CA), USA: Xerox PARC, 1976.

73. Kay, A. C. The Reactive Engine: Ph.D. thesis / Dept. of Electrical Engineering, Computer Science,University of Utah.— Ann Arbor, Michigan, 1969.

74. Kay, A. C. The early history of Smalltalk 11 ACM SIGPLAN Notices. -Vol. 28. ACM Press, 1993. - Pp. 69-95.

75. Stroustrup, B. A history of C++: 1979-1991 // Proceedings of the Conference on History of Programming Languages. — Vol. 28(3) of ACM Sigplan Notices. — New York, NY, USA: ACM Press, 1993. Pp. 271-298.

76. Gofen, A. From Pascal to Delphi to Object Pascal-2000 / Alexander Gofen // ACM SIGPLAN Notices. Vol. - no., 6. - Pp. 38-49.

77. Gosling, J. The Java Language Specification / James Gosling and Bill Joy and Guy Steele. The Java Series.- Addison-Wesley, 1997.- P. 864.http://java.sun.com/docs/books/jls/html/.

78. Eliëns, A. Principles of Object-Oriented Software Development / Anton Eliëns. — second edition. — Addison-Wesley, 2000.

79. Hunt, J. SmallTalk and object orientation / John Hunt. — Springer-Verlag, 1997. P. 378.

80. Ungar, D. SELF: The power of simplicity / David Ungar and Randall B. Smith // Lisp and Symbolic Computation. — Vol. — no., 3. — Pp. 187-205.

81. Hopkins, T. Smalltalk: An Introduction to Application Development using Visualworks / Trevor Hopkins and Bernard Horan. — Prentice-Hall, 1995.

82. Cincom Smalltalk. — 2003. — http://www.cincomsmalltalk.com/.

83. Brant, J. ^Smalltalk (Sharp Smalltalk).-http://www.refactory.com/Software/SharpSmalltalk/.http://www.refactory.com/Software/SharpSmalltalk/.

84. Ingalls, D. Back to the future: The story of Squeak, A practical Smalltalk written in itself // Proceedings OOPSLA '97, ACM SIGPLAN Notices. ACM Press, 1997. - Pp. 318-326.

85. Finney, A. Systems biology markup language: Level 2 and beyond / A. Finney and M. Hucka. Vol. - 31. - Pp. 1472-1473.

86. Nielsen, P. The evolution of CellML / Nielsen, P and Halstead, M // Conf Proc IEEE Eng Med Biol Soc. Vol. - 7. - Pp. 5411-5414.

87. Calzone, L. BIOCHAM: an environment for modeling biological systems and formalizing experimental knowledge / Calzone, Laurence and Fages, Francois and Soliman, Sylvain // Bioinformatics. — Vol. — no., 14. — Pp. 1805-1807.

88. Le Novere, N. STOCHSIM: modelling of stochastic biomolecular processes / Le Novere, N and Shimizu, T S // Bioinformatics. — Vol. — no., 6. — Pp. 575576.

89. Milner, R. Communicating and Mobile Systems : The 7r-Calculus / Robin Milner. — Cambridge University Press, 1999.

90. Ji, S. The linguistics of dna: Words,sentences, grammar,phonetics and semantics / Singchul Ji // Molecular Strategies in Biological Evolution.— 1999.-Pp. 411-417.

91. Kubicek, C. P. Trichoderma and Gliocladium, Basic Biology, Taxonomy and Genetics / Kubicek, C. P. and Harman, G E. — Taylor and Francis, 1998. — P. 278.

92. Chaverri, P. Hypocrea-trichoderma: species with conidiophore elongations and green conidia / P. Chaverri, and L. A. Castlebury and B.E. Overton and G.J.Samuels // Mycologia. Vol. - no., 6. - Pp. 1100-1140.

93. Druzhinina, I. 2005 spicies concept and biodiversity in trichoderma and hypocrea: from aggregate species to species clusters / I. Druzhinina and C.P. Kubicek // J. Zhigiang Univ SCI. Vol. - 6. - Pp. 100-112.

94. McCabe, T. A complexity measure / Thomas McCabe // Vol.— 6.— Pp. 308-320.

95. Chidamber, S. A metrics suite for object oriented design / S. Chidamber and C. Kemerer // IEEE Transactions on Software Engineering. — Vol. — no., 6. — Pp. 476-493.

96. Henderson-Sellers, B. Object-Oriented Metrics: Measures of Complexity / Brian Henderson-Sellers. — Prentice-Hall, 1996.