Бесплатный автореферат и диссертация по биологии на тему
Методы и алгоритмы визуализации структурных и динамических данных, характеризующих макромолекулярные структуры
ВАК РФ 03.01.02, Биофизика
Автореферат диссертации по теме "Методы и алгоритмы визуализации структурных и динамических данных, характеризующих макромолекулярные структуры"
На правах рукописи
Филиппов Сергей Валерьевич
Методы и алгоритмы визуализации структурных и динамических данных, характеризующих макромолекулярные структуры
Специальность 03.01.02 - биофизика
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук
•| Г Г< ори
Пущино - 2014
00554783Ь
005547836
Работа выполнена в Федеральном государственном бюджетном учреждении науки Институте математических проблем биологии Российской академии наук, г.Пущино Московской области.
Научные доктор физико-математических наук
руководители: Устинин Михаил Николаевич
доктор физико-математических наук, профессор Полтев Валерий Иванович
Официальные
оппоненты:
Ведущая организация:
доктор физико-математических наук, профессор Ризниченко Галина Юрьевна
(зав сектором информатики и биофизики сложных систем кафедры биофизики биологического ф-та МГУ им. М.В. Ломоносова, г.Москва)
доктор биологически наук Сивожелезов Виктор Семенович
(ведущий научный сотрудник лаборатории молекулярной физиологии клетки ИБК РАН, г.Пущино)
Центр фундаментальных исследований Национального исследовательского центра «Курчатовский институт»
Защита состоится «_
Л» МЕЖ
£ 2014 г. в 15:30 на заседании совета Д 002.093.01 по защите диссертаций на соискание ученой степени кандидата наук при Федеральном государственном бюджетном учреждении науки Институте теоретической и экспериментальной биофизики Российской академии наук по адресу: ул. Институтская, 3, г. Пущино, 142290, Московская область.
С диссертацией можно ознакомиться в Центральной библиотеке НЦБИ РАН по адресу: ул. Институтская, 3, г. Пущино, 142290, Московская область, и на сайте ИТЭБ РАН: http://web.iteb.psn.ru.
Автореферат разослан «
, 2 3> ДПР 201**
2014 г.
Ученый секретарь диссертационного совета, к.ф.-м.н.
Панина Н.Ф.
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ Актуальность темы
Визуализация научных данных — один из наиболее широко распространенных методов, применяемых современными исследователями. Особую роль играет визуализация в молекулярной биологии, объекты исследования которой характеризуются сложностью и недоступностью для прямого наблюдения. Справедливость вышесказанного подтверждается большим количеством программных пакетов, предназначенных для визуализации молекулярных моделей, например, RasMol, PyMol, VMD, Swiss-PdbViewer и другие. Разносторонний характер данных, подлежащих отображению диктует необходимость в разнообразных способах представления информации. Существующие пакеты молекулярной графики во многих случая недостаточно адекватно и эффективно представляют структуры и формы биологических систем и тем более, протекающих в этих системах процессов.
С другой стороны, универсальные пакеты 3D графики не достаточно хорошо приспособлены для визуализации научных данных, но при этом адекватно представляют решения многих технологических задач. Данное ограничение этих пакетов 3 D-графики преодолевается с помощью добавления к ним программных модулей (plug-in). Примеры таких программных модулей уже существуют для многих ЗО-редакторов, например, PDBImp для 3D Studio MAX, PDB by Jyrki Hokkanen для Realsoft 3D и Atomic Blender. В настоящее время эти программные модули используют лишь малую часть математического аппарата ЗО-редакторов.
Таким образом, сохраняется актуальность задачи по разработке методов, алгоритмов и программ, предоставляющих исследователю специализированные инструменты для работы с молекулярными моделями. Поэтому целью нашей работы является разработка методов и алгоритмов визуализации, которые дополняют и расширяют границы применимости существующих методов визуализации и будут полезны при решении задач клеточной и молекулярной биологии.
Цель и основные задачи диссертационной работы:
• Разработка методов и программных средств, которые интегрируют численные и аналитические методы представления структур и форм макромолекул и макромолекулярных систем.
• Исследование конформационных возможностей нативных дуплексов ДНК методом теоретического конформационного анализа.
• Разработка нового метода быстрой оценки степени гидратации макромолекул.
• Разработка методов и программных средств визуализации ЗП-данных, характеризующих структуры и свойства макромолекул и макромолекулярных систем.
• Визуализация параметров и величин описывающих динамику макромолекул и макромолекулярных систем.
Научная новизна и практическая значимость диссертационной работы
Методом теоретического конформационного анализа и расчета стерически доступных поверхностей гидрофильных атомов выполнено исследование конформационных возможностей моделей нативных олигонуклеотидных дуплексов ДНК с чередующейся пурин-пиримидиновой последовательностью. Эти последовательности очень часто встречаются в геномах многих организмов и направляют ход регуляции генной экспрессии. Поэтому изучение их конформационных особенностей и их физико-химических свойств является актуальной задачей.
Нами был разработаны методы и реализованные в компьютерных программах алгоритмы для построения и визуализации молекулярных моделей, которые интегрируют численные и аналитические способы представления структур и форм макромолекул и макромолекулярных систем.
Предложен метод и реализованный в компьютерной программе алгоритм быстрой и эффективной оценки в первом приближении степени и характера гидратации биологических макромолекул на основе расчета доступного растворителю объема. Метод был применен для решения задачи о конформациях дуплекса ДНК содержащего участки poly(dG):poly(dC).
Нами были также разработаны алгоритмы и реализующие их компьютерные программы для построения трехмерных моделей биологических макромолекул в среде графических программных пакетов ЗО-моделирования, анимации и визуализации, что позволило качественно улучшить графическое представление молекулярных моделей и выполнять визуализацию их конформационной динамики.
Были разработаны методы и средства синхронизированного и совмещенного показа разнородных по своей природе научных данных.
Разработан метод, алгоритмы и реализующий их программный комплекс, позволяющий в среде Cinema 4D визуализировать 3D- и динамические характеристики макромолекул.
Апробация работы
Результаты работы были представлены на II открытой городской научной конференции молодых ученых города Пущино, 1997; IV Пущинской конференции молодых ученых, Пущино, 1999; семинаре ИМПБ РАН, 2008, двух семинарах на кафедре биофизики биологического факультета МГУ, 2008; 16-й Международной Пущинской школе-конференции молодых ученых, Пущино, 2012; на двух семинарах в ИТЭБ РАН, 2013; на семинаре ВЦ РАН, 2013.
Публикации
Материалы диссертации опубликованы в 20 научных работах: из них в рецензируемых международных журналах - 2 статьи, в рецензируемых российских журналах - 3 статьи, из них по списку ВАК - 3 статьи, в сборниках - 2 статьи, а также в материалах 14 научных конференций.
ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ
Во введении
Обоснована актуальность развития методов и алгоритмов визуализации макромолекул и макромолекулярных систем и их динамического поведения при постановке и решении задач молекулярной и физико-химической биологии.
В первой главе
Проведен анализ и классификация основных способов визуального представления разнообразных по характеру научных данных. Систематизированы основные методы и приемы визуализации, основанной на синтезе изображений с помощью вычислительной техники. Приведена терминология, устоявшаяся в области компьютерной графики.
Важнейшей частью главы является обзор наиболее распространенных в научно-исследовательской среде программных средств визуализации таких научных данных, как пространственные структуры биологических макромолекул, а также средства визуализации 3D- (трехмерных) функций.
Вторая глава посвящена обсуждению результатов моделирования низкоэнергетических конформаций нативного дуплекса ДНК с последовательностью d(CGCATGCGTACGC):d(GCGTACGCATGCG) для исследований изменения конформации и стабильности двойной спирали ДНК при генотоксической модификации оснований. С использованием программы CONAN [1а], а также метода Ли и Ричардса [2а] для оценки стерической доступности гидрофильных атомов (кислорода дезоксирибозы) были найдены три низкоэнергетические конформации, принадлежащие семейству B-формы ДНК. Хотя результаты расчетов и имеющиеся экспериментальные данные не позволяют нам однозначно оценить, какие из этих конформаций осуществляют биологическую функцию этого дуплекса, возможно, все три конформации могут участвовать в процессе его функционирования в генной экспрессии. В настоящее время вопрос этот остается открытым.
Характеристики найденной структуры пригодны для сравнения с соответствующими характеристиками дуплексов, содержащих неправильные пары естественных оснований и пары, образованные с участием 8-оксигуанина и 2-аминопурина, для которых имеются экспериментальные данные о термодинамической стабильности.
В дальнейшем трехмерная модель рассчитанного дуплекса была использована для аналитической визуализации результатов моделирования переноса дырки (электрона) в молекуле ДНК.
Основные результаты:
1. Методом теоретического конформационного анализа были найдены низкоэнергетические конформации дуплекса ДНК d(CGCATGCGTACGC): d(GCGTACGCATGCG). Бьши охарактеризованы и проинтерпретированы конформационные параметры этого дуплекса.
2. Методом Ли и Ричардса была проведена оценка степени гидратации дуплекса ДНК d(CGCATGCGTACGC): d(GCGTACGCATGCG). Были найдены три низкоэнергетические конформации, принадлежащие семейству В-формы ДНК.
3. Вычисленные структурные характеристики дуплекса d(CGCATGCGTACGC): d(GCGTACGCATGCG) сравниваются с вычисленными характеристиками дуплексов, содержащих неправильные пары естественных оснований и пары, образованные с участием 8-оксигуанина и 2-аминопурина, для которых имеются экспериментальные данные об их термодинамической стабильности.
Третья глава описывает работу по созданию метода построения молекулярных моделей и их динамической визуализации в среде трехмерных графических пакетов и компьютерной программы MolWorld. Созданная компьютерная программа удовлетворяет следующим требованиям:
• Возможность визуального представления молекулярных структур в виде шаростержневых, скелетных и ван-дер-ваальсовых моделей (традиционно используемых в молекулярном моделировании).
• Программно-аппаратная платформа: Win32-x86.
• Поддержка аппаратного ускорения ЗО-графики посредством API - OpenGL для реализации возможностей показа и манипулирования молекулярной моделью в реальном масштабе времени.
• Развитый графический интерфейс пользователя.
• Интегрированные в программу функции: конверсия форматов записи молекулярных моделей, возможности ручного редактирования PDB-файлов, некоторые сервисные расчеты и т.п.
• Основной входной формат описания молекулярных моделей - PDB.
• Автоматическое определение и «расстановка» ковалентных связей для возможной визуализации «нестандартных» молекул и PDB-файлов, не отвечающих спецификации в полном объеме. Предложены средства обработки ошибок во входных файлах.
• Отсутствие программных ограничений на количество обрабатываемых данных (размер макромолекул).
• Построение визуально «корректных» шаростержневых моделей.
• Наличие возможностей для навигации в трехмерном пространстве: сдвиг, поворот и масштабирование.
Экспорт в среду 3D графических пакетов геометрических данных построенной молекулярной модели в формате VRML для обеспечения возможностей динамической визуализации (анимации) и рендеринга.
С помощью разработанной программы была выполнена динамическая визуализация (рис. 1) результата математического моделирования переноса дырки (электрона) в нуклеотидных последовательностях [За]. Для целей этой работы была разработана и применена методика совмещенного показа разнородных данных (рис. 2).
Коа эксперимента 000049 Количество сайтов (N) 200, Расчетная параметр ВЕРОЯТНОСТЬ Начало расчета 0 ООО ее* Окончание расчета 39997 ООО се* Шаг расчета 1 ООО се» Масштаб просмотра 250 X, Шаг просмотра 20 СЮО сек
Текущая точка просмотра (сек I 31600.СИХ)
Рис. 1. Интегрированный синхронный показ разнородных данных, демонстрирующих результаты численного эксперимента, выполненного согласно математической модели переноса дырки (электрона) в молекуле нуклеиновой кислоты. По оси абсцисс — расстояние вдоль оси спирали от выбранного начала координат. По оси ординат — распределение электронной плотности.
Полученная нами ранее низкоэнергетическая конформация структуры дуплекса ДНК средствами программного комплекса CONAN была переведена из аналитической формы описания в численную. На основе этого описания с помощью разработанной нами программы MolWorld была построена трехмерная шаростержневая модель дуплекса ДНК. Динамическая визуализация полученной трехмерной модели была выполнена в программе 3D Studio МАХ. Синхронизированное сведение различных видеослоев и анимация распределения заряда по нуклеотидной последовательности ДНК было выполнено в программе-
композере discreet Combustion. В этой же программе был получен результирующий видеофрагмент.
Универсальность разработанного нами подхода к визуализации молекулярных моделей была также продемонстрирована в работе по созданию динамической визуализации липопротеиновой частицы низкой плотности (рис. 3), пространственная структура которой была определена методом рентгеноструктурного анализа [4а, 5а].
Рисунок 2. Блок-схема, иллюстрирующая методику и технологическую цепочку совмещенного и синхронного показа разнородных данных.
Основные результаты:
1. Разработаны методы динамической визуализации молекулярных структур и процессов на основе интегрированного представления разнородных, структурных и динамических данных.
2. На основе разработанных методов и программ была выполнена аналитическая визуализация процесса переноса заряда в модели ДНК и визуализации липопротеиновой частицы низкой плотности.
Четвертая глава описывает работу по разработке принципов конструирования численных и аналитических молекулярных моделей, а также построению и написанию компьютерной программы РБВТоок, реализующей эти принципы.
В ходе выполнения работы, описанной во второй и третьей главах нами был пересмотрен традиционный подход к построению и визуализации молекулярных моделей. Мы сформулировали принципы расширенного построения моделей, и на основе этих принципов предложили способ построения «активных» молекулярных моделей.
Рис. 3. Трехмерная структура липопротеиновой частицы низкой плотности, построенная программой Мо1Шог1с1 и визуализированная в среде ЗЭ ЭМо МАХ. Желтым цветом показана белковая оболочка частицы, фиолетовым — липидное ядро.
В основу предложенного нами способа модельного представления молекулярных структур положено два основных принципа:
1. При построении структуры молекулярной модели в ее формализованное описание закладывается не только пространственная (геометрическая) информация (например, координаты атомов) и функциональная (типы атомов), что в совокупности нами причисляется к «численной» части описания молекулярной модели, а также неразрывно связанная с ней «аналитическая» часть описания, представляющая собой иерархическую структуру, описывающую взаимосвязи между атомами, формирующими молекулярную модель.
2. Для каждого структурного элемента, описывающего элементарную часть молекулярной модели назначается любой необходимый набор вспомогательных свойств, ограничений (например, геометрических, таких
как ограничения на величины валентных и торсионных углов, длины связей, расстояния между атомами) и даже автономных программных модулей. Эти программные модули, будучи помещены в программную среду графического пакета, приводят к тому, что они могут самостоятельно отслеживает соблюдение основных правил «молекулярной механики».
В первом приближении вышеизложенные принципы были реализованы в компьютерной программе PDBTools. Основные характеристики программы таковы:
• Гибкость интерпретатора форматов входных файлов, позволяющая использовать нестандартные форматы файлов.
• Отсутствие ограничений на сложность молекулярных моделей: число атомов, структурных групп, граф связанности атомов и т.д.
• Алгоритмическое определение и «расстановка» ковалентных связей, а также определение фрагментов и циклических структур, имеющих первостепенное значения для корректного построения иерархических структур, соответствующих молекулярным.
• Построение шаростержневых моделей, обладающих «автономностью» при выполнении базовых трансформаций, выполняемых методами прямой и обратной кинематики.
• Оптимизация геометрии моделей.
• Использование настраиваемых полигональных и NURBS примитивов.
• Независимость от вычислительной платформы, позволяющая запускать программу на многопроцессорных параллельных вычислительных системах, способствующих росту сложности моделируемых и визуализируемых процессов.
• Сохранение молекулярных моделей в формате RenderMan с поддержкой базовых возможностей анимации молекулярной модели, для визуализации в пакетном режиме с использованием ресурсов суперкомпьютеров.
• Генерация MEL-скрипта, строящего молекулярные модели в среде пакета 3D-моделирования, анимации и рендеринга Maya, дающая широкие возможности визуализации структур и процессов.
• Построение «скелета» молекулярной модели из деформаторов типа bone, наделяющее программу возможностями трансформации молекулярной поверхности с помощью этого «скелета».
• Наложение определенных ограничивающих условий трансформации, позволяющих оставлять неизменными те углы и расстояния, которые не должны изменяться в процессе моделирования конформационных изменений молекулярной модели.
• Возможность включения в генерируемую программу построения молекулярной модели на MEL траекторий всех атомов.
На рис.4 показана схема работы программы PDBTools при построении иерархической шаростержневой модели со «скелетом» с последующей записью этой модели как MEL-программы.
Обработка параметров командной строки
Считывание файла, описывающего молекулярную модель, интерпретация формата, запись в динамически расширяемый (ДР) список
Первичная обработка получаемых данных
1. Определение типов атомов согласно локальной базе данных (БД) 4. Определение числа ковалентных связей и выделение памяти для массивов указателей на атомы, ковалентно связанные с текущим
2. Заполнение «оптимизирующих полей» элементов списка атомов указателями на локальной БД 5. Заполнение «оптимизирующих полей» элементов ДР-списка
3. Определение и расстановка ковалентных связей 6. Определение «фрагментов» - цепочек атомов, соединенных ковалентными связями
1
Начало записи MEL-программы построения молекулярной модели в файл
Запись MEL-команд, создающих визуальные характеристики каждого типа атомов
I
Начало рекурсивного обхода всех ковалентно связанных атомов «фрагмента»
Генерация и запись команд создания «шарнира» в точке с координатами текущего атома
¡.атСогеЬапП | А1от_4_Р_185^хм*Сопа1«»И1 |.
joint |Р_4_185
Join«
DiawStyie ¡Bone _•») Radus [1000 Desees о» Freedom f* X P Y P Z Stiffnest (OOOO pOO |0 000
Preletied Angle pC
poo poo-
Join! Orient ¡0.000 [OOOO ¡0.000 Г Segment Scale Compénsale
Установка для созданного «шарнира» ограничений на масштабирование
jJ Scale Min Curen. Max
Scale Lim»X F {1.00 < ¡1.00 > ¡1.00 я
Scale Limit Y W ¡1.00 < |1.00 > ¡1.00 \f
Scale Limit 2 lv ¡1.00 < ¡1.00 > |1.00 fi?
Функция необходима для предотвращения искажения модели при манипуляциях с ней в среде Maya
Запись команд построения сферы соответствующего радиуса, обозначающей атом (полигональной или NURBS в зависимости от настроек программы). Если это первый экземпляр атома данного типа, то создаваемая сфера
Deg.ee 1П/ [3 [3
Рент и | Ореп | Рост V | Регю<Лс _|
— реальный объект. В ином случае — ссылка на реальный объект-сферу
rubsSurface: ¡Atom_4_P_18!
^J NURBS Surface Hitl
Min Max Range U ¡0000 (ЙЙ Mr Max Range V ¡0.000 [Í&000
Spans UV [8 fl6
Запись команд,
приписывающих
созданной сфере
визуальные
характеристики
атома
Запись команд «привязки» сферы к «шарниру» для обеспечения возможностей трансформаций средствами прямой и обратной кинематики в среде Maya
Запись MEL-команд построения и трансформации цилиндра, соответствующего ковалентной связи
Запись MEL-команд, направляющих ось цилиндра на второй из двух связанных атомов.
Это «нацеливание» продолжает работать в реальном масштабе времени при манипуляциях с моделью в среде Maya
Завершение рекурсивного «обхода» всех ковалентно связанных атомов «фрагмента»
I
Запуск процедуры обнаружения циклических кольцевых структур (работа функции основана на установке флага, сигнализирующего о том, что связь с этим атомом уже построена, во время рекурсивного «обхода» ковалентно связанных атомов)
Последовательный поиск среди всех атомов тех, для которых флаг ковалентной связи не был установлен
Запись замыкающих циклическую кольцевую структуру команд (построения «шарнирного» узла, ограничений на трансформации масштабирования, цилиндра, соответствующего ковалентной связи и его направлению)
Рисунок 4. Схема работы PDBTools при записи сцены на MEL.
PDBTools наделена функцией автономной работы без использования 3D-графического пакета. В таком режиме программа записывает построенную ей молекулярную модель и заданный в ее текстовом конфигурационном файле «анимационный сценарий» в виде файла, соответствующего спецификации RenderMan.
Для визуализации задач молекулярной динамики в PDBTools была включена возможность записи в программу на MEL команд покадровой трансформации координат каждого атома молекулярной модели согласно данным из серии мгновенных «снимков/слепков» конформационного состояния молекулярной системы (рис. 5).
Рисунок 5. Воссозданные с помощью РОВТоо1з траектории атомов, рассчитанные методами молекулярной динамики. Крестиками показаны точки в пространстве, соответствующие координатам центров атомов. Числа возле точек, обозначенных крестиками соответствуют номеру кадра.
С помощью программы PDBTools была выполнена динамическая визуализация липопротеиновой частицы высокого разрешения, динамическая визуализация результатов расчета молекулярной динамики ферредоксина Peptococus aerogenes [6а, 7а].
Комплексное использование всех возможностей программы PDBTools было реализовано при подготовке демонстрации одного из возможных механизмов прениляции (посттрансляционной модификации) геранил-геранил трансферазой белка Rab7GDP в живой клетке [8а, 9а].
Основные результаты:
1 Разработаны методы и алгоритмы построения и динамической визуализации молекулярных моделей в среде 3D графических пакетов, которые позволяют рассматривать как структурные, так и динамические характеристики системы.
2 С помощью разработанных методов и программ была выполнена визуализация:
0 Конформационных изменений геранил-геранил трансферазы и демонстрации одного из возможных механизмов прениляции (посттрансляционной модификации) геранил-геранил трансферазой белка Rab7GDP в живой клетке;
° Результатов расчета молекулярной динамики ферредоксина Peptococus aerogenes.
Глава 5 описывает работу по созданию метода быстрой оценки гидратации первого слоя с помощью расчета доступного растворителю объема, а также написанию программы AccVol, реализующей данный метод.
Суть метода состоит в том, чтобы количественно оценить доступные растворителю объемы сферического слоя, образованного сферой минимального радиуса R min и сферой максимального радиуса R max. Где R min - расстояние,
ближе которого молекула растворителя не может подойти к гидрофильному атому, а R max - расстояние, дальше которого молекула воды уже не может образовать водородную связь.
Метод был реализован в написанной на языке C/C++ программе AccVol (Accessibility Volume). Данная программа позволяет количественно оценить доступные растворителю объемы сферического слоя, а также способна находить области перекрывания доступных растворителю объемов двух и более гидрофильных атомов, которые можно расценивать как индикаторы возможного образования в данных местах структур, называемых «водными сшивками» или «водными мостиками» (рис. 8). Такие, обнаруженные программой, области указывают на наиболее вероятное место нахождения молекул связанной воды, играющей важную роль в формировании и стабилизации конформационных состояний биологических макромолекул in vivo. Эти же области коррелируют со структурами, обнаруживаемыми в рентгеноструктурных исследованиях кристаллов дуплексов ДНК, где они являются важными элементами гидратной оболочки молекул.
Программа выполнена в виде консольного Шт32-приложения, блок-схема которого представлена на рис. 9. Управление программой осуществляется с помощью конфигурационных файлов, что делает возможным пакетный режим работы программы, обеспечивает воспроизводимость результатов и автоматизацию серийных экспериментов.
Разработанный нами метод оценки степени гидратации молекул был использован при «сканировании» конформационного пространства по двум спиральным параметрам методом минимизации потенциальной энергии дуплекса ро1у((Юц):ро1у(с1Си). Выявлены корреляции между углом наклона плоскости основания и шагом спирали. Для гидрофильных атомов гликозидного желоба дуплекса ДНК исследованы вариации доступных растворителю объемов. Выявлено уменьшение «доступностей»
Рисунок 8. Иллюстрация, показывающая сферические слои вокруг двух выбранных гидрофильных атомов аденина. Непрозрачный сегмент желтого цвета соответствуют найденной программой Асс\/о1 области перекрывания доступных растворителю объемов гидрофильных атомов.
гидрофильных атомов оснований и, наоборот, их увеличение для кислородов дезоксирибозы (04') при переходе из минимума с меньшей энергией дуплекса в минимум с большей энергией дуплекса.
Нормализация результатов
Коррекция результатов расчета «водных мостиков»: поиск дублированных записей, меньшие входят в состав больших и т.п.
Фильтр
Вывод конечного
результата в выходные файлы
Рисунок 9. Блок-схема программы AccVol. Основные результаты:
Разработан метод оценки гидратации биомолекул, построен алгоритм расчета доступных растворителю объемов и обнаружения потенциальных «водных сшивок» («водных мостиков»), локализованных в областях перекрывания доступных растворителю объемов двух и более гидрофильных атомов.
Шестая глава посвящена описанию программы VOXEL, предназначенной для расширенной и модифицированной визуализации численных и аналитических молекулярных моделей и их характеризующих ЗБ-функции (в формате AVS).
Модуль визуализации ЗБ-функций содержит в себе передаточную функцию (рис. 10) с элементами графического пользовательского интерфейса, а также собственный модуль рендеринга воксельной модели методом обратной трассировки лучей, управление которому передается при «попадании» луча встроенного в Cinema 4D трассировщика на полигональный объект с привязанными к нему 3D-функциями. Совместная работа двух трассировщиков позволяет демонстрировать разные по своей природе типы данных - векторные молекулярные модели и 3D-функции.
Mode Edit User Data
Voxel Shader [The experimental voxel shaderj
1 Data I Render 1 Size j
- 3D Texture... ШШD:^toject\_0LD_PR0jECTS.Water'imapT Color of Density
Weight..
Deep........ДЗОО*.....ЩЩ
Render Properiet
1 Enable votume render 0_
Quality........... [Exelent
Container properties
>—————F-r —
PI -xfoj......P2,xjq
P1..YÍQ1 "Д-ОР2.У 0
Interpolation Linear M
Pos 4 % S
Intensity 100* ы
Рисунок 10. Панель настроек передаточной функции программы VOXEL, являющейся одним из основных инструментов обработки данных ЗР-функции.
Градиентная шкала Color of Density назначает цвет для соответствующих значений плотности в условной ячейке объема. Градиентная шкала Weight определяет оптическую плотность для соответствующих значений плотности в условной ячейке объема.
Все параметры передаточной функции могут изменять во времени, то есть, могут быть анимированы.
Программа организована в виде встраиваемого программного модуля (plug-in) для ЗО-графического редактора Maxon Cinema 4D. Основные цели написания программы VOXEL:
• усовершенствование метода описания молекулярных структур в виде численных и аналитических молекулярных моделей;
• обеспечение динамической визуализации ЗО-функций (например, вероятностей распределения молекул растворителя, пространственного распределения зарядов и т.п.);
• обеспечение программных возможностей по синхронному показу разнородных типов данных: векторных/процедурных (молекулярные модели) и вексельных (ЗО-функции);
• повышение удобства работы и дружественности пользовательского интерфейса, присущее программному пакету Cinema 4D;
• «бесшовная» интеграция молекулярной графики с трехмерным графическим редактором.
С помощью программы VOXEL была выполнена динамическая визуализация процессов, идущих в ионных каналах в кристалле гидроксиапатита (рис.11). Полученная анимационная модель способствовала лучшему пониманию механизмов протонного транспорта на поверхности гидроксиапатита. Оцененные по модели поверхностные заряды (порядка 0.1 Кл/м2) соответствуют экспериментальным данным. Созданная в рамках этой работы динамическая визуализация была привлечена для демонстрации движения и адгезии живых клеток (остеобластов) на поверхности
гидроксиапатита под действием электрического поля (порядка 105-107В/м) во внешней среде, создаваемого поверхностными зарядами [12-18].
Рис. 11. Фрагмент динамической визуализации ионного канала в кристалле гидроксиапатита. Атомы водорода, кроме находящихся в ионном канале, не показаны. Атомы кальция обозначены сферами, бледно-зеленого цвета.
С помощью программы VOXEL была также выполнена динамическая визуализация гидратации фрагмента ДНК, состоящего из двух пар оснований [8а] (рис. 12).
При визуализации данных молекулярной динамики были задействованы возможности программы по одновременному синхронному показу разнородных типов данных.
Визуализация пространственной карты распределения вероятности нахождения лиганда (молекула воды) вокруг дуплекса ДНК показала, что в пределах корректности расчетной модели, такая карта вероятности коррелирует с картой электронной плотности и обладает информативностью, сопоставимой с экспериментальными методами рентгеноструктурного анализа [10а].
Способность программы VOXEL использовать все штатные методы анимации Cinema 4D была вовлечена в создание динамической визуализации областей с различной вероятностью нахождения растворителя вокруг определенных молекулярных групп и для выделения их на фоне областей с низкой вероятностью. Посредством изменения во времени некоторых параметров трансфер-функции (градиентные шкалы Color of Density и Weight) области с низкой вероятностью последовательно «отсекались» и осуществлялся постепенный переход к показу областей с высокой вероятностью расположения молекул воды - элементов гидратной оболочки исследуемого дуплекса ДНК. Таким образом программа VOXEL была использована как элемент анализа расчетных данных.
Рис. 12.1. Синхронный динамический показ молекулярной модели в векторном представлении и пространственного распределения молекул растворителя.
Зеленым цветом показаны области с низкой плотностью.
Красным — с высокой плотностью.
Рис. 12.2. Области с низкой плотностью отсечены посредством настроек передаточной функции.
Показаны области с высокой и «средней» плотностью.
Рис. 12.3. Области с низкой и «средней» плотностью отсечены передаточной функцией.
Показаны области с высокой плотностью.
Динамическое представление таких областей позволяет оценить реальные тепловые флуктуации лиганда.
Основные результаты:
1 Разработаны методы и алгоритмы построения и динамической визуализации молекулярных моделей и ЗБ-функций в среде ЗБ графических пакетов, которые позволяют рассматривать разнородные как структурные, так и динамические характеристики системы.
2 Разработаны методы интегрированного представления разнородных структурных и динамических данных, которые были вовлечены в создание динамической визуализации.
В С помощью разработанных методов и программ согласно предоставленным данным была выполнена аналитическая визуализация:
о Динамической модели ионных каналов в кристалле гидроксиапатита; ° Распределения вероятностей нахождения растворителя в объеме дуплекса ДНК.
Седьмая глава демонстрирует универсальность разработанных нами методик и программных инструментов, пригодных для визуализации разнородных научных данных. В ней описана работа по созданию комплексного динамического представления результатов аудиторного эксперимента, полученных на 148-канальном измерительном стенде Magnes 2500 WH в больнице Бельвью, в Центре нейромагнетизма Медицинского факультета Нью-Йоркского университета. По условиям эксперимента стимул подавался с частотой 7.35 Гц, велась его запись, в результате был выделен аудиторный отклик коры головного мозга: магнитное поле, порождаемое источниками в слуховой коре. Этот отклик представляет собой сложную пространственно-временную функцию - 68 точек по времени с шагом 2 мс; в каждый момент 148 датчиков, расположенных на поверхности головы, регистрируют магнитное поле.
В ходе эксперимента [3] была также получена ЯМР-томограмма головы испытуемого. ЯМР-томограмма представляет собой функцию трех пространственных переменных, которая визуализировалась с помощью программы VOXEL (рис. 13) и разработанных нами ранее методик, описанных выше.
Целью эксперимента являлось нахождение эквивалентных токовых диполей, порождающие магнитное поле. Обработка экспериментальных данных была выполнена программным комплексом MRIAN [3].
Для динамической визуализации результатов эксперимента было обеспечено синхронное представление нескольких видов сложных многомерных данных:
• функции трех переменных (томограмма головы человека);
• двумерной карты магнитных полей, распределенной в пространстве, определяемом магнитными датчиками, и представляющей амплитуды поля в точках расположения датчиков;
• временного ряда, синхронизирующего развитие демонстрируемых процессов во времени;
• графического представления результатов решения обратной задачи аудиторного эксперимента.
Вышеперечисленные задачи были решены с помощью разработанных в ходе данной работы программы VOXEL и методов обработки и визуализации информации путем построения сцены в среде пакета Cinema 4D.
Наша работа позволяет эффективно визуализировать множество взаимосвязанных разнородных 3D- структурных и динамических данных, характеризующих макромолекулярные и клеточные структуры.
Рис. 13а. Интегральный синхронный показ данных: вверху — томограмма и динамическая карта регистрируемых магнитных полей; внизу — кривая стимула, совмещенная с графическим представлением сигналов датчиков, регистрирующих магнитное поле.
Рис. 136. Интегральный синхронный показ данных: вверху — томограмма и графическое представление результатов решения обратной задачи аудиторного эксперимента; внизу — томограмма и динамическая карта регистрируемых магнитных полей.
Основные результаты:
С помощью разработанных методов и программ согласно предоставленным данным была выполнена аналитическая визуализация результатов аудиторного эксперимента по магнитной энцефалографии.
ЗАКЛЮЧЕНИЕ
В ходе выполнения данной работы были рассчитаны конформационные возможности нативного дуплекса ДНК с1(СССАТОСОТАССС): с!(ОССТАСССАТССО) и выявлены связи между его конформационными параметрами. Расчет проводился методом теоретического конформационного анализа нуклеиновых кислот.
Для рассчитанного дуплекса ДНК была проведена оценка степени его гидратации по методу Ли и Ричардса. По результатам этой оценки была выбрана конформация, являющаяся наиболее близкой к конформации в растворе и пригодная для сравнения с соответствующими характеристиками дуплексов, содержащих неправильные пары естественных оснований и пары с участием 8-оксигуанина и 2-аминопурина.
Решение вышеназванных задач молекулярной биологии привело к разработке метода, алгоритмов и реализующей их компьютерной программы для оценки гидратации молекулярных моделей с помощью расчета доступных растворителю объемов, а так же к разработке метода обнаружения потенциальных «водных сшивок» («водных мостиков»), локализованных в областях перекрывания доступных растворителю объемов двух и более гидрофильных атомов.
Одной из основных задач, решаемых в процессе выполнения данной работы стала разработка метода, алгоритмов построения и динамической визуализации «активных» молекулярных моделей в среде ЗБ графических пакетов для визуализации структуры и конформационной динамики макромолекул.
С помощью разработанных методов и программ была выполнена аналитическая визуализация расчетных и экспериментальных данных, каждая из которых являлась самостоятельной научной задачей:
• результатов расчета переноса заряда в модели ДНК;
• конформационных изменений геранил-геранил трансферазы и демонстрации одного из возможных механизмов прениляции (постгрансляционной модификации) геранил-геранил трансферазой белка ЯаЬ700Р в живой клетке;
• динамическая визуализация результатов расчета молекулярной динамики ферредоксина Рер1ососш аего$,епе$.
Разработан метод, алгоритмы и реализующие их компьютерные программы для визуализации трехмерных функций в среде ЗИ графических пакетов.
С помощью разработанных методов согласно предоставленным данным была выполнена аналитическая визуализация:
• динамической модели ионных каналов в кристалле гидроксиапатита;
• распределения вероятностей нахождения растворителя в объеме дуплекса ДНК;
• динамического представления результатов аудиторного эксперимента по магнитной энцефалографии.
Также были разработаны методы интегрированного представления разнородных структурных и динамических данных, которые были вовлечены в создание динамической визуализации:
• модели переноса заряда в ДНК;
• расчетных данных гидратации дуплекса ДНК;
• аудиторного эксперимента по магнитной энцефалографии.
ВЫВОДЫ
1. Разработаны методы, алгоритмы построения и динамической визуализации молекулярных моделей среде ЗБ-графических пакетов. Возможности методов опробованы на следующих задачах физико-химической биологии:
° Расчете переноса заряда в ДНК;
° Исследования информационных изменений геранил-геранил трансферазы;
° Расчете молекулярной динамики ферредоксина;
° Динамической модели ионных каналов в кристалле гидроксиапатита.
2. Разработаны методы, алгоритмы построения и динамической визуализации ЗБ-функций в среде ЗБ-графических пакетов. Возможности методов опробованы на следующих задачах физико-химической биологии:
° Представлении электрической активности мозга, наблюдаемой в ходе аудиторного эксперимента по магнитной энцефалографии;
° Расчете пространственного распределения вероятности молекул растворителя вокруг дуплекса ДНК.
3. Найдена связь между конформационными параметрами дуплекса ДНК ё(СОСАТССОТАССС): с1(ССОТЛСССАТССО) и его нуклеотидной последовательностью: вычисление конформации было проведено методами теоретического конформационного анализа. Найдена конформация, соответствующая конформации в растворе: степень гидратации оценивалась по методу Ли и Ричардса.
4. Разработан метод оценки степени гидратации макромолекул и учета связанной воды посредством расчета доступных растворителю объемов.
Результаты диссертации опубликованы в следующих работах:
Статьи в журналах, рекомендованных ВАК для публикаций результатов диссертаций на соискание ученой степени доктора и кандидата наук:
1. Филиппов С.В., Нестерова Е.Н., ЧупринаВ.П., Полтев В.И., Моделирование изменений конформации и стабильности двойной спирали ДНК при генотоксической модификации оснований. I. Низкоэнергетические конформации нативного дуплекса // Молекулярная биология, 1997, No.5, том.31, с.847-854.
2. Лахно В.Д., Назипова Н.Н., Ким B.JI., Филиппов С.В., Фиалко Н.С., Устинин Д.М., Теплухин А.В., Тюльбашева Г.Э., Зайцев А.Ю., Устинин М.Н., Информационно-вычислительная среда Mathcell для моделирования живой клетки // Матем. биолог, и биоинформ., 2007, 2:2, с.361-376.
3. Ustinin M.N., Kronberg Е., Filippov S.V., Sychev V.V., Sobolev E.V., Llinás R., Kinematic visualization of human magnetic encephalography // Матем. биолог, и биоинформ., 2010, 5:2, с.176-187.
4. Gonzales Е., Castro I., Lopez E., Poltev V.I., Filippov S.V., Teplukhin A.V., Simulasion de la hydratasion de los pares de bases adeina-timina por el método de Monte Carlo // Revista Mexicano de Fisica, 1998, 44, pp.473-478.
5. Gonzalez E., Castro I., Lopez E., Filippov S.V., Teplukhin A.V., Poltev V.I., Role of Hydration in the Accuracy of Nucleic Acid Biosynthesis. A Computer Simulation // J. Mol. Struct. (THEOCHEM), 1999,493, pp.301-308.
Другие издания:
6. Филиппов С.В., Соболев Е.В., Использование технологий профессиональной компьютерной графики для визуализации результатов научных исследований // Компьютеры и суперкомпьютеры в биологии / Под ред. Лахно В.Д., Устинина М.Н., Москва-Ижевск: Институт компьютерных исследований, 2002. стр.476-497.
7. Филиппов С.В., Нестерова Е.Н., Полтев В.И. Конформационные возможности олигонуклеотидного дуплекса с чередующейся пурин-пиримидиновой последовательностью // II открытая городская научная конференция молодых ученых города Пущино, Тезисы докладов, Пущино, 1997.
8. Poltev V., Filippov S., Nesterova E., Chuprina V., Teplukhin A., Gonzalez E.. Molecular Mechanics Study of Correlations between DNA Chemical Modification and its Biological Properties // The Fifth Chemical Congress of North America, Cancun Q.Roo, 11-15 November, 1997.
9. Gonzalez E., Castro I., Lopez E., Filippov S.V., Teplukhin A.V., Poltev V.I. Investigación Computacional de la Contribución de la Hidratacion a la Exactitud de la Biosintesis de los Acidos Nucleicos // XXIV Congreso Internacional de Químicos Teoricos de Expresión Latina, Puebla Pue. September 20-25, 1998.
10. Филиппов C.B., Теплухин A.B., Полтев В.И. Конформационный анализ фрагментов ДНК, содержащих последовательность poly(dG):poly(dC) // Материалы IV Пущинской конференции молодых ученых, Пущино, 1999.
11. Полтев В. И., Теплухин А. В., Филиппов С. В., Гонзалес Э. Компьютерное изучение роли гидратации в обеспечении точности биосинтеза ДНК // II съезд биофизиков России. Тезисы (раздел 2: Структура и динамика нуклеиновых кислот и их комплексов). М., 1999.
12. Bystrov V., Paramonova Е., Bystrova N., Sapronova A., Filippov S. Computational Molecular Nanostructures and Mechanical Properties of Hydroxyapatite // Abstracts of 3rd Symposium
"Micro- and Nanostructures of Biological Systems", June, 2004. - Halle, Germany. - Martin Luther University Halle-Wittenberg, 2004, p.64-68.
13. Bystrov V., Paramonova E., Bystrova N., Sapronova A., Filippov S. Computational Molecular Nanostructures and Mechanical/Adhesion Properties of Hydroxyapatite // Selected Proceedings of 3rd Symposium "Micro- and Nanostructures of Biological Systems", June, 2004. - Halle, Germany. -Martin Luther University Halle-Wittenberg, 2004, p.77-90.
14. Bystrov V., Paramonova E., Bystrova N., Sapronova A., Filippov S. Computational Molecular Nanostructures and Mechanical/Adhesion Properties of Hydroxyapatite. Review paper. // In the book: The 3rd Edition of "Micro- and Nanostructures of Biological Systems", Ed.: G. Bischoff,D. -Shaker Press: Aachen, Germany, 2005,. pp.77-93.
15. Bystrov V.S., Paramonova E.V., Sapronova A.V., Filippov S.V. Proton transfer simulation and polarization of the hydroxyapatite // Abstracts book of XV All-Russian conference "Theoretical background and design of numerical algorithms for mathematical physics problems applicable to multi-processor systems".- Institute of Applied Mathematics RAS, Moscow-Dyurso, 2004, p.23.
16. Bystrov V., Sapronova A., Bystrova N., Paramonova E., Filippov S. Proton transport in hydrogen-bonded systems: ab inition modeling of hydroxyapatite (HAP) crystal surface properties. // In: Abstracts Issue of 49th Annual Meeting of Biophysical Society on CD-ROM, February 12-16, Long Beach, California, USA. Program # 532-Pos, Session Title: Biophysics of Ion Permeation, 2005.
17. Bystrov V., Bystrova N., Paramonova E., Filippov S., Sapronova A., Baumuratova T. Computer simulation and computational exploration of Hydroxyapatite biomaterials nanostructures, surface's and adhesive properties. // In: Abstracts Book of 19th European Conference on Biomaterials, Sorento, Italy, 11-15 September, 2005. p.482.
18. Bystrov V., Paramonova E., Sapronova A., Filippov S., Kim V. Computer modeling of Hydroxyapatite Nanoparticles and its interaction with heavy metal ions and titanium substrate // Конференция по биоинформатике. Тезисы докладов, Пущино, 2006.
19. Ким В.Л., Погорелый Е.Н., Филиппов С.В. Разработка интерактивной трехмерной модели эукариотической животной клетки. I. Моделирование пространственной структуры основных клеточных органелл. Конференция по биоинформатике. Тезисы докладов, Пущино, 2006.
20. Ким В.Л., Филиппов С.В., Шаба Л.Н., Устинин М.Н. Разработка интерактивной учебной 3D модели, демонстрирующей основные биохимические процессы живой клетки в игровой форме // 16-ая Международная Пущинская школа-конференция молодых ученых, Сборник тезисов, Пущино, 2012.
Литература
la. Nesterova E.N., Fedorov O.Yu., Poltev V., I., Chuprina V.P. The study of possible A and В conformations of alternating DNA using a new program for conformational analysis of duplexes (CONAN). J. Biomol. Struct. Dyn. 1997. v. 14, p. 459-474.
2a. Lee, B; Richards, FM. The interpretation of protein structures: estimation of static accessibility. J. Mol.Biol, 1971. 55 (3): 379-400.
За. Лахно В.Д., Фиалко H.C. Моделирование процессов переноса заряда в ДНК // В книге "Динамические модели процессов в клетках и субклеточных структурах" под ред. Ризниченко Г.Ю. и Рубина А.Б., М.-Ижевск: НИЦ "Регулярная и хаотическая динамика", ISBN 978-593972-783-9,2010, с.11-67.
4а. Lunin V.Y., Lunina N.L., Ritter Stephan, Frey Ingrid, Berg Aloys, Diederichs Kay, Podjarny Alberto D., Urzhumtsev Alexandre and ManfredW. Baumstark. Low-resolution data analysis for low-density lipoprotein particle. Acta Crystallographica Section D. Biological Crystallography, 2001. p. 108121.
5а. Лунин В.Ю. Определение пространственной структуры биологических макромолекул. Часть 1, глава 3 // Компьютеры и суперкомпьютеры в биологии / Под редакцией Лахно В.Д. И У станина М.Н. - Москва-Ижевск: Институт компьютерных исследований, 2002. стр. 107108.
6а. Ивайкина А.Г., Балабаев Н.К., Шайтан К.В. Определение влияния пептидной структуры на энергетику реакций окисления-восстановления белков, содержащих Fe4S4 кластеры, с помощью компьютерных экспериментов. БИОФИЗИКА, 2001. Т.46, №4, стр. 589-594.
7а. Балабаев Н.К., Лемак А.С., Шайтан К.В. Молекулярная динамика и электрон-конформационные взаимодействия в ферредоксине. Молекулярная биология, 1996. Т.30, №6, стр. 1345-1356.
8а. Rak A, Pylypenko О, Nlculae F, Pyatkov К, Goody RS, Alexandrov К. Structure of the Rab7:REP-1 complex: insighits into mechanism of Rab prenylation and choroidermia disease. Cell. 2004 Jun 11; 117(6), pp. 749-760.
9a. Pylypenko O, Rak A, Reents R Niculae A, Sidorovitch V, Cioaca MD, Bessolitsyna E, Thoma NH, Wildmann H, Shlichting I, Goody RS, Alexandrov K. Structure of Rab escort protein-1 in complex with Rab geranylgeranyltransferase. Molecular cell. 2003 Feb; 11 (2), pp. 483-494.
Юа.Теплухин А.В. Устное сообщение.
Подписано в печать 15.04.2014г. Печать лазерная
Заказ № 5789 Тираж: 80 экз.
Типография «ПхРппЬ) ИНН 503900523316 142290, Пущино, м-н «АБ», 22 (4967) 75-97-84 www.fix-print.ru
Текст научной работыДиссертация по биологии, кандидата физико-математических наук, Филиппов, Сергей Валерьевич, Пущино
Федеральное государственное бюджетное учреждение науки Институт математических проблем биологии Российской академии наук
На правах рукописи
04201460596
Филиппов Сергей Валерьевич
МЕТОДЫ И АЛГОРИТМЫ ВИЗУАЛИЗАЦИИ СТРУКТУРНЫХ И ДИНАМИЧЕСКИХ ДАННЫХ, ХАРАКТЕРИЗУЮЩИХ МАКРОМОЛЕКУЛЯРНЫЕ
СТРУКТУРЫ
Специальности 03.01.02 - биофизика
Диссертация на соискание ученой степени кандидата физико-математических наук
Научные руководители: д.ф.-м.н. Устинин Михаил Николаевич д.ф.-м.н., проф. Полтев Валерий Иванович
Пущино - 2014
Оглавление
ВВЕДЕНИЕ...............................................................................................................................5
1 .ОБЗОР ЛИТЕРАТУРЫ..........................................................................................................8
1.1. Визуализация в реальном масштабе времени............................................................11
1.1.1 .Молекулярные модели............................................................................................12
1.1.1.1 .RasMol и OpenRasMoi......................................................................................12
1.1.1.2.WebLab ViewerPro............................................................................................16
1.1.1 J.Visual Molecular Dynamic (VMD)....................................................................17
1.1.1.4.Программный комплекс PyMol.......................................................................18
1.1.1.5.Общие выводы по программам молекулярной графики...............................20
1.1.2.Визуализация ЗО-функцнй.....................................................................................21
1.1.2.1 .Визуализация 3D функций с использованием 3D API...................................23
1.1.2.2.VolVis.................................................................................................................27
1.1.2.3 -AVS /EXPRES S..................................................................................................28
1.2. Высококачественная (пакетная) визуализация...........................................................32
1.2.1.Высококачественная Визуализация молекулярных моделей...............................35
1.2.1.1.PDBImp в среде 3D Studio МАХ.....................................................................36
1.2.1.2.Atomic Blender и Bioblender............................................................................38
1.2.1.3.PDB plug-in Jyrki Hokkanen в среде OY Realsoft 3D......................................39
1.2.2.Пассивная организация молекулярных моделей..................................................44
1.2.3.Визуализация ЗО-функций в ЗО-редакторах общего назначения.......................45
1.2.3.1 .Jyrki Hokkanen VolData в среде OY Realsoft 3D.............................................46
1.2.3.2.Визуализация ЗО-функций среде Blender......................................................47
1.3. Выводы по обзору литературы....................................................................................48
2. ИССЛЕДОВАНИЕ КОНФОРМАЦИОННЫХ ОСОБЕННОСТЕЙ ДУПЛЕКСОВ ДНК МЕТОДОМ ТЕОРЕТИЧЕСКОЕО КОНФОРМАЦИОННОЕО АНАЛИЗА........................49
2.1. Моделирование низкоэнергетических копформаций нативного дуплекса ДНК для исследований изменения конформации и стабильности двойной спирали ДНК при генотоксической модификации оснований.......................................................................49
3 .МЕТОДЫ И СРЕДСТВА ВЫСОКОКАЧЕСТВЕННОЙ ВИЗУАЛИЗАЦИИ МОЛЕКУЛЯРНЫХ МОДЕЛЕЙ.............................................................................................62
3.1. Предпосылки для разработки методов и реализующей их программы. Постановка задачи...................................................................................................................................62
3.2. Реализация разработанных методов визуализации в программе MolWorld............64
3.2.1 .Практика применения MolWorld для визуализации объектов и процессов молекулярной биологии..................................................................................................70
3.2.1.1.Динамическая визуализация переноса заряда в ДНК...................................70
3.2.1.2.Динамическая визуализация липопротеиновой частицы..............................72
4.МЕТОД «АКТИВНОЙ МОЛЕКУЛЯРНОЙ МОДЕЛИ» И ЕЕО РЕАЛИЗАЦИЯ В ИРОЕРАММЕ PDBTools........................................................................................................76
4.1. Программа построения молекулярных моделей - PDBTools....................................79
4.1.1.реализация элементов концепции «Активной молекулярной модели» в первом приближении....................................................................................................................81
4.1.1.1.Alias|wavefront Maya в качестве среды для построения структурированных
молекулярных моделей................................................................................................81
4.1 Л.2.Автономная программа рендеринга - Exluna BMRT.....................................84
4.1.2.Структура и основные свойства PDBTools...........................................................84
4.1.2.1.Управляющий интерфейс программы PDBTools...........................................88
4.1.2.2.Возможности программы PDBTools по построению «активных» молекулярных моделей................................................................................................97
4.2. Практическое использование программы PDBTools...............................................102
4.2.1.Визуализация липопротсиповои частицы с помощью PDBTools и системы рендеринга BMRT v.2.6.................................................................................................102
4.2.2.визуализация в среде Alias|wavefront maya конформационной динамики молекулярных моделей, построенных программой PDBTools..................................105
4.2.2.1.Визуализация расчега молекулярной динамики ферредоксина Peptococus aerogenes.....................................................................................................................106
4.2.2.2.Визуализация копформациоппых изменений геранил-геранил трансферазы .....................................................................................................................................110
5.РАЗРАБОТКА МЕТОДИКИ ОЦЕНКИ СТЕПЕНИ И ХАРАКТЕРА ГИДРАТАЦИИ МОЛЕКУЛЯРНОЙ МОДЕЛИ С ПОМОЩЬЮ РАСЧЕТОВ ДОСТУПНЫХ
РАСТВОРИТЕЛЮ ОБЪЕМОВ.............................................................................................113
5.1.1.Программа расчета доступных растворителю объемов - AccVol......................116
6.ВИЗУАЛИЗАЦИЯ ЗО-ФУНКЦИЙ....................................................................................119
6.1. Программа построения молекулярных моделей и ЗО-функций - VOXEL.............119
6.1.1 .Алгоритм визуализации трехмерных функций..................................................120
6.1.2.Цифровая обработка данных дискретных функций трех переменных.............125
6.1.3.Алгоритм визуализации биологических макромолекул....................................128
6.1.4.Программиая платформа — Cinema 4D..............................................................130
6.2. Практика применения программы VOXEL для визуализации объектив и процессов физико-химической биологии..........................................................................................135
6.2.1.Динамическая Визуализация механизма протонного транспорта в кристалле гидроксиапатита.............................................................................................................135
6.2.2.Визуализация ЗО-функций программой Voxel...................................................137
7. ДИНАМИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТА ПО
МАГНИТНОЙ ЭНЦЕФАЛОГРАФИИ................................................................................142
8 .ЗАКЛЮЧЕНИЕ..................................................................................................................150
9.ВЫВОДЫ............................................................................................................................152
ЛИТЕРАТУРА........................................................................................................................153
ВВЕДЕНИЕ
Актуальность темы
Визуализация научных данных — один из наиболее широко распространенных методов, применяемых современными исследователями. Особую роль играет визуализация в молекулярной биологии, объекты исследования которой характеризуются большой сложностью и недоступностью для прямого наблюдения. Справедливость вышесказанного подтверждается большим количеством программных пакетов, предназначенных для визуализации молекулярных моделей, например, RasMol, PyMol, VMD, Swiss-PdbViewer и многие другие. Разносторонний характер данных, подлежащих отображению диктует необходимость в разнообразных способах представления информации. Существующие пакеты молекулярной графики во многих случая недостаточно адекватно и эффективно предегавляюг структуры и формы биологических систем и тем более, протекающих в этих системах процессов.
С другой стороны, универсальные пакеты 3D графики не достаточно хорошо приспособлены для визуализации научных данных, но при этом адекватно представляют решения многих технологических задач. Данное ограничение этих пакетов 3D-графики преодолевается с помощью добавления к ним программных модулей (plug-in). Примеры таких программных модулей уже существуют для многих 3D-редакторов, например, PDBImp для 3D Studio MAX, PDB by Jyrki Hokkanen для Realsoft 3D и Atomic Blender. В настоящее время эти программные модули используют лишь малую часть математического аппарата 3 D-редакторов.
Таким образом, сохраняется актуальность задачи по разработке методов, алгоритмов и программ, предоставляющих исследователю специализированные инструменты для работы с молекулярными моделями.
Поэтому целью нашей работы является разработка методов и алгоритмов визуализации, которые будут дополнять и расширять границы применимости существующих методов визуализации и будут полезны при решении широкого круга задач клеточной и молекулярной биологии.
Цел« диссертационной работы:
• Разработка методов и программных средств, которые интегрируют численные и аналитические методы представления структур и форм макромолекул и макромолекулярных систем.
• Исследование конформационных возможностей нативиых дуплексов ДНК методом теоретического конформационного анализа.
• Разработка нового метода быстрой оценки степени гидратации макромолекул.
• Разработка методов и программных средств визуализации ЗЭ-даппых, характеризующих структуры и свойства макромолекул и макромолекулярных систем.
• Визуализация параметров и величин описывающих динамику макромолекул и макромолекулярных систем.
Научная новизна и практическая значимость диссертационной работы
Методом теоретического конформационного анализа и расчета стерически доступных поверхностен гидрофильных атомов выполнено исследование конформационных возможностей моделей нативных олигонуклеотидных дуплексов ДНК с чередующейся пурин-пиримидпновой последовательностью. Эти последовательности очень часто встречаются в геномах многих организмов и направляют ход регуляции генной экспрессии. Поэтому изучение их конформационных особенностей и их физико-химических свойств является актуальной задачей.
Нами были разработаны методы и программный комплекс (PDBTools и VOXEL) для построения и визуализации молекулярных моделей, который интегрирует численные и аналитические методы представления структур и форм макромолекул и макромолекулярных систем.
Предложен метод и реализующая его компьютерная программа AccVol для быстрой и эффективной оценки в первом приближении степени и характера гидратации биологических макромолекул на основе расчета доступного растворителю объема. Метод был применен для решения задачи о конформациях дуплекса ДНК содержащего участки poly(dG):poly(dC).
Нами были также разработаны алгоритмы и реализующие их компьютерные программы: MolWorld, PDBTools, VOXEL для построения трехмерных моделей биологических макромолекул в среде графических программных пакетов ЗО-моделирования, анимации и визуализации, что позволило качественно улучшить графическое представление молекулярных моделей и выполнять визуализацию их конформационной динамики.
Были разработаны методы и средства синхронизированного и совмещенного показа разнородных по своей природе научных данных.
Разработан метод и программный комплекс VOXEL, позволяющий в среде Cinema 4D визуализировать 3D- и динамические характеристики макромолекул.
Апробация работы
Результаты работы были представлены rra И открытой городской научной конференции молодых ученых города Пущино, 1997; IV Путинской конференции молодых ученых, Пущино, 1999; семинаре ИМПБ РАН, 2008, двух семинарах на кафедре биофизики биологического факультета МГУ, 2008; 16-й Международной Пущинской школе-конференции молодых ученых, Пущино, 2012; rra двух семинарах в ИТЭБ РАН, 2013; на семинаре ВЦ РАН, 2013.
Публикации
Материалы диссертации опубликованы в 20 научных работах: из них в рецензируемых международных журналах - 2 статьи, в рецензируемых российских журналах - 3 статьи, из них по списку ВАК - 3 статьи, в сборниках - 2 статьи, а также в материалах 14 научных конференций.
1. ОБЗОР ЛИТЕРАТУРЫ
К настоящему времени можно считать устоявшимся мнение о синонимичности понятий научная компьютерная графика и трехмерная (ЗО) компьютерная графика. Во-первых, трехмерное представление объектов исследования является абсолютно естественным в контексте естественнонаучных дисциплин. Во-вторых, именно такое представление особо ценно для исследователя. Соответственно, практически все усилия работающих в области визуализации научных данных, так или иначе, направлены на разрешение проблем объемного представления информации.
В последнее время ввиду экстремально сильного развития аппаратных средств вычислительных машин (которые, фактически, являются средой существования компьютерно-графических программ и данных), а так же алгоритмической основы компьютерной графики стало возможным повсеместное создание научной графики, демонстрирующей сколь угодно сложную динамику исследуемых процессов в том числе и в виде анимационных последовательностей. Однако, несмотря на важную конечную роль анимации, ей, тем не менее, все же принадлежит второстепенная роль. На первом месте, безусловно, стоят проблемы представления объектов в трехмерном пространстве. Иными словами - проблемы построения трехмерных моделей объектов исследования.
Принято выделять два основных подхода к визуализации данных, представленных трехмерными моделями. Различаются они главным образом способом представления моделей в трехмерном пространстве.
Первый, получивший наибольшее распространение в настоящее время - метод полигональных моделей [1]. Суть данного метода состоит в том, что поверхность объекта аппроксимируется псвьтпуклыми многоугольниками, главным образом треугольниками и реже четырехугольниками. Существенным преимуществом этого метода является относительная простота реализации основных операций по трансформации геометрии объекта и растеризации составляющих его примитивов на аппаратном уровне. Подтверждением этому может служить невероятно быстрый рост индустрии графических ускорителей, первое поколение которых отвечало лишь за растеризацию геометрических примитивов, а последнее поколение практически
полностью берет на себя весь конвейер визуализации, включая расчет свойств поверхностей моделируемых объектов (материалов) и освещение. Неотъемлемой частью технологий визуализации информации, представленной 3D моделями является Интерфейс Прикладных Программ (Application Program Interface - API), позволяющий не только стандартизировать и абстрагировать от аппаратуры прикладную программу, но и существенно упростить её разработку за счёт реализации набора часто используемых алгоритмов в программных библиотеках, которые в свою очередь могут использовать низкоуровневые команды, исполняемые специализированной аппаратурой, в частности, видеоадаптером. Вследствие наиболее широкого распространения и большей универсальности, методы визуализации полигональных моделей имеют устоявшийся и хорошо отработанный API. По ряду причин (среди которых: высокий уровень независимости от аппаратуры и операционной системы, большая гибкость и расширяемость стандарта, обеспечивающая соответствие текущему уровню развития технологий трехмерной графики), наибольшее распространение и всеобщее признание получил API - OpenGL.
Как уже было сказано выше, область применения методов аппроксимации поверхности моделируемого объекта полигонами невероятно широка. Для научной графики такой метод представляет интерес, прежде всего там, где визуализируемые объекты представляют собой структуры, имеющие четкие границы в пространстве. Ярким примером может служить визуализация молекулярных моделей, где атомы или группы атомов могут быть представлены геометрическими фигурами без необходимости отображения внутренней структуры каждой из них [2].
Второй метод, получивший название метода визуализации объемов, основан на представлении фрагмента трехмерного (3D) пространства, содержащего в себе объект, посредством разбиения его трехмерной сеткой на массив элементарных частей пространства, называемых вокселями (Voxel, от Volume Pixel)[16-17], Каждый из таких фрагментов имеет два состояния: принадлежность объекту и принадлежность "пустому пространству". В свою очередь, воксели, составляющие объект могут иметь ряд атрибутов, таких как: цвет, степень прозрачности, коэффициент преломления и т.д. и т.п. Как не сложно заметить, этот метод обладает невероятной гибкостью и точностью передачи не только формы объекта, но и его внутренней структуры, поскольку
максимально приближен к "реальности". Однако, у этого метода есть и ряд существенных недостатков. Одним из наиболее существенных является огромное количество оперативной памяти, требуемое для хранения фрагмента пространства, содержащего визуализируемый объект. А с ростом детализации представления объекта растут требования к объему памяти в геометрической прогрессии. И если количество памяти в существующих на данный момент времени образцах вычислительной техники легко нарастить до объемов, заведомо превышающих разрешающую способность дисплеев (иа которые, в конечном счете, проецируется трехмерное представление объекта), то мощности современных процессоров очень далеки от того чтобы обрабатывать такие потоки данных в реальном времени. Конечно, существуют методики "компрессии" таких данных, наи�
- Филиппов, Сергей Валерьевич
- кандидата физико-математических наук
- Пущино, 2014
- ВАК 03.01.02
- Молекулярный докинг при исследовании белок-лигандных комплексов
- Программно-алгоритмическое обеспечение кластеризации и визуализации многомерных данных сейсморазведки и ГИС
- Визуализация биологических материалов методами сканирующей туннельной и атомно-силовой микроскопии
- Вычислительные подходы к решению фазовой проблемы кристаллографии биополимеров при низком разрешении
- Геолого-геофизические модели Бенинского залива и выделение тектонических дислокаций по данным сейсморазведки