Бесплатный автореферат и диссертация по биологии на тему
Анализатор траекторий молекулярной динамики и его применение к изучению механических свойств белков
ВАК РФ 03.01.02, Биофизика

Автореферат диссертации по теме "Анализатор траекторий молекулярной динамики и его применение к изучению механических свойств белков"

На правах рукописи

Лихачев Илья Вячеславович

Анализатор траекторий молекулярной динамики и его применение к изучению механических свойств белков

03.01.02 - биофизика

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук

1 5 ИДИ 2014

Пущино — 2014

005548195

005548195

Работа выполнена в лаборатории молекулярной динамики Федерального государственного бюджетного учреждения науки Института математических проблем биологии Российской академии наук

Научный руководитель: кандидат физико-математических наук

Балабаев Николай Кириллович

Научный консультант доктор физико-математических наук

Галзитская Оксана Валериановна

Официальные оппоненты: доктор физико-математических наук

Цыганкова Ирина Глебовна (в.н.с. ИТЭБ РАН, г. Пущино),

кандидат физико-математических наук Кондратьев Максим Сергеевич (с.н.с. ИБК РАН, г. Пущино)

Ведущая организация: Федеральное государственное бюджетное

учреждение науки Институт химической физики им. H.H. Семенова Российской академии наук

Защита состоится «_4_» июня 2014 г. в 13-30 на заседании совета

Д 002.093.01 по защите диссертаций на соискание ученой степени кандидата наук, на соискание ученой степени доктора наук при Федеральном государственном бюджетном учреждении науки Институте теоретической и экспериментальной биофизики Российской академии наук по адресу: 142290, Московская область, г. Пущино, ул. Институтская, 3.

С диссертацией можно ознакомиться в Центральной библиотеке ПНЦ РАН по адресу: 142290, Московская область, г. Пущино, ул. Институтская, 3, и на сайте ИТЭБ РАН: http://web.iteb.psn.ru.

Автореферат разослан «_»_2014 г.

Ученый секретарь диссертационного совета, к.ф.-м.н.

Ланина Н.Ф.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы.

Методом моделирования молекулярной динамики (МД) пользуются во многих научно-исследовательских лабораториях. После проведения МД-эксперимента ставится задача анализа полученных данных. Возможны случаи, когда необходимо ответить на конкретные вопросы по эксперименту, а также когда возникает потребность описать эксперимент в целом, заострив внимание на структурные перестроения в ходе эксперимента.

Как правило, при анализе траекторий многие исследователи пишут собственные несложные программы для расчета простых характеристик. Вместе с тем, сложные алгоритмы работы с траекториями заложены в такие объемные пакеты как VMD и GROMACS, на изучение которых требуется до полугода рабочего времени.

Разработанная программа TAMD (Trajectory Analyzer of Molecular Dynamics, далее по тексту Анализатор) сочетает в себе: интуитивный графический пользовательский интерфейс, новые характеристики, направленные на быстрый анализ траектории в целом, а также является платформой для написания новых характеристик на траекториях и управляемой программой-платформой с интерпретатором скриптового языка для автоматизации рутинных действий.

В целях повышения быстродействия для анализа МД-систем из большого количества атомов, реализация Анализатора траекторий использует современные технологии, направленные на ускорение обработки информации, такие как технология вывода трехмерной графики OpenGL, параллельное программирование, в том числе массивно-параллельное (технология CUDA).

Некоторые белки в клетке испытывают механические деформации при таких биологических процессах как межклеточная адгезия, сокращение мышц, перенос белков через мембрану. Для понимания молекулярной природы механической стабильности белков необходимо провести большое количество МД экспериментов для исследования зависимости механических свойств белков от различных параметров. Исследование этого вопроса представляет практический интерес для конструирования биоматериалов с повышенной механической стабильностью.

При помощи Анализатора в данной работе проведен анализ механического разворачивания по траекториям МД белка межклеточной адгезии кадгерина, а также влияние хиральности восьми альфа-спиральных белков на их механические свойства.

Цель и задачи исследования.

Целью данной работы является разработка новых методов и подходов к анализу траекторий молекулярной динамики биомолекулярных систем и их

апробация на конкретных молекулярных комплексах. Для этого решаются следующие задачи:

1. Разработка Анализатора траекторий молекулярной динамики как программного средства для анализа МД-траекторий с одной стороны, так и платформы для создания инструментария по анализу траекторий с другой. Создание новых алгоритмов исследования МД траекторий биомолекулярных систем. Обеспечение работы с молекулярными системами, содержащими до 100 ООО атомов.

2. Получение МД-траекторий для различных гидратированных белков и решение следующих задач:

a) Сравнение механических характеристик белка клеточной адгезии С-кадгерина (С-СасШепп) в зависимости от присутствия ионов различного типа.

b) Исследование влияния хиральности альфа-спиральных белков на их механические свойства.

Научная новизна работы.

Созданный программный комплекс для анализа МД-траекторий позволяет в интерактивном режиме рассчитывать конфигурационные и динамические характеристики молекулярных систем. В том числе, получение расширенных динамических контактных карт и лент контактов, нормальных мод, коэффициентов вариации.

Впервые проведенный методом молекулярной динамики анализ механических характеристик белка межклеточного взаимодействия С-кадгерина показал, что С-кадгерин с ионами Mg2+ имеет механические свойства схожие со свойствами белка с ионами Са2+.

Анализ последовательности разворачивания восьми альфа-спиральных белков по МД-экспериментам показал, что правозакрученные домены обладают большей механической стабильностью, чем левозакрученные.

Практическая значимость работы.

Анализатор траекторий является необходимым средством при проведении МД-исследований. Основная направленность Анализатора — способность дать быструю характеристику динамики исследуемого объекта в целом, включая системы до 100 ООО атомов. Применение Анализатора способствует повышению эффективности исследований методом молекулярной динамики.

Исследование механической стабильности белковых молекул представляет практический интерес для конструирования биоматериалов с повышенной механической стабильностью.

Апробация работы. Материалы диссертации были представлены на следующих конференциях: 11-я, 13-я, 14-я, 15-я, 16-я, 17-я Международная Пущинская школа-конференция молодых ученых «Биология - наука XXI века» (Пущино, Россия, 2007, 2009, 2010, 2011, 2013); I и III Международная конференция «Математическая биология и биоинформатика» (Пущино, Россия, 2006, 2010); V и VI Санкт-Петербургская конференция молодых учёных «Современные проблемы науки о полимерах» (Санкт-Петербург, Россия, 2009, 2010); IV Съезд биофизиков России (Нижний Новгород, Россия, 2012), XI и XII международная конференция МКО-2011, МКО-2013 «Математика, Компьютер, Образование» (Пущино, 2011, 2013), VII и VIII Национальная конференция «Рентгеновское, Синхротронное излучения, Нейтроны и Электроны для исследования наносистем и материалов. Нано-Био-Инфо-Когнитивные технологии» (Москва, 2009,2011).

Публикации. Основные результаты диссертации представлены в 20 печатных работах, в том числе в 4 статьях в реферируемых научных изданиях из списка ВАК. Программа TAMD зарегистрирована в Федеральной службе по интеллектуальной собственности, свидетельство о государственной регистрации программы для ЭВМ № 2014612313.

Структура диссертации. Диссертация изложена на 148 страницах машинописного текста и состоит из введения, 4 глав (обзора подходов и методов, описания Анализатора траекторий молекулярной динамики, описания проведенных экспериментов), благодарностей, выводов, и списка цитируемой литературы, включающего 109 ссылок. Работу иллюстрируют 37 рисунков и 6 таблиц.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ

Во Введении обоснована актуальность темы диссертации, сформулированы цель и основные задачи исследования, обозначены научная новизна и практическая значимость работы.

В первой главе работы дан обзор программного обеспечения, как по использованию метода МД, так и по анализу траекторий. Дано описание цикла проведения МД-экспериментов, который включает в себя непосредственно сам МД-расчет, анализ траекторий, постановку вопросов к полученным данным, вычисление характеристик по траекториям.

Во второй главе дается описание созданного программного комплекса ТАМБ («Анализатор траекторий молекулярной динамики»). Обсуждаются основные режимы его работы и получаемые характеристики.

При разработке Анализатора траекторий преследовались несколько целей:

• проведение интерактивного анализа траекторных файлов;

• получение простых характеристик, основанных на геометрическом расположении атомов с последующим их отображением в модуле построения графиков. Сбор статистической информации по характеристикам;

• нахождение оригинальных характеристик, описывающих поведение МД-системы. Для этого используются: визуализатор квазигармонических колебаний, расширенные динамические контактные карты, работа с расширенными траекториями, поведение коэффициента вариации вдоль МД-траектории;

• реализация эффективных алгоритмов для анализа большого объема данных с применением параллельного программирования, в том числе массивно параллельного (технология С1ЮА).

Схема основных модулей программы ТАМБ представлена на рис.1. Анализатор траекторий предназначен для изучения поведения различных характеристик молекулярной системы во времени. Для полученных характеристик, как функций от времени, предусмотрена возможность нахождения плотностей распределения их значений, преобразования Фурье, оконных преобразований Фурье, вывода частично усредненных значений (трендов).

Модуль чтения траекторий

РОВ

1 '-\

TAMD.NET ---< Визуализация

ТАМй

Характеристики

-ч-^ на траектории

СУБД

Дополнительные связи

Пользовательская информация

Древовидная структура

Работа с графиками

Динамические расширенные контактные карты и ленты _ контактов

Коэффициент вариации молекулярной динамики

ТАМО-всНр!

т

Визуализатор квази гармонических колебаний

Рисунок 1. Схема основных модулей программы ТАМО.

Типичный вид Анализатора траекторий приведен на следующем рис.2.

Окно визуализации в перспективной проекции

Основная панель инструментов

Окно визуализации в ортогональной проекции

41™ 3 [Ттв -у

41», 4 „ I

Тялв (Мпч! Ьв»«вв<1 Ь агг*с:

Щ-1!

Туре Ы етв^шс

¡ЭЛс! о! 3

К> Ч*/Р*Фиг 0

полученной величины

Перемещение во времени

Панель параметров

»1

Мот 2 -1

1« ±|

Рисунок 2. Пример работы Анализатора траекторий МД.

Анализатор траекторий содержит следующие возможности по отображению исследуемой молекулярной системы:

• Визуализация молекулярной системы в перспективной проекции;

• Работа с трехмерными изображениями: вращение, перемещение, масштабирование;

• Отображение векторов движения атомов;

• Отображение групп и связей атомов;

• Визуализация усредненных характеристик атомов («температура», вклады в тензор напряжений), включенных в расширенные траектории МД;

• Управление прозрачностью отображаемых данных. В том числе раздельное управление прозрачностью растворителя и макромолекулы;

• Отображение колебательных мод в анимированном виде;

• Работа в режиме показа молекулярного кино во всех перечисленных режимах.

Перспективная проекция разработана с использованием технологии ускорения вывода трехмерных объектов OpenGL и включает аппаратное ускорение при его наличии. При этом резко снижается загрузка процессора на вычислительных установках с развитыми графическими адаптерами.

В TAMD заложен ряд уникальных характеристик и возможностей анализа траекторий МД:

• расширенные динамические контактные карты и ленты контактов;

• визуализатор квазигармонических колебаний;

• работа с расширенными траекториями МД.

Анализатор поддерживает визуализацию траекторий с расширенной компонентой(ами) во всех режимах работы. В расширенной траектории к трем координатам атома добавляется одна или несколько компонент, указывающих на какое-либо свойство атома («температура», вклады в тензор напряжений), соответствующее текущему кадру траектории. При визуальном анализе такое свойство проявляется в виде цвета атома, меняющееся при смене кадра.

Медленные коллективные движения многих атомов играют важную роль в функционировании молекулярных систем. Анализатор траекторий содержит Визуализатор квазигармонических колебаний, который позволяет поочередно анимировать колебательные моды. К анализируемым частицам добавляются вектора, показывающие их движения, соответствующие выбранной моде. Длины и цвета векторов говорят об амплитудах движения частиц.

Работа над быстродействием занимала особое место в разработке программного комплекса. С одной стороны подбирались алгоритмы, которые как можно быстрее решали поставленную задачу, требуя минимального машинного времени. С другой стороны, реализации наиболее ресурсоемких алгоритмов эффективно используют аппаратные средства современных вычислительных систем, предоставляя результат за минимальное время.

Для повышения быстродействия в Анализатор траекторий внедрены следующие алгоритмы:

• буферированное чтение траекторий, пригодное в том числе и для случайного доступа к кадрам траектории. Модуль чтения траекторий позволяет быстро переходить к произвольному кадру траектории для систем, содержащих до 100 000 атомов и больше. Анализатор хранит в памяти уже прочитанные (не обязательно последовательно) кадры, доступ к которым организуется без

обращения к диску. В то же время буфер не дает замедления для последовательного считывания большого количества кадров траектории с диска.

• Вывод трехмерной информации (молекулярного кино) организован при помощи технологии OpenGL. Благодаря использованию аппаратного ускорения вывода графики возможна работа в интерактивном режиме с макромолекулами, содержащими 100 000 и более атомов.

• В модуле квазигармонического анализа применены сразу несколько современных технологий ускорения вычислений. Расчет основной матрицы применяемого метода - матрицы ковариации - выполнен с использованием нескольких ядер центрального процессора. Нахождение собственных чисел и векторов - с использованием графических процессоров по технологии CUDA. Анимированный вывод колебательных мод — по технологии OpenGL.

• Модуль расширенных динамических контактных карт способен функционировать в следующих режимах: использование одного процессора, нескольких процессоров и массивной параллельности (графических адаптеров, работающих по технологии CUDA).

Расширенные динамические контактные карты и ленты контактов

Контактные карты как инструмент анализа молекулярных структур начали применять с 70-80 годов прошлого века. Обычная контактная карта представляет собой булеву матрицу, часто изображаемую в виде двуцветного точечного рисунка. Номера строк и колонок в ней соответствуют номерам атомов, а значения 0 или 1 (пустой либо закрашенный пиксель) проставляются в зависимости от того, расстояние между соответствующими атомами больше или меньше заданного критического значения. Анализ таких карт не представляет труда. Благодаря контактной карте можно быстро охарактеризовать сложную трехмерную статическую молекулярную структуру. Плоское изображение является одним из преимуществ контактных карт. За счет этого их информативность крайне высока.

В работе предлагается новый подход к построению контактных карт, пригодный, в том числе, и для динамических систем. Описываются быстрые интерактивные методы интерпретации таких данных.

Расширенная динамическая контактная карта представляет собой анимированный точечный рисунок с нанесением структуры. Интенсивности цветов зависят от близости атомов. А сами цвета зависят от принадлежности атомов различным структурным единицам. Структурные единицы — это, например, элементы вторичной структуры белковой цепи. Линии,

параллельные и перпендикулярные главной диагонали говорят о наличии контакта между структурами вдоль основной цепи.

V.' . V

Рисунок 3. Синхронный вывод молекулярного кино и расширенной динамической контактной карты (с представлением структуры С-кадгерина).

Анализатор позволяет одновременно в динамике просматривать молекулярное кино с выводом контактной карты (рис.3), тем самым делая карту динамическим изображением. Расширенная динамическая контактная карта позволяет наблюдать динамику образования и разрушения контактов между группами атомов МД-системы.

Третья глава посвящена изучению механических свойств белка клеточной адгезии С-кадгерина (C-Cadherin). В ней приводятся результаты проведенных МД-экспериментов.

Кадгерины - белки клеточной адгезии, обеспечивающие кальций-зависимое соединение клеток в плотных тканях организма. Специфичность образования контактов между клетками очень важна для развития организма, в частности для образования тканей из клеток. Кадгерин состоит из экстрацеллюлярной (внеклеточной или межклеточной) и мембранной частей. Межклеточная часть состоит из пяти доменов (ЕС1-ЕС5), каждый из 110 аминокислотных остатков, всего около 8300 атомов.

Знание механических характеристик белков клеточной адгезии важно для оценки способности межклеточных контактов. Механические свойства кадгерина зависят от наличия или отсутствия ионов металла в структуре молекулы, а также их типа (Са2+, К+, либо Na+). Кадгерин в присутствии ионов Са2+ сохраняет палочковидную конформацию и является более стабильным, чем с ионами К4 и Na+. В отсутствие ионов (в апоформе) структура белка неустойчива.

В работах по атомно-силовой микроскопии приводятся эксперименты по полному разворачиванию кадгерина с содержанием ионов Са2+, Mg2+, К+, Na+ [Oroz et al„ The journal of biological chemistry 286, 2011 9405-9418]. Наблюдаемые в эксперименте пики силы интерпретируются как последовательное разворачивание каждого из 5 доменов кадгерина. Более детальную информацию о конформационных перестройках и возникающих силах в макромолекуле из экспериментов по атомно-силовой микроскопии получить трудно или невозможно. Компьютерное моделирование растяжения кадгерина позволяет регистрировать все происходящие процессы. В теоретической работе [Sotomayor, Schulten, Biophysical Journal 94, 2008, 4621 — 4633] проводилось МД-исследование кадгерина с ионами Са2+, К+, Na+ и в апоформе. Авторы наблюдали дополнительный пик силы, предшествующий первому пику в атомно-силовом эксперименте. Этот пик интерпретировался как конформационные перестройки в отдельных доменах кадгерина.

В работе ставится вопрос о поведении С-кадгерина с ионами Mg:+ в начальной стадии разворачивания глобулы.

Для исследования механических свойств С-кадгерина методом МД было проведено по 8 экспериментов по растяжению с постоянной скоростью 0.1 А/пс белка с ионами Са2+, Mg2+, К+, Na+, а также в апоформе. Изучалась только первая стадия разворачивания белковой глобулы, приводящая к начальному разрушению ее структуры. Расстояние между концами полипептидной цепи увеличивалось примерно от 180 до 480 А.

Выявлено два типа поведения системы: 1) кадгерин с ионами кальция и магния (с большей силовой реакцией на растяжение) и 2) с ионами калия и натрия (с меньшей силовой реакцией на растяжение). Во всех экспериментах присутствуют некоторые флуктуации. Необходимо иметь в виду, что конкретные наблюдаемые опыты являются частным случаем из поведения кадгерина. Конкретные значения силы отличаются для каждого моделирования. Однако можно наблюдать общую тенденцию в поведении молекулы кадгерина. Для апоформы сначала происходит распрямление структуры с одновременным увеличением расстояний между всеми доменами, кроме второго и третьего. Затем из первого домена вытягивается полипептидная цепь, потом из четвёртого (когда первый еще не до конца вытянулся). Все восемь траекторий очень похожи. Для системы с ионами кальция на первой стадии также происходит распрямление структуры, однако, домены не отходят друг от друга.

Далее полипептидная цепь вытягивается, но только из первого домена. Для системы с ионами магния происходит то же, что и с ионами кальция, и только при растяжении на 250-300 А происходит увеличение расстояния между четвёртым и пятым доменами. Для системы с ионами калия и натрия происходит то же, что и с ионами кальция, но в конце, при растяжении на 250300 А, происходит увеличение расстояния между остальными доменами, -сначала между четвёртым и пятым (либо между первым и вторым, меняется от траектории к траектории), потом между третьим и четвёртым. Для всех вариантов самым прочным оказалось соединение второго и третьего доменов. При растяжении полипептидная цепь всегда вытягивалась из первого домена и ни в одном из вариантов при этих растяжениях не вытягивалась из последнего, пятого домена, что можно объяснить наличием двух дисульфидных связей в нем.

В отличие от работы [Sotomayor, Schuiten, 2008, Biophysical Journal 94, 2008, 4621-4633], где наблюдался только один пик силы, мы наблюдаем два пика сила, соответствующие удлинению на 100 и 260 А. Первый пик силы связан с разрушением связей в первом домене и началом разворачивания его полипептидной цепи. Второй пик силы связан с ослаблением контактов между эктодоменами, и в первую очередь между четвёртым и пятым доменами. Результаты по средней величине силы для первого и второго пиков, усредненные по восьми независимым расчетам для каждого из типов ионов, представлены в табл.2. Как видно, первый пик силы в среднем самый большой для ионов кальция, а второй пик — для ионов магния.

Таблица 2.

Средняя сила реакции кадгерина на растяжение с постоянной скоростью.

Система 1 -ый пик силы, F, пН 2-ой пик силы, F, пН

апоформа 154±89 -

Са2+ 2189±121 2604±193

Mg2+ 1979±225 2712±193

Na+ 1884±242 1920±105

К+ 1667±203 1805±219

200 300 400 500 600

Расстояние (А)

Рисунок 4. Усреднённая зависимость силы реакции Р, действующей на концы кадгерина, от расстояния в опытах по растяжению за концы с постоянной скоростью 0.1 А/пс для апоформы и с ионами Са2+, К+,

Для лучшего понимания взаимодействия белков и ионов в водном окружении выполнены МД-эксперименты по растяжению модельной системы Окыоп-СЛи (две молекулы глутаминовой кислоты и ион между ними). Эта простая модель наглядно показала, что в воде ионы Са2+ и взаимодействуют с аминокислотами сильнее, чем ионы К/ и Ыа+.

Результаты моделирования показали (рис. 4), что при деформациях, пограничных с деструктивными, С-кадгерин с ионами имеет

механические свойства схожие со свойствами кадгерина с ионами Са~+.

Четвертая глава посвящена изучению механических свойств восьми альфа-спиральных белков, состоящих из трех альфа-спиралей (четырех правозакрученных и четырех левозакрученных). Проведены МД-эксперименты

11

по растяжению гидратированных макромолекул белков за концы как с постоянной скоростью, так и с постоянной силой. Показаны результаты моделирования с постоянной силой (по 64 траектории для у=0.1, 0.05, и 0.01 А/пс, Т=300 К) (пример см. на рис. 5) и с постоянной силой (64 траектории, Б=800 пН, Т=300 К), всего 256 траекторий.

Для быстрого анализа всех 256 полученных траекторий был использован применен специально созданный инструмент ТА[\/Ю-8спр(., который позволяет использовать возможности Анализатора траекторий из программы-скрипта, упрощающей проведение рутинных операций.

t.nc t.nc

Рисунок 5. Опыты по разворачиванию левозакрученного белка РАВ (lprb) и правозакрученного TRF1 (1Ьа5) под действием постоянной силы 800 пН, приложенной к концам. Зависимость расстояния между концами от времени, показаны результаты 8 независимых испытаний для каждого из белков.

Анализ моделирования 64 МД-траекторий силового разворачивания с постоянной силой (800 пН) показал, что правозакрученные белки механически более устойчивы, чем левозакрученные. На рис. 5 можно увидеть сравнение реакции на силовое воздействие у двух белков; альбумин-связывающий домен (albumin-binding domain, далее по тексту РАВ, lprb) (левозакрученный) и ДНК-связывающий домен теломерного белка (DNA-binding domain of human telomeric protein, далее по тексту TRF1, lba5) (правозакрученный). Время разворачивания левозакрученного белка в среднем составляет около 400 пс, а правозакрученного - около 600 пс. Следует отметить, что существует короткое плато на зависимости расстояния между N-и С-концами от времени у пяти из рассмотренных восьми белков (lprb, lbdd, lenh, lfex и lba5). Существование такого плато может означать появление короткоживущих промежуточных состояний. Белок 1Ьа5 (правозакрученный) имеет максимальную механическую стабильность, а белок 1 vii (левозакрученный)— минимальную.

Следует отметить, что на всех траекториях механического разворачивания каждого из восьми белков вначале разрушаются концевые

спирали. Это объясняется тем, что при разворачивании концевые спирали действуют на среднюю сжимающим образом.

О 0.05 0.1

V, А/пс

Рисунок 6. Зависимость усредненного значения пика силы от скорости растяжения для левозакрученных (кружки) и правозакрученных (квадраты) белков.

При растяжении белков с постоянной скоростью регистрировалась возникающая сила реакции, действующая на концы. Максимальные усилия, которые возникают при растяжении лево- и правозакрученных белков, были усреднены и в зависимости от скорости растяжения представлены на рис. 6. Существует тенденция снижения силового барьера при уменьшении скорости растяжения. Для всех рассмотренных значений скорости правозакрученные белки являются механически более устойчивы, чем левозакрученные.

Анализ 256 траекторий МД показал, что правозакрученные альфа-спиральные белки механически более стабильны, чем левозакрученные. Для объяснения этого явления было проанализировано число контактов между аминокислотами в белках. При расчетах принималось, что несоседние остатки контактируют, если расстояние между их С-а!рЬа атомами не превышало 6 А. Такой анализ показал, что различие в механической стабильности объясняется тем, что правозакрученные домены имеют большее количество контактов на остаток, чем левозакрученные.

Заключение

В работе описаны новые характеристики анализа траекторий молекулярной динамики: коэффициента вариации молекулярной динамики, визуализатор квазигармонических колебаний, расширенных динамических контактных карт и лент контактов, расширенных траекторий, а также коэффициента вариации молекулярной динамики.

Анализатор траекторий молекулярной динамики, разработанный в рамках описанной работы, содержит в себе все описанные методы и подходы к работе с траекториями. Одновременно Анализатор служит интерактивным средством работы с траекториями молекулярной динамики. Это означает, что все алгоритмы, заложенные в Анализатор, работают максимально быстро, чтобы диалог пользователя и компьютера оставался именно диалогом. В ходе реализации программы были применены современные технологии программирования, включая многопроцессорную обработку данных и массивно-параллельную (технологию CUDA).

Согласно работе [Sotomayor Marcos, Schulten Klaus, The Allosteric Role of the Ca2+ Switch in Adhesion and Elasticity of C-Cadherin. Biophysical Journal 94, 2008, 4621—4633] стабильность палочковидной конформации, присущая кадгерину в межклеточном пространстве, зависит от наличия ионов кальция в макромолекуле. При их отсутствии кадгерин принимает случайное свернутое состояние. В настоящей работе проведено моделирование растяжения молекулы кадгерина как в присутствии ионов Са2+, Mg2+, Na+, К+, так и в апоформе с постоянной скоростью. Установлено, что белок межклеточного взаимодействия С-кадгерин с ионами Mg2+ имеет механические свойства схожие со свойствами белка с ионами Са2+.

Методом молекулярной динамики были изучены четыре правозакрученных и четыре левозакрученных альфа-спиральных белка в экспериментах при растяжении с постоянной скоростью (192 траекторий) и под действием постоянной силы (64 траекторий). Анализ траекторий молекулярной динамики с явным растворителем показали, что правозакрученные альфа-спиральные домены более механически устойчивы, чем левозакрученные. Этот результат можно объяснить, по крайней мере частично, тем, что правозакрученные альфа-спиральные белки имеют большее число контактов на остаток, чем левозакрученные белки.

Выводы

1. Разработано новое программное обеспечение (ПО) для интерактивного анализа траекторий молекулярной динамики (МД), в рамках которого предложены новые характеристики и подходы для анализа структуры и динамики биологических макромолекул. Это коэффициент вариации МД, работа с расширенными траекториями, визуализатор квазигармонических колебаний, расширенные динамические контактные карты.

2. По результатам молекулярно-динамического моделирования установлено, что белок межклеточного взаимодействия С-кадгерин с ионами Мд2+ имеет механические свойства, схожие со свойствами белка с ионами Са2+.

3. Установлено, что механические свойства трехспиральных белков зависят от их хиральности. При этом правозакрученные домены обладают большей механической стабильностью, чем левозакрученные.

4. Созданное ПО и предложенные подходы могут быть применены для анализа траекторий МД расчетов сложных биомолекулярных систем, в том числе белков и нуклеиновых кислот.

Публикации автора по теме диссертации

Статьи

1. Лихачев И.В., Балабаев Н.К. Анализатор траекторий молекулярной динамики. // Математическая биология и биоинформатика. 2007. Т. 2. № 1. С. 120-129.

2. Лихачев И.В., Балабаев Н.К. Анализатор траекторий молекулярной динамики (TAMD) // Свидетельство о государственной регистрации программы для ЭВМ № 2014612313.

3. Лихачев И.В., Балабаев Н.К. Построение расширенных динамических контактных карт по данным молекулярно-динамических расчетов. // Математическая биология и биоинформатика. 2009. Т. 4. № 1. С. 36-45.

4. Glyakina AV, Likhachev IV, Balabaev NK, Galzitskaya OV. Right- and left-handed three-helix proteins. II. Similarity and differences in mechanical unfolding of proteins. // Proteins. 2014. V. 82. No. 1. P. 90-102.

5. Лихачев И.В., Галзитская O.B., Балабаев Н.К. Исследование механических свойств С-кадгерина методом молекулярной динамики. // Компьютерные исследования и моделирование. 2013. Т. 5. № 4. С. 727-735.

Материалы конференций

1. И.В. Лихачев, Н.К. Балабаев. «Анализатор траекторий молекулярной динамики». Сборник тезисов I международной конференции молодых ученых «Математическая биология и биоинформатика». Пущино, 9-15 октября 2006. С. 194-195.

2. И.В. Лихачев, Н.К. Балабаев. «Построение расширенных динамический контактных карт по данным молекулярно-динамических расчетов». Сборник тезисов II международной конференции молодых ученых

«Математическая биология и биоинформатика». Пущино, 7-13 сентября 2008. С. 158-159.

3. И.В. Лихачев, Н.К. Балабаев. «Построение расширенных динамический контактных карт по данным молекулярно-динамических расчетов». Сборник тезисов 11-ой Пущинской международной школы-конференции молодых ученых «Биология - наука XXI века». Пущино, 29 октября - 2 ноября 2007. С. 58.

4. И.В. Лихачев, Н.К. Балабаев. «Комплексный анализ траекторий молекулярной динамики». Сборник тезисов 13-ой Пущинской международной школы-конференции молодых ученых «Биология - наука XXI века». Пущино, 28 сентября - 2 октября 2009 года. С. 260.

5. И.В. Лихачев, Н.К. Балабаев. «Применение анализатора траекторий молекулярной динамики при анализе фазовых переходов». Материалы V Санкт-Петербургской конференции молодых учёных «Современные проблемы науки о полимерах». Санкт-Петербург, 19-22 октября 2009 г С 75.

6. И.В. Лихачев, Н.К. Балабаев. «Анализ траекторий молекулярной динамики модельных молекулярных систем». Сборник тезисов VII Национальной конференции «Рентгеновское, Синхротронное излучения, Нейтроны и Электроны для исследования наносистем и материалов. Нано-Био-Инфо-Когнитивные технологии», РСНЭ-РНБИК 2009. Москва, 16-21 ноября 2009 г. С. 448

7. Лихачев И.В., Балабаев Н.К. «Визуализатор квазигармонических колебаний молекулярных структур». Сборник тезисов 14-ой Пущинской международной школы-конференции молодых ученых «Биология - наука XXI века». Пущино, 19 - 23 апреля 2010 года. С. 283.

8. Лихачев И.В., Балабаев Н.К. «Использование графических сопроцессоров для интерактивного анализа траекторий молекулярной динамики». Сборник тезисов III международной конференции молодых ученых «Математическая биология и биоинформатика» ICMBB-10. Пущино, 10-15 октября 2010г. С 160-161.

9. Лихачев И.В., Балабаев Н.К. «Визуализатор квазигармонических колебаний молекулярных структур». Материалы Шестой Санкт-Петербургской конференции молодых ученых с международным участием «Современные проблемы науки о полимерах». Санкт-Петербург, 18-21 октября 2010 г. С 98

10. Лихачев И.В., Балабаев Н.К. «Анализатор траекторий молекулярной динамики на лабораторном практикуме». Материалы Одиннадцатой международной конференции «Математика, Компьютер, Образование», МКО-2011. Пущино, 24-29 января 2011 г. http://www.mce.biophys.msu.ru/ archive/doc98066/doc.pdf.

11. Лихачев И.В., Балабаев Н.К. «Использование графических сопроцессоров для ускорения вычисления динамических контактных карт». Сборник тезисов 15-ой Пущинской международной школы-конференции молодых

ученых «Биология - наука XXI века». Пущино, 18-22 апреля 2011 г. С. 215-216.

12. Лихачев И.В., БалабаевН.К. «Использование динамических контактных карт для исследования структурных перестроек в белках при их деформации». Сборник тезисов VIII Национальной конференции «Рентгеновское, Синхротронное излучения, Нейтроны и Электроны для исследования наносистем и материалов. Нано-Био-Инфо-Когнитивные технологии», РСНЭ -НБИК 2011. Москва, 14-18 ноября 2011 г. С. 283.

13. Лихачев И.В., БалабаевН.К., Гесснер Р. «Механические свойства С-кадгерина по результатам молекулярно-динамического моделирования». Сборник тезисов 16-ой Пущинской международной школы-конференции молодых ученых «Биология — наука XXI века». Пущино, 2012. С. 81.

14. Лихачев И.В., БалабаевН.К. «Анализ механического растяжения С-кадгерина по данным МД моделирования». Труды IV Съезда биофизиков России. Н.-Новгород, 2012. Симпозиум III. С. 177

15. Лихачев И.В., БалабаевН.К. «Механические свойства с-кадгерина по результатам молекулярно-динамического моделирования». Материалы Двенадцатой международной конференции «Математика, Компьютер, Образование», МКО-2013. Пущино, 28 января - 2 февраля 2013 г. С. http://www.mce.su/archive/docl73995/rus.pdf.

16. Лихачев И.В., Балабаев Н.К. «Переход на гетерогенную архитектуру программы расчета молекулярной динамики». Сборник тезисов 17-ой Пущинской международной школы-конференции молодых ученых «Биология - наука XXI века». Пущино, 21-26 апреля 2013 г. С. 69.

Формат 60x84/16. Усл. печ.л. 1,25 Тираж 100 экз. Заказ № 20.

Отпечатано с готового оригинал-макета в типографии «Папирус» г. Тула, ул. Ленина, 12 Тел.: (4872) 38-40-09

Текст научной работыДиссертация по биологии, кандидата физико-математических наук, Лихачев, Илья Вячеславович, Пущино

Федеральное государственное бюджетное учреждение науки ИНСТИТУТ МАТЕМАТИЧЕСКИХ ПРОБЛЕМ БИОЛОГИИ РОССИЙСКОЙ АКАДЕМИИ НАУК

На правах рукописи

0420145818?

Лихачев Илья Вячеславович

Анализатор траекторий молекулярной динамики и его применение к изучению механических свойств белков

03.01.02 - биофизика

Диссертация на соискание ученой степени кандидата физико-математических наук

Научный руководитель:

к.ф.-м.н. Балабаев Николай Кириллович

Научный консультант:

д.ф.-м.н. Галзитская Оксана Валериановна

Пущино - 2014

Содержание

Введение....................................................................................................................................4

Глава 1. Обзор подходов и методов.........................................................................................8

1.1 Молекулярная динамика и анализ траекторий молекулярной динамики.....................8

1.2 Программы для работы в области молекулярной динамики.......................................16

Глава 2. Создание Анализатора траекторий..........................................................................27

2.1 Назначение.....................................................................................................................27

2.2 Принцип работы............................................................................................................28

2.3 Краткое описание возможностей..................................................................................30

2.3 Работа по увеличению быстродействия.......................................................................37

2.4 Расширенные динамические контактные карты и ленты контактов...........................45

2.5 Коэффициент вариации молекулярной динамики. Распознавание процессов на исследуемой системе без предварительных сведений.......................................................58

2.6 Квазигармонический метод...........................................................................................64

2.7 Сценарии анализа траекторий молекулярной динамики. Платформа TAMD............72

Глава 3. Механические свойства кадгерина..........................................................................75

3.1 Введение........................................................................................................................75

3.2 Постановка расчетов.....................................................................................................77

3.3 Проведение расчетов.....................................................................................................81

3.4 Результаты.....................................................................................................................87

Глава 4. Исследование механической стабильности лево- и правозакрученных альфа-спиральных белков.................................................................................................................89

4.1 Введение........................................................................................................................89

4.2 Постановка расчетов.....................................................................................................91

4.3 Проведение расчетов.....................................................................................................97

4.4 Результаты...................................................................................................................106

Заключение............................................................................................................................107

Выводы..................................................................................................................................110

Список литературы...............................................................................................................111

Список сокращений и условных обозначений.....................................................................122

Приложение I. Инструкция по эксплуатации TAMD..........................................................123

1.1 Назначение...................................................................................................................123

1.2 Общий порядок работы с ПО.......................................................................................123

1.2.1 Открытие файлов...................................................................................................125

1.2.2 Перемещение вдоль траектории. Молекулярное кино.........................................126

1.2.3 Расчет общих характеристик.................................................................................127

1.2.4 Средство работы с графиками...............................................................................128

1.3 Дополнительные режимы работы................................................................................129

1.3.1 Выделение групп атомов.......................................................................................129

1.3.2 Визуализация расширенных траекторий..............................................................131

1.3.3 Расширенные динамические контактные карты...................................................132

1.3.4 Квазигармонический анализ..................................................................................132

Приложение II.......................................................................................................................136

II. 1 Базовые команды TAMD-Script.....................................................................................136

11.2 Базовые команды TAMD-Script.....................................................................................137

11.3 Пример. Сценарий анализа лево- и правозакрученных альфа-спиральных белков в опытах их разворачивания под действием постоянной силы, приложенной к концам.....139

Введение

Стремительное развитие вычислительной техники, особенно за последние 10 лет, привело к бурному росту количества научных работ в физике, химии, биологии и смежных науках, основным методом исследования в которых является так называемое «компьютерное моделирование» (или «компьютерный эксперимент»). Эти термины применяются в случаях, когда компьютер в научной работе используется не в традиционном качестве, т. е. в виде средства ускорения процесса расчета искомых величин по аналитически заданным формулам (или средства обработки введенной информации), но как особый «прибор». На этом приборе с помощью заданной модели и специально составленных программ проводится детальная имитация исследуемого процесса, в итоге которой извлекается информация об искомых свойствах системы. Технический прогресс в области вычислительной техники стимулировал развитие множества численных алгоритмов для решения различных задач с использованием компьютеров. В итоге компьютерное моделирование, наряду с традиционными теоретическими (аналитическими) подходами, а также экспериментальными методами, превратилось в мощное средство изучения свойств различных молекулярных систем и объектов, в ряде случаев едва ли не единственно возможное, а потому представляющее специальный интерес.

Результатом МД-расчетов являются траектории молекулярной динамики. Траекторные файлы представляют собой последовательную запись координат атомов макромолекулы через определенные промежутки времени. Исходя из определения, траекторные файлы в текстовом формате отличаются своей простотой и бесполезностью. Для извлечения информации из таких файлов используются специальные программы и методы обработки информации: от показа молекулярного кино до нахождения характеристик вдоль траектории (от времени).

Данная работа содержит описание новых методов и характеристик анализа траекторий молекулярной динамики - коэффициента вариации молекулярной динамики, квазигармонического метода, расширенных динамических контактных карт и лент контактов, расширенных траекторий.

Актуальность темы исследования

Методом моделирования молекулярной динамики (МД) пользуются во многих научно-исследовательских лабораториях. После проведения МД-эксперимента ставится задача анализа полученных данных. Возможны случаи, когда необходимо ответить на конкретные вопросы по эксперименту, а также когда возникает потребность описать эксперимент в целом, заострив внимание на структурные перестроения в ходе эксперимента.

Как правило, при анализе траекторий многие исследователи пишут собственные несложные программы для расчета простых характеристик. Вместе с тем, сложные алгоритмы работы с траекториями заложены в такие объемные пакеты как VMD и GROMACS, на изучение которых требуется до полугода рабочего времени.

Разработанная программа TAMD (Trajectory Analyzer of Molecular Dynamics, далее по тексту Анализатор) сочетает в себе: интуитивный графический пользовательский интерфейс, новые характеристики, направленные на быстрый анализ траектории в целом, а также является платформой для написания новых характеристик на траекториях и управляемой программой-платформой с интерпретатором скриптового языка для автоматизации рутинных действий.

В целях повышения быстродействия для анализа МД-систем из большого количества атомов, реализация Анализатора траекторий использует современные технологии, направленные на ускорение обработки информации, такие как технология вывода трехмерной графики OpenGL,

параллельное программирование, в том числе массивно-параллельное (технология США [110]).

Некоторые белки в клетке испытывают механические деформации при таких биологических процессах как межклеточная адгезия, сокращение мышц, транслокация белков через мембрану. Для понимания молекулярной природы механической стабильности белков необходимо провести большое количество МД экспериментов для исследования зависимости механических свойств белков от различных параметров. Исследование этого вопроса представляет практический интерес для конструирования биоматериалов с повышенной механической стабильностью.

При помощи Анализатора в данной работе проведен анализ механического разворачивания белка межклеточной адгезии кадгерина, а также влияние хиральности восьми альфа-спиральных белков на их механические свойства.

Цели и задачи

1. Разработка Анализатора траекторий молекулярной динамики как программного средства для анализа МД-траекторий с одной стороны, так и платформы для создания инструментария по анализу траекторий с другой. Создание новых алгоритмов исследования МД траекторий биомолекулярных систем. Обеспечение работы с молекулярными системами, содержащими до 100 ООО атомов.

2. Получение МД-траекторий для различных гидратированных белков и решение следующих задач:

а) Сравнение механических характеристик белка клеточной адгезии С-кадгерина (С-СасШепп) в зависимости от присутствия ионов различного типа.

Ь) Исследование влияния хиральности альфа-спиральных белков на их механические свойства.

Научная новизна

Создан новый инструмент для анализа МД-траекторий, позволяющий в интерактивном режиме рассчитывать конфигурационные и динамические характеристики молекулярных систем. В том числе, получение расширенных динамических контактных карт и лент контактов, нормальных мод, коэффициентов вариации.

Впервые методом молекулярной динамики проведен анализ механических характеристик макромолекулы белка С-кадгерина с ионами магния.

Впервые произведен сравнительный анализ последовательности разворачивания восьми альфа-спиральных белков по МД-экспериментам. Показано, что правозакрученные домены обладают большей механической стабильностью, чем левозакрученные.

Теоретическая и практическая значимость работы

Анализатор траекторий является необходимым средством при проведении МД-исследований. Основная направленность Анализатора - способность дать быструю характеристику динамики исследуемого объекта в целом, включая системы до 100 ООО атомов. Применение Анализатора способствует повышению эффективности исследований методом молекулярной динамики.

Исследование механической стабильности белковых молекул представляет практический интерес для конструирования биоматериалов с повышенной механической стабильностью.

Глава 1. Обзор подходов и методов

1.1 Молекулярная динамика и анализ траекторий молекулярной динамики

К настоящему моменты времени метод молекулярной динамики является одним из наиболее востребованных средств теоретического анализа молекулярных структур.

Существует ряд программ по проведению численных расчетов методом молекулярной динамики (МД): GROMACS (GROMOS), HyperChem, CHARMM (CHARMm), NAMD, PUMA. История развития последних тесно связана с историей вычислительной техники. К настоящему моменту времени существуют и активно поддерживаются версии программ для всех основных вычислительно мощных классов компьютерной техники: персональных компьютеров (однопроцессорное и малопроцессорное вычисление), суперкомпьютеры (многопроцессорные комплексы), вычисления с поддержкой GPU (сверхмногопотоковые алгоритмы для CUDA [110]). Отмечается, что направленность определенной программы на конкретную аппаратную базу слабо связана с возможностями самой программы.

В настоящей работе в качестве комплекса программ для моделирования молекулярной динамики выбрана PUMA [45, 46]. Выбор обусловлен, прежде всего, полнотой понимания программного комплекса - это наиболее важный фактор для проведения вычислительных экспериментов с конкретными образцами. Опыты проводились как на персональных компьютерах, так и на серверном оборудовании. Исходный код PUMA доступен и, при необходимости, может быть изменен и/или дополнен.

Как представитель своего класса, PUMA получает на входе pdb-файл, в котором содержится информация о пространственной структуре молекулярного комплекса к начальному моменту времени. Информация о моделируемом объекте может быть изменена или дополнена встроенными средствами PUMA, например, заполнение пространства заданного объема растворителем (молекулами воды).

Следующий этап - подготовительный. На основе координат атомов, их типов, а также наименований аминокислот программа составляет списки постоянно взаимодействующих частиц (используя силовое поле Amber), а также задает начальные скорости атомов по первоначальной температуре. Аналогичным образом работает и программа GROMACS.

Процесс моделирования - процесс интегрирования уравнений 2-го закона Ньютона - самая важная часть эксперимента. Внутри программы происходит вычисление координат атомов и сопутствующих величин через заданный промежуток времени - шаг интегрирования. Результат работы программы - траектории молекулярной динамики и сопутствующих величин. Траектория - это последовательная запись координат интересуемых частиц моделирования через заданные промежутки времени - период вывода траектории МД. Под сопутствующими величинами понимаются текущее значение времени, энергии (Ван-дер-Ваальса, свободная), прикладываемы силы, температура системы, термостата и пр.

Анализ полученных данных является одной из важнейших задач по теоретическому молекулярному моделированию

1.1.1 Задача анализа траекторий молекулярной динамики

После того, как проведен МД-опыт, траектории молекулярной динамики являются основными объектами теоретического исследования.

Они с требуемой детализацией несут в себе подавляющую часть информации о поведении молекулярной системы.

1.1.2 Аппаратная база

Помимо важности самой траектории, толчком для создания и развития программ по анализу файлов траекторий послужило бурное развитие вычислительной техники. С одной стороны, объем современных устройств хранения информации исчисляется гигабайтами. С другой, возможности отображения графической информации с некоторого момента времени стали особо привлекательными для показа графического образа молекулярной системы. Определенную временную точку назвать нельзя, процесс шел и идет ступенчатым образом. Можно упомянуть об устройствах вывода графической информации на бумажные носители. Огромный вклад внесло появление мониторов с графическим режимом, цветных мониторов. Увеличения разрешения мониторов. Если переходить к эре массовых персональных компьютеров, то особый вклад в развитие средств визуального анализа траекторий сделало появление отдельных графических адаптеров. Компания IBM в 1981 году выпустила видеокарту CGA (Color Graphics Adapter), а также первый стандарт для цветных мониторов. После некоторых промежуточных моделей (EGA, MCGA) эта же фирма в 1987 году выпустила видеокарту и одноименный стандарт VGA (Video Graphics Array), который, спустя 23 года, сохранился и по сей день. Видеокарты, поддерживающие этот стандарт, способны в режиме 640x480 точек по горизонтали и вертикали соответственно отображать картинку с частотой 60 Гц. Стандарт поддерживает 256 цветов, каждый из которых может принимать одно из 262 144 различных значений (отводится по 6 битов на красный, зелёный и синий компоненты), объём видеопамяти VGA — 256 кБ. Уже на этом видеоадаптере возможно уверенное отображение графического представления молекул в динамике. Следующий стандарт появился в 1991 -

активно используется и по сей день - SVGA (SuperVGA). Разработчики увеличили количество цветов до 16 и 24 бит, разрешение и стали поддерживать любую частоту вывода информации. Последняя постоянно росла в эру в CRT-мониторов и резко упала до 60-75 Гц с появлением жидкокристаллических мониторов.

Следующим шагом в развитии видеоадаптеров стало появление трехмерных ускорителей, в большей степени, благодаря играм, нежели научным потребностям. В начале 1990-х компания 3dfx Interactive на основе собственных видеокарт Voodoo Graphics предложила использовать Glide -API для трехмерной графики. Дело не в том, что изображение стало еще более реалистичным - его можно было посчитать и центральным процессором, стандарта SVGA было уже достаточно. Благодаря трехмерным ускорителям процесс создания изображений стал быстрым, благодаря чему появилась способность быстро менять изображения, создавая эффект анимации. Дальше поколения видеокарт можно разделять по версиям DirectX и OpenGL, которые они поддерживают - современных API, которые активно развиваются и по сей день.

1.1.3 Методика проведения экспериментов

К настоящему моменту времени исследователи из разных стран мира, использующие данные мо�