Бесплатный автореферат и диссертация по биологии на тему
Исследование состояний ансамбля ионных каналов с помощью теории нейронных сетей АRТ2
ВАК РФ 03.00.02, Биофизика

Текст научной работыДиссертация по биологии, кандидата физико-математических наук, Пешехонов, Вадим Вячеславович, Москва

Г> 4 ci «1 hh а 0 - '

/

/ марковский ОРДЕНА ЛЕНИНА, ОРДЕНА ОКТЯБРЬСКОЙ РЕВОЛЮЦИИ И \у ОРДЕНА ТРУДОВОГО КРАСНОГО ЗНАМЕНИ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ИМЕНИ М. В. ЛОМОНОСОВА

ФИЗИЧЕСКИЙ ФАКУЛЬТЕТ ПЕШЕХОНОВ Вадим Вячеславович

ИССЛЕДОВАНИЕ СОСТОЯНИЙ АНСАМБЛЯ ИОННЫХ КАНАЛОВ С ПОМОЩЬЮ ТЕОРИИ НЕЙРОННЫХ СЕТЕЙ ART2

Специальность 03.00.02 - биофизика

Диссертация на соискание ученой степени кандидата физико-математических наук

Научный руководитель доктор физ.-мат. наук, профессор В.А. Твердислов канд. физ-мат. наук Л. В.Яковенко

Москва 1999

ОГЛАВЛЕНИЕ

Введение 3

Глава I. Обзор литературы 7

Часть 1 Анализ временных рядов 7

ь

Часть 2 Искусственные нейронные сети 3

Часть 3 Ионтранспортные системы эритроцитов человека 21

Часть 4 Математические модели пассивного транспорта ионов 24

Глава II. Теоретическая часть 48

Часть 1. Метод анализа временных рядов 48

Часть 2. Классификация гистограмм 57

Часть 3. Моделирование временных рядов фиксированной длины с 65 заданной функцией плотности распределения

Часть 4 Анализ моделированного временного ряда 68

Глава 111. Экспериментальная часть 71

Часть 1 Материалы и оборудование 72 Часть 2 Классификация состояний ансамбля каналов эритроцитов

человека 72

Обсуждение результатов 78

Приложение Биофизические методы в экономике 81

Выводы 92

Список литературы Ф 94

ВВЕДЕНИЕ

Транспорт ионов через биологические мембраны играет чрезвычайно важную роль в

функционировании растительных и животных клеток. Жизненно важные для человеческого

организма функции таких клеток как эритроциты целиком обусловлены особенностью их

t

мембран, в частности характеристиками систем трансмембранного транспорта ионов -ионных каналов и переносчиков ионов.

Значительные успехи в изучении функционирования ионных каналов были достигнуты с усовершенствованием экспериментального метода patch-clamp, позволяющего регистрировать активность одиночных каналов, встроенных в мембранные фрагменты малого диаметра, а также проводить измерения на мембранах живых клеток. Однако, при этом возникает биофизическая проблема определения числа каналов и структуры состояний проводимости. Не являются исключением и ионтранспортные системы клеток крови человека, большое количество работ по изучению мембранного состава и особенностей функционирования которых обусловлено особой ролью, отведенной им в процессе нормального функционирования организма. Значительное число работ посвящено исследованию ионного транспорта эритроцитов человека, физиологические функции которых сильно зависят от проницаемости клеточных мембран.

Несмотря на сравнительную несложность клеточной структуры эритроцитов, в их мембранах обнаружены все основные виды ионтранспортных систем: натриевые, калиевые, кальциевые и хлорные. При исследованиях зависимости калиевой проводимости активируемых кальцием каналов от трансмембраной разности потенциалов было обнаружено два значения проводимости (Schwarz, W., R.Grygorczyk, D.Hof). Методом patch-clamp два состояния проводимости (0,5 пА и 1,7 пА) калиевых каналов (К+-каналов) обнаружены также в мембранах эритроцитов лягушки. Учитывая различия в чувствительности этих состояний проводимости к внеклеточной концентрации калия, внутриклеточной концентрации ионов

кальция и изменению объема клетки, авторы сделали вывод о существования двух типов

калиевых каналов, а не одного типа с двумя подсостояниями проводимости. Ни один из

существующих методов анализа не позволяет точно ответить на вопрос: один канал с

несколькими -подсостояниями или несколько типов каналов с различными состояниями

£

проводимости существуют в мембранах клеток, в частности в эритроцитах.

При исследовании поведения ансамбля ионных каналов в плазматических мембранах, функционирования ферментативных систем и т.д. анализ флуктуаций измеряемой величины является единственно доступным способом получения информации об изучаемом объекте без внесения в него существенных возмущений.

В последние десятилетия достигнуты существенные успехи в создании алгоритмов анализа временных рядов с использованием новейших методов теории нелинейных динамических систем таких как: вычисление корреляционной размерности, экспонент

Ляпунова, энтропии, и т.д., которые совместно с традиционными методами статистического

*

анализа успешно используются при первичной обработке экспериментальных данных. С усовершенствованием экспериментальных методов и техники научных исследований повышается точность и количество накопленных в опыте данных, и в тех случаях, когда человеческий мозг не в состоянии справиться с объемом информации, или точность представления данных недоступна человеческому глазу, вторичную обработку целесообразно проводить с привлечением компьютерных методов анализа.

Развитие вычислительной техники сделало возможным создание самоорганизующихся систем классификации объектов и явлений, реализующих новейшие алгоритмы распознавания, и способных выделять из непрерывного потока информации наиболее важную, классифицировать и регистрировать ее в долговременной памяти. Особое внимание при создании интеллектуальных систем нового поколения уделяется теории нейронных

сетей, устройство и принципы функционирования, способность эффективно обучаться и самообучаться которых напоминает мыслительные процессы человеческого мозга.

При самообучении нейросеть начинает вести себя так же, как вела себя исследуемая система на протяжении определенного промежутка времени. Чем больше этот промежуток, тем более вероятно появление уже известных из прошлого состояний, поведение системы при которых легче предсказать. При этом, такая анализирующая система ничего не знает о природе происходящих процессов. Просто после "рождения" ей предлагают прожить "жизнь" исследуемого объекта. Количество параметров исследуемой системы и взаимосвязь между ними, как правило, также не известны. Если принципы построения и особенности функционирования искусственной системы соответствуют природе исследуемой системы, то после окончания обучения в ответ на изменения внешних параметров эта система будет

а

вести себя так же, как и исследуемая. Зная архитектуру искусственной системы, можно определить число и взаимосвязи параметров исследуемой системы, изменяя, например, только один параметр и наблюдая за поведением остальных. В качестве такого подхода, мы предлагаем современные методы распознавания, в частности, использующие теорию нейронных сетей.

Данная работа посвящена экспериментальному определению значений проводимости ансамбля ионных каналов эритроцитов человека методом patch-clamp и определению структуры их состояний. Создан новый метод анализа макроскопических флуктуаций, в котором для распознавания и классификации экспериментальных данных используется "адаптивная резонансная теория" нейронных сетей. Параметризация первичной информации производится с помощью традиционных статистических методов. Предложенный метод проверен с помощью математического моделирования временных рядов, исследована чувствительность распознающей системы к уровню шума в теоретической модели. Экспериментальная часть работы посвящена выделению и исследованию с помощью

описанного метода дискретных состояний проводимости системы ионных каналов пассивного транспорта в мембранах эритроцитов человека, и определению структуры

о

состояний проводимости. Большая общность разработанных и использованных биофизических подходов, в частности теории нейронных сетей, позволяет предположить возможность их использования в других областях науки. Показана применимость их в экономике на примере прогнозирования поведения курса валют и важнейших мировых индексов.

ГЛАВА I. Обзор литературы

ЧАСТЬ 1. Методы анализа временных рядов

Анализ временных рядов как метод исследования свободного функционирования систем различной природы, позволяющий обнаруживать корреляции разных процессов и явлений и прогнозировать их временное поведение [1,2], успешно применяется во многих областях науки и техники: в экономике [3, 4], медицине [5], а также при изучении физико-химических и биологических объектов [6, 7]. Это стало возможным благодаря огромному

количеству теоретических исследований, посвященных разработке новых методов анализа

©

нелинейных динамических систем [8, 9, 10], а также стремительному развитию вычислительной техники.

Для получения какой-либо информации об изучаемом объекте или явлении, экспериментальные данные подвергаются нескольким последовательным стадиям обработки информации не менее 3-х). Во-первых, это качественная оценка результатов измерения, позволяющая обнаружить артефакты, которые с очевидностью не могут появиться в результате свободной эволюции наблюдаемой системы, как-то: особенности функционирования измерительной системы или возмущающее влияние внешних воздействий. Второй этап - это количественная обработка экспериментальных данных с помощью статистических методов анализа. При этом каждый раз выбор конкретного метода зависит от характера наблюдаемого процесса, но первым шагом при анализе любого процесса должен быть тест на обнаружение очевидных периодичностей и наличие тренда. Затем традиционно следует спектральный анализ, позволяющий разделить периодические, квазипериодические и апериодические процессы. Введение фиксированных границ анализируемого участка ряда может привести к возникновению боковых частот [11]. Если

при анализе экспериментальных данных по каким-либо соображениям шум считается несущественным, обычно применяют элементы теории нелинейных детерминированных систем: вычисление экспонент Ляпунова [12], корреляционных размерностей, энтропии, сечение Пуанкаре, а также методы символьной динамики [13]. Основное предположение таких подходов заключается в том, что состояние системы может быть охарактеризовано небольшим числом переменных, а эволюция системы может быть описана системой дифференциальных уравнений. Таким образом, второй этап анализа данных заключается в выявлении основных закономерностей изучаемого процесса, снижающих размерность наблюдаемого явления и позволяющих представить экспериментальные данные в наиболее удобной для последующего анализа форме.

Если изучаемый процесс носит вероятностный характер, то одним из способов его описания является определение плотности распределения наблюдаемой величины. При построении функции плотности различают две ситуации: в первом случае априори известна форма функции плотности, содержащая ряд параметров, которые следует определить по ограниченной выборке независимых реализаций. В этом случае оценку параметров осуществляют параметрическими методами: метод максимума правдоподобия Фишера, метод Байеса [см. например 14, 15].

Параметрическая оценка плотности возможна лишь при описании достаточно простых объектов, поэтому на практике при большом количестве признаков и неизвестной зависимости между ними, в отсутствии априорной информации о форме распределения наблюдаемой величины, оценку функции плотности целесообразно проводить непараметрическими методами [15,16]. Наиболее простым является гистограммный метод, основанный на оценке средней в области плотности распределения. Существуют два способа построения гистограмм: с одинаковыми по объему интервалами разбиения, и с областями, содержащими равное количество реализаций. При этом считается, что функция плотности

является непрерывной или количество разрывов незначительно по сравнению с объемом выборки. Основные недостатки гистограммного метода - это неопределенность выбора границ и дробности разбиения пространства признаков, поэтому оценку функции плотности вероятности гистограммным методом можно считать удовлетворительной лишь при достаточно больших выборках. Однако существует большое число работ, показывающих, что "несостоятельные" гистограммы плотности, построенные по небольшим выборкам, количество областей разбиения в которых сравнимо с объемом выборки [17], также могут служить информативным способом при изучении различных процессов [18, 19, 20, 21]. В работах [19, 20] на основе визуального анализа несостоятельных оценок функции плотности обнаружено сходство гистограмм, полученных при наблюдении процессов различной природы и зафиксирована периодичность их появления, кратная суточному вращению земли. В работе П.С. Иванова [9] методами кластерного анализа проведена классификация "несостоятельных" гистограмм значения суммарной калиевой проводимости ансамбля грамицидиновых каналов, встроенных в бислойную липидную мембрану, и показано существование устойчивых состояний проводимости. В этой же работе дана сравнительная характеристика различных алгоритмов кластерного анализа и метрических функционалов, используемых в качестве критерия сходства различных гистограмм. С помощью метода главных компонент проведена визуализация блуждания ансамбля ионных каналов вдоль выделенных состояний.

К другим методам непараметрической оценки, основанным на определении среднего значения плотности в определенном интервале разбиения, относятся методы локального оценивания (оценивание функции плотности распределения в фиксированной точке): метод "парзеновского окна" [22], заключающийся в последовательном сжатии малой окрестности Уы точки как функции размера выборки И, и метод "км ближайших соседей" [15, 22], в котором объем окрестности является не только функцией И, но и функцией фиксированного

числа реализаций, ближайших к выбранной точке. Если предполагается, что значение

функции плотности в малой окрестности любой реализации отлично от нуля, то оценку

можно представить в виде суммы весовых функций всех реализаций. Такая оценка

называется "обобщенной гистограммой" или оценкой, "парзеновского" типа [14, 16].

i

Очевидными существенными недостатками методов локального оценивания являются необходимость хранить в памяти всю выборку и неопределенность выбора зависимости VN, kN от N, а недостатками метода "обобщенной гистограммы" - равное числу реализаций количество слагаемых и неоднозначность в выборе вида ядра.

Наиболее общим способом непараметрического оценивания является разложение искомой функции плотности по ортогональным базисным функциям, в качестве которых могут использоваться: разложение Фурье, полиномы Лежандра, Гегенбауэра, Якоби, Эрмита и Лагерра, а также учитывающее принцип неопределенности Гейзенберга: AtAf > 1/4тс Фурье-разложение по специальным функциям называемым "wavelet" [23]. В работе П. С. Иванова [19] разложение по тригонометрическим функциям использовано для снижения размерности несостоятельных оценок функций плотности, полученных гистограммным методом. В качестве основных признаков гистограмм было выбрано ограниченное число коэффициентов при определенных гармониках, позволяющее наиболее эффективно расклассифицировать распознаваемые объекты при данном выборе признакового пространства и алгоритма классификации.

В самом общем случае построение любой системы распознавания состоит из следующих этапов: выбор эффективного словаря признаков для описания исходного множества объектов; формирование оптимального алфавита классов; выбор решающего правила, наилучшим образом обеспечивающего разбиение всего множества объектов на классы.

По первоначальной априорной информации о классифицируемых объектах системы распознавания можно разделить на системы без обучения, обучающиеся и самообучающиеся [24]. Если первоначальной информации о множестве изучаемых объектов достаточно для формирования эффективного словаря признаков и априорного словаря классов, построение распознающей системы сводится к выбору решающего правила, наилучшим образом определяющего границы между классами [15, 22]. Такие системы называются "системами без обучения". В "обучающихся системах" количество априорной информации позволяет определить оптимальный алфавит классов и построить априорный словарь признаков, но ее не достаточно для эффективного описания классов на языке признаков. Обучение заключается в многократном предъявлении обучающей выборки с указанием, к какому классу принадлежит очередной объект [25]. В случае, когда первоначальной информации достаточно лишь для определения словаря признаков, а априорная информация о числе и свойствах классов неполна или отсутствует, создать априорный алфавит классов, не накладывая жестких ограничений на свойства исследуемых объектов, не возможно. Тогда целесообразным становится применение "самообучающихся систем", в которых обучающая последовательность заменена набором правил, с помощью которых система распознавани