Моделирования координации движений при локомоции на основе синхронизации осцилляторов

Цымбалюк, Геннадий Сергеевич

Бесплатный автореферат и диссертация по биологии на тему
Моделирования координации движений при локомоции на основе синхронизации осцилляторов
ВАК РФ 03.00.02, Биофизика

Автореферат диссертации по теме "Моделирования координации движений при локомоции на основе синхронизации осцилляторов"

MOCICOnCKIlfï ОРДЕНА ЛШШПЛ, 01'ДШЛ ОКТЯЫ'ЬС KOI I гаю.пюцпп JJ (И'ДКМЛТРУДОЮГО красного üiiAMiüiíi госудлгстш-ППЫП УШШНРСПТПТ

______им. M. В. ЛОМОНОСОВА______

РГ Б ОД Физическим факультет

На üpnuí.x ¡ь'комиин

1 7 OKI ''Л"' УДК 007: 519.95

Цьшбалюк Генпашш Сергеетч

Моделироваиме координации движении при .íokomoj-;:-» на основе снихроинзации оецнллчторо»

0J.00.U2 - биофизика

АВТОРЕФЕРАТ

диссертации на соискание yieiioti степени кандидата фшико-матсматичсска;. маук

! МОСКВА-1996

Работа выполнена и Лаборатории нейронных сетей Института математических проблем биологии Российской академии наук.

Научный руководитель: кандидат физико-математических наук

P.M. Борисюк

Ui;;::;itia;iLi.>.c ощонентм: доктор физико-математических наук

В.Л. Дунин-Барковский

доктор биологических наук Л. Л. Фролов

?1':аушал гоганлзацня: Институт з теоретической 1и

экспериментальной! биофизики Российской академ|.ь h.v "

огиц;:та ^сссртацчи состоится Г7ту 1996 года н часов ira засол:;::"!« с^енпалнзнропанного совета №3 ОФТТ (К.053.05.77) в МГУ им. M.Ï5. Ломоносова по адресу: 119899, ГСП, г. Москва, Воробьевы горы. МГУ, физический факультет, ауд. УОФ,Я

С диссертацией можно ознакомиться в. библиотеке физическогл факультета МГУ и«'.. М.В. Ломоносова

Aim ргф| рат разослан)7996 года

Ученый секретарь диссертационного совета

ОФТТ (К.053 (15.77) кандидат физико-математических наук

О. А. Котельником

I. ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность проблемы. Проблема координации движений конечностей является одной из центральных при изучении локомоции. Под локомоцией понимается совокупность согласованных движений, с помощью которых животное или аппарат активно перемещаются в пространстве. Эта проблема рассматривается как при изучении физиологических механизмов управления движениями у животных, так и при конструировании шагающих роботов.

К настоящему времени на основе теоретических и экспериментальных исследований сформирована базовая концепция устройства и функционирования системы управления локомоцией животных. Управление локомоцией осуществляется многоуровневой иерархической системой (Баев, 1991; Бернштей'н, 1947, 1966; Гельфанд, Цетлин, 1966; Сеченов, 1890; Sherrington, 1910). Много исследований посвящено "нижнему" иерархическому уровню. Он представляет собой сеть из локально связанных осцилляторных подсистем, причем каждой конечности ставится в соответствие одна осцилляторная подсистема (Shik, Orlovsky, 1976; Grillner, 1981; Cohen, Harris-Warrick, 1984). Каждый такой осциллятор состоит из нейронного контроллера, включающего сенсорные органы, и механической части, включающей мышцы (Фельдман, 1979; Cruse, 1990). Координация движений конечностей возникает на основе динамики системы взаимодействующих осцилляторов. Различные периодические поХодки представляют собой различные режимы синхронизации осцилляторных подсистем (Collins, Stewart, 1993; Kopell, 1988; Schoener et al, 1990). Помехи и внешние возмущения походки преодолеваются автономно (Mueller-Wilm et'al, 1992; Taga et al, 1991).

Животные демонстрируют поразительную способность успешно решать локомоторные задачи несмотря на сложность ландшафта, внешние нагрузки, возмущения движений тела и конечностей, повреждения и так далее. Высокая устойчивость живых систем объясняется, в частности, распределенностью или параллельностью системы управления, а также высокой устойчивостью подсистем к внешним возмущениям.

Описанная выше концепция в настоящее время является объектом детального изучения. Применение методов математического моделирования представляется перспективным для такого исследования. Эти методы позволяют рассматривать как задачу управления локомоцией в целом, так и. отдельные подзадачи. Актуальным является изучение

динамики отдельных осцилляторов, участвующих в управлении движением, а так же системы взаимодействующих осцилляторов. При этом основной интерес представляет проблема организации "целесообразного" взаимодействия осцилляторных систем, обеспечивающая эффективное управление локомоцией.

Цель работы. Разработка модели управления локомоцией на основе системы взаимодействующих осцилляторов. Исследование динамических режимов, выбор оптимальных значений параметров системы, обеспечивающих "правильную" координацию конечностей при движении с различными скоростями.

Основные задачи работы. Для достижения сформулированной цели решались следующие задачи.

1. Изучение динамических режимов в случае простейшей модели двух взаимодействующих пейсмекерных нейронов.

2. Разработка модели нейронной сети из малого количества элементов, способной генерировать ритмическую активность, устойчивую по отношению к шумам. Исследование динамических режимов, а также устойчивости ритма генераторов для различных архитектур связей между элементами.

3. Разработка модели управления ходьбой шестиногого шагающего устройства на основе системы из шести локально связанных осцилляторов.

4. Настройка параметров модели, обеспечивающая устойчивую координацию движений конечностей при ходьбе с различными скоростями. Выбор целевой функции и определение оптимальных параметров модели.

5. Исследование динамики настроенной модели, изучение и сравнение модельных "походок" с походками, наблюдаемыми в экспериментах на насекомых.

Научная новизна работы.

1. Для модели двух электрически связанных пейсмекерных нейронов впервые показано, что режим противофазных колебаний может быть единственным устойчивым режимом как при слабых, так и при промежуточных величинах связи между нейронами. Этот режим является интересным предсказанием для экспериментальной проверки.

2. В результате исследования нейронных сетей из интегративно-пороговых элементов с шумами показано, что определенные нейросетевые архитектуры демонстрируют устойчивую ритмическую активность в условиях сильных шумов (порядка веса синаптической связи). Наибольшей устойчивостью обладает сеть из модулей с возбувдающими связями, в

которой взаимодействия между модулями организованы по типу тормозно-возбуждающего кольца.

3. Для задачи управления шагающей системой предложена целевая функция, учитывающая частоту падений при стартах из различных начальных положений конечностей при ходьбе с различными скоростями.

4. Показано, что оптимальные параметры, полученные' в результате минимизации целевой функции обеспечивают эффективное управление движением системы при стартах из произвольных начальных положений.

Практическое значение работы. Результаты диссертационной работы могут использоваться при разработке математических моделей и теоретическом изучении механизмов управления генераторами паттернов.

Результаты проведенных исследований могут быть полезными при разработке систем управления шагающими роботами. В частности, результаты исследований разработанной модели локомоции используются в системе управления шестлногого шагающего робота в Мюнхенском Техническом университете (Германия).

Апробация работы. Основные результаты работы докладывались и обсуждались на научных семинарах кафедры биофизики физического факультета МГУ, Московского семинара по нейронным сетям под руководством д.ф.-м.н. В.Л. Дунина-Барковского, кафедры биологической кибернетики биологического факультета университета г. Билефельд (Германия) под руководством проф. X. Крузе, лаборатории Системной организации нейронов ИТЭБ РАН под руководством проф. О.С. Виноградовой, на съезде Всероссийского общества по нейронным сетям (Москва, январь 1995), на симпозиуме по нейронным сетям и нейронным вычислениям (Прага, Чехословакия, 1990), на международной конференции "Искусственная жизнь - 93", (Брюссель, Бельгия, 1993), на международной конференции "От восприятия к действию", (Лос Аламитос, США, 1994), на международном совещании "Нейронное кодирование" (Прага, Чехия, 1995).

Публикации. По результатам диссертационной работы опубликовано 9 печатных работ.

Структура и объем диссертации. Диссертация состоит из введения, 5 глав, выводов и списка литературы. Диссертация изложена на страницах, содержит 22 рисунка, и 2 таблицы, список литературы содержит 121 библиографическую ссылку.

II. СОДЕРЖАНИЕ РАБОТЫ Во введении обоснована актуальность темы, сформулированы цель и основные задачи работы, охарактеризована научная новизна полученных результатов.

Первая ' глава представляет собой обзор литературы по теме диссертации. В главе рассматриваются известны? экспериментальные и теоретические данные о координации движений при локомоции животных. Многие виды движений животных содержат в своей основе циклические процессы. Так, при локомоции можно наблюдать повторяющуюся смену положений конечностей (ходьба, плавание, полет) или ритмические изгибания тела (плавание у рыб). Экспериментальные исследования пространственной и временной организации локомоторного паттерна служат основой осцилляторных моделей нейронных сетей. Эти модели объясняют ряд особенностей координации движений и переходов от одного типа движенйя к другому. При этом основное внимание уделяется моделированию центрального генератора паттернов. Центральным генератором паттернов (ЦГП) называют нейронную сеть, которая способна демонстрировать различные наборы динамических паттернов активности, соответствующих тем или иным типам движений. В главе рассматриваются модели осцилляторных нейронных сетей, относящиеся к ходьбе животных и шагающих роботов, а также плаванию некоторых видов рыб.

Вторая глава. Режимы синхронизации в системе двух электрически связанных осцилляторов.

Модель состоит из двух идентичных осцилляторов Хиндмарша- Роуза [Hindmarsh, Rose, 1984], соединенных слабой электрической связью. Динамика активности этих осцилляторов задается уравнениями: CdEi/cit = (I, - Р(Е,)) + а(Е2 -Е,)

dl,/dt = Q(E,)-1¡ (1)

CdE2/dt = (I2 - P(E2)) + a(Ej - E2) dh/dt = Q(E2)-[2

Здесь С- емкость мембраны (С=2); E¡ (t), /, (t) - мембранный потенциал и восстанавливающий ток на внутренней части мембраны /-го осциллятора (i = 1,2), Р(х) = х' - Зх2 - /¿i Q(x)= -5Х2 + J ; ¡o - параметр, задающий величину поляризующего тока; а - параметр, характеризующий величину электрической связи между осцилляторами (0 < а < 1).

Основные результаты получены методами теории бифуркаций. Для построения бифуркационных диаграмм периодических решений

используются как. асимптотический метод при а —> 0, так и численные методы при а = 0.05.

-•'-ti

I I

-.-'_. V71

Рис. 1. Бифуркационные диаграммы предельных циклов (наверху) и стационарных состояний (внизу) при фиксированной силе связи (а=0.05) и различных значениях /g. Непрерывная линия соответствует устойчивому режиму, штрих-пунктирная линия соответствует неустойчивому режиму; а (¡о = -0.57) - рождение синфазного предельного цикла /РС{бифуркация Андронова-Хопфа); b (10 = -0.42) -рождение противофазного предельного цикла АРС (бифуркация Андронова-Хопфа); с (/<? = -0.37) - рождение пары несимметричных предельных циклов NSCj и NSC2 (бифуркация ветвления); d {J0 = -0.36) - рождение пары торов Т/ и (бифуркация тора); е {/t, = -0.20) -исчезновение тора Та (бифуркация тора); /(Л? = 0.42) - рождение пары предельных циклов с разностью фаз SPCi и SPC2 (бифуркация ветвления); g {1д = 1.66) - исчезновение пары предельных циклов с разностью фаз SPC/ и SPC2 (бифуркация ветвления); h ( Jo = 4.39) -рождение пары предельных циклов с разностью фаз SPC/ и SPC4 (бифуркация ветвления); к (/'о - 6.37) - рождение тора Та (бифуркация тора); /(Ip ~ 7.01) - слияние и исчезновение пары предельных циклов с разностью фаз SPCj и SPC4 и пары несимметричных предельных циклов NSCi и NSCj (бифуркация слияния); m (/'о = 7.09) -исчезновение противофазного предельного цикла АРС (бифуркация Андронова-Хопфа); п (¡о ~ 7.90) - исчезновение синфазного предельного цикла /PC(бифуркация Андронова-Хопфа).

Для рассматриваемого нами случая фиксированной слабой электрической связи между осцилляторами перечислим динамические

режимы: 1) синфазные колебания (с нулевой разностью фаз); 2) противофазные колебания (разность фаз равна половине периода); 3) колебания с разностью фаз (р, где ц> непрерывно зависит от поляризующего тока; 4) в зависимости от начальных условий либо синхронные, либо противофазные колебания; 5) в зависимости от начальных условий либо синфазные, либо квазипериодические колебания. Обнаруженные режимы являются грубыми и сохраняются при небольших возмущениях системы.

Бифуркационная диаграмма при а = 0.05 позволяет проследить эволюцию динамических режимов при изменении параметра /о в диапазоне (-1, 8). Бифуркации ветвления циклов JPC и АРС при а О подобны бифуркациям, представленным на Рис. 1. Различия состоят только в бифуркационных-значениях параметра Iо.

Результаты исследования модели двух электрически связанных пейсмекеров позволяют сформулировать ряд гипотез о возможном устройстве и функционировании простейшего ЦГП.

1. Изменение паттерна активности на выходе ЦГП может происходить при неизменной архитектуре и величине связей;

2. Изменение паттерна активности может осуществляться изменением величины одного управляющего параметра.

В заключение выдвинуто несколько гипотез, интерпретирующих результаты эксперимента по исследованию паттерна активности сегментного ЦГП миноги при аппликации стрихнина. (Cohen, HarrisWarrick, 1984). В эксперименте наблюдается эффект перехода от противофазных колебаний (левого и правого корешков спинного мозга) к синфазным колебаниям при увеличении концентрации стрихнина, блокирующего действие тормозных глицинэргических связей. На основе результатов исследования описанной выше модели выдвинуты следующие предположения :

1) при достаточно высокой концентрации стрихнина электрические связи определяют синфазный режим активности ЦГП;

2) при промежуточной концентрации стрихнина," когда тормозные связи уже заблокированы, электрические связи определяют противофазный режим активности ЦГП.

На основе результатов исследования можно предположить, что электрические связи могут играть существенную роль при генерации нервной системой сложных пространственно-временных паттернов активности. Таким образом, при изучении работы нервной системы, по-видимому, следует принимать во внимание возможное участие

электрических связей в процессах как синхронизации, так и десинхронизации активности осцилляторных нейронов.

Третья глава. Моделирование ритмической активности в малых нейронных сетях с шумами.

В главе исследуются модели генераторов ритмики, в которых генерация ритма происходит на основе взаимодействия между нейронными модулями. Нейронный модуль представляет собой группу нейронов, расположенных в узлах прямоугольной решетки так, что каждый нейрон связан возбуждающими связями с 4 соседями. Нейрон представляет собой интегративно-пороговый элемент с шумами. Отметим, что модуль из интегратнвно-пороговых элементов с локальными связями не может генерировать ритмическую активность. Соединяя такие модули в нейронные сети (НС) с различной архитектурой, можно строить разнообразные генераторы периодических колебаний. Наличие в сети шумов приводит к нестабильности периода колебаний.

Задача состоит в том, чтобы исследовать динамические режимы отдельного модуля при варьировании двух параметров (амплитуда шума и вес синаптической связи). Исследование проводится для двух случаев: без электрических связей между элементами модуля и при их наличии. Для трех различных архитектур связи между модулями выбираются параметры моделей так, чтобы период колебании был максимально стабилен при сильных шумах.

Остановимся подробнее на описании модели. Время дискретно, шаг дискретности принимается равным сумме длительности спайка и времени абсолютной рефрактерностп (Д/ = 2 мс). Время срабатывания синапса принимается равным шагу по времени.

Уровнем активности группы нейронов будем называть величину: = 2Х,(/)/уУ, (2)

'./-I

где И/.х N2 - число нейронов в модуле, Х,у (/)- состояние нейрона с координатами О,]) на решетке (принимает значение / в момент спайка, О - в других случаях). Динамика мембранного потенциала нейрона с координатами (¡ц) в сети без электрических связей задается уравнениями: ¡С/0 + (I/,.,(/) - ¿У") * д\ У,.,(/) * Н,

£,.,(/ + д') = ^ ¿у = н

[/¡¡0+А0= +А*(Х1.и(1) Щ+иО) +хи.,(г> +Хы+,0))

ч + л.

где q - константа (О < q < 1), характеризующая скорость релаксации потенциала, R - пороговый потенциал, Н - амплитуда спайка (H>R), w -параметр (w < LP), который определяет относительную рефрактернооть; Е, -шумовая компонента, равномерно распределенная на интервале f-S,SJ; А -вес синаптической связи (А > 0).

При наличии электрических связей мембранный потенциал нейрона зависит от потенциалов ближайших соседей. Взаимное влияние потенциалов соседних нейронов моделируется с меньшим шагом (Л/ /б). При этом к потенциалу данного нейрона Ujj добавляется отклонение этого потенциала от среднего потенциала ближайших соседей на решетке <U> с весом равным величине электрической связи (Ujj + a(Ujj -<U>)),

В результате параметрического анализа динамических режимов нейронного модуля было обнаружено 6 различных динамических режимов активности, которым соответствуют б областей на плоскости параметров (А, S) (в начальный момент времени один нейрон находится в состоянии 1, остальные в состоянии 0). Перечислим эти режимы: 1) уровень активности равен 0; 2) уровень активности достигает 0.5, и затем падает до О (нулевое значение является устойчивым состоянием); 3) уровень активности нерегулярно изменяется от 0 п.о 0.6 ; 4) уровень активности равен 0.5 ; 5) уровень активности, нерегулярно изменяется в окрестности 0.4 ; 6) уровень активности выше 0.5. Границы указанных режимов представлены на Рис. 2 а).

Рис. 2. Границы динамических режимов модуля: а) без электрических связей; б) при электрических связях. Данные приведены для N=25, \v~20, а=0.09.

Введение электрических связей изменяет границы динамических режимов активности модуля. Рассмотрим случай слабых электрических связей (а=0.09). На Рис. 2 б) видно, что после их введения в модель происходит смещение границ областей в сторону меньших синаптических весов и больших амплитуд шума. При этом область 2 исчезает, а области 1 и 4 существенно расширяются. По-видимому, такое изменение границ имеет две причины: 1) к моменту передачи импульса происходит повышение потенциала нейрона, что облегчает егб возбуждение; 2) происходит усреднение шумов и, соответственно, уменьшается эффективная амплитуда шума. Исследование показывает, что модуль не имеет динамического режима с регулярными колебаниями активности. Такие режимы возникают только при соответствующей организации связей между несколькими модулями.

Параметрический анализ показывает, что области параметров, соответствующие динамическим режимам 4, 6 и до некоторой степени 5 пригодны для стабильной генерации ритма. Введение электрических связей расширяет эти области (Рис. 2).

Рассматриваются три типа нейронных сетей (НС).

1. НС с возбуждающе-тормозными связями. Сеть состоит из описанного модуля и одного тормозного нейрона. Тормозный нейрон получает возбуждающее воздействие от нейронов модуля и в свою очередь их тормозит.

2. НС типа тормозное кольцо. Рассматривается НС из трех модулей, расположенных на кольце. Элементы каждого модуля получают тормозное воздействие от элементов предыдущего модуля и тормозят элементы последующего.

3. НС типа тормозио-возбуждающее кольцо. НС состоит из трех модулей, расположенных на кольце. Элементы каждого модуля получают тормозное воздействие от элементов предыдущего модуля и возбуждающее воздействие-от элементов последующего модуля и в свою очередь тормозят элементы последующего модуля и возбуждают элементы предыдущего модуля.

В результате исследования было показано, что нейронная сеть типа тормозно-возбуждающее кольцо демонстрирует стабильную генерацию колебаний при сильных шумах (порядка веса синаптической связи) и наиболее устойчива в отношении шумов по сравнению с двумя другими сетями. Кроме того, для всех типов НС показано, что электрические связи допускают увеличение (в несколько раз) амплитуды шума, при которой сохраняется регулярность колебаний. При этом НС типа тормозно-возбуждающего кольца с электрическими связями сохраняет стабильную

генерацию, даже когда амплитуда шума »У превышает в два. раза вес синаптической связи А. Таким образом показано, что электрические связи могут выполнять стабилизирующую роль при наличии сильных шумов. В завершение интересно отметить, что структура связей между модулями НС типа тормозно-возбуждающего кольца обладает сходством со структурой связей между элементами генератора локомоторного ритма моллюска Clione limacina.

Четвертая глава. Обучаемая модель управления движением конечности.

Глава посвящена разработке кинематической модели управления движением отдельной конечности шестиногого устройства. Движение конечности состоит из двух фаз: фазы опоры и фазы возврата. Находясь в фазе возврата, дистальная точка ноги не касается поверхности опоры и двигается вперед по ходу движения. Когда нога находится в фазе опоры, она располагается на поверхности опоры, поддерживает тело, и, при движении животного вперед, ее дистальная точка движется назад по отношению к телу. Система управления конечностью состоит из трех нейронных сетей. Первая сеть - ЦГП - задает ритмическую работу двух других нейронных сетей так, что они работают по очереди. Одна из них -модуль фазы возврата (МФВ) - управляет движением конечности, когда та находится в фазе возврата. Другая сеть - модуль фазы опоры (МФО) -осуществляет управление конечностью, когда та находится в фазе опоры.

Задача состоит в разработке и настройке параметров МФВ (МФО был разработан другими исследователями (Cruse et al., 1995)). Настроенный МФВ должен производить траекторию движения конечности в фазе возврата "близкую" к траектории, наблюдаемой в биологическом эксперименте (Cruse, Bartling). МФВ перемещает конечность из текущей точки в целевую точку с известными координатами.

Предполагается, что конечность состоит из трех звеньев (Рис. За). Углы <р и у/ считаются фиксированными. МФВ состоит из 11 нейронов. На вход МФВ, состоящий из 8 элементов подается следующая информация: ос, ¡1, у - угловые координаты текущей точки; а ¡3 ', у' - угловые координаты целевой точки, S/ - сигнал сенсора о контакте с препятствием; S2 - сигнал сенсора о контакте с опорной поверхностью.. Выход МФВ состоит из трех элементов, значения которых а, [} , у определяют текущие значения угловых скоростей движения.

Веса связей МФВ выбираются в результате обучения на примерах. В качестве примеров используются экспериментально полученные

траектории движения конечности насекомого (для передних, средних и задних конечностей траектории различаются).

-10 о

х{тт)

Рис '3 а) Схематическое изображение конечности: организация сочленений и их осей вращения; б) траектория дистальной точки в фазе возврата (светлые ромбики) и точки обучающей траектории (черные кружки); в) траектория, полученная при начальном положении сдвинутом на 5 мм относительно обучающего положения; г) траектория, полученная в случае, когда угол а был моментально изменен на -30 градусов, ¡5 на 30 градусов и у на 10 градусов; д) траектория демонстрирует "избегание препятствия".

По начальному положению и целевой точке сеть строит траекторию движейия. Каждой из предъявляемых пар точек ставится в соответствие п (п=5) точек, выбранных на обучающей траектории. Эти точки представлены на рис. 3 б в виде'черных кружков. Первые четыре точки (на рис. 3 б отсчет слева) были взяты из экспериментов, которые определяли траектории движений конечностей при ходьбе насекомых по плоской поверхности. Пятая точка, которая расположена ниже опорной поверхности, была получена из измерений, проведенных на насекомых, движущихся по плоской поверхности, которые затем' попадают передней конечностью в отверстие. Целевая функция, используемая для обучения,

представляет собой сумму квадратов расстояний от траекторий до точек на обучающей траектории. Для каждого МФВ, управляющего передней, средней или 'задней конечностью, веса связей подбирались независимо.

На рис. 3 6 видно, что, поскольку поверхность не была достигнута, конечность продолжает движение после достижения целевого положения. Момент завершения фазы возврата определяет сигнал от сенсора контакта с опорной поверхностью.. Интересно отметить, что, будучи обученной на нескольких траекториях, эта простая система способна к "обобщению". Адекватные движения в фазе возврата могут быть достигнуты, когда начальные или конечные положения варьируют в диапазоне (±5 мм) относительно начальных и конечных положений, использованных при обучении (например, см. рис. 3 в). Более того, МФВ толерантна в отношении внешних возмущений, приложенных в ходе фазы возврата (например, Рис. 3 г) Тем не менее, конечнрсть выполняет фазу возврата с небольшой ошибкой по сравнению с невозмущенным движением. По-видимому, такие ошибки тем больше, чем больше возмущение траектории и чем позднее оно возникает в фазе возврата.

Столкновение с препятствием в ходе фазы возврата вызывает сигнал нагрузки, что вызывает "рефлекс", при .котором конечность быстро сокращается и двигается некоторое время вверх. Затем движение продолжается как обычно (например, рис. 3 д). Этот "рефлекс" был ранее в действительности обнаружен у палочника.

Использование описанной сети позволяет осуществлять управление ходьбой в сложных условиях "пересеченной" местности, когда только ограниченные области поверхности пригодны в качестве опоры. При этом внешняя система (например "визуальная") обеспечивает контроллеры передних конечностей информацией о пригодных областях поверхности. Затем эта информация может передаваться от контроллеров передних конечностей к контроллерам задних конечностей. Так, в частности, может реализовываться ходьба "след-в-след", описанная для палочника. Другими исследователями было показано, что полная модель, использующая рассмотренную сеть, способна ходить с разными скоростями по нерегулярной поверхности (Cruse et al., 1995).

Пятая глава. Моделирование координации движений на основе синхронизации системы локально взаимодействующих осцилляторов.

В главе изучается модель управления шагающей системой с шестью конечностями. Движением каждой конечности управляет отдельный осциллятор. Взаимодействия между осцилляторами локальные, правила взаимодействия выбраны на основе экспериментальных данных о ходьбе

насекомых (палочников). Задача состоит в том, чтобы выбрать количественные значения параметров системы, которые обеспечивают устойчивое движение.

Для решения этой задачи предложена целевая функция, представляющая собой частоту падений при движениях с разными скоростями из случайно выбираемых начальных положений конечностей. Искомые значения параметров модели находятся в результате минимизации целевой функции.

Коротко опишем модель управления движением. Рассматривается прямолинейное движение животного по плоскости, причем учитывается только кинематика движения. Дистальная точка (ДТ) каждой конечности движется на заданном для нее отрезке [PEPmi„, АЕРо], параллельном оси симметрии животного. Движение каждой конечности описывается парой переменных (х,(t), s(t)), где x(t) - координата ДГ конечности на отрезке, s(t) е {О, 1)- состояние конечности в момент (s (t) = Ощт состояния (фазы) возврата, и s (t) - /для состояния (фазы) опоры).

Согласованное движение конечностей достигается в результате их локальных "взаимодействий". Взаимодействие состоит в том, что экстремальные положения ДТ конечности PEP и АЕР зависят от положений ДТ и состояний ближайших "соседних" конечностей. Динамика взаимодействия описывается четырьмя правилами. Рассмотрим влияния на некоторую, выбранную конечность. Ниже индекс г обозначает положение конечности, от которой приходит влияние, относительно данной конечности (re {с, J h}, где с - контралатеральное положение; f -ипси латеральное переднее положение; h - ипсилатеральное заднее положение;)

Правило ]. На данную конечность воздействуют нпсилатеральная задняя и контралатеральная конечности (г = с, h).

Л1 г (Г+&Г) = (Sr (0-1) * Р'п (2)

где Р'г - параметр, определяющий величину воздействия.

Правило 2. На данную конечность воздействует нпсилатеральная задняя конечность (/•=//):

Al !t А Л 1{А£Р» - Р£Р{1)) ^ PU> еС J?"S> (/)= 1 " J'(/ ~ А/) = 0'

ДД/ + Д/)=И_ (3)

10, в про m te. с л,

Правило 3. На данную конечность воздействуют нпсилатеральная передняя и контралатеральная конечности (г = с, fi.

AW/ А А А _ \Р'Л * * -Х'{!))-Х'{1) * ^ '

ЛД/ + LM) - * j * {ри -xr{l))\Xr{l) > р;\ < J

где Р3'1^ /*•*, и Iх''3г - параметры взаимодействия. Кроме того, если A3r(t+At) > q, то AJr (t+At) = q, (q=4).

Правило 4 Если соседняя передняя нога выходит за порог своего "нормального" движения РЕРо настолько, что пересекается с данной, то следуя правилу (4) данная конечность заканчивает фазу возврата и начинает фазу опоры (A4f(t+At)=PEP„ul, - АЕРо).

С учетом всех четырех правил взаимодействия динамика каждой конечности задается системой разностных уравнений: x(t+At) =x(t) - yg*M*s(t) + Vp*M*(l - s(t) ),

1; ли x(t) > AEP(t) и s(t) = 0, s (/ + Д/) = 0; ec mi x{t) < PEP(t) и s (t) = 1, (5)

s (/); в ост с л AEP(t+At)~ ЛЕРд +а4/(0, PEP(t+At)= PEPg+Q(r), где Q(i)- сумма всех влияний, (описываемых величинами А'г , /=/,..,J), приходящих на данную конечность, ^ и Ур - скорости движения ДТ в фазе опоры и в фазе возврата, соответственно.

Параметры tg, Уг идентичны для всех конечностей. соответствует скорости движения "животного". В модели постулируется, что Ур, РЕРо, АЕРо не зависят от Vg. Примем Ур=1.

Для настройки параметров модели рассматривается целевая функция, которая представляет собой частоту падений при движении системы, стартующей из случайно выбранных начальных положений конечностей. Отметим, что допустимыми считаются старты, при которых все конечности начинают движение из некоторого положения на поверхности, выбираемого в определенном диапазоне значений. Рассматривается так же случай, когда целевая функция представляется в виде средней частоты падений при стартах из различных начальных положений и при различных скоростях движения.

Для случая движения с фиксированной скоростью определены оптимальные значения параметров взаимодействия, обеспечивающие минимальную для данной скорости частоту падений при различных стартах (минимальное значение целевой функции). Оказалось, что для "низких" скоростей оптимальные параметры обеспечивают частоту падений не превышающую 10% от общего числа стартов, а для высоких скоростей не удается сделать частоту падений меньше 70%. Зависимость частоты падений от скорости движения при оптимально выбранных для каждой скорости значениях параметров будем называть "идеальной зависимостью. На рис. 4 приведен график "идеальной" зависимости.

Рис. 4. Представлены зависимости частот падений от скорости движения Уц для различных моделей: 0 - при отсутствии взаимодействий между конечностями; О - настроенная модель (см. текст); X - "идеальная" зависимость; Г - настроенная модель с использованием процедуры ускорения.

Рассмотрим случай, когда целевая функция зависит от скорости. Для этого случая рассматривается модель, в которой один параметр (/*'■ ^ линейно зависит от скорости движении. Подбор оптимальных значений параметров (минимизация целевой функции) позволяет получить зависимость частоты падений от скорости близкую к "идеальной". На рис. 4 показан график зависимости частоты падении для этого случая. Для получения устойчивого движения при высокой скорости предлагается использовать процедуру "ускорения". Движение начинается на низкой скорости, когда система "легко находит" статически устойчивую походку, и затем скорость постепенно увеличивается до высоких значений. Такая процедура позволяет достичь высокой эффективности (частота падений меньше 10%) при движении с высокой скоростью при стартах из произвольного положения (Рис. 4).

Так как координационные правила были выбраны на основе экспериментальных данных, полученных на палочнике, то можно было бы ожидать, что результирующее локомоторное поведение будет подобным наблюдаемому в экспериментах. Исследование походок, которые демонстрирует настроенная модель, действительно показывает хорошее согласие с экспериментами на палочниках.

III. ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ

1. Проведено детальное исследование динамических режимов в математической модели двух электрически связанных нейсмекерных нейронов. Показано, что система может находиться в одном из режимов: синфазные колебания с нулевой разностью фаз; противофазные колебания с разностью фаз, равной половине периода; колебания с фиксированной разностью фаз, которая зависит от величины поляризующего тока; сосуществование синфазных и противофазных колебаний; сосуществование синфазных и квазипериодических колебаний. Обсуждается применение полученных результатов для построения модели центрального генератора паттернов.

2. Проведен параметрический анализ динамических режимов нейронного модуля из интегратнвно-пороговых элементов с локальными связями, который используется для построения генераторов регулярных колебаний. Введение электрических связей между нейронами модуля допускает увеличение (в несколько раз) амплитуды шума, при которой сохраняется регулярность колебаний. Показано, что нейронная сеть типа тормозно-возбуждающее кольцо демонстрирует стабильную генерацию колебаний при сильных шумах (порядка веса синаптической связи) и наиболее устойчива в отношении шумов по сравнению с другими рассматриваемыми сетями.

3. Разработана модель нейронной сети для управления движением отдельной конечности. Модель обучается на примерах двигаться по предписанной траектории и достигать целевую точку. Обученная модель способна к движению в условиях сложного рельефа, препятствий и помех.

4. Разработана модель управления шестиногой шагающей системой, состоящая из шести локально взаимодействующих осцилляторов. Правила взаимодействия выбираются на основе изучения экспериментальных данных по движению насекомых.

5. Для настройки параметров системы управления при движении с постоянной скоростью предлагается целевая функция: частота падений при стартах из произвольных начальных положений конечностей. При движении с произвольными скоростями целевая функция является средней частотой падений для различных скоростей.

6. Показано, что оптимальные параметры полученные в результате минимизации целевой функции обеспечивают хорошую статическую устойчивость системы (частота падений не превышает 10%) при "низких" скоростях движения. Для "высоких" скоростей оптимальные параметры не позволяют сделать частоту падений ниже чем 70%. Предложенная

процедуры "Ускорения позволяет сиаеме лшиап.си vcuinnwi как при Hi; !г:пх, п при высоких скоростях.

Список публикаций по теме диссертации:

1. Борисюк Г.Н., Порисюк P.M., Казапонич Я.П., Jlywiuma 'Г.П., Гурона Г.О., Цымболюк Г.С. Осшшшторпме нейронные сои. Мак магические результаты и приложения. Математическое моделирование т i, N 1, 1992, сгр. 3-43.

2. Цымбалюк Г.С. Моделирование ритмической акпг.тг.сш в малых leiipoinibix сетях с шумами. Препринт, Пуипшо, 1991.

3. Cruse Н., Cymbalyuk G., Dean J. Л walking machine using coordinating mechanisms of three different animals: stick insect, crayfish ai.J cat. Proceedings of European conference of Artificial Life, Brussels, Belgium, 1993, pp 246 - 258.

4. Cruse H., Battling C., Cymbalyuk G., Dean J., Drcifei M. л neural net jom roller f^r ¿iv- legged waiting system. !••.: Гчуп Per.eption to Action Confeiebcc 'id: Gaussier P., Nr.ob:' J.-П., IEEE Compete:- Society Press, Los AJamitos, Califoru.'a, 1994, pp. 55 - 65.

5. Cruse H-, BarJi.i?, C., Cymbalyuk G., Dean J., Dviieit M. A modular artificial neural nei ¡or controlling a six- legged walking- system. Biological Cybernetics v 72, H:?3, pp. 421 - 430.

6. Cyinbiiyuk G.S. Modelling of rhythmic activity in small neural nets with r.oise. Proceedings of International symposium un Neural Ne.woiks and Neural Computing, Prague, 1990, pp. 341 - 343. ■ ' '

7. Cymbalyuk G.S, Nikolaev E.V. and Borisyuk R.M In phase and anti-niiace Self- -oscillations in a model of two, electric,-.lly coupled pacemakers. T/io'.^gical Cybernetics v 71, 193', pp. 153 - !(>().

8. Cymbalyuk G. and Cnse H. The scif-orga( i.-ation■ the oscillatory r.etw;..k controlling six-lcigcf- locomotion by meair, of siim:<:ued annealing. Proceedings cf Internntiohr.l .workshop "Neuronal Codifg', :995. Prague, p. 15.

9. Dean J., Brunn D., Battling C., Cruse I t., Сущ'лчуи'; G D re ife it M. and Schmitz J. Control ofhexapod walking i.r.iug aitili'.ia' and tol neurons. BIONA-repoit 9, 1995 pp. 17 - 36.

Список utnr.piuai иой литературы:

1. Паев K.IJ. Нсйробиологня локомошш. M.: Наука, 1991.

2. IkpmuTciii; П.Л. Физиология движения и активность. М.: Наук: 1990.

3. Гсльфонд М.М., Цетлип М.Л. О математическом моделироьаип механизмов центральной нервной системы. - В кг.: Модели структурно функциональной организации некоторых б/юлгг:. :ескнх систем. М Наука, 1966, с. 9-.М

4. Сеченов l.'.M. Физиология играных цел-.ров. М.; Изд-во AMI СССР, 1952.

5. Sherrington C.S., .'. rtiysiol. 1910, v. 40, о;. 28 - 121.

6. O-ici.■£;!:> G.N., Shik M.L. Intern. Rev. Physiol., 1976, v. 10, pp. 281- Я7

7. Grillner, S (1981) Control of locomotion in bipedi, tetrapods an. fish. In: Handbook of Physiology, Sect. 1: The nervous system, moto control, ed. Hrooks, VB, 2: pp. 1179 - 1236, Bethesda, МЛ:.Ат. Pnys.ol Soc.

8. Cchoi A.H., Harris- Warrick R.M. Brain Research, 1984, v 293, pp H.4 167. ,

9. Фельдман А. Г. Центральные и рефлекторные механизмы ynpa.Meij,i! движениями. М.: Наука, 1979.

• 10. Cruse Н Trends Neurosci. 1990, v 13, pp. 129 - 154.

11. Cruse If.., Bartling H. J. insect physiol. (In press)

12. Coiiins, JJ, Stewart, I Biol. Cybern. 1993, v 68, pp. 287 - 298

13. Kopell N. Toward a theory of modeling central patten: ^neia-.-'rs ',; Neural Control of Rhythmic Movements in Vetfebrates (A.H.Corierj S.Poss> ,ic S.Grillncr, eds), 1988, pp.369-'' 13, Wiley., N.Y.

14. Schoner G., Jiang W.Y., Kcl:o J.A.S. J. Theor. Biol. 1990, v ¡42, N3, pp. 359-391.

15. Mueller-Wilm U., Dew.}., Си.« H., Weidemann H.J., fc'.tze J., PfeiiTc. F. Adapt. Behav., 1992, v ); :'p. 33 - 46

16.Taga G„ Yairagnclii Y., Shimizu H. Bioi. Cybern. 1991, v 65, pp. 147 ■

159.

5.09.96 r. 3ai:.7;.'07P. Тир.100 экз. Усл.печ.л. 1,5.. Отпечатано на ротапринте в 0НТИ ПНЦ РАН

Информация о работе

Цымбалюк, Геннадий Сергеевич
кандидата физико-математических наук
Москва, 1996
ВАК 03.00.02

Автореферат

Похожие работы