Бесплатный автореферат и диссертация по наукам о земле на тему
Дискретный математический анализ и нечеткая логика в геофизических приложениях
ВАК РФ 25.00.35, Геоинформатика

Автореферат диссертации по теме "Дискретный математический анализ и нечеткая логика в геофизических приложениях"

РОССИЙСКАЯ АКАДЕМИЯ НАУК

Международный институт теории прогноза землетрясений и математической геофизики

На правах рукописи

АГАЯН Сергей Мартикович

Дискретный математический анализ и нечеткая логика в геофизических приложениях

Специальность 25.00.35 - Геоинформатика

Автореферат диссертации на соискание ученой степени доктора физико-математических наук

Москва - 2005

Работа выполнена в Геофизическом центре Российской Академии наук (ГЦ РАН), г.Москва

Научный консультант:

доктор физико-математических наук профессор А.Д. Гвишиани (ГЦ РАН)

Официальные оппоненты:

доктор физико-математических наук C.B. Анисимов (ИФЗ РАН), доктор физико-математических наук В.Г. Кособоков (МНТП РАН), доктор физико-математических наук, Ю.А. Криксин (ИММ РАН)

Ведущая организация:

Институт динамики геосфер РАН

Защита состоится 17 ноября 2005г. в 11 часов на заседании диссертационного совета Д 002.118.01 в Международном институте теории прогноза землетрясений и математической геофизики РАН по адресу: 113556 Москва, Варшавское шоссе, д.79, корп. 2, конференц-зал.

С диссертацией можно ознакомиться в библиотеке МНТП РАН.

Автореферат разослан октября 2005 года.

Ученый секретарь диссертационного совета, доктор физико-математических наук

П.Н. Шебалин

Общая характеристика работы

Актуальность работы. "Дискретный анализ - область математики, занимающаяся изучением свойств структур конечного характера. Дискретный анализ представляет собой важное направление в математике, имеющее характерные для него предмет исследования, методы и задачи, специфика которых обусловлена, в первую очередь, необходимостью отказа в дискретном анализе от основополагающих понятий классической математики -предела и непрерывности - и (в связи с этим) тем, что для многих задач дискретного анализа сильные средства классической математики оказываются, как правило, мало приемлемыми" (Мат. энциклопедия, 1979).

Если принять во внимание, что любые данные имеют дискретный характер, то актуальность дальнейшего развития анализа дискретных структур сомнений не вызывает.

Цель работы. Создание нового подхода к изучению многомерных массивов и временных рядов, основанного на моделировании предела в конечной ситуации и реализованного в серии алгоритмов под общим названием "Дискретный математический анализ".

Постановка конкретных задач. Цель работы определила постановку следующих

• разработка алгоритмов поиска плотных областей в конечных метрических пространствах, в частности, кластеризации и трассирования в многомерных массивах;

• функциональный подход к временным рядам, включающий в себя:

" определение, построение и прогнозирование гладких временных рядов;

■ поиск аномальных участков на произвольных временных рядах;

■ определение понятий монотонности, экстремума, выпуклости и точки перегиба для временных рядов; разработка на их основе алгоритмов разбиения временного ряда на монотонные, выпуклые участки, а также поиска экстремумов и точек перегиба;

• морфологический анализ временных рядов на основе нечеткой логики;

• геофизическое приложение дискретного математического анализа (выделение плотных областей и кластеризация при поиске источников аномалий потенциальных полей, выделение аномалий на геоэлектрических и гравитационных временных рядах).

Методологические основы исследования. Сформулируем принятую в работе концепцию дискретного математического анализа: отсутствие предела и непрерывности в конечной ситуации и более устойчивый по сравнению с математическим характер восприятия человеком дискретности и стохастичности делают необходимым то, что В.И.Кейлис-Борок называл моделированием "на глаз" (Выч. сейсм., 1968): решает не математика, а человек, и его решение нужно формально выразить. Нечеткая математика и нечеткая логика обладают достаточно большими возможностями для моделирования человеческих представлений и рассуждений по сравнению с обычными множествами и булевой логикой, и потому именно они послужили технической основой дискретного математического анализа. Нечеткая математика и нечеткая логика позволяют дать строгое математическое описание в действительности расплывчатых экспертных утверждений и преодолеть лингвистический барьер между человеком, суждения и оценки которого являются приближенными, качественными и нечеткими, и компьютером, который может выполнять только четкие инструкции.

задач:

Основные результаты работы, выносимые на защиту:

• совокупность алгоритмов поиска плотных областей в многомерных массивах (включая кластеризацию и трассирование в них), основанных на формальном определении плотности;

• создан и апробирован подход к изучению конечных временных рядов на основе построения для них аналогов всех фундаментальных понятий математического анализа (непрерывности, гладкости, монотонности, экстремума, выпуклости, точки перегиба);

• алгоритмически реализованный морфологический анализ конечных временных рядов на основе применения нечеткой логики;

• геофизическое применение дискретного математического анализа (выделение плотных областей и кластеризация при поиске источников аномалий потенциальных полей, выделение аномалий на геоэлектрических и гравитационных временных рядах).

Научная новизна.

• В дискретном математическом анализе аналоги фундаментальных математических понятий: предела, непрерывности, связности, монотонности, выпуклости представляют собой моделирование при помощи нечеткой математики и нечеткой логики человеческих представлений об этих понятиях.

• Реализованные алгоритмы поиска плотных подмножеств в конечных метрических пространствах расширяют возможности классического кластерного анализа, поскольку не требует отделимости найденных подмножеств.

• Анализ временных рядов осуществлен в работе на основе новых для них понятий гладкости, монотонности, экстремума, выпуклости, геометрических мер.

Практическая значимость

• Все алгоритмы носят универсальный характер: они способны работать с данными существенно разной природы.

• Цели и задачи, на которые ориентированы алгоритмы, общеизвестны и фундаментальны.

• Алгоритмы "Роден" и "Кристалл" совместно с деконволюцией Эйлера послужили основой интерпретации магнитных аномалий в заливе Сан-Мало (Франция) и массиве Аххагар (Алжир).

• Алгоритм DRAS используется в мониторинге вулкана Ла Фурнез (Франция).

• Алгоритм FLARS используется при обработке данных мировой сети сверхпроводящих гравиметров (GGP Network).

• Построенная в работе геометрия временных рядов дает возможность по новому подойти к анализу рельефов, что имеет большое значение в геоморфологии, батиметрии и т.д.

Апробация работы. Результаты работы были представлены на международных и российских научных конференциях и совещаниях, в том числе на 28-ой, 30-ой и 32-ой сессиях Международного семинара им. Д.Г. Успенского «Вопросы теории и практики геологической интерпретации гравитационных, магнитных и электрических полей» (Киев -2001, Москва - 2003, Пермь - 2005), на 17-ой и 18-ой международных конференциях CODATA (Baveno, Italy - 2000, Montreal, Canada -2002), AROPA Workshop. "Institute d'Europe (Luxembourg - 2001), 1П International Workshop on Magnetic, Electric and Electromagnetic Methods in Seismology and Volcanology (Москва - 2002), на Втором Международном симпозиуме «Геодинамика и геоэкологические проблемы высокогорных регионов» (Бишкек - 2002), Sixth ISTC Scientific Advisory Committee Seminar "Science and Computing" (Москва - 2003), TELESOL (Киев - 2003), на международном семинаре "Распознавание образов и кластеризация в геофизических приложениях" (Париж - 2004).

Основные результаты исследований по теме диссертационной работе изложены в 24 публикациях, в том числе в 10 статьях в реферируемых международных и российских журналах (""Earth and Planetary Science Letters "Geophysics", "Физика Земли", "Кибернетика н системный анализ " и др.).

Структур* н объем работы. Диссертация состоит из введения, четырех глав, заключения и списка литературы (105 наименований), содержит 200 страниц машинописного текста.

Благодарности. Автор выражает искреннюю благодарность сотрудникам ИФЗ РАН и ГЦ РАН, которые оказывали поддержку и помощь в проведении исследований, -В.СХМихайлову, С-А.Тихоцкому, А,А.Соловьеву (мл), МВ.Родкину, Д.Ю.Шур, ЕМГраевой, М.Д.Коваленко, Ю.С.Тюпкину, В.Н.Морозову, ВЛ.Татаринову, Э.О.Кедрову, а также АЛЗЛедепеву, СМЛебедеву и Ж.Злотники (Франция), Ж.Бошшу (Франция). Особая признательность автора своему учителю АД.Гвишиани и Ш.Р.Богоутдинову, вклад которых в создание дискретного математического анализа трудно переоценить.

Исследования по теме диссертации были поддержаны РФФИ (грант 04-05-65055-а).

Содержание работы.

Во введении показана актуальность исследуемого комплекса вопросов, сформулированы цепи и задачи работы, ее научная новизна и. практическая значимость.

Глава I. Дискретный математический анализ в конечных метрических

пространствах

Настоящая глава посвящена формальному изложению дискретного математического анализа (ДМА) в конечных метрических пространствах (КМП). Начинается она с нечетких сравнений чисел и числовых подмножеств, продолжается мерами близости и стационарным пределом, а завершается определением плотности в КМП, как меры стационарной предельности, и общей непрерывностью отображений КМП.

Нечеткие сравнения

Во многих случаях обычная линейная мера превосходства одного числа над другим в виде их разности оказывается слишком грубой и целесообразно использование ее нормировки. Кроме того, нормированное представление сравнения двух чисел дает возможность сопрягать его при помощи операций нечеткой логики с другими такими сравнениями. Определение 1.1. Нечеткое сравнение /(а,Ъ) на действительных числах а и Ь измеряет в знакопеременной шкапе отрезка [-1,1] степень превосходства "Ь " над "а":

/(р,Ь)=цея{р < Ь) б [-1,1]. С формальной точки зрения роль нечеткого сравнения может играть любая функция /(о, Ь),/: К2 ->[-1,1], возрастающая по Ь и убывающая по а с дополнительными граничными условиями

1ш/(а,г>)=±1 Уа 1ш/(в,г>)=т1 /(в,в)=0 Уа. (1.1)

Если /(а,Ь) - нечеткое сравнение, у/ - возрастающее преобразование отрезка [-1,1] в себя, то суперпозиция /){а,Ь) также будет нечетким сравнением, которое естественно назвать вариацией / при помощи у/. Выбор у дает возможность усиливать или ослаблять базовое сравнение /.

Широкое применение в работе нашел вариант базового сравнения п0(а,Ь), определенный только на неотрицательных числах, а также его вариации специального вида Ра-

Определение 1.2.1.Если а,ЬеЕ*,то

2. Для «е(-1,1) положим

l~a (1.3)

f^M,«] 1+а

naia,b) = Va{n0(а,й)). (1.4)

Такая вариация корректна: п0(a,b) = i//0(/i0(a,b)). При а>0 получается усиление п0, при а< 0 - наоборот, его ослабление. В дальнейшем под сравнением п(а,Ь) понимается какое-либо tia(a,b).

Сравнение tt(a,b) допускает обобщение на произвольные неотрицательные конечные совокупности А и В : если Л = йаг ¿...¿aN}, В = {0йЬ, йЬг ¿...¿¿>м},то

= = U] (1.5)

NM

есть мера того, что А лежит левее В (В лежит правее А). В случае а, V/, j всегда п(А,В)S0, так что определенная мера ftes{A<B) (1.5) корректна по отношению к исходному порядку на К+.

Меры близости в конечном метрическом пространстве. Близость точек. Зная расстояние d(x,у) между точками в КМП (X,d), за исключением тривиального случая d(x, у) = 0, мы не можем ответить на вопрос: "В какой степени точка у близка или далека от точки х в XT'. Для этого нужен глобальный взгляд на -У, а именно сравнение d(x,y) с остальными расстояниями d(x,y), х,уе X.

Пример. Xj ={(-1,0,1,2),11}, Хг = {(°.//4.^4>l),l l}> Il - обычный модуль. В обоих случаях

¿/(0,1) = 1, но в X, эти точки близки, а в Х2 - далеки.

В работе предложено несколько вариантов ответа на этот вопрос, но везде "близость" у к х реализована как нечеткая мера <5,0')SPU] (или [-1,1]) с нормировкой SJx) = 1. В общем случае Sx(y) не только убывает с ростом d(x,y), но и зависит от топологического распределения X вокруг х.

Примеры. 1. Обозначим через dX = {d(x,y):xïyeX} совокупность всех нетривиальных расстояний в (X,d), тогда бх(у) есть мера малости d(x,y) по сравнению с (IX

I л I (j л I 1)

2. Следующая конструкция получается из предыдущей заменой dX на dX{x)=[d(x,y)\yeX-x} - совокупность расстояний от х до любых точек из X

5х(у) = Mcs(d(.x,y) <dX(,x)) = n(d(x,y),dX(x)) = (1.7)

| Л |-1

Заметим, что вторая конструкция в отличие от первой, вообще говоря, несимметрична -

3. Симметричная конструкция, наиболее связанная с исходным расстоянием d(x,y). Пусть <р - убывающая на полуоси [0,оо) неотрицательная функция "потенциального типа":

0) = 1, $>(/,)> *р(/2) при /, </2. С ней связана мера близости 8% (у) = 8х(у)

5x(x)=<p(d(.x,y))VyeX. (8)

Близость точки к подмножеству в конечном метрическом пространстве

Пусть х е X и А - подмножество в X .В работе использовались две конструкции близости

х к А: нечеткая принадлежность и монолитность.

1. Нечеткая принадлежность (ж): пусть S - мера близости на X. Значение Sy(x) можно трактовать, как согласованную с метрикой d нечеткую меру принадлежности х к у в X. На основании набора {¿^(х) е X} мера е.л (х) нечеткой принадлежности х к А определялась следующим образом

2. Монолитность топл(х): пусть 0</| <г2 <... <г„м - упорядоченная совокупность нетривиальных расстояний отточки х до остальных элементов в X.

Определение 1.3. 1. Пусть Л-квант и KJ = [kh,k = 0,1,...}. Назовем квантованием соответствие t -> h(t) : R4 -» R^

f /, если t = nh

{(и+1)й, если / е («Л, (и+1)Л)' 2. Если Вх(г,) = {уеХЛ(х,у)£г,} - шар с центром в х радиуса г„ ¡¿¡¿п(х) и

у/,{пЬ)=\- ,то

Л(г,)+й

Монолитность можно считать одним из способов дискретного выражения непрерывности шара Д.(г,) в своем центре х: фиксируется элементарный числовой квант Л, и шар Д. (г,) разбивается на концентрические Л-кольца йх (г, )[«/;, (//+1) А] = {у б Ох(/\)-Л(х,у) б[й/),(л+1)Л]л (л+1)/г2/;(/;)}. Если в £>,(/;) имеются пустые Л-кольца, то этот дефект в Д/г() оценивается тем строже, чем формально ближе такие кольца к центру

л. Таким образом, чем формально дальше от х в Ох(г,) расположены пустые Л-кольца, тем монолитность топр (г)(л:) выше, в частности, если их нет совсем, то шопе (г,)(х) =' (Рис- 1).

Х\ Х2 Х3

топХ[(х)=1 > топ^х) > топХз(х)

Рис. 1. Влияние пропусков на монолитность

Определение 1.4. 1. Положим

топ д. (ж) = шоп0 ( (1.и)

2. Будем понимать под монолитностью топ^ (х) для прошвольного АсХ монолитность х в пространстве А +х.

Обозначим через Р(х \ А) любую конструкцию близости х к А, построенную выше.

Стационарный предел в конечном метрическом пространстве.

Пусть А = {(А,,а1)- взвешенная система подмножеств в КМП (Х,с1): А, а.X, а, е(0,1]. Предположим также заданным на X тот или иной формальный вариант примыкания 1Д) его точек к каждому Д. В качестве |А.) выбирался один из описанных выше видов близости /'(-14) к А (0-9), (1.11)), а также какое-либо метрическое отклонение Д(-1 А/) в X от Д.

Соединение А и 1Д.) в любой точке хеХ приводит к взвешенному числовому примыканию £(:с| Д) = {(.У (х|Д ),<*,) В нем содержится вся информация о стремлении А к х:

>У(х| Д) - результат сравнения А с х на стадии Д (аналог количественной с -составляющей классического предела);

а.I - вес, который имеет такое сравнение (аналог динамической -составляющей классического предела).

Для того, чтобы воспользоваться этой информацией, необходимо от примыкания £(л:| А) перейти к какой-либо его интегральной характеристике Е, что позволит численно выразить меру —> *) стремления А к х, которая, в свою очередь, формализует

понятие стационарного предела в КМП.

Определение 1.5. В введенных выше обозначениях мы можем говорить о стремлении А к любому х е X и потому

1. Стационарный предел А в X - нечеткая структура на X

рех(А ->*) = (1.12)

мера стремления А к х на основе примыкания 5 и интегральной характеристики £.

2. Чем <«е.$(Д -> х) больше (меньше) для плотности 8 = 1' (отклонения «У = А), тем х ближе к А. Элементы из X, особенно близкие в этом смысле к А, также будем считать стационарными пределами для А в X:

х* = aig max ftes(A -» x | P, S) x =slimi4=sIimSJ- A, если . x (1.13)

x = arg mi n /jes(A -> x | Д, £)

Пример: £ = £rr>0 - среднее по Колмогорову

Если {(л;)|"} - последовательность в X, то для определения ее стационарного предела при (—>/2+1 необходимо придать элементам х, неубывающие по i неотрицательные веса а, (например, а, = 1 или or, = Тогда Д = {(*„«,)|"} и наиболее естественная версия стационарного предела в этом случае ассоциирована с мерой £" dix х)а

ße.s(A —> х)=——— ', поэтому предел (1.13) для конечной последовательности

I"}. вообще говоря, зависит от весов {(or,) : х = д:*((л:,,аг,)|"). Заметим, что "бесконечное" расширение стационарного предела до классической ситуации бесконечной последовательности совпадет с обычным ее пределом и не будет зависеть от весов от,. Это -следствие теоремы Штольца о равенстве для любой сходящейся числовой последовательности ее предела с пределом ее средних (Фихтенгольц, 1969).

Утверждение 1.6. Если {.у(}1Г сходящая последовательность в метрическом пространстве (Г,р), limy, =йг, 0 <a,äa(rt и А = {(у„ог,) , то для любого уеУ

/jes(A ->у) = Ii mZbP(y,.J>to = p(fl>y) ;

V . rf

так что а = arg mjn /.ies(A -» y)

В работе также определен динамический предел в КМП. Он приведен ниже (3.18-20).

Плотность в конечном метрическом пространстве.

Пусть на (X,d) задана мера близости Sx(-) к точке х, 0 <r,<r2<...<rll(x) - упорядоченная совокупность нетривиальных расстояний от х до остальных элементов из X. Будем считать весом а,=0хфх(г,)) шара Dx(r,) любой интегральный числовой показатель совокупности

&(*):хе£),(>;)}, »=1....."(*)•

Пример. Обычное среднее

ZSx(x):xeDx(n)

IAWI '

Взвешенную систему А"-подмножеств Их = {(Dx(r,),a,) естественно считать

дискретным аналогом фильтрации в X вокруг x, а определенную выше меру fies(2)x ->• (1.12) нужно понимать, как меру предельности КМП X в своей точке *

на основании примыкания S и его интегрального показателя £.

При определении плотности X в х примыкание S будем считать одной из построенных выше конструкций близости к множеству: S(x| А) = Р(х\ А) = {s^ (x^mon^Cx)} ((1.9), (1.11)). При этом заметим, что меры близости S и Р независимы друг от друга: близость 5, вообще говоря, не обязана принимать участие в конструкции Р. Точка зрения, принятая в работе относительно плотности, дается следующим определением:

7

Определение 1.7. Плотность Рх{х) точки х в КМП (Х,с1) есть какая-либо из мер предельности 2>х к х на основе Р:

Ях(х) = дюСО,->х|ЛЕ) 0-14)

Введенное таким образом понятие плотности послужило основанием для развития методов кластеризации и трассирования в КМП. Этим вопросам посвящена вторая глава работы.

Непрерывность отображении конечных метрических пространств.

Пусть /: (Х,^) (У,с}г) отображение КМП. Введенные выше нечеткие сравнения, меры близости, плотность дшот широкие возможности в формализации непрерывности /. Приведем две конструкции дискретной непрерывности.

В основе первой из них лежит следующая логика непрерывности: отображение / непрерывно, если оно плотные точки в X переводит в плотные точки в У. Фильтрация ={</>,<»•,),«,) Г»} посредством / переходит в систему /(%>х) взвешенных У -

подмножеств {/(Д.(г,),а,) |"(,)}. Выбрав варианты примыканий и их интегральных

показателей (З^,!^.) и (^..Е,.), получим меры предельности рехфО^-ьх) и

(X),,) —> /(*)) (1.12). Любое их нечеткое сравнение и (1.4) можно считать мерой С/(х) непрерывности / в точке х:

X—¡—>У

-> х) -> /(*))

\ /

Сг(х) = я(/1м(©ж -> *)./м»СЛ©х) -> /(*)))•

Всякая пара мер близостей ^ на X, на Г позволяет реализовать вторую естественную логику непрерывности: отображение / непрерывно в х, если близкие к х точки в X / переводит в близкие к у=/(х) точки в У. Эта логика была формализована через график Гу = {(г, /(г)), ге X) отображения /.

Пусть г б Л", ¿/(г) - мера близости г к х л X, Зуу (/(г)) - мера близости /(г) к /(*) в У. Знакопеременным условным доводом Сг(х\г) за непрерывность / в х с позиции г может быть любое сравнение 6* (г) и например, их разность

Сг(х\2) = 6гу(/(г))-3* (г). К нему надо отнестись с весом 5* (г) (чем точка г ближе к дг, тем она важнее для непрерывности / в х). Окончательный вывод СДх) о непрерывности / в х может быть любым интегральным показателем взвешенной числовой совокупности {(СДх | г), 5* (г)): г е А-}, например, ее средним:

В третьей главе работы подробно рассматривается дискретная гладкость конечных временных рядов. Реализация общих положений ДМА в конкретные алгоритмы, применяемые далее для анализа геофизических данных, описана в гл. II и III.

8

Глава //. Плотные области в конечных метрических пространствах

Формализация плотности Рх(х) (1.14) дает возможность поиска в КМП сгущений. Описание нескольких подходов к решению этой задачи составляют содержание второй главы диссертации.

Основы в в конечном метрическом пространстве.

Пусть (Х,е1) - КМП и Рх(х) - выбранная на нем модель плотности, хеХ. Определение 2.1. Обозначим через Р(Х) совокупность значений плотности Рх(х): Р(АГ)={^.(х):леЛГ}. Пусть а е (0,1]. Назовем точку х' - сильной (слабой) а-основой в X, если для меры превосходства Рх(х') наД Р(.Х) (1.5), индуцированной нечетким сравнением па (1.4), справедливо неравенство

це*(Р(х) < Рх (*)) = па (Р(х),Рх (х)) £ 0.5 (;> 0) (2.1)

Основы - действительно "очень сильные" на общем фоне точки в X (рис .2). Они бывают не всегда, например, их нет в достаточно однородных, равномерных КМП. "Выбор основ" - алгоритм скелетного "дискретного" выделения сгущений в А" по соотношению (2.1). Но можно потребовать более "непрерывного" выделения сгущений: дело в том, что плотные области в X не обязаны целиком состоять из основ. Более тщательное описание сгущений достигается кристаллизацией вокруг содержащихся в них основ. Но прежде, чем перейти к ее изложению, остановимся на локализации в КМП.

У у .'¿ГЛЧ

■'■■•¡¡К й?

¡Ш' / /V:\Vv'/; ;У

•Щ--■'•'

:'1

Ж! ¡ {-Л"' '-Ч-' •

.'Л*.'*"-.' ".'• • '•••■"•••':'■'•'•'•■• Ш ¡}

'•ч,. ' / /А***•

:■—-Л?' ':••'.'.' • Л; ■ иЛ'У'и'/ ■ . 'V;.'.

»/.• 1 • ■ . 'ч • .!''.■ \ '■'■'%'■ '••."•'¥

•л-^.';-. ■.'.Л'.;. ■.;; ш

Рис. 2. Работа алгоритма "Выбор основ": а - исходный массив, б - основы (красные точки)

Наличие в Рх(х) 3 -составляющей {а, = <£С(ДС(';))|"М} дает основание считать такую

плотность "инфинитезимальной" и влечет ее относительную вычислительную сложность. Поэтому возникла проблема разумного компромисса между вычисжгтельной сложностью плотности н ее топологической адекватностью. В работе она была решена, так называемой, локализацией X в х: система шаров £),(/;) I"'*' заменялась при помощи меры близости 5Х(-)

((1.6), (1.7)) одним шаром й(х,д) = {>■ е Л": 5х(у) > 0.5} 5 -близких к х в X точек. Локализация X -> й{х, 3) дала еще один способ построения плотности в х внутри X. Определение 2.2. Меру близости х к В(х,д), полученную на основании любой конструкции Р ((1.9), (1.11)) назовем локальной плотностью X ъ х\

Рх(х) = Р(х\0{х,5)) (2.2)

Исследования показали, что "инфинитезимальная" и локальная плотности ведут себя почти одинаково, и потому в работе, в основном, использовались локальные плотности. Пример. Большое применение нашла локализация X -»£>(*,£) по мере близости (1.6), индуцированная сравнением н05: 0(х,8) = Ох(гСл), где га - решение уравнения п0}(ге„с1Х) = 0.5 (гс, - граница сильной минимальности для множества расстояний с!Х).

Кристаллизация в конечном метрическом пространстве.

Алгоритм "Кристалл" окружает основы в X а-плотными подмножествами ("кристаллами"). В результате получается более детальное по сравнению с выбором основ выделение плотных подмножеств в X.

Определение 2.3. Пусть А - подмножество в X, Р - конструкция плотности (1.14), а > 0.

1. Назовем А плотным (Р -плотным) на фоне X, если

Р/х)^РЛх) Ух а А (2.3)

2. Назовем А а -плотным (а -Р -плотным) на фоне X, если

РА(х)^аРх(х) Ухе А (2.4)

На рис. 3 представлена блок-схема алгоритма "Кристалл".

Рис. 3. Блок-схема алгоритма "Кристалл"

Если Р - результат выбора основ в X одним из описанных выше способов (2.1), то кристаллизация начинается вокруг самой сильной из них '. Каждый раз после завершения предыдущей кристаллизации в блоке "Основа" происходит выбор следующей основы для дальнейшей кристаллизации. В связи с этим происходит проверка на наличие "незадействованных" основ, не принимавших участие в предыдущих кристаллизациях. Таким образом, если закончена /'-ая кристаллизация Кт и при этом Р с А"'0 и.-.и АГ'0, то алгоритм завершает свою работу (переход в блок "Завершение") и Кт - его

результат. В противном случае, Р<х ЛГ(1)и...и.ЛГ(0, происходит выбор - самой сильной из оставшихся основ для следующей (/+1) -ой кристаллизации.

10

После очередного выбора основы происходит процесс кристаллизации вокруг нее. Он возможен на базе любой плотности, но эффективным с вычислительной точки зрения будет в случае, когда плотность обладает линейностью.

Определение 2.4. Плотность Р линейна на X, если для любых дизъюнктных подмножеств А и В в X и хе X

Р,.я(х) = 1/41 Р.(х) + Рв(х) (2.5)

Из определенных выше конструкций РА(х) линейностью обладает нечеткая принадлежность ел (дг) (1.9) на основе той или иной меры близости 8 на X. Кристаллизация начинается с блока "Рост I". Пусть К„ = - текущая и-ая стадия роста /ого кристалла К0*. На начальном этапе кристалл К0) состоит лишь га одной точки - самой основы: К? = Базовое условие а -плотности (2.4) для кристалла Кп, благодаря линейности Р, выражается через его дополнение Кп следующим образом:

«ю

ЧхеК, |лг|-1-д|Л: \+аРк-{х) (2-6)

Коэффициент в правой части (2.6) зависит от а и п:

В блоке "Рост I" происходит проверка каждой точки из К„ на предмет возможности ее присоединения к текущему кристаллу. Она состоит в следующем утверждении: Утверждение2.5.Пусть х„н еК„ и К„а ={ЛГ„,дгп>1},тогда

Рк.А (*„.,) ^ аРх{х, и)о Р^) Ъ р(а,п+\)РР^ (*„м) (2.8)

Таким образом, если (х) < 0(а,п+1)/'-. (х) Ухе Кто а-плотных расширений кристалла К„ нет, его дополнение Кп "сохраняет" за собой все свои точки, и рост кристалла К(п заканчивается на стадии Кп = К^. Далее происходит переход к блоку "Основа". Если же ЗхеКп: Рк (х)^/)(а,п+\)Ре (х), то такие х рассматриваются как "кандидаты" на присоединение к К„. Обозначим

их через ^-и».При переходе кристалла из Кп в

следующую стадию КпА через : КмХ ¿ = 1.....к, вообще говоря, меняется

плотность точек из Кп, поскольку меняется объемлющий их контекст. Необходимо, чтобы она по-прежнему была в а раз выше фоновой. В этом - суть проверки в блоке "Рост 1Г\ Утверждение 2.6. Если для точки д^, соблюдено условие (2.8), то кристалл ЛГ„И = будет а -плотен тогда и только тогда, когда выполнено условие "Рост 1Г':

В случае, если ни одна точка не выдерживает условие (2.9), текущий кристалл Кп расти перестает и в алгоритме происходит переход к блоку "Основа" с целью выбора основы для следующей кристаллизации. Если точек , удовлетворяющих условию (2.9), оказывается

несколько то в качестве продолжения кристалла К„ берется та из них, при

которой качество (2.13) кристалла на (;"+1)-ой стадии роста будет максимальным:

•*„», = агвшах^,

Далее, благодаря линейности Р (2.5), происходит перерасчет плотностей Рк^ (х) и Ру^ (х) для точек х е КпЛ с целью их дальнейшего участия в проверке "Рост Г' (2.8) на предмет последующего роста кристалла на (л + 2) -ой стадии:

1

№ «.1-1

1

(2.10)

, А. (х)-т^п—5Х (х) К.1-2 К'К К\-2

В блоке "Завершение" происходит идет-ификация окончательных стадий роста кристаллов: К = К' и. • • и К', I =1{а, 5х(у), Р). Работа алгоритма "Кристалл" приведена на рис. 4,21, 24.

1

Рис. 4. Работа алгоритма "Кристалл":

синие точки - основы; красные - кристаллизованные точки

* • 5 '

у;-. .*■1

Рис. 5. Красные точки - результат работы алгоритма "Роден"

Кластеризация в конечном метрическом пространстве.

Выделение плотных областей в КМП тесно связано с кластеризацией в нем. Последняя -вещь более строгая, поскольку помимо повышенной плотности дополнительно предполагает еще и изолированность множества.

В работе мы исходили из более расширенного, метрического толкования кластер-анализа, как описательного инструмента для изучения взаимного расположения объектов в метрическом пространстве. В частности, под кластер-анализом подразумевался метод изучения списка всех возможных кластеров при использовании некоторого заданного определения кластера. При этом любые два кластера могли пересекаться по любому числу элементов. Такой подход отличается от традиционного понимания кластер-анализа, как классификации без учителя и требующего дизъюнктное™ кластеров, либо устанавливающего верхнюю границу числа общих элементов для любых двух кластеров.

Несмотря на широкое применение кластер-анализа, общепринятого определения кластера не существует. Наш подход к кластерности представляет собой предельное выражение определенного выше свойства "быть" плотным на фоне (2.3), а именно:

класгерность множества есть его "суперплотность", то есть плотность этого множества на фоне любого объемлющего его контекста.

Определение 2.7. Подмножество А в X назовем кластером относительно плотности Р (Р-кластером), если

РА(х)^РЁ(х) \/xbA,VB:AczBcX (2.11)

Утверждение 2.8. Если РА(х) - линейная плотность ел (х) ((1.9)), индуцированная мерой близости 5, то класгерность А эквивалентна следующему свойству:

PA(x)Zäy(x) VxeA,VyeX-A (2.12)

Если интерпретировать Sy(x) и Рл(х) как притяжение точки х соответственно точкой у и подмножеством А, то приведенное утверждение неформально означает, что кластер притягивает свои точки сильнее, чем это делает любая внешняя по отношению к нему точка. Класгерность есть сочетание плотности и отделимости, поэтому численное выражение плотности и отделимости дадут численное выражение класгерности, необходимое для ее поиска.

Определение 2.9. Пусть А - подмножество в X, Р - конструкция плотности на X:

1. Плотность (качество) А

Р(А) = тмпРл(х) (2.13)

2. Отделимость (класгерность) А от своего дополнения А в точке хеА

С'л(х) = Ра(Х}Еа(хУ гДе £<(*) = тах^(х) (2.14)

. Отделимость (класгерность) А в X

Cl(A) = min С1Л (х) (2.15)

Поиск кластеров осуществляет алгоритм "Роден". Он базируется на двух положениях - конструктивном выражении кластерности (2.12) и принципе высекания: понимая, что такое кластер заданного качества и отделимости, "Роден" ищет его в исходном пространстве X, отсекая при этом от него все лишнее. Этим объясняется название алгоритма. В работе представлены различные его версии, в частности, способные работать с нечеткими массивами, что особенно важно для геофизики. Остановимся подробнее на простейшем, глобальном варианте "Родена".

Сначала задаются характеристики высекаемого кластера: уровень качества а и уровень отделимости ß. Обозначим через Кп текущую версию кластера, получившуюся из

X после высекания из него п точек {х, : Кп = А' — {х,. Начальной версией К0 считается все X: К0=Х. Высекание из Кп точки xntl может происходить по двум причинам:

во-первых, по причине неудовлетворительного качества Р(Кп)<а, тогда дг„„ - слабейшая по плотности точка Кп: xnti = arg min/^(х);

во-вторых, по причине неудовлетворительной отделимости С!(Кп) < ß, и тогда хп(1 -слабейшая по отделимости точка К„: = arg min ClK (х)

"Роден" завершает работу при встрече первого попавшегося кластера с заданными характеристиками. Вполне возможно, что внутри него может быть еще один кластер необходимо более высокого качества 5>а. "Роден" найдет его, если повысить начальный уровень плотности до S и скорректировать ß-+ß. Так, настраивая "Роден" на тот или иной уровень характеристик, мы имеем возможность диагностировать КМП (X,d) на предмет

сгущений, получая при этом значительную их часть. На рис. б представлена блок-схема алгоритма "Глобальный Роден"

Рис. б. Блок-схема алгоритма "Роден"

В заключение отметим, что "Роден" также, как и "Кристалл", работает более "непрерывно", чем алгоритм "Выбор основ". Результаты его применения приведены на рис.

Трассирование в конечном метрическом пространстве.

В любом метрическом пространстве (X,d) любое троеточие {x,y,z} можно считать обычным треугольником с вершинами х, у, г. Теорема косинусов дает возможность определить косинус и синус "угла" yxz, которые нам понадобятся ниже

d1(x,y)+d1{x,z)-d1(y,z) . Г.-i-

cosyxz = — „—Vrr—ч sm yxz = J\-cosyxz (2.16)

2 d(x,y)d(x,z)

Теперь (X,d) предполагается конечным. Всякое трассирование в нем считается локально "прямолинейным". Это означает, что для любой точки х s X, в которой имеет место трассирование, найдутся шар D{x,г) и точка yeD(x,r), порождающая направление

трассирования "ху" в нем (направление, вокруг которого в D(x,r) наблюдается трассирование).

Формализация понятия трассирования пространства X около х по "направлению" ху в масштабе D(x.r). Отклонение точки z s D(x, г) от "направления" ху оценивается в алгоритме трассирования через модуль вертикальной проекции d(x,z)sinzxy посредством функции р:[0,г]->[-1,1]. Значение (p(d(x,z)s\nzxy) можно считать "условным" знакопеременным доводом от z за трассирование через х вдоль ху в масштабе Dix,г). 1-ое условие локального трассирования "Положительных" доводов должно быть больше

2ко(».г) z)sin zxy) >0 (2.17)

Приведем один из вариантов <р : если у - ширина предполагаемого трассирования, то

[l ~yr OSÍSr

Выполнение (2.17) — первый этап локального трассирования. Его итог — достаточная четкость коридора D(x,r,y)={zeD(x,r):d(x,z)sinyxz£y] на фоне D(x,r).

Цель второго, тщательного этапа локального трассирования состоит в проверке достаточной монолитности D(x,r,y) вдоль "направления" ху. Для этого сначала задается

разбиение отрезка [-г,г] на 2п частей

Г' '+1 1 • , _

—г,-г , / = -и,...,н-1. С ним связано разбиение

и и J

коридора D(x,r,y) на сегменты D¡ = D,(x,r,y\xy):

D. = J z s D(x,r,y):d(x,z)cosyxz e

[ I n n .

Далее для них строятся булевы веса <а, =

1 |Z)f|Sl

о'еол>(|=о

и с их помощью формализуются 2-ое и 3-е условие локальной трассируемости.

2-ое условие локального трассирования. Нетривиальных сегментов должно быть много:

обычно мы полагали

!;■;>, (2.18)

3-ье условие локального трассирования. Нетривиальные сегменты D, должны распределяться более или менее равномерно в рамках своих границ. Пусть /' (/**) - номера

первого (последнего) нетривиальных сегментов. Для /е/ =[/*,/"] определим его односторонние монолитности в I:

S^fO):ye[i,i] /-»+1

/•in ££,ГО'):0(У) = We ['>'"] rr, -4 i" +\-j .

rmon(/ /) = z,;(.):.G[.r] . W-rzrf.

и потребуем выполнения условия общей монолитности с параметром а е (0,1] для всех i el: min(/ mon(/11), r mon(/" | /)) £ a (2.20)

Локальная трассируемость в точке х означает существование yeD(x,r), вдоль направления которого последовательно выполняются условия (2.17), (2.18), (2.20). Итогом локального этапа трассирования будет подпространство Tr(X) е X: Тг(Х) - объединение коридоров D(x,r,y) вточках х, где имеет место локальная трассируемость.

Глобальный уровень трассирования связывает воедино достаточно близкие коридоры из Тг(Х). Зададим параметр близости Д>0. Отношение Д-близости на Тг(Х) симметрично, и потому его транзитивное замыкание разбивает Тг(Х) на компоненты Д-связносги, которые мы считаем трассами в X. Локальная трассируемость (2.17-20) и разбиение множества Тг(Х) на глобальные трассы вместе составляют алгоритм "Трассирование", работа которого представлена на рис. 7.

Рис. 7. Линейные структуры, найденные алгоритмом "Трассирование", состоят из красных и зеленых точек. В их число не вошли круговые сгущения на правом рисунке.

Целесообразный выбор параметров: г - rei(X,d) (см. пример после опр. 2.2), у - Уп?с, > ае(0.3,0.5), w = 8-12, Д £/■«,.

Выбор направления: в произвольном КМП - прямая рутинная проверка по ysD(x,r) на предмет лучшего выполнения трех условий локальной трассируемости. В евклидовой ситуации направление е может быть выбрано на основе условной оптимизации J(e) = Z,coo.r)(r - х, е)2 -> шах на сфере || е ||= 1 : е - направление, сумма квадратов проекций

векторов xz на которое будет максимальной.

Гпава III. Дискретный математический анализ временных рядов.

Нечеткие сравнения, меры близости ((1.4)-(1.7)), стационарный предел (1.13) дают возможность построить для конечных временных рядов дискретные аналоги всех основных понятий классического математического анализа: гладкости, разрывности, монотонности, экстремума, точек перегиба.

Пространство временных рядов на квантованном отрезке [a,i]sRt с узлами

/,=аг+(/ -1)/», a = l{, b = tn, h = -—- обозначим через BP[a,b], Если xeBI'[a,b], то

х, - x(t,), так что *~(x()|"eR".

Гладкие временные ряды. Алгоритм "Равновесие"

Для конечного ряда х в работе рассматривались три вида стационарного, так называемого, гравитационного предела в узле t,. Определим один из них и без ограничения общности назовем его гравитационным.

Пусть г(1")=тах(]/(-а|,|/)-Ь0+А, выберем М еМ и положим г(/,ст)=г(0-,

=:| - /, г(/, т)}, т=0.....М. Зададим гравитационное распределение

Д даярада ж в узле /,.

Количественная составляющая Д:

Множества и] е и,м} - образ окрестности II,ж при отображении х.

Примыкания - квадратичные отклонения г от взвешенного центра тяжести

(3.1)

где

<5?я>0')=

\J1lJA и <г(;,т)

г(/,т) " 4 ' ,т<М (3.2)

О, |/у-/,|>г('» $и)и) - символ Кронекера

Динамическая составляющая А, - веса окрестностей 111м: ат т=0,...,М.

Интегральный показатель для взвешенного примыкания | И,) - обычное среднее 2=Ц. Таким образом, гравитационная мера предельности (1.12)имеет вид

(33)

¿-О "т

Ее минимум достигается в точке г', которую мы также считаем гравитационным пределом х при стремлении (к/, (1.13):

г -=Шпдо А, — (3.4)

Гравитационный предел есть суперпозиция двух усреднений: локального gr(4,я;<^íC*',) в окрестности £/(л1 с весом «?"'(•) и глобального - по таким с весом а„. Ряд х тем гравитационно непрерывнее в узле чем значение х, в нем ближе к пределу ^1ипх((), поэтому функционал

С£?г0(х)=ЕГ.||х1-ег1шх(/)|2 (3.5)

естественно считать невязкой гравитационной непрерывности ряда х на отрезке [в,6]. Она является важной частью алгоритма построения гладких временных рядов "Равновесие", к изложению которого мы переходим.

Проблема состояла в построении для временного ряда у на [о, 6] "гладкого скелета" х=5т(у), являющегося сглаживанием у и формализующего понятие "гладкое

динамическое равновесие" внутри у. Ряд х определялся в работе на основе следующей лотки:

(х -"гладкий" скелет для >')-(* - "гладкий") л(х -приближение у).

Идея гладкости формализовалась посредством функционала невязки гравитационной гладкости CGr(x). Идея приближения формализовалась функционалом сканирования Sc(y).

Определение 3.1. 1. Невязка гравитационной гладкости: нулевой уровень - невязка непрерывности CGr°(x) (3.5).

2. Невязка гравитационной гладкости: 5-ый уровень, s = l,...,/;-l. Пусть D' - оператор дифференцирования i-oro порядка: D' :К" ->R""*, х' =D'x - s-ая производная функции х: х eBP[a,b' = b-sh]

= /( е[а,Ъ<} (З.б)

Функционалом CGr'(x) s -ой гравитационной гладкости ряда х будем считать невязку гравитационной непрерывности его .v-ой производной х*

CGr'(x) = CGr°(x') (3.7)

3. Невязка гравитационной гладкости: итоговый уровень

CGr(x) = asCGr'(x), (3.8)

где а, - неотрицательные веса (параметры сглаживания).

Функционал сканирования естественно определить как квадратичную форму

ад^И^-*!!'» (-3-9)

Итоговый функционал сглаживания Sm(x\y) для ряда у есть одно из линейных Я-соединений определенных выше функционалов

Sm,(х) = ЯCGr(x)+(1 -X)Sc(x\>>), Де[0,1] (3.10)

Функционал &нЛ(х|_у) является неотрицательным и квадратичным на К", а потому достигает своего минимума х" в единственной точке, которая и будет искомым Я-сглаживанием для у\ х = SmAy. Таким образом, поиск "гладких скелетов" Sm,y сводится к решению линейной системы п -ого порядка

x'=Smfy о Grad&?jA(x* |^) = 0 (3.11)

Алгоритм "Равновесие" связывает с рядом у серию его сглаживаний SmAy, гомотетично изменяющуюся от константы при А = 1 до самого у при Я = 0. Чем Я больше, тем скелет визуально "глаже". Обозначим через GsO неотрицательный оператор на ВР[а,Ь], ассоциированный с невязкой CGr:

CGrix) = (Gx, х), х е ВР[а, 6] (3.12)

Пусть V,[«,b] - подпространство ВР[а,Ь], индуцированное многочленами степени <s.

Утверждение 3.2. 1. KerG = KerCGr = КегД' = Г.[а,Ь], где 5 - номер первого

нетривиального веса (os в невязке CGr (3.8).

2. BP[a.b] = KerG Ф Im G, dim ImG = w-s'-l, dim KerG = 5* +1.

Сглаживание у -> Smxy оказывается линейным обратимым оператором на ВР[а,Ь\, тесно связанным с G.

Утверждение 3.3.1. Дяя = (Ле+(1-А)£)",(1-А) , так что сглаживание у—ъБт^у оставляет инвариантными подпространства Кег(? и М(7, а на Кет С? действует тождественно.

2. 5т1 -сжатиена 1т(7.

3. ¡^-Яп^^сЭД, у*ВР[а,Щ.

Отсюда следует сходимость итераций сглаживания: Утверждение 3.4.1. Если кег^> - проекция у на Кет б, то 5->кегу.

2. Компонента кету - оптимальное в квадратичном смысле полиноминальное сглаживание временного ряда у степени 5*.

3. Гравитационные невязки СО(5Ь£у) убывают к нулю монотонно.

В сипу обратимости оператора любой хеВР[а,Ь] служит А-сглаживанием для какого-либо у е ВР[а, Ь]:

Следовательно, одной итерации ИтАу, вообще говоря, может оказаться недостаточно: количество необходимых итераций для "гладкости" 5т1у зависит как от самого ряда у (п=п(у)), так и от целей, которые преследуются при сглаживании. В свою очередь, последняя решается тем или иным вариантом гладкости на временных рядах. Приведем один из них.

Определение 3.5. Назовем ряд £-<?г-гладким («¿0), если он с точностью до е принимает на основании невязки Сбг "правильные значения". Дня I е[а,Ь] и геМ обозначим через л? рядна [а, Ь]: =2, если t¡=t, ;£(/,)=х(, если Тогда * е-вг -гладок, если

ССфрг: Свг(х), V/, б [а, 6], Уг^г-х, $>е (3.13)

Утверждение З.б. При е>0 для любого уеВР[а,Ь] обязательно найдется е-вг-правильная итерация Зт^у, л=п(у,е,Л).

Пример. Опыт работы с алгоритмом "Равновесие" показал, что при в-Ь, Л=0.9999 число итераций, как правило, не превышает 4. Чем Л меньше, тем итераций больше.

Прогнозирование гладких временных рядов. Алгоритм "Прогноз".

Эффективность алгоритма "Равновесие" объясняется использованием в нем не только ряда х, но и его производных х", то есть заложенным через функционал ССгг(х) (3.8) требованием "гравитационной" гладкости х. В работе это использовалось для прогнозирования.

Дан временной рад у~(у,) 15 на [а,й]еКА, /,=аг+/й, /=0,..., я. Обозначим через у, его возможное продолжение в точку Ь+й: уг(0=у,, если 1,е[а,Ь], и у,(1,) = г, если =6+Л. Для д=0,...,п производная у'г в точке 6"=6+й-лй равна

= (3.14)

л

Выбор г (прогнозирование поведения ряда у в точке Ь+Ь) осуществляется в алгоритме "Прогноз" на основе гравитационного предела и невязок гладкости. Гравитационный предел {»гИтУ(0 = к/' с соответствующими весами еаг позволяет сформировать идеальное

значение-прогноз в виде взвешенной совокупности Л/Су) = {('^'»®«)1о}- Прогноз у(Ь+Л) = г' ищется из соображения минимального квадратичного отклонения реального возможного распределения К.еО',) = {(>'*(6'),е>1)|2} от идеального:

(3.15)

где

Введем обозначение

г' = Прогиоз(у[аМ)

(3.16)

Рис. 8. Сглаживание реальной записи алгоритмом "Равновесие" изображено зеленым цветом. Прогнозирование этого сглаживания алгоритмом "Прогноз" с основами в 100 точек на 20 точек вперед обозначено красным цветом.

Согласованность алгоритмов "Равновесие" и "Прогноз". Динамический предел. В основе обоих алгоритмов лежит гравитационная гладкость, связанная с гравитационным пределом 8гНт (3.4). Это влечет их согласованность, выраженную следующим утверждением:

Утверждение 3.7. Пусть хеВР[а,Ь], А б (0,1]. Для любого е>0 существует е-йг-

правильная итерация 8т"х, п = п(х, Л, е) для которой

| Прогнозах |(а ь_ч) - ¿Ч>(А)| < е (3.17)

Естественно считать Прогноз(8т\х динамическим пределом сглаживания Бт"хх при стремлении I к 6+А: НтЗт^х = Прогиоз{8т°х4]). В общем случае динамический

предел с учетом (3.17) получается как суперпозиция алгоритмов "Прогноз" и "Равновесие": «Шт = "Прогноз" ""Равновесие".

Определение 3.8. Пусть х произвольный временной ряд на [а,Ь], Л е (0,1], е > 0 и 8т"хх -сглаживание (3.17). Назовем динамическим пределом х при стремлении I к 6+А прогноз для в 6+А:

^ 1т х = Прогпоз(5т"х\аМ) (3.18)

Имея динамический предел в числовом, одномерном случае (рис. 9), обратимся к произвольной ситуации. Если (дг,) Ц°-> х' - обычная сходящаяся последовательность в

метрическом пространстве (Х,(1), то для любого хеХ числовая последовательность | сходится к £?(х,х*), и последнее расстояние служит мерой предельности х для (х,)Е% в частности, х*=ат5пнп1нп«Г(х,х()Р. Воспользуемся этими рассуждениями в конечном случае.

Пусть (х,) - конечная последовательность в (Х,сГ) и хеХ.

Определение 3.9.1. Назовем динамической мерой стремления конечной последовательности (х,)? к точке х числовой предел ^1ип</(х,х|) (3.18).

^((х;)|^х)=аГ1ш^(х,х,) (3.19) 2. Точка х -динамический предел в (Х,сГ) для последовательности (х,)£, если

х*=швпт«Пгт</(х,х,) (3.20) На рис. 9 приведен пример конечного числового предела.

Рис. 9. Красная точка - числовой динамический предел исходной записи на основе сглаживания, отмеченного зеленым цветом, при стремление слева к /=40

Аномалии на временных рядах.

Если сглаживание Smx(x) считать идеальным сценарием протекания процесса, описываемого временным рядом х на [а,Ь], то точки /е[а,Ь], в которых отклонения х(1)-Ятл(х) особенно велики, естественно назвать разрывными (аномальными) для х. Алгоритмы DRAS и FLARS, о которых пойдет речь ниже, способны работать с более широким пониманием аномальности на временных рядах, в частности, они открыты к любому экспертному мнению по этому вопросу.

Общепринятые алгоритмы выделения аномалий на временных рядах основываются преимущественно на статистическом и частотно-временном анализах. При этом некоторое исключение составляет алгоритм "вероятностного" моделирования логики интерпретатора по Б.М.Наймарку (Выч. сейсм, 1966). Именно она послужила толчком к созданию алгоритмов DRAS и FLARS. DRAS (Difference Recognition Algorithm for Signals) и FLARS (Fuzzy Logic Recognition Algorithm for Signals) - результаты мягкого (на основе нечеткой математики) моделирования логики интерпретатора, ищущего на записи аномалии. В работе она понималась так: сначала интерпретатор скользит по записи, оценивая положительными числами активность одинаковых небольших ее фрагментов. Делает он это в силу своего восприятия,, при этом "мысленно" присваивая выработанные числовые оценки центрам фрагментов. Так от исходной записи интерпретатор переходит к неотрицательной функции, которую естественно назвать выпрямление записи, поскольку более активным точкам на записи будут соответствовать большие значения этой функции. Далее поиск интерпретатором аномалий на записи сводится к поиску возвышенностей на ее

выпрямлении. Таким образом, интерпретатор работает на двух уровнях: локальном -выпрямление записи, и глобальном - поиск возвышенностей на выпрямлении. Соответственно алгоритмы ИКАБ и РЬАНЭ также имеют два уровня. При этом на локальном они совпадают, а на глобальном действуют по-разному.

Локальный уровень. Выпрямление записи.

Активность на записи (временном ряде) - понятие многозначное, способное видоизменяться как от записи к записи, так и в рамках одной записи и неподдающееся однозначному строго математическому определению. Поэтому для ее адекватного моделирования применялся открытый к пополнению набор "выпрямлений". Пусть у = (ук = У(кк)) запись на отрезке (периоде регистрации) УеК^. Введем параметр локального обзора Д>0, кратный А: ДеЕ^, и назовем фрагментом локального обзора записи у с центром в /сЬеУ ее отрезок А* у:

АкУ = {укуг,У>,...,Ук^еШ%" (3.21)

Определение 3.10. Если J = {Д*_у} совокупность фрагментов локального обзора записи у и

к ь лг

Ф:./ то суперпозицию к Ау -> Ф(Д _у) = Фу(к) назовем выпрямлением у на

основе Ф.

Примеры выпрямлений. 1. Длина фрагмента обзора:

¿(AV)= I \Ум~У\ (3.22)

2. Энергия фрагмента обзора

** , Ч

ЧА*у) = 2 {у, -л)2' где Ä £ У, (2.23)

2Д + А т"д

3. Осцилляция фрагмента обзора

кЧ к*~н

0(Аку) = max yt - min yt (3.24)

'-"Л

4. "Разрывность" фрагмента обзора I. Сглаживание Smx(Aky) (3.11) можно считать идеальным поведением записи на данном локальном временном фрагменте, а потому отклонение от него мерой разрывности записи у в точке kh:

to,(AV) = |K(AV)-Äty|f (3.25)

Заметим, что энергия есть предельный случай последней конструкции, если среднее считать результатом сглаживания алгоритмом "Равновесие" при Я = 1.

5. "Разрывность" фрагмента обзора П. Мера гравитационной гладкости (3.8) для Дку

'Ун

CGr(Aky) = Zta,CGr((Akyy) (3.26)

Глобальный уровень. Алгоритм РКАБ.

На рис. 10 приведена блок-схема алгоритма ОЯА8.

Меры фона ЬаФу, ЯаФ_

Выпрямление записи

I

Фрагментация записи )>к~у(кИ)

Распознавание потенциально аномальных фрагментов

г--1-1

/ I \

Выделение заведомо аномальных фрагментов

Запись

Рис. 10. Блок-схема алгоритма ЭЛЛв

Как из нее видно, после выпрямления (локальный уровень) поиск аномалий на записи сводится к поиску возвышенностей на ее выпрямлении. В то же время (рис. 11) показывает, что рельеф выпрямления может бьтгь достаточно сложен и анализа одного вертикального уровня кривой Фу (к), вообще говоря, недостаточно для определения искомых

возвышенностей. Дело в том, что аномалии могут не обладать постоянно высокой интенсивностью: они неоднородны - активных участков больше, но их разделяют слабые, так что соответствующие им выпрямления представляют собой осциллирующие возвышенности. Надо найти платформу (связное основание) такой возвышенности и в ней указать всплески. Для этого нужна более тонкая по сравнению с выбором по уровню логика выделения возвышенностей, сочетающая в себе объединение (поиск платформ) и размежевание (вырезание всплесков внутри платформ).

СОН »142

ОЯАв реализует ее на глобальном уровне в два этапа. Сначала запись делится на фоновую (спокойную) и потенциально аномальную части (блок "Распознавание потенциально аномальных фрагментов"). Связные области в потенциально аномальной части и есть основания (платформы) возвышенностей. Далее уже в платформах ОЯАв ищет заведомо аномальные фрагменты (блок "Выделение заведомо аномальных фрагментов").

Решающую роль при этом играют односторонние меры фона ЬаФу(к) и Д,Ф(к), характеризующие степень спокойствия выпрямления Ф^, слева н справа от точки кЪ (блок "Меры фона"). Введем параметр глобального обзора Л » Д, Л е Щ и назовем фрагментом глобального обзора совокупность

Л'Ф, = {Ф,(A-%))...)ФУ(Í))...>ФДA+%)}6R2^, (3.27)

Множество таких совокупностей обозначим через 9{. Введем на отрезке А(к) = [АЛ - Л, АЛ+Л] весовую функцию

Л+/1 ' (328)

Она представляет собой модель глобального обзора фрагмента А*Фу, придавая больший вес при его анализе более близким к центру АЛ точкам из Л (к). Введем еще один свободный параметр - вертикальный уровень фона а и по нему построим отображения Д.Фу(к): 91 ->[0,1] и КаФу(к): ЭТ —> [0,1]

^(к):Фу(к)1а,ке[к-%,к]

^ - - - л / Р-29) К Ф (к)=———=г-=-т-.-

Отсюда видно, что чем меньше выходов выпрямления Фу(к) за уровень а, тем ЬаФу(к) (ЯаФу(к)) больше и наоборот, так что они действительно являются мерами фона и отражают «-спокойствие выпрямления Ф^ слева (справа) от АЛ. Перейдем к построеншо областей потенциальной аномальности. предусматривает возможность гибкого отношения к

24

(3.30)

выходам Фу(к) за уровень а при глобальном Л-обзоре в точке АЛ, то есть к а-неспоконствню в kh. При правильной настройке он обращает внимание только на достаточно массивные по времени выходы за уровень а и пропускает незначительные, считая их фоновыми аномалиями. Это достигается с помощью свободного параметра Р е (0,1] н условий ЬаФу(к) <0, ЯаФу(к) < Р. Для любого р возникает разбиение периода регистрации У на фоновую (спокойную) В и потенциально аномальную (активную) РА части: У ~B\J РА

В = {kh <= У: тт(4ФД*), ЛаФ у(к)) 2 /?}

PA = {kheY: т\п(Ь„Фу(к),ЯаФу(к)) < /?}

Параметр р естественно назвать горизонтальным уровнем фона, поскольку массивность аномалии по времени есть ее горизонтальная протяженность. Чем меньше /?, тем большая часть записи относится к фону и тем грубее распознавание аномалий с помощью DRAS. Самая внимательная версия DRAS получается при Р = 1. Она не пропустит ни одного выхода рельефа Ф}. за уровень а. Перейдем к построению областей заведомой аномальности (блок "Выделение заведомо аномальных фрагментов"). Множество РА является объединением связных компонент РА„: РА = \У„^РАп. Именно с ними работает DRAS на втором этапе глобального уровня. Выделение областей заведомой аномальности в РАп происходит на основе анализа разности

ПаФу(к) = 1.аФу(к)-КаФу(к) (3.31)

Этим и объясняется название алгоритма "Difference Recognition Algorithm for Signals", (DRAS). Оператор ОаФу определяется формулой (3.31) на РА и полагается равным нулю на В. Начала аномалий лежат в положительных максимумах DJt>y, поскольку именно в них разница между спокойствием записи слева и ее неспокойствием справа выражена в наибольшей степени. По той же причине концы аномалий лежат в отрицательных минимумах ОаФу. На рис. 12 приведен пример работы алгоритма DRAS.

DON С*Н2 Спаду и*0вJ wtadOO

\

! ;_______________ ___

Al J К v \ \ A, /Vf ...........\r

/ \ J • N W" . /......._______mj..........

J * щ .............

Рис. 12. Работа алгоритма DRAS на геоэлектрическом временном ряде: синим цветом обозначены фоновые точки, зеленым - потенциально аномальные, красным - аномальные.

Глобальный уровень. Алгоритм И,АИ5.

На рис. 13 приведена блок-схема алгоритма ШАЯБ.

Мера аномальности (¿(к)

Выпрямление записи Фу тг

Выделение заведомо аномальных фрагментов

Меры фона

Распознавание потенциально аномальных фрагментов

Запись

Рис. 13. Блок-схема алгоритма РЬАНБ

Из нее видно, что РЬАКв совпадает с БЯЛв на локальном уровне, но по-новому действует на глобальном. РЬАЯв сначала выделяет области заведомой аномальности (блок "Выделение заведомо аномальных фрагментов"), а потом присоединяет к ним области потенциальной аномальности, формируя нечеткий ореол сигнала (блок "Выделение потенциально аномальных фрагментов"). Таким образом, РЬАЯЭ в два этапа осуществляет деление У = А+РА+В области регистрации записи У на три подмножества: А - аномальные точки, принадлежащие возвышенностям выпрямления Фу, В - фоновые, спокойные точки,

расположенные достаточно далеко от этих возвышенностей и РА - потенциально аномальные, неспокойные точки, носящие промежуточный характер (формально не принадлежащие возвышенностям, но лежащие от них достаточно близко и потому ощущающие их влияние).

При выделении областей заведомой аномальности был применен новый способ поиска экстремальных значений (выделения возвышенностей) на рельефах. Он основан на логике горы, реализованной при помощи нечетких сравнений и мер близости: гора - это не абсолютно высокий фрагмент рельефа, но фрагмент, возвышающийся над своими подножиями, от которых, в свою очередь, зависит ее изолированность от других гор. Мера горы есть сочетание этих двух ее качеств: относительной возвышенности и абсолютной изолированности.

Доводом за минимальность (фоновость) выпрямления Фу в точке кЬ при глобальном обзоре А4Ф> (3.27) в модели $к(к) (3.28) будет сумма

сг+(Л,А)=£(Ф,(Г )-Ф,(*))**№•) :**А е Л(А-)лФ,(Г) > Фу(к) (3.32) Доводом за максимальность (аномальность) выпрямления Фу в точке кЬ будет сумма

а (Л,к) = Х(Ф,(А)-ф,(*-))*,(*"):к 1геЛ"(к)лФ,(Г)<ФДА:) (3.33) Мера экстремальности //(А) - результат нечеткого сравнения и доводов а~(А,к) и а* (А, к) (1.4):

№ = 1»,(<г*(Л,П<г(Л,*)) (3.34)

Решение об аномальности во РЬАЛЗ принимается на основе вертикального уровня экстремальности оге[-1,1]:

У = А + М, Л = {Айе Г :/#)>«}, ЛС4 = {А:ЛеУ:ц(к)<.а] (3.35)

Дальнейшее разбиение ЫА = В+РА неаномальных точек на фоновую и потенциально аномальную составляющие происходит во РЬЛКв также, как и в ВЯЛв при помощи односторонних знакопеременных мер £аФу(к) и

В = {ш 6 У: тюс(£аФу(к),ЖаФу(к)) £ р]

РА = {к/геУ: тах(£аФу(к),<ПаФу(к)) > р)

где Р б [-1,1] - горизонтальный уровень фона, (//, - вспомогательная функция (1.3). Пример работы алгоритма ГЬАКЭ приведен на рис. 26.

Завершая рассказ об алгоритмах БИЛв и РЬАЯЗ, сделаем два замечания: во-первых, очень много зависит от выбора вертикального фона а. В РЯДв предусмотрена его вариация в зависимости от образа 1т Ф^ выпрямлен™ Ф>, на периоде регистрации У при помощи нечеткого сравнения /» (1.4): а должен быть сильно максимален по модулю 1т на основе пу

а:пг(\тФу,а) = 0.5 (3.37)

Во РЬАИЗ уровень экстремальности а обычно полагается равным 0.5 или 0.75. Таким образом, и в этом случае необходимая жесткость также реализуется сравнением пу в мере т (3.34);

во-вторых, если ВЯЛв нацелен на поиск абсолютно сильных событий, то РЬАЯЗ больше ориентирован на относительно сильные события, поскольку ему для выбора а не нужен предварительный глобальный анализ (3.37). Итак, в зависимости от задач можно применять либо РЬАЯЗ (при более детальном анализе), либо ОЯАЭ (при более грубом, глобальном анализе).

Морфология записей.

"Выпрямление" 3.10 при помощи того или иного функционала сводит задачу поиска сигналов на записи к поиску возвышенностей на одномерных рельефах. Морфология таких возвышенностей (более широко морфология выпрямления) полезна при определении природы сигнала и свойств процесса, отраженного записью. Таким образом, исследование рельефа возвышенностей и выпрямления включает в себя определение границ возвышенностей, впадин и пиков, плоскогорий, участков роста и спада, выпуклости и вогнутости, "беспокойных" осциллирующих участков, то есть исследование рельефа выпрямления в целом.

В работе предлагается два дополняющих друг друга подхода; первый го них состоит в определении монотонности и выпуклости для временных рядов. Второй связан с переводом геометрии временных рядов на язык нечеткой логики. Обратимся к первому.

Монотонность временных рядов. Дан временной ряд хеЯР[а,6]: х= {*(/,) /, =а+/Л, п

Определение 3.11. Назовем ограничения х^, левой, правой частями х в узле /, и обозначим их соответственно через Ьх(1,) и Лх(/,).

Сформулируем принятое в работе понимание монотонности временных рядов. Ряд х возрастает (убывает) в узле /,, если 1х(/,)£Лс(/,) (¿х(/,)^ •/&(/,)). Эти неравенства при помощи нечетких сравнений моделируются по-разному, и также по-разному им придается нечеткая мера. Приведем одну из возможных схем такого моделирования. Пусть и

£«('/) " односторонние веса в узле 1,:

(3.38)

Без ограничения общности сохраним название и обозначение левых и правых частей LxQ,) и 1Ьс(1,) за взвешенными совокупностями

Ьг(/,)ф(*,),<?,;(<,)):/,£ [а,/,]}

(3.39)

Определение 3.12. 1. Нечеткое сравнение н(1х(/(),./&(<,)) (1.5) назовем мерой монотонности fies mon x(ti) ряда х в узле

2. ряд х возрастает (убывает) в узле I, о //e.smonx(/,)>0 (//es monx(/,)<0);

3. ряд х возрастает (убывает) на [а,Ь], если он возрастает (убывает) в любом узле /, е[а,й].

Экстремумы временных рядов. В произвольном случае х-динамика на отрезке [а, Ъ\ представляет собой последовательное чередование максимальных противоположных монотонностей. В отличие от обычных монотонностей определенные в 3.12 противоположные нечеткие монотонности на временном ряде могут пересекаться, наплывая друг на друга (рис.14). Их пересечение нужно считать нечетким подножием для экстремума э ряда х. Возникает задача его нахождения. В работе получено несколько способов определения о. Приведем один из них, основанный на логике превосходства. Обозначим

через 5,(Т) модель обзора отрезка [а, 6] сцентром /: S,(J) = 1--———-.

тах(|/-а|,|/-й|)+Л

Определение 3.13.1. Пусть a<cid <Ь, ряд х возрастает на [a, d] и убывает на [с, 6]. Тогда узел Me[c,d] - максимум для х на [а, Ь], если взвешенный образ lmx(0 = {(x(T),S,(Ty) :7e[a,Z>]} имеете нем наибольший момент

М = arg max(£M, (ЕГ{[оА1 х(Т)5Д)) (3.40)

2. Пусть a<cid<й, ряд х убывает на [a,d] и возрастает на [с,¿]. Тогда узел me[c,d] -минимум для х на [а, 6], если взвешенный образ Imx(/) имеет в нем минимальный момент

т = ах& 1шп,с[с ¿1 (Е,С|ал х(Г)8, (Г))

(3.41)

Выпуклость временных рядов. В ее основе лежит связь между выпуклостью и монотонностью в классическом математическом анализе: функция / выпукла на [а,Ь], если ее производная /' монотонна на [а,Ь\, Я - точка перегиба для /, если Я - экстремум для /'■

В работе такой подход реализован на временных рядах. Для него помимо монотонности понадобилось сглаживание 5отЛ алгоритмом "Равновесие" (3.11), поскольку осцилляция временных рядов приводит к еще большим осцилляциям их производных. Применялась последовательность переходов х ->• 8т\х -> .

Определение 3.14. 1. Назовем временной ряд х выпуклым на [а,Ь], если ряд монотонен 3.12 на [а, Ь - А];

2. Я - точка перегиба для ж, если Я -экстремум 3.13 для Ят/(Ит')х). На рис. 14 представлены нечеткие монотонности и экстремумы.

400 200 0 -200 -400

Рис. 14. Возрастающие и убывающие нечеткие монотонности отмечены соответственно красной и зеленой штриховкой. Нечеткие экстремумы выделены голубыми вертикальными

прямыми.

Геометрические меры на временных рядах.

Вторая версия морфологического анализа временных рядов связана с применением нечеткой логики к геометрии одномерных рельефов. Она дает возможность находить пики, впадины, плато, границы и склоны гор, а также другие геометрические характеристики на временных рядах.

Элементарные меры. Пусть хе.ВР[а,Ь]. В каждом / е [а, А] мы построим для х четыре знакопеременные нечеткие меры //"(')> //''(0. М''(0> /'"(')> отвечающие в шкале [-1,1] на следующие вопросы:

р"(0 минимальным слева

//'*(/) - в какой степени значение х(1) можно считать максимальным слева от I на [а,Ь]

р"(1) минимальным справа

/и"(1) максимальным справа

Определенные меры будут с дополшггельной нормировкой: если [1 - любая из них, то значение //(/) окажется близким к 1 (-1), если соответствующее ¡1 свойство в узле г выполнено слабо (сильно).

Выберем параметр одностороннего обзора Д «Ъ-а н обозначим через *"(') и ■¿'Ц) соответственно верхнее и нижнее отклонения х от значения х(1) слева от / на р-Д,/]:

х"(0 = Д*(О-*(0):Г е[/-Д,/]л*(0>*(/) (3 42)

*"(') = Е(*(<)-*С")):Ге[/-Д,/]л*(Г)<*(0' Аналогично определим верхнее и нижнее отклонения *''(') и *"(') справа от / на [/,/+А]:

*"(<) = Д*(0-*(0):'* ер,<+Д]л*(О>*(0

*"(0 = £(х(0'-х(1')):Г е[1,1+Д]лх(Г)<х(1)'

Неформально на эти отклонения можно посмотреть как на количественные результаты взаимоотношения ряда х со своим значением х(1) близко от /, но значительно важнее и интереснее оказывается не абсолютное, а относительное выражение связи х с х(1) около I. Оно получается как вариант меры БЬАЯЗ (3.34), ориентированный на минимальность. Для рядов *"(/), ¿'(С), *"(/), х"{1) на [сг+Д.й-Д] положим

где

а"(х,I) = Дх"(1*)-х"(1))\1' е[а+А,Ь-А]лх"(1*)>х"(1) (т.(х, 0 = Е(*"(0 - х"(Г)): Г е [а+А,Ъ- Д] л х"(Г) < х"(1)'

о. (х,t) = Z(x"(Г)-х"(/)):/' е[а+А,Ь-А]лх"(Г)> х"(/) сг1'(х,0 = £(х"(0-х"(Г)):Ге[а+А,6-А]лх"(Г)<х"(0'

(3.44)

Рх'О) = nr(p'J(x,t),cr't'(x,t))

сг:'(х,1) = Т.(х"(П-х"(<))--1*е[а+Ь,Ь-А]лх"(1*)>хг'(1) o'J (ж,0 = Z(x" (0 - x" (Г)): Г е [а+А, Ь ~ Д] л х" (Г) < ж" (/)'

М" (0 = (о"" 0.о" (*, 0)

где

ст"(ж,/) = (О-*"(')):'* б[а+Д,6-Д]лх"('')> *"(0

Построенные меры являются элементарными. На их основе при помощи нечетких конъюнкций строятся более сложные геометрические меры, выражающие геометрию ряда х. Соединения элементарных мер. Пусть Г - любая нечеткая конъюнкция, например Т = min или Т = х.

Определение 3.15. Нечеткие соединения элементарных мер (3.44) при помощи нечеткой конъюнкции 'Г назовем геометрическим мерами для ряда х:

(1,1,1,1) -н. Т{ц''{«)>»"(')) =

(-1,1,1,1) о = /4ил0(')

(-1,-1,-1,-1) <-> ц-р'ло-^о-м'ло-р'л')) = «'"'-'"'Чо

Меры (3.45) позволяют выразить различные геометрические ситуации на х около /.

Геометрическое свойство Логический перевод Геометрическая мера

фон для х в 1 в точке 1 слабо выражены минимальность и максимальность как слева, так и справа, следовательно, все элементарные меры в / должны быть большими

начало горы для хв/ в точке / слева слабо выражены минимальность и максимальность, справа сильно выражена минимальность и слабо максимальность, следовательно, все элементарные меры кроме /¡"(1) в 1 должны быть большими, а //"(О " маленькой /4и-и>С)

подъем (левый склон) для х в / в точке * слева слабо выражена минимальность и сильно максимальность, справа - все наоборот, следовательно, //"(0 и //*(/) должны быть большими, а //''(0 и ц" (/) - маленькими

пик (вершина) для *в/ в точке 7 слева и справа от 1 слабо выражена минимальность и сильно максимальность, следовательно, /л" (1) и /¿"(0 - большие а /у'* (0 и -маленькие м'ГХ1>(<)

Исследования показали: чем мера (3.45) в t больше, тем соответствующая ей геометрия выражена для х в t сильнее. Следовательно, геометрическую меру (/) можно считать нечеткой мерой принадлежности на [д + Л,Л-А] геометрическому свойству "^уА" для х-.

Вывод: построен перевод геометрии одномерного рельефа на язык нечеткой математики посредством связи с каждой геометрической характеристикой рельефа нечеткой меры соответствия точек на рельефе этой характеристике. Такие меры мы назвали геометрическими. На рис. 15-18 представлены описанные выше четыре геометрические меры для реальной записи. На верхней панели каждого рисунка приведена сама запись, на средней панели дано ее выпрямление на основе функционала "Длина" (3.22), на нижней изображена соответствующая геометрическая мера.

780 ; 760 -; 740 720 700

ЬЛ\

_1_!_

-1_I

гзоо 5300 6000 6100 6200 6300 6400 6500 6300 6700 6800

600 400 200

.-Да-

5800 5300 6000 6100 6200

6400 6500 6600 6700 6600

1

0.5 0 -0.5 -1

_____¿1Л&1

Д..

¡ГП

1

5800 5300 6000 6100 6200 6300 6400 6500 6600 6700 6800

Рис. 15. Геометрическая мера "Фон"

780

.760 | М0

720 700

5800 5300 6000 6100 6200 6300 6400 6500 6600 6700 6800

600 400 200

Л-

"V

5800 5300 6000 6100 6200 6300 6400 6500

0.5 О -05 -1

М1та

5800 5300 6000 6100 6200 6300 6400 6500

6700 6800

¿ж:.}

I

6700 6800

Рис. 16. Геометрическая мера "Начало горы"

780 -§ 760 "

!| 740 -720 -700 -

5800

^ к

- 1

л

Л--

Рис. 17. Геометрическая мера "Рост"

VII

_1_

780 760 740 720 700

5800 5300 вооо 6100 6200 6300 6400 6500 6600 6700

600 г

400 200

/\

/V-

5800 5900 6000 6<00 6200 6300 6400 6500 6600 6700

1

05 О -05

5800 5300 6000 6)00 6200 6300 6400 6500 6600 6700 6300

) , " т ( 1 г,

1

.....У., .и. II ( Й ||

1___Ь_!_..!!. ^____ 1 л 1.1 1 \ _

Рис. 18. Геометрическая мера "Пик"/-

РОС. й" .

СПмсрЬж?

Глава IV. Геофизические приложения ДМА.

Созданные в рамках ДМА алгоритмы "Роден" и "Кристалл" применялись при интерпретации магнитных аномалий в заливе Сан-Мало (Франция) и массиве Аххагар (Алжир), алгоритм DRAS явился ключевым звеном в мониторинге вулкана JIa Фурнез (Франция), алгоритм FLARS анализировал остаточные гравиметрические данные в рамках международного научного проекта Global Geodynamic Project (GGP).

Плодотворные геофизические приложения "Родена" и "Кристалла" связаны с методом деконволюции Эйлера (МДЭ). Этот известный в практике метод основан на аппроксимации измеренного аномального гравитационного или магнитного поля АГ в скользящем "окне" полем некоторого элементарного источника однородной плотности или намагниченности, аномалия от которого является однородной по Эйлеру функцией.

В дальнейшем (x,y,z) - декартовы координаты, ось Oz направлена вертикально вниз, ось Ох - на север, ось Оу - на восток. Параметр N = -n принято называть структурным индексом. Известно, что уравнение Эйлера на координаты (x0,y0,z0) элементарного источника имеет вид

(4.1)

ох оу OZ

где (x,y,z) - координаты точки наблюдения, в которой задано поле AT ч вычислены его производные, А - фоновое значение поля.

МДЭ заключается в определении четырех неизвестных параметров (x0,_y0,z0) и А в скользящем "окне", содержащем более четырех точек, путем решения системы линейных уравнений. Таким образом, каждому "окну" соответствует одно эйлерово решение (эйлерова точка) и одно фоновое значение А.

Эйлеровы точки для изолированных аномалеобразующих тел (АОТ) располагаются по их контурам и дают оценку глубины их залегания, но в сложных интерференционных случаях эйлеровы точки образуют размытые облака, которые трудно интерпретировать. Тем не менее оказывается, что в этих облаках имеются плотные области, которые располагаются вблизи контуров тел, поскольку, благодаря небольшому размеру палетки и ее перемещению с перекрытием, одно и то же АОТ будет оказывать доминирующее влияние в поле при нескольких соседних положениях палетки. Следовательно, к этому АОТ будут относиться несколько решений инверсии (4.1), они должны быть близки и поэтому образовывать плотные скопления. Таким образом, имеет место эквиваленция: чем четче будут выделены в эйлеровых решениях плотные области, тем лучше будет известна топология АОТ.

Геофизическое применение алгоритма "Роден". Алгоритм "Роден" был применен к интерпретации участка аэромагнитной карты аномального поля AT Армориканского массива в Бретани (Франция). Выбранная область включала в себя восточную часть залива Сен-Мало и часть суши к югу от залива. Важной особенностью данного района является система долеритовых даек, которые внедрились в докембрийский фундамент и были позднее срезаны и мстаморфизованы герцинскими гранитными интрузиями. В прибрежной зоне дайки имеют небольшую толщину (в среднем около 5 м), их простирание меняется от С-Ю до ССВ-ЮЮЗ. Линейные магнитные аномалии в этом районе имеют такое же простирание, но значительно большую ширину, что указывает на возможное соединение этих даек на глубине в более крупные магматические тела.

Аэромагнитные измерения были проведены на высоте 350 м с малым расстоянием между профилями, что позволило провести интерполяцию на равномерную сетку с шагом 250 м. Целью применения "Родена" совместно с МДЭ было изучение структуры источников квазилинейных магнитных аномалий на су ше и в заливе.

Эйлеровы точки рассчитывались с размером окна 9x9 точек (2x2км). На рис 19 представлены результаты применения локальной версии "Родена" с параметрами а = 0.8, Р = 0.7 и г = 0.3 км. Из начального набора в 34 500 решений алгоритм отбросил 7000 точек, сформировав плотные кластеры, оконтуривающие изомстричные и линейные тела. Важной особенностью полученного решения явились линейные кластеры, вытянутые с С на Ю в южной части рисунка, и линейные кластеры, простирающиеся с СЗ на ЮВ в его северной части. Южнее береговой линии они имеют то же простирание, что и долеритовые дайки. Это дало основание считать, что вторая система описывает структуру даек непосредственно в заливе Сан-Мало.

а б

Рис. 19. Слева представлено аномальное магнитное поле для участка залива Сен-Мало и прибрежного участка (береговая линия отмечена черным цветом). Справа точками показаны кластеры эйлеровых решений, выбранные алгоритмом "Роден".

Для выбора параметров "Родена" и сравнения его работы с общепринятыми методами отбора эйлеровых решений был взят небольшой участок карты в районе изометричной аномалии 1 (рис. 20а). Несмотря на то, что более 40% из них было отброшено, как имеющие малые сингулярные значения (числа обусловленности), полученное распределение дало мало информации о строении выбранного района. Далее были применены другие стандартные методы селекции в МДЭ ("разброс", "расстояние" и т.д.). Хотя в целом картина несколько прояснилась (рис. 206), полученное распределение вряд ли можно использовать для трассирования кошуров магнитоактивных тел. На рис. 20в представлен результат применения "Родена". Важно отметить его устойчивость к малым вариациям параметров: результат слабо менялся в диапазоне а (0.78*0.82), р (0.67+0.73), г (0.25+0.35км).

Таким образом, применение алгоритма "Роден" позволило уверенно выделить линейные магнитные аномалии в районе залива Сен-Мало.

Геофизическое применение алгоритма "Кристалл". Алгоритм "Кристалл" использовался совместно с МДЭ в интерпретации участка аэромагнитной карты аномального поля АТ в районе массива Ахаггар (Хоггар) вблизи южной границы Алжира. Аэромагнитные измерения в этом районе были проведены на высоте 300-350м в 1974г. В результате аномалия ДТ оказалась заданной на регулярной сетке размерностью 901x271 (Дх = Ду=1км). МДЭ применялся к данному полю дважды: со структурным индексом Лг=3 и N=0.5. Остановимся на каждом из них.

Известно, что при N=3 МДЭ порождает решение, соответствующее эквивалентному точечному диполю, поле которого наилучшим образом аппроксимирует наблюденные значения аномалий в скользящем окне. Для локализованных магнитных объектов положение такого диполя приблизительно совпадает с центром магнитных масс. При N=3 эйлеровы решения определялись с помощью квадратного окна 5x5 точек (5x5км) со сдвигом в две точки. В результате получилось 17153 эйлеровых решения. Число их было уменьшено до 2719 путем стандартной фильтрации, принятой в МДЭ. Проекции этих решений на горизонтальную плоскость хОу представлены на рис. 21а.

2260-

•. г. • ■><.

•л ••• -

4-Г-

ТГ

2200-

- X_____I

й »

V

%'

I

ч*

*

1^0

•Л У

г

к.

Рис.21. Слева показаны отфильтрованные эйлеровы решения при ЛГ= 3, справа - результат применения к ним алгоритма "Кристалл"

Несмотря на то, что более 84% точек было отброшено, результат такой фильтрации нельзя было напрямую интерпретировать в терминах геологического строения. "Кристалл" применялся к оставшимся эйлеровым решениям. На рис. 216 приведен результат его работы: из исходного набора в 2719 решений алгоритм отобрал 669 точек, сформировав 38 плотных сгущений.

Далее для каждого К -ого сгущения (/С = 1....38) оценивался его центр тяжести 8г(К) и средний магнитный момент т(К), а также их разбросы. Дело в том, что МДЭ имеет продолжение: после определения координат эйлеровою решения (диполя) компоненты тг, ту, тг его магнитного момента т определяются из линейной относительно них переопределенной системы с порядком, равным числу точек в "скользящем окне". Если ; -произвольная точка в "окне", соответствующему эйлерову решению, г, - радиус-вектор из / к нему, то

0) где т (А- (егс^'ХО и „ -дя-т'Гн/ .

ИЧИГ Т Ц(8гааД7)(0|| И "°~4;Г10 /«

магнитная проницаемость вакуума.

Оказалось, что полученные результаты по направлению намагниченности хорошо согласуются с представлениями о тектонике региона (рис.22). Так было показано, что сходные в тектоническом отношении участки, входящие в состав массива Ахаггар, характеризуются общим для каждого из них направлением намагниченности пород.

Рис. 22. Результаты определения средних углов намагниченности для каждого из выделенных алгоритмом "Кристалл" сгущений

150 ~зо зо ззо з5о~ Рис. 23. Карта прогнозных изоглубин поверхности кристаллического фундамента, полученная по результатам интерпретации: черными кругами обозначены центры сгущений, выделенных алгоритмом "Кристалл", цифрами, расположенными над кругами, обозначены значения средних глубин соответствующих сгущений

При структурном индексе N=0.5 МДЭ порождает решения, соответствующие положению ближайших к поверхности особых точек аномального поля, связаных с положением изломов верхней кромки. В этом случае эйлеровы решения определялись с помощью квадратного окна размером 9x9 точек (9x9км) со сдвигом 3 точки. Выбранная сетка породила 7319 эйлеровых решений, число которых было уменьшено до 7000 путем стандартных фильтраций, принятых в МДЭ. Проекции этих решений на горизонтальную плоскость хОу показаны на рис. 24а. "Кристалл" отобрал из них 708 точек, сформировав 58 сгущений (рис. 246).

Рис. 24. Слева показаны отфильтрованные эйлеровы решения при ЛМ).5, справа -

результат применения к ним алгоритма "Кристалл

В условиях древних платформ, к которым относится изучаемый район, аномалеобразугощие тела залегают в кристаллическом фундаменте, а перекрывающая фундамент осадочная толща практически немагнитна. Верхние кромки намагниченных объектов, как правило, выходят на поверхность кристаллического фундамента, поэтому полученные оценки глубин сгущений могут рассматриваться как оценки глубин кристаллического фундамента. На рис. 23 изображена карта прогнозных изоглубин кристаллического основания, полученная путем линейной интерполяции средних глубин сгущений. Построенная таким образом карта хорошо согласуется с имевшимися ранее данными о глубинах фундамента и позволила детализировать представление о них.

Геофизическое применение алгоритма DRAS. Мониторинг вулкана Ла Фурнез (Piton de la Fournaise), расположенного в юго-восточной части острова Reunion в архипелаге Mascareignes, был начат в 1981г. Непрерывные магнитные измерения начались с 1985г., а электрические - с 1994г. Получившаяся база данных содержит уникальные долгосрочные ряды наблюдений, включающие активный период 1981-1992гт. (более 25 извержений), спокойный период 1992-1996гг. (только одно извержение в ноябре 1996г.) и последний период возобновившейся активности (1997г. и позднее).

Электрические сигналы регистрировались на вулкане Ла Фурнез пятью станциями MAV, DON, DOS, CSV, BAV (рис.25), измеряющими две горизонтальные компоненты EW и NS электрического поля с повторяемостью опроса 20 секунд. Алгоритм DRAS применялся к данным за 1997-1998гг. Эти два года характеризовались медленным повышением сейсмической активности, которая началась после слабого извержения в ноябре 1996г. Две значительные ступени в сейсмической активности имели место в середине июля 1997г. и в январе 1998г.

à

t*1

2 km

Рис.25. Мониторинг аномалий электрического потенциала вулкана La Fournaise на основе

алгоритма DRAS: цвет станции означает ее состояние в момент времени t. Черным, красным, зеленым цветом отмечены станции, находящиеся соответственно в спокойном (фоновом), заведомо аномальном и промежуточном (потенциальноаномальном) режимах. Приведенные на рисунке цветовые состояния станций соответствуют моменту /=58.542.

Параметры алгоритма DRAS были настроены по обучающей выборке из кратковременных рядов, с которыми французский вулканолог Ж.Злотники (J. Zloinicki) работал вручную. С функционалом "Энергия", Д=30 (600 сек), а = 0.97 DRAS выделил 95% обучающих сигналов, что продемонстрировало его высокую эффективность. Именно с этими параметрами DRAS анализировал данные 1997-1998гг. Найденные аномалии относятся в основном к двум типам: первые имели очень большую амплитуду (до 1000 mV/км или выше за десятки минут) и появлялись одновременно на нескольких станциях, вторые имели меньшую амплитуду (до 100 mV/км за несколько мш!ут) и могли иметь задержку от одной станции к другой.

В результате проведенного плювиометрического анализа и сопоставления с данными о режиме интенсивных (более 10 мм/день) осадков было выявлено, что аномалии 1-ого типа связаны с сильными осадками, в то время как аномалии 2-ого типа обусловлены вулканическими и геотермальными процессами в теле вулкана и коррелируют по времени со слабыми землетрясениями.

Особый интерес представляли аномалии 2-ого типа во временной окрестности момента извержения 9 марта 1998г. (26 февраля - 13 марта). Внимание привлекли аномалии с относительно резким началом и довольно большим (3-5 дней) временем релаксации. Прогрессирующий сдвиг их по направлению к будущим трещинам в период активности до извержения дал основание считать эти аномалии обусловленными вулканической активностью. Таким образом, DRAS позволил, во-первых, выделить на записях 1997-1998гг. аномалии в диапазоне УНЧ, порожденные геотермальной или вулканической активностью, а, во-вторых, выделить в окрестности твержения 9 марта сигналы, обусловленные вулканической деятельностью, предваряющие извержение и позволяющие локализовать вероятное место будущего прорыва лавы. На рис. 25 представлен мониторинг вулкана Ла Фурнез на основе anropirrMaDRAS.

Геофизическое применение алгоритма FLARS. Начиная с 1997г. в рамках международного научного проекта Global Geodynaraics Project (GGP) в различных точках земного шара

40

установлены и объединены в единую сеть SGr Network 18 сверхпроводящих гравиметров (Superconducting Gravimeters, SGr) с целью наблюдения и изучения временных вариаций гравитационного поля Земли. Полученные временные ряды с промежутками между измерениями в 60 сек длиною в несколько месяцев подвергаются обработке и разностороннему анализу. Первым шагом обработки является построение по ним остаточных гравиметрических данных с поправками на атмосферные и приливные эффекты. В результате получается запись с небольшими амплитудами, удобная для дальнейшего анализа.

Важной задачей обработки данных является поиск сигналов, привязанных к смещению уровня записи и искажению ее длиннопериодной компоненты. Скачки на записи SGr делятся на аппаратурные и неаппаратурные. Первые возникают при техническом обслуживании прибора, вторые связаны со случайным наклоном прибора, погодными эффектами, сильными колебаниями почвы. Но в любом случае их нужно считать аномалиями, поэтому поиск скачков осуществлялся последовательностью алгоритмов FLARS (рис.26) и Jump (рис. 27), специально для этого созданного (FLARS искал на записи аномалии, a Jump распознавал среди них скачки).

55 h.....................1.......................;.......................*........................i.......................i.......................i........................!•■■

50

45

................■■■■<......................*........................>........................>.....................-I.......................'........................>.....

162 162.2 162.4 162.6 162.8 163 163.2

Рис.26. Работа алгоритма РЬАЯЗ на остаточных вариациях поля силы тяжести.

........^4'f. НЦ4.................. s 1

■i........................i.....................-i.......................'........................i

Таким образом, на вход к алгоритму Jump поступала аномалия, найденная алгоритмом FLARS. Для каждого ее внутреннего фрагмента Jump строил меру скачкообразности этого фрагмента внутри данной аномалии, что представляло собой конъюнкцию трех уровней: спокойного поведения аномалии слева и справа от выделенного фрагмента + его достаточная резкость. Скачкообразность J аномалии определялась как верхняя грань скачкообразности се внутренних фрагментов. Оказалось, что если J <1.2 или J ^ 1.6, то можно уверенно говорить об отсутствии или наличии скачка на аномалии, остальные ситуации носили пограничный характер (рис. 27).

Г« Гв ре РЧ и

1 К( >М

3% 1 :. ,1 1 Ж /'WY* f. . .

J = 0.62 7 = 1.39 7 = 1.95

Рис. 27. Мера скачкообразности аномальных фрагментов, найденные алгоритмом РЬАЯв на остаточных вариациях поля силы тяжести.

В качестве проверки описанных алгоритмов был использован тестовый период проекта GGP с марта по ноябрь 1997г. Алгоритмом FLARS обрабатывались данные Страсбургской станции GGP. На записи, соответствующей 8 месяцам наблюдений, FLARS выделил 264 аномальных события разной длительности и интенсивности, среди которых Jump нашел 14 достаточно отчетливых и сильных скачков с J £1.6.

Заключение

Общий итог работы состоит в создании нового подхода к дискретным данным, основанном на моделировании дискретных аналогов фундаментальных математических понятий (предела, непрерывности, связности, монотонности, выпуклости) и названного "Дискретным математическим анализом". Отправной точкой такого моделирования послужил "мягкий", более устойчивый по сравнению с математическим, характер восприятия человеком дискретности и "сгохастичности" (например, гладкая в классическом смысле функция / на отрезке [а,Ь\ после даже достаточно тщательной дискретизации [я,6], либо под воздействием небольшого стохастического возмущения е:/->/+г потеряет это свойство, но по прежнему останется гладкой для человека). Технической основой ДМА явились нечеткая математика и нечеткая логика, поскольку они обладают достаточно большими выразительными возможностями для передачи человеческих представлений и рассуждений.

ДМА реализован в серии алгоритмов. Первая из них: алгоритмы "Выбор основ", "Кристалл", "Роден", "Трассирование" посвящены выделению плотных областей в многомерных массивах данных, в частности, кластеризации и поиску линейных структур в них.

Вторая серия алгоритмов ("Равновесие", "Прогноз", БЯАЗ, РЬАЯЭ, алгоритмы поиска нечетких монотонностей, экстремумов, выпуклости, точек перегиба) представляет собой функциональный подход к конечным временным рядам, во многом схожий с классическим математическим анализом гладких функций.

В ДМА также входит морфологический анализ конечных временных рядов, основанный на нечетких геометрических мерах.

Геофизические применения ДМА представлены в работе применением алгоритмов "Роден" и "Кристалл" к интерпретации магнитных аномалий соответственно в заливе Сен-Мало (Франция) н массиве Аххагар (Алжир), а также использованием алгоритмов РЛАБ и РЬАЯв для выделения аномалий на геоэлектрических и гравитационных временных рядах.

Список основных публикаций по теме диссертации

1. A. Gvishiani, V. Mikhailov, S. Agayan, Sh. Bogoutdinov, M. Diameni, A. Galdeano. Towards interpretation of gravity and magnetic data using methods of artificial intelligence. 17th International CODATA Conference. 15-19 October, 2000 - Baveno, Italy. Book of Abstracts.

2000, p.109.

2. A. Gvishiani, M. Diameni, A. Galdeano, S. Agayan, Sh. Bogoutdinov, A. Beriozko. Comparative mathematical methods of geophysical data handling; clustering and fuzzy clustering. 17th International CODATA Conference. 15-19 October, 2000 - Baveno, Italy. Book of Abstracts. 200, p.8

3. СМ. Агами, Ш.Р. Богоутдгтов, А. Гальдеаио, А.Д. Гвиишаии, B.M. Гордин, ЕМ. Граева, М. Диамаи, В.О. Михайлов, С.А. Тихоукий. Интерпретация магнитных аномалий залива Сен-Мало (Франция): Применение нового метода кластерного анализа при выборе решений, полученных по методу деконволюции Эйлера. Материалы 28-ой сессии Между народного семинара им. Д.Г. Успенского «Вопросы теории и практики геологической интерпретации гравитационных, магнитных и электрических полей». Киев, 29 января - 2 февраля 2001 г. М.: Изд.-во ОИФЗ РАН. 2001, c.l 1.

4. A. Gvishiani, V. Mikhailov, S. Agayan, S. Tikholsky, Sh. Bogoutdinov, M. Diament, A. Galdeano. Artificial intelligence technique in potential field and other geophysical data studies. AROPA Workshop. "Institute d'Europe". Castle of Munsbach, Luxembourg. 23-27 October,

2001, Abstracts. 2001, p.23.

5. A. Gvishiani, S. Agayan, Sh. Bogoutdinov, J. Bonnin. A new mathematical approach to cluster and classification analysis of potential field anomaly data. AROPA Workshop. "Institute d'Europe". Castle of Munsbach, Luxembourg. 23-27 October, 2001. Abstracts. 2001, p.9-10.

6. A. Zlotnicki, J-L. LeMouel, S. Agayan, Sh. Bogoutdinov, A. Gvishiani, V. Mikhailov, S. Tikhotsky. An automatic analysis of long geoelectromagnetic time series: determination of the volcanic activity. 18th International Conference CODATA 2002: Frontiers of Scientific and Technical Data. 29 September - 3 October, 2002 - Montreal, Canada. Book of Abstracts. 2002, p.70.

7. S. Agayan, Sh. Bogoutdinov, A. Gvishiani, M. Diament, V.O. Mikhailov, C. Widhvijayanti. Clustering of geophysical data by new fuzzy logic based algorithms. 18th International Conference CODATA 2002: Frontiers of Scientific and Technical Data. 29 September - 3 October, 2002 - Montreal, Canada. Book of Abstracts. 2002, p.71.

8. А.Д. Гвиишаии, С.М. Агаяи, Ш.Р. Богоутдииов. Новый математический подход к кластерам и анализ геофизических данных. Второй Международный симпозиум «Геодинамика и геоэкологические проблемы высокогорных регионов». 29 октября - 3 ноября, 2002, г.Бишкек. Тезисы докладов. 2002, с.203.

9. J. Zlotnicki, V. Mikhailov, J.L. Le Mouel, A. Gvishiani, P. Yvetot, S. Agayan, F. Fauquet, Sh. Bogoutdinov, G. Donnadiue. Ulf Magnetic and electric signals related to volcanic activity: La Fournaise Case (Reunion Island). Ill International Workshop on Magnetic, Electric and Electromagnetic Methods in Seismology and Volcanology (MEEMSV-2002). September 3-6

2002, Moscow, Russia. Book of Abstracts. 2002, p.127.

10. А.Д. Гвиишаии, M. Диамаи, В.О. Михаилов, А. Гальдеаио, СМ. Агаяи, Ш.Р. Богоутдииов, Е.М. Граева. Алгоритмы искусственного интеллекта для кластеризации магнитных аномалий. М.: Физика Земли, 2002, № 7, с.13-28.

11. A.D. Gvishiani, М. Diament, V.O. Mikhailov, A. Galdeano, S.M. Agayan, Sh.R. Bogoutdinov, E.M. Graeva. Artificial intelligence algorithms for magnetic anomaly clustering. Izvestiya, Physics of the Solid Earth. English Translation Copyright by MA1K "Nauka/Interperiodica", Russia, 2002, vol.38, p.545-559.

12. А.Д. Геишиани, СМ Агаяи, Ш.Р. Богоутдииов. Математические методы геоинформатики. I. О новом подходе к кластеризации. Киев: Кибернетика и системный анализ, 2002, № 2, с.104-122.

13. SM. Agayan, S.R. Bogoutdinov, M. Diament, J.E. Dubois, A.D. Gvishiaiii, M.D. Kovalenko, H. Kroehl, O. Mikhailov, У. Murakami, A.A. Soloviev. Fuzzy-logic based artificial intelligence algorithms in applications to geophysical problems. Sixth ISTC Scientific Advisory Committee Seminar: Science and Computing. 15-17 September, 2003 - Moscow, Russia. Abstracts. 2003, p.101.

14. А.Д. Гвишиаии, M. Злотпики, B.O. Михайлов, С.М. Агаяи, Ш.Р. Богоутдииов. Применение методов нечеткой логики в задачах выделения геофизических сигналов на длинных временных рядах - алгоритм FLARS. Материалы 30-ой сессии Международного семинара им. Д.Г. Успенского «Вопросы теории и практики геологической интерпретации гравитационных, магнитных и электрических полей». Москва, 27-31 января 2003 г. В двух частях. 2003, ч. I, с.30-31.

15. V. Mikhailov, A. Galdeam, M. Diament, A. Gvishiani, S. Agayan, S. Bogoutdinov, E. Graeva, and P. Sailhac. Application of artificial intelligence for Euler solutions clustering. Geophysics. 2003, vol. 68, no. 1, p.168-180.

16. А.Д. Геишиани, С.М. Агаяи, Ш.Р. Богоутдииов, А.В. Леденев, Ж. Злотпики, Ж. Боннин. Математические методы геоинформатики. И. Алгоритмы нечеткой логики в задачах выделения аномалий на временных рядах. Киев: Кибернетика и системный анализ, 2003, №4, с.103-111.

17. J. Zlotnicki, S. Agayan, A. Gvishiani, Sh. Bogoutdinov. Telematics and artificial intelligence tools in monitoring of volcanoes. WISTCIS Newsletter, 2003, vol. 3, November 2002-May 2003, p.58-60.

18. А.Д. Геишиани, C.M. Агаян, Ш.Р. Богоутдииов, Ж. Злотпики. Алгоритмы нечеткой логики в задачах выделения аномалий на временных рядах. В кн.: «Очерки геофизических исследований. К 75-летию Объединенного института физики Земли им. О.Ю. Шмидта». М.: ОИФЗ РАН, 2003, с.257-262.

19. A.D. Gvishiani, S.M. Agayan, Sh.R. Bogoutdinov, J. Bonnin. New mathematical approach to cluster and classification analysis of potential field anomaly data. Ministère de la Culture, de l'Enseignement Supérieur et de la Recherche, Conseil de l'Europe. Cahiers du Centre Européen de Geodynamique et de Seismologie. Grand-Duchy of Luxemburg, 2003, vol. 20, p.29-34.

20. A.D. Gvishiani, V.O. Mikhailov, S.M. Agayan, Sh.R. Bogoutdinov, S.A. Tikhotsky, M. Diament, A. Galdeano. Artificial intelligence technique in potential field and other geophysical studies. Ministere de la Culture, de l'Enseignement Supérieur et de la Recherche, Conseil de l'Europe. Cahiers du Centre Européen de Geodynamique et de Seismologie. Grand-Duchy of Luxemburg, 2003, vol. 20, p.63-69.

21. A.D. Gvishiani, S.M. Agayan, Sh.R Bogoutdinov, S.A. Tikhotsky, J.Hinderer, J.Bonnin, M.Diament. Algorithm FLARS and recognition of time series anomalies. System Research & Information Technologies. 2004, no. 3, 7-16.

22. Агаян C.M., Соловьев A.A. Выделение плотных областей в метрических пространствах на основе кристаллизации. System Research & Information Technologies. 2004, № 2, с. 7-23.

23. J. Zlotnicki, J.-L. LeMouel, A. Gvishiani, S. Agayan, V. Mikhailov, Sh. Bogoutdinov. Automatic fuzzy-logic recognition of anomalous activity on long geophysical records. Application to electric signals associated with the volcanic activity of la Fournaise volcano (Réunion Island). Earth and Planetaiy Science Letters, vol. 234,2005, p.261-278.

24. Агаяи СМ., Богоутдииов Ш.Р., Геишиани А.Д., Граева Е.М., Злотпики Ж., Родкип М.В. Исследование морфологии сигнала на основе алгоритмов нечеткой логики. Сборник ИФЗ РАН. 2006 (в печати).

Заказ N81934 Подписано о печать 12.10.05 Тираж 100 экз. Усл. пл. 1,84

^ ООО "Цифроиичок", тел. (095) 797-75-76; (095) 778-22-20 V-. 1 /у \v\vw. с/г. ги ; е-таИ: т/о@с/г. т

/П —7

РНБ Русский фонд

20074 11317

Содержание диссертации, доктора физико-математических наук, Агаян, Сергей Мартикович

Введение

Глава 1. Дискретный математический анализ в конечных метрических пространствах

1.1. Нечеткие сравнения

1.1.1. Нечеткие сравнения действительных чисел

1.1.2. Нечеткие сравнения точечных масс

1.1.3. Нечеткие сравнения взвешенных подмножеств действительных чисел

1.2. Меры близости в конечных метрических пространствах

1.2.1. Близость точек в конечном метрическом пространстве

1.2.2. Близость точки к подмножеству в конечном метрическом пространстве

1.2.3. Стационарный предел в конечном метрическом пространстве

1.2.4. Плотность в конечном метрическом пространстве

1.2.5. Непрерывность отображений конечных метрических пространств

1.3. Выводы

Глава 2. Выделение плотных областей в конечных метрических пространствах

2.1. Основы в конечных метрических пространствах

2.1.1. Локализация в конечном метрическом пространстве

2.1.2. Алгоритм «Выбор основ» 40 2.2 Кристаллизация в конечных метрических пространствах

2.2.1. Алгоритм «Глобальный Кристалл»

2.2.2. Алгоритм «Локальный Кристалл»

2.3. Кластеризация в конечных метрических пространствах

2.3.1. Алгоритм «Глобальный Роден»

2.3.2. Алгоритм «Локальный Роден»

2.3.3. Алгоритм «Нечеткий жесткий Роден»

2.3.4. Алгоритм «Нечеткий мягкий Роден»

2.4. Трассирование в конечных метрических пространства

2.5. Выводы

Глава 3. Дискретный математический анализ временных рядов

3.1. Гладкие временные ряды

3.1.1. Построение гладких временных рядов: алгоритм «Равновесие»

3.1.2. Прогнозирование гладких временных рядов: алгоритм «Прогноз»

3.2. Аномалии на временных рядах

3.2.1. Выпрямление временных рядов

3.2.2. Поиск аномалий па временных рядах: алгоритм DRAS

3.2.3. Поиск аномалий на временных рядах: алгоритм FLARS

3.3. Динамика временных рядов

3.3.1. Монотонность временных рядов

3.3.2. Иерархия монотонностей

3.3.3. Экстремумы временных рядов

3.3.4. Выпуклость временных рядов

3.4. Геометрические меры на временных рядах

3.4.1. Атомарные меры

3.4.2. Геометрия рельефа и нечеткая логика

3.5. Выводы

Глава 4. Геофизические приложения (ДМА)

4.1. Выделение плотных областей и кластеризация при поиске источников аномалий магнитного поля

4.1.1. Эйлерова деконволюция

Введение Диссертация по наукам о земле, на тему "Дискретный математический анализ и нечеткая логика в геофизических приложениях"

Актуальность работы. "Дискретный анализ - область математики, занимающаяся изучением свойств структур конечного характера. Дискретный анализ представляет собой важное направление в математике, имеющее характерные для него предмет исследования, методы и задачи, специфика которых обусловлена, в первую очередь, необходимостью отказа в дискретном анализе от основополагающих понятий классической математики -предела и непрерывности - и (в связи с этим) тем, что для многих задач дискретного анализа сильные средства классической математики оказываются, как правило, мало приемлемыми" (Мат. энциклопедия, 1979).

Если принять во внимание, что любые данные имеют дискретный характер, то актуальность дальнейшего развития анализа дискретных структур сомнений не вызывает.

Цель работы. Создание нового подхода к изучению многомерных массивов и временных рядов, основанного на моделировании предела в конечной ситуации и реализованного в серии алгоритмов под общим названием "Дискретный математический анализ".

Постановка конкретных задач. Цель работы определила постановку следующих задач:

• разработка алгоритмов поиска плотных областей в конечных метрических пространствах, в частности, кластеризации и трассирования в многомерных массивах;

• функциональный подход к временным рядам, включающий в себя: определение, построение и прогнозирование гладких временных рядов; поиск аномальных участков на произвольных временных рядах; определение понятий монотонности, экстремума, выпуклости и точки перегиба для временных рядов; разработка на их основе алгоритмов разбиения временного ряда на монотонные, выпуклые участки, а также поиска экстремумов и точек перегиба;

• морфологический анализ временных рядов на основе нечеткой логики;

• геофизическое приложение дискретного математического анализа (выделение плотных областей и кластеризация при поиске источников аномалий потенциальных полей, выделение аномалий па геоэлектрических и гравитационных временных рядах).

Методологическая основа исследования. Сформулируем принятую в работе концепцию дискретного математического анализа: отсутствие предела и непрерывности в конечной ситуации и более устойчивый по сравнению с математическим характер восприятия человеком дискретности и стохастичпости делают необходимым то, что

В.И.Кейлис-Борок называл моделированием "на глаз" (Выч. сейсм., 1968): решает не математика, а человек, и его решение нужно формально выразить. Приведем три примера.

1. Гладкая в классическом смысле функция / на отрезке [а, Ь] после даже достаточно тщательной дискретизации [а, Ъ\, либо под воздействием небольшого стохастического возмущения s:f-> f + s потеряет это свойство, по по прежнему останется гладкой для человека).

2. Формальную монотонность /на [а,Ь] может нарушить любое сингулярное возмущение, в то время как, человеческое понимание тренда более устойчиво к нему: лишь достаточно «большое» возмущение заставит человека изменить свое решение о монотонности / на [а, Ъ].

3. В многомерном конечном массиве X любой, в частности, геофизической природы особую роль реперных точек играют наиболее «плотные» из них, сильнее всего концентрирующие X вокруг себя. Они важны для анализа X, например, при кластеризации или трассировании в нем. Нетривиальное формальное выражение плотности в X не может быть построено в рамках классической математики, потому что для nee X - дискретное пространство, все точки которого одинаково изолированы и не интересны.

Определенные в ДМА дискретная гладкость и мягкая (стохастическая) монотонность для конечных и временных рядов, а также подход к плотности в точке, как к мере дискретной предельности пространства в ней, дает содержательные ответы в описанных выше примерах.

Техническая основа исследования. Нечеткая математика и нечеткая логика обладают достаточно большими возможностями для моделирования человеческих представлений и рассуждений по сравнению с обычными множествами и булевой логикой, и потому именно они послужили технической основой дискретного математического анализа.

Пример. В булевой логике основные связки «и», «или», «не» моделируются однозначно. В нечеткой логике для этого предназначены целые параметрические семейства, так называемых, Т-норм и Т-конорм [1], [42], моделирующие связки «и» и «или». Аналогично дело обстоит и с отрицанием. Опыт практического применения нечеткой логики и нечеткой математике показал их достаточность поскольку при необходимости благодаря параметрам возможен нестандартный выбор операторов для логических связок, отражающий характерные особенности конкретного приложения. Преимущество этого подхода состоит в том, что, избегая фиксированных, конкретнонезависимых определений нечеткая математика и нечеткая логика достигают плюрализма, которая повышает их гибкость и выразительные возможности. * Таким образом нечеткая математика и нечеткая логика позволяют дать строгое математическое описание в действительности расплывчатых экспертных утверждений и преодолеть лингвистический барьер между человеком, суждения и оценки которого являются приближенными, качественными и нечеткими, и компьютером, который может выполнять только четкие инструкции. Научная новизна.

• В дискретном математическом анализе аналоги фундаментальных математических понятий: предела, непрерывности, связности, монотонности, выпуклости представляют собой моделирование при помощи нечеткой математики и нечеткой

Л логики человеческих представлений об этих понятиях.

• Реализованные алгоритмы поиска плотных подмножеств в конечных метрических пространствах расширяют возможности классического кластерного анализа, поскольку не требует отделимости найденных подмножеств.

• Анализ временных рядов осуществлен в работе на основе новых для них понятий гладкости, монотонности, экстремума, выпуклости, геометрических мер.

Практическая значимость

• Все алгоритмы носят универсальный характер: они способны работать с данными существенно разной природы.

• Цели и задачи, на которые ориентированы алгоритмы, общеизвестны и ф фундаментальны.

• Алгоритмы "Роден" и "Кристалл" совместно с деконволюцией Эйлера послужили основой интерпретации магнитных аномалий в заливе Сан-Мало (Франция) и массиве Аххагар (Алжир).

• Алгоритм DRAS используется в мониторинге вулкана JIa Фурнез (Франция).

• Алгоритм FLARS используется при обработке данных мировой сети сверхпроводящих гравиметров (GGP Network).

Построенная в работе геометрия временных рядов дает возможность по новому подойти к анализу рельефов, что имеет большое значение в геоморфологии, батиметрии и т.д.

Схема построения ДМА.

Заключение Диссертация по теме "Геоинформатика", Агаян, Сергей Мартикович

4.3. Выводы

Созданные в рамках ДМА алгоритмы "Роден" и "Кристалл" применялись при интерпретации магнитных аномалий в заливе Сан-Мало (Франция) и массиве Аххагар (Алжир), алгоритм DRAS явился ключевым звеном в мониторинге вулкана Ла Фурнез ^ (Франция), алгоритм FLARS анализировал остаточные гравиметрические данные в рамках международного научного проекта Global Geodynamic Project (GGP).

Геофизические приложения ДМА изложены в реферируемых международных и российских журналах ("Earth and Planetary Science Letters", "Geophysics", ДАН, «Физика Земли», «Кибернетика и системный анализ», "System Research & Information Technologies").

Заключение

Общий итог работы состоит в создании нового подхода к дискретным данным, основанном на моделировании дискретных аналогов фундаментальных математических понятий (предела, непрерывности, связности, монотонности, выпуклости) и названного "Дискретным математическим анализом". Отправной точкой такого моделирования послужил "мягкий", более устойчивый по сравнению с математическим, характер восприятия человеком дискретности и "стохастичности". Технической основой ДМА явились нечеткая математика и нечеткая логика, поскольку они обладают достаточно большими выразительными возможностями для передачи человеческих представлений и рассуждений.

ДМА реализован в серии алгоритмов. Первая из них: алгоритмы "Выбор основ", "Кристалл", "Роден", "Трассирование" посвящены выделению плотных областей в многомерных массивах данных, в частности, кластеризации и поиску линейных структур в них.

Вторая серия алгоритмов ("Равновесие", "Прогноз", DRAS, FLARS, алгоритмы поиска нечетких монотонностей, экстремумов, выпуклости, точек перегиба) представляет собой функциональный подход к конечным временным рядам, во многом схожий с классическим математическим анализом гладких функций.

В ДМА также входит морфологический анализ конечных временных рядов, основанный на нечетких геометрических мерах.

Геофизические применения ДМА представлены в работе применением алгоритмов "Роден" и "Кристалл" к интерпретации магнитных аномалий соответственно в заливе Сен-Мало (Франция) и массиве Аххагар (Алжир), а также использованием алгоритмов DRAS и FLARS для выделения аномалий на геоэлектрических и гравитационных временных рядах.

Библиография Диссертация по наукам о земле, доктора физико-математических наук, Агаян, Сергей Мартикович, Москва

1. А.Н. Аверкин, И.З. Батыршин, А.Ф. Блишун, В.Б. Силов, В.Б. Тарасов.- Нечеткие множества в моделях управления и искусственного интеллекта /Под ред. Д.А. Поспелова/.- М., Наука, 1986, 312 с.

2. Айвазян С.А., Бухштабер В.М., Еиюков И.С., Мешалкин Л.Д. Прикладная статистика: Классификация и снижение размерности. Справ. Изд./ под ред. С.А. Айвазяна. М.: Финансы и статистика, 1989. 606 стр.

3. Аронов В.И. Обработка па ЭВМ значений аномалий силы тяжести при произвольном рельефе поверхности наблюдений. М.: Недра, 1976.

4. Агаян С.М., Соловьев А.А. Выделение плотных областей в метрических пространствах на основе кристаллизации. System Research & Information Technologies. 2004, № 2, с. 7-23.

5. Агаян С.М., Богоутдинов Ш.Р., Гвишиапи А.Д., Граева Е.М., Злотники Ж., Родкин М.В. Исследование морфологии сигнала на основе алгоритмов нечеткой логики. Сборник ИФЗ РАН. 2006 (в печати).

6. Боровков А.А. Курс теории вероятностей, М., Наука, 1972,287с.

7. Васильев Ф.П. Численные методы решения экстремальных задач, М., Наука, 1980, 508с.

8. А.Д. Гвишиани, М. Диаман, В.О. Михайлов, А. Гальдеано, С.М. Агаян, Ш.Р. Богоутдинов, Е.М. Граева. Алгоритмы искусственного интеллекта для кластеризации магнитных аномалий. М.: Физика Земли, 2002, № 7, с. 13-28.

9. А.Д. Гвишиани, С.М. Агаян, Ш.Р. Богоутдинов. Математические методы геоинформатики. I. О новом подходе к кластеризации. Киев: Кибернетика и системный анализ, 2002, № 2, с. 104-122.

10. А.Д. Гвишиани, М. Злотники, В.О. Михайлов, С.М. Агаян, Ш.Р. Богоутдинов. Применение методов нечеткой логики в задачах выделения геофизических13.