Бесплатный автореферат и диссертация по геологии на тему
Математическое обеспечение и компьютерная технология распознавания цифровых изображений в поисковой геофизике
ВАК РФ 04.00.12, Геофизические методы поисков и разведки месторождений полезных ископаемых

Автореферат диссертации по теме "Математическое обеспечение и компьютерная технология распознавания цифровых изображений в поисковой геофизике"

РГО О Л МИНИСТЕРСТВО НАУКИ, ВЫСШЕЙ ШКОЛЫ

И ТЕХНИЧЕСКОЙ ПОЛИТИКИ РОССИЙСКОЙ ФЕДЕРАЦИИ МОСКОВСКАЯ ГОСУДАРСТВЕННАЯ ГЕОЛОГОРАЗВЕДОЧНАЯ АКАДЕМИЯ 5 'МОСКОВСКИЙ ГЕОЛОГОРАЗВЕДОЧНЫЙ ИНСТИТУТ

На правах рукописи

БУСЫГИН Борис Сергеевич

УДК 681.3 : 550.83

МАТЕМАТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ И КОМПЬЮТЕРНАЯ ТЕХНОЛОГИЯ РАСПОЗНАВАНИЯ ЦИФРОВЫХ ИЗОБРАЖЕНИЙ В ПОИСКОВОЙ ГЕОФИЗИКЕ

Специальность 04.00.12 — Геофизические методы поисков и разведки месторождений полезных ископаемых

Автореферат диссертации на соискание ученой степени доктора технических иаук

Москва — 1993

Работа выполнена в Московском геологоразведочном институте

Научный консультант - чл.-корр. АЕН России, доктор физико-математических наук, профессор А.А.НИКИТИН

Официальные оппоненты :

В.И, АРОНОВ В.В. ЛОМ'ГАДЗК

Г,Ц. ТУМАРКИН

доктор физико-матоматическйх наук доктор технических наук чл.-корр. АЕН России, доктор физико-математических наук, профессор

Ведущее предприятие - Всероссийский научно-исследовательский институт минерального сырья (ВШУ)

Защита состоится " 20 " мая 1993 г. в 15 часов на заседании специализированного Сонета Д.063.55.03 при Московском геологоразведочной институте по адресу: 117485, г. Москва, ГСП-7, В"185, ул. Миклухо-Маклая, 23, ауд.6-33

С диссертацией можно ознакомиться в библиотеке института.

Автореферат разослан " /«2 " Р / J993 rv

Ученый секретарь специализированного Совота,

доктор Зиоико-матоматических------------------------ —

паук, профессор у/- Ю.й. Г>ЛО>

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность том». Одной из основных тенденций современного поискового процесса является переход к поискам сложных и слабо-коптрастшх по своим физичоским свойствам ; объектов с высоким уровнем помех. Это шзываот необходимость расширения комплексе поисковых методов, влечет рост обкома, разнообразия и сложности половых материалов. По количеству получаемых данных подущоо мосто во многих случаях занимают гоофизичоскио съемки. Широкоо и ос1'1>ок— тивиоо использование геофизических материалов может бить достигнуто прежде всого за счет развития теоретической Опои, технологического, методического и программного обеспечения разведочной геофизики. Актуальность исследований в указшпшх направлениях определяется следующими объективными факторами:

1- концепции изолированной аномалии и упрощенной функциональной связи аномалия-возмущающая масса порастала отвечать требованиям практики. На горный план вышла концепция целостного геофизического поля, структура которого рассматривается как основной источник информации о закономерностях размещения геологических объектов;

- подавляющая часть геофизических признаков, представляицих структуру поля и обеспечивающих оф1ю1стишгость опознв!гая искомых геологических объектов, нопосродствошю не) измеряется;

- низкоо отношение сигнал-ломоха затрудняет, а во многих случаях но позволяет использовать классические методы илтерпрота-ции, основашше на уравнениях математической физики;'

• - количество получаемых материалов тробуот создания специализированных средств сбора, регистрации, накопления и обработки данных на базо ЭВМ.

Указашше обстоятельства стимулировали развитие принципиально иных по сравнонюо с классическими подходов к интерпретации. Широкое распространенно получил вероятностно-статистический подход, доказавший свою высокую зффоктивяоеть в практике геофизических исследований при видсигении и восстановлении слабых аномалий,' решении ¡трямых и обратных задач.

Мощными, по к настоящему времени Далеко не использованными возможностями облпдяет подход, основанный на методах распознавания образов и обработки изображений геофизических полой.

О

Несмотря но глубокую теоретическую базу методов распознана шл, специфика материалов разведочной геофизики требует решени. серьозннх проблем, связанных с адекватным описанием пространственной структуры поля, формализации понятия объекта, выявления оптимального набора признаков и решающих правил в условия) ограниченной априорной информации, методов оценки аффективноста прогнозных построений.

Разработка атого направления позволяет надеяться на получение ваямых в теоретическом, методическом и практическом отношении результатов, обуславливающих повышение степени извлечения информации из данных комплекса геофизических съемок. Исследования I рамках указанного подхода неразрывно связаны с решением крупно* научной проблемы, заклмчащейся в разработке зф^октшзных математических, методических, программных и технологических средств дл> прогноза и поисков скрытых и глубоко залегающих месторождений.

Цель работы - разработать математическое обеспечение дам интерпретации комплексных геофизических материалов на основе методов распознавания образов и обработки изображений и создать компьютерную технологию ведения прогнозно-поисковых исследование па базе.персональных ЭВМ.

Основные задачи исследований.

1. Анализ методов интерпретации комплексных геофизическю данных на разных стадиях поискового процесса; обоснование методики применения аппарата распознавания образов и обработки цифровы) изображений геофизических полей при прогнозировании сложных геологических объектов.

2. Классификация методов и подходов к описанию пространственной структуры геофизических полей; разработка математического и алгоритмического обеспечения формирования признаковой пространства.

3. Исследование возможностей и эффективности различных методов описания структуры поля; обоснование целесообразности при:

' монешш различных признаков в сложных геолого-геофизических условиях.

4. Разработка я совершенствование методов принятия решени на основе статистического и дотермшшстского подходов к распознаванию.

• 5. Исследование и разработки методов выбора информативных признаков при ограниченной априорной информации; выявление оптимальных наборов геофизкчоских признаков с помощью имитоциошгого

МОДЭЛИрОВВ1ШН.

6. Разработки методов и алгоритмов оценки точности прогноз-лих построений. ;

7. Создание компьютерной технологии и автоматизированной системы обработки и шторпротации комплексных геофизических данных; разработка аффективных мотодше решения прогнозно-поисковых задач; внодрвнио автоматизированной системы и матоматичоского обоспечешя в учобпых, научных и нроизтодствошшх организациях.

' I

Научная новизна работы.

1Обосновано и разработана оЭДюктииная мотодика принятия прогнозных решвний на основа методов распознавания образов^! обработки цифровых изображений гсюфизичоских полой. Ео идоя заключается, в том, что компьютеризированный прогноз сложных гоологи-ческжс объектов слодуаг рассматривать как сопоиутюсть рошолий конкретных задач с однозначно заданными параметрами, а саму нро-додуру прогноза предлагается осуществлять методами вычислительного эксперимент) с обратной связью.

2. Проводона классификация методов описания пространствошюй структуры цифровых геофизических и геохимических полей, разработаны новые орнгиналышо алгоритмы вычисления количественных и ка-чествошшх признаков, отражающих основше компоненты структуры полой - состав, геометрию, морфологию и пространственные связи; исследовано их еффоктивность для различных сложных моделей изоб-ражо!гий.

3. Разработан математический аппарат и предложены новые нв-параметричоские алгоритмы выделения, распознавания и рашмрования объектов как по отдельным методам , так и по комплексу; экспериментально доказана их большая способность к обучению на ограниченной выборке по сравиошш с извостннми.

4. Ризработаны и исследованы повыв меры и правила оценки точности прогнозных построений, основанные, в частности, на определении стоноги приурочовдости ¡грогнозов к объектам контрольной выборки.

5. В рззультзте имитационного моделирования:

- установлена болоо высокая информационная ценность преобразованных гоолого-геофизических признаков по отношении к первичным, даны рекомендации по их использованию;

- исследована вычислительная сложность методов и критериев выбора информативных наборов геолого-гео^язических признаков, даны количественные» оценки трудормкости расчетов;

- исследованы условия существования оптимальных наборов признаков.

6. Разработана автоматизированная система обработки и интерпретации геофизических данных РАГОД, и на ее базе создана эффективная компьютерная технология, ориентированная на пользователя-интерпретатора. С. помощью системы РАПИД решены конкретные задачи гооквртировакия, поисков и прогноза месторождений полезных исконаомых.

Достоверность и оОос.новашюсть научных положений, выводов и рекомендаций подтверждаются достаточно большим объемом экспериментальных исследований; проверкой на математических и физико-геологичоских моделях, иматирущих основныо черты сложного строения реальных геологических объектов; положительным опытом внедрения ряда научшх положений работы при решении производственных задач.

Практическая ценность и реализация работы.

Автоматизированная система РАПИД, реализирующая разработанную компьютерную технологию на персональных ЭВМ, является мощным средством оперирования разнородной геолого-геофизической информацией и предоставляет пользователю практически неограниченные возможности моделирования и решения широкого круга задан обработки, интерпретации и визуализации результатов. Использование системы позволяет увеличить степень извлечения информации из данных комплекса геофизических съемок; повысить точность, надежность и полноту прогнозных решений; обеспечить оперативность и снизить затраты на обработку полевых материалов..

Ряд алгоритмов ранжирования зарегистрирован в государственном отраслевом фонде алгоритмов и программ. Алгоритмы описания структуры поля применяются в институте ВНШГеосистем, г.Москва для решмЕЫ прикладных задач. . Разработанное ' математическое

!

обеспеченно и рнмшо год» использовалось при прогнозировании сульфидно-ннколевого и родкомотальпого оруденения на Украинском кристаллическом щито и и севорном Казахстане; при поисках золота в западном Узбекистане, центральном и кислом Казахстане: при обработке геолого-гоофизичеепшх материалов провинции Юйинан (Китай). Первая версия системы РАПИД передана в ЫГ СССР в рампах выполне-1шя научно-исследовательских работ по государственной программе ШГГК "Геос". Система используется в тресте "Со иморнефте геофизика" (г. Мурманск Заполярной ГРЭ 1ГГ0 "Якутскгеология" Гг.Усть-Куйга;, государственном геофизическом предприятии "Дноп-рогоофиЬшса" f г. Днепропетровск,), внедренческом предприятии "Фирма ДЖЕЙС" (г. 'Днепропетровск; для рошония широкого круга задач.

Рёзультати исследований применяются автором и ого коллегами при обучении студентов в курсах "Теоретические основы комплексной интерпретации геофизических материалов", "Математические метода в геологии", при чтении спецкурсоп для слушателей факультета понише кия Квалификации Днепропетровского горного института.

Апробация работы. Основные теоротичоскио и методические результаты выполненных исследований докладывались на: 6-ом Всесоюзном совещании "Использование математических методов и ЭВМ при поисках и разведки месторождений" (Москва, 1977), Исосоюзной школе перодового опыта "Новейшие достижония в области техники и методики гравиразведочных работ, обработки и храпения гравиметрических материалов (Днепропетровск, 1978), школе перодового опыта МГ СССР и сессии Дальневосточной и Сибирской секций Междуведомствешюго Сово.та по проблеме! "Научные основы геохимических методов поисков месторождений н'олозних ископаемых" (Хабаровск, 1978), Всосогоной школе-семинаре "Теория и практика геологической инторпротации гравитациошшх и магнитных аномалий" (Алма-Ата, 1904), Всесоюзных кон^иронциях "Применение математических методов и ЭВМ при поисках и разводке полезных ископаемых" (Новосибирск, 197?, 1979, 198-1). Всесоюзной научно-методической конференции "Научно-методические основы применения елоктронной вычислительной техники, автоматизированных систем управления и проектирования и автомптизировншшх ооучащих систем в учооном процессо" (Рига, 1937), Всесоюзной научно-технической конференции 'Теофизичоскио методы изучения систем разломов земной' корн и принципы их использования для прогнозирования рудашх месторождений" (Диепро-

петровск, 1988), 4-ом Eco сотовом совещании "Теория и практике геохимических поисков в современных условиях" (Ужгород, 1933), региональной конференции "Экспортные системы в программе ГЕОС" (Новосибирск,' 1988), школо-семинарв "Статистические методы распознавания образов и компьютерной кластеризации" ("Киев, 1989), 4-ой Всесоюзной конференции "Математические методы распознавания образов" (Рига, 1989), Всесоюзном семинаре им.Д.Г.Успенского "Теория и практика геологической интерпретации гравитационных и магнитных аномалий" (Алма-Ата, 1990; Днепропетровск, 1991), научно-технической конференции "Проблемы создания универсальных баз данных в геологии" (Киев, 1990), Международном семинаре по статистическому прогнозированию минеральных ресурсов (г.Ухань, Китай, 1990), 24-й Всесоюзной школе по автоматизации научных исследований (Апатиты, 1990), Всесоюзной научно-технической конференции с международным участием стран членов СЭВ "Применение статистических методов в производстве и управлении" (Пермь, 1991).

Публикации. По теме исследований опубликовано 54 работы, в том числе 2 монографии в соавторстве, 4 брошюры ВИЗМС, статьи и тезисы докладов.

Структура и объем работы. Диссертация состоит из введения, четырех глав и заключения. Объем работы 260 страниц^ в т.ч. 42 рисунка, 10 таблиц, 7 приложений. Библиографический список включает 205 наименований.

Исходные материалы и личный вклад автора.

Диссертация отражает результаты исследований, проводившихся автором в 1977-1992 гг. по госбдцжотной и хоздоговорной тематике на кафедре геофизики и проблемной научно-исследовательской лаборатории Днепропетровского горного института, а' также во время обучения с 1990 года в докторантурэ Московского геологоразведочного института.

Большинство теоретических, методических и технологических исследований выполнены лично автором. Часть алгоритмов ранжирования разработаны совместно с Н.К.Ступаком и Е.А.Семенюком. В обосновании методов выбора информативных признаков, проведении математического моделирования, написании и отладив функциональных

программ принимала участио Л.В.Мирошниченко. Большая часть работы по программной реализации ввтоматизироншшой системы как единого интегрированного пакета, включая базу данных, диалоговую сроду, графические и сервисные процедуры выполнена под руководством автора С.В.Сорегиним, С.В.Яковлевым, А.Л.Шшриым. Боа их помощи создание законченного программного продукта было бы невозможным.

На разных этапах работы ,в избранном направлении автор использовал помощь, советы, консультации и доброжелательную критику сотрудников геологоразведочного факультета ЛГИ Г.Я.Голиздры, А.Д.Додётко, К.Ф.Тнпкшш, о таюко специалистов производстввшшх ¡.•рганизоций, НИИ и вузов: М.Д.Бвлшшш, А.А.Дорягина, Б.И.Журбиц-кого, Л.А.Линцора, А.Н.Кленчина, Г.П.Полуариинова, С.К.Сакояна, С.А.Сандомирского, А.В.Тарханова, Г.Ц.Тумаркина, М.М.Чагшш, Е.И.Чоромисиной, Д.НЛучадоева, Т.К.Янбухтина. Во время пробыва-ния в докторантуре МГРИ большую помощь автору оказали Ю.1С£ !!лох, Г.В.ДоМура и А.В.Петров. Всом указанным лицим автор выражаот свою глубокую признательность., Особую благодарность автор приносит научному консультанту А.Л.Никитину, постоянное общение с которым при выполнении работы было исключительно творческим и конструктивным.

СОДЕРЖАНИЕ РАБОТЫ

В диссертационной работа последовательно защищаются следующие основные положения.

. 1. Методы распознавания образов как сродство комплоксирова-ния структурных описаний: цифровых изображоний геофизических полей могут зффоктивно применяться на псих стадиях поискового процесса, однако их использовании наиболее целесообразно на стадии дотэль-1шх поисков в сложных гаолого-гоофизичвсиих условиях, что предопределяет принципы формирования признакового пространства и пост[юо;шя процодур принятия прогнозных решений. •

Проблема прогнозной оценки и выявлошм закономерностей ггро-странствешгаго размещения полезных ископаемых на всех стадиях поискового процесса неразрывно связлни с возможностями различных гоолого-геофлзических методов, контролируют1« по совокупности факторов местоположение искомых объектов. В нестоящее время прак-

■гика поисков в значительной стопони опирается на факторы структурного контроля. Но умаляя роли других, большинство исследователей отмечает их принципиальное значение в размещении и локализации месторождений (Боровко, 1979; Вогацкий, Коллеганов, Суганов, 1976; Бродовой, 1984; Будянский, 1985; Вахромеев, Давыденко, 1987; Красовский, 1989; Островский и др., 1986; Тяшшн, Гонтарен-ко, 1990). Водущая роль при выявлении структурных факторов принадлежит площадным геофизическим съомкам.

Структурный подход к прогнозировании по геофизическим данным базируется на предположении, что элементы земной коры,контролирующие закономерности размещения и локализации месторождений, отражаются в составе, интенсивности, морфологии, геометрии и пространственных взаимосвязях изучаемых полей. Совокупность указанных факторов' рассматривается как структура геофизического поля. Анализ структуры поля, выявление его пространственной организации становится дополнительным источником информации для проникновения в геологическую сущность геофизических явлений ССемондуев, 1983).

В главе рассмотрены особенности структурного подхода нв разных стадиях прогнозно-поискового процессе. По задачам и методам их решений процосс поисков представлен в виде трех этапов: предварительного (рекогносцировочного,) - .масштаб 1:1000000 1:100000, картировочного (1:50000 - 1:25000) и этапа детальных поисков (1:1ОООО и крупнее;.

На предварительном этапе непосредственными объектами сравнения и оценки являются карты геофизических полей, основная процедура интерпретации которых заключается в визуальном анализе и сравнении их с такими же картами изученных районов. При втом геофизические карты рассматриваются, по существу, как плоские изображения трехмерного поля, где объектами сравнения служат отдельные линии, отрезки, замкнутые фигуры и их различные комбинации.

На картировочном этапе объектами сравнения являются, геофизические аномалии и отвечающие им геологические тела. Здесь можно выделить два подхода, которые по классификации В.Н.Страхова (1987) соответствуют двум парадигмам комплексной интерпретации геофизических данных. Первая основывается на решении прямых и обратных задач и подборе геологических моделей, удовлетворяющих наблюденной картине физических полей. Результаты интерпретации переносятся на изучаемую территорию через содержательные модели геологической среда.

вторая Парадигма базируется на методах распознавания образов, при использовании которых основноо внимание акцептируется не на иэучошщ гоологичоского строения, в на установлении прямых связей между структурой геофизичоских полей и расположенном искомых геологических объектов.

На отапо дотплышх поисков подходы, осповшншо на решении прямых и обратных задач в целях изучения геологического строения практически но применимы. Ото связано с тем, что существует масштабная граница для классических методов интерпретации геофизических жшоршшй, поскольку при летальных'и высокоточных съемках понятно аномалии теряет определенность. Главной задачей на отом этапе яйляотся выянлонио наиболоо перспективных мост заложения поисковых скважин с учотом геологических фактов, получаемых в процессе бурония.

Исходя из существования структурных закономерностей размещения месторождений мотодику поисков н рамкпх второй парадигк^ можно ориентировать на использование понятия "благоприятная гоологи-чоская обстановка". Поскольку гоофизичоскио ноля являются отражением геологического строения изучаемой территории, то любую точку земной поверхности можно описать в терминах структуры геофизических полой. Для этого вводится понятно "гоофизичоская обстановка" в окрестности этой точки, которая по существу подмоняот собой гоологичоскую обстановку и сама становится предметом исследования . '

Под описанием геофизической обстановки понимается получение совокупности количествешпи и/или кочостшшшх признаков, характеризующих структуру поля в пределах окрестности - некоторого связного подмножества точек сети наблюдений, являющегося объектом прогноза. В результате описания знпчония исходного шля прообразуются в таблицу тина "объект - признак", каждая строка которой соответствует точно сети наблюдений, а каждый столбец - значению отдельного признака, вычисленного в продолах окрестности. Том самым осуществляотся формализация понятия геофизической обетанов;си, а для изучошш отношоний между объектами используется соответствующий математический аппарат.

1! такой постановке задача прогноза по гоофизичоским дашшм можот рассматриваться как задача анализа и распознавания изображений (Аписимов и др., 1983; Островский и др., . 1986; Прзтт , 1982; Ширяев 1984). Формально изображение .определяется как ноко-

торая действительная функция двух шромошшх Р(х,у), обладающая необходимыми аналитическими свойствами. Для обработки на ЭВМ изображоние обычно представляется в виде массива значений поля заданного на целочисленной решетке. Вти значения называются элементами изображения, в соответствующая решетка носит название цифрового изображения.

В главе г анализируются способы представления объектов и рассматриваются особенности описания, определяемые сложностью геологического строения, стадией и масштабом проведения работ, физической природой поля и т.п. Поскольку реализация определенных процедур обработки и анализа изображения привязано к специфическому виду представления объекта (дискретные точки, линии, однородные области), то при работе с одним изображением приходится иметь дело с несколькими его моделями (Журавлев, Гуревич, 1989).

Проблема принятия решений при распознавании изображений геофизических полей определяется постановкой конкретных задач и характером априорных данных. Поскольку результату полевых измерений и получаемых на их основе трансформаций неизбежно подвергаются случайным возмущениям, то наблюдения оказываются реализациями случайных величин, в силу чего результат распознавания также может рассматриваться как случайная величина. Отсцца вытекает, что принятие решений при геофизическом прогнозировании обычно связано с исследованием случайных отображений и требует привлечения методов, базирующихся на статистической теории распознавания (Голь-. цман, Калинина, 1983; Дуда, Харт, 1976; Классификация.., и кластер,...,1980; Никитин, Петров, 1990; Николенко, 1980; Фомин, Тарловский, 1986). . ,.

Вместе с тем дефицит эталонных объектов, характерный для крупномасштабных исследований, затрудняет, а нередко делает невозможным корректное применение статистических методор. В таких случаях целесообразно использовать эвристические детерминистские алгоритмы, основанные на различных видах расстояний и мер сходства (Алексашин, Клюев, Никитин, 1991; Браверман, Мучник, 1983; Вудянский, 1987; Воронин , 1989; Каратаев, Лобовкин, Фуре, 1984; Коваль и др., 1985; Марченко, 1988; Савинский, 1978; Ступак, Бусыгин, Семонюк, 1979; Черемисина, 1972).

С долью оценки влияния комплексирования с помощью методов распознавания, в работе даны аналитические выражения количества информации, извлекаемой из данных геофизических съемок для случа-

- ¿о -

ев т°комплексных величин и п многократных измерений случайной величины. Сделан вывод, что в плано повышения степени извлечения информации комплоксироввние всегда эффективнее многократного дублирования .

Выдвлено три типа задач распознавания;

1) задано множество классов П, пространство признаков X, требуется найти решающее правило й, минимизирующее затраты С. Это задача распознавания при наличии обучения, частным случаем которой является рашмрованио - упорядочение объектов по покоторой мере сходства относительно заданного класса.

В) задано множество классов П, решающее правило П, требуется найти систему признаков X, мшшмизиругацую затраты С. Это задача минимизации пространства признаков.

3) задано пространство признаков X, тробувтся найти множество классов П и решоющоо правило Д. Это задача кластеризации -разбиения объектов на некоторое, в общем случае шзаданнйэ число классов в соответствии со свойствами самих объектов.

Поскольку четверка множеств ГХ,Б,Н,С.) характеризует тш задачи' распознавания формально, т.к. не учитывает связи между входя-цдами в нее величинами, то в работе рассмотрена целесообразность использования различного рода гипотез, определяющих выбор алгоритма и качество решетя задачи распознавания.

Неотъемлемой частьи распознающей системы является обучение, имеющее конечной целью формирование эталонных описаний классов, форма которых; определяется ■ способом их использования в решающих правилах, а также выбор информативных признаков для распознавания.. В этой связи■проанализирована специфика задания классов ата-лонных объектов при геофизическом прогнозировании, основанных на принципах эквивалентности, толерантности и сходства и рассмотрены на содержательном уровне элементы.обучения.

В реальных условиях процесс геофизического прогнозирования обычно на может быть сведен к выполнению только одного типа задач. Масштабы проведения работ на каждом этапе, слабая представительность, а нередко и отсутствие эталонных объектов искомого класса приводят к необходимости последовательного выполнения нескольких операций. Опираясь на работы Ю.А.Воронина и представителей его школ; (Будянскяй, 1987.; Воронин, 1982; Добрынин, Чере-миешэ, 1988) 'процесс геофизического прогнозирования на каждом этапе можно свести к выполнению трех основных операций:

1) выделение на территории поиска множества всех объектов среди которых могут оказаться искомые;

2) разделение множества выделенных объектов на несколько классов;

3) упорядочешю объектов искомого класса по перспективности.

С формальных позиций операция выделения может быть интерпретирована как ' задача нахождения в некотором смысле аномальных и фоновых -объектов, не представляющих практического интереса. Подразумевается,, что выделенные аномальные группы включают объекты разных классов.

Операция разделения сводится к задачам распознавания или кластеризации совокупности выделенных аномальных объектов.

Операция упорядочышя выполняется посредством ранжирования объектов одного класса, полученных в результате разделения.

При выполнении указанных операций методы распознавания, как правило, используют принцип аналогий. В то же время ряд специалистов отмечает важность применения принципа аномальности (Бекжа-нов, Бугаец,.Лось, 1987). В единой процедуре прогноза целесообразно использовать оба принципа. Так операция выделения, как правило, должна базироваться на принципе аномальности, а операции разделения и ранжирования могут широко .использовать принцип аналогий .

2. Разработанные методы и алгоритмы описания структуры цифрового изображения геофизического поля позволяют выявлять широкий спектр его морфологических и геометрических особенностей и учитывать как иерархичность структуры поля, так и пространственные от-ношешш между элементами этой иерархии на всех стадиях исследований, что в конечном счете приводит к увеличению объема полезной информации о закономерностях размещения искомых■ геологических объектов. .

Вопросам анализа и описания структуры цифровых геоизображений посвящено большое число публикаций ( Викторов, .1986; Воронина, Лаламарчук, 1937; Горолик и др., 1990; Гуревич, 1988; Каратаев, Лобовкип, Фуре, 1984; Кучай, Чучадеов, Ким, 1986; Ласточкин, 1991; Орлов, 1982; Островский, Ратушшй, Смушкович, 1986; Шлезингер, 19Ю; Ш СШ)]ьп, 1992). Описанию и распознаванию геоизображений ооычно предшествует предварительная обработка, имеющая

цэлыо решение, двух основшх задач: 1) "улучшение" качества изображения, под которым понимается набор различных операций, изменяющих некоторые свойства изображения; контрастность, зашумленность, размытость и т.п.; 2) разбиение исходного изображения на однородные области, каждая из которых обладает каким-то особым свойством - сегментация. Частным случаом последней является бинаризация, в результате которой каждый элемент изображения пришма от значение 0 или 1.

В главе рассмотрены различ1ше метода предварительной обработки, включающие фильтрацию, контрастирование и выдоленио контуров. Приведены линейные и нелинейные методы контрастирования, сиущестэляоше, в частности, с помощью операций свертки фрагмента исходного изображения с курсовыми градиентными масками, а также с маской оператора Лапласа и корреляционной маской. Указанные процедуры Позволяют выделить различные лшюйзше структуры типа роз- , рывных|нарушений, осой складок и т.п.

Для улучшения визуального восприятия изображения разработан алгоритм, основанный на идее теневого представления изображения при имитации освещения ( Harn, ВасТшт, 1978; Kawalllt, Gleim, 1987). Предполагается, что трехмерное изображение освещается бесконечно удаленным источником света. Яркость в каждой точко изображения считается пропорциональной косинусу угла между направлением на источник и вектором, перпендикулярным к поверхности рельефа в данной точке. На карте яркости "тони" от источника не только хорошо выделяют рельеф изображения, но и показывают детали, нв видимые при обычном изолинейном представлении.

.Проведенный анализ методов бинаризации, позволил установить, что основная проблема заключается в выборе порога, определящего разбиение функции интенсивности нв ■ два уровня. С целью обхода этой проблемы предложен алгоритм, базирующийся на аппроксимации фоновой составляющей поля двумерной поверхностью, определяемой второй производной функции интенсивности F(x,y). При атом бинарное изображение B(i,J) = 1 при F(x,y)> Щ(х,у) и нуль в остальных случаях. Здесь F-$(x,y) - фоновая составляющая, проведенная по точкам перегиба функции Р(х,у). Поскольку при обработке реальных изображений в геофизике точки перегиба существуют всегда, то алгоритм позволяет выделять бинарные изображения дежэ слабых аномалий.

В работе дана классификация методов и алгоритмов, пригодпых

для описания геоизображоний. В основу классификации положено два критерия: целевое назначение описания и форма представления изображения (рис.1). Выделено четыре основных подхода к описанию.

Функциональный подход рассматривает изображение как вещественную) функцию одной или двух переменных и ставит целью выявление критических точек этой функции и ее морфологических особенностей.

При статистическом подходе изображение в целом считается представителем определенного статистического ансамбля, . а в качестве описания рассматриваются различные статистические оценки параметров этого ансамбля.

Корреляционно-спектральный подход базируется на аппарате корреляциошго-спектрального анализа в пространственной и частотной областях.

При геометрическом подходе имеют дело с объектами, контуры которых предварительно выде'лены на изображении и определяют свойства атих объектов, не зависящих от уровня амплитуд.

Вне зависимости от применяемого подхода общая схема построения признаков- следующая. Пусть наблюденное физическое поле задано на равномерной прямоугольной (квадратной} сета. Для каждой точки сети строится система вложенных окрестностей линейной или прямоугольной формы. Размеры окростноотей по горизонтали N и вертикали Н выражаются нечетным числом точек сети. Для каждой окрестности вычисляются определенные признаки, из которых формируется вектор, имеющий фиксированную структуру. При необходимости процодура повторяется для других исходных полей, так что точке сети ставится в соответствие вектор признаков

(п,ш)-- <„.,,,

р

Размерность р вектора. X = (Х1, Х2,..., ) зависит от количества полей, числа.окрестностей по каждому полю и числа вычисляемых но каждой окрестности признаков

к Н Р = £ Е- ^(к),

I= «

где - число признаков 1-ой окрестности й-Го поля, I - чис-

ло окрестностей ?с-го поля, К - число полой.

Поскольку признаковое описяшю в значительной степени определяется размером и количеством окрестностей, то в работе проддхь

ОПИСАНИЕ ОБЪЕКТОВ

I. Целевое назначение описания

Геометрия

II. Форма представления исходных данных

III.

Г~

Контурная, реке матричная

Основные подходи к описанию

Функциональный

X

Функциональный

с; 'й

д

33 Л с:

о ё

с: я

о

23

о В*

н Э

о м А

Я а

Статистический

Корреляционно-спектральный

Геонетрический

* 1

я 3 35 я

и мч О Л

ж я с;

< я я <

а. 'Е- я;

и и с; 1-

о * ы «

н и М

н в< С

N о и

« а

§ ж

Э и

« м

П т

ы 5ч

г и

о

ч, =;

н о

м в

г о Е-.

Рис. 1. Схема классификации методов описания

жен метод нахождения указанных факторов, основанный на выявлении индикаторных частот. Последние определяются как частоты, для которых величина амплитуды гармоник спектра профиля, расположенного над искомым объектом, претерпела наибольшее'изменение при "изъятии" искомого возмущающего объекта.

В рамках функционального подхода разработаны следущие

Признаки местоположения. Предназначены для описания взаимоотношений элементов изображения на окрестности в пространственных координатах и характеризуют местоположение центра объекта, относительно особенностей поля (критических точек;. В одномерном случав в качестве особенностей поля принимаются экстремумы полинома среднеквадратичного приближения функции третьей степени. Далее вычисляются линейные расстояния (с учетом знака, характеризующего положение критической точки относительно центра окрестности - хо) от точки х0 до абсцисс соответствующих особенностей - максимума, минимума и точки перегиба. Повторение процедуры для совокупности вложенных окрестностей приводит к набору признаков, описывающих взаимоотношения структурных элементов различного порядка.

В двумерном случав значения Р(х,у) аппроксимируются полиномом второй степени U(x,y). Далее находятся точки (х0,у0) в которых возможно наличие экстремума:

Lfro'Vj ' U\(Xc,>yJU\ (Xo-yJ ~ ' Ку(Ха>Уй>У- " Q3'

К К -

анализ которого дает возможность определить точки вкстремума ("минимум и максимум;. Совокупность пар координат, фиксирующие екстремвлышв значения поля для данной окрестности, представляет собой вектор признаков {(хО,уО)1Юх,(хО,уОЩп) точки - центра окрестности.

К достоинствам этой системы признаков относится возможность выявления взаимосвязей структурных особенностей объектов на локальном и региональном уровнях, однородность единиц измерений, инвариантность к уровню постоянной фоновой составляющей.

Дифференциальные признаки предназначены для учета интенсивности и морфологических особенностей .изображений. Являются аиало-

системы признаков.

Затем вычисляется определитель матрицы Гессе

гами некоторых извостннх трансформаций физических полей. Формируются из коэффициентов полинома среднеквадратичного приближения второй степени на прямоугольной окрестности. К ним относятся: средняя интенсивность поля, модуль горизонтального градиента, дивергенция градиента (аналог второй вертикальной производной^, смотанная производная, среднее сумма квадратов отклоне- ^ ний от аппроксимирующей поверхности, направление горизонтального "" градиента, разность средних по окрестностям или их периметрам.

Признаки типа особенности предназначены для описания и типизации особенностей фрагментов изображений. Реализованы в трехмерном и двумерном (плоском; варианте. В первом случае исходное поле Р(^,у) на окрестности ЯхМ точек аппроксимируется полиномами, соотвотствувдим особенностям вида: максимум, минимум, седло, обезьянье седло, желоб, скрещенные желоба. Вектор признаков формируется несколькими путями, в частности, составляется из ошибок приближения, опредэлящих степень соответствия функции одной из вышеописанных особенностей; выражается целым числом - кодом особенности, характеризующейся минимальной величиной ошибки аппроксимации. Во втором случае исходное, изображение рассекается горизонтальными плоскостями по разным уровням интенсивности; для каздого из них рассматривается кривая второго порядка, которая находится в результате аппроксимации по точкам (а 1=1,2, ...,1 '- число уровюй. Затем вычисляются инварианты, на основании которых определяется тип кривой: 'эллипс, парабола, гипербола, йара пересекающихся прямых, пара параллельных или сливающихся прямых.

. Морфологические признаки предназначены для формализации понятий морфометрии: плато, склон, холм, впадина, ров, вал, овраг, отрог. На квадратной окрестности последовательно прослеживаются четыре направления, проходящие через центральную точку. Для каждого направления строятся полиномы среднеквадратичного приближения первой и второй степени, анализируются их коэффициенты и каждому направлению ставится в соответствие определенный код. Совокупность четырехзначных кодов представляет вектор признаков. Система признаков инвариантна относительно растяжений и вращений, кратных 45 градусам.

В рамках геомотрического подхода проанализированы существующие методы и алгоритмы и предпожена система интегральных признаков, инвариантных к сдвигам, поворотам и однородным изменениям

масштаба изображения. Построение такой системы базируется на комбинации двух методов: инвариантных контурных моментов и интегральных функционалов и заключается в построении интегральных сумм по конечному числу значений интенсивности изображения на окрестности.

В диссертации приведены результаты экспериментов по классификации и типизации с помощью описанных систем признаков 63-х цифровых модельных изображений, отвечающих следующим морфологическим типам: склоны (прямые, вогнутые, выпуклые,), плато, валы, рвы, холмы {в т.ч. вытянутые}, впадины (в т.ч. со смешением}, овраги и отроги разной крутизны, желоба вогнутые и выпуклые. Эксперименты на указанных моделях, подвергнутых преобразованиям типа вращения, растяжения и сдвига, показали высокую эффективность разработанных систем признаков.

3. Процесс принятия решений при прогнозировании следует рассматривать как сложную итерационную процедуру, вклвчащую три взаимосвязанных этапа обучения распознающей системы: построение решающего правила, выбор информативных признаков, оценку качества прогноза. Разработанный математический аппарат дает возможность аф})ективно строить процедуру обучения;' получаемые в результате информативные комбинации геофизических признаков позволяют увеличить точность прогнозных построений и значительно сократить вычислительные затраты.

В настоящее время при автоматизированном прогнозировании применяются различные подходы к распознаванию: статистический,' детерминистский, лингвистический (структурный}, логико-комбинаторный (Бугаоц, Дудокко, 1976; Бусыгин, Мирошниченко, 1991; Вап-ник, Червоненкис, 1974; Веселов, Гинатуллин, Кленчин, 1988; Горолик, Гурович,' Скрипкин, 1985; Дуда, Харт, 1976; Крампит,. Никитин, 1992; Овечкин, Сакоян, 1988; Федосеев и др., 1980; Рвудис, 1990; Родионов, 1991; Сиротинскоя, 1986; Ту,, ГонсаЛес, 1978; У/а1азшЬр, 1981, 1983).,

Разработанный.в диссертации математический аппарат принятия рошоний базируется на статистическом и детерминистском подходах к распознаванию, как нвиболео близко отвечающих специфике геофизического прогнозирования. В работе последовательно проводится идоя, что шюгьомломой частью процедуры распознавания является обуче-

нив, которое имеет конечной целью получение ответов на следующие вопроси:

1) сколько и каких признаков требуется для • описания объектов?

2) какого объема и состава должна быть обучающая выборка?

3) какие решающие правила использовать?

В связи с этим, в главе рассмотрены метода построения решающих правил, выбора информативных признаков и оценки качАства прогноза. Проанализированы наиболее известные алгоритмы статистического распознавания в параметрической и непарамотрической постановках, базирующихся на байесовских решающих функциях

где Р(%1 ) - априорная вероятность появления класса т.; -

плотность распределения^класса в р-мерном пространстве. Отмечено, в частности, , что оптимальность получаемых (на основе байесовских'; решающих функций весьма условна. Параметричоскио методы дают приближенные результаты потому, . что основаны на упрощающих предположениях' • относительно статистических характеристик исходных данных, а приближенность нэпараметрических - обусловлена упрощающими предположениями относительно формы решающей функции и неточностью процедуры восстановления функций по обучающей выборке. Характеру задач распознавания при геофизическом прогнозировании больше соответствуют нвпарамотрические мотоды. Это обусловлено трудностями оцешш неизвестных параметров величин по обучающим выборкам малого объема. Кроме того, нот оснований ожидать, что функции распределения данных окажутся унимодал'ышмн. Полимодальные жз распределения очень неудобно восстанавлипать параметрически. Поэтому непараметрическиа методы, на зависящие от гипотезы о виде функции распределения данных, в случав малой обучающей выборки являются более предпочтительными.

В главе приведены разработанные' автором нвпарамотрические решающие правила, а также разработанные совместно с Н.И.Ступшсом и Е.А.Семонюком алгоритмы ранжирования обгоктов относительно одного и двух классов, основошше на морах сходства: функция миры блио^рти, угловая мора подобия, проекция на подпространство линейно независимых объектов-обучающей-выборки,, проекция па лнп.ы, соединяющую наиболоо "удплшпшо" объекты двух классов. Эксперименты на модульных материалах Показали их высокую способность к

обучении при ограниченной обучающей выборке.

Для бинарных данных автором разработан алгоритм ранжирования, основанный на учете мэры частоты совместной встречаемости бинарных признаков.

Для решения задач кластерного анализа в диссертации приведен модифицированный алгоритм ИЗОДАТА, осуществляющий процедуры объединения, разбиения, добавления и поиска ("Ту, Гонсалео, 1978). На первом шаге средние вектора классов задаются произвольно и каждый вектор относится к кластеру, определяемому ближайшим средним вектором с последующим вычислением новых средних. Итерационный процесс заканчивается по достижению локального минимума средних расстояний между векторами. Для определения "правильного" числа кластеров используются критерии, основанные на соотношении следов межгрупповой и. вяутригруиловой матриц рассеяния. По достижению максимума критерия на соответствующем шаге алгоритме вычисляется среднее значение расстояния Бхаттачариа по всем признакам. Признаки, у которых это расстояние превышает среднее значение, оставляются для проведения окончательной кластеризации, остальные отбрасываются. Получаемое при этом сокращение числа признаков обеспечивает более плотную кластеризацию и способствует уменьшению объема вычислений. -

Для решения задачи выделения аномальных объектов из совокупности исходных в диссертации приведен алгоритм, базирующийся на применении расстояния Махаланобиса, работу которого можно интерпретировать как построение оценки функции плотности' распределения неперспективного (фонового} класса и отсечение "хвостов" функции, соответствующих искомым аномальным объектам.

Применение методов распознавания неразрывно связано с выявлением и использованием в решающих правилах наборов информативных признаков. Под минимизацией размерности признакового пространства понимается отображение исходного пространства в пространство меньшей размерности: без потери полезной информации. В результате проведенного анализа выделено три группы методов минимизации:

1) представление данных в пространстве меньшей размерности, определяющееся оптимизацией некоторой функций критерия, не учитывающей в явном виде классовую структуру объектов (метод главных компонент, факторный анализ, кластер-анализ для признаков, метод корреляционных плеяд и др.};

2) преобразование признаков для распознавания (методы апп-

роксимацяи функциями, метода, основанные на дискриминантшх критериях разделимости классов и др..);

3) выбор информативных признаков из совокупности исходных (последовательный поребор, случайный поиск и его модификации).

В диссертации приведена развернутая схема классификации методов, основанных на таком делении и рассмотрены, методы и критерии выбора, сокращающие поребор вариантов. В рамках метода ранжировки, независимых признаков предложен алгоритм, опирающийся не использование знаний эксперта. При этом эксперт ограничивается только качественным сравнением, т.е. установлением бинарного отношения "лучше - хуже" (отношения доминирования по информативности) между любыми двумя признаками. Задавая бинарное отношение на множестве всех пар признаков, эксперт не обязан производить ранжирование всей совокупности признаков в целом, что является гораздо болев сложной задачей. В основа алгоритма лежит аппарат матриц доминирования (Кемени, Снвлл, Томпсон, 1965).

Для методов ранжировки, последовательного присоединения, последовательного отбрасывания, случайного поиска, случайного поиска с адаптацией приведет аналитические4 выражения фактической трудоемкости для линейного классификатора и представлены результаты сравнения их вычислительных затрат.

В главе рассмотрены различные подходы к оценке качества прогноза с учетом специфики прогнозно-поисковых работ, и дано определение качества. В результате проведенного анализа все оценки подразделены на:

- экономические,' призванные установить ценность (экономический эффект) от Использования прогнозной информации лицом, принимающим решение;

- научные, касаадиося степени соответствия прогнозов полученным впоследствии результатам.

В рамках научного подхода указаны основные атрибуты прогнозов (точность,- надежность, разрешающая способность) и даны характеризующие их меры оцонки качества. Выделено две гругтн мор; отражающие степень "уверенности" распознающего алгоритма при принятии решений (например, в видо мер сходства) и но обладающие такой способностью. .

Первая группа базируется на подходах, разработанных и рпмкох теории субъективных вероятностей (Груза, Ранькова, 19Ш). В эт>;м случае прогноз представляет каглчествошю пироаннун стак;ш> yv.it-

— (ЬЧ —

ренности прогнозиста относительно осуществления каждого из воз-ножных событий Ф .

к

Пусть Р = (Р,, Р,,..., Р.), Р. > 0, 2 Р. = 1 - истинное

1=1 Л

мнение прогнозиста, тогда субъективное математическое ожидание меры качества прогнозов 3(Я,Р) для данного прогнозиста выража-

к

ется как 5(7?,Р; = £ Р С позиций математической статисти-

ки Р = ГР1, Р8,...„ Рк) представляет собой закон распределения

дискретной случайной величины а Я = (г , г2,,.., гк) - оценку

Р, полученную в результате прогноза на имеющейся выборке. С этой точки зрения назначение правила оценки сводится к тому, чтобы показать по денным прогнозов и осуществившихся впоследствии событий Ф^, насколько хорош вектор Я в качестве оценки Р.

В главе приведет различные правила оценки и даны примеры, подтверждающие их эффективность при геофизическом прогнозировании.

Меры оценки качества второй группы предназначены для использования в случае, когда пользователь не имеет другой информации кроме номера класса. Наиболее распространенными критериями качества в этой ситуации являются"'величины ошибок первого и второго рода, подсчитываемые на объектах обучайщей или контрольной выборок.

Для оценки статистической значимости прогнозов в диссертации предложено использовать дискретные распределения'. (гипоргеометри-ческое, биномиальное, Пуассона;, позволяющие оценить вероятность случайности прогнозных решений.

Если большинство прогнозных точек не попадают непосредственно в контуры объектов контрольной выборки, но при этом наблюдается тенденция их группирования в пределах контролирующих геологических структур, то критерий оценки качества предлагается- формулировать на основе понятия приуроченности. Для этого рассматриваются две функции. Первая К(р) отражает процент прогнозных точек данного класса, расстояние от которых до ближайшего конт-ролыюго объекта на территории исследований не превышает некоторой величины р. Вторая Я^'р; является аналогом первой для соответствующего числа случайных точек, равномерно распределенных по территории.

Совокупность прогнозных точек считается приуроченной к контрольным объектам, если для достаточно большого отрезка ро í р í pt выполняется условна

ЕЯ^(р) < Щр)

' Р{]П^(р) - Hí^(р)| > |fЦр) - M5fp;|i < е

где EN^(p) - математическое ожидание функции Р(А) - веро-

ятность события А.

В диссертации разработан алгоритм и приведен примор иллюстрирующий придананив предложенного критерия.

Качество задач распознавания при геофизическом прогнозировании определяется влиянием множества факторов: объемом обучающей выборки, числом классов, .решающими правилами, размерностью признакового пространства, характером исходного материала и т.п. В главе приведены результаты имитационного моделирования по оценке влияния перечисленных фысторов при обучении распознающей системы, выборе информативных признаков и решении задач прогнозирования. Эксперименты проводились на специально сконструированных математической и физико-геологических моделях. \

Сконструированные модели позволили провести широкий спектр экспериментов по выявлению оптимальных методов описания структуры поля при наличии ("отсутствии J регионального фона и случайных помех, влиянию комплексировяния на качество прогноза, выбору наиболее информативных наборов признаков, определению аффективноети разработанных правил принятия решений, исследованию методических вопросов и т.п.

Краткие выводы по результатам экспериментов сводятся rf следующему. .

1. Многие метода выбора признаков и построения решающих правил имеют лишь теоретический интерес, а их оптимальность справедлива только для некоторых известных распределений. В реальных условиях преимущество теоретически обоснованных методов по отношению к эвристическим требуется доказывать экспериментально.

2. Качество распознавашя во многом обусловлено возможностью детального анализа структуры классов. Поэтому при выборе призма-ков целесообразно использовать методы диалогового типа, позволяющие человеку участвовать в процессе машшшого прообразон.'шня.

3. Выдолонио отдельных процедур по выбору ин'К.рчатпшшх

признаков и построению решающих правил не всегда целесообразно. Наилучший выделитель признаков должен быть и оптимальным классификатором.

4. Оптимальный набор признаков безусловно существует. Как при сжатии, так и при расширении этого набора понижается качество распознавания. В различных физико-геологических условиях выявляются разные наборы признаков, определяемые целевой постановкой задачи, параметрами решающих правил, объемом 'и составом обучающей выборки.

5. Ранжированные комбинации признаков следует рассматривать с учетом всего комплекса условий, влияющих на качество распознавания. Информативность отдельного признака зависит от набора признаков, участвующих в процессе распознавания. Попытки приписывать выделенным формальным путем признакам функции поисковых критериев в большинстве случаев не оправданы. Речь должна идти о диагностирующей информативности. Содержательный смысл последней может прядать только тщательный предметный анализ.

6. Близкая к нулю величина ошибки, полученная скользящим экзаменом на ограниченной обучающей выборке, не всегда свидетельствует о высоком качестве прогноза. В этом случав при выборе информативного набора необходимо учитывать ошибки на контрольной выборке. Для получения реальных значений в состав обучающей, выборки необходимо включать объекты, находящиеся в различных структурных условиях.

7. При ограниченной обучающей, выборке следует. руководствоваться правилом: чем меньше эталонов, тем меньшее число признаков необходимо использовать, поддерживая тем самым представительность выборки.

8. Прогноз объектов, находящихся на разной глубине и контролируемых региональными факторами, целесообразно осуществлять с одновременным использованием нескольких независимых систем признаков по комплексу физических полей.

9. При фиксированных системах признаков и решающих правилах качество прогноза определяется составом эталонной выборки. Обучение на высокоаномальных объектах подавляет особенности структуры полей и резко ухудшает качество прогноза.'

В диссертации полученные выводы обосновываются расчетами, таблицами, графиками, прогнозными картами.

4. Автоматизированная система РАПИД, включающая разработанное математическое обестечение, и созданная на ее базе компьютер-пая технология являются мощным и гибким ' средством комплексного анализа геолого-геофизич8ских материалов, обеспечивающим повышение степени извлечения информации из данных геофизических наблюдений, увеличение оперативности и достоверности прогнозных построений.

В связи с широким внедрением в практику прогнозно-поисковых исследований средств вычислительной техники, все большое значение приобретают вопросы создания математического и программного обеспечения для автоматизации прогнозных построений. Большой вклад в решение этих вопросов внесли В.И.Аронов, М.Д.Бвлонин, Д.Н.Боляшов, А.Н.Бугаец, В.А.Вудянский, Г.И.Каратаев, В.В.Ломтад-зв, В.В.Марченко, А.А.Нгчитин, Э.Я.Островский,- М.М.Чагин, Е.Н.Че-ремисина. Вместе с1 тем бурный рост числа персональных компьютеров и оснащение имя коллективов полевых партий,- экспедиций, научно-исследовательских груш НИИ и ВУЗов потребовали создания специализированных программных комплексов, обеспечивающих специалистов, гибкими средствами анализа геолого-геофизических данных. Перспективы их дальнейшего развития связаны с разработкой оптимальной технологии расчетов. Одним из таких программных комплексов является автоматизированная системе РАПИД, разработанная под руководством автора.

РАПИД (Распознавание, Автоматизированное Прогнозирование, Интерпретация Данных,) - диалоговая программная система, предназначенная для решения широкого круга задач обработки, анализа и комплексной интерпретации цифровых изображений преимущественно площадных геофизических съемок при прогнозировании минеральных ресурсов. Система ориентирована на 'установление связей между структурой полой и закономерностями размещения полезных ископаемых в земной коре.

РАПИД относится к классу человеко-машинных систем: пользователь сам определяет последовательность процедур и принимает окончательное решещю. В системе реализован принцип шоговцри.чнтного решения прогнозных задач путем 1гроводения вычислительных зксиери ментов. Организация РАПИД базируется на модульном проектировании задач как'последовательности технологических цепочек процедур обработки д.'пишх. Каздая процедура лридстшшюг сосЛ .-цы'р.-м'ду.

- км -

реализующую алгоритм функционально содержательного фрагмента деятельности пользователя.

В диссертации описан состав и общая структура системы, рассмотрены принятые соглашения го организации и хранению данных.

Математическое обеспечение РАПИД состоит из программ семи функциональных блоков. Модули блока МАНИПУЛИРОВАНИЕ осуществляют различные операции над данными, . не изменяющие их значений: объединение, разделение, сортировки по различным критериям и т.п.

Блок ПРЕОБРАЗОВАНИЕ предназначен для предварительной обработки (нормирование, фильтрация, приведение к равномерной сети, интерполяция и т.п.).

В блоке ВЫЧИСЛЕНИЕ ПРИЗНАКОВ реализовано значительное число алгоритмов описания структура далей и обработки изображений, основанных на функциональном, статистическом, корреляционно-спектральном и геометрическом подходах.

Весьма емким и насыщенным является блок ПРОГНОЗ. Он включает алгоритмы оценки перспективности на основе выделения, распознана-, шгя, кластеризации и ранжирования, а также алгоритмы оценки качества прогнозов.

Программы блока ИНФОРМАТИВНОСТЬ ПРИЗНАКОВ осуществляют оценку индивидуальной и диагностирующей информативности на основе различных матодов и критериев. .

Елок СТАТИСТИКА предоставляет возможность оценки статистических параметров изображений полей, построения корреляционных и регрессионных моделей. :•

Визуальное представление материалов производится с помощью модулей блока ГРАФИКА, (теневые изображения,. растровые цветные и серые карты, изолинии, аксонометрия, карты классов однородности и т.п.). Пользователь имеет возможность отобразить на экране монитора географические сведения и геологические факты по изучаемой территории (месторождения, геологические- структуры, скважины, населенные пункты и т.п.), а также отрисовать схему интерпретации с последующим совмещением указанных материалов с любой из карт (исходных, трасформировэнных, прогнозных).

Полное меню верхнего уровня системы показано на рис.2.

При наличии соответствующим образом сформированной базы геологических знаний для конкретного региона и вида сырья система РАПИД позволяет использовать программное обеспечение экспертных систем на Всех стадиях исследований, что дает возможность

ГРАФИКА

Растровая карта Классы однородности Карта фактов Схема интерпретации Выдолошо подобластей Изолинии на экране На принтере/плоттере Карты освещенности Аксонометрия

— НАСТРОЙКА

— Определение объекта

— Настройка графики

— Интерфейс с ЭС

— Программа пользователя

— МАНИПУЛИРОВАНИЕ

— Манипулирование признаками

— Выбор подтаблицц

— Работа с таблицами

— Редактирование таблиц

— Работа с фрагментами участ.

— Работа с картой графиков

— Обмен с DOS

— ПРЕОБРАЗОВАНИЯ

— Простейшие преобразования

— Интерполяцйя

— Нормирование

— Заполнение пропусков

— Фильтрации| '

— Фильтрация по точкам перегибов

— Фильтрация с масками

— Сглаж.в пространстве признаков >

— Главные компоненты

— ВЫЧИСЛЕНИЕ ПРИЗНГ.К0В

— Выбор размеров окрестностей

— Дифференциальные, признаки

— Гистограммные признаки

— Морфологические признаки

— Признаки типа особенности \

— Местоположения (площадные) ^'

— Местоположения (линейныв;

— Интегральные

— Корреляционные

— Кривизны

— Формы секущих кривых

— ПРОГНОЗ

— Выделение

— Кластеризация

— Задание.эталонов >

— Распознавание / ранжирование

— Предск.количественного параметра

— Ранжирование для двух классов

— Проектиров. па-подпространство

— Качество прогноза

— ИНФОРМАТИВНОСТЬ ПРИЗНАКОВ Рис. 2. Полное мешо

— Гистограмма признака

— Диагностирующий набор верхнего уровня системы

— Матрица доминирований

— Индивидуальная информативность РАПИД

— СТАТИСТИКА .

— Элементарные статистики'

— Диаграмма разброса —- Корреляционный анализ

— Парная регрессия г- Множественная регрессия

- ои -

Геологические средстна воздействии

Геофизические средства воздействии

X

Выделение

Iеофизическис поли

„I I I

]сологичоскио факты

Антонатизировапная система

=±=

Разделении

1

Ранжирование

1_

Литературные и Фондовые источники

Оценка качества

Визуализация ■

К 0 /1 0 Г^-

Опыт и знании

-| Иринитис решении |

Рис. 3. Схема прохождения иФормации при прогнозировании

- ол -.

рассматривать ее как гибридную.

В диссертации процесс поиска рассматривается как сложная система с обратной связью. Основные этапы исследований и технология работы пользователя сводятся к следующему.

Пуств область поиска покрыта комплексом геофизических съемок. Информация поступает на вход РАПИД и помещается в базу данных. В зависимости от стадийности исследований и наличия априорных геологических данных выполняется одна из операций: выделение, разделение или ранжирование, сопровождающиеся при необходимости оценкой качества с последующей визуализацией результатов в виде различных карт. При отсутствии сведений о размещении искомых объектов указанные: операции выполняются последовательно. Схема прохождения информации на всех стадиях представлена на рис.3.

Пусть выполнена операция выделения, в результате которой на изучаемой территории определены некоторые объекты . (участки). Соответствующая информация поступает ГЕОЛОГУ, под которым понимается конкретное лицо или коллектив, уполномоченные принимать решения относительно,продолжения или прекращения работ. Геолог, используя собственный опыт и знания других специалистов (в том числе,.-с привлечением базы знаний), а также литературные и фондовые источники го району исследований, может принять одно из трех решений: 1) провести на выделенных участках болев деталыше геофизические съемки; 2) осуществить некоторый объем геологических исследований, включающий бурение скважин и заложение горных выработок; 3) отказаться от Продолжения работ. При этом.решения 1 и 2 могут быть выполнены одновременно. .

Если принято решение 1, то по результатам более детальных геофизических съемок и на основании полученной геологической информации на ранее выделенных участках может быть проведена операция. разделения, например, с помощью процедур распознавания или кластеризации. Таким образом, площадь огожскования еще .более сократится. Анализ полученной информации можэт вновь привести к принятию решений 1 и 2 или какого-либо из них в отдельности. При необходимости для совокупности разделенных объектов проводится операция ранжирования и принимается решение 2.

Если результаты неудовлетворительны, операции разделения и ранжирования проводятся итерационно с привлечением получаемых в процессе поиска новых геологических и геофизических данных до тох пор, пока не будет найдено удовлетворительное решение или сделан

вывод о нецеласообразности дальнейшего проведения работ.

Изложенная технология иллюстрируется в диссертации на примерах решения задач поисков золота по коиллоксу гравитационных и магнитных данных в пределах зеленокаменшх структур Среднего Приднепровья и сульфидно-никелевого оруденения в пределах Прутовского интрузива (зона сочленения Волынского и Подольского могаблоков].

ЗАКЛЮЧЕНИЕ

В диссертационной работе даны методологические, теоретические и методические основы и предложен математический аппарат распознавания цифровых изображений геофизических полей, позволившие разработать компьютерную технологию прогнозирования сложных геологических объектов, ориентированную на сгюцналиста-интврпро-татсра .

Основные научные результаты, выводы и практические рекомендации диссертационной работы заключаются в следующем.

1. Выполнен анализ состояния применения мотодов обработки и распознавания цифровых изображений геофизических полей нэ разных стадиях поискового процесса. Установлено, что методы распознавания,- являясь средством комплексирования геофизических дашшх, могут применяться на всех этапах прогнозно-поисковых исследований, однако максимальный эффект они дают при обработке детальных и высокоточных наблюдений. Аналитически показано, что с позиций теории информации комплоксированиэ всегда эффективное многократного дублирования.

2. Разработаны методологические основы и обоснована эффективная методика прогнозных решений на основе аппарата распознавания образов и обработки изображений геофизических полей. В ее рамках компьютерный прогноз рассматривается как совокупность решений конкретных задач с однозначно заданными параметрами, а сама процедура прогноза осуществляется методами вычислительного эксперимента с обратной связью.

3. Исследованы методические, теоретические и' вксперимен-талыше вопросы обработки и описания структуры изображений геофизических полей. Предложена схема классификации методов формирования признакового пространства, разработаны оригинальные алгоритмы вычисления геофизических признаков., исследована их эффективность для различных сложных моделейщжрройых изображений, теоретически

обоснована полная система интегральных признаков, инвариантных к преобразованиям вращения, растяжения и сдвига цифрового изображения. , '

4. Исследованы и проанализированы возможности статистических и Детерминистских подходов к распознаванию при принятии прогнозных решений, что позволило обосновать их применение в различных геолого-геофизических условиях. Разработаны новые непараметрические алгоритмы выдэлония, распознавания и ранжирования объектов; экспериментально доказана их большая способность к обучению на ограниченной эталонной выборке по сравнению с известными.

5. Проведен 1 аналитический обзор и предложена схема классификации методов выбора информативных Признаков; приведены аналитические, выражения. их вычислительной сложности; даны рекомендации по применению. Разработан новый алгоритм оценки информативности геофизических признаков ' на основе использования матриц доминирования .

6. В результате имитационного моделирования:

- установлена информационная ценность первичных и преобразованных признаков геофизических полей, даны рекомендаций по их использованию; ' •

- исследованы условия существования оптимальных наборов признаков;

- проведен сравнительный анализ эффективности индивидуальных и диагностирующих наборов признаков при прогнозировании- объектов в сложных геолого-геофизических условиях. #

Результаты исследований позволили обосновать необходимость и выявить особенности, применения методов распознавания образов при геофизическом прогнозировании.

7. Разработана автоматизированная система обработки и интерпретации геолого-геофизических данных - РАПИД, и на ее базе создана компьютеризированная технология прогнозно-поисковых работ, ориентированная на пользователя-интерпретатора.

Результаты прогнозирования .реальных объектов золоторудной, редкометалыюй, сульфидно-никелевой минерализации в различных регионам СНГ подтвердили высокую эффективность и результативность технологии в сложных геолого-геофизических условиях.

Основные положения диссертации опубликованы в следующих работах:

1. Методика расчета "весов" обучающих примеров при комплексной интерпретации гравимагнитных данных методами распознавания образов /7 Новейшие достижения в области техники и методики гравиразведочных работ, обработки и хранения гравиметрических материалов.- М.: ВНЖГ'еофизика, 1979. - С.45-50.

2. Программа предсказания отсутсвующих данных методами многомерной статистики // Алгоритм и программы. Информац. бюлл. ВНТИЦ, И 2(22). -М.: 197814 с. ( Совместно с Н.К.Ступаком;.,

3. Программа вычисления обобщенной моры близости в многомерном пространство // Алгоритмы и программы. Информац. бкшл. ВНТИЦ, 112 (22). -М.; 1978.-11 с. ( Совместно с Н.К. Ступаком;.

4. Программа вычисления обобщенной меры подобия в многомерном пространстве // Алгоритмы и программы. Информац. бюлл. ВНТЩ, И 2(22). - М.: 1978. -12 с. ( Совместно с Н.К. Ступаком;.

5. Программа ортогонального проектирования на подпространство. // Алгоритмы и программы. Информац. бюлл. ВНТИЦ, N 2(22).-П.: 1978. -12 с. ( Совмостно с Н.К. Ступаком, Е.А. Семэ-нюком;.

6. Математичесие методы решения прогнозно-поисковых задач. Обзор ВИЭМС.-М.: 1978.- 24 с. С Совмостно с Н.К. Ступаком, В.Ф. Полуактовым;.

7. Возможность применения расстояния Хаусдорфа для сравнения групп геологических объектов // Матем. метода исслед. в геологии. Экспресс-информация. -М.: ШШС, 1979. -И 1.- С.14-18. (Совместно с Н.К. Ступаком;.

В. Сравнительный анализ некоторых методов сглаживания геохимического поля. // Матем. методы исслод. в геологии. Экспресс-информация.-М.: ВИЭМС, 1979. 8.- 0.8-17. (Совместно с Н.К. Ступаком;.

9. Сравнительная оценка применения различных мер сходства при построении комплексных геохимических карт на ЭВМ // Геохимич. карты и их использование при поисках рудных местороздений. Тез. докл. Всес. школы передового опыта МГ СССР.-Хабаровск, 1979.-И 8. -С.57 (Совместно с Н.К.СтупакомЬ

10. Сопоставление некоторых методов сглаживания геохимического поля. // Геохимич. карты и юс использование при поисках рудных месторождений.- Тез.. докл. Всес. школы передового опыта

МГ СССР.-Хабаровск, 1979.- С.58-59 (Совмостно с Н.К.Ступаком).

11. Ортогональное проектирование на подпространство - способ введения мери сходство в пространстве признаков // Геофизич. журнал, 1979.- Т.1.- N2. -С. 62-63 (Совместно с Н.К.Ступаком, Е.А. Семенюком).

12. Комплекс программ для сравнония многомерных геологических объектов // Алгоритмы и программы. ВИЗМС.-М.: 1979. -Выл.8(34).- 60 с. (Совместно с Н.К. Ступаком, Е.А. Семонюком).

13.Способ оценки информативности признаков в задачах геологического прогнозирования // Изв. вузов.- Геология и разведка.- 1982.- N1.- С.52-54 (Совместно с Е.А.Семенюком)

14. Сравнение! результатов обучения алгоритмов автоматического прогноза при выборе мест размещения поисковых скважин// Разведочная геофизика: Теория, методика,результаты.-Киев: Наук, думка, 1984.- С.184-188. (Совмартно с Н.К. Ступаком, Е.А.Семенюком)

15. Описание, структуры потенциальных геофизических полей при решении прогнозно-поисковых зад8ч//Тез.докл.1У Всес. школы-семинара" Теория и практика геологической интерпретации гра-вит. и магн. аномалий".- Алма-Ата, 1984,- С. 24'.

,16. Геометрические характеристики как средство описания пространственной структуры геофизических шлей.- Деп.в ВИНИТИ, N5049-84 от 13.CfT.84.- 9 с.

17. Использование элементов пространственной структуры геофизических шлей для прогнозирования геологических объектов с помощью алгоритма кластер-анализа в режиме диалога.-Деп.в ВИНИТИ, N5051-84 от 13.С/Г.84. - б с. ,

18. Классификация геологических объектов с Помощью алгоритма кластер-анализа в режима диалога. - Дап. в ВИНИТИ, N 5051 - 84 от 13.ОТ.84.- 15 с. (Оовместно с Л.В.Мирошниченко).

19. Система комплексной интерпретации геологогеофизичоских данных//Тез.докл VII Всес.угольного совещания.- Ростов-на-Дону, 1986.- С.72-73. (Совместно с Л.В.Мирошниченко).

20. Выбор информативных признаков в распознавании образов (применительно.к задачам геологии) // Матем. метода и овтоматиз. системы в геологии. Обзор ВИЭМС. - М., 1986. - 66 с. (Совмостно с Л. В. !'£1рошниченко ).

21. Конструирование признаков для анализа пространствошюй структуры физичоских полей при распознавании гоологичоских об'ьок-тов// Матем. методы и овтоматиз. систомц в геологии. Обзор 1ШМС.

- М., 1987. -54 с.

22. Автоматизированное решение прогнозно-поисковых задач в режиме диалога "человек - ЭВМ"// Матем.методы и автоматиз.системы в геологии. Обзор ВИЭМС. - М., 1987. -58 с. (Совместно с Л.В. Мирошниченко и A.B. Романовым}.

23. Диалоговая автоматизированная система для обучения студентов ВУЗа геологического профиля//Тез.докл. Всес. научно-мето-дич. конференции.-Рига: РШГА, 1987. -0.92-93. (Совместно с Л.В.Мирошниченко}.

24. Оценка металлогонической споциализации систем разломов с помощью методов распознавания. // Тез.докл. Всес. научно-технической конференции. - Днепропетровск, ДГИ, 1988. - С. 38. (Совместно с И.В. Ластовиным, А.Л. Лозовым}.

25. Технология комплексной обработки геохимических данных в интерактивном режиме. // Тез.докл. IV Всес. совещания "Теория и практика геохимических поисков в современных условиях". - М.: ИМГРЭ, 1988. - С. 29. (Совместно с Л.В.Мирошниченко}.

26. Метода, критерии и алгоритмы, используемые при преобразовании, выделении и выборе признаков в анализе данных. - Вильнюс: ИМК АН Литвы, 1988. - 149с,. (Совместно о К.А. Чепонисом, Д.А. Жвиренайте, Л.В.Мирошниченко}.

27. Об одном показателе качества автоматизированного прогноза// Изв. ВУЗов. Геология и разведка. - 1989. - N в. - С.84-87.

28. Об информативности многомерных и многократных геофизических измерений // Изв. ВУЗов. Геология и.разводка. - 1989. -Н9.~ 0.64-70.

29. Метода конструирования признаков при распознавании геоизображений// Тез. докл. IV Всос. конференции "Математич. методы распозн. образов". -Рига: МИПКРРиС при СМ ЛатвССР, .1989. -С.34-36.

30. Оценка информативности трех систем геофизических признаков// Тез. докл. Всес. семинара им. Д.Г. Успенского "Теория и практика геологической интерпретации гравитационных и магнитных аномалий". - Алма-Ата: Каз. ПТИ, 1990. - С.19-20.

31. Автоматизированное картирование железистых кварцитов Кривбасса. // Изв. Днепропетровского горного ин.-та. - М.: Недра, i990. - С.141-146. (Совместно с Д.Н. Великом, В.В. Кутиным}.

32. Технология и программная реализация комплексной интерпретации геолого-геофизических данных на базе персональных ЭВМ //

Тез. докл. научно-технич. конференции "Проблемы создания универсальных баз данных в геологии". - Киев, 1990. - С.11. ССовместно о Л.В.Мирошниченко, С.В.Серегиным.).

33. Об одном подходе к снижению размерности в задачах кластеризйции// Тез. докл. Всес. научно-технич. конференции с международным участием стран - членов СЭВ "Применение статистич. методов в производстве и управлении". - Пермь, 1990. - С.290-291. (■совместно с Л.В.Мирошниченко;.

34. Решение прогнозно-поисковых задач в интерактивном режиме// Тез.доюг. 24-й Всос. школы но автоматизации научных исследований. - Апатиты, ' 1990. - С.79-80 ("Совместно с Л.В.Мирошниченко, С. В.Серегиным).

35. Оценка Информативности признаков при крупномасштабном геофизическом прогнозе // Геофиз. ' журн. - 1991. - t.13. - S 3. -С.35-46 ("Совместно' с Л.В.Мирошниченко;.

36. Оценка приуро^шюсти прогнозов к известным геологическим объектам //Изв. ВУЗов. Геология и разведка. - 1991. - N2. - С.98-103.

37. Индивидуальная и диагностирующая информативность геофизических признаков'при распознавании геологических объектов // Изв. ВУЗов. Геология и разведка. - 1991. - }¡ 6. - G.82-90 ("Сов-MScTHO с Л.В.Мирошниченко).

38. Распознавание образов при геолого-геофизическом прогнозировании. - Днепропетровск : Изд-во ДГУ, 1991. - 168 с. ("Совместно с Л.В.Мирошниченко;.

39. Компьютеризированная технология решения . прогнозно-поисковых задач// Тез. докл. междунар. симпозиума "Применение метем. методов и компьютерных технологий при решении задач геохимии и охраны-окружающей,среды". - Львов, 1992. - С.З7-38.

40. Эффективное прогнозирование по денным измерений геофизических полей// XXX Symposium, pracovnlcu banskcha. prmysly. Hornlcta Pribram vede a technlce, 1991.- P.449-458.

41. Automated system of prognosis for minorai resources upon geophysical date // Intern. symposium on computer applications In geoselence, -ABSTRACTS.- Beijing, Chine, 1991, P. 726-728.

■+42. Uan-ond-machine technology for the prediction of mineral deposite using geophysical date // tiath. Geology.- У.24.-N 6.- 1992,- P. 711-717. _