Бесплатный автореферат и диссертация по геологии на тему
Компьютерная технология обнаружения слабых аномалий в геофизических полях
ВАК РФ 04.00.12, Геофизические методы поисков и разведки месторождений полезных ископаемых
Автореферат диссертации по теме "Компьютерная технология обнаружения слабых аномалий в геофизических полях"
На правах рукописи
В ГЕОФИЗИЧЕСКИХ ПОЛЯХ
Специальность 04.00.12. - Геофизические методы поисков и разведки месторождений полезных ископаемых
Автореферат
диссертации на соискание ученой степени кандидата технических наук
Москва, 1997г.
Работа выполнена во Всероссийском научно-исследовательском институте геологических, геофизических и геохимических систем (ВНИИгеосистем).
Научный руководитель:
Черемисина Евгения Наумовна, доктор технических наук, профессор (ВНИИгеосистем, г.Москва)
Официальные оппоненты: Аронов В.И.
доктор физико-математических наук, профессор (ВНИИгеосистем, Москва)
Паламарчук В. К.
кандидат геолого-минералогических наук (ВНИИОкеангеология, г.Санкт-Петербург)
Ведущая организация - Московская Государственная Геологоразведочная Академия
Защита состоится М^рТб 1997 г. в Щ часов на заседании Диссертационного совета Д071.10.01 при Всероссийском научно-исследовательском институте геологических, геофизических и геохимических систем, г.Москва, 113105, Варшавское шоссе, д.8, конференц-зал.
С диссертацией можно ознакомиться в библиотеке ВНИИгеосистем.
Автореферат разослан " 1997 г.
Ученый секретарь Диссертационного Совета д.г.-м.н. ' ' В.С.Лебедев
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность проблемы Современный этап научно-технического прогресса в геологии, геофизике и геоэкологии характеризуется внедрением новых компьютерных технологий. Повышение эффективности исследований в этих областях связывают с необходимостью использования новейших разработок в области автоматизированной обработки и анализа геоинформации.
Изучение все более глубинных областей земных недр; стремление наиболее полно использовать информацию, содержащуюся в геофизических полях; изучение и анализ тонких особенностей полей, ставшие возможными благодаря высокой точности современных геофизических съемок, все чаще приводят к ситуациям, когда интенсивность интересующих геофизических аномалий становится сопоставимой с интенсивностью помех различной природы. Визуальное обнаружение и прослеживание аномалий становится затруднительным, неоднозначным или вообще невозможным. В тех случаях, когда помехи можно считать случайными, для обнаружения используется статистический подход.
Проблема обнаружения аномалий на фойе помех актуальна для широкого круга практических задач, решаемых на основе геолого-геофизической, геохимической и геоэкологической информации. Статистические алгоритмы обнаружения показали свою эффективность как при решении геологокартировочных задач, так и при поисках полезных ископаемых (рудных, нефти и газа), при обработке данных магниторазведки, гравиразведки, сейсморазведки (MOB), электроразведки (методы естественного поля, вызванной поляризации, комбинированного электропрофилирования, дипольного электропрофилирования, радиокип) и радиометрии (эманационная и гамма-съемка).
К настоящему времени разработан ряд алгоритмов обнаружения слабых аномалий и имеется опыт их использования при решении разнообразных практических задач. Этот опыт, с одной стороны, показал несомненные достоинства подхода в целом, и, с другой стороны, выявил ограничения в применении существующих алгоритмов. Развитие аппарата математической статистики создает предпосылки для дальнейшего расширения крута алгоритмов, решающих задачу обнаружения. В связи с этим становится актуальной разработка новых алгоритмов
обнаружения, а также создание методики и технологии их применения при решении геолого-геофизических и геоэкологических задач.
Целью работы является разработка компьютерной технологии обнаружения слабых аномалий на фоне случайных помех с выбором рационального алгоритма обнаружения и его оптимальных параметров при решении геологических и геоэкологических задач.
Основные задачи работы
1. Систематизация постановок н методов решения задачи обнаружения слабых аномалий на фоне случайных помех для различных моделей поля и типов данных.
2. Разработка методического, алгоритмического и программного обеспечения компьютерной технологии решения задачи обнаружения.
3. Создание и апробация компьютерной технологии решения задачи обнаружения с выбором рационального алгоритма и его оптимальных параметров.
Научная новизна.
1. Выполнена типизация постановок и методов решения задачи обнаружения слабых геофизических аномалий, учитывающая форму и величину аномалии, и закон распределения помехи, позволившая обосновать необходимость создания новых алгоритмов и построить технологию выбора рационального способа решения.
2. Разработаны и опробованы новые непараметрические алгоритмы обнаружения слабых геофизических аномалий, основанные на свободных от распределения статистиках Спирмена, Кевдалла, их многомерных обобщениях и статистике Краскела-Уоллиса.
3. Создана база знаний о решаемой задаче и алгоритмах обнаружения, обеспечивающая построение методики и технологии выбора рационального алгоритма и его параметров.
Защищаемые положения.
1. Предложенная типизация методов решения задачи обнаружения слабых геофизических аномалий с учетом априорной информации является базой для создания новых алгоритмов и выбора рационального метода решения.
2. Разработанные не парам етрнч ее кие алгоритмы, основанные на статистиках Спнрмена, Кендалла, Краскела-Уоллиса, многомерных обобщениях статистик Спирмена и Кендалла позволяют выделять слабые аномалии при различном объеме априорной информации об аномалиях на фоне помех с произвольным непрерывным законом распределения.
3. Предлагаемая компьютерная технология обнаружения слабых аномалий на фоне случайных помех позволяет повысить эффективность обработки и комплексного анализа геофизических данных за счет выбора алгоритма, наиболее адекватного модельным представлениям и исходной информации.
Реализация и апробация работы. Приведенные в диссертации разработки внедрены в МГТА, ВИМСе, ПГО "Уралгеология", МИНГЕО Республики Казахстан.
Основные результаты работы докладывались на ежегодных научных конференциях МГРИ (Москва, 1983-1990), Всероссийской научно-технической конференции "Экология и геофизика" (Дубна, 1995), Международной конференции "Вопросы теории и практики геологической интерпретации гравитационных, магнитных и электрических полей" (Воронеж, 1996).
Публикации и личный вклад в решение проблемы. Диссертация основана на теоретических, методических н экспериментальных исследованиях, выполнекньЬс автором в 1983-1996 гг.
Основные теоретические, методические и технологические результаты получены непосредственно автором. По результатам выполненных исследований опубликовано 5 печатных работ.
Объем и структура работы. Диссертация состоит из введения, четырех глав, заключения, списка литературы, содержит 43 страниц машинописного текста. Список литературы включает № наименований.
Автор выражает глубокую признательность научному руководителю д.т.н., проф. Черемисиной E.H., д.ф.-м.н., проф. Никитину A.A., искренне благодарит к.т.н. Митракову О.В., к.ф.-м.н. Финкелыптейна М.Я. и к.т.н. Галуева В.И. за ценные советы при обсуждении работы.
СОДЕРЖАНИЕ РАБОТЫ
ГЛАВА 1. Анализ существующих алгоритмов обнаружения
Развитие теории и практики использования статистических алгоритмов обнаружения связывается с именами А.Г.Тархова, А.А.Никитина, О.А.Демидовича, Г.В.Демуры, В.П.Лукиной и А.В.Петрова. Они создали и ввели в практику обработки геофизических данных такие алгоритмы обнаружения слабых геофизических аномалий как способ обратных вероятностей, способ самонастраивающейся фильтрации, алгоритм, непараметрической адаптивной фильтрации, многомерные аналоги способов обратных вероятностей и самонастраивающейся фильтрации, позволяющие решать задачу обнаружения при различной априорной информации об искомых аномалиях и помехах.
Механизм обнаружения слабых аномалий (Рис.1) заключается в том, что от анализируемого поля, а в общем случае, от нескольких полей, переходят к полю распределения некоторой статистики (обозначим ее у). Эта величина вычисляется по
Исходное поле Поле статистики
Расчет статистики
Местоположение аномалии исходного поля
Выделение аномалий статистики
Аномалии статистики
Определение местоположения искомых аномалий
Рис.1. Механизм обнаружения слабых аномалий
значениям поля в пределах некоторого окна и относится к его центру. Поле у получается в результате последовательного перемещения окна от точки к точке в пределах контура исходного поля. Затем в поле у выделяются аномалии у, по которым производится обнаружение и определение местоположения аномалий анализируемого поля.
Основа для построения статистики * модель поля в окне, описывающая искомые аномалии и мешающие помехи. Статистический подход предполагает следующий критерий выбора фильтра: статистика ц/ реализует критерий проверки нулевой гипотезы - в окне присутствует только помеха, состоятельный против альтернативы, состоящей в том, что аномалия в окне является искомой. Такой подход к выбору статистики позволяет для любой фиксированной аномалии определить надежность обнаружения, что, в свою очередь, позволяет сформулировать следующий очевидный критерий выбора окна: форма и параметры окна выбираются так, чтобы вероятность обнаружения была максимальной.
Статистический подход к обнаружению позволяет также сформулировать общее правило выделения аномалий в поле рассчитанной статистики. Вопрос о том, является ли значение аномальным или нет, эквивалентен, в соответствии с критерием выбора статистики, вопросу о том, верна или не верна при этом положении окна альтернативная гипотеза. Используемые в алгоритмах статистики сконструированы так, чтобы аномальными были значения, превышающие пороговое значение, соответствующее статистическому критерию.
Анализ имеющихся алгоритмов и опыта их использования позволил сделать следующие основные выводы.
Алгоритмы не охватывают всей широты ситуаций, встречающихся на практике. Подавляющее большинство алгоритмов предполагает нормальное распределение помехи, что не всегда имеет место, в частности, при обработке данных магниторазведки и электроразведки. В некоторых случаях несоответствие реальной ситуации и модели метода обнаружения может значительно искажать результаты его применения. Развитие непараметрических алгоритмов обнаружения фактически только начинается - метод непараметрической адаптивной фильтрации, основанный на свободной от распределения статистике Фридмана, позволяет выделять лишь линейные аномалии при отсутствии информации о ее значениях.
Алгоритмы используют различные статистические критерии для принятия решения о наличии аномалии. Метод обратных вероятностей и его многомерный аналог используют критерий максимума правдоподобия. Самонастраивающийся фильтр, его многомерный вариант и способ непараметрической адаптивной фильтрации - критерий Неймана-Пирсона. В итоге отсутствует общая база, без которой невозможно сравнение результатов, полученных разными алгоритмами и, как следствие, практически отсутствует методика выбора рационального алгоритма для каждой конкретной ситуации. В качестве этой общей базы в работе предлагается критерий Неймана-Пирсона.
Отсутствует аппарат определения правил перехода от аномалий статистики к искомым аномалиям в каждом конкретном случае. Для первых алгоритмов обнаружения - обратных вероятностей н самонастраивающейся фильтрации, решение этого вопроса казалось само собой разумеющимся: искомые аномалии надо выделять по максимальным значениям статистики. Однако уже . с алгоритмом непараметрической адаптивной фильтрации оказалось, что все не так просто: знакопеременные аномалии выделялись максимумами статистики, а знакопостоянные - двумя максимумами, причем ось искомой аномалии приходилась на минимум, расположенный между ними.
Программная реализация алгоритмов обнаружения позволяет качественно решать содержательные задачи только специалистам, имеющим опыт их использования. В системах обработки геофизической информации (КОБСАО, АПМ-2, АБОМ-АОВ/ЕС, А50М-АС8/РС) практически отсутствуют средства, позволяющие пользователю, не имеющего такого опыта, выбрать один или несколько алгоритмов, наилучшим образом отвечающих имеющейся реальной ситуации, а также определить оптимальные параметры обнаружения. Интерфейс пользователя в большинстве этих систем основан на выборе программы из некоторого списка и явном определении ее параметров без связи с особенностями решаемой задачи.
ГЛАВА 2. Методические аспекты формализации и решения задачи обнаружения слабых аномалий на фоне случайных помех
Основная цель методической части работы состоит в построении типизации постановок задачи обнаружения, определении на ее основе полноты множества
имеющихся алгоритмов для построения компьютерной технологии с выбором метода решения, адекватного решаемой задаче. При анализе ограничимся рассмотрением аспектов, связанных с формализацией геолого-геофизических задач, сводящихся одним из своих этапов к задаче обнаружения.
В качестве методологической базы формализации и решения задачи обнаружения использован подход, развиваемый в работах Ю.А.Воронина и Е.Н.Черемисиной. В рамках этой идеологии решение содержательной задачи разделяется на этапы формулирования геологической задачи, формализации задачи, выбора способа решения, собственно решения и интерпретации результатов.
Формализация задачи включает формализацию цели, модельных представлений, данных, результата и требований к результату.
Формализация цели - это процесс перехода от описания цели на содержательном уровне к ее описанию на формальном уровне. В процессе формализации содержательная задача может разделиться на последовательность формальных задач.
Обнаружение аномалий является одним из этапов решения разнообразных геолого-геофизических, геохимических и геоэкологических задач, решаемых различными методами. В их числе задачи геологического картирования, поиска рудных полезных ископаемых и углеводородного сырья, инженерно-геологические задачи и задачи экологического мониторинга. В тех случаях, когда визуальное выделение аномалий становится неоднозначным или невозможным из-за того, что они сопоставимы по амплитуде со случайными помехами, одним из первых этапов анализа данных по необходимости становится обнаружение, которое позволяет установить факт наличия интересующих аномалий в анализируемых полях и определить их местоположение.
Формализация модельных представлений. Обнаружение геологических объектов проводится опосредованно - по их отражениям в физических полях, поэтому формализация модели предполагает не только описание модели среды как совокупности объектов с некоторой геометрией и физическими свойствами, но и переход от объектов к порождаемым ими эффектам. В зависимости от конкретной геологической задачи эти эффекты подразделяются на аномалии (эффекты от интересующих нас объектов) и помеху (совокупность эффектов от остальных
объектов). В тех случаях, когда аномальные эффекты сопоставимы по интенсивности с помехами и их визуальное выделение становится неоднозначным или невозможным, а помеха описывается стохастической моделью, для решения задачи может быть использован предлагаемый аппарат обнаружения.
В качестве основной для алгоритмов обнаружения будем использовать аддитивную модель: Р = А + Е, где Б - анализируемое поле или комплекс полей, А -искомая аномалия, а Е - случайная помеха.
Конкретная постановка задачи обнаружения определяется информацией об аномалиях и помехах. Максимально возможная информация об аномалии имеет место в том случае, когда известны ее значения, например, в результате решения прямой задачи или по аналогии. В других случаях имеется описательная информация типа следующей: требуется обнаружить профильную положительную симметричную аномалию шириной 7 точек. Такая ситуация описывается с помощью рангов. В некоторых случаях о значениях аномалии информации нет, а есть лишь данные о ее геометрии: линейная, изометричная, кольцевая и т.д. Комплексные аномалии можно обнаруживать, располагая информацией о согласованном изменении компонент.
При описании случайной помехи важно иметь информацию о законе распределения и степени взаимозависимости случайных ошибок. В работе рассматриваются ситуации, когда ошибки распределены непрерывно (частный случай - нормальное распределение) и взаимно независимы как между характеристиками полей, так и для каждой характеристики отдельно.
Формализация данных. При определении формальных типов данных будем иметь в виду, что точки измерения могут располагаться на одной прямой с постоянным шагом между ними, как в скважине или на отдельном профиле (профиль), так и на плоскости наблюдений в узлах двумерной прямоугольной регулярной сети (сеть). В каждой точке наблюдения могут быть представлены одним значением (скаляр) или вектором параметров (вектор).Таким образом, мы получаем 4 типа данных, которые в дальнейшем будем обозначать (профиль, скаляр), (профиль, вектор), (сеть, скаляр) и (сеть, вектор).
Этап формализации включает и преобразование данных. В тех случаях, когда модель поля не является аддитивной, или информация об искомых объектах не связана непосредственно со значениями анализируемых полей, обнаружение
и
предваряется содержательными операциями: приведением данных к аддитивной модели, разделением сложных полей на составляющие или переходом от значений полей к некоторым их характеристикам, несущим информацию об искомых геологических объектах. Так, если искомые объекты связаны с повышенной изменчивостью поля, то разумным будет сначала выделить нужную компоненту поля, затем рассчитать изменчивость (дисперсию) поля в скользящем окне, а затем обнаруживать положительные аномалии в поле дисперсии.
Формализация результата. Результатом обнаружения (см. Рис.1) являются карты и схемы, на которых показано местоположение обнаруженных аномалий.
Формализация требований к результату. Формальные требования к результату вытекают из содержательных требований и полностью определяются особенностями решаемой геологической задачи.
Информация об аномалиях, помехе и типе данных составляет основу базы знаний о заОаче.
В соответствии с априорной информацией об искомой аномалии (информация о значениях аномалии или о ее геометрии, либо информация о согласованном поведении аномальных полей) и помехе, и исходными данными проведена типизация постановок и методов решения задачи обнаружения.
Профиль, скаляр
Обнаружение одномерной аномалии при наличии информации о ее значениях.
Информация об аномалиях может быть в двух видах: либо известны значения, либо их ранги. С учетом того, что помеха может быть либо нормально распределенной, либо иметь произвольное непрерывное распределение, получим четыре постановки, из которых только для первой (известны значения аномалии; помеха - нормальная) есть решение с помощью метода обратных вероятностей.
Сеть, скаляр
Обнаружение двумерной аномалии при наличии информации о ее значениях.
Ситуация аналогична обнаружению одномерной аномалии при наличии информации о ее значениях.
Обнаружение двумерной аномалии известной геометрии.
В эту группу входят постановки обнаружения линейных и произвольных (изометричных, кольцевых и т.д.) в плане аномалий с произвольной формой аномалии в сечении. Известные алгоритмы самонастраивающейся фильтрации и непараметрической адаптивной фильтрации позволяют обнаруживать только линейные аномалии, соответственно, для нормально и произвольно распределенной помехи. Алгоритмы для обнаружения аномалий произвольной геометрии отсутствуют.
Профиль, вектор
Обнаружение комплексной одномерной аномалии при наличии информации о ее значениях по всем компонентам вектора.
Информация об аномалиях может быть трех видов: по всем компонентам известны значения искомых аномалий; по всем компонентам известны только ранги аномалий; по одним компонентам известны значения аномалии, а по другим - только ранги. С учетом того, что помеха может быть либо нормально распределенной, либо иметь произвольное непрерывное распределение, получим шесть постановок, из которых только для первой (известны значения аномалии по всем компонентам; помеха - нормальная) есть решение с помощью многомерного обобщения метода обратных вероятностей.
Обнаружение комплексной одномерной аномалии, проявляющейся согласованным изменением всех компонент вектора.
Традиционный статистический подход к обнаружению не охватывал постановки этой группы, хотя здесь могут использоваться известные алгоритмы вычисления коэффициентов корреляции между компонентами поля в скользящем окне. В зависимости от числа компонент здесь выделяются парная и множественная корреляция. Парная корреляция для нормальной помехи основана на использовании выборочного коэффициента корреляции, для произвольной помехи могут использоваться коэффициенты ранговой корреляции Спирмена и Кендалла. Для множественной корреляции важно установить, можно или нет считать случайные ошибки по всем компонентам извлеченными из одной и той же совокупности. В первом случае для нормальной помехи можно использовать способ
самонастраивающейся фильтрации, а для произвольной - метод непараметрической адаптивной фильтрации. Этот же алгоритм используется и во втором случае.
Обнаружение комплексной одномерной аномалии в случае, когда для некоторых компонент вектора известны значения или ранги, а для остальных наблюдается согласованное изменение полей.
Алгоритмов для решения этой группы постановок нет.
Сеть, вектор
Обнаружение комплексной двумерной аномалии при наличии информации о ее значениях по всем компонентам вектора.
Ситуация аналогична обнаружению комплексной одномерной аномалии при наличии информации о ее значениях по всем компонентам вектора.
Обнаружение комплексной двумерной аномалии, проявляющейся согласованным изменением всех компонент вектора.
Ситуация аналогична обнаружению комплексной одномерной аномалии, проявляющейся согласованным изменением всех компонент вектора. Обнаружение комплексной двумерной аномалии в случае, когда известна геометрия аномалий по всем компонентам вектора.
Многомерное обобщение способа самонастраивающейся фильтрации позволяет обнаруживать только линейные комплексные аномалии на фоне многомерной нормально распределенной помехи. Алгоритмы обнаружения аномалий произвольной геометрии, различной для разных компонент вектора на фоне помехи с произвольным законом распределения отсутствуют.
Обнаружение комплексной двумерной аномалии при наличии для различных компонент вектора информации о значениях, согласованном изменении компонент.
геометрии аномалий.
Алгоритмов для решения этой группы постановок нет.
Рассмотренная типизация постановок и методов решения задачи обнаружения и описание особенностей алгоритмов составляют основу базы знаний об алгоритмах.
Таким образом, во второй главе построена типизация постановок задачи обнаружения, проведена оценка полноты множества имеющихся алгоритмов и определены постановки, не имеющие алгоритмического решения. Эта типизация может служить основой для выбора метода обнаружения, адекватного имеющейся ситуации.
ГЛАВА 3. Теоретические аспекты статистического подхода к обнаружению слабых аномалий на фоне случайных помех
Анализ процесса решения задачи обнаружения и его методических аспектов показывает, что полное описание любого конкретного алгоритма обнаружения должно включать:
- описание модели в терминах статистической задачи;
- определение круга постановок, которые решаются с помощью фиксированного алгоритма;
- описание модели поля в терминах конкретных постановок и отображения данных при переходе от постановки к статистической задаче;
- определение статистики;
- определение функции распределения статистики при нулевой гипотезе и пороговых значений для различных параметров окна;
- определение функции распределения статистики при наличии аномалии в окне и вероятности обнаружения аномалии;
- изучение взаимоотношения между формой и местоположением искомых аномалий и формой и местоположением аномалий статистики, а также рекомендации по переходу от аномалий статистики к искомым аномалиям.
В работе представлены новые алгоритмы, основанные на свободных от распределения статистиках. Они позволяют существенно расширить круг постановок, имеющих алгоритмическое решение.
Алгоритм на основе коэффициента ранговой корреляции Спирмена позволяет обнаруживать профильные и площадные аномалии, заданные рангами на фоне помех с произвольным непрерывным законом распределения т.е. решать задачи обнаружения одномерных и двумерных аномалий при наличии информации об их
значениях (рангах). Для решения тех же задач может использоваться и алгоритм на основе коэффициента ранговой корреляции Кендалпа.
Алгоритм на основе статистики Краскела-Уоллиса позволяет обнаруживать площадные аномалии произвольной формы, а также профильные и площадные комплексные аномалии, проявляющиеся согласованным изменением более чем двух компонент вектора, являющихся реализациями единого случайного процесса на фоне помех с произвольным непрерывным законом распределения.
Алгоритмы на основе многомерного обобщения коэффициентов ранговой корреляции Спирмена и Кендалла позволяют обнаруживать профильные и площадные комплексные аномалии, заданные рангами на фоне помех с произвольным непрерывным законом распределения.
Алгоритм на основе комплексных статистик позволяет сворачивать разнородную информацию. Его сущность состоит в том, что статистики, входящие в комплекс, с помощью квантилей распределения при нулевой гипотезе приводятся к стандартному нормальному распределению. Определить функцию распределения и, следовательно, пороги для выделения аномальных значений взвешенной суммы нормализованных статистик не представляет сложности.
Описание новых алгоритмов обнаружения иллюстрируется примерами опробования их на модельных задачах.
Одна из особенностей свободных от распределения статистик состоит в том, что это дискретные случайные величины, поэтому точные значения функций распределения при нулевой гипотезе и пороги принятия решения известны только для небольших объемов выборок. Видимо, по этой же причине в литературе отсутствует информация о мощности непараметрических критериев, надежности обнаружения и средних значениях статистики при выполнении альтернативной гипотезы. Вычислительные возможности современных компьютеров позволяют быстро и с достаточной степенью точности определять необходимые для расчета этих параметров функции распределения на основе численного моделирования. В работе предлагается способ экспериментального построения искомой функции распределения по результатам большого числа экспериментов, каждый из которых состоит в следующем. Сначала в окне с помощью датчика случайных чисел генерируется случайная помеха с заданным законом распределения. В том случае,
когда необходимо определить функцию распределения при альтернативной гипотезе, к помехе добавляется анализируемый сигнал. Затем по значениям поля в окне рассчитывается значение статистики.
Переход от аномалий статистики к аномалиям исходного поля определяется особенностями конкретного алгоритма обнаружения: в одних случаях местоположение исходной аномалии определяется по максимуму статистики, а в других случаях связь между положением исходной аномалии и аномалией статистики может быть более сложной. Для решения этой проблемы в работе предлагается подход, основанный на изучении взаимосвязи местоположения искомой аномалии с аномалией среднего значения статистики, а для ранговых статистик - с аномалией статистики, рассчитанной на основе вероятностной ранжировки.
Известен следующий способ расчёта рангов выборки ( ^ ... £ ... ^ ... £т ): составляется матрица размера ш х т, элементы которой определяются следующим образом:
= 1 - на главной диагонали единицы,
Я^ =0 для £ < $ ,
Чу = 1 для 5 > ^ ;
тогда ранг значения £ будет равен сумме элементов в 1-м столбце матрицы.
Обобщим детерминированный случай на стохастический, положив значение qjj лвным вероятности события: > Тогда для аддитивной модели поля в окне она -дет равна значению функции распределения разности помехи при значении аргумента, равном разности между значениями аномалии:
= Р{Г, > /,} = + > я, + е,} = -*,<в;-я,} = Г'"1 (я,. - а,)
Суммирование столбцов матрицы дает вероятностную ранжировку, которая и используется для вычисления статистики.
ГЛАВА 4. Компьютерная технология статистического обнаружения слабых аномалий и апробация ее на геолого-геофизических задачах
Компьютерная технология охватывает четыре этапа постановки и решения задачи обнаружения: формализации модельных представлений, выбора метода решения, собственно решения и формальной интерпретации результата.
Прохождение каждого этапа обеспечивается функциональными блоками, приведенными на рисунке 2.
Блок трансформации данных позволяет приводить их к аддитивной модели, разделять поля на составляющие с помощью методов линейной и нелинейной фильтрации, а также рассчитывать разнообразные интерпретационные характеристики (статистические характеристики в окне, производные, градиенты, и Т.д.).
Изучение свойств помехи проводится на безаномальных участках и включает анализ корреляционных свойств с помощью корреляционных функций (АКФ, ВКФ, ДАКФ, ДВКФ), а также изучение законов распределения и проверку гипотез о законе распределения с помощью статистических тестов. В тех случаях, когда помеха коррелирована, может потребоваться пересчет данных на более редкую сеть. Информация о помехах и их параметрах поступает в базу знаний о задаче.
Анализ информации об аномалиях позволяет отнести решаемую задачу к одному из следующих типов:
- известны значения (ранги) аномалии,
- известна ее геометрия,
- данные о согласованном изменении компонент,
- комбинация предыдущих пунктов для комплексных данных.
Для приведения аномалий к одному из перечисленных вариантов может потребоваться трансформация данных. Информация об аномалиях и их параметрах поступает в базу знаний о задаче.
В ходе выбора алгоритма решения задачи проводится сопоставление имеющейся информации о задаче с информацией об алгоритмах из базы знаний.
Определение оптимальных параметров алгоритма включает определение формы и параметров окна, а также весов компонент для комплексных данных. Форма окна определяется геометрией аномалии, а его размеры - размерами аномалии. Пользователь может воспользоваться рекомендациями по выбору окна из базы знаний, а также может оценить надежность выделения аномалий при разных параметрах окна.
Приведение к аддитивной модели Разделение полей на составляющие Расчет интерпретационных характеристик
Анализ корреляционных свойств Изучение закона распределения
Значения, ранги, геометрия Согласованное изменение компонент
Форма Размеры Веса компонент
Аномалия - выше порога
Определение местоположения осей и контуров искомых аномалий Формальная оценка результата
Сопоставление с имеющейся геолого-геофизической информацией
Рис.2. Обобщенная технологическая схема решения задачи обнаружения
Выделение аномалий статистики проводится на основе пороговых значений для вероятности ошибки первого рода 1% и 5%.
Формальная интерпретация включает определение местоположения осей и контуров искомых аномалий и формальную оценку результатов. При переходе от аномалий статистики к искомым аномалиям используется информация об алгоритме, имеющаяся в базе знаний. В тех случаях, когда полученный результат не соответствует формализованным модельным представлениям, может потребоваться изменение параметров алгоритма или возврат на этап формализации модельных представлений. Итог этого этапа - карты и схемы обнаруженных аномалий.
Содержательная интерпретация - это процесс сопоставления полученных карт и схем с имеющейся геолого-геофизической информацией. Она проводится совместно с постановщиком задачи - геологом. В тех случаях, когда результат не согласуется с имеющейся информацией, необходимо вернуться к этапу формулирования содержательной задачи.
Важным элементом технологии является экспертный блок, который включает базу знаний об алгоритмах и решаемой задаче. Знания об алгоритмах - это постановки задачи обнаружения, при решении которых он используется; возможные для данного алгоритма виды окон; законы распределения статистики при нулевой и альтернативной гипотезах или средства их вычисления; пороговые значения статистик, функции мощности критериев или средства для определения надежности обнаружения, функции среднего значения статистик при альтернативной гипотезе или средства их вычисления. Знания о решаемой задаче - это информация об аномалиях и помехах, а также информация о тиле данных. Основные функции экспертного блока - это выбор алгоритма обнаружения, адекватного решаемой задаче, определение его параметров и обеспечение перехода от аномалий статистики к искомым аномалиям.
Возможности технологии иллюстрируются примерами решения конкретных геологических и геоэкологических задач.
Первый пример связан с решением геоэкологической задачи прогнозирования карста по данным двукратной (май и октябрь) эманационной съемки. Решение задачи проведено совместно с д.ф.-м.н. В.П.Рудаковым, представившим материалы и осуществившим содержательную постановку и интерпретацию результатов. Развитие
карстово-суффузионных процессов приурочено к протяженным тектонически активным зонам. Визуальное выделение зон по исходным данным не представляется возможным: искомые аномалии маскируются вариациями концентрации радона, связанными с сезонными и техногенными процессами, влияющими на условия переноса эманации в рыхлых образованиях и порождающими эффекты, соизмеримые по интенсивности с искомыми аномалиями. Изучение помехи показало, что она некоррелирована и . ее закон распределения отличается от нормального. Формализация первоначальной постановки содержательной задачи свелась к обнаружению по двум полям раздельно отрицательных симметричных линейных аномалий концентрации радона. Результат обнаружения не удовлетворяет требованиям - аномалии статистики не увязываются в протяженные линейные зоны. Изменение параметров окна не изменило ситуацию.
Осмысление этого факта привело к осознанию необходимости переформулирования содержательной задачи - изменению модельных представлений. Формализация уточненной постановки привела к задаче обнаружения комплексной аномалии, проявляющейся согласованным (инверсионным) поведением двух компонент, измеренных в принципиально разные моменты жизни горного массива • увеличения деформирующих напряжений весной и уменьшения осенью. Для обнаружения использован алгоритм, основанный на коэффициенте ранговой корреляции Спирмена. По результатам обнаружения уверенно выделяются две линейные зоны. Содержательная интерпретация показала, что выделенные зоны действительно являются зонами проявления карегово-суффузнокных процессов, поскольку в пределах одной из выделенных зон наблюдалось аномально высокое поглощение бурового раствора в скважине, при сейсмоакустическом просвечивании отмечено понижение скорости упругих волн, а на продолжении выделенных зон отмечены трещина в фундаменте школы и проседание грунта, вызвавшее повреждение и обрушение жилых домов.
Во втором примере перед геофизическими исследованиями ставилась задача изучения элементов структурно-тектонического строения нефтегазоносного бассейна в Южной Америке по результатам аэромагниторазведки.
Обнаружению слабых аномалий предшествовало выделение остаточной компоненты исходного поля, несущей информацию о строении верхней части
разреза. Анализ этой компоненты показал, что в некоторых частях бассейна уверенно прослеживаются линейные аномалии магнитного поля, связанные с известными тектоническими элементами. Для прослеживания аномалий в других частях бассейна, там, где визуальный анализ не дал результатов, было принято решение об использовании аппарата обнаружения.
Исследование помехи, проведенное на нескольких участках показало, что она имеет случайный характер, распределена нормально и некоррелирована. Модельные геологические представления дают основание связывать тектонические элементы с линейными отрицательными симметричными аномалиями остаточного магнитного поля. Алгоритм обнаружения при такой информации об аномалиях и помехах - поиск площадной аномалии по образу на основе коэффициента ранговой корреляции Спирмена. Оптимальные параметры окна выбирались таким образом, чтобы обеспечить заданную вероятность обнаружения, при этом использовалась информация о размерах аномалий остаточного поля, полученная при выделении остаточной компоненты.
Выделенные оси аномалий укладываются в протяженные линейные зоны. Применение статистического обнаружения позволило не только проследить разрывные структуры, но и выявить основные направления их простирания для бассейна в целом. Результаты обнаружения подтверждаются имеющейся геологической информацией и результатами космодешнфрирования.
ЗАКЛЮЧЕНИЕ
В итоге проведенных исследований разработана компьютерная технология обнаружения слабых аномалий на фоне случайных помех с выбором рационального алгоритма и его оптимальных параметров. При этом получены следующие результаты:
1. Выполнен обзор существующих алгоритмов обнаружения слабых аномалий на фоне случайных помех и реализующих их программных средств.
2. Предложена типизация алгоритмов обнаружения слабых геофизических аномалий, позволившая оценить полноту существующих, наметить пути для построения новых алгоритмов и выбрать алгоритм обнаружения, адекватный решаемой содержательной задаче.
3. Разработаны н опробованы на молельных и практических примерах новые алгоритмы обнаружения слабых аномалий в геофизических полях на основе непараметрических статистик.
4. Разработана компьютерная технология обнаружения слабых аномалий, которая была апробирована при решении геолого-геофизических и геоэкологических
Основные положения диссертационной работы изложены в печатных работах:
1. Непараметрическая адаптивная фильтрация результатов площадных геофизических съемок: Деп. в ВИНИТИ 1 сент. 1983г. №4973-83. Деп.- М., 1983,-8с. (совместно с Никитиным A.A. и Демурой Г.В.)
2. Методика комплексной адаптивной фильтрации сложных геофизических полей: Деп. в ВИНИТИ 31 окт. 1984г. №70187-84. Деп.- М„ 1984,- 12с. (совместно с Демурой Г.В.)
3. Автоматизированное производственное место геолога-геофизика на микро-ЭВМ. В кн.: Теория и практика геологической интерпретации гравитационных и магнитных аномалий. Алма-Ата, 1990, стр. 105 (совместно с Гавриловым Ю.Б. и Чесаловым Л.Е.)
4. Применение автоматизированной системы обработки геофизических данных для решения геоэкологических задач (на примере картирования зон активизации карстообразования в г.Москве). В сборнике материалов Всероссийской научно-технической конференции "Экология и геофизика". Дубна,
5. Обнаружение слабых геофизических аномалий на фоне помех случайной природы. - "Геоинформатюса" №6, М., 1996 г., стр. 22.
задач.
1995.
Подписано в печать Заказ 2. Тир. 100 экз.
113105 Москва, Варшавское ш., 8, ВНИИгеосистем
- Левин, Алексей Сергеевич
- кандидата технических наук
- Москва, 1997
- ВАК 04.00.12
- Технология пакетной обработки геофизических данных методами вероятностно-статистического подхода в программном комплексе "Коскад 3D"
- Методы адаптивной фильтрации и многомерного дисперсионного анализа в компьютерной системе обработки геофизической информации "КОСКАД 3D)
- Методика и компьютерная технология обработки и интерпретации гравимагнитных полей для построения геофизической основы при изучении структурно-тектонического строения
- Компьютерная технология обработки геофизической информации, организованной в профильные сети наблюдений методами вероятностно-статистического подхода
- Методика и технология обработки и интерпретации геофизических данных в скользящих окнах "живой" формы