Бесплатный автореферат и диссертация по геологии на тему
Классификация геоданных на основе моделирования "экстремальных объектов" при решении геолого-прогнозных задач
ВАК РФ 04.00.12, Геофизические методы поисков и разведки месторождений полезных ископаемых
Автореферат диссертации по теме "Классификация геоданных на основе моделирования "экстремальных объектов" при решении геолого-прогнозных задач"
МИНИСТЕРСТВО ЭКОЛОГИИ И ПРИРОДНЫХ РЕСУРСОВ РОССИЙСКОЙ ФЕДЕРАЦИИ
Всероссийский научно-исследовательский институт геологических, геофизических и геохимических геосистем (ВНИИГеосистем)
КЛАССИФИКАЦИЯ ГЕОДАННЫХ НА ОСНОВЕ МОДЕЛИРОВАНИЯ "ЭКСТРЕМАЛЬНЫХ ОБЪЕКТОВ" ПРИ РЕШЕНИИ ГЕОЛОГО-ПРОГНОЗНЫХ ЗАДАЧ
Специальность: 04.00.12. - Геофизические методы поисков и разведки месторождений полезных ископаемых
На правах рукописи
ВОРОНИН Александр Юрьевич
Автореферат диссертации на соискание ученой степени кандидата технических наук
. Москва, 1992 г.
Работа выполнена в Новосибирском государственном университете
(НГУ)
Научный руководитель:
Черемисина Евгения Наумовна, доктор технических наук, (ВНИИГеосистем, г.Москва)
Официальные оппоненты:
доктор физико-математических наук, профессор АЛ.Никигин, (МГРИ, г.Москва)
кандидат технических наук В.НДобрынин (ВИМС, г.Москва)
Ведущая организация - НПО "Сибгео" (г.Новосибирск). Защита состоится 199к г. в /У часов на
заседании Специализированного совета Д071.10.01 при Всероссийском научно-исследовательском институте геологических, геофизических и геохимических геосистем, г.Москва, 113105, Варшавское шоссе, д.8, конференц-зал.
С диссертацией можно ознакомиться в библиотеке ВНИИГеосистем. Автореферат разослан"
ЛЬ
1992 г.
Ученый секретарь /
Специализированного совета Ц^О^^ - В.СЛебедев
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
• • ;' /
Актуальность проблемы. Одной из важнейших задач народного ~-~1-хозяй(^гва является повышение эффективности геологоразведочных работ. Актуальность этой проблемы определяется, в частности, научно-технической программой 0.50-03 ГКНТ СССР на 1986-1990 г.г. и на период до 2000 г. "Разработать высокоэффективные геофизические методы и аппаратуру для поисков и разведки глубокозалегающих месторождений полезных ископаемых, включая нефть и газ". Одним из направлений, тесно связанных с этой программой, является эффективное использование комплексных геолого-геофизических данных и ЭВМ при решении геологоразведочных задач.
Успех применения математических методов и средств вычислительной техники при комплексной обработке геолого-геофизических данных существенно зависит от состояния методологии и теории геологоразведки, обеспечивающих постановку задач, интерпретацию и анализ результатов обработки. Поэтому развитие методологических и теоретических основ выделения перспективных геологических объектов по комплексу геолого-геофизической информации является актуальной проблемой.
По своей направленности диссертация примыкает к исследованиям ШАГубермана, в смысле понимания задач выделения объектов и их связи с задачами распознавания, к результатам, полученным Е.Н.Черемисиной, в плане развития компьютерной технологии распознавания образов.
Цель работы - разработать методолого-теоретические основы классифицирования геоданных на базе технологии распознавания образов, построить и применить на практике методику классификации геологических объектов, содержащую элементы экспертных оценок.
Основные задачи исследований,
1.0бобщение опыта применения распознавания образов для решения геолого-прогнозных задач, определение путей повышения эффективности распознавания.
2. Разработка процедуры анализа исходного эталонного материала и способов его коррекции.
3.Построение нового класса решающих правил, учитывающих требования экспертных систем, на основе экспертного определения экстремальных эталонных объектов.
4Лрименение предложенного подхода при решении практических геолого-прогнозных задач.
Научная новизна.
1.Впервые произведено разделение объектов распознавания на "экстремальные" и "ординарные", причем распознавание первых ведется с помощью экспертов, а вторых - формальными методами, используя новые специальные решающие правила.
2.Впервые сформулированы необходимые требования к исходному эталонному материалу для обоснованно!*) применения методов распознавания при решении геолого-геофизических задач.
ЗЛредаожен новый подход к оценке результатов распознавания. Результаты распознавания содержат не только показатель принадлежности объекта к образу, но и показатели сложности и надежности отнесения к образу.
Реализация и апробация работы. Предложенные в диссертации методолого-теоретический подход, схема постановки и решения задач, класс алгоритмов классификации геологических объектов внедрены в ПГО "Самаркандгеолопш", ЗапСибНИГНИ, НПО "СибГео", ВЦ СО РАН, ОИГТМ СО РАН.
Основные результаты диссертации докладывались на семинарах по вычислительным методам в геологоразведке в Новосибирске (1988 и 1990 гг.), в Тюмени (1991 г.), а также на совещаниях по интерпретации комплексных геофизических данных в Красноярске (1989 и 1991 гг.), и Алма-Ате (1991 г.).
Публикации и личный вклад в решение проблемы. Диссертация основана на теоретических, методологических и экспериментальных исследованиях, выполненных автором в Новосибирском государственном университете. Но результатам выполненных исследований опубликовано 4 печатных работы.
Основные теоретические и технологические результаты получены непосредственно автором. Им разработан и реализован на ЭВМ класс алгоритмов принятия решений на основе моделирования "экстремальных" объектов, выполнена детализация технологии распознавания образов, разработанной д.т.н. ЕН.Черемисиной. Методологические результаты по развитию понятийного базиса распознавания применительно к геологоразведке получены совместно с профессором Ю А.Ворониным.
Объем и структура работы. Диссертация состоит из введения, четырех глав, заключения, списка литературы, содержит 128 страниц машинописного текста, 14 таблиц. Список литературы включает 96 наименований.
Диссертация выполнена под научным руководством д.т.н. Е.Н.Черемисиной, которой автор выражает глубокую благодарность, а также искренне благодарит профессора ЮЛ.Воронина за руководство рядом методологических исследований и д.г.-м.н. ВЛ.Каштанова за участие в работе по решению практических прогнозных задач.
СОДЕРЖАНИЕ РАБОТЫ
Глава 1. Формальные задачи поиска полезных ископаемых и подходы к их решению на основе распознавания образов
Данная глава посвящена анализу связей формализованной схемы поиска полезных ископаемых и приемов использования методов распознавания образов для решения задач классификации геологических объектов.
Формализованная схема поиска и разведки месторождений полезных ископаемых (ПРМПИ) состоит из двух циклов работ: рекогносцировочного и поисково-оценочного. В результате проведения первого цикла определяются начальная область и конечный объект поиска, дается их характеристика, формулируются принимаемые теоретические предположения, фиксируются исходные экспериментальные данные, формулируются критерии для оценки качества поиска. Посково-разведочный цикл состоит из некоторого числа стадий. Каждая стадия делится на четыре подстадии, а каждая из подстадий делится на три этапа. В процессе ПРМПИ используются одни и те же операции выделения и описания геологических объектов различных рангов, способы их классифицирования и оценивания. Одна стадия отличается ог другой областью и объектами поиска. Подстадии связаны с выделением, разделением, упорядочением и оцениванием объектов стадии.
Логическая основа схемы ПРМПИ может быть интерпретирована так: в некоторой области поиска выделяются некоторые объекты поиска, которые затем разделяются на перспективные и неперспективные; далее первые упорядочиваются по степени перспективности и затем некоторые из них оцениваются с той степенью приближения, которая гарантирует отсутствие ошибочных оценок. Выделение, разделение, упорядочение и оценивание строятся на сходстве с уже известными промышленными объектами поиска и на исключительности объектов поиска, на предсказании объектов, которые пока еще неизвестны, но могут существовать. Эти задачи можно трактовать как задачи классификации геологических объектов. С формальных позиций операции выделения и разделения могут быть интерпретированы как задачи распознавания образов.
, Применение распознавания образов в геологии позволило решить широкий круг практических классификационных задач, поставить ряд новых проблем, изменило методолого-теоретические взгляды на описание объектов
исследования. Однако, это не привело к получению каких-либо принципиально новых практических следствий, получивших массовую проверку и общее признание: С одной стороны, это связано с тем, что основные усилия были направлены на детальную разработку различных частных алгоритмов в ущерб развитию методсшого-теоретических вопросов, с другой - во многом обусловлено спецификой применения распознавания в геологоразведке. Почти всегда первоначально приходится иметь дело с "образами внутри сознания конкретных специалистов". Переход- от таких "образов" к формализованным называется организацией образов. Этот процесс всегда должен предшествовать процессу распознавания. Для реализации процесса организации образов важно понять, как геологоразведчики выделяют объекты, описывают их, сравнивают между собой, фиксируют множества объектов и организуют в них образы (распознавание - лишь заключительный и притом самый простой этап предсказания в геологоразведке).
Среди многих факторов повышения эффективности распознавания главными являются совершенствование материала для распознавания и соответствующих априорных представлений. Необходимо уметь формально описывать, сравнивать и устанавливать отношения предпочтения на множестве эталонных объектов.
В работе дается следующее определение распознавания.
Пусть А - множество объектов, Ф - совокупность прямых (организующих) свойств объектов ак из А, а В - совокупность косвенных (распознающих) свойств. Затраты, связанные с сопоставлением объекту ак из А значений прямых и косвенных свойств Фк и Рк, обозначим С(ак ,Ф) и С(ак, Р). Из представлений о прямых и косвенных свойствах следует, что с(ак
,Ф)>>с(ак, Р). Множество объектов ¡) = {¿[¡}< на которых замерены прямые и косвенные свойства, назовем опорным. Пусть У^(Ао) " алгоритм
разбиения^ на классы ), Д0) ~ алгоритм разбиенияу!д на классы /=и
Построение 0) при фиксированных А, Ф, Рд назовем
т-1М
организацией образов, а построение УДА,) и \У*/(/4о) ПРИ фиксированных
Д Ф,Ао ~ распознаванием образов Ат(Р) ъА.
Следовательно, в данном понимании распознавание - это одновременно организация образов в пространстве прямых свойств и их распознавание в общепринятом смысле в пространстве косвенных свойств.
Описанные в данной главе исследования позволяют сформулировать первое защищаемое положение. Повышение эффективности использования распознавания при решении задач геологоразведки требует развития методолого-теоретических основ организации образов на базе экспертных оценок.
Глава 2. Анализ заданной ситуации при постановке и решении классификационных задач
В главе 2 определяются цели и содержание анализа заданных ситуаций. Главная цель анализа заключается в выяснении, в какой мере имеющиеся база знаний и база данных пригодны для постановки задачи, в каких случаях эти базы необходимо совершенствовать. Первые разработки по анализу задачных ситуаций были сделаны Е.Н.Черемисиной. В данной работе эти разработки развиты и дополнены. В частности, дается краткое описание этапов анализа задачных ситуаций.
На первом этапе выясняется: как именно выделены исходные объекты, какие свойства у них являются прямыми, а какие косвенными, имеются ли у эксперта представления о важности тех или иных косвенных свойств.
На втором этапе выясняются особенности распознаваемых образов А / и А2, в частности, выясняется, может ли принадлежность объектов к ним бьггь установлена без привлечения экспертов (на основе прямых свойств и алгоритма организации образов).
На третьем этапе фиксируются исходные установки распознавания: было ли при формировании эталонного материала заранее известно, каким алгоритмом предполагалось воспользоваться, имеется ли возможность дополнить эталонный материал новыми объектами или новыми свойствами.
На четвертом этапе проверяется соответствие эталонного материала формальным требованиям, которые формулируются следующим образом:
-количество косвенных свойств должно быть больше числа образов;
-объектов в каждом образе должно быть не меньше числа свойств;
-любое значение косвенного свойства должно встречаться хотя бы один раз;
-не должно быть объектов, описанных одинаковыми векторами свойств и принадлежащих разным образам.
В случаях несоответствия реальной задачной ситуации перечисленным требованиям выполняется преобразование исходного эталонного материала, в частности, определяются информационные веса косвенных свойств, минимизируется количество свойств, меняются шкалы измерений свойств, удаляются дублирующие объекты.
Только после процедуры анализа и корректировки задачной ситуации, когда установлено, что предложенный эталонный материал не противоречит априорным представлениям эксперта и намечены пути формализации этих представлений, можно переходить к постановке задачи распознавания.
Процесс постановки задачи включает фиксацию способа обнаружения возможных ошибок распознавания, задание цен ошибок распознавания первого и второго родов, а также цены отказов от распознавания, задание критерия оценки эффективности распознавания и способов его вычисления в конкретных ситуациях. Здесь же выполняется упорядочение всех факторов повышения качества распознавания: выбор класса алгоритмов распознавания, переописание материала для распознавания, переход к новым образам.
Для оценки качества распознавания введены показатели надежности и сложности. При этом, надежность распознавания характеризуется степенью компактности, перекрытия и представительности эталонного материала. Степень сложности распознавания зависит от положения распознаваемого объекта относительно эталонов (конкретные формулы вычисления этих параметров приводятся в третьей главе).
Под решением задачи распознавания предполагается понимать следующую последовательность операции:
-вычисление значений параметров в мерах сходства на основании заданных условий предпочтения одной меры перед другой;
-вычисление значений параметров в решающем правиле по заданному критерию качества распознавания;
-определение для распознаваемого объекта показателя сложности распознавания, указание образа, к которому он принадлежит и вычисление показателя надежности распознавания.
За постановку задачи отвечают геологи (геофизики) и математики, за решение - только математики. Решение задачи распознавания при этом сводится только к вычислению тех или иных заданных показателей и нахождению значений тех или иных параметров по заранее заданным условиям.
Таким образом, можно сформулировать следующее защищаемое положение. Анализ задачной ситуации обеспечивает эффективное использование представлений экспертов при постановке и решении классификационных геолого-геофизических задач.
Глава 3. Разработка алгоритмов организации и распознавания образов на основе моделирования "экстремальных объектов"
Известно, что при решении классификационных задач в экспериментальном материале присутствуют объекты, легко распознаваемые экспертом и трудно распознаваемые. Разработанные до настоящего времени алгоритмы используют знания эксперта на уровне оценки принимаемых решений в классе трудно распознаваемых объектов. В данной работе предполагается другой подход: формализация знаний эксперта в классе легко распознаваемых объектов, и на этой основе построение формального решающего правила. Легко распознаваемые объекты, как правило, находятся ц "вершинах пространства свойств". Представления эксперта-геолога (геофизика) о принадлежности их к одному из заданных образов наиболее четкие.
Для дальнейших конструкций вводятся представления об
** *
экстремальных значениях отдельных свойств [р и мера сходства между которыми равна нулю. Под экстремальными объектами понимаются такие, у которых все косвенные свойства принимают экстремальные значения. Если у объекта хоть одно косвенное свойство не экстремально, то такой объект называется ординарным. Очевидно, что экстремальные объекты как раз и находятся в "вершинах пространства свойств" и, следовательно, значительная часть из них должна легко распознаваться. С другой стороны, они
практически не встречаются в эталонном материале. Смоделируем объект,
** ** »* **
более характерный для первого образа ^ :, ^ ,..., ^ ).
Противоположный ему объект д^р, , будет более
характерен для второго образа. Такие экстремальные объекты назовем полюсами образов. Взяв их за основу, перестановкой одного значения,
сконструируем еще - опорных пар. ** ** •*
а'^ъ (г, . г, . •••> f« ) * * * «
¡¿ЕЛ,. Г».-- Г.) *« ** «» •*
аз (г, . г, . г„) » « » «
•• . **, *щ **
ЗшИ-Рт^М! » Г1 « •••> / * « » . »
а.«^...^!»Гг > •••> Гш^
Смоделированные опорные пары противоположных экстремальных объектов позволяют:
-дополнить и улучшить исходный эталонный материал; -наметить пути построения диалога с экспертом; -разработать широкий класс решающих правил; -осуществить структурное задание эталонного материала. Объясняя последнее, следует напомнить, что под вещественным представлением эталонного материала подразумевается матрица "объекты-свойства", а под структурным представлением - матрица "объекты-опорные
пары экстремальных объектов". Если мера сходства эталонного объекта с
больше, чем с то относительно этой пары ему приписывается 1. Если меньше, то -1. Если эти меры сходства равны, то 0.
Обсуждаются преимущества, которые даются вещественным и структурным представлениями эталонного материала по сравнению с его только вещественным представлением для формального описания этого материала.
Диалог с экспертом при распознавании опорных пар противоположных экстремальных объектов имеет следующие немаловажные особенности:
-доя распознавания предлагаются не просто экстремальные объекты, а пары противоположных экстремальных объектов;
-каждая пара и каждый объект из нее предварительно описываются некоторыми характеристиками, основанными на минимальных и максимальных мерах сходства их с эталонными объектами из первого и второго образа. В частности, вводится показатель надежности пары:
Н'Ла.а>=1/8((Л (дГ,А,)+Л (Л".Л«))*(1-((Л~(а:.л.,)-Л (дГ,л,)+(Л (а"./и-
Ло| Ли
где /¿в" - количество объектов первого образа, больше похожих на , чем на а.;
- количество объектов второго образа, больше похожих на чем
на а,.
Этот показатель отражает, насколько компактно располагаются образы относительно противоположных объектов данной пары. Для построения
решающих правил выбираются только те опорные пары, в которых объект ¿7,
эксперт отнёс к первому образу, а объект - ко второму.
В простейшем случае, когда для распознавания объекта используется только одна опорная пара (¿^, то решающее правило строится
следующим образом: если .¿4)>Л(*{.а) и Н(£<си))е1> то Л
принадлежит первому образу, распознается со степенью надежности отнесения к образу, равной показателю надежности пары, и степенью сложности отнесения к образу, равной
Меи- к, - о
если ^(¿Ци А(а]ак))£2> то си принадлежит второму образу с теми же значениями степеней надежности и сложности, что и в первом случае; если же не выполнено ни одно из этих двух условий, то объект надежно не распознается. Значения е\ и ег выбираются в зависимости от
конкретной задачи, опираясь на результаты экзамена всего эталонного материала относительно этой опорной решающей пары.
В диссертации рассматриваются и более сложные алгоритмы распознавания, использующие несколько решающих пар. Например, выбранные экспертом пары ранжируются по показателю надежности и каждая последующая пара распознает те объекты, которые предыдущей парой отнесены в отказ, цикл работает, пока либо не распознаны все объекты, либо не использованы все пары.
Особо формулируется основная методолого-теоретическая посылка распознавания: наличие формального описания эталонного материала является необходимым условием учета предшествующего опыта и развития теории распознавания. Обсуждаются возможности использования показателей формального описания эталонного материала для выбора класса алгоритмов распознавания и эффективного дополнения экспериментальных данных. В частности, предлагаются следующие показатели формального описания представительности эталонного материала
1, если т
2, если то <ги,,< т+ 2 А(Д,Г)= 3, еслит+ 2< ця<2т
4, если 2т < цы < 2"
5, если 2" < П„>
где т - число косвенных свойств, цы - число объектов в образах, / = 1,2, и компактности образов
и /. .А) - - && -
1 По1 По2 По 1 По I
где /^С/^) - число объектов первого образа, располагающихся ближе к значению f ^, чем к а ц,^/) - наоборот.
Аналогично, и для и
Таким образом, можно сформулировать следующее защищаемое положение. Алгоритмы моделирования "экстремальных объектов" позволяют
классифицировать геоданные, дополнять и улучшать эталонный материал и тем самым обеспечивают повышение эффективности и надежности при решении геолого-геофизических задач.
Глава 4. Применение алгоритмов моделирования "экстремальных объектов" для решения задач классификации локальных структур
Эта глава посвящена практическому применению разработанной технологии для прогноза нефтегазоносности локальных структур юга Западной Сибири.
В первом примере кратко излагаются результаты проверки гипотезы связи пилообразных микромагнитных аномалий чехла перспективных земель Юрольской впадины с нефтегазоносными локальными структурами. При этом требовалось:
1. Установить, имеется ли закономерная связь между наличием залежей углеводородов и микромагнитньши аномалиями над локальными структурами.
2. Определить, можно ли по признакам, снятым с микромагнитных аномалий, установить, с какой залежью мы имеем дело - нефтяной или газовой.
3. Осуществить прогноз нефтегазоносности 84 локальных структур. Эти задачи решены с помощью конкретного алгоритма моделирования
экспериментальных объектов (МЭО-1). В обучающую выборку были включены 21 объект первого образа (нефтегазоносные структуры) и 15 объектов второго образа (пустые структуры).
Каждый объект был описан шестью признаками:
-наличие микромагнитных аномалий над контуром структур -(есть,
нет),
-количество таких аномалий в контуре - (0-30 шт.),^у, -суммарная интенсивность (в НТл) - (0-50) ; -средняя интенсивность (в НТл) - (0-5) -суммарная длина аномалий (км) - (0-16) -средняя длина аномалий (км) - (0-3.0) $ .
Анализ заданной ситуации. Прямое свойство - наличие углеводородов - установлено бурением. Косвенные свойства взяты с карт микромагнитных
аномалий. Свойства и f сильно взаимосвязаны; первое дает качественную характеристику признака, а второе - количественную. Свойство f4 вычисляется отношением J) к а отношением
Вывод: свойства f¡, и $ можно удалить из описания объектов.
Экспертом свойства f и fJ были удалены, а f4 оставлено с целью усиления признаков наличия магнитных микроаномалий в контуре для нефтегазоносных структур.
На момент решения задачи 5 структур находилось в стадии проверки бурением, в последующем они были использованы для оценки "Устойчивости" данного алгоритма При этом, под "устойчивостью" понимается степень изменения экстремальных объектов при добавлении новых экспериментальных данных. В данном случае добавление пяти экспериментально проверенных пустых структур не привело к изменению решающего правила. Все эти структуры были распознаны правильно.
При анализе гистограмм расположения объектов по каждому свойству было установлено, что объекты второго образа расположены достаточно компактно и больше тяготеют к минимальному значению. Объекты же первого образа, хотя и тяготеют к максимальным значениям, располагаются вытянуто.
На основе этого была сформирована первая пара противоположных экстремальных объектов
^:/гГ(30;50;5;16); ¿: ^;(0;0;0;0)
Среди эталонного материала оказался аналог объекту д, аналогов же
(11 не оказалось. Опираясь на эту пару, были смоделированы еще четыре опорные пары, которые экспертом были забракованы в связи с полной нереальностью существования. Объект эксперт отнес к первому образу, а
объект (1К - ко второму.
Эталонному материалу были приписаны некоторые формальные показатели, в частности:
1. Представительности:
МДА,) = 0.95 Й.(/,А,) = 0.95
М/,А)= 0.9
Анализируя их, можно утверждать, что материал представителен. Образы в пространстве свойств компактны. Структурное разнообразие невелико, но это не так важно в связи с тем, что эксперт оставил всего одну опорную пару.
На основании проведенного анализа задачной ситуации были сделаны следующие выводы. Имеется связь между залежами УВ и локальными магнитными аномалиями незначительной интенсивности. При анализе объектов первого образа было установлено, что количество микроаномалий и их интенсивность в значительной степени зависят не только от количества, но и от качества флюидов в залежах. Так, например, над чисто нефтяными залежами (Останкинская, Северо-Останкинская, Чкаловская и др.) фиксируются единичные низкоинтенсивные аномалии Та, тогда как над газовыми и газоконденсатными месторождениями (Казанское, Лугинецкое, группа Сильгинских и др.) отмечается значительное количество микроаномалий.
На основании всего сказанного можно сделать вывод, что предложенный эталонный материал и априорные представления эксперта не противоречат друг другу. Формальные показатели достаточно высоки. Это дает основание на получение достоверных результатов решения задачи. Перейдем к постановке задачи.
Постановка задачи. Была выбрана конкретная мера сходства. Был установлен критерий оценки эффективности Р1= 0 и рг = 0, где Р, и Р2 -ошибки первого и второго рода. Был рассчитан показатель надежности пары.
Решение задачи. Пороговые значения £| и £г для решающей пары были рассчитаны на основе эталонного материала, а приравнивалось к
максимальной мере сходства с объектами из второго образа, а ег - к
максимальной мере сходства д, с объектами из первого образа.
С такими значениями £1 и £г был проведен экзамен по всему эталонному материалу, который показал, что две нефтегазоносные структуры и три пустые структуры попали в отказ, что соответственно составляет от объектов первого образа менее 10%, а объектов второго образа - около 20%. Результаты экзамена экспертом были признаны удовлетворительными. Используя это решающее правило, была проведена классификация локальных структур. Из 84 локальных структур 18 были распознаны как перспективные, проранжированы по степени сложности отнесения к образу и рекомендованы к бурению.
Во втором практическом примере кратко излагаются результаты анализа задачной ситуации и последующего прогноза нефтегазоносности локальных структур юга Западной Сибири.
В качестве эталонного материала было взято 10 месторождений и 33 пустые структуры, описанных 50 структурно-тектоническими признаками.
Требовалось выбрать информативную совокупности свойств, построить решающее правило и осуществить прогноз 71 локальной структуры.
В информативную совокупность свойств были выбраны свойства, у которых показатель компактности больше 0.3. Таких свойств оказалось 11. Используя их, было смоделировало 12 опорных пар. Значительным отличием от предыдущего примера является то, что все эти пары эксперт распознал и оставил в выборке. Аналогов этим экстремальным объектам в эталонном материале не было. Формальные характеристики эталонного материала:
1. Представительность:
2. Компактность по свойствам:
Ж/.,А»)
3. Показатель структурного разнообразия:
й(Ло,.*)= 0.44
По рассчитанным формальным характеристикам эталонного материала была определена его недостаточная представительность , которая преодолена добавлением в каждый образ по 12 опорных экстремальных объектов. Низкая компактность на этапе постановки задачи указывает на недостаточно удачное описание объектов косвенными свойствами.
Был выбран критерий />,= 0 и Р2 = 0. Было решено воспользоваться алгоритмом МЭО-2, использующим последовательное применение опорных пар. Пары были проранжированы по показателю надежности.
и е: для каждой пары выбирались так, что первая приравнивалась к
максимальной мере сходства с объектами из второго образа, а вторая
приравнивалась к максимальной мере сходства (1< с объектами из первого образа.
Используя это решающее правило и заданный критерий, экзаменационная проверка всего эталонного материала показала, что в область отказа попали два месторождения и пустые структуры. В результате прогноза 71 локальной структуры в класс перспективных вошли 11, в класс пустых - 18, а 42 оказались в области отказа. Большое количество отказов заставило вернуться на этап постановки задачи и выбрать менее жесткий критерий
Ро = 0' ар + ьр,-* пип,
где р и р2 - ошибки первого и второго рода, ро - отказ от распознавания, а^^и^- цена этих показателей.
В данном случае было принято, что Со = С1~Сг Д™ каждой пары опорных объектов были подобраны значения £| и на основе мер сходства экстремальных объектов с эталонными объектами. При экзамене эталонного материала были распознаны все структуры с ошибками 33% второго рода и 1% первого рода.
При прогнозе 71 локальной структуры к перспективным было отнесено 14 структур, к пустым - 46, в отказы попало 11 структур. В результате проведенных буровых работ было разбурено 42 локальные структуры. К
сожалению, вследствие ряда объективных и субъективных причин из 14 нами рекомендуемых перспективных структур разбурено только 3.
Из перспективных структур Ургулъсхая и Марьяновская имели признаки нефтегазоносности, а З-Калгачевская содержала в коллекторе воду.
Проверка неперспективных структур дала ошибку второго рода равную
15%.
Полученные результаты показали принципиальную возможность применения разработанного подхода к решению классификационных задач при прогнозе неФтегазоносиооти локальных структур юга Западной Сибири.
ЗАКЛЮЧЕНИЕ
Основные результаты работы сводятся к следующему.
1.Конкретизированы цели и этапы анализа задачной ситуации, сформулированы необходимые требования к исходному эталонному материалу для обоснованного применения приемов и методов распознавания образов.
2,Обоснована процедура дополнения исходного эталонного материала за счет моделирования "экстремальных объектов".
З.Разработан и реализован на ЭВМ алгоритм распознавания, используюший последовательное применение пар противоположных "экстремальных объектов".
4,Определена схема взаимодействия эксперта-геолога (геофизика) и математика при постановке и решении геолого-геофизических задач на ЭВМ.
5.Решен ряд практических задач прогноза нефтегазоносности локальных структур Западной Сибири.
Основные положения диссертационной работы изложены в четырех опубликованных работах:
1.К вопросу о построении АРМ для геологопрогнозиста. В кн. Теоретическое и алгоритмическое обеспечение задач вычислительной геологоразведки. ВЦ СО АН СССР, Новосибирск, 1987, с. 49-58.
2.0 задачах анализа геологоразведочных данных. В кн. Методологическое и алгоритмическое обеспечение геологоразведочных вычислительных центров. ВЦ СО АН СССР, Новосибирск, 1990, с. 84-101.
3.0 распознавании в геологии моделированием экстремальных объектов. Геология и геофизика, 1991, N 3, с. 38-49.
4.0 структурном представлении материала для распознавания. В кн. Вычислительные методы при комплексной интерпретации геофизических и геохимических данных. ВЦ СО РАН, Новосибирск, 1991, с. 52-61.
Отпечатано на ротапринте ВНИИГеосистем Заказ 2.9$ Тираж 100 экз.
113105 Москва, Варшавское шоссе, д.8. ВНИИГеосистем
- Воронин, Александр Юрьевич
- кандидата технических наук
- Москва, 1992
- ВАК 04.00.12
- Компьютерная технология статистической многоальтернативной комплексной интерпретации для решения прогнозно-поисковых задач рудной геофизики
- Разработка согласованной базы геоданных на основе множественно-реляционной модели
- Компьютерная технология комплексного анализа и интерпретации геолого-геофизических данных на региональных профилях
- Метод структурного анализа комплексных геолого-геофизических данных с целью прогноза и поисков полезных ископаемых
- Исследование и разработка структур баз геоданных информационно-телекоммуникационных систем