Бесплатный автореферат и диссертация по биологии на тему
Механизмы процесса узнавания изображений разной сложности
ВАК РФ 03.00.13, Физиология
Автореферат диссертации по теме "Механизмы процесса узнавания изображений разной сложности"
А
- .
.■О
РОССИМСКАЯ АКАДЕМИЯ НАУК ИНСТИТУТ ВЫСШЕЙ НЕРВНОЙ ДЕЯТЕЛЬНОСТИ И НЕЙРОФИЗИОЛОГИ»
На правах рукописи УДК 612.843.63:612.843.721
КРОЛЬ Владимир Михайлович
МЕХАНИЗМЫ ПРОЦЕССА УЗНАВАНИЯ ИЗОБРАЖЕНИЙ РАЗНОЙ СЛОЖНОСТИ
03.00.13 - Физиология человека и животных
Автореферат диссертации на соискание ученой степени доктора биологических наук
Москва, 1993
Работа выполнена в- отделе моделирования познавательной деятельности НИИ информатики Московского института радиотехники, электроники я автоматики (Ректор - академик РАН Н. Н. ЕВТЙЖЕВ)
ОФИЦИАЛЬНЫЕ ОПЮНЕНШ:
академик РАО, доктор психологических наук В. Е ЗИНЧЕНКО доктор биологических наук, профессор И. А. ШЕВЕЛЕВ доктор биологических наук В. Б. ПОЛЯНСКИЙ
ВЕДУЩЕЕ УЧРЕЖДЕНИЕ: ■ Научно исследовательский институт мозга РАМН (директор академик РАМН О.С. АДРИАНОВ)
Защита состоится 1994 г. б час о е
на заседании специализированного^совета Д-003.10.01 при Институте высшей нервной деятельности и нейрофизиологии РАН по адресу: 1174856 Москва, ул. Бутлерова, д. 5а.
О диссертацией можно ознакомиться в библиотеке Института высшей нервной деятельности и нейрофизиологии РАН
Автореферат разослан <Тг.. 1993 г.
Ученый секретарь специализированного совета доктор биологических наук / 0. X. КОШТОЯНЦ
Актуальность исследования. Зрительная система живых организмов является аппаратом,предназначенным для получения сведений о внешней среде, необходимых для выработки команд регулирования поведения.Одной из основных задач физиологии зрения является выяснение механизмов восприятия и узнавания объектов.Работа всех отделов зрительной системы направлена в конечном счете на решение этой задачи.
Центральные вопросы работы зрительной системы при этом в существенной степени связаны с проблемами инвариантного выделения на сложной зрительной сцене на фоне других объектов и шумов . фигур определенного типа, определения характеристик этих объектов и их классификации.При этом зрительная система должна выполнять анализ сцены в соответствии с текущими требованиями и мотивациями организма,т.е. в соответствии с решаемой в данное время поведенческой задачей (Э.А.Асратян.В.П.Зинченко, П.В.Симонов, О.С.Адрианов и др.). Изучение активного характера зрительного восприятия имеет, таким образом^существенное значение в связи с вопросом организации целенаправленного поведения организма.
Нейрофизиологические и психофизические механизмы работы зрительной системы в процессе восприятия интенсивно разрабатываются в" настоящее время (В.Д.Глезер, А.М.Йваницкий, Л.Й.Леуши-на, Н.Н.Любимов, Э.А.Констандов, Н.Ф.Подвигин, В.Б.Полянский, Е.Н.Соколов, А.Я.Супин, Л.А.Шевелев, М.С.Шехтер и др.)-
Изучение различных аспектов зрительного восприятия направлено на выяснение таких важных вопросов как работа механизмов обобщенного описания формы и классификации объектов, пространственная организация обработки зрительной информации, механизмы текстурного анализа, стереозрения.
В настоящее время при комплексном подходе, сочетающем применение современных методов психофизики,электрофизиологии и компьютерного моделирования становится реальной эффективная разработка этих вопросов.
С другой стороны решение перечисленных проблем имеет значение не только для развития теории переработки информации в зрительной системе живых организмов.Получаемые данные актуальны с точки зрения их непосредственного использования для разработки
и построения биоподобных роботов-манипуляторов,используемых для автоматизации производства, работы в труднодоступных местах,а также для образного представления информации,организованной адекватно характеристикам восприятия оператора человеко-компь-ютерных систем управления.
Цель и задачи исследования. Анализ данных литературы, касающихся различных сторон проблемы зрительного узнавания, показывает существование большого количества работ, посвященных исследованию вопросов микрогенеза восприятия, соотношения симультанных и сукцессивных процессов, в частности, роли контекста в ходе восприятия, эффектов преобладания целого над частью, иерархии признаков описания изображений.С другой стороны существуют данные,показывающие наличие и некоторые характеристики работы нейронов, реагирующих на сложные элементы формы объектов.
Тем не менее целостная картина процесса зрительного узнавания включающая данные макро- и микроуровней изучения, остается не ясной, Существует разрыв между результатами, описывающими проблему узнавания на нейронном уровне, и результатами, описывающими макроуровень процесса узнавания. Этот разрыв касается определения этапов узнавания, их последовательности, характеристик, структуры инвариантных описаний классов зрительных объектов и т.д.
Анализ литературных данных приводит, таким образом, к формулированию следующих основных задач исследования.
1. Психофизическое изучение временного развития процесса восприятия формы изображений разной сложности,анализируемых в условиях различных зрительных шумов.Определение основных характеристик этапов классификации и идентификации воспринимаемых фигур. Формулирование системы представлений о структуре перцептивного, эталонного описания класса зрительных объектов и об основных этапах и стратегии работы зрительной системы в ходе процесса узнавания.
2. Определение взаимоотношений между ходом текстурного анализа и процессами описания формы элементов текстур. Психофизическое изучение соотношений интегральных и локальных механизмов текстурного анализа.
3 Определение с помощью синтезированных на ЭВМ и не имеющих
монокулярных признаков глубины стереограмм роли операций анализа формы фрагментов в процессе стереовосприятия.
Научная новизна работы.В данной работе проведено комплексное изучение монокулярных и бинокулярных закономерностей и механизмов зрительного восприятия. В работе впервые установлены, следующие явления и закономерности.
1. Измерение порогов восприятия формы изображений в условиях прямого и обратного паттернового маскирования показало, что пороговое время предъявления тестовых фигур, необходимое для их восприятия, определяется степенью сходства тестовой фигуры и маскирующего изображения.
Полученные данные позволяют сделать вывод, что обработка изображений на центральных стадиях опознания является фрагмент-но специфичной и осуществляется многоуровневой структурой, анализирующей различные характеристики формы.
2. Показано, что изменение условий восприятия (смена маскирующих изображений или переход к режиму направленного поиска объектов) приводит к существенному варьированию хода процесса узнавания. Данный эффект проявляется в изменении пороговых характеристик отдельных стадий узнавания, вплоть до выпадения одних и появления других стадий.
3. Систематическое измерение порогов стадий узнавания и анализ ошибок, имеющих место на стадиях частичного, описания, оценочной классификации и идентификации тестовых фигур, привели к выводу, что узнавание объекта осуществляется путем проведения операций генерации вариантов разбиения изображения на фрагменты, а также операций выдвижения и проверки гипотез об отдельных фрагментах, их характеристиках и характеристиках взаимного расположения постепенно усложняющихся групп фрагментов.
4. В результате нейрофизиологических экспериментов по изучению закономерностей отображения зрительного поля в зрительную кору мозга подтверждены выводы о значимости характеристик взаимоотношений групп фрагментов различных уровней сложности. Показано сохранение при отображении в пространство зрительной коры подобия малых элементов анализируемых фигур, сохранение величин углов между любыми линиями фигур при одновременном искажении формы больших фрагментов (конформность отображения).
5. Полученные экспериментальные данные о временном ходе процесса восприятия формы изображений разной степени сложности
и зашумленности позволили сформулировать положение о узнавании как об иерархическом контекстно - управляемом поиске фрагментов, характеристики которых удовлетворяют критериям перцептивного эталонного описания класса объектов.
6. В работе показано, что процесс восприятия текстур и выделения границ между текстурными областями включает в себя частично интегральные и в основном локальные стадии обработки. Процесс тесно связан с операциями усложняющегося описания формы фрагментов, составляющих текстурные области. На основании полученных экспериментальных данных разработана модель текстурного анализа, сущность работы которой заключается в определении различных характеристик формы элементов текстур и выявлении характеристик, имеющих близкие значения на компактном множестве фрагментов.
Результатом работы модели является генерация естественных для восприятия вариантов разбиения сложного текстурного изображения на отдельные текстурные области, выступающие в дальнейшем как целостные единицы восприятия. Окончательный выбор варианта разбиения происходит после сопоставления характеристик текстурных областей с критериями перцептивного эталонного описания.
7. Сравнительное изучение восприятия синтезированных на ЭВМ и не имеющих монокулярных "ключей" стереограмм из точек,линий и символов свидетельствует в пользу активного участия в ходе сте-реовосприятия операций анализа формы фрагментов. Время реакции при восприятии стереофигур, состоящих из имеющих форму фрагментов (линий и символов) мало зависит от наклона стереофигуры вглубь, тогда как время реакции восприятия точечных стереоизображений в этом случае резко растет.
8. На основании полученных экспериментальных данных сформулирована гипотеза -о "полоеовом" механизме решения одной из основных задач стереозрения - задачи идентификации пар неточечных фрагментов двух стереограмм. Разработана и реализована в виде программы для ЭВМ модель процесса стереовосприятия, определяющая расстояния до элементов зрительной сцены на основании анализа информации входной стереопары изображений.
Практическое значение работы.
1. Полученные экспериментальные результаты и следующие из модели зрительного узнавздия выводы о характеристиках пофраг-ментнои обработки изображений в процессе их узнавания и класси-
-о- ■
фикации полезны для использования при разработке способов образного представления данных для автоматизированных рабочих мест (АРМ) операторов человеко-компьютерных систем.
2. Полученные данные о механизмах восприятия сложных, естественных текстур позволили разработать и реализовать в виде программы для ЭВМ принципиально новую модель процесса текстурного анализа. Модель осуществляет выделение и охаракте-ризацию сложных текстурных областей, играющих роль целостных единиц в ходе дальнейшего узнавания.
3. На основании данных, полученных при изучении бинокулярного зрения разработана и реализована на ЭВМ модель процесса стереовосприятия. Модель на основании двух плоских сетчаточных изображений позволяет определять удаленность от наблюдателя любых элементов зрительной сцены.
Результаты изучения характеристик стереозренияия (число стереопланов, временной ход процесса стереовосприятия ) могут быть использованы при разработке способов представления информации человеку -оператору путем кодирования параметров объекта управления удаленностью элементов сцены от наблюдателя.
Показано, что нарушение работы предложенного "полосового" механизма идентификации пар фрагментов двух стереоизображении играет важную роль в возникновении ряда форм косоглазия.
4. Полученные в работе экспериментальные и теоретические результаты использованы при чтении курсов психофизиологии восприятия в эргономики в Московском институте радиотехники, электроники и автоматики.
Основные положения, выносимые на защиту.
1. Изучение временных этапов и анализ характерных ошибок восприятия формы изображений позволили сформулировать положение об узнавании как о процессе направленного поиска на зрительной сцене фрагментов, удовлетворяющих критериям перцептивного эталонного описания соответствующего класса объектов. Процесс поиска является перестраиваемым, контекстно управляемым и проводится путем выполнения операций генерации вариантов разбиения изображении на фрагменты, а также операций выдвижения и проверки гипотез о характеристиках отдельных фрагментов и характеристиках взаимоотношения сложных групп Фрагментов.
2. Механизмы текстурного анализа и стереовосприятия, имеющие место в ходе процесса узнавания, основаны на многоэтапном
усложняющемся процессе анализа формы фрагментов.
3. Текстурный анализ включает в себя интегральные, локальные и собственно текстурные этапы, сущность которых заключается соответственно в постепенно усложняющейся охарактеризации фрагментов, составляющих текстурные области, и выделении самих областей и границ между ними. Важная черта текстурного анализа заключается также в порождении вариантов разбиения на текстурные области с последующим отбором тех вариантов, которые удовлетворяют критериям перцептивных эталонных описаний и рассматриваются в дальнейшем как целостные единицы восприятия.
4. В работе сформулирован "полосовой" механизм решения одной из основных задач стереозрения - задачи идентификации пар фрагментов двух стереограмм. Предложенный "полосовой механизм отбора соответствующих пар среди множества фрагментов основан на измерении элементарных характеристик формы сравниваемых фрагментов.
В работе показано, что нарушение работы "полосового" механизма играет важную роль в возникновении некоторых форм косоглазия.
Апробация диссертационного материала. Результаты диссертации доложены и обсуждены на III,IV» TI и VIII Всесоюзных конференциях по нейрокибернетике (Ростов-на-Дону, 1967,1970,1976, 1980,1983),I Всесоюзной конференции по проблемам биологической • и медицинской кибернетики (Москва,1971), Республиканской школе по нейробионике (Канев,1971),II симпозиуме по физиологии сенсорных систем "Физиология зрения" (Ленинград,1973), IV симпозиуме по физиологии сенсорных систем (Ленинград, 1976),IV Международной объединенной конференции по искуственному интеллекту (Москва,1975), V Всесоюзном съезде психологов (Моек-ва,1977), II Международной конференции стран членов СЭВ (Ленинград, 1978) , VII Всесоюзном съезде психологов (Москва,1982), Биофизическом конгрессе (Москва,1982), VI Всесоюзной конференции по инженерной психологии (Москва, 1984), XIII и XV научно-методических конференциях МЙРЭА по новым методам и средствам обучения (Москва,1989,1991), Международной конференции "Взаимодействие человека с компьютером"(Москва, 1993).
Публикации.Основное содержание диссертации опубликовано в 32 печатных работах.
Объем работы.Диссертация состоит из следующих разделов:
введение, обзор -литературы. ' методика, результаты, обсуждение результатов, выводы, список литературы. Работа изложена на 405 страницах машинописного текста, содержит 51 таблицу, 41 рисунок. Список литературы содержит 132 русских я 373 иностранных наименования.
Методы исследования.
Исследование проводилось при использовании методов психофизики, электрофизиологии и компьютерного моделирования.
Психофизические методы. Работа проводилась с 65 здоровыми испытуемыми обоего пола в возрасте от 18 до 40 лет. с нормальным или корректированным до нормы зрением. В качестве тестовых фигур использовались разные типы черно-белых, контурных или полутоновых изображений: паттерны из параллельных линий и полос, одинаковой длины, геометрические фигуры и их комбинации, схематические изображения лиц, одиночные предметные изображения, полутоновые изображения реальных текстур и лиц людей, компьютерно синтезированные стереопары, лишенные монокулярных "ключей" узнавания.
В экспериментах использовались различные типы искажений и зрительных шумов: пересечение и продление линий тестовых фигур, раздвяжение их частей я др. Тестовые фигуры предъявлялись з центре экспозиционного поля после сигнала готовности, их размер в разных сериях находился в пределах 1,5 - 3.0°. Яркость изображений имела порядок 7-10 люкс.
В качестве маскирующих использовались шумовые и паттерновые изображения разных типов, детально описанные при изложении результатов соответствующих экспериментов.
3 экспериментах по изучению монокулярных характеристик узнавания использовался трехканальный тахистоскоп с электронным блоком управления, обеспечивающим независимую регулировку длительности предэкспозиционного. экспозиционного и послеэкспози-ционного полей. Ввиду того что в разных сериях длительности экспозиции находились в пределах от 2 до 300 не. фронты экспозиционного поля были доведены до величин порядка 2-3 мс. Минимальный шаг роста экспозиции равнялся 2-3 мс. Маскирующее поле предъявлялось непосредственно после окончания времени экспозиции тестового изображения. Пороговым временем считалось время предъявления тестовой фигуры, необходимое для ее узнавания.
При измерении времени реакции тестовые фигуры предъявлялись
з тахистоскопе на неограниченное время при отсутствии постэкспозиционного маскирования. Испытуемые обучались нажимать указательным пальцем на одну из клавиш, расположенных розеткой. При этом каждая из клавиш символизировала то или иное тестовое изображение; количество клавиш соответствовало числу тестовых фигур. Включение счета времени реакции происходило одновременно с предъявлением тестового изображения непосредственно от управляющего блока тахистоскопа.
Для синтеза стереоизображений, лишенных монокулярных ключей узнавания, были разработаны компьютерные программы, поточечно определяющие координаты элементов тестового объекта на правой и-левой стереограмме. В качестве тестовых фигур использовались пандусы, пары плоскопараллельных плоскостей, лестницы с варьирующим числом ступенек, куполообразные фигуры. Для рисования стереограмм использовался графопостроитель. Стереопары предъявлялись в зеркальном стереоскопе, позволяющем проводить измерение времени реакции у испытуемых. Начало экспозиции стереопары определялось моментом зключения источника света. Передние фронты полей экспозиции имели величину, порядка 20 мс., что на порядок или два меньше, чем измеряемое з этих экспериментах время реакций.
Остановка счета времени проводилась так же как и в экспериментах по измерению времени реакции при 'изучении 1 монокулярных механизмов восприятия. Маскирующее поле в экспериментах отсутствовало. Фиксационная точка , сигнал готовности/ содержалась в предэкспсзиционном поле. Измерение зертикальной диспа-ратности проводилось при помощи микрометрического винта, сдвигающего одно из изображений стереопары.
Электрофизиологические методы. Эксперименты проводились на 14 обездвиженных :лиорелаксантом взрослых кошках. Световая стимуляция осуществлялась при помощи газонаполненных ламп типа ДРГМ-70. дающих бесшумную вспышку белого света с регулируемой интенсивностью и длительностью. Определение положения светового пятна в зрительном поле производилось в сферической системе координат. В экспериментах использовались пятна света диаметром от 0.5 до нескольких градусов. Для регистрации вызванных ответов использовались электроды с диаметром конца 5-10 мкм.
ГЛАВА 1. ВРЕМЕННОЕ РАЗВИТИЕ ПРОЦЕССА УЗНАВАНИЯ.
1.1. Оценка длительности процесса узнавания предметных изображений.
Цель экспериментов заключалась в оценке верхней (заведомо завышенной) и нижней (заведомо заниженной) границ времени узна-зания. Тестовые и маскирующие изображения предъявлялись в трех-Есанальном тахистоскопе. В качестве тестов использовались либо 8 чернобелых изображений одиночных предметов с угловым размером в Г, либо набор из 8 отрезков прямых разной ориентации. Яркост-яо-шумовые маскирующие изображения предъявлялись непосредственно после тестовых, т.е. время предъявления тестового изображения равнялось времени отставления маски. Минимальный шаг экспозиции - 1,5-3,0 мс.
Определялось пороговое время узнавания , т.е минимальное время предъявления изображений, необходимое для их узнавания. Кроме того определялось время узнавания тех же изображений. Методом определения служило измерение интервалов времени от момента предъявления изображения до нажатия испытуемым одной из 8 клавиш, символизировавших то или иное тестовое изображение. В этих экспериментах тестовые изображения предъявлялись в течении всего времени узнавания и выключались в момент нажатия испытуемым на клавишу.
Таблица 1. Пороги, времена реакции и оценки времен узнавания.
Испы- Пороги Время Время Верхняя Время Нижняя
туе- реак- реак- граница реак- граница
мые . ции на ции на ции на
изображ. зспышку линии
10 39,7 681.56 259,9 421,5 450,3 231,28
±0,97 ±9,48 -4, 94 ±10,8 :7,2 ±12.0
Верхнюю границу времени узнавания оценивали как результат вычитания из общего времени узнавания предметных изображении (столбец 3) времени простой двигательной реакции на обнаружение вспышки. При измерении времени реакции на вспышку стадия узнавания резко редуцирована; стадия перекодирования результатов узнавания в номер клавиши отсутствует - испытуемые нажимают од-
ну, заранее известную клавишу.
Таким образом, полученные результаты дают завышенное значение времени узнавания предметных изображении. Это значение включает в себя, кроме процесса узнавания, как минимум, процесс перекодирования результатов узнавания в сигнал, определяющий номер клавиши.
Нижнюю границу времени узнавания оценивали как результат вычитания из времени реакции узнавания предметных изображений времени реакции узнавания отрезков прямых разной ориентации. Несмотря на то, что отрезки прямых представляют собой элементарные изображения, в процессе их восприятия имеют место стадии классификации, выбора клавиши, формирования готовности и нажатия. Причем, первая стадия - узнавания резко укорочена, в то время как остальные имеют такую же длительность, как и при узнавании предметных изображений.
Таким образом, эта оценка дает явно заниженное значение длительности узнавания предметных изображений: "центральное" время классификации за исключением процессов, связанных с узнаванием наклона отрезков прямых.
1.2. Характеристики "пофрагментности" хода процесса узнавания
Пороговое время восприятия можно рассматривать не только как минимальный интервал предъявления изображения, необходимый для его узнавания но и как интервал, по прошествии которого предъявление маски уже не способно воздействовать на процесс узнавания. Как видно из табл. 1 для данного алфавита изображений в условиях шумового обратного маскирования это время равно 39,7+0,97 мс. Невосприимчивость процесса узнавания к маскированию может определяться двумя причинами а). Маска не может воздействовать на изображение, так как не может догнать его на участке стандартной обработки, что может быть обусловлено, например, отсутствием на этом участке блока с временем анализа, большим межстимульного интервала, б) Маска не в состоянии воздействовать на изображение, так как после относительно небольшого времени стандартной обработки способы обработки изображения п маски значительно отличаются.
Исходя из принципа специфичности обработки изображении разных классов, возникает вопрос о поисках адекватных способов исследования отдаленных этапов узнавания, в частности, вопрос о применении паттернового маскирования. Цель экспериментов данно-
го раздела - изучение степени влияния различных по сложности и сходству с тестом маскирующих изображений.на восприятие тестовых геометрических фигур.
Ввиду того что в экспериментах использовались простые контурные геометрические.фигуры, сходство изображений определялось на основании наличия у сравниваемых фигур фрагментов, имеющих одинаковое и относительно простое описание. Это описание имеет вид: нормированные длины отрезков прямых - углы между ними, т.е.описание представляет собой упорядоченную последовательность Тх 61|2Т 2 ¿2)3Тд ... ' Ъ ......
где - нормированные" отрезки прямых, - углы между ними.
Отметим, что при таком описании имеет место инвариантность к поворотам, сдвигу в поле зрения и размеру фигур.
Были проведены 5 серий экспериментов по изучению восприятия тестовых фигур в условиях прямого (адаптационного) и обратного паттернового маскирования. Эксперименты проводились с использованием трехканального тахистоскопа. Измерялось пороговое время предъявления тестовых фигур, необходимое для их _узнавания. Тестовые фигуры, время их предъявления и типы масок чередовались случайным образом. Сравнительный анализ результатов этих серий показал, что для всех тестовых изображений основные группы адаптационных и маскирующих фигур, по критерию роста вызываемого- их применением порогового времени узнавания,- -располагаются в одинаковой последовательности (табл.2).
Таблица 2. Последовательность групп маскирующих изображений, вызывающих рост пороговых времен узнавания тестовых фигур (куб, квадрат, треугольник).
"Ш групп .......- - _ - ^.ипы масок -
масок.
1. "Безконтурные" текстурные изображения (пятна) и изоб-
ражения с хаотически расположенными отрезками контуров
2. Элементарные фрагменты тестовых фигур. ~
3. Сложные фигуры, не имеющие специфических по структуре, общих фрагментов с тестовой фигурой.
4. Сложные фигуры, включающие в себя весь тест или его характерную часть.
йзображения, отличающиеся от теста положением в поле зрения .
Обобщение данных всех 5 серий приводит к формулированию следующего положения. Пороговые времена узнавания тестовых фигур увеличиваются по мере роста сходства тестового и маскирующих изображений. В частности, результаты, полученные со всеми тестовыми изображениями, свидетельствуют, что несмотря на то, что применявшиеся в качестве маски реальные текстуры являются довольно сложными изображениями они статистически значимо имеют минимальное влияние на рост порогового времени восприятия тестовых фигур.
Отличительной чертой текстур, применявшихся в данных экспериментах, являлось то, что они состояли из пятен и не имели четких контурных элементов, характерных для тестовых фигур. Тем более текстурные изображения не включали в себя специфически организованных фрагментов, являющихся характерными для тех или иных тестовых фигур.
Статистически неотличимые значения имеют пороги узнавания при использовании в качестве маски набора хаотически расположенных контурных линии. В отличии от текстур, такая маска содержит четкие контуры, однако, низкий порог узнавания тестовых фигур при .этой маске связан, по-видимому, с тем, что ее структура еще весьма далека от специфической структурной организации тестовой фигуры.
Вторая группа масок таблицы 2 включает в себя фигуры, являющиеся элементарными фрагментами тестовых изображений. Пороговые времена восприятия всех тестов при использовании этих масок статистически достоверно превышают пороги узнавания в условиях масок первой группы. - Таким образом, структурно явно более простые изображения, представляющие собой, однако, элементарные фрагменты тестовых фигур, имеют тенденцию к более выраженному влиянию на рост порога восприятия тестовых изображений.
Группы 3-5 адаптационных и маскирующих изображений включают в себя фигуры, имеющие один порядок сложности и различную степень сходства с тестом: группа 3 - сложные не похожие фигуры, группы 4 и 5 - сложные похожие. Как следует из экспериментального материала, изображения группы 3 вызывают достоверно меньшее увеличение порогового времени, чем изображения групп 4 и 5.
Наибольшая величина порогового времени связана с использованием масок, отличавшихся от тестовой фигуры положением в поле зрения, размером и поворотом. При этом максимальный рост порога имеет место при масках, отличающихся от теста только положением в поле зрения.
Из сравнения ненормированных значений пороговых времен следует, что порог восприятия фигур, отличающихся от маскирующих сдвигом, растет относительно порога восприятия тестовой фигуры без адаптации (маскировки) примерно в 2 - 2,5 раза.
Полученные экспериментальные данные приводят к следующим выводам.
1. Пороги узнавания фигур при использовании паттернового маскирования примерно вдвое превышают пороги, имеющие место при использовании неспецифической шумовой маски. Эти факты говорят в пользу предположения, что паттерновое маскирование сходными с тестом фигурами, способно воздействовать на более центральные стадии зрительного восприятия.
2. Ввиду того, что маска, являясь конкурентом теста,-действует тем сильнее, чем больше у нее и у теста общих фрагментов, выделение этих фрагментов и измерение их характеристик является существенным для процесса узнавания.
3. Полученные данные свидетельствуют в пользу модели, рассматривающей процесс узнавания формы изображений как результат их обработки многоуровневой системой, в разных частях которой проходят различные операции по охарактеризации формы отдельных фрагментов.
1.3. Изменение хода узнавания изображений при смене типа обратного паттернового маскирования.
Изучение процессов восприятия в условиях паттернового маскирования позволяет не только решать задачи определения характеристик пофрагментной обработки изображений, но и дает возможность исследовать последовательность и характеристики стадий узнавания, в том числе и вопросы изменения последовательности стадий и их содержания.
В данном разделе приводятся данные о ходе процесса временного анализа изображении, состоящих из параллельных, расположенных друг над другом и имеющих одинаковую длину, линий и полос. В части экспериментов использовались только полосы равной ширины, в других сериях в тестовый паттерн входили как линии.
так и полосы.
В качестве фактора, обеспечивающего смену условий восприятия использовались два типа обратного шумового маскирования: стандартная шумовая маска, состоящая из расположенных случайным образом отрезков контуров, и маска с добавлением к отрезкам контуров пятен того же контраста,что делало маску более близкой к тестовым изображениям.
В первых двух сериях экспериментов применялась стандартная шумовая маска. Результаты экспериментов со стимулами, состоящими из полос одинаковой ширины (1 серия), и стимулами включающими линии и полосы (2 серия) показали, что процесс описания таких фигур не является одномоментным и включает следующие стадии: аморфного восприятия объекта; приблизительной, оценочной классификации и стадию идентификации объекта. При этом измеренные в экспериментах пороговые значения отдельных стадии дают возможность говорить о распределении во времени отдельных стадий друг относительно друга.
Стадия оценочной классификации представляет особый интерес для рассмотрения. В момент ее прохождения с одной стороны уже закончен процесс классификации тестовой фигуры - испытуемые правильно узнают, что тесты представляют собой решетки, составленные из элементов одинаковой ориентации. С другой стороны испытуемые на этой стадии ошибочно оценивают некоторые параметры тестов. Так, в ходе восприятия паттернов, составленных из полос одинаковой ширины, в 72,2% случаев измерений имели место ошибки уменьшения контраста восприятия (порог 9,84+1,38 мс). При восприятий неоднородных паттернов, состоящих из линий и полос кроме ошибок в восприятии контраста в 93,3% измерений имели место ошибки, связанные с неправильной оценкой ширины полос. При ->этом испытуемые воспринимали паттерн как состоящий либо из только широких либо из только тонких линий (порог этой стадии 20,2+2,19 мс ).
В экспериментах третьей и четвертой серии использовались те же тестовые изображения, но в условиях применения второй, более адекватной тестовым фигурам, маски. Результаты показали,, что изменение условий восприятия, вызванное сменой маскирующих изображений, приводит к изменениям временных характеристик процесса восприятия. При этом в ходе восприятия одного и того же теста могут меняться сами стадии восприятия /выпадать одни и
появляться другие типы операций/, могут меняться значения порогов отдельных стадий и интервалов между ними.
Так, в случае паттернов, составленных из одинаковых полос, смена маскирующих изображений приводит, во-первых, к появлению неправильной оценки ширины полос на стадии оценочной классификации и во-вторых, к росту пороговых времен стадии ' аморфного восприятия в 2 раза и стадии идентификации в 2,3 раза.
При восприятии паттернов, составленных из элементов разной ширины, смена маскирующих изображений также приводит к статистически достоверным изменениям порогов стадий восприятия, а также к изменению частотности этих стадий. В частности, порог стадии аморфного восприятия изменился с 9,5+1,69 мс до 14,46+1,83 мс., т.е. вырос при нестандартной маске в 1,5 раза. На стадии оценочной классификации порог ошибок измерения контраста восприятия вырос в 1,9 раза (с 12,9+2,27 мс. до 24,25+2,17 мс.); порог ошибок, связанных с неправильной, оценкой ширины полос, вырос в 1,7 раза; порог стадии идентификации - в 1,2 раза (таблица 3).
Таким образом, результаты экспериментов непосредственно показывают, что применение различных типов обратного паттернового маскирования, т.е. по существу изменение контекста восприятия, приводит к существенному изменению хода процесса восприятия. В частности, метод подбора масок может быть использован для создания условий^выявления различных стадий и операций процесса восприятия. Во-вторых, результаты экспериментов свидетельствуют в пользу гипотезы о перестройке структуры перцептивного описания при изменении контекста восприятия.
1.4. Временные характеристики восприятия геометрических фигур.
Целью экспериментов было получение количественных данных о характеристиках процесса описания изображений (треугольник, круг, квадрат, пяти- и шестиугольник, ромб, крест, пары линий, сектор) и их комбинаций. Эти изображения обладают более сложной организацией, чем линии и полосы (см. п. 1.3. ), но являются тем не менее достаточно простыми фигурами. При проведении экспериментов было использовано стандартное обратное шумовое маскирование, что давало возможность проводить изучение стадий восприятия в некоторых стандартных условиях. В ходе каждого эксперимента в случайном порядке предъявлялось несколько заранее не
Табл.3. Сравнение порогов стадий восприятия паттернов из линий и полос в условиях обратного маскирования двух типов.
Т
Стадии восприятия
Условия восприятия
Аморфное воспри-тие
Порог мс.| %
|наличия
___I___
Предварительная, оценочная классификация
Изменение контраста
"Т"
Порог мс.
наличия
Неправильная оценка ширины
Порог мс. | %'
|наличия ____1__а
Идентификация
Порог мс. | %
|наличия
__I___
а. Тестовое изображение типа "полосы" Маска стандартная 7,8+0,92 40,47 9,84+1,38 51
I
от
19,2?±2,18 100
Маска
"лннни-пятна"
16+2,19 36,1
32,46+4,66 73,3 44,30+3,48 100
б. Тестовое изображение типа "линии-полосы" Маска стандартная 9,50+1,69 22,2 12,9+2,27 30,1 20,20+2 19 47,2 42,8+3,43 100
Маска
"линии-пятна"
14,46+1,88 27,5 24,25+2,17 46,17 34,9+2,55 66,45 52,52+2,45 100
показанных испытуемым, тестовых фигур. Время экспозиции возрастало с минимальным шагом в 1,5-3,0 мс., причем при каждом фиксированном времени каждое тестовое изображение предъявлялось несколько раз.
Результаты экспериментов показали, что в процессе анализа испытуемыми тестового изображения могут быть выделены 4 стадии.
1) Стадия аморфного восприятия (порог 14,78+0,59 мс., присутствовала в 88% измерений), характерной чертой которой является восприятие объекта как набора малоконтрастных пятен, не имеющих четких контуров.
2) Стадия наличия элементов контура без правильной классификации фрагментов изображения (порог 20,37+0,83 мс, частотность 94%). На этой стадии испытуемые регистрировали наличие отдельных участков контура, однако, не могли определить характеристики этих участков: кривизну, длину, расположение в зрительном поле я т.д. Отсутствие даже грубой, оценочной классификации формы тестовой Фигуры является очевидным следствием этого факта.
3). Стадия примерной оценочной классификации тестовых фигур. Порог стадии 32,73+1,32 мс., частотность 94%.' Приблизительная классификация на этой стадии достигается за счет правильного узнавания отдельных фрагментов теста. На этой стадии имеют место три основных феномена: Во-первых, узнаются не все фрагменты тестовой фигуры- и испытуемые относят тест к тому или иному классу на основании такого частичного описания. Во-вторых, при нескольких повторных экспозициях одного и того же тестового изображения при одном и том же времени предъявления испытуемые, как правило, (93% случаев) дают несколько равновероятных и различных вариантов классификации. В-третьих, в ходе узнавания происходит неправильная оценка основных характеристик как отдельных фрагментов, так и взаимного отношения .групп фрагментов.
Полученные при анализе этой стадии результаты приводят к выводу, что ошибки в классификации тестовых фигур связаны с механизмом выдвижения испытуемыми гипотез о всем объекте на основании сведений о его отдельных частях. Существенно, что факт восприятия части фрагментов тестового изображения часто связан с ошибками типа дефицита внимания. Выдвижение гипотез предполагает, вообще говоря, их дальнейшую, проверку. Отсутствие таковой в наших экспериментах, связанное с недостатком времени анализа, по-видимому, свидетельствует о существовании в условиях нор-
мального восприятия циклического пофрагментного анализа картины, включающего отдельные операции по выдвижению и проверке гипотез. Существенный характер механизмов выдвижения и проверки гипотез следует также из данных клиники зрительных агнозий, одним из основных симптомов которой является симптом фрагментарности восприятия с неконтролируемым дополнением до целого. В результате для больных характерны парагнозии типа: фуражка -тарелка, кресло - тулуп и т.д. (Кок, Лурия).
Приведем примеры гипотез. В случае достаточно простых тестовых фигур появляются ошибочные предположения типа "круг в треугольнике" вместо "треугольник рядом с кругом". В случае более сложных фигур например, шестигранной гайки оценочная классификация может проявиться в виде гипотез типа "кольцо", "две концентрические окружности", "цилиндр" и пр.
Ошибки, возникающие на стадии оценочной классификации, могут быть разделены на три группы. Это ошибки в определении характеристик отдельных фрагментов, например,- ориентации или длины линии, площади замкнутых фрагментов, их эксцентриситета и т.д. Другая группа ошибок - ошибки определения характеристик взаимного расположения и взаимного отношения фрагментов, например, смещения фрагментов друг относительно друга, порядок их расположения, величина угла между осями двух фрагментов и т.д. Ошибки третьего типа заключаются в неправильном выделении фрагментов, когда, например, в качестве единого фрагмента выступают части разных фигур.
Существенно отметить, что величины порогов появления всех типов ошибок не имеют статистически достоверных отличий,табл.4.
Табл. 4. Ошибки определения характеристик фрагментов геометрических фигур на стадии оценочной классификации.
1 '1 1 Наличие ошибок 1 | Общее
Типы ошибок | Пороги .......1 число
1 ■ % I Кол. | измере-
1 | 1 I регистр. | ний |
Ориентация линий 32,59+1,52 98,4 ' 62 63
Длина линий 29,80+2,43 94,5 21 22
Площадь Смещения (вверх-вниз) Смещения (вправо-влево) Смещения (общие) Величина угла Порядок мест Генерации сложных
-1931,60+1,61 95,8 33,00+2,2 53,2
46 33
48 62
32,10+2,2 43,5 27
6 2.
33,2 +1,56 96,7 60
32,8 +3,2 78,6 11
29.8 +2,5 93,3 14
32.9 +2.9 96.7 60
62
14
15 62
фрагментов
Полученные данные дают основание для заключения, что операции измерения собственных характеристик фрагментов, характеристик их взаимного расположения и операции по генерации вариантов выделения фрагментов многократно чередуются в ходе процесса зрительного узнавания.
4). Последняя стадия узнавания - стадия идентификации тестовых фигур. Порог стадии в описываемых экспериментах -48,73+2,35 мс.
Таким образом, анализ стадий узнавания и ошибок, возникающих на стадии оценочной классификации, приводит к выводу, об узнавании как о процессе выдвижения и проверки гипотез о классе изображения, выдвигаемых на основании измерения характеристик отдельных фрагментов анализируемой фигуры, генерации вариантов выделения фрагментов разной сложности и операций сравнения характеристик выделенных фрагментов с критериями перцептивного эталонного описания.
ГЛАВА II. Восприятие объектов заданного класса.
Описанная в п.1.3 смена маскирующих изображений представляют собой частный случай изменения контекста восприятия, т.е. вариант, когда в алфавите изображений, ожидаемых испытуемым, сменяется одно, причем наиболее часто встречающееся изображение.
Существенный характер последствий, вызываемых такого рода изменением контекста восприятия, приводит к постановке вопроса об изучении хода процесса узнавания объектов одного, заранее заданного класса. Цель такой постановки состоит также в выявлении характерных черт структуры перцептивного, эталонного описа-
ния одного класса зрительных объектов. Правомерность такого подхода обусловлена тем, что во многих случаях к зрительной системе предъявляются вполне определенные требования - выделение на сложной пространственной сцене объектов заданного класса.
2.1. Ход процесса восприятия при сдвоенных процедурах изменения времен предъявления тестовых изображений.
Эксперименты,описанные в данном разделе,были проведены с целью измерения эффекта изменения порогов отдельных стадий восприятия по схеме:- две непосредственно следующие друг за другом процедуры постепенного изменения времен предъявления тех же самых или сходных тестовых фигур. Такая постановка задачи является следствием следующих предположений. 1.Восприятие изображений происходит в результате реализации инструкций и критериев перцептивного,эталонного описания соответствующего класса зрительных объектов. 2. При повторном предъявлении "похожего" объекта его пороговое время будет уменьшаться в связи с тем,что в процессе восприятия участвует, уже активированное перцептивное описание.
Исходя из изложенного,можно ожидать,что наиболее явный эффект изменения порогов восприятия будет связан с повторным предъявлением одного и того же тестового объекта. В первой серии экспериментов изучалось влияние явного знания испытуемыми тестового объекта на пороги стадий восприятия. Тестовые изображения (геометрические фигуры) предъявлялись в условиях стандартного, обратного, шумового маскирования.В первой части эксперимента при постепенном увеличении времени предъявления теста ("прямой" ход) регистрировались пороги отдельных стадий восприятия. После достижения стадии идентификации проводилась вторая часть эксперимента,заключавшаяся в постепенном уменьшении времени предъявления того же изображения ("обратный" ход).
Результаты показали,что при "обратном" ходе происходит уменьшение порогов всех стадий процесса восприятия,а также уменьшение разностей величин порогов одинаковых стадий "прямого" и "обратного" хода.Например,порог стадии идентификации при "прямом" ходе был равен 41,3+2,4 мс.при "обратном" - 25,5+3,3 мс; порог стадии наличия одного или более фрагментов 25,3+3,1 мс и 19,4+2,7 мс соответственно (таблица 5).
Табл.5. Гистерезис пороговых времен стадий восприятия, а. "Прямая" и обратная процедуры изменения времени предъявления.
-1-!
| Пороги (мс.) I
Стадии I-:-1 Т1-Т2
| Рост времени Уменьшение време-| (мс) | предъявления ни предъявления (
Аморфное 11,5+1,2 9,0+0,8 2,5+1,44
восприятие
Наличие эле- 15,8+1,3 . 9,5+0,6 6,3+1,43
ментов контура
Наличие одного 25,3+3,1 19,4+2,7 5,9+4,1
или более фраг-
ментов
Идентификация 41,3+2,4 25,5+3,3 15,8+4,08
б. Двукратная процедура увеличения времени предъявления
Стадии 1 [Первая процедура увеличения Вторая процедура увеличения дТ=Т2~Т1
| Пороги 1 наличие стадии 7. • - - -Пороги наличие стадии %
Аморфное 18,5+2,7 75 16,3+1,9 75 2,2+3,3
восприятие
Наличие одно- 26,2+2,7 92 ' 19,3+2,3 50 6,9+3,5
го фрагмента
Наличие двух 36,7+2,3 83 24,0+2,4 42 12,7+3,3
фрагментов
Идентифика- 46,0+2,2 100 29,6+2,1 100 16,4+3,0
ция
Таким образом,полученные результаты свидетельствуют,что знание испытуемыми" формы и местоположения ожидаемого изображения изме-
няют ход процесса восприятия.Процесс узнавания в условиях поиска заранее известного, объекта отличается от соответствующего процесса при восприятии незнакомого объекта.Причиной этого,по-видимому, являются события,связанные с активацией и возможной перестройкой структуры перцептивного, эталонного описания соответствующего класса объектов.
Во второй серии экспериментов проводилась двукратная процедура увеличения времени предъявления тестов.Причем испытуемые ни в первый,ни во второй раз не знали,какое изображение им будет предъявлено.Тем не менее при вторичной процедуре предъявления процесс узнавания проходил в условиях предварительной активации соответствующего тесту перцептивного описания. Основной результат экспериментов заключается в статистически достоверном снижении порогов всех стадий процесса восприятия (за исключением стадии аморфного восприятия) при ¡вторичной процедуре предъявления тестов, табл. 5.
Итак,суммируя данные двух серий,можно заключить,что восприятие тестовых фигур в условиях наличия их предварительного, многократного предъявления (снятие первой пороговой последовательности) выявляет эффект типа петли "гистерезиса",заключающийся в уменьшении порогов большинства стадий. Данный эффект свидетельствует об изменении временных параметров хода процесса восприятия _в условиях активизированного перцептивного описания.
В серии контрольных экспериментов было показано,что для несхожих изображений при последовательном снятии пороговых последовательностей, пороги стадий восприятия не меняются.
2.2.Восприятие сложных, схематических изображений в условиях направленного поиска.
Общая идея экспериментов данной серии заключалась в том,что испытуемых инструктировали изначально принимать любые изображения за изображения схематических лиц (рис.1), другими словами у испытуемых создавалось искусственное "предпочтение к лицам". Далее при постепенном увеличении времени тахистоскопического предъявления тестовых изображений регистрировались пороговые времена, при которых испытуемым становилось ясно,что данное изображение не является лицом,ввиду того,что на нем отсутствует существенный комплекс фрагментов,либо какие-то фрагменты представлены в двойном наборе.Испытуемые,таким образом,реализо-вывалп режим поиска на тестовом изображении определенной систе-
у У и и 0 и
Рис. 1 Схемы изображений лиц, использовавшихся з экспериментах.
рис.2
Лйрикш/'ри/.нш ни нцшгмгчти Хи/тяте/шипи ни фрагмента \хариктсрис/м \кн /¡чтгменти \\npaKinrpui /ни (*// //¡рагиенти упракмсришш 1 |л7/ ¡¡Ч'агигнтп |
-л 7ГЖ7\7\
Пример структуры двух сегментов перцептивного опясанля класса "лицо"
мы признаков,описывающих класс зрительных изображений.
Полученные результаты показали,что в ходе процесса восприятия происходит пофрагментное описание изображений: изображения анализировались путем выделения отдельных фрагментов и измерения различных характеристик этих фрагментов. В процессе анализа имела место следующая последовательность- стадий.
A). Стадии,связанные с интегральными оценками заполненности контура и с оценками взаимного расположения отдельных комплексов пятен на изображении. Такими стадиями являются. Стадия определения неравномерности заполнения внешнего контура (порог 58,9+1,98 мс.) На этой стадии испытуемые "отсекали" как не лица все тестовые фигуры, имеющие равномерное заполнение, например, контуры, заполненные штриховкой.
Стадия определения заполненности контура (регистрация отсутствия деталей) с порогом 66,2+1,6? мс. и стадия определения наличия комплекса областей, расположенных в двух взаимно перпендикулярных направлениях (порог 70,0+1,94 мс.).
Б). Стадии выделения на изображениях локальных комплексов фрагментов. Среди этих стадий статистически достоверно меньший порог имела стадия, на кбторой проводился поиск фрагментов комплекса глаз (порог 75,2+2,15 мс.). При этом как не лица "отсекались" изображения, лишенные данного комплекса фрагментов. Далее следовала стадия поиска и анализа характеристик фрагментов, составляющих комплексы рта и носа (порог 93,4+2.59 мс.). Таким образом, стадии группы Б представляют собой этапы частичной классификации тестовых фигур.
B). Стадии выявления на тестовых фигурах неожиданных или маловероятных фрагментов. Эти стадии могут рассматриваться как стадии идентификации, связанные с описанием отдельных деталей в уже выделенных комплексах фрагментов. К ним относятся стадии определения наличия лишних деталей в комплексах глаз, носа и рта (пороги 107,1+2,39 мс. и 168,3+5,3 мс соответственно).
Полученные данные свидетельствуют, что испытуемые вначале производят операции по поиску и выделению на изображении заранее известных и ожидаемых ими фрагментов и только затем отмечают то, что на изображении имеются и другие, не характерные для данного класса объектов, детали. При этом'существенно, что порядок стадий восприятия определялся, исходя из содержательной значимости фрагментов, а не из таких неспецифических факторов
как порядок сканирования изображения при его осмотре. Изложенные факты хорошо согласуются с гипотезой, рассматривающей зрительное восприятие как процесс, происходящий по инструкциям и критериям, записанным в перцептивном, эталонном описании класса зрительных объектов.
2.3. Восприятие простых геометрических изображений, подвергнутых искажениям "пересечением" и "продлением".
Изучение работы зрительной системы в режиме поиска объектов заданного класса может проводиться не только при использовании условий и методических инструкций, приводящих к активизации определенных перцептивных описаний (пп. 2.1 и 2.2 ), но также при анализе зашумленных, нечетких, частично закрывающих друг друга объектов. Узнавание объектов в таких условиях можно рассматривать как непрерывный процесс поиска и выделения фрагментов, расположенных на фоне других маскирующих фрагментов.
В экспериментах данного раздела наряду с применением стандартного, обратного, шумового маскирования в качестве специального зашумляющего фактора использовалось наложение на тестовое изображение дополнительных, искажающих его линий. Использовались линии двух типов: создающие зашумление путем пересечения и путем продления линий тестовых фигур.
В первой серии измерялось пороговое время восприятия тестовых фигур, которые испытуемые должны были отнести к одному из им заранее известных трех классов: ромбы, пяти- и шестиугольники. Испытуемые были ознакомлены с незашумленными (эталонными) фигурами. Результаты показали, что в этих условиях изображения по пороговым временам восприятия статистически достоверно распадались на 4 группы. I - эталонные, неискаженные фигуры (порог 22,46+1,16 мс.);II-фигуры,зашумленные пересечением сторон и углов дополнительными линиями (порог 31,83+2,03 мс); III группа-фигуры, зашумленные продлением части и IV - всех линий контура (пороги 37,12+1,18 мс. и 45,54+2,37 мс. соответственно ).
В экспериментах второй серии измерялись пороговые времена в условиях предъявления изображений из неограниченного алфавита классов.В результате тестовые фигуры в зависимости от типа за-шумления были разбиты на такие же 4 группы,что и в предыдущей
серии. При этом пороги I и II групп (22,79+1,0 мс. и 34,14+1,0 мс) практически не отличались от порогов соответствующих групп первой серии. Однако, восприятие фигур III и IT групп (маскировка "продлением" ) имело отличительные черты.Испытуемые не всегда описывали тесты как зашумленные ромбы,пяти- и шестиугольники. В этих случаях тестовые фигуры воспринимались как некоторые новые,незнакомые паттерны.Такой эффект имел место в 30% случаев для III и примерно в 50% случаев для IV группы.
При восприятии изображений IV группы (маскировка "продлением" всех линий контура) эффект маскирования был выражен наиболее явно. В случаях правильной классификации тестов пороговое время имело значение 141,5+5,36 мс.,что более чем в 3 раза превышало пороговое время фигур IV группы в первой серии.
В третьей серии экспериментов проводилась независимая оценка результатов действия различных шумов - измерялась величина времени реакции при узнавании тестовых фигур.Причем,как и в первой серии,испытуемые- должны были отнести тесты к одному из трех заранее известных классов: к ромбам,пяти- или шестиугольникам. Времена реакций для фигур I группы (эталоны) в этих условиях равны 540,6+4,86 мс., для фигур II группы (маскировка "пересечением") - 687,6+9,36 мс. Времена реакций для фигур III группы - 699,0+19,48 мс. и IV-856,8+18,9 мс. Таким образом,по результатам всех трех серий можно сделать следующие выводы. 1.В зависимости от способа маскирования тестовые изображения могут быть разбиты на 3 четкие группы: эталонные фигуры; фигуры, зашумленные "пересечением" элементов контура и фигуры,зашумленные "продлением" всех элементов контура. 2 Изображения,маскируемые продлением линий контура представляют существенно большие трудности для узнавания,чем те же фигуры, маскируемые путем пересечения.
3.Полученные данные дают основания полагать,что в перцептивном описании существенную роль играют записи о характеристиках взаимного расположения ' и координатах концов линий анализируемых объектов. Нарушение этих характеристик при маскировании приводит к появлению существенных трудностей узнавания.
2.4. Влияние нарушения характеристик взаимного расположения фрагментов на восприятие сложных изображений.
В экспериментах искажения в тестовое изображение вво-
дились путем изменения характеристик взаимного расположения од-
них фрагментов относительно других. В качестве тестовых фигур использовались фотографии хорошо знакомых испытуемым лиц,что давало возможность изучать работу зрительной системы в режиме опознания объектов заданного класса.
Тестовые изображения распадались на 3 группы. I группа -стандартные изображения, II группа - изображения,искаженные введением смешением частей лица,при которых комплексы характерных фрагментов глаз носа и рта сдвигались как целое. К III группе относились изображения,искаженные путем взаимного смещения фрагментов,входящих в состав комплексов глаз,носа и рта.
Полученные результаты свидетельствуют,что кривые зависимости пороговых времен узнавания от степени нарушения взаимного расположения фрагментов имеют два участка. Участок константного восприятия,соответствующий изменению взаимного расположения комплексов фрагментов в среднем на 52,8+5% (переход от изображений I к изображениям II группы). Пороговые времена на этом участке менялись недостоверно: от 35,38+1,1 мс. до 36,13+1,4 мс, для нормально ориентированных изображений и от 54,0+1,8 мс до 56,3+2,0 мс. для повернутых на 180° изображений. В ходе процесса классификации испытуемые не замечали искажений,соответствующих первому участку кривой.
Второй участок кривых связан с существенным ростом пороговых времен - в 2,3-2,5 раза.Этот участок (переход от изображений Ц-ой к изображениям Ш-ей группы) описывает процессы восприятия,в ходе которых испытуемые проводят правильную классификацию тестовых изображений,замечая при этом факты нарушения характеристик взаимного расположения их частей. Величины пороговых времен узнавания на этом участке линейно связаны со степенью нарушения взаимного расположения фрагментов тестовых фигур.Такая зависимость имеет место как для нормально ориентированных, так и для инвертированных фигур.
Таким образом, при переходе к третьей группе фигур, определяемой с одной стороны тем,что сдвигам подвергаются более мелкие фрагменты, и с другой стороны тем,что общая величина сдвигов достигает 139.3+9,9%, наблюдается существенный рост порогового времени восприятия.
Эксперименты показывают также,что для всех 3 групп пороги восприятия инвертированных изображений значительно превышают пороги нормально ориентированных фигур.
Результаты данного раздела позволяют сделать следующие выводы. 1.Структура перцептивного описания класса сложных изображений тесно связана с операциями определения взаимного расположения фрагментов. 2.Эталонное,перцептивное описание способно обеспечивать достаточную- обобщенность восприятия к ориентации фигур и к изменению характеристик взаимного расположения их фрагментов.Изменения характеристик взаимного расположения в пределах порядка 50% не связаны с достоверным ростом порогов узнавания. При дальнейшем изменении характеристик взаимного расположения до величин порядка 140% узнавание тестовых фигур все еще имеет место, однако, при росте порогов в 2,3-2,5 раза.
ГЛАВА III. ПОИСКОВАЯ МОДЕЛЬ ПРОЦЕССА ЗРИТЕЛЬНОГО УЗНАВАНИЯ.
Поисковая модель процесса зрительного узнавания формы объектов учитывает основные группы фактов,полученных в экспериментальной части работы: характеристики пофрагментности описания изображений в условиях паттерного маскирования; данные о временном ходе процесса узнавания изображений разной сложности;, данные об узнавании в режиме поиска объектов заданного класса.
Экспериментальные данные позволяют рассматривать процесс зрительного узнавания как контекстно управляемое постепенно усложняющееся описание одних более сложных фрагментов через другие,более простые. - При этом происходив-многократное измерение как характеристик отдельных фрагментов,так и характеристик их взаимного расположения. Существенной чертой процесса узнавания является то,что он происходит как циклический процесс выдвижения и проверки гипотез о характеристиках фрагментов анализируемого изображения.
В результате такого подхода зрительное узнавание рассматривается" в данной модели как работа по поиску и выделению среди множества частично перекрывающихся объектов сцены фрагментов и фигур,удовлетворяющих критериям соответствующих перцептивных, эталонных описаний. Предлагаемая модель рассматривает весь процесс узнавания как работу,проходящую по критериям и инструкциям перцептивного описания соответствующего класса зрительных . объектов.
3.1. Структура перцептивного, эталонного описания.
Сформулируем коротко основные положения модели,описывающие структуру перцептивного описания.
-291. Работа модели представляет собой процесс упорядоченной активации записей перцептивного описания.Перцептивное описание не обязательно содержит подробное изложение всех операций, приводящих к выделению определенного фрагмента, но может содержать только критерии правильности процедур поиска, выделения и отбора сложных фрагментов, например, интервалы значений характеристик. Описание построено по принципу "часть через части" и представляет собой структуру,в которой сложные фрагменты определяются через соотношения более простых фрагментов,имеющих определенные характеристики.
2. Сегмент перцептивного описания,описывающий часть объекта, содержит записи трех типов, рис.2. Интегральные характеристики данной части,характеристики частей,составляющих данную часть, и характеристики взаимного расположения составляющих частей друг относительно друга и относительно всего объекта. Такая структура перцептивного описания дает возможность осуществления независимой,параллельной обработки сцены многими сегментами (принцип "автономии") и возможность ограничивать количество сегментов, участвующих в процессе классификации (принцип "кворума").
Изложенные положения отражают полученные в экспериментальной части работы факты, говорящие о постепенно усложняющемся по мере продвижения процесса восприятия, пофрагментном описании тестовой фигуры. К ним относятся данные о последовательности этапов зрительного восприятия (измерение интегральных характеристик объекта, выявление элементов контура, частичная классификация на основании описания отдельных фрагментов, выдвижение и проверка гипотез о виде всего изображения), а также данные, свидетельствующие о важной роли операций по измерению характеристик отдельных фрагментов "и характеристик взаимоотношений фрагментов в ходе процесса восприятия.
3. Основная стратегия работы перцептивного описания заключается в том,что обработка сцены начинается с включения верхних сегментов описания, которые непосредственно работают с изображением, производя как бы шунтирование всех остальных сегментов. В результате определяются интегральные характеристики некоторого сложного фрагмента, характеристики взаимного расположения и интегральные характеристики составляющих его фрагментов, т.е. требования, которые предъявляет к фрагментам сцены данный сег-
. 30-
мент перцептивного описания. _ '
Включение в работу сегментов нижележащих уровней происходит только, если результат их работы требуется сегментам высших уровней (включение "по запросу"). Такая ситуация типична при различных видах зашумления изображений, когда зрительная система не находит на сцене всех фрагментов, обладающих требуемыми перцептивным описанием характеристиками.
Описанная стратегия работы согласуется с полученными в экспериментальной части работы данными о том, что на начальных стадиях восприятия как простых, так и сложных изображений происходит измерение интегральных характеристик областей тестовых фигур, включающих в себя целые, сложноорганизованные комплексы фрагментов (средняя яркость областей при восприятии геометрических фигур и текстур, оценки вытянутости при восприятии схем лиц и др.).
4. Модель способна проводить частичное доучивание, т.е. формировать редуцированные перцептивные описания, приспособленные для-работы в определенных, конкретных условиях зрения.
3.2. Типы операций исполняющих блоков модели.
Последовательность этапов выделения фрагментов может быть достаточно длинной, но состоять из нескольких типов повторяющихся операций. Сформулируем коротко их сущность. Во-первых это операции по первичному описанию объекта интегральными характеристиками. Такое описание связано с нахождением точек фиксации на каждой из выделенных областей. Выделение на этом этапе областей например, при помощи процедуры усреднения по окрестности, согласуется с полученными в экспериментальной части данными о характеристиках стадии аморфного восприятия (минимальный порог, присутствие при восприятии как простых, так и сложных изображений). Выделенные таким образом части представляют собой с точки зрения детального анализа объединение многих фрагментов. Однако именно такое огрубленное, разбиение полезно для начального описания изображения. В дальнейшей работе "по запросам" соответствующих сегментов эталонного описания происходит детальный анализ таких фрагментов.
Второй тип операций связан с разбиением области на "элементарные" сегменты. Смысл разбиения сводится-к получению по возможности мало отличающихся друг от друга крупных конгломератов точек, т.е. разбиении изображения в местах резких изменений
свойств элементов. Например, проведения границ в местах резких изменений яркости, разбиений линий в местах резких изменений кривизны.
Третий тип операций связан с измерением различных характеристик отдельных фрагментов, таких как площадь, длина, вытяну-тость, "ориентация оси, координаты концов и т.д. Ввиду того, что характеристики фрагментов представляют собой величины, которые могут сравниваться с критериями перцептивного описания, на этом этапе осуществляется отбор фрагментов, удовлетворяющих описанию.
Четвертый тип операций направлен на укрупнение фрагментов и связан с определением характеристик взаимного соотношения фрагментов, таких как "угол между осями "параллельность", "близость концов" и т.д.. Укрупненные и удовлетворяющие критериям перцептивного описания фрагменты в дальнейшем анализе рассматриваются как целостные единицы и циклически передаются на третий этап.
Операции третьего и четвертого типа соответствуют полученным в I и II главах экспериментальной части работы данным о типах ошибок определения различных характеристик отдельных фрагментов и характеристик взаимного расположения фрагментов (восприятие элементарных паттернов, геометрических фигур, лиц, текстур).
В результате этапов сборки происходит выделение специфических для изображений данного класса фрагментов, что позволяет выдвигать гипотезы о местоположении и характеристиках еще не выделенных фрагментов (этап принятия частного решения). Данные о наличии подобной процедуры в ходе нормального зрительного восприятия изображений разной сложности соответствуют результатам этапа приблизительной,оценочной классификации - тестовых изображений.
Этап синтеза узнанной части сцены связан с определением характеристик взаимного расположения отдельных объектов сцены. В отличии от этапа укрупнения фрагментов,имеющего место при узнавании отдельных объектов,на этом этапе описываются существующие на сцене соотношения,без сравнения их с критериями перцептивного описания.
Этап переключения внимания связан с выделением нового поля анализа.что происходит либо на основании гипотезы о месте на-
хождения необнаруженной части,либо в процессе перебора точек фиксации,выделенных на первом этапе.
Из изложенного следует, что работа модели зрительного узнавания определяется структурой перцептивного описания класса. Тем не менее процесс работы не представляет собой абсолютно детерминированную, запрограммированную последовательность операций: Перцептивное эталонное описание построено но принципу "часть через части", что дает возможность осуществлять независимую работу отдельных сегментов описания (принципы "автономии" и "кворума"). В зависимости от контекста работы, условий восприятия, алфавита ожидаемых изображений в работу могут включаться те или иные сегменты эталонного описания.
Действительно, работа может происходить в условиях, когда объект может быть частично закрыт другими объектами, в условиях различной освещенности и т.д. Большое разнообразие условий связано с фактурой материала или же с стилем выполнения изображения - штриховкой, мозаикой пятен, контурными или пунктирными линиями и т.д. •
Основной путь решения этой проблемы связан с тем, что эталонное описание является обобщенным, т.е. в нем содержатся в основном значения характеристик, которыми должны обладать достаточно сложные фрагменты, характеристики которых не зависят, например, от фактуры материала. Интервалы значений таких характеристик представляют собой критерии для построения и выделения этих фрагментов путем генерации и перебора различных вариантов охарактеризации, объединения или разделения частей.
3.3. Функция отображения зрительного пространства в пространство зрительной коры.
Построение модельных представлений о функциональных закономерностях "восприятия тесно связано с вопросами пространственной организации отделов зрительной системы, реализующими нейрофизиологические механизмы обработки изображений.
Изучение проекционной системы проводится, как правило, путем поточного картирования, однако, такой способ имеет ряд трудностей, связанных с ошибками многократного сопоставления точек зрительного поля и мозга, а также со сложностью учета складок и изгибов коры. В нашей работе использовался принципиально другой метод нахождения вида функции отображения сетчатки в кору. Общая идея построения карты зрительного поля в коре
состояла в использовании результатов исследования масштабного фактора отображения (М-фактора), т.е. отношения приращения функции отображения в коре дХ и соответствующего приращения ар-гументадЕ на сетчатке. При этом важно заметить, что в пределе масштабный фактор определяет первую производную функции отображения сетчатки в кору. Таким образом, первообразная этой величины представляет собой саму функцию отображения (Скрипников, Кроль, 1972,1975).
Измерение величины М-фактора проводилось экспериментально на кошках в условиях локальной стимуляции сетчатки пятнами света размером 0,5°-1-, 0° и регистрации вызванных ответов зрительной коры. Основной метод при этом заключался в измерении расстояний между двумя точками максимумов первичных ответов коры; функция отображения изучалась для точек, соответствующих центральной зоне сетчатки в 15-20°.
Результаты измерений показали, что определяющим для величины М-фактора является расстояние от центра сетчатки до точки стимуляции. В центральной области сетчатки величина М-фактора имеет значение порядка 1 мм/°. При исследовании периферии величина М-фактора уменьшается, достигая-0,2 - 0,3 мм/° . Зависимость величины М-фактора от расстояния точки измерения от центра сетчатки может быть записана в виде
дХ 1 /1/"
дй. И
где дХ есть смещение регистрирующего электрода по зрительной коре, дИ - смещение локального пятна света по сетчатке, И -расстояние от центра сетчатки до точки, из которой было сделано смещение Следует отметить, _ что смещение дИ производилось в экспериментах в произвольном направлении. Таким образом, выражение /1/ показывает, что смещение по сетчатке в произвольном направлении дИ приводит к соответствующему смещению по коре дХ и что отношение дХ/дИ радиально симметрично и является функцией только Я.
Смещения дХ, дИ и Я представляют собой длины соответствующих векторов. Сопоставим сетчатку комплексной плоскости 2, а кору комплексной плоскости IV . Тогда преобразование /1/ имеет вид
1
ьЪ г
где а2 есть величина смещения во плоскости сетчатки, - величина смещения по плоскости'зрительной коры. После некоторых допущений и доопределений интегрирование данного отношения дает решение вида
V/ = 1п <г+к) /3/
где К - константа. График этой функции хорошо совпадает с экспериментальными картами отображений, полученными при поточечном картировании зрительной коры, рис. 3.
Функция /3/ является функцией комплексного логарифма и осуществляет конформное отображение зрительного поля в пространство зрительной коры (Кроль 1968, Скрипников, Кроль 1972). Основные свойства отображения определяются следующим образом:
1. При отображении происходит подобное преобразование малых элементов, наряду с значительными искажениями больших фигур. Это свойство является следствием того, что в каждой точке отображение характеризуется постоянством углов и растяжений линейных размеров. Другими словами величины углов между любыми линиями фигур при отображении сохраняются; при этом в каждой точке имеет место одинаковое растяжение по всем направлениям, в разных точках коры растяжение разное.
2. Масштабный фактор отображения показывает, что размер малых элементов изображения в коре изменяется обратно пропорционально расстоянию этих элементов от центра сетчатки. Следствием этого является увеличение масштаба отображения элементов центра поля зрения и сжатие масштаба отображения периферических элементов. Такое отображение, в частности, переводит неравномерную полярную сетку координат сетчатки в равномерную сетку декартовых координат коры. Отметим, что равномерное представительство в коре относительно небольшой центральной части зрительного поля и всей остальной периферии создает условия для существования системы глазодоминантных и ориентационных гиперколонок, имеющих одинаковый размер вне зависимости от того, какую часть зрительного поля они анализируют (Хьюбл.Визел 1977). Отметим также, что сохранение при отображении подобия малых элементов и углов
''0
12о
Рис.3. Отображение зрительного поля в проптраиство зрительной кори. Л. Отображения У-1п2, V—1пС¿-ьК) . Экспериментальные дашшс: Б.- Лллман.Каас,137'!,зрительная кора обезьяны; 13.-Билдж и др..1967,зрительная нора кошки; Г.- Тутел я др. ,1902, зрительная коря макака.
Рис.Л. Примеры текстур, исиольпошшшнхся в качестве тестовых фигур.
между фрагментами всех уровней сложности в явном виде указывает на фундаментальное значение характеристик взаимного отношения между различными типами элементов в процессе создания эталонного описания и узнавания изображения.
ГЛАЗА IV. МЕХАНИЗМЫ ТЕКСТУРНОГО АНАЛИЗА
В соответствии с общей'схемой зрительного восприятия, развиваемой в данной работе, место текстурного анализа определяется тем, что он представляет собой процедуру, применяемую исполняющими блоками для выделения сложных по внутренней структуре областей. Текстурный анализ является, по-видимому, одним из наиболее существенных способов разбиения сложной пространственной сцены на области, содержащие множество фрагментов, схожих по одной или нескольким характеристикам.
Казалось бы сущность текстурного анализа - выделение областей, - которые в дальнейшем должны рассматриваться вкачестве единиц восприятия, - диктует и способ его проведения.*—описание областей на основании их интегральных характеристик, - без опоры на локальные характеристики фрагментов, составляющих текстурные области.
Однако, описанные в данной работе данные о локальном, поф-рагментном характере процессов узнавания изображений, делают актуальной следующую постановку вопроса. Являются ли основными в процессе восприятия сложных, текстурных изображений механизмы, связанные с анализом отдельных фрагментов, составляющих текстуры, или механизмы, выделяющие текстурные области без анализа характеристик этих фрагментов.
4.1.Восприятие сложных, текстурных изображений.
В экспериментах в условиях стандартного, обратного шумового маскирования измерялось пороговое время предъявления, необходимое для узнавания текстурных- изображений^ каждое из которых состояло из двух текстурных областей, рис.4. Непосредственная цель экспериментов состояла в измерении порогов выделения и охарактеризации отдельных фрагментов (групп фрагментов),составляющих текстуры и порогов выделения границ между текстурными областями.
В ходе временного развития процесса восприятия сложных текстур было выделено 4 стадии: стадия выявления зон разной яркости (порог 39,1+1,26 мс.), стадия частичной охарактеризации Фрагментов текстур (порог 58,16+2,55 мс.), стадия приблизитель-
ного выделения "полюсов" текстурных областей (порог 61,59±2,55 мс. ) и стадия выделения границ между этими областями (порог 181,27+3,94 мс).
Существенно, что стадия выделения зон разной яркости (интегральный текстурный анализ) имела место не у всех испытуемых и не во всех экспериментах, что, по-видимому, говорит о ее менее важной роли или необязательности для процесса текстурного анализа. Важно также отметить, что яркостные зоны не совпадали с областями, занимаемыми той или иной текстурой; в частности, внутри одной текстурой области могло присутствовать несколько зон разной яркости.
Стадии локального текстурного анализа - частичная охаракте-ризация и выделение "полюсов" текстурных областей - связаны с измерением различных характеристик отдельных текстурных фрагментов. В результате прохождения этих стадий вне зависимости от того грубо или точно испытуемые выделяли текстурные области они всегда выделяли их как места, занятые фрагментами определенного типа. Таким образом, существенно то, что испытуемые никогда не выделяли сами текстурные области без информации о том, из каких фрагментов эти области состоят.
Порог последней стадии - проведения границ между текстурными областями (границы указывались с точностью до 20-25°) - примерно втрое превышал порог стадии частичной охарактеризации фрагментов текстур. Полученные факты свидетельствуют,что зрительная система на продвинутых стадиях текстурного анализа не использует интегральных механизмов, типа автокорреляции. Действительно, при таких способах работы области выделялись бы раньше, чем появлялась информация о фрагментах, чего в экспериментах не обнаружено.
4.2.Модель процесса текстурного анализа.
Модель реализует основные этапы, выявленные в ходе экспериментального исследования восприятия изображений сложных, естественных текстур. Текстурный анализ по излагаемой модели включает в себя этапы двух типов. Во первых этапы, связанные с описанием (измерением характеристик) отдельных текстурных фрагментов и их групп. Во-вторых, собственно текстурные этапы, связанные с формированием текстурных областей из множества похожих по некоторой характеристике фрагментов. Этапы первого типа являются типичными этапами работы исполняющих блоков в процессе
узнавания формы объектов и.могут быть ввиду этого названы "уз-казательскими". Эти этаиы связаны с операциями разбиения зрительной сцены на элементарные фрагменты и с операциями сборки из этих фрагментов более сложных частей. Работа на этих этапах происходит в соответствии с критериями перцептивных описаний.
Собственно текстурные этапы включают в себя специализированные операции, свойственные только текстурному анализу. Эти этапы могут рассматриваться как результат работы некоторого автономного блока, который может подключаться к любому из этапов измерения. К собственно текстурным этапам относятся: этап отбора элементов, близких по измеряемой характеристике, этапы проверки компактности и измерения характеристик, полученной текстурной области. Измерение характеристик полученной области и сравнение их с заданными в перцептивном описании критериями (например, с допустимыми значениями данной характеристики) является заключительной стадией всего цикла операций процесса текстурного анализа.
Если характеристики полученной области не удовлетворяют требованиям перцептивного описания, то текстурный анализ вступает в новый цикл, связанный с применением другого набора операций измерения и разбиения, и следовательно способный, вообще говоря, дать другой вариант текстурного разбиения.
Данная модель реализована в виде программы для ЭВМ. Первый этап программы проводит два варианта операций разбиения: на од-носвязные области и на отрезки линий между узлами контура. На втором и третьем этапе использовались операции измерения площади, Х-овой и У-овой координат центра тяжести,длины большой и малой полуосей фрагментов, наклона большой оси к горизонтали. На этапе отбора фрагментов применялся оператор "развала на кучи". Результаты экспериментов с программой показали,что она находит естественные с точки зрения человека варианты разбиения сцены на текстурные области, рис.5. ГЛАВА V. СТЕРЕОВОСПРИЯТИЕ.
5.1. Характеристики процесса стереовосприятия объектов произвольно расположенных в пространстве.
В экспериментах использовались специально синтезированные на ЭВМ тестовые стереограммы,на которых полностью отсутствовали монокулярные ключи восприятия глубины; ■ при монокулярном рассматривании стереограммы представляли собой текстурные изоб-
Рис. 5 Пример работы программы текстурного анализа. А - исходное изображение, 3-Е варианты разбиения.
— / V' V /*->/V' „ \.,
Рис. 5 Линейчатая стереопара, содержащая куполообразную поверхность.
ражения, в которых нельзя было увидеть элементы объемности, рис.6.
В экспериментах измерялось время реакции, т.е. время от включения освещенности стереопары до момента нажатия испытуемым одной из 8 клавиш, соответствующих различным наклонам пандуса.
Основная задача экспериментов заключалась в сравнении закономерностей стереозрения, проявляющихся при наличии фронтопа-раллельных участков стереофигур, и закономерностей, определяющих работу на частях, удаленность которых от наблюдателя постепенно меняется Механизмы процессов первого типа могут быть основаны на обнаружении совпадений массивов элементов двух сте-реограмм (Юлеш,1971,1976). Механизмы восприятия наклонных в глубину частей объектов остаются в настоящее время неизвестными. Для создания условий предпочтительной работы механизмов каждого типа использовались точечные и линейчатые стереопары: точечные стереопары состояли из множества отдельных точек, линейчатые - из множества отрезков прямых разной ориентации. Точечные стереопары представляют оптимальные условия для работы механизмов поэлементного совпадения, выявленных в работах Юле-ша. Использование линейчатых стереопар исключает использование сложных процессов узнавания формы. Наряду с этим такие стереопары, составленные из элементарных, типичных для реальных изображений, фрагментов представляют возможность для работы нормальных, обычно функционирующих стереомеханизмов.
В экспериментах измерялось время реакции узнавания стерео-фигур разных типов. Стереофигуры представляли собой либо пандусы, расположенные под разными углами к фоновой, горизонтальной плоскости, либо параллельные плоскости, расположенные на разных высотах относительно фоновой плоскости, либо куполообразные формы.
Эксперименты показали, что процесс стереовосприятия включает в себя следующие временные фазы: фазу отождествления пар фрагментов двух стереограмм, фазу приблизительной (качественной) классификации стереообъекта ж фазу точного определения его параметров. Последние две фазы восприятия, таким образом, могут быть сопоставлены со стадиями оценочной классификации и идентификации при монокулярном восприятии.
Количественное сравнение характеристик восприятия точечных и линейчатых стереопар показало, что для точечных фигур с
ростом угла наклона пандуса связано резкое ухудшение восприятия Время реакции при восприятии пандуса возрастает с 811+27 мс. до 2093+145 мс. при изменении угла наклона пандуса от 22° до 44°. Время реакции при восприятии линейчатых стереограми при этом же изменении угла наклона меняется только от 671+23 мс. до 843+43 мс. Таким образом, при восприятии линейчатых стереограмм зависимость времени реакции от угла наклона пандуса практически отсутствует.
Полученные данные показывают, что механизмы, основанные на поточечном совпадении' элементов и проявляющиеся в полной степени при восприятии точечных паттернов, действительно играют существенную роль при анализе фронтопараллельных или близких к ним частей изображений. В то же время отличные от них механизмы восприятия линейчатых элементов обладают существенным выигрышем при восприятии наклонных в глубину частей.
Однако, работа стереомеханизмов связанных с восприятием линейчатых, произвольно расположенных в пространстве изображений, - а именно они составляют значительную часть реально встречающихся изображений - остается не ясной. Наклонные части сте-реофигур, не расположенные в фронтопараллельных плоскостях, не имеют совпадающих линий ни при каких сдвигах.
Отдельная серия экспериментов была проведена в связи с изучением вопроса об устойчивости восприятия разных типов стереоизображений к вертикальным смещениям. Вопрос о роли вертикальной диспаратности в ходе нормального стереозрения остается в настоящее время не ясным. Однако, известно, что этот параметр играет существенную роль в процессах возникновения некоторых форм косоглазия и при других нарушениях нормального стереозрения.
В экспериментах этой серии измерялись максимально возможные сдвиги по вертикали между правым и левым стереоизображениями, при которых еще возможно объемное восприятие у опытных тренированных испытуемых, обладающих нормальным стереозрением. Использовались точечные и линейчатые стереограммы. Результаты показали, что вертикальный сдвиг является очень критичным параметром стереовосприятия; причем эта критичность имеет тенденцию возрастать с ростом угла наклона пандуса. Следует отметить, что при всех углах наклона пандуса относительно фоновой плоскости, линейчатые'стереограммы допускают больший сдвиг, чем точечные и следовательно, как и в случаях нулевой вертикальной диспарат-
ности, воспринимаются лучше точечных. Так, на расстоянии наилучшего зрения при угле в 22° максимальная вертикальная диспа-ратность равна 4,7+0,44 мм и 6,37+0,48 мм соответственно для точечных и линейчатых стереопар.
Таким образом, механизмы стереовосприятия, выявляющиеся при анализе линейчатых стереопар являются более пригодными в затрудненных условиях зрения - при ненулевых вертикальных диспа-ратностях.
5.2. Модель работы системы стереозрения.
Результаты всех . экспериментальных серий - -свидетельствуют, . что в наиболее сложном варианте стереозрения - при восприятии наклонных в глубину объектов - существенными являются механизмы, чувствительные к вертикальной диспаратности элементов двух стереограмм, и не связанные с обнаружением поточечного совпадения больших массивов элементов. Полученные данные позволяют предположить, что при решении центральной для стереозрения задачи установления соответствия пар фрагментов двух стереограмм, важную -роль играют механизмы. анализа характеристик, „отрезков прямых либо других оформленных фрагментов.
Изображения, связанные своим происхождением с правым и левым глазом, представляют мозгу двойной набор элементов, причем эти элементы, вообще говоря, не идентичны друг другу. Б частности, при наложении изображений большинство элементов не совпадает друг с другом ни при каких сдвигах изображений друг относительно друга. Это связано с тем, что элементы объектов внешнего мира, не расположенные в фронтопараллельных плоскостях, будут иметь разный наклон и разную длину осей на проекциях в плоскостях правой- и левой сетчаток.
Тот факт,что линейчатые стерёограммы представляют собой достаточно простые изображения,позволяет предположить механизм, определяющий процесс их стереовосприятия.Отдельные фрагменты линейчатых стереопар обладают только характеристиками длины и ориентации. Причем,у фрагментов двух стереограмм, соответствующих одному,произвольно расположенному в пространстве,прототипу не могут совпадать ни длины,ни ориентации.Все же у этих фрагментов существуют характеристики,имеющие одинаковые значения. Такими характеристиками являются У-ковые координаты концов этих фрагментов.
Полученные нами экспериментальные данные позволили сформу-
лировать для объяснения механизмов отождествления пар следующую гипотезу "полосы". У пары Фрагментов,являющихся проекциями одного прототипа,должны попарно совпадать координаты самых верхних и самых нижних точек. Другими словами,пара фрагментов, являющихся бинокулярными проекциями одного прототипа,лежат в одной полосе.Гипотеза полосы имеет также дополнительное утверждение: проекции фрагментов разных прототипов лежат,как правило, в разных полосах.
Подтверждением правильности гипотезы "полосы" являются полученные в экспериментальной части работы данные о критичности вертикальной диспаратности элементов двух стереограмм для процесса нормального стереозрения.
В ходе разработки модели стереозрения проведен расчет обоснованности гипотезы "полосы". Результаты расчетов показали ее правильность. При отклонениях точки пространства от плоскости симметрии, имеющих порядок нескольких градусов, предположение "полосы" оказывается точным: проекции точки на правой и левой сетчатке лежат на одной горизонтали. При больших углах отклонения проекции точки лежат на линии, описываемой соответствующим уравнением. Другими словами в этих условиях полоса соответствия представляет собой пару кривых, описываемых этими уравнениями. В качестве поясняющего примера приведем числовые оценки. При угле отклонения точки в 4° линии, описывающие полосу, отличаются от горизонтальных на 0,5%; при отклонениях в 15; - на 1.7%.
В пользу существенной роли механизмов "полосы" в ходе нормального стереозрения говорят факты, описывающие некоторые формы косоглазия. Одной из известных причин косоглазия является анизэйкония, т.е. разная величина изображений на сетчатках двух глаз. Очевидно, что при этом имеет место нарушение работы "полосового" механизма идентификации пар проекции. Таким образом, именно данное нарушение .может представлять первопричину косоглазия при анизэйконии. Другая причина косоглазия - анизометро-пия также может быть объяснена нарушением работы "полосового" механизма, так как следствием анизометропии примерно в 70% случаев (Аветисов, 1967) является анизэйкония.
Еще одной существенной причиной косоглазия является вертикальное расхождение осей глаз. В этом случае также имеет место нарушение полосового механизма идентификации пар проекций.
Отсутствие идентификации -пар фрагментов обуславливает субъективно воспринимаемый феномен двоения. Следствием борьбы с двоением может явиться выключение одного из глаз: функциональная скотома ведомого глаза с отведением его в сторону, т.е. собственно косоглазие.
Дальнейшее усиление механизмов идентификации пар фрагментов связано с совместным действием "полосового" механизма и механизмов усложняющейся охарактеризации формы фрагментов, описанных в главе III "Поисковая модель зрительного восприятия".
Чем дальше реализуется -распознавание, т.е. чем более сложными и разнообразными являются выделенные фрагменты, тем легче будет проходить процедура идентификации пар. В частности, не будет необходимости точно проверять, лежат ли фрагменты в одной полосе, так как способ идентификации будет переключаться с полосового на идентификацию по форме.
Следует отметить, что в зрительной системе идентификация пар по форме действует, повидимому, совместно с механизмом полосовой идентификации. Организация рецептивных полей бинокулярных нейронов удовлетворяет такому представлению. Центры рецептивных полей этих нейронов имеют малую вертикальную диспарат-ность и, следовательно, удовлетворяют гипотезе "полосы". Кроме того бинокулярные нейроны настроены на стимулы определенной формы - отрезки линий. Работа таких нейронов может рассматриваться как пример сочетания полосового механизма и простых механизмов описания формы.
Общая схема процесса стереовосприятия может в итоге быть представлена как последовательность операций: разбиения монокулярных изображении на элементарные фрагменты; идентитикации пар фрагментов двух сетчаток с использованием как полосовых механизмов, так и механизмов идентификации формы; определения горизонтальной диспаратности соответствующих фрагментов и вычисления на ее основе всех трех пространственных координат элементов разбиения. Для вычисления пространственных координат элементов объекта получено выражение описывающее общий вид функции удаленности. Причем, полученные формулы пригодны для определения удаленности точек, расположенных по всему пространству, а не только для точек, расположенных в плоскости зрения /0гл,1962/.
Общая схема процесса стереовосприятия была положена в основу программы, реализованной на ЭВМ. Работоспособность программы
— 4о-
показана в соответствующих машинных экспериментах, цель которых состояла в определении расстояний от телеввода до различных точек реальных тестовых объектов: куба, пирамиды, пандуса, наклонно расположенных в пространстве.
ЗЫЕОДЫ
1. Пороги узнавания при использовании паттернового маскирования в среднем вдвое превышают пороги, имеющие место при использовании неспецифического шумового маскирования. Полученные результаты показали, что паттерновые маски тем сильнее влияют на центральные стадии процесса узнавания, чем больше у них и у теста схожих фрагментов. Результаты экспериментов свидетельствуют, что обработка изображений на центральных стадиях опознания является фрагментно специфичной и осуществляется многоуровневой структурой, анализирующей различные характеристики формы.
2. Изменение условий восприятия (смена маскирующих изображений) приводит к изменению временных характеристик процесса узнавания. 3 частности, показано, что з ходе узнавания при этом могут исчезать одни и появляться другие операции, могут меняться значения порогов отдельных стадии н интервалы между порогами ;тадии. Т-лкгал образом, метод подбора масок свидетельствует о перестраиваемости хода восприятия и может быть применен для создания условии выявления разных стадии процесса восприятия. ' - ■
3. Проведено измерение пороговых времен стадий узнавания стимулов разной сложности. Анализ ошибок восприятия, возникающих на стадии приблизительной, оценочной классификации, приводит к выводу о важной роли а ходе узнавания процессов выдвижения л проверки гипотез о классе изображения, выдвигаемых на основании измерения характеристик фрагментов, генерации различных вариантов разбиения и- выделения фрагментов анализируемых фигур.
Ввиду того что пороги ошибок измерения характеристик отдельных Фрагментов и пороги ошибок определения характеристик взаимного расположения фрагментов статистически не отличаются, сделан зывод о чередовании этих операций з ходе процесса узнавания.
4. Проведено изучение хода восприятия изображении з режиме узнавания объектов заданного типа. т.е. при направленном поиске на тестовом изображении, заранее известной системы признаков.
Восприятие изооражении в этих условиях приводит к активации соответствующего перцептивного, эталонного описания, что выражается в снижении порогов узнавания ожидаемых фигур.
Последовательность стадии восприятия в режиме направленного поиска (измерение интегральных характеристик, выделение сложных комплексов фрагментов, локальный анализ и выделение лишних и недостающих деталей) позволяет рассматривать зрительное узнавание как целенаправленную деятельность, последовательность этапов которой управляется записями перцептивного, эталонного описания соответствующего класса зрительных объектов.
5. Изучение восприятия изображений в условиях действия различных типов шумов показало, что при маскировании "продлением" пороговые времена предъявлений я времена реакции узнавания имеют в среднем вдвое больше значения, чем при маскировании "пересечением". Полученные данные позволяют полагать, что для перцептивного описания класса зрительных объектов существенное значение имеют характеристики взаимного расположения концов отдельных линий фигур, а также характеристики взаимного расположения более сложных фрагментов (эксперименты с искажением сложных фигур).
6. Результаты изучения временных этапов и характеристик процесса узнавания позволили сформулировать положение о узнавании как о контекстно управляемом, перестраиваемом процессе поиска на зрительной сцене фрагментов, характеристики которых удовлетворяют критериям перцептивного, эталонного описания соответствующего класса. На основании анализа экспериментальных данных разработана поисковая модель узнавания формы изображений.
7. Работа модели определяется структурой перцептивного описания класса, однако она не представляет собой абсолютно жестко запрограммированную деятельность. Перцептивное, эталонное описание построено по принципу "часть через части", что дает возможность осуществлять независимую работу отдельных сегментов описания (принцип "автономии"), возможность ограничения количества сегментов. . участвующих в узнавании (принцип "кворума").
Основная стратегия работы перцептивного описания заключается в том, что обработка сцены начинается с включения достаточно высоко расположенных сегментов описания, которые не-
посредственно анализируют изображение, производя как бы шунтирование всех остальных сегментов. Включение нижележащих сегментов происходит только"по запросу" сегментов высших уровней.
Перцептивное эталонное описание является обобщенным, это в частности означает, что в нем содержатся значения характеристик, которыми должны обладать достаточно сложные фрагменты, характеристики которых, например, не зависят от фактуры материала. Интервал значений таких характеристик представляет собой критерий для построения и выделения этих фрагментов путем перебора различных вариантов охарактеризациии, объединения или разделения частей.
8. Нейрофизиологическое изучение пространственных механизмов работы проекционной системы зрительного анализатора (кошка) позволило определить параметры первичных вызванных ответов точек зрительной коры при смещении локальных световых стимулов по сетчатке. В результате показано, что отображение зрительного поля на пространство зрительной коры является конформным, что означает сохранение всех углов между элементами отображенных фигур и следовательно характеристик взаимного расположения фрагментов, сохранение подобия формы малых элементов при значительных искажениях формы больших фигур.
9. Изучение восприятия сложных текстурных изображений показало, что основной чертой этого процесса является постепенно усложняющееся, постадийное описание формы отдельных фрагментов и групп фрагментов, составляющих текстурные области. В результате прохождения стадии интегрального и локального анализа происходит определение характеристик, имеющих одинаковые значения у всех фрагментов данной области. На основании полученных характеристик становится возможным процесс генерации вариантов разбиения сложной текстуры на отдельные компактно расположенные области.
Основные стадии процесса текстурного анализа реализованы в виде модели и программы для ЭВМ, результат работы которой заключается в генерации вариантов -проведения границ между отдельными текстурными областями сложной текстуры, выделении самих текстурных областей и измерении их характеристик. Отбор вариантов осуществляется путем сопоставления интегральных и локальных характеристик отдельных областей критериям перцептивного эталонного описания. Отобранные области используются в процессе
дальнейшеи работы как целостные единицы восприятия.
10. Проведено изучение процесса восприятия стереопар, лишенных монокулярных признаков глубины. Предварительное знание испытуемым ожидаемого в эксперименте стереоизображения приводит к резкому уменьшению времени реакции, что свидетельствует об изменении временных характеристик стереовосприятия в режиме направленного поиска.
11. Сравнительное изучение времен реакций при узнавании точечных, линейчатых и символьных стереопар позволило сделать вывод об активном участии в процессе стереовосприятия механизмов анализа формы фрагментов. Полученные данные позволяют сделать вывод о различных механизмах восприятия точечных стереопар и стереопар, составленных из фрагментов (линий и символов). Показано, что восприятие точечных и линейчатых стереопар, на которых закодированы одни и те же объекты (наклонные плоскости) происходит по разному. Время узнавания объектов на линейчатых стереопарах практически не зависит от наклона фигуры в пространстве. Время узнавания плоскости на точечных стереопарах напротив резко растет с ростом наклона плоскости.
12. В-работе сформулирован "полосовой" механизм решения основной задачи стереовосприятия - идентификации пар неточечных, имеющих форму, фрагментов двух сетчаточных изображений. Показана важная роль нарушении "полосового" механизма в возникновении различных форм косоглазия.
Общая схема процесса стереовосприптия была положена в основу программы, реализованной на ЭВМ. Результат работы программы - определение удаленности элементов реальных объектов, расположенных наклонно в пространстве, на основании двух сетчаточных изображений.
Основные материалы диссертации опубликованы з следующих работах:
1. Бинокулярное взаимодействие на уровне наружного коленчатого тела и коры зрительного анализатора коики//Ироблемы нейрокибернетики. Рефераты докл. Ш Всесоюзной конферен. по нейрокибернетике, -1967. - С. 75-76. Соавтор А. Г. Скрипников
2. Изучение структурно-функциональных единиц зрительного анализатора//там же. С. 139-140. Соавтор А. Г. Скрипников
3. Проекционные отношения з многоканальной системе зрительного анализатора кошки//Современные проблемы кибернетики. -М. -"Наука". -1970. -0.257-273. Соавтор А. Г. Скрипников
4. Модельные представления о процессе узнавания зрительных образов//Управление и информационные процессы з твой природе. -М. -"Наука". -1971. -С. 64-69. Соавторы: Левашов 0.В., Позин Н. В., Реклайтис В. К. , Таненгольц Л И.
5. Информационные процессы в зрительном анализаторе//Сов-ременные проблемы нейрокибернетики -Л.-"Наука". -1972. -С. 107-119. Соавтор А. Г. Скрипников
6. Некоторые структурно-фенкциснальные характеристики проекции сетчатки на зрительную кору ксшки//Нурн. высшей нервной деятельности.-1S72.-т. 22.-N 3.-С.575-581. Соавторы:
Н. Н. Любимов, А. Г. Скрипников
7. Характеристика вызванных отгегоз 17 и 18 полей зрительной коры кошки//0птимизация. Исследование операций. Бионика. -М. -"Наука". -1973. -С. 245-254
3. Проблема функциональной ассиметрии больших полушарий головного мезга и зрительное узнавание. //Материалы П симпозиума по физиологии сенсорных систем "Физиология зрения"-Л. , -1973. -С. 104-106. Соавторы: Левашов 0. В. ..Таненгольц А И.
9. Модель некоторых этапов узнавания схематических изображений. //Биофизика. -1973. -т. 18. -вып. 3. -С. 544-549. Соавторы: Левашов 0. В., Реклайтис В. К., Таненгольц Л. И.
10. Текстурный анализ//Труды 1У Международной конференции по искусственному интеллекту. -1975. -т9. -С. 99-103. Соавтор Таненгольц А И.
И. information processes in the visual analyzer//Current problems in newrocybernetics. -M. Y. -1975. -P. 118-132.Соавтор А. Г. Скрипников
12. Пороговое время предъявления и время узнавания предметных изображений. //Переработка информации в зрительной
сис?еме//Тезксн доклада ГУ симпозиума по физиологии сенсорных систем. -1976. -С. 80-83. Соавтор Таненгольц Л. И.
13. Сравнение времени узнавания и порогового времени предъявления изображений. //Тезисы доклада 1У Международной конференции по кейрокибернетике. -1976. -С. 94-95. Соавтор Таненгольц Л И.
14. Время узнавания, пороговое времени предъявления и длительность маскирования изображений.//Физиология человека. -1976. -т. 2. -И 4. С. 566-570. Соавтор Таненгольц Л И.
15. Восприятие текстур как процесс, связанный с анализом составляющих их фрагментов. //Тезшы У създа психологов.-1977.-С. 134
16. Особенности 'тахистоскопического восприятия текстур. //Физиология человека.-1979.-т. 5.-Н 2. С. 281-285. Соавтор Таненгольц Л. И.
17. Текстурный анализ и зрительное восприятие. //П Мемду-народная конференция "Бионика-78". -1978. т. 2. С. 19-22
18. Модель работы зрительной системы при выделении объектов заданного класса. I. Структура эталонного описания.//Физиология человека. -1979. -т. 5. -Н 5. С. 875-881
19. Модель работы зрительной системы при выделении объектов заданного класса. П. Основные этапы -и операции, //там же. С. 882-890
20. Текстурный анализ и его место в зрительном восприятии. //Бионические аспекты сенсорных и управляющих процессов в нервной системе. -М. -1980. -С. 9-18
21. Моделирование процесса восприятия текстур зрительной системой человека.//Проблемы нейрокибернетики. -1980. -С. 73. Соавтор Таненгольц Л К ~ - - ' -
22. Временное развитие механизмов зрительного восприятия простых геометрических фигур. //Тезисы Всесоюзного създа психологов.-1982.-С. 121-122. Соавтор Бондарь Е. И.
23. Многоплановое представление сложных рельефов. //Тезисы биофизического конгресса. -1982. -С.8-9. Соавтор Гришин В. Г. •
24. Восприятие геометрических фигур в условиях применения различных адаптирующих и маскирующих изображений. //Тезисы Зсессюзнои конференции по нейрокибернетике. -1983. Соавтор Соси-на В. Я.
25. Модель работы бинокулярной зрительной системы при восприятии объема./'/Физиология человека.-1983.-т. 9.-К
4. С. 602-508
25. Восприятие комплексных контурных стереопредстазлений сложных полей.//Тезисы У1 Всесоюзной конференции по инженерной психологии. -1984. -вып. 2. -С. 7. Соавторы: Афанасьев В. Л., Гришин В. Г.
27. Характеристики процесса восприятия изображений при изменении времени их экспозиции. //Журнал зыешей нервной деятельности.-1984.-т. 34.-вып. 4.-С. 778-780. Соавтор Бондарь Е. И.
28. Перестройка процесса зрительного узнавания при смене условий восприятия. //Журнал высшей нервной деятельности. -1984. -т. 34. -вып. 5.-С. 975-977. Соавтор Бондарь Е. И. ■
29. Методика смены обратного паттернового маскирования как фактор процесса восприятия. // Вопросы психологии.-1985.-вып. 3.-С. 162-154. Соавтор Бондарь S. И.
30. Зрительное восприятие изображений з условиях маскирования сходными фигурами. //Физиология человека. -1985. -т. И. -N
5. С. 859-860. Соавтор Сосина В. Д.
31. Психофизические характеристики етереозосприятия объектов, произвольно расположенных в пространстве. /'/Физиология человека. -1985. -т. И. -N 3. -С. 525-528
32. Временные характеристики процесса восприятия объектов-заданного класса. //Вопросы психологии. -1986. -вып. 4.--С. 142-146. Соавторы: Бондарь Е. И., Сосина В. Д.
33. Логическое исчисление для решения задач з сильно структурированных предметных областях. //Автоматика и телемеханика. -1987. -N 2. -0.127-136. Соавтор Таненгольц JL И.
34. Зрительное узнавание как процесс управляемого поиска слогкных фрагментов изображений.//Физиология человека. -1993.
35. Perspective visual"user's'interface: point of view of the psychophysiologist//A report in Internacional Ccnference on Human-Computer Interaction EWHCI'93-East-Vest НС Г 93.-1993. -V. 1.-Р. 159-163.
- Кроль, Владимир Михайлович
- доктора биологических наук
- Москва, 1993
- ВАК 03.00.13
- Влияние сходства форм изображений на точность их узнавания
- Электронно-микроскопические исследования специфических комплексов ДНК
- Синхронизация нейронной активности в процессах кратковременной зрительной памяти: роль кортикальных холинергических и гламатергических структур
- ДНК-белковое узнавание
- Структурно-функциональные исследования взаимодействий ДНК-зависимой РНК-полимеразы бактерий с промоторами