Бесплатный автореферат и диссертация по биологии на тему
Пространственные и спектральные характеристики краудинг-эффекта
ВАК РФ 03.00.02, Биофизика
Автореферат диссертации по теме "Пространственные и спектральные характеристики краудинг-эффекта"
Санкт-Петербургский государствен ;ми уннверпгге г
Пространственны!, и спектральные характеристики крзудинг-эффекта
специальность 03.00.02 - биофизика
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата биологических наук
РГ Б
1 -? луг
* ' ОМ
•- На правах рукописи
ДАНИЛОВА
Марина Валерьевна
Санкт-Петербург
1996
Работа выполнена в лаборатории физиологии зрения Института Физиологии им.И.П.Павлова РАН, Санкт-Петербург
Научный руководитель - заведующий лабораторией, доктор медицинских наук Ю.Е.Шелепин.
Официальные оппоненты:
доктор биологических наук,профессор Н.Ф.Подвигин, доктор технических наук,профессор В.В .Александров.
Ведущее учреждение - Институт мозга человека РАН, Санкт-Петербург
Защцга диссертации состоится 1996 г. в 16 часов на
заседании Диссертационного Совета Д.063.57.50 по «щите диссертаций на соискание ученой степени доктора биологических наук в Санкт-Петербургском . государственном университете по адресу: Санкт-Петербург, Университетская наб., 7/9.
С д! сертацисй можно ознакомиться в библиотеке Санкт-Петербургского государственного университета (Санкт-Петербург, Университетская наб., 7/9).
Автореферат разослан "_"___ 1996 г.
Ученый секрегчрь
Лнссерыипонн 'Го Совета
кандидат бчо.ш |'.чесм:\ на} к. доцент
З.И.Крутецкая
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность исследований. Проблема сегментации изображения, т.е., разделение его на отдельные объекты, является одной из важнейших проблем зрительного восприятия. Применительно к техническим системам, разработанным для инженерных задач передачи оптической информации, методы сегментации используют свойства избыточности изображения. Для того, чтобы идентифицировать объект, предварительно необходимо его выделить среди остальных элементов изображения. В технических системах обработки изображений для выделения объектов обычно используют яркостные признаки (Александров. Горский, 1985). На основе яркостных методов строятся методы сегментации по текстурным и цветовым признакам. Применительно к зрительной системе человека процессы сегментации традиционно исследуются с применением текстурированных изображений, где цвет является вторичным признаком.
Один из подходов к сегментации любых, необязательно текстурированных изображений, предложили гештальт-психологи и сформулировали общие принципы группирования отдельных элементов объекта в целое, гештальт (Koffka, 1935), такие как принципы близости (proximity), схожести (similarity), принцип "хорошего продолжения" (good continuity) и принцип "общей судьбы" (common fate). И хотя экспериментальных данных, подтверждающих принципы группирования, много, сами принципы в основном критикуют потому, что они являются интуитивными и качественными описаниями, которые не указывают на механизмы, лежащие в основе этих принципов. При использовании цифровых методов обработки изображений и низко-частотной фильтрации основные принципы группирования, сфомулированные гештальт-психологами, были формализованы, и была показана их справедливость (Ginsburg, 1971).
Представления о зрительной системе, как о наборе частотных фильтров (Campbell, Robson, 1968; Glezer et al., 1973; Ginsburg, 1971) позволили сформулировать основные положения разделения изображений в зрительной системе на основе пространственно-частотного анализа (см., например, обзоры в Шелепин и др., 1992; Глезер, 1993; Левашов, 1989; Кропотов, 1989; Caelli et al., 1978). В работах Гинзбурга (Ginsburg et al., 1976) был также выдвинут тезис о том, что ограниченного набора низкочастотных фильтров достаточно для описания формы изображения.
Другой подход к сегментации зрительных изображений, также использующий идею о том, что изображение как гештальт описывается ограниченным числом элементов, был предложен в опубликованных ранее работах (Кемпбелл, Шелепин, 1990; Шелепин и др., 1995). В этих работах было показано, что на пределе разрешения зрительной системы изображение как гештальт описывается функциональным элементом, который отождествляется с модулем зрительной коры
(Ilubel, Wiesel, 1962; Глезер, 1993). Тем самым была отмечена важность соотношения размеров элементов разбиения зрительной системы и размеров всего изображения.
Однако в этих экспериментах не учитывали два фактора: во-первых, не исследовали процесс сегментации изображений больших размеров, и во-вторых, не принимали во внимание тот факт, что реальный мир не черно-белый, а цветной. Естественно возникает вопрос о формировании функциональных элементов для описания окрашенных изображений и об изменении размеров этих элементов при изменении размеров зрительных объектов. Известно,что цвет играет важную роль в задачах на зрительный поиск (Braun, Sagi, 1990; Harms, Bundesen, 1983), что говорит о том, что цветовые отличия объекта от окружающих его дополнительных объектов упрощают его выделение. Однако зависимость размера функциональных элементов от окраски изображений не исследовали.
Целью данной работы явилось изучение влияния размера и цвета тестовых объектов и их окружения на контрастную чувствительность и разрешающую способность наблюдателя, а также на его способность выделять объект из окружения, которые обеспечивают восприятие отдельного тестового объекта. Для решения поставленной задачи в качестве тестовых объектов использовали распространенные в офтальмологической практике оптотипы - кольца Ландольта. Предъявление этих стимулов позволило впервые использовать такую зрительную задачу, как хорошо известный краудинг-эффект, в качестве модели сегментации зрительной сцены. Краудинг-эффект можно определить как ухудшение распознавания тестового объекта, окруженного рядом расположенными дополнительными объектами или контурами. Сам термин "краудинг-эффект" образован от английского слова "crowd" -толпа - и достаточно хорошо отражает сущность данного явления.
Основной задачей данной работы явилось исследование краудинг-эффекта, в том числе:
1) изучение влияния формы дополнительных объектов на способность наблюдателя выделять информацию о тестовом стимуле;
2) изучение влияния изменения окраски тестового стимула и его окружения (т.е., окрашивание как тестового изображения, так и дополнительных объектов в спектральные цвета) на пространственные характеристики краудинг-эффекта.
Основные положения, выносимые на защиту. 1) При опознании формы тестового объекта, окруженного дополнительными стимулами, функциональные элементы, описывающие объект как целое, формируются в зависимости от размера объекта.
2) Размер функциональных элементов, описывающих объект как гештальт, определяется пространственными характеристиками (размером) тестового объекта и
нс зависит от цвета, т.е. окрашивания в спектральные цвета как тестового стимула, так и дополнительных объектов.
3) В условиях выделения тестового стимула, окруженного матрицей дополнительных объектов, формирование функциональных элементов происходит независимо от формы дополнительных объектов.
Научная новизна. Впервые был исследован вопрос о зависимости размера зоны тормозного взаимодействия, определяемой как такое расстояние между краями тестового и дополнительных объектов, при котором на опознание тестового стимула не влияют дополнительные объекты, от изменения окраски тестового и дополнительных объектов. Было показано, что внесение цветовых различий не изменяет размер зоны тормозного взаимодействия. Однако при наличии цветовых различий снижается разница между контрастным порогом обнаружения изолированного тестового стимула и стимула, окруженного дополнительными объектами.
В центре поля зрения исследована зависимость размера зоны взаимодействия между функциональными элементами (краудинг-эффект) от формы дополнительных контуров, окружающих тестовый объект. Было показано, что форма дополнительных объектов не влияет на размер зоны тормозного взаимодействия. Однако при изменении формы дополнительных объектов, форма кривых, описывающих этот вид тормозного взаимодействия как зависимость процента правильных ответов от расстояния между тестовым и дополнительными объектами, изменяется: при использовании в качестве дополнительных объектов полос получена U-образная функция; при использовании матрицы из колец Ландольта получена монотонно увеличивающаяся функция.
Теоретическая и практическая значимость. Полученные экспериментальные данные позволяют определить характеристики функционального элемента зрительной системы, используемого для выделения целостного объекта из фона,и дают представление о механизме сегментации зрительной сцены при создании систем обработки и передачи информации.
Краудинг-эффект является важным приемом исследования в оптометрии - науке, решающей практические задачи оценки функциональных возможностей органа зрения. Изучение краудинг-эффекта - это важнейшая проблема практической медицинской метрологии. Полученные данные могут быть использованы при создании новых оптотипов для исследования больных с рядом офтальмологических и неврологических заболеваний.
Полученные в работе экспериментальные данные могут бьггь использованы для решения практических задач сегментации изображений и выделения целостных
объектов из фона в различных системах представления зрительной информации, например, при организации рабочего места операторов видеоконтрольных устройств.
Апробация работы. Апробация диссертации состоялась на научном семинаре лаборатории физиологии сенсорно-моторных функций, лаборатории физиологии речи и лаборатории физиологии зрения Института физиологии РАН.
Результаты исследований были доложены на Конференции молодых ученых "Механизмы регуляции физиологических функций" (Санкт-Петербург, 1992), на 29-м совещании по высшей нервной деятельности (Санкт-Петербург, 1994), на 18-й Европейской конференции по зрительному восприятию (Тюбинген. Германия, 1995).
Публикации. По теме диссертации опубликовано 5 работ.
Структура и объем диссертации. Диссертация состоит из введения, обзора литературы, описания методов исследования, результатов собственных исследований, их обсуждения, выводов, списка литературы и приложения. Диссертация изложена на 198 страницах, иллюстрирована 36 рисунками, 5 таблицами. Библиографический указатель включает 154 литературных источника, в том числе 27 на русском и 127 на английском языках.
МЕТОДЫ ИССЛЕДОВАНИЙ
Все эксперименты были проведены с применением психофизических методик исследований.
Исследование краудннг-эффекта
При исследовании краудинг-эффекта были проведены четыре серии экспериментов.
Стимулы. В трех первых сериях тестовыми стимулами служили стандартные кольца Ландольта в 4-х ориентациях. Толщина кольца и величина разрыва кольца
С О О
° ЭиР 6
а
ООО
составляли 1/5 от его диаметра (рис.1).
а
Рис.1. Примеры стимулов, использовавшихся в экспериментах по изучению краудинг-эффекта (первая и третья серии экспериментов). Расстояние а равно размеру диаметра тестового кольца.
В первой серии экспериментов исследовали влияние дополнительных объектов различной формы на определение формы центрального тестового объекта для черно-белых изображений. Использовали два типа дополнительных объектов, окружающих тестовый стимул. Ими были либо 4 полосы, симметрично расположенные вокруг тестового стимула (рис.1,а), либо прямоугольная матрица из 8 колец Ландольга со случайно ориентированным разрывом, аналогичных тестовому кольцу (рис!.б). Использовали черные стимулы (5 кд/м2) на белом фоне (210 кд/м ). Размеры тестовых колец подбирали индивидуально для каждого испытуемого в зависимости от остроты зрения в пределах от 2.25 до 4.5 угл.мин.
Вторая серия экспериментов была проведена с целью выравнивания субъективной яркости двух тестовых колец, окрашенных в разные спектральные цвета. Испытуемым предъявляли кольца, окрашенные в красный и зеленый цвета, находящиеся на фиксированном расстоянии друг от друга, равном размеру тестового кольца. Размер кольца соответствовал размеру тестового кольца, которое использовали в третьей серии.
В третьей серии экспериментов исследовали влияние цветовых различий между тестовым и окружающими его дополнительными объектами на обнаружение ориентации разрыва центрального кольца. Использовали нейтральный серый фон (освещенность фона - 5 кд/м2), на котором предъявлялись изображения красного (х=0.6054, у=0.3619 в координатах цветностей цветового треугольника МКО-1931) или зеленого цвета (х=0.3171, у=0.5786) или комбинации этих цветов (тестовый стимул окрашен в один цвет, а дополнительные объекты - в другой). Яркость стимулов находилась в пределах от 20 до 29 кд/м2 для разных цветов индивидуально для каждого испытуемого (значения яркости были получены во второй серии экспериментов). Размер стимула был одинаков для всех испытуемых и составлял 5.3 угл.мин. В качестве дополнительных объектов использовали только прямоугольную матрицу из 8 колец Ландольта (рис. 1,6), размер которых был такой же, как и у тестового кольца, а ориентацию варьировали случайно.
В четвертой серии экспериментов исследовали зависимость выравнивания субъективной яркости от расстояния между тестовыми полями. Использовали два
квадрата, размер которых составлял 5 угл.мин., расположенных вертикально. Квадраты было окрашены в разные цвета. Расстояние между квадратами менялось от О до 58 угл.мин. с шагом 3.96 угл.мин.
Процедура. В первой серии экспериментов определяли процент правильных ответов при предъявлении стимула с фиксированными параметрами. Испытуемый бинокулярно смотрел на экран монитора с расстояния 6 м. В каждом эксперименте использовали только один тип дополнительных объектов и измеряли зависимость процента правильных ответов от расстояния между ними и тестовым
кольцом. Шаг изменения расстояния между тестовым кольцом и дополнительными объектами составлял 0.225 угл.мин. Затем эксперимент повторяли для других дополнительных объектов. На приведенных графиках значение каждой точки основано на более чем 45 предъявлениях каждого стимула (см.рис.1). Во второй серии экспериментов испытуемым предлагали выравнять яркость двух колец. Для каждого испытуемого проводили по 5 выравниваний яркости, полученные значения усредняли и использовали в третьей серии. В третьей серии экспериментов измеряли зависимость порогового контраста обнаружения разрыва тестового кольца Ландольта от расстояния между тестом и матрицей дополнительных объектов. Испытуемый монокулярно (правый глаз) смотрел на экран монитора. Расстояние наблюдения составляло 11.8 м и было получено с помощью трехкратного отражения от плоских оптических зеркал. В каждой серии фиксировали комбинацию цветов теста и дополнительных колец, и измеряли зависимость порогового контраста обнаружения разрыва кольца от расстояния между тестовым и дополнительными кольцами методом "лестницы". Расстояние между тестовым кольцом и дополнительными кольцами изменяли с шагом 1.3 угл.мин. Использовали яркость красного и зеленого кольца, которые были найдены во второй серии. В четвертой серии испытуемые выравнивали яркость зеленого тестового квадрата и красного референтного квадрата. Для каждого испытуемого проводили не меньше 5 серий, в каждой из которых было сделано по 5 выравниваний для каждого расстояния между тестовыми полями.
Наблюдатели. В первой серии экспериментов участвовали 5 испытуемых с нормальной и выше или скорректированной до нормальной остротой зрения, измеренной по таблицам Головина-Сивцева. Четверо наблюдателей были опытными испытуемыми, а один впервые участвовал в экспериментах по зрительному восприятию. Во второй и третьей серии экспериментов принимали участие трое испытуемых с нормальной или скорректированной до нормальной остротой зрения и нормальным цветовым зрением. Один, наблюдатель был опытным испытуемым, а двое впервые участвовали в психофизических экспериментах. В четвертой серии экспериментов участвовали 15 наблюдателей с нормальной (без коррекции) остротой зрения и нормальными цветовым зрением. Цветовое зрение проверяли с помощью таблиц Ишихара и теста Мэнселла или аномалоскопа Нагеля.
Исследование процесса сегментации простых геометрических фигур Стимулы. Стимулами служили простые и наклонные кресты, вписанные в квадратные рамки. Толщина линий, образующих кресты, и ширина линий в рамках составляли 1/10 от размера рамки. Размеры рамок варьировали от 10.8 до 178 угл.мин. Тестовые изображения предъявляли черные (0.5 кд/м2) на белом фоне (210 или 250 кд/м2).
Процедура. Стимулы предъявляли в случайном порядке в цешре экрана дисплея. В каждой серии фиксировали размер рамки и варьировали размер крссга от полного соприкосновения с рамкой до 1/3 от размера рамки. Испытуемому предлагали ответную карту, на которой были изображены отдельные кресты и кресты, соприкасающиеся с рамкой. При каждом предъявлении от наблюдателя требовали ответить, на что больше похож предъявляемый стимул: на отдельный крест или на крест, вписанный в рамку. Расстояние наблюдения было 6 и 2 м. Для двух размеров рамок (35.6 и 71.1 угл.мин.) измерения повторяли при обоих расстояниях наблюдения, чтобы исключить влияние размера экрана на восприятие целостное!и изображений. Критические расстояния между краем креста и внутренним краем рамки, при которых происходило разделение стимула на части (выделение креста как самостоятельной фигуры) определяли как 50%-й уровень на психометрической функции, связывавшей размер креста с ответами "целое изображение". Наблюдатели. В экспериментах участвовали 7 наблюдателей с нормальной или скорректированной до нормальной остротой зрения. Отдельные точки были получены еще на 5 наблюдателях.
РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЙ И ИХ ОБСУЖДЕНИЕ
Сравнение характеристик краудинг-эффекта при использовании дополнительных объектов различной формы.
В первой серии экспериментов было получено, что окружение тестового кольца четырьмя полосами привело к 11-образной кривой, тогда как добавление матрицы из восьми колец выявило монотонно возрастающую функцию, описывающие зависимость процента правильных ответов ог расстояния между тестовым стимулом и окружающими его дополнительными объектами (рис.2). Увеличение размера тестового стимула в 1.5-2 раза, а также изменение формы дополнительных объектов не изменяли размер зоны тормозного взаимодействия. Для каждого испытуемого размер зоны оставался постоянным, зависел только от остроты зрения и находился в пределах от 2.25 до 3.4 угл.мин. для разных испытуемых Для полной изоляции тестового стимула (расстояние между краями теста и дополнительных объектов, при котором процент правильных ответов при определении ориентации тестового кольца, окруженного дополнительными объектами, равнялся проценту правильных ответов для изолированного кольца) необходимо было удалить другие объекты на расстояние, равное размеру тестового кольца на пределе разрешения зрительной системы наблюдателя.
В л лп
1-1-1-Г-]-1—г
01 234567 расстояние а, угл.мин.
Дополнительные объекты:
полосы;
Т Г i I Г 01234567 расстояние а, угл.мин.
°—° матрица из 8 колец
Рис.2. Зависимость процента правильных ответов опознания ориентации тестового кольца Ландольта, окруженного дополнительными элементами разной формы.
Данные приведены для одного и того же размера тестового стимула, окруженного либо матрицей (незаполненные кружки), состоящей из колец Ландольта, либо четырьмя полосами (заполненные кружки).
Горизонтальные пунктирные линии на графике соответствуют проценту правильных ответов при опознании ориентации изолированного тестового кольца, полученному в данной серии экспериментов.
Вертикальные линии на графике указывают размер зоны тормозного взаимодействия, определяемую с помощью критерия %2: рассчитывали достоверность отличия процента правильных ответов, полученного при опознании ориентации изолированного тестового кольца, и кольца, окруженного матрицей дополнительных объектов. Расстояние а, где различия уже были недостоверны, принимали за размер зоны тормозного взаимодействия.
а - испытуемый МД, б - испытуемый ВБ.
Механизмы, лежащие в основе этого явления, а также приблизительную локализацию в зрительной системе можно предположить, исходя из рассмотрения психофизических данных, полученных в данной работе и известных из литературы, а также морфологических данных. Известно, что горизонтальные связи обнаружены на всех уровнях зрительной системы: от сетчатки и НКТ (Подвигин, 1991) до зрительной коры (Hubel, Wiesel, 1962). Экспериментальные данные показывают, что пространственное взаимодействие, выявляемое при изучении краудинг-эффекта, локализовано на пост-хиазмальном уровне, так как в дихоптических экспериментах, где стимул предъявляется одному глазу, а дополнительные объекты - другому, было обнаружено такое же взаимодействие, как и при монокулярном предъявлении (Flom et al., 1963b; Westheimer, Hauske, 1975; Levi et al., 1985; Kooi et al., 1994). Далее,
взаимодействие также было обнаружено между тестовыми стимулами, предъявляемыми в область слепого пятна одного глаза, а дополнительных объектов -другого глаза (Tripathy, Levi, 1994). На основе этих данных можно предположить, что механизмы, лежащие в основе этого эффекта, локализованы в зрительной системе не ранее стриарной коры, где соединяется информация от обоих глаз. Известно, что стриарная кора имеет модульное строение: модуль состоит из нейронов, избирательно настроенных на определенные пространственные частоты и ориентации (Hubel, Wiesel, 1974). Известно также, что между такими модулями существует взаимодействие (Kaas, 1986). Поэтому можно предположить, что в основе пространственных взаимодействий, выявляемых в задачах типа краудинг-эффект, лежат горизонтальные тормозные связи между рецептивными полями модулей стриарной коры. Локализация этого явления на уровне стриарной коры также подтверждается результатами измерения зон взаимодействия краудинг-эффектау детей различного возраста (Atkinson, 1991; Kothe, Regan, 1990): размер зон у детей соответствует размерам зон, полученным для взрослых наблюдателей только в 6-7 лет. Морфологические данные о созревании стриарной коры также к 6-7-летнему возрасту подтверждают этот вывод. Несомненно, что в онтогенезе формирование механизма, лежащего в основе опознания формы объекта, окруженного дополнительными объектами, происходит согласованно со всеми уровнями зрительной системы, начиная от оптики глаза. То, что оптика глаза лежит в основе формирования механизма, опосредующего это явление, подтверждает и тот факт, что у людей, имевших плохую оптику в детстве (например, амблиопия). по абсолютной величине зона взаимодействия намного больше, чем у людей с нормальным зрением (Flom, 1991; Jacobs, 1979; Levi, Klein, 1985). однако cloth ос ительный размер также равен размеру стимула на пределе разрешения наблюдателя, как и у людей с нормальным зрением, т.е. минимальному углу разрешения (Flom, 1991).
В первой серии эксперименты были проведены с использованием черно-белых стимулов. Однако цвет играет большую роль в зрительном восприятии, следовательно, встает вопрос о формировании функциональных элементов, описывающих окрашенные изображения в процессе сегментации.
Сравнение характеристик краудинг-эффекта при изменении окраски тестовых стимулов и дополнительных объектов
В третьей серии экспериментов рассмотрим две характеристики краудинг-эффекта, с помощью которых можно описать возможность наблюдателя определять положение разрыва тестового кольца Ландольта. В первой серии экспериментов рассматривалась только одна характеристика - размер зоны тормозных взаимодействий.
,7 ,6 -,5 -
АБ
л -
б
-.1 --,2 -
О 2 4 6 8 10 12 14 расстояние а, угл.мин.
О 2 4 в 8 10 12 14
расстояние а, угл.мин.
•—• зеленый - зеленый °—0 зеленый - красный
красный - красный красный - зеленый
Рис.3. Сравнение зависимостей разностей между пороговым контрастом обнаружения разрыва изолированного тестового кольца Ландольта (С0) и кольца, окруженного матрицей колец (С) от расстояния между тестовым кольцом и матрицей для различных комбинаций окраски тестового кольца и матрицы.
Пунктирная линия на графиках обозначает нулевую разность между пороговым контрастом, полученным при предъявлении изолированного кольца, и пороговым контрастом, полученным при предъявлении кольца, окруженного матрицей дополнительных колец. Нулевая разница свидетельствует о том, что добавление матрицы не привело к изменению порогового контраста обнаружения разрыва кольца.
В легенде, приводимой ниже графиков, первое слово обозначает цвет тестового кольца Ландольта, второе - обозначает цвет матрицы дополнительных колец.
а - испытуемый АТ, б - испытуемый АБ.
В качестве первой характеристики краудинг-эффекта рассмотрим размер зоны тормозных взаимодействий. Окрашивание тестовых изображений и дополнительных объектов в красный и зеленый цвета не изменило достоверно размер зоны взаимодействия по сравнению с . ахроматическим вариантом стимулов
Внесение цветовых различий между тестом и дополнительными объектами привело к тому, что у одних испытуемых зона взаимодействия незначительно сузилась, когда зеленое тестовое кольца было окружено массивом красных дополнительных объектов, а у других испытуемых такое же незначительное
(см.рис.З).
уменьшение было выявлено в противоположной ситуации при окружении красного тестового кольца массивом зеленых дополнительных колец. Изменение размера зоны взаимодействия можно было бы связывать с изменением размера функциональных элементов, описывающих объект, если бы наблюдаемые изменения было одинаковы для всех испытуемых, т.е. сужение или расширение зоны взаимодействия наблюдали бы при одной и той же комбинации цветов центрального тестового кольца и матрицы дополнительных колец.
Результат экспериментов третьей серии не позволяет сделать такой вывод, а четвертая серия экспериментов позволила связать этот факт с другим явлением, а именно,с зависимостью субъективного равенства яркости красного и зеленого цветов от расстояния между тестовыми полями. Эта серия, проведенная на группе из 15 испытуемых с нормальным цветовым зрением, показала наличие индивидуальных различий выравнивания яркости двух тестовых полей, окрашенных в разные спектральные цвета. В группе обследованных наблюдателей можно выделить две подгруппы. В первой подгруппе не было выявлено зависимости субъективного равенства яркости от расстояния между тестовыми полями, однако тестовые поля казались равнояркими, если яркость зеленого поля превышала яркость красного поля. В другой подгруппе была выявлена зависимость от расстояния между тестовыми полями: при малых расстояниях (5-15 угл.мин.) для выравнивания субъективной я ,-сости тестовых полей требовалась более высокая яркость зеленого поля, чем при С _.льших расстояниях (20-60 угл.мин.) Этот факт позволяет объяснить зависимость выполнения задачи опознания формы тестового стимула от комбинации цветов, в которые были окрашены тестовые стимулы и окружающие их дополнительные объекты, полученную как в данной работе, так и другими авторами (Коо1 й а1., 1993) в условиях измерения контрастного порога. При проведении экспериментов третьей серии выравнивание субъективной яркости проводилось на фиксированном расстоянии между объектами (вторая серия экспериментов), а коррекция на зависимость выравнивания от расстояния не проводилась, поэтому для части испытуемых восприятие яркости зеленого и красного цветов было выравнено не для всех исследованных расстояний между объектам.
В качестве второй характеристики краудинг-эффекта рассмотрим степень краудинг-эффекта, которую можно ввести как разницу между контрастным порогом обнаружения разрыва тестового кольца Ландольта, полученным при добавлении дополнительных объектов, и порогом, полученным для одиночного кольца. Эта величина достоверно уменьшается у всех испытуемых при наличии цветовой разницы между тестовым и дополнительными объектами независимо от комбинации цветов. Тем не менее,полностью изолировать тестовое кольцо путем внесения цветовых различий не удалось: пороговый контраст обнаружения разрыва кольца.
окруженного матрицей дополнительных объектов, по-прежнему оставался выше, чем пороговый контраст, полученный для изолированного кольца. Было зарегистрировано увеличение порогового контраста для тех же расстояний, когда и тестовое кольцо, и
дополнительная матрица были окрашены в одинаковый цвет.
Полученный в третьей серии экспериментов факт о независимости размера зоны тормозных взаимодействий от окраски изображения свидетельствует о том, что процесс выделения объекта из фона (т.е. опознание формы изображения для последующей сегментации зрительной сцены) для наблюдателей, имеющих нормальное зрение, не связан с цветовыми характеристиками изображения. Следовательно, на пределе разрешения зрительной системы функциональные элементы, описывающие изображение как целостный объект, формируются в зависимости от пространственных (размер), а не цветовых характеристик объекта. Этот факт подтверждается также данными Куликовского с соавторами (1991), которые приводят экспериментальные данные о том, что самый высокочастотный элемент (пространственно-частотный канал при использовании терминологии частотного анализа) не воспринимает цветовые различия.
Таким образом, на пределе разрешения зрительной системы в условиях тормозного взаимодействия между функциональными элементами, описы ющими зрительный объект как целое, гештальт размер функциональных элементов превышает размер тестового объекта в 3 раза. Сохраняется ли соотношение размеров тестовых изображений и функциональных элементов, описывающих эти изображения, при увеличении размера изображений? Этот вопрос исследовался на примере сегментации простых геометрических изображений при изменении размеров от 10 угл.мин. до 3 градусов.
Сегментация простых геометрических фигур
При анализе результатов, полученных в этой серии экспериментов, было обнаружено, что различные испытуемые по-разному, решают задачу оценки целостности простого изображения, состоящего из креста (прямого или косого), заключенного в квадратную рамку. По результатам эксперимента вся основная группа испытуемых (7 человек) была разделена на две подгруппы в зависимости от выбранного испытуемым критерия. В первую подгруппу вошли 2'испытуемых, у которых восприятие креста как отдельной фигуры не зависело от размера изображения, а было связано с остротой зрения испытуемого: при наличии видимой белой полосы между краем рамки и краем креста они разделяли фигуру на составляющие. Вторая подгруппа испытуемых использовала другой критерий при выполнении данной задачи. Для этой подгруппы критическое расстояние между краем рамки и краем креста, при котором происходила сегментация изображения
(т.е. смена категории ответа, см. методический раздел), зависело от размера предъявляемого тестового стимула: при увеличении размера рамки критическое расстояние также увеличивалось. Наблюдалась тенденция перехода ответов при больших расстояниях для наклонных крестов, чем для прямых при одном и том же размере рамки. При определении размеров крестов использовали размеры квадрант, в которые они могли быть вписаны. Если оценивать исходные размеры крестов по диаметрам кругов, в которые они могут быть вписаны, то, наоборот, размеры косых крестов будут больше. Важно подчеркнуть, что изменение категории ответов при использовании этих двух стимулов происходит при разных физических размерах этих стимулов независимо от того, как оценивать их размеры.
Отношения размеров рамок к критическим размерам крестов, при которых происходит разделение изображения на его составляющие, сначала уменьшаются, а затем практически не меняются при выходе размеров стимулов за пределы центральной части фовеолы. Это означает что критические размеры крестов пропорционально увеличиваются при размерах рамок больших, чем 21.1-24.75 угл.мин. и колеблются около величины 1.5-1.6. Полученный результат хорошо согласуется с чисто интуитивным представлением о том, что для того, чтобы восприятию объекта не мешали другие объекты, его лучше окружить пустым полем. При моделировании процесса опознания (Бондарко, 1989а, 19896) было показано, чго для оптимального описания объекта с минимальной потерей информации конечным набором пространственно-частотных фильтров (конкретно в этих работах было взято 3. 4 и 5 гармоник основной частоты, соответствующей размеру объекта) размер оптимального элемента должен превосходить объект в 1.2 - 2.1 раза для выбранного алфавита изображений. При попытке найти размер функционального элемент, описывающего оптимальным образом все изображения алфавита, оказалось, чго оптимальный для данно! о алфавита элемент имел размер, в 1.5 раз превосходящий размер стимулов, который составлял 50-60 угл.мин. Таким образом, было показано, что окружение стимула однородным полем необходимо для успешного описания объекта конечным набором пространственно-частотных фильтров. В экспериментах, описываемых в данной работе, также был получен размер элемента, описывающего изображение, в 1.5 раза превышающий размер изображения. Этот факт позволяет рассматривать процесс сегментации изображений с точки зрения описания отдельных частей изображения как целостных объектов.
Результаты экспериментов, описываемые в данной работе, свидетельствуют также о том, что такое описание объекта,как гештальт (т.е. единый целостный образ), является частью процесса сегментации изображений: зрительная система тогда разделяет изображение на составляющие части, когда эти части воспринимаются как -отдельные и целостные образы.
Краудинг-эффект как модель сегментации зрительной сцены. Следует отметить, что разделение стимула на составные части при маленьких размерах стимулов (см. раздел "Сегментация простых геометрических фигур) согласовано и с пространственными характеристиками краудннг-эффекта, размер зоны взаимодействия которого составляет те же величины - 2.5-3.2 угл.мин. в зависимости от остроты зрения испытуемого (Вопс1агко, ОапПоуа, 1995), а соотношение размера тестового объекта и размера функционального элемента, описывающего это изображение, равно 3. При увеличении размеров изображений это соотношение уменьшается и приближается к 1.5 (ОапПоуа, Вопёагко, 1995). Такое расхождение размеров можно объяснить различными условиями проведения экспериментов. На пределе разрешения размер функционального элемента может быть обусловлен сильным тормозным взаимодействием. При увеличении размеров изображений это взаимодействие ослаблено или отсзтствует, так как даже при самых матеньких расстояниях между краями крестов и краями рамок (в экспериментах использовали расстояния от 0.5 угл.мин.) опознание формы центральной фигуры не затруднено. Однако при этих расстояниях изображение не разделяется на составные части большинством испытуемых.
Этот факт также хорошо согласуется и с данными, полученными при сегментации изображений другого класса - китайских иероглифов. Отчетливого видения отдельных частей еще недостаточно для разделения изображения (Шелепин и др., 1995; Бондарко, Шелепин, 1986). На пределе разрешения также оказалось необходимым, чтобы светлые промежутки между отдельными частями иероглифа составляли 2.5-3.2 угл.мин.
Таким образом, при проведении двух серий экспериментов процесс сегментации исследовался в разных экспериментальных условиях, и были получены разные данные о размере функциональных элементов, описывающих объект. Этот факт согласуется с экспериментальными данными по измерению ширины пространственно-частотных каналов, полученными с помощью разных психофизических методик, т.е. в разных условиях ■наблюдения. В условиях адаптации, когда активировано несколько соседних каналов, выявлена их ширина, превышающая величину, полученную методом подпороговой суммации, когда взаимодействие между каналами слабое. Таким образом, можно предположить, что на пределе разрешения для оптимального описания изображения необходимо, чтобы взаимодействие между функциональными элементами, описывающими отдельные части изображения, отсутствовало, что происходит тогда, когда размер этого элемента превышает размер тестового объекта в 3 раза и не зависит от окраски изображения. При увеличении размеров изображения относительный размер функционального элемента уменьшается и приближается к величине 1.5.
1?
выводы
При исследовании в психофизических экспериментах процесса опознания центрального стимула, окруженного дополнительными объектами, было получено:
1) На пределе разрешения зрительной системы при опознании тестового стимула, окруженного дополнительными объектами, размер зоны взаимодействия не зависит от изменения размера тестового стимула в исследованных пределах и от формы использовавшихся дополнительных объектов. Опознание тестового стимула, окруженного матрицей дополнительных элементов, ухудшается при малых расстояниях между тестом и дополнительными объектами и возвращается к исходному уровню, полученному для изолированного тестового кольца, при одном и том же расстоянии между тестовым стимулом и окружающими его дополнительными элементами.
2) Изменение формы дополнительных элементов, окружающих тестовый стимул, приводит к изменению вида функции, описывающей зависимость правильного опознания центрального тестового стимула от расстояния между тестовым стимулом и дополнительными элементами: при использовании в качестве дополнительных объектов полос была получена и-образная функция; при использовании прямоугольной матрицы, состоящей из колец Ландольта, была зарегистрирована монотонно увеличивающаяся функция.
3) Размер зоны тормозного взаимодействия не изменяется при окрашивани центрального тестового стимула и окружающих его дополнительных объектов в красный и зеленый цвета. Размер зоны тормозного взаимодействия также не зависит от комбинации цветов, в которые окрашивали тестовый стимул и дополнительные объекты.
4) Степень тормозного взаимодействия краудинг-эффекта, выражаемая в увеличении порогового контраста опознания формы тестового стимула, окруженного дополнительными объектами, по сравнению с порогом, полученным для изолированного тестового стимула, уменьшается при внесении цветовых различий между тестом и дистракторами.
5) На основании полученных экспериментальных данных можно предположить, что функциональный элемент, описывающий изображение как целое, гештальт, формируется в зависимости от размера изображения. На пределе разрешения зрительной системы в условиях тормозного взаимодействия размер функциональных элементов превышает минимальный размер тестового- стимула в 3 раза. При увеличении размеров изображения от 10 до 25 угл.мин. относительный размер функциональных элементов уменьшается и достигает относительной величины 1.5 для изображений больших размеров. Для оптимального описания изображения как
целостного объекта и последующей сегментации зрительной сцены необходимо, чтобы взаимодействие между функциональными элементами отсутствовало.
СПИСОК ОСНОВНЫХ РАБОТ, ОПУБЛИКОВАННЫХ ПО ТЕМЕ ДИССЕРТАЦИИ
1. Коскин С.А., Данилова М.В., Шелепин Ю.Е., Трифонов М.И. О группировании букв во время чтения // Механизмы регуляции физиологических функций. С.-Петербург. 1992.
2. Ю.Е.Шелепин, В.М.Бондарко, М.В.Данилова. Конструкция фовеолы и модель пирамидальной организации зрительной системы // Сенсорные системы. 1996. Т.9. Вып.1. С.87-97.
3. Bondarko V.M., Danilova M.V. Crowding-effect: different surroundings and different sizes of test stimuli // Perception. 1995. V.24. Suppl. P. 124.
4. Danilova M.V., Bondarko V.M. Perception of an image as a whole pattern depends on the size of the object // Perception. 1995. V.24. Suppl. P.l 16.
5. Бондарко B.M., Данилова M.B. Оценка целостности изображений в зависимости от их размеров // Физиология человека. 1996. Т.ЗЗ. Вып.1. С.70-76.
Отпечатано в типографии ПИЯФ
Зак. 343, тир. 100, уч.-изд. л. 1; 27/VI-1996 г. Бесплатно
- Данилова, Марина Валерьевна
- кандидата биологических наук
- Санкт-Петербург, 1996
- ВАК 03.00.02