Бесплатный автореферат и диссертация по биологии на тему
Опознание сложных изображений при их прямой маскировке
ВАК РФ 03.03.01, Физиология
Автореферат диссертации по теме "Опознание сложных изображений при их прямой маскировке"
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ УЧРЕЖДЕНИЕ НАУКИ ИНСТИТУТ ВЫСШЕЙ НЕРВНОЙ ДЕЯТЕЛЬНОСТИ И НЕЙРОФИЗИОЛОГИИ РАН
На правах рукописи
Калинин Сергей Алексеевич
ОПОЗНАНИЕ СЛОЖНЫХ ИЗОБРАЖЕНИЙ ПРИ ИХ ПРЯМОЙ МАСКИРОВКЕ
03.03.01 - Физиология
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата биологических наук
Москва -2013
2 8 НОЯ 2013
005540280
Диссертация выполнена в лаборатории физиологии сенсорных систем (зав. лабораторией - доктор биологических наук И.В. Бондарь) Федерального государственного бюджетного учреждения науки «Институт высшей нервной деятельности и нейрофизиологии РАН» (директор - доктор биологических наук, профессор, чл.-корр. РАН П.М. Балабан).
Научный руководитель:
доктор биологических наук Е.С. Михайлова
Официальные оппоненты:
доктор биологических наук профессор A.B. Латанов
кандидат биологических наук A.A. Варламов
Ведущая организация: Институт физиологии им. И.П. Павлова РАН
Защита состоится 18 декабря 2013 г. в 14.00 на заседании диссертационного ученого совета Д 002.044.01 при Федеральном государственном бюджетном учреждении науки «Институт Высшей нервной деятельности и нейрофизиологии РАН» по адресу Москва, 117485, ул. Бутлерова, д. 5А, большой конференц-зал
С диссертацией можно ознакомиться в библиотеке Федерального государственного учреждения науки «Институт Высшей нервной деятельности и нейрофизиологии РАН».
Ученый секретарь диссертационного совета
Доктор биологических наук
Иерусалимский В.Н.
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ Актуальность работы.
В сложноорганизованной и перенасыщенной информацией зрительной среде современного человека необходимым условием эффективного взаимодействия с ней является быстрота анализа изображений, которые часто появляются одновременно или быстро сменяют друг друга. Ведь даже не находящаяся в фокусе внимания и неосознанно воспринятая зрительная информация создает преднастройку, влияющую на решение основной задачи, например, опознания значимого объекта, выполнения профессиональной деятельности и т.п. Вопрос о том, каковы механизмы восприятия зрительного образа, которому или предшествует, или за которым следует информация о другом изображении, несмотря на его очевидность, остается далеко не ясным. Связанным с этой проблемой, другим важным аспектом переработки зрительной информации и организации адекватного поведения является необходимость надежного разделения значимых и незначимых сигналов.
Одним из экспериментальных подходов к решению этой проблемы является модель зрительной маскировки. При прямой маскировке, где маска предшествует опознаваемому изображению, переработка информации о целевом стимуле «накладывается» на продолжающийся анализ маскирующего стимула, что существенно изменяет ранние стадии переработки сигнала (ВгеКтеуег, 1984; Маскгик, Магйпег-СопсЭе, 2004). Таким образом, модель прямой маскировки позволяет исследовать поведенческие характеристики и нейрофизиологические механизмы восприятия зрительных сигналов в ситуации неосознаваемого восприятия другой, нерелевантной в настоящий момент, зрительной информации.
В классических работах механизм зрительной маскировки связывают с латеральным торможением на границах целевого и маскирующего изображений (Маскп1к, 2006). Но для более сложных зрительных образов механизм маскирующего эффекта не ограничивается простым совпадением в пространстве, тем более что иерархически более высокие объект-чувствительные зрительные области не обладают свойством ретинотопии (СпН-БресЬэг е! а!., 2001; (ЧесМу, КагмиэЬег, 2006). Многими авторами
(Кроль, Сосина, 1985; Кроль, 1993; Bachmann, 1994; Breitmeyer, Ogmen, 2006) показано, что при опознании сложных фигур большим маскирующим эффектом обладают фигуры, сходные с целевыми, причем, этот эффект не зависит от их совпадения в пространстве. Все эти факты свидетельствуют о возможности более сложных, не ограниченных конфигурационным сходством, отношениях между целевым стимулом и маской.
Современная литература подчеркивает, что для маскирующего эффекта важными могут быть не только конфигурационные, но и семантические характеристики целевого и маскирующего стимулов (Михайлова, Герасименко и др., 2009; Enns, Oriet, 2007). Важность семантического сходства целевого и игнорируемого стимулов для возникновения затруднений опознания показана и в других экспериментальных моделях, таких как негативный прайминг (Tipper, 1985; Fox, 1994) и опознание в присутствии дистрактора ("flanker task") (Erikse, Erikse, 1974). Но обе эти модели характеризуются достаточно большим временем действия незначимого зрительного сигнала. В примененной нами модели прямой маскировки используются, как правило, относительно небольшие длительности предъявления нерелевантного стимула (Macknik, 2006). В этом случае восприятие нерелевантного стимула можно считать неосознаваемым, что приближает выбранную нами модель к естественной ситуации решения зрительных задач в перенасыщенной информацией зрительной среде современного человека. В современной литературе сведения об опознании человеком сложных изображений в условиях их прямой маскировки другими сложными изображениями ограничены и в подавляющем большинстве представлены поведенческими работами (см. для обзора Bachman, Luiga, 2004).
Цель исследования: на модели прямой маскировки провести анализ зависимости поведенческих и нейрофизиологических показателей опознания человеком сложных зрительных стимулов от степени категориальной близости целевого и маскирующего изображений.
\
Задачи исследования:
1) Провести сравнительный анализ времени реакции и точности опознания зрительных объектов двух категорий (изображения животных и предметов) при их прямой маскировке сложными изображениями различной степени категориального сходства с опознаваемым стимулом.
2) Установить характер влияния категориального сходства целевого и маскирующего изображений на параметр дисперсии времени реакции.
3) Провести сравнительный анализ силы маскирующего воздействия и устойчивости к маскировке для изображений объектов, относящихся к разным категориям - животных и предметов.
4) По критерию вызванных потенциалов установить, в каких временных, амплитудных и топографических характеристиках электрической активности коры отражаются особенности опознания целевого стимула при категориальном сходстве или несходстве целевого и маскирующего изображений.
Научная новизна работы.
В работе получены новые данные о нейрофизиологических механизмах прямой маскировки сложных изображений другими сложными изображениями. Впервые показано, что сила маскировки зависит не от конфигурационного сходства стимула и маски, как это ранее установлено для простых изображений, а от их семантических характеристик. Эффективность маскировки значительно выше при принадлежности целевого и маскирующего изображений к одной категории объектов, что выражается в значительном ухудшении опознания целевого стимула. Впервые показано, что нейрофизиологическим коррелятом ухудшения опознания при категориальном сходстве стимула и маски является снижение амплитуды комплекса компонентов N2-РЗ зрительных вызванных потенциалов, связанного с операциями разделения значимого и игнорируемого стимулов и обработки их семантических характеристик. Важная роль когнитивного звена переработки информации в механизмах маскирующего эффекта для сложных изображений подтверждена данными о резком возрастании дисперсии времени реакции при категориальном сходстве целевого стимула и маски. Полученные результаты могут найти свое применение не только при исследовании механизмов зрительной маскировки, но и предоставят информацию
важную для понимания системных механизмов зрительного поведения человека в сложной информационно перенасыщенной среде, организации важного свойства зрительной системы - ее помехоустойчивости. Результаты исследования также применимы для анализа механизмов распределения ресурсов внимания и контекстного восприятия.
Практическая значимость работы.
Полученные в данной работе данные дополняют известные для нейрофизиологии зрительного восприятия сведения о механизмах категоризации зрительных образов и селекции значимой зрительной информации и могут быть использованы в лекционных курсах учебных учреждений биологического и психологического профилей. Полученные результаты важны при конструировании эргономичной зрительной среды для специалистов, чья работа связана с большими нагрузками на зрительную систему: авиадиспетчеров и операторов. Использование обнаруженных закономерностей позволит снизить помехи зрительного восприятия и повысить качество работы многих специалистов, создавая для них более удобные интерфейсы различных компьютерных программ. Обнаруженные в работе закономерности восприятия последовательно предъявляемых зрительных стимулов могут быть использованы при подготовке телевизионной и любой другой видеопродукции для создания видеоряда оптимальной последовательности и временной структуры. Эти сведения также интересны создателям рекламы, так как позволят оптимизировать подачу материала и привлечь внимание большей аудитории потенциальных потребителей.
Основные положения, выносимые на защиту.
1. Опознание сложного зрительного образа затруднено, если ему предшествует короткое предъявление незначимого, но семантически близкого изображения.
2. Изображения лиц являются категорией зрительных стимулов, которые не обладают маскирующим эффектом; они могут оказывать модулирующее активирующее воздействие на опознание (целевого стимула), степень которого зависит от эмоционального выражения лица.
3. Изображения животных обладают более мощными маскирующим действием и большей устойчивостью к влиянию маскировки по сравнению с изображениями предметов.
4. Нейрофизиологическим коррелятом ухудшения опознания при категориальном сходстве целевого стимула и маски является снижение амплитуды комплекса N2-P3 зрительных вызванных потенциалов, связанного с операциями разделения значимого и игнорируемого стимулов, обработки их семантических характеристик и принятия решения.
Апробация работы
Результаты работы были доложены на конференциях молодых учёных в Федеральном государственном бюджетном учреждении науки ИВНД и НФ РАН, в г. Москва, в 2011, 2012 годах; на III Съезде физиологов СНГ в Ялте в 2011 году; на Съезде Скандинавского физиологического общества в 2011 году в г. Берген, Норвегия; на 8-м европейском форуме FENS в г. Барселона, Испания в 2012 году; на XVI Международной конференции по нейрокибернетике, в г. Ростов-на-Дону в 2012 году; на Выездной сессии ОФФМ РАН «От детектора признака к единому зрительному образу», посвященной 80-летию со дня рождения академика И.А. Шевелёва, в г. Москва, в 2012 году; на Международной конференции ECVP-2013 в г. Бремен, Германия в 2013 г, на Международной научной конференции студентов, аспирантов и молодых учёных «Ломоносов-2013» в 2013 году, в г. Москва, на XXII Съезде Физиологического общества им. И.П. Павлова 16-20 сентября 2013. ВолгГМУ, Волгоград.
По теме диссертации опубликовано 12 работ, из них 2 в журналах, рекомендованных ВАК.
Объем и структура диссертации.
Диссертация состоит из следующих разделов: введение, обзор литературы, материалы и методы исследования, результаты, обсуждение, выводы, список литературы. Материал изложен на 160 страницах машинописного текста, содержит 23 рисунка, 21 таблицу. Библиография включает 280 источников.
Материалы и методы исследования
Испытуемые. В исследовании приняли участие 80 испытуемых (37 мужчин и 43 женщины) в возрасте от 21 до 34 лет (24.9±0.6 лет). Все испытуемые были правшами, не имели серьезных соматических и неврологических расстройств, обладали нормальным или скорректированным до нормы зрением. Во всех случаях было получено письменное согласие испытуемых на проведение исследования, согласно протоколу, утвержденному этической комиссией ИВНД и НФ РАН. Участие в эксперименте оплачивалось.
Экспериментальная процедура.
Проведено три серии опытов: две поведенческие и одна нейрофизиологическая. В поведенческих экспериментах (55 чел.) анализировали зависимость характеристик опознания целевого стимула (время двигательной реакции и точность опознания) от категориальной близости целевого и маскирующего стимулов. В нейрофизиологической серии (25 чел.) проводили 40-канальную регистрацию вызванных потенциалов при выполнении задачи опознания сложных изображений при их прямой маскировке для выявления анализа компонентов ВП, которые являются коррелятами обнаруженных в поведенческой серии эффектов. Эти 25 испытуемых не принимали участия в поведенческих экспериментах. Таким образом', эффект обучения был исключен
Стимулы. В качестве стимулов использовались чёрно-белые контурные рисунки животных, предметов (Рис.1 А,Б) (Snodgrass, Vanderwart, 1980; http://stims.cnbc.cmu.edu/lmaqe%20 Databases/ TarrLab / Objects), чёрно-белые
контурные рисунки лиц с различной эмоциональной экспрессией, сделанные на основе фотографий из альбома П. Экман и У. Фризена (Рис.1 В) (Ekman, Friesen, 1976), а также шумовое изображение (набор линий различной направленности) (рис 1 Г). Угловой размер стимулов на экране монитора (65 Гц) составлял 4-5 угловых градуса. Во время опыта испытуемый находился в звукозаглушенной и затемненной комнате на расстоянии 120 см от экрана монитора, освещенность на уровне глаз составляла 4 лк.
Поведенческий эксперимент. Основная часть поведенческого эксперимента состояла из восьми серий с разным сочетанием целевых и маскирующих изображений: опознание животных без маскировки (1), при маскировке изображениями животных (2), при маскировке изображениями предметов (3), при маскировке изображениями лиц (4), опознание предметов без маскировки (5), при маскировке изображениями предметов (6), при маскировке изображениями животных (7), при маскировке изображениями лиц (8). Временная схема экспериментов: длительность целевого стимула - 17 мс, маскирующего изображения - 51 мс. Целевой стимул предъявляли сразу после окончания маски. Длительность межстимульного интервала - 3-4 сек. Во время межстимульного интервала на экране была фиксационная точка в виде небольшого кружка. В ходе эксперимента серии чередовались в случайном порядке. Предъявление стимулов и регистрацию параметров опознания в поведенческой (психофизиологической) серии экспериментов проводили с помощью программного обеспечения E-Prime 2.0 (Psychology Software Tools, Inc., США) с выносной клавиатурой Serial Response Box. Регистрировалась точность опознания (вероятность правильных ответов) и время нажатия на кнопку. Далее, после опыта, для каждого испытуемого рассчитывали точность опознания (в %) и среднее по эксперименту время реакции (BP, мс) для правильных ответов.
Эксперимент начинался с появления на экране инструкции. Например, в серии опознания животных, она выглядела так: «Во время эксперимента смотрите, пожалуйста, в центр экрана на маленький кружок. При появлении рисунка лисы нажмите на цифру 1. При появлении кенгуру нажмите на цифру 2. При появлении льва нажмите на цифру 3. При появлении лошади нажмите на цифру 4». Для
остальных серий инструкции были аналогичными, с поправкой на используемые целевые стимулы. Сразу после опознания изображения испытуемый должен был как можно быстрее нажать на соответствующую стимулу кнопку клавиатуры Response Serial Box.
В дополнительных сериях, испытуемые опознавали изображения животных и предметов в трех ситуациях, различавшихся характером маски: 1) маска -изображение категории той же что и тестовое, показанное в обычной ориентации ("upright"), 2) маска - изображение той же категории, но перевернутое на 180° ("inverted") и 3) шумовая маска. Стимулы предъявлялись по той же временной схеме, что и в основном эксперименте. Серии чередовались в случайном порядке.
После эксперимента для каждого испытуемого рассчитывали точность опознания стимулов (в %) и среднее по эксперименту время реакции (BP, мс) для правильных ответов. Принимая во внимание данные работы (Sigman, Dehaene, 2005) об отражении в дисперсии BP особенностей когнитивных операций, мы провели анализ дисперсии BP. Для этого индивидуальные значения BP опознания при различных вариантах маскировки обрабатывали для получения следующих величин: 1) среднее BP, его дисперсия, ошибка среднего; 2) величина верхней и нижней квартили BP и их разница - межквартильный интервал. (Межквартильный интервал - Interquartile range - это интервал между 25 и 75 процентилями, который содержит «центральные» 50% значений признака. Эта величина менее чувствительна к выбросам BP и является робастным аналогом дисперсии).
Электрофизиологический эксперимент. 40-канальную регистрацию ЭЭГ (схема 10 - 20% с объединенным ушным электродом) проводили с помощью системы «Neocortex-Pro» («Neurobotics», Россия). Сопротивление электродов устанавливалось не выше 1-5 кОм. Полоса частот усилителей ограничивалась сверху 70 Гц, а снизу 0.1 Гц. Временная схема ЭЭГ исследования была сходна с таковой в психофизиологическом исследовании. Время предъявления целевого стимула было увеличено до 100 мс, что необходимо для получения отчетливого ВП ответа; остальные временные параметры не меняли. В серии каждый стимул предъявляли по 12 раз, таким образом, в каждом опыте предъявляли по 48 целевых
Рис.1. Примеры изображений, использовавшихся в эксперименте в качестве целевых и маскирующих стимулов. А - рисунки животных; Б - рисунки предметов; В -рисунки лиц; Г- шумовая маска.
Данные ЭЭГ обрабатывали "off-line" в программе «Neocortex-Рго». При визуальном анализе исключали фрагменты ЭЭГ с мышечными артефактами или с электроокулографическими потенциалами амплитудой более 20 мкВ. Усреднение вызванных потенциалов (ВП) проводили по 35-40 безартефактным отрезкам ЭЭГ для правильно опознанных стимулов. Длительность отрезка ЭЭГ - 600 мс, что включало 100 мс до и 500 мс после целевого стимула. Усреднение ВП проводили по 25-35 безартефактным отрезкам ЭЭГ для правильно опознанных стимулов. Далее с
помощью программы ЫеигосоКех-Рго измеряли латентность пика и амплитуду волн ВП (N2 и РЗ).
Статистическую обработку данных проводили в программе БРЭв 14.0 (лицензионное соглашение № 20071119-) с использованием дисперсионного анализа (метод повторных измерений, АЫО\/А КМ), тестов Вилкоксона и Стьюдента, а также кластерного анализа. Для А1МО\/А КМ при анализе поведенческих данных анализировали влияние факторов: Тип маски и Категория стимула, при анализе ВП -факторов Категория стимула, Тип маски, Область и Полушарие. Учитывали поправку Гринхауза-Гессера.
Результаты и обсуждение
Поведенческие эксперименты
На первом этапе анализа было обнаружено, что точность опознания и ВР значимо (р<0.0005) зависят от Типа маски (без маски, маска той же категории, маска другой категории) и от Категории стимула (животные и предметы). Принимая во внимание эти эффекты, а также взаимодействие факторов, влияние категориального сходства маски и целевого стимула анализировали отдельно в задачах опознания животных и предметов.
На рис.2 (А, В) приведены средние по группе значения ВР и точности при опознании изображений животных. Видно, что при маскировке увеличивается ВР и снижается точность, и эти эффекты более значимы при категориальном сходстве маски и целевого стимула. Парные сравнения выявили значимость различий этих показателей (0.0005<р<0.05, критерий Вилкоксона). Сходные закономерности были обнаружены и для задачи опознания предметов (рис. 2Б, Г), хотя эффекты категориального сходства маски и целевого стимула были менее выразительны. Как видно на рисунке, различия ВР и точности для ситуаций категориального сходства и разницы - только на уровне тенденции.
Эти различия поведенческих характеристик опознания, связанные с категорией целевого стимула, подтверждены при проведении АЫОХ/А КМ с учетом факторов
Категория стимула («животные» и «предметы») и Сходство (маска иной категории, маска той же категории). Выявлено значимое взаимодействие Категория стимула * Сходство (Р1,19=14.37; р<0.001).
%
900 800 700 600 500 400
100 98 96 94 92 90
Животные - *** —
Предметы
1.
2 3
маска другой маска той же категории категории
**
%
900 800 700 '600 500 400
100 98 96 94 92 90
Г
Н
Рис. 2. Характеристики опознания животных и предметов при разных условиях маскировки.
А и Б - время реакции при опознании животных (А) и предметов (Б). Б и Г - точность опознания животных (В) и предметов (Г). Цифрами от 1 до 3 обозначены различные условия маскировки. Достоверность различий между разными условиями маскировки: * - р<0.05; ** - р<0.01, *** - р<0.001. Приведены средние по группе значения и ошибки среднего.
Анализ дисперсии ВР (по показателю величины межквартильного интервала - МКИ) в сериях с различными типами маскировки показал, что Тип маски значимо влияет на дисперсию ВР. Для категории «животные» - Р 2,36=6.96; р<0.003, для категории «предметы» - Р 2,30=10.38; р<0.001. На рис. 3 представлены средние по группе значения МКИ в разных задачах. Видно, что опознание в условиях маскировки увеличивает МКИ при категориальном сходстве целевого и маскирующего изображений. На величину МКИ значимо влиял только фактор Тип маски: Р 2,30=12.52; р<0.0005. При этом нет значимого влияния фактора Категория или взаимодействия двух факторов.
без маски маска иной маска той же без маски маска иной маска той же
категории категории категории категории
Рис. 3. Усредненные по группе значения межквартильного интервала ВР при опознании животных (А) и предметов (Б) при разных условиях маскировки. Приведены средние по группе значения интервала и ошибки среднего. Звездочки -достоверность различий по сравнению с серией без маскировки. ** - р<0.01, *** -р<0.001.
Проведена дополнительная поведенческая серия, целью которой было проверка того факта, что именно категориальное сходство целевого стимула и маски влияет на точность и ВР опознания. В этой серии целевые стимулы опознавались при их прямой маскировке шумовой маской, категориально сходной маской, которая появлялась или в нормальном положении (up-right) или перевернутой на 180 град, (inverted). Такая трансформация маски затрудняла ее неосознанное опознание и, следовательно, категоризацию изображения. Дисперсия ВР при инвертированной
маске становилась меньше, чем при маске обычной ориентации, но при этом оставалась выше, чем при бессмысленной шумовой маске.
В серии экспериментов, в которых в качестве маски использовали рисунки лиц с разными эмоциональными выражениями, были получены следующие результаты. Точность опознания при маскировке изображениями лиц значимо не менялась относительно опознания без маски, не зависела от типа эмоциональной экспрессии и была достаточно высокой: ее средние по группе значения для разных типов эмоциональной экспрессии лиц и для разных категорий целевых стимулов варьировали от 97.1±0.9 до 97.9±0.7 %. ВР также оставалось достаточно высоким, но зависело от типа экспрессии лица (р<0.025). Самое короткое ВР регистрируется, если в качестве маски использовали рисунок лица с выражением страха, а наименьшее маскирующее влияние оказывало улыбающееся лицо. Значимые эффекты обнаружены только в задаче опознания предметов, при опознании животных обнаружены сходные эффекты, но не достигавшие уровня значимости. Установлено, что существует связь между поведенческими характеристиками опознания и личностными свойствами испытуемых. Так, например, ВР отрицательно связано (р<0.02) со значениями фактора шкалы Кеттелла, отражающими уровень тревожности (Р1). Точность опознания отрицательно коррелировала (0.002<р<0.05) со значениями фактора О (спокойствие/тревожность) и положительно с факторами Н (робость смелость), 01 (консерватизм/радикализм) и Р2 (интраверсия/экстраверсия).
Анализ вызванных потенциалов.
В серии с регистрацией зрительных вызванных потенциалов обнаружено, что ухудшение опознания сопровождается снижением амплитуды компонентов N2 и РЗ.
Компонент N2. Этот компонент (см. рис. 4) отчетливо регистрировался во всех областях коры с латентности пика от 180 до 300 мс с ее большими значениями в задних отделах коры. Дисперсионный анализ амплитуды N2 (Категория стимула, Тип маски, Область, Полушарие) для восьми пар симметричных областей коры
(F3, F4, FC3, FC4, СЗ, С4, СРЗ, СР4, РЗ, Р4, Р01, Р02, 01, 02, Т5, Т6) выявил влияние Типа маски (р<0.015), а также взаимодействия Категория * Область (р<0.05) и Категория * Полушарие (р<0.005).
Рис. 4. Усредненные по группе ВП в симметричных отведениях Р, РС, С, СР и Р при двух вариантах маскировки. Сплошная линия - маска и целевой стимул относятся к одной категории, пунктирная линия - к разным категориям. По оси абсцисс - время в мс, по оси ординат - амплитуда в мкВ. Вертикальной линией отмечено начало целевого стимула, вертикальной стрелкой - начало маскирующего изображения. Звездочками отмечены достоверные различия амплитуды компонентов N2 и РЗ для двух условий маскировки: * - р<0.05, ** - р<0.01.
6 мкВ
РЗ РСЗ РС4 СЗ С4 СРЗ СР4 РЗ Р4 01 02 Т5 Т6
Рис.5. Вверху - средние по группе значения амплитуды компонента N2. Темные столбики - маска и целевой стимул из одной категории, заштрихованные - маска и целевой стимул из разных категорий. Приведены средние значения и ошибки среднего. Внизу - карта разностного ВП «маска и целевой стимул из разных категорий» минус «маска и целевой стимул из одной категории» в интервале компонента N2 160-180 мс. Черный цвет на карте соответствует максимуму (в цифровой шкале это -2 мкВ). Достоверность различий: * - р<0.05; ** - р<0.01.
Амплитуда N2 зависела от сходства/несходства маскирующего и целевого стимулов и была значимо выше при маскировке категориально несходным изображением по сравнению с ситуацией сходства. Топография эффекта зависела от категории целевого стимула. В задаче опознания животных амплитуда N2 выше в ситуации, когда целевой и маскирующий стимулы относятся к разным категориям, что видно на
усредненных по группе ВП (рис.4). По данным дисперсионного анализа влияние Типа маски статистически значимо при схеме анализа с включением всех отведений (р<0.04), а также в кластере лобно-центральных (р<0.03) отведений. На рис. 5 сравниваются средние по группе значения амплитуды N2 в двух задачах. Видно, что амплитуда компонента выше в задаче с разными категориями маски и целевого стимула во всех отведениях, но статистически значимо в передних отделах коры и правой нижневисочной области. На рис.5 приведена карта разностного ВП («маска и целевой стимул из разных категорий» минус «маска и целевой стимул из одной категории»), построенная для интервала компонента N2 (160-180 мс). Видно, что максимум различий локализован в передних отделах коры.
Компонент РЗ. Этот компонент ВП отчетливо регистрировался во всех областях коры с межиндивидуальным разбросом латентности пика от 250 до 360 мс с ее большими значениями в задних отделах коры. При дисперсионном анализе амплитуды РЗ выявлены значимые эффекты Типа маски (р<0.005), Области (р<0.0005) и Полушария (р<0.02). Дальнейший анализ был проведен отдельно для категорий животные и предметы.
Опознание животных. При схеме анализа с включением всех отведений выявлен значимый эффект Типа маски (р<0.003) и Области (р<0.0005) и Полушария (р<0.01). При схеме анализа в отдельных кластерах областей высокозначимый эффект Типа маски обнаружен в теменных (р<0.01) и затылочно-височных (р<0.01) областях.
На рис.4 представлены усредненные по группе ВП, а на рис. 6 - диаграммы средних по группе значений амплитуды РЗ при опознании животных с разными типами маски. Видно, что амплитуда РЗ значительно ниже при категориальном сходстве маски и целевого стимула по сравнению с их разницей. По данным парного ¿-теста значимые различия между двумя задачами (0.005<р<0.05) получены практически во всех областях коры за исключением лобных и лобно-центральных, где различия не достигали уровня значимости, но имели тот же знак. Топография этих различий отчетлива видна на картах разностных ВП, построенных для интервала компонента РЗ (рис. 6).
2мкВ О
-2 мкВ
Рис.6. Сверху - средние по группе значения амплитуды компонента РЗ. Темные столбики - маска и целевой стимул из одной категории, заштрихованные - маска и целевой стимул из разных категорий. Приведены средние значения и ошибки среднего. Внизу - карты разностных ВП «маска и целевой стимул из разных категорий» минус «маска и целевой стимул из одной категории» во временном интервале компонента РЗ 280-300 и 300-320 мс. Темно серый цвет на карте соответствует максимуму различий (в цифровой шкале - 2 мкВ). Достоверность различий: * - р<0.05; ** - р<0.01.
Опознание предметов. Как и для опознания животных, эффект Типа маски значим, но достоверность его влияния ниже: лишь р<0.05 при схеме анализа с включением всех отведений и р<0.05 для кластеров передних и теменных областей.
Таким образом, анализ ВП показал, что обнаруженное в поведенческих опытах ухудшении опознания при категориальном сходстве маски и целевого стимула, сопровождается снижением амплитуды компонентов ВП N2 и РЗ, причем, для более раннего компонента N2 эффекты проявляются четче в передних отделах коры, а во временном окне компонента РЗ они имеют более генерализованный характер с вовлечением передних и теменных корковых зон.
Обсуждение
В современной литературе мы не обнаружили прямых аналогов использованной нами экспериментальной парадигмы. Но поскольку последовательность маска -целевой стимул можно представить как последовательность игнорируемый стимул -релевантный стимул, то можно сравнить наши результаты сданными, полученными в других моделях, в которых опознание значимых стимулов происходит в присутствии игнорируемых.
Ухудшение опознания при принадлежности целевого и маскирующего изображений к одной категории. Возможно, что обнаруженный в нашей работе эффект ухудшения опознания целевого стимула при его маскировке семантически близким изображением (увеличение времени реакции и снижение точности опознания) может быть результатом интерференции процессов переработки информации двух стимулов (целевого и маскирующего); причём маскирующий стимул может рассматриваться в роли дистракгора. Это предположение основывается на результатах работ с такими близкими к использованной нами модели экспериментальными парадигмами, как «flanker task» (Erikse, Erikse, 1974; Kopp, Mattler, 1994), негативный прайминг (Tipper, 1985; Fox, 1994, 1996; Damian, 2000; Schrobsdorff, Ihrke et al, 2012), и «замаскированный прайминг» (masked prime), в котором сопоставимость (compatibility) целевого и прайм-стимулов вызывает резкое ухудшение опознания целевого стимула (Jast'kowski, 2007; Jaskowski, Bialunska et al., 2008).
Увеличение дисперсии времени реакции в случае принадлежности целевого и маскирующего изображений к одной категории. Обработка результатов психофизических экспериментов показала, что опознание в условиях маскировки
увеличивает дисперсию двух характеристик двигательной реакции: BP и МКИ (межквартильный интервал, т.е. интервал значений выборки между 25 и 75 процентами дисперсии BP); причем дисперсия значимо выше при категориальном сходстве целевого и маскирующего изображений. Дисперсионный анализ значений МКИ показал, что фактор Тип маски (без маски, маска той же категории, маска иной категории) значимо влиял на МКИ и при опознании животных, и при опознании предметов. Учитывая данные модельного исследования (Sigman, Dehaene, 2005), можно думать, что высокая дисперсия BP при семантической близости целевого стимула и маски отражает увеличение нагрузки на когнитивное звено переработки информации, возникающее как результат интерференции семантических репрезентаций целевого и маскирующих изображений.
Обнаруженные эффекты более отчетливы при опознании животных, чем при опознании предметов. Эффекты категориальной близости маски и цели оказались более отчетливыми в задаче опознания животных, а изображения животных обладали более мощным маскирующим действием по сравнению с предметами. Это проявлялось в больших значениях BP в задаче опознания предметов по сравнению с задачей опознания животных (862±33 мс vs 775±29.14 мс дать ошибки среднего) и меньших значениях точности (92.3±1.66 % vs 94.7±1.6 %) в ситуации категориального сходства маски и целевого стимула. Также BP принимало большие значения при маскировке изображений предметов изображениями животных, чем в обратной ситуации (723±25.49 мс vs 711±20.51 мс). Можно предположить, что этот результат связан с особым положением категории «животные» в зрительном мире, выделение которой важно для организации широкого спектра поведенческих реакций. Так, известно, что живые объекты быстрее выделяются из натуральных сцен по сравнению с неживыми, и в их обработке участвует не только система вентрального зрительного пути, но и быстрая магноцеллюлярная система дорзального пути (Mace, Thorpe et al., 2005). Чёткие репрезентации животных обнаружены не только в нижневисочной, но и в префронтальной коре (Freedman, Riesenhuber et al., 2001; Kiani, Esteky et al., 2007).
Изображения лиц не оказывают достоверного маскирующего действия. Изображения лиц не оказывали маскирующего действия, что, возможно, связано с
обособленностью специфической для лиц зоны нижневисочной коры (Kanwisher et al., 1997, 2003), а также тем обстоятельством, что лицевые стимулы являются постоянной составляющей нашего зрительного мира. Но были обнаружены изменения времени двигательной реакции, зависящие от типа эмоциональной экспрессии лица-маски. Эмоционально-отрицательная мимика (выражения гнева и страха) вызывала укорочение времени реакции по сравнению с радостными и нейтральными лицами. Эти эффекты могут возникать за счет увеличения пространственного внимания к этим лицам (Pourtois et al., 2004; Mace, Richard et al., 2005; Drewes, Trommershauser et al., 2011). То есть, наблюдаемое в нашей работе укорочение BP опознания, может быть результатом модулирующего влияния коротко предъявляемого изображения лица и его эмоциональной экспрессии на опознание следующего за ним целевого стимула.
Ухудшение опознания при категориальном сходстве целевого стимула и маски сопровождалось снижением амплитуды компонентов N2 и РЗ. В серии с регистрацией зрительных вызванных потенциалов обнаружено, что ухудшение опознания сопровождается снижением амплитуды компонентов N2 и РЗ. Амплитуда компонента N2 зависела от сходства/несходства маскирующего и целевого стимулов. Большая амплитуда этой волны наблюдалась в ситуации, когда маскирующий и целевой стимулы относились к разным категориям. Топография эффекта зависела от категории целевого стимула. При опознании животных эффекты локализованы преимущественно в передних отделах коры, при опознании предметов фокус изменений смещался к задним отделам коры. В литературе компонент N2 считают отражением процессов когнитивного контроля, он связан с процессами выбора из возможных альтернативных решений, подавления неадекватных реакций, а также мониторингом соответствия событий (стимулов или собственных ответов) целям решаемой когнитивной задачи (Bartolow, Pearson et al., 2005; Roche, Garavan, 2005). Таким образом, увеличение амплитуды N2 в передних областях при категориальном несходстве двух стимулов может быть отражением затруднений процесса когнитивного контроля, связанного с выбором правильной реакции и подавлением ответа на нерелевантный стимул.
Затруднение поведенческого ответа сопровождалось по нашим данным также снижением амплитуды РЗ. Самые низкие значения амплитуды РЗ во всех отведениях наблюдались при ситуации маскировки изображением, категориально сходным с целевым, этот эффект был значимым в отведениях теменного кластера. Снижение амплитуды РЗ в центрально-теменных и теменных областях может быть отражением затруднений процессов обновления ("update") информации, необходимой для правильной оценки стимула и организации правильного ответа (Donchin, Coles, 1988), а также показателем повышения субъективной трудности задачи (García-Larrea, Cézanne-Bert,1998).
Таким образом, энцефалографическим коррелятом ухудшения опознания при категориальном сходстве целевого стимула и маски является снижение амплитуды волнового комплекса N2-P3, связанного с операциями разделения значимого и игнорируемого стимулов и обработки их категориальной информации. Предполагается, что механизмом наблюдаемых эффектов является взаимодействие корковых семантических репрезентаций маскирующего и целевого стимулов, негативное влияние которого усиливается при категориальном сходстве двух стимулов. Топографически эти процессы связаны с фронто-центральными и теменными областями коры. Полученные данные дополняют сведения о механизмах зрительной маскировки и важны для понимания принципов разделения значимой и незначимой информации, распределения ресурсов внимания, контекстного восприятия.
Выводы:
1) В модели прямой зрительной маскировки опознание сложного зрительного образа зависит от его категориального сходства с маскирующим изображением. Опознание ухудшается при принадлежности целевого стимула и маски к одной категории, что проявляется в снижении точности опознания, увеличении времени двигательной реакции и нарастании его дисперсии.
2) Изображения лиц не оказывают маскирующего действия и не влияют на точность опознания сложных изображений. Изменение времени двигательной реакции зависит от типа эмоциональной экспрессии лица-маски: эмоционально-
отрицательная мимика (выражения гнева и страха) вызывает укорочение времени реакции по сравнению с радостными и нейтральными лицами.
3) Нейрофизиологическим коррелятом ухудшения опознания при категориальном сходстве маски и целевого стимула является нарушение переработки зрительной информации во временном окне 160-320 мс волнового комплекса М2-РЗ зрительного вызванного потенциала. Снижение амплитуды более раннего компонента N2 отчетливо в передних отделах коры, тогда как изменения амплитуды компонента РЗ имеют более генерализованный характер с вовлечением передне-центральных и теменных корковых зон.
4) Эффекты семантической близости маскирующего и целевого стимулов (снижение точности опознания, увеличение времени двигательной реакции, ее дисперсии, снижение амплитуды компонентов N2 и РЗ вызванных потенциалов) зависят от категории целевого изображения и более выражены в задаче опознания животных.
5) Предполагается, что негативное влияние на опознание сложных изображений семантической близости целевого стимула и маски поддерживается деятельностью динамической системы, ключевыми звеньями которой являются ассоциативные побно-центральные и теменные области коры, обеспечивающие фокальное внимание, выделение значимого сенсорного сигнала и выполнение когнитивной операции принятия решения.
Работа поддержана Грантом РГНФ 11-06-00518а.
Публикации по теме диссертации
1. Герасименко Н.Ю., Славуцкая А.В., Калинин С.А., Михайлова Е.С. Влияние эмоциональной экспрессии нерелевантного лицевого изображения на опознание зрительных стимулов. Физиология человека. 2013. Т\ 39. № 3. с. 1-9.
2. Герасименко Н.Ю., Славуцкая А.В., Калинин С.А., Куликов М.А., Михайлова Е.С. Опознание зрительных образов в условиях их прямой маскировки: влияние категориальной близости значимого и маскирующих изображений. Журнал высшей нервной деятельности. 2013. Т. 63. № 4. с. 419-430.
3. Герасименко Н.Ю., Славуцкая А.В., Калинин С.А., Михайлова Е.С. Влияние категориальной близости тестового и маскирующего стимулов на эффективность прямой маскировки. Научные труды III Съезда физиологов СНГ. Ялта. Украина. 2011. с.117.
4. Gerasimenko N.Yu., Kalinin S.A., Slavutskaya A.V., Mikhailova E.S. Forward masking: influence of categorical similarity for tests and masks. Acta Physiologica (Abstracts for the Scandinavian physiological society's annual meeting, 12-14 August 2011. Bergen. Norway). 2011. V.202. suppl. 685, p.109.
5. Slatutskaya A.V., Gerasimenko N.Y., Kalinin S.A. Sex differences in performance of visual construction task. Acta Physiologica, 2012. V.206. suppl. 691. p.123.
6. Gerasimenko N.Y, Kalinin S.A, Slatutskaya A.V, Mikhailova E.S. Categorical similarity of the forward mask and test influences on perceptual and cognitive stage of object recognition. 8th FENS Forum of neuroscience. Barselona, 2012. FENS Abstracts. V.6. p.065.04.
7. Герасименко Н.Ю., Славуцкая А.В, Калинин C.A Зрительная маскировка: влияние информационной составляющей тестового и маскирующего стимулов. Материалы XI Всероссийской с международным участием школы-конференции «Механизмы адаптации растущего организма к физическим и умственным нагрузкам». Казань. 2012. с.35-36.
8. Михайлова Е.С., Герасименко Н.Ю., Славуцкая А.В, Калинин С.А. Опознание зрительных образов при их прямой маскировке. Влияние семантического сходства значимого и маскирующего изображений. Сборник трудов X Международной конференции «Прикладная оптика-2012». Санкт-Петербург. Т. 3, с. 323.
9. Калинин С.А., Герасименко Н.Ю., Славуцкая A.B. Опознание человеком сложных зрительных образов в условиях прямой маскировки. Влияние категориального сходства тестового и маскирующего изображений. Выездная сессия ОФФМ РАН «От детектора признака к единому зрительному образу», посвящённая 80-летию со дня рождения академика И.А. Шевелёва. Москва, 2012. Сборник докладов и тезисов, с.71 -72.
Ю.Калинин С.А., Герасименко Н.Ю., Славуцкая А. В. Опознание человеком сложных зрительных образов в условиях их прямой маскировки. Эффект категориального сходства тестового и маскирующего изображений. Материалы XVI Международной конференции по нейрокибернетике. Ростов-на-Дону. 2012. Т. 1. с. 367-369.
H.Gerasimenko N.Y., Kalinin S.A., Slavutskaya A.V., Mikhailova E.S. Inhibitory effect of forward mask on target stimuli recognition. The influence of mask-target categorical compatibility. 36-th European Conference on Visual Perception. 2013. Bremen. Germany. Perception. V.42. suppl. ECVP 2013. p.124.
12.Н.Ю. Герасименко, C.A. Калинин, A.B. Славуцкая, E.C. Михайлова. Анализ взаимодействия значимого зрительного стимула и игнорируемого дистрактора на модели зрительной маскировки. Тезисы докладов XXII Съезд Физиологического общества им. И.П. Павлова 16 - 20 сентября 2013. ВолгГМУ. Волгоград, с. 117
Подписано в печать 14.11.2013 Формат А5 Бумага офсетная. Печать цифровая. Тираж 100 т Заказ № 2411 Отдел полиграфии Научной библиотеки МГУ имени М.В. Ломоносова 119192 Москва, Ломоносовский проспект, 27
Текст научной работыДиссертация по биологии, кандидата биологических наук, Калинин, Сергей Алексеевич, Москва
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ УЧРЕЖДЕНИЕ НАУКИ ИНСТИТУТ ВЫСШЕЙ НЕРВНОЙ ДЕЯТЕЛЬНОСТИ И НЕЙРОФИЗИОЛОГИИ РАН
На правах рукописи
04201454839
Калинин Сергей Алексеевич
ОПОЗНАНИЕ СЛОЖНЫХ ИЗОБРАЖЕНИЙ ПРИ ИХ ПРЯМОЙ
МАСКИРОВКЕ
03.03.01 - Физиология
диссертации на соискание ученой степени кандидата биологических наук
Научный руководитель -доктор биологических наук Е.С. МИХАЙЛОВА
Москва-2013
СОДЕРЖАНИЕ ВВЕДЕНИЕ ------------------------------------
2 5
ГЛАВА 1. Обзор литературы-----------------------------------------------------10
1.1. Современные представления о мозговых механизмах опознания изображений —-------------------------------------------------------------10
1.1.1. Иерархический принцип зрительного анализатора----------------10
1.1.2. Пути передачи зрительной информации-------------------------------13
1.2. Маскировка как экспериментальный приём для изучения механизмов зрительного восприятия-----------------------------------16
1.2.1. Типы зрительной маскировки--------------------------------------------17
1.2.2. Области применения приёма зрительной маскировки--------------19
1.2.3. Механизмы зрительной маскировки-----------------------------------20
1.3. Экспериментальные модели, близкие к зрительной маскировке: негативный прайминг, задача с окружением (flanker task)--------25
1.4. Вызванная активность головного мозга. Последовательность переработки зрительного сигнала и ее отражение в компонентах ВП ------------------------------------------------------------------------------29
1.4.1. Компонент N2---------------------------------------------------------------31
1.4.2. Компонент РЗ----------------------------------------------------------------33
ГЛАВА 2. Материалы и методы--------------------------------------------------39
2.1. Поведенческие эксперименты----------------------------------------------39
2.1.1. Характеристика группы испытуемых-----------------------------------39
2.1.2. Стимулы —-........-----------------------------------------------------------39
2.1.3 Оборудование-----------------------------------------------------------------40
2.1.4. Описание эксперимента----------------------------------------------------41
2.1.5. Статистическая обработка------------------------------------------------44
2.2. Регистрация вызванных потенциалов------------------------------------45
2.2.1 Характеристика группы испытуемых-----------------------------------45
2.2.2. Стимулы.......---------------------------------------------------------------45
2.2.3. Оборудование---------------------------------------------------------------46
2.2.4. Описание эксперимента----------------------------------------------------46
2.2.5. Статистическая обработка-------------------------------------------------46
ГЛАВА 3. Результаты исследования-------------------------------------------------48
3.1. Поведенческие характеристики опознания------------------------------48
3.1.1. Результаты основной серии---------------------------------------------- 48
3.1.1.1. Опознание животных--------------------------------------------------- 50
3.1.1.2. Опознание предметов----------------------------------------------------52
3.1.1.3. Анализ дисперсии ВР----------------------------------------------------55
3.1.2. Анализ результатов дополнительной серии---------------------------57
3.1.3. Опознание сложных изображений при их прямой маскировке изображениями лиц--------------------------------------------------------64
3.2. Анализ вызванных потенциалов-------------------------------------------69
3.2.1. Анализ компонента N2---------------------------------г------------------71
3.2.1.1 Опознание животных------------------------------------------------------73
3.2.1.2 Опознание предметов----------------------------------------------------80
3.2.2 Анализ компонента РЗ------------------------------------------------------87
3.2.2.1. Опознание животных----------------------------------------------------88
3.2.2.2. Опознание предметов----------------------------------------------------93
ГЛАВА 4. Обсуждение результатов-------------------------------------------------98
4.1. Ухудшение опознания при принадлежности целевого и маскирующего изображений к одной категории------------------100
4.2. Увеличение дисперсии времени реакции в случае принадлежности
целевого и маскирующего изображений к одной категории-----106
4.3. Обнаруженные эффекты более отчетливы в задаче опознания
животных, чем при опознании предметов---------------------------107
4.4. Изображения лиц не оказывают достоверного маскирующего действия---------------------------------------------------------------------110
4.5. Ухудшение опознания при категориальном сходстве целевого
стимула и маски сопровождается снижением амплитуды компонентов N2 и РЗ-----------------------------------------------------112
4.6. Заключение-------------------------------------------------------------------116
ВЫВОДЫ--------------------------------------------------------------------------------117
ЛИТЕРАТУРА--------------------------------------------------------------------------119
ВВЕДЕНИЕ
Актуальность работы.
В сложноорганизованной и перенасыщенной информацией зрительной среде современного человека необходимым условием эффективного взаимодействия с ней является быстрота анализа изображений, которые часто появляются одновременно или быстро сменяют друг друга. Ведь даже не находящаяся в фокусе внимания и неосознанно воспринятая зрительная информация создает преднастройку, влияющую на решение основной задачи, например, опознания значимого объекта, выполнения профессиональной деятельности и т.п. Вопрос о том, каковы механизмы восприятия зрительного образа, которому или предшествует, или за которым следует информация о другом изображении, несмотря на его очевидность, остается далеко не ясным. Связанным с этой проблемой, другим важным аспектом переработки зрительной информации и организации адекватного поведения является необходимость надежного разделения значимых и незначимых сигналов.
Одним из экспериментальных подходов к решению этой проблемы является модель зрительной маскировки. При прямой маскировке, где маска предшествует опознаваемому изображению, переработка информации о целевом стимуле «накладывается» на продолжающийся анализ маскирующего стимула, что существенно изменяет ранние стадии переработки сигнала (Вгектеуег, 1984; Маскшк, Магйпег-Сопёе, 2004). Таким образом, модель прямой маскировки позволяет исследовать поведенческие характеристики и нейрофизиологические механизмы восприятия зрительных сигналов в ситуации неосознаваемого восприятия другой, нерелевантной в настоящий момент, зрительной информации.
В классических работах механизм зрительной маскировки связывают с латеральным торможением на границах целевого и маскирующего
изображений (Macknik, 2006). Но для более сложных зрительных образов механизм маскирующего эффекта не ограничивается простым совпадением в пространстве, тем более что иерархически более высокие объект-чувствительные зрительные области не обладают свойством ретинотопии (Grill-Spector et al., 2001; Reddy, Kanwisher, 2006). Многими авторами (Кроль, Сосина, 1985; Кроль, 1993; Bachmann, 1994; Breitmeyer, Ógmen, 2006) показано, что при опознании сложных фигур большим маскирующим эффектом обладают фигуры, сходные с целевыми, причем, этот эффект не зависит от их совпадения в пространстве. Все эти факты свидетельствуют о возможности более сложных, не ограниченных конфигурационным сходством, отношениях между целевым стимулом и маской.
Современная литература подчеркивает, что для маскирующего эффекта важными могут быть не только конфигурационные, но и семантические характеристики целевого и маскирующего стимулов (Михайлова, Герасименко и др., 2009; Enns, Oriet, 2007). Важность семантического сходства целевого и игнорируемого стимулов для возникновения затруднений опознания показана и в других экспериментальных моделях, таких как негативный прайминг (Tipper, 1985; Fox, 1994) и опознание в присутствии дистрактора ("flanker task") (Erikse, Erikse, 1974). Но обе эти модели характеризуются достаточно большим временем действия незначимого зрительного сигнала. В примененной нами модели прямой маскировки используются, как правило, относительно небольшие длительности предъявления нерелевантного стимула (Macknik, 2006). В этом случае восприятие нерелевантного стимула можно считать неосознаваемым, что приближает выбранную нами модель к естественной ситуации решения зрительных задач в перенасыщенной информацией зрительной среде современного человека. В современной литературе сведения об опознании человеком сложных изображений в условиях их прямой маскировки другими сложными изображениями ограничены и в
подавляющем большинстве представлены поведенческими работами (см. для обзора ВасЬшап, Ьг^а, 2004).
Цель исследования: на модели прямой маскировки провести анализ зависимости поведенческих и нейрофизиологических показателей опознания человеком сложных зрительных стимулов от степени категориальной близости целевого и маскирующего изображений.
Задачи исследования:
1) Провести сравнительный анализ времени реакции и точности опознания зрительных объектов двух категорий (изображения животных и предметов) при их прямой маскировке сложными изображениями различной степени категориального сходства с опознаваемым стимулом.
2) Установить характер влияния категориального сходства целевого и маскирующего изображений на параметр дисперсии времени реакции.
3) Провести сравнительный анализ силы маскирующего воздействия и устойчивости к маскировке для изображений объектов, относящихся к разным категориям - животных и предметов.
4) По критерию вызванных потенциалов установить, в каких временных, амплитудных и топографических характеристиках электрической активности коры отражаются особенности опознания целевого стимула при категориальном сходстве или несходстве целевого и маскирующего изображений.
Научная новизна работы.
В работе получены новые данные о нейрофизиологических механизмах прямой маскировки сложных изображений другими сложными изображениями. Впервые показано, что сила маскировки зависит не от конфигурационного сходства стимула и маски, как это ранее установлено для простых изображений, а от их семантических характеристик. Эффективность маскировки значительно выше при принадлежности целевого и маскирующего изображений к одной категории объектов, что выражается в
значительном ухудшении опознания целевого стимула. Впервые показано, что нейрофизиологическим коррелятом ухудшения опознания при категориальном сходстве стимула и маски является снижение амплитуды комплекса компонентов Ы2-Р3 зрительных вызванных потенциалов, связанного с операциями разделения значимого и игнорируемого стимулов и обработки их семантических характеристик. Важная роль когнитивного звена переработки информации в механизмах маскирующего эффекта для сложных изображений подтверждена данными о резком возрастании дисперсии времени реакции при категориальном сходстве целевого стимула и маски. Полученные результаты могут найти свое применение не только при исследовании механизмов зрительной маскировки, но и предоставят информацию важную для понимания системных механизмов зрительного поведения человека в сложной информационно перенасыщенной среде, организации важного свойства зрительной системы - ее помехоустойчивости. Результаты исследования также применимы для анализа механизмов распределения ресурсов внимания и контекстного восприятия.
Практическая значимость работы.
Полученные в данной работе данные дополняют известные для нейрофизиологии зрительного восприятия сведения о механизмах категоризации зрительных образов и селекции значимой зрительной информации и могут быть использованы в лекционных курсах учебных учреждений биологического и психологического профилей. Полученные результаты важны при конструировании эргономичной зрительной среды для специалистов, чья работа связана с большими нагрузками на зрительную систему: авиадиспетчеров и операторов. Использование обнаруженных закономерностей позволит снизить помехи зрительного восприятия и повысить качество работы многих специалистов, создавая для них более удобные интерфейсы различных компьютерных программ. Обнаруженные в
работе закономерности восприятия последовательно предъявляемых зрительных стимулов могут быть использованы при подготовке телевизионной и любой другой видеопродукции для создания видеоряда оптимальной последовательности и временной структуры. Эти сведения также интересны создателям рекламы, так как позволят оптимизировать подачу материала и привлечь внимание большей аудитории потенциальных потребителей.
Основные положения, выносимые на защиту.
1. Опознание сложного зрительного образа затруднено, если ему предшествует короткое предъявление незначимого, но семантически близкого изображения.
2. Изображения лиц являются категорией зрительных стимулов, которые не обладают маскирующим эффектом; они могут оказывать модулирующее активирующее воздействие на опознание (целевого стимула), степень которого зависит от эмоционального выражения лица.
3. Изображения животных обладают более мощными маскирующим действием и большей устойчивостью к влиянию маскировки по сравнению с изображениями предметов.
4. Нейрофизиологическим коррелятом ухудшения опознания при категориальном сходстве целевого стимула и маски является снижение амплитуды комплекса Ы2-Р3 зрительных вызванных потенциалов, связанного с операциями разделения значимого и игнорируемого стимулов, обработки их семантических характеристик и принятия решения.
1. Обзор литературы
1.1. Современные представления о мозговых механизмах опознания изображений
Зрение является основным каналом поступления в мозг сенсорной информации и имеет огромное значение в жизни человека. Известно, что до 70 % информации о внешнем мире поступает в мозг через зрительный канал (Глезер, 1966). Зрительное восприятие обеспечивает формирование индивидуального опыта человека, его познавательной деятельности. Оно играет очень важную роль в адаптации человека к меняющимся условиям внешней среды и социальной жизни.
Зрительная система человека прошла длительный эволюционный путь развития. Так, у низших позвоночных значительная часть переработки зрительной информации происходит в сетчатке, где имеются специализированные ганглиозные клетки - детекторы, которые реагируют только на биологически важные объекты. Например, земноводные хорошо видят только движущиеся объекты, на которые реагируют или как на пищевой объект, или как на возможную опасность (Никитенко, 1968). У высших позвоночных детальный анализ зрительной информации осуществляется в мозге, его зрительных центрах. Следствием эволюционных преобразований является способность зрительной системы одинаково реагировать на изображения одних и тех же объектов, которые отличаются друг от друга такими параметрами как яркость, контраст, положение в поле зрения, поворот, размер. Кроме того, зрительная система перерабатывает информацию о новых объектах, основываясь на предшествующей информации о сходных объектах.
1.1.1. Иерархический принцип устройства зрительного анализатора.
Зрительная система построена по иерархическому принципу, который прослеживается и на анатомическом, и на функциональном уровне.
Основные принципы анатомической и функциональной организации зрительной системы подробно изложены в ряде работ (Шевелёв, 1971; Lamme et al., 2000). При переходе от иерархически более ранних областей к более высоким имеет место увеличение размера рецептивных полей и усложнение настройки нейронов в более высоких корковых областях (Maunsell et al., 1987).
Начальная обработка зрительного сигнала в мозге включает в себя такие операции как: выделение сигнала из шума, удаление избыточности информации, выделение некоторых признаков (например, размера изображения). Она происходит на уровне сетчатки и подкорковых таламических ядер (Шевелев, 1971; Шелепин, 1973; Подвигин и др., 1986). Аксоны нейронов наружного коленчатого тела направляются в первичную проекционную зону зрительной коры - поле 17 или стриарную кору. Именно здесь происходят первые принципиальные операции по анализу формы объектов - выделение (детекция) её существенных признаков, например, ориентации отрезков линий или полосок, составляющих элементы контуров изображения. За открытие корковых нейронов-детекторов в зрительной коре Д. Хьюбел и Т. Визел в 1981 г. были удостоены Нобелевской премии. Существует упорядоченное топологическое соответствие (свойство ретинотопии) между сетчаткой и 17-м (VI) полем коры. Проекция изображения в 17-м поле дублируется также в 18-м и в 19-м (V2) полях коры (Hubel, Wiesel, 1965). В этих ранних зрительных областях обнаружены нейроны-детекторы не только линий различной ориентации, но их пересечений и изломов (Шевелев, 1971, 2010).
На пути передачи информации от ранних областей зрительной иерархии к вышележащим уровням обработки, ряд исследователей выделяют латеральный затылочный комплекс (LOC), который находится на латеральной стороне фузиформной извилины, распространяясь в дорзальном и вентральном направлениях. Его особенность в том, что он не является ретинотопической зоной, активируется при стимуляции как
контралатеральных, так и ипсилатеральных зрительных полей (Tootell et al., 1998). LOC вовлекается в анализ высокоуровневых (сложные, составные контуры, геометрические фигуры и их комбинации, форма, положение объекта в пространстве и его частей относительно друг друга и т.д.) характеристик объекта, при этом данная область в большей степени участвует в анализе формы объектов, а не в анализе, связанном со сведениями об этих объектах (знани
- Калинин, Сергей Алексеевич
- кандидата биологических наук
- Москва, 2013
- ВАК 03.03.01
- Вызванные потенциалы зрительной коры мозга человека при экспозиции целых фигур и составляющих их элементов
- Механизмы процесса узнавания изображений разной сложности
- Взаимодействие больших полушарий головного мозга при образно-мыслительной деятельности человека
- Центрально-периферические механизмы зрительного подавления при движениях глаз у животных и человека
- Психофизические и электрофизиологические проявления последовательной маскировки движущегося звукового образа