Психологические механизмы зрительного восприятия: интегральная модель

В. М. КРОЛЬ

Работа выполнена при поддержке РФФИ, проект № 97 - 06 - 80263.

Построение динамичного "перцептивного образа " классов объектов внешнего мира представляет основную задачу процессов зрительного восприятия. Получение объективной информации о внешней среде дает принципиальную возможность для выработки команд регулирования поведения. Центральные вопросы процесса зрительного восприятия при этом в существенной степени связаны с проблемами инвариантного выделения и узнавания объектов, находящихся в условиях сложного зрительного шума, т. е. расположенных на фоне других объектов, частично закрывающих и маскирующих друг друга. Инвариантность восприятия в этих условиях определяется тем, что опознание проходит независимо от таких параметров, как освещенность, положение в поле зрения, контрастность, размер, ориентация и пр.

Более того, понятие инвариантности часто включает в себя независимость узнавания и от таких сложных процедур, как изменение ракурса объекта или определенных нелинейных искажений его нормы. В итоге к инвариантному классу объектов данного типа зрительная система относит варианты объектов, часто обладающих при их прямом физическом наложении очень небольшим количеством совпадающих точек. В частности, следует отметить, что объекты, принадлежащие одному зрительному классу, часто не совпадают ввиду разного стиля их изображения. Так, один и тот же объект может быть представлен как контурное или как полутоновое изображение, как изображение, нарисованное пунктирными или штриховыми линиями, как фигура, составленная из текстурных областей, или, наконец, как фигура, содержащая элементы иллюзий. К последним относятся, например, фигуры, нуждающиеся в мысленном достраивании их частей, такие как фигуры с кажущимся или воображаемым контуром.

Решение данных проблем имеет значение не только для психологической теории построения перцептивных образов, рассматривающей восприятие как активное действие, но и для продвижения в прикладных направлениях, таких как эргономика, переработка информации в деятельности оператора автоматизированных рабочих мест и т. д. [3][6].

В настоящее время существует большое количество работ по изучению различных

45

аспектов инвариантного зрительного восприятия. С одной стороны, это психологические исследования вопросов микрогенеза восприятия [7], [11], [12], соотношения симультанных и сукцессивных процессов в ходе опознания [1][3], [12], [14], роли контекстных отношений при интерпретации зрительных сцен. Важность контекстных отношений, в частности, демонстрируется эффектом преобладания целого над частью при восприятии слов и фигур [12], [17], [19], [20], а также при произвольной и непроизвольной смене интерпретации при опознании неоднозначных фигур [13][16], [28], [29]. В этих работах процесс симультанности представляется, на наш взгляд, в несколько новом свете не только как одномоментный акт выбора, когда испытуемый вдруг "видит " ту или иную фигуру, но и как процедура, обеспечивающая общий контекст сукцессивных действий.

Так, при восприятии неоднозначных фигур типа химер они могут быть опознаны как относящиеся к одному или другому классу в зависимости от исходной точки фиксации взгляда испытуемого. Испытуемый одномоментно, скачком переключается на тот или иной вариант неоднозначной фигуры в зависимости от того, с какого фрагмента он начинает опознание и, следовательно, в зависимости от того, как, в соответствии с каким перцептивным образом он интерпретирует все остальные элементы изображения [13], [28]. Можно полагать, что аналогичным образом может быть объяснен эффект инверсии при восприятии "обратимых " фигур типа куба Неккера, лестницы Шредера, картинок типа "жена теща ". Тот или иной вариант видения испытуемым тестового изображения является следствием того, какой "перцептивный образ " (или, в нашей терминологии, инвариантное перцептивное описание) первым включается в работу по опознанию [9].

С другой стороны, наряду с данными о психологических характеристиках всего процесса восприятия и опознания существуют исследования, показывающие наличие и некоторые характеристики работы нейронов, избирательно реагирующих как на простые, так и на сложные элементы формы объектов [26][27]. Так, в работе [22] описаны нейроны нижневисочной коры бодрствующих макак, избирательно реагирующие на сложные элементы трехмерных объектов, причем определялась наиболее простая часть объекта, вызывающая максимальную реакцию. В работе [24] в аналогичных условиях показано, что большинство селективных нейронов реагировало на лицо человека (45 %) или обезьяны

(28 %), 7,5 % реагировали на еду, 10 % на простые геометрические фигуры.

Инвариантность (константность) нейронных ответов описана в работах [18], [23], [30], [32]. Было обнаружено, что нейроны отвечали только на "ключевые " признаки объектов, слабо реагируя на такие параметры, как размер или контрастность. Например, по данным [32], ответы нейронов коррелировали с основными характеристиками лица, типа расстояния между глазами, глазами и бровями, глазами и ртом и т. д.

Таким образом, существует два различных направления, по которым идет изучение макро (психологического) и микро (нейронного) уровней процесса зрительного восприятия. Однако целостная картина процесса, включающая данные обоих уровней, остается неясной: существует провал между данными, полученными на уровне функционирования отдельных нейронов, и данными, полученными при изучении характеристик восприятия как единого процесса. В настоящей работе сделана попытка заполнения этого провала: приведены данные экспериментов по изучению характеристик этапов восприятия, их последовательности и вариабельности, а также рассмотрены теоретические представления о структуре инвариантных перцептивных описаний классов зрительных объектов.

МЕТОДИКА

В экспериментах участвовали 32 здоровых испытуемых обоего пола в возрасте 22 - 36 лет с нормальным или корригированным

46

до нормы зрением. С помощью трехканального тахистоскопа испытуемым предъявлялись на дозируемое (с минимальным шагом в 5 мс) время тестовые фигуры. Появлению тестовых фигур предшествовало предэкзаменационное поле с центральной точкой фиксации, появляющейся на 1,5 - 2,0 с. Сразу же после конца экспозиции предъявлялось маскирующее поле.

В качестве тестовых фигур использовались чернобелые контурные или полутоновые изображения: паттерны из параллельных горизонтальных линий и (или) линий и полос одинаковой длины; геометрические фигуры и их комбинации; одиночные предметные изображения; схематические изображения лиц, фотографии лиц и предметов. Использовались различные типы зрительных шумов и искажений тестовых фигур. Тестовые фигуры имели размер в пределах 1,5 - 3,0 и яркость порядка 7 - 10 люкс.

В качестве маскирующих изображений использовались как шумовые (случайно расположенные отрезки контуров тестовых фигур), так и паттерновые изображения (более сложные, чем отрезки контуров, элементы тестовых фигур). Время предъявления тестовых фигур, как правило, увеличивалось от минимального с некоторым шагом; в ряде серий проводилась и обратная процедура уменьшение времени предъявления, начиная со времени полного узнавания. При каждом времени предъявления в случайной последовательности по несколько раз показывались все тестовые фигуры, использовавшиеся в данной серии. Регистрировалось пороговое время предъявления тестовых фигур, требуемое для их полного узнавания или же для описания отдельных стадий процесса опознания.

РЕЗУЛЬТАТЫ

1. Характеристики этапов процесса зрительного опознания

Процесс зрительного восприятия и опознания может протекать либо в режиме поиска объектов заранее заданного типа, либо в режиме, когда испытуемый заранее не знает, что ему будет предъявлено. В первом случае испытуемый работает в условиях "узкого " (небольшого) алфавита изображений; во втором в условиях максимально расширенного алфавита. На самом деле в реальной ситуации реализуется некоторый усредненный режим, сущность которого заключается в осуществлении контекстно зависимой процедуры зрительного восприятия и узнавания. Действительно, целенаправленное поведение практически очерчивает контекст ожидаемых объектов и ситуаций.

Существенно отметить, что этот ожидаемый контекст постоянно изменяется. В частности, в экспериментальных условиях влияние контекста проявляется в том, что время узнавания отдельных объектов зависит от числа возможных альтернатив, т. е. от алфавита ожидаемых объектов (закон Хика). Время опознания зависит также от условий восприятия, степени обученности, знакомости материала и пр. [3]. Все это свидетельствует о том, что процедура опознания данного объекта не представляет собой жесткого, фиксированного алгоритма, но меняется в зависимости от условий восприятия. В свете этого возникает вопрос: каковы характеристики устойчивых последовательностей этапов восприятия, в чем проявляется вариабельность процесса восприятия?

В нескольких сериях экспериментов использовались контурные (геометрические фигуры, схематические изображения лиц) и полутоновые (текстуры) тестовые изображения. Анализ результатов позволяет выделить последовательность из четырех устойчиво присутствующих стадий процесса опознания.

Серия 1. Узнавание геометрических фигур (треугольник, круг, квадрат, ромб и их комбинации).

Стадия недифференцированного (аморфного) восприятия, порог 14,78 0,59 мс, частотность 88 %, т. е. стадия имела место в 74 измерениях из 84. Основной чертой этой стадии является восприятие тестовой фигуры как набора размытых, малоконтрастных (имеющих меньший

47

контраст и яркость, чем сами тесты) пятен. Стадия связана с функциями обнаружения объекта и его недифференцированного, целостного описания.

Стадия выделения части элементов контура, порог 23,970,83 мс, частотность

94 %. Основной чертой стадии является локальный характер ее операций: испытуемые регистрируют наличие отдельных участков контура фигур, однако никогда не могут определить параметры этих участков (кривизну, угол наклона, длину и пр.), что, повидимому, является причиной отсутствия попыток классификации фигур на этой стадии.

Стадия приблизительной, оценочной классификации, порог 32,731,32 мс, частотность 94 %. Основная по степени информативности стадия, связанная с выделением и частичной характеристикой отдельных фрагментов тестовых фигур. Рассмотрим основные феномены этой стадии: а) испытуемые узнают и описывают не все фрагменты тестовых фигур, б) при нескольких случайно распределенных во времени повторных предъявлениях одного и того же теста и при одном и том же времени экспозиции испытуемые дают несколько равновероятных и различных вариантов классификации, в) классификация тестов проводится в режиме выдвижения гипотез о классе тестовой фигуры, причем при отсутствии процедуры проверки этих гипотез, г) в ходе опознания происходит неверная оценка основных характеристик как отдельных фрагментов, рассматриваемых в качестве целостных единиц восприятия, так и взаимоотношений фрагментов.

Ошибки опознания, возникающие на этой стадии, могут быть отнесены к трем группам. Вопервых, это явно выраженные, грубые ошибки определения характеристик отдельных фрагментов, проявляющиеся, например, в неправильном определении ориентации отрезков прямых (вплоть до поворота на 90), длины линий, которая может быть изменена в 2 - 3 раза, площади замкнутых фрагментов, их эксцентриситета и т. д.

Вторую группу составляют ошибки в определении характеристик взаимных отношений фрагментов (групп фрагментов), в частности ошибки в определении взаимного расположения фрагментов: справа или слева, выше или ниже, первый внутри второго или рядом с ним, ошибки в определении угла между осями фрагментов и т.д.; ошибки в определении взаимных пропорций фрагментов, когда испытуемые, например, регистрируют большой круг около маленького треугольника, хотя тестовая структура содержит маленький круг внутри большого треугольника.

Третью группу составляют ошибки неправильного выделения фрагментов, когда в качестве единого сложного фрагмента выступают части различных фигур, присутствующих на зрительной сцене, например, выделение близко расположенных сторон квадрата и треугольника в качестве пары параллельных линий или использование других вариантов объединения частей разных фигур по признаку пространственной близости, что может быть проявлением "полевых " эффектов, постулируемых гештальтными теориями восприятия.

Важно отметить, что временные пороги всех трех типов ошибок не имеют статистически достоверных отличий и находятся в диапазоне от 29,8 до 33,8 мс при средней ошибке в 2,7 мс. Так, например, порог ошибок при определении ориентации линий составляет 32,591,5 мс, пороги определения взаимного расположения фрагментов 33,02,20 мс, порог ошибочной генерации сложных фрагментов 32,90 2,90 мс и т. д. [9]. Эти данные дают основание считать, что операции по определению собственных характеристик отдельных фрагментов (характеристик фрагментов как целостных единиц восприятия), операции по определению взаимного расположения и отношения фрагментов, так же как и операции по генерации вариантов сложных фрагментов, многократно чередуются в процессе зрительного восприятия.

Анализ полученных результатов приводит к выводу, что все типы ошибок этой стадии связаны с работой механизмов выдвижения гипотез об узнаваемом объекте на основании данных о его частях.

48

Существенным для этой стадии является эффект неполного узнавания всех элементов фигуры, когда испытуемый регистрирует только некоторые, причем при повторных предъявлениях разные, части тестовой фигуры. Этот феномен может рассматриваться как проявление механизма дефицита внимания.

Сам процесс зрительного внимания в таком случае получает некоторое вполне конкретное объяснение, связанное так или иначе с механизмом "рассмотрения " зрительной сцены разными инвариантными эталонными описаниями (перцептивными образами) классов зрительных объектов. В условиях ограничения времени анализа естественно ожидать, что только некоторые, приоритетные в данном контексте восприятия перцептивные образы памяти успеют проверить наличие на зрительной сцене соответствующих им фрагментов.

Выдвижение гипотез предполагает, вообще говоря, их дальнейшую проверку. Однако в наших экспериментах ввиду ограничения времени анализа такая проверка отсутствовала. Например, испытуемые при предъявлении им изображения шестигранной гайки предполагали, что это "кольцо ", "две концентрические окружности ", "цилиндр " и т. д. При предъявлении фигур типа "круг в треугольнике " испытуемые видели "большой эллипс рядом с маленьким треугольником " или "круг над вершиной треугольника " и т. д. Таким образом, выделение в экспериментальных жестких условиях самостоятельно существующих этапов выдвижения гипотез, повидимому, свидетельствует о существовании в нормальных условиях восприятия циклических операций по выдвижению и проверке гипотез о характеристиках фрагментов зрительных объектов.

Интересно отметить, что, по клиническим данным, при локальных поражениях мозга также наблюдаются многочисленные случаи, когда больные на основании опознания отдельных фрагментов ошибочно опознают все изображение без дальнейшей проверки правильности своих предположений [8], [10]. Так, больные могут вместо настольной лампы увидеть горн, вместо кресла тулуп, вместо очков велосипед и т. д. [8].

Последней стадией опознания является стадия идентификации тестовых фигур. Характерной особенностью этой стадии является не отнесение фигур к одному из достаточно широких обобщенных классов, а точное, детальное описание фигур, что, с одной стороны, занимает достаточно большое время (порог стадии 48,732,35 мс) и, с другой стороны, связано с уже не инвариантным, а с конкретным описанием данной фигуры как единичного объекта, обладающего индивидуальными свойствами.

Серия 2. Узнавание схематических изображений лиц, табл. 1.

Таблица 1

Вариабельность характеристик стадий восприятия

Стадия

Пороги, мс

Т

Рост времени предъявления

Уменьшение времени предъявления

Аморфное восприятие

11,51,2

9,00,8

2,51,4

Наличие одного фрагмента

15,81,3 .

9,50,б

6,31,4

Наличие двух фрагментов

25,33,1

19,42,7

5,94,1

Идентификация

41,32,4

25,33,3

1б,04,1

Несмотря на то что эксперименты этой серии проводились при методических условиях, отличающихся от условий предыдущей серии, основные этапы процесса узнавания: этап интегральной оценки целостного изображения, этапы локального анализа отдельных фрагментов, этапы идентификации имели место во всех случаях.

Методической особенностью экспериментов данной серии являлось то, что они

49

проводились в режиме, который может быть назван режимом "направленного поиска ". Общая схема экспериментов заключалась в том, что у испытуемых создавалось искусственное "предпочтение к лицам ". Другими словами, испытуемых инструктировали изначально принимать за лица любые тестовые изображения. В ходе эксперимента при постепенном увеличении времени предъявления тестовых фигур регистрировались пороговые времена, при которых испытуемым становилось ясно, что данное изображение не является изображением лица. Причиной этого могло быть то, что на изображении отсутствовали существенные комплексы фрагментов либо имели место какието лишние фрагменты. Эксперименты, таким образом, выявляли ход поиска на тестовом изображении определенной системы признаков, описывающих класс схем лица.

Начальными стадиями восприятия в этих экспериментах являлись стадии общей недифференцированной оценки. Среди них минимальный порог имела стадия аморфного восприятия, затем шла стадия, когда испытуемые "отсекали " как не лица все тестовые фигуры, имеющие равномерное заполнение внешнего контура, например контуры, заполненные равномерной штриховкой или другой равномерной текстурой. Порог этой стадии 58,301,98 мс. Следующая стадия была связана с операцией "отсечения " пустых контуров, порог стадии 66,201,67 мс.

Последняя из стадий недифференцированных общих оценок стадия определения некоторой нечеткой, размытой конфигурации, состоящей из взаимно перпендикулярных областей, воспринимаемых как Tобразные, Iобразные, либо как 1образные конфигурации. Тестовые фигуры иного типа классифицировались испытуемыми как не лица. Порог стадии 70,01,94 мс.

Во всех экспериментах за стадиями недифференцированной оценки устойчиво следовал ряд стадий, связанных с выделением на тестовом изображении комплексов локальных фрагментов, т. е. стадий локальной обработки и частичной классификации тестовых фигур. В ряду стадий локальной обработки достоверно меньший порог имела стадия поиска и характеристики фрагментов комплекса глаз, порог 72,22,15 мс. На этой стадии как не лица определялись изображения, лишенные данного комплекса фрагментов. Далее следует стадия поиска фрагментов, составляющих комплекс рта и носа, порог стадии 93,42,59 мс.

Таким образом, данная группа стадий представляет собой этапы локальной пофрагментной обработки изображений, связанные с частичной классификацией тестовых фигур.

Стадии идентификации тестовых фигур. Эти стадии связаны с выявлением на тестовых фигурах конкретных деталей в уже опознанных комплексах фрагментов, с определением параметров этих деталей, что дает в итоге возможность узнавания тестовой фигуры как индивидуальной единицы. В рамках нашей экспериментальной методики на стадиях идентификации происходило выявление тестовых фигур, неожиданных с точки зрения схемы лица, в частности, содержащих фрагменты, маловероятные для нормальной схемы лица. К таким стадиям относятся стадии выявления лишних деталей в комплексе глаз (порог 107,12,39 мс), в комплексе рта и носа (порог 168,75,30 мс). Пороговые времена этих стадий определяли минимальное время предъявления, которое требуется для отсечения тестовых фигур, содержащих удвоенный, либо почти удвоенный набор фрагментов комплекса глаз или комплекса рот нос этих фигур.

Серия 3. Узнавание изображений реальных текстур. Наряду с контурными и схематическими изображениями в экспериментах по определению устойчивой последовательности этапов восприятия использовались такие полутоновые изображения, как текстуры. Методической особенностью экспериментов этой серии являлось то, что испытуемые кроме типа текстурных элементов должны были опознать положение и вид границы между двумя текстурными областями, представленными на каждом слайде. Граница представляла

50

собой ломаную линию, составленную из нескольких отрезков прямых.

Эксперименты показали, что при увеличении времени экспозиции имели место четыре основные стадии опознания.

Стадия выделения зон разной яркости, которая представляла собой явный вариант стадии аморфного, недифференцированного восприятия. Яркостные зоны, выделяемые на этой стадии, воспринимались как размытые нечеткие пятна, не совпадающие с границами текстурных областей. В частности, одна яркостная зона могла включать в себя части обеих текстурных областей, в других случаях в границах одной текстуры могли быть выделены несколько зон разной яркости. Порог данной стадии 38,83,4 мс, частотность 80 %.

Стадия частичной характеристики фрагментов текстур и выделения "полюсов " текстурных областей. Операции выделения "полюсов " и описания ряда характеристик элементов текстур не имели достоверно различимых порогов. Однако тенденция к их разделению во времени были отмечены. Ни в одном из случаев испытуемые не проходили стадии "полюсов " (порог 63,06,8 мс) ранее стадии частичной характеристики элементов текстур (порог 55,44,9 мс).

В 25 % экспериментов пороги стадий имели достоверные отличия, когда порог стадий частичной характеристики был меньше порога стадии выделения "полюсов " текстурных областей. Вне зависимости от того, как точно испытуемые выделяли "полюса " различных текстурных областей, они всегда выделяли их как области, заполненные текстурными элементами определенного типа. Примерами описаний элементов текстур являются характеристики типа "мелкие зерна ", "крупные зерна ", "волокнистые структуры ", "регулярные нити ", "шахматный рисунок ", "геометрическая сетка " и пр. Анализ данных показывает, что эта стадия может рассматриваться как типичный представитель стадий частичной пофрагментной классификации.

Стадия идентификации изображений в данных экспериментах имела примерно втрое более высокий порог (179,06,3 мс), чем стадия частичной классификации. Точное проведение границ между текстурными областями, как и точное описание элементов, составляющих эти области, вызывало у испытуемых большие трудности, и поэтому стадия считалась пройденной, если испытуемые указывали направления основных участков границ с точностью в 20 - 25.

2. Вариабельность характеристик этапов восприятия

Наличие устойчивой последовательности стадий восприятия, описанное в предыдущем разделе, не исключает существенных изменений в ходе этого процесса, возникающих при изменении условий восприятия, его контекста или алфавита ожидаемых изображений.

А. Влияние явного знания объектов на ход процесса восприятия

В табл. 1 приведены данные, показывающие изменение пороговых времен отдельных стадий узнавания геометрических фигур при переходе от условий, когда испытуемые не знали заранее, какие тестовые объекты им будут предъявлены ( "прямой ход "), к условиям, когда тестовые объекты были известны испытуемым ( "обратный ход "). Условия "прямого хода " означали регистрацию порогов стадий опознания при постепенном увеличении времени экспозиции тестовых фигур. Условия "обратного хода " регистрацию порогов стадий опознания при постепенном уменьшении времени экспозиции. В этой части экспериментов за порог принималось время, когда испытуемые переставали регистрировать признаки данной стадии.

В условиях опознания знакомого объекта ( "обратный ход ") имеет место значимое уменьшение всех пороговых времен. Из полученных данных следует, что существенно снижаются пороги стадий, близких к завершению процесса узнавания, что свидетельствует о большом влиянии явного знания на поздние стадии процесса опознания.

Явное знание в условиях "обратного хода " сокращает также всю длительность

51

процесса опознания. Интервал между стадиями идентификации и аморфного восприятия составил при "прямом ходе " 29,8 1,7 мс, в то время как при "обратном ходе " всего 16,53,4 мс. Явное знание сокращает также длительность отдельных стадий узнавания, близких к стадии идентификации. Так, интервал между порогами стадии идентификации и стадии наличия одного или более фрагментов сократился с 16,03,9 мс при "прямом " до 6,1 4,2 мс при "обратном ходе ".

В этом плане интересно отметить, что при "обратном ходе " все испытуемые часто "проскакивают " некоторые, особенно ранние, стадии восприятия. Такая тенденция, возможно, свидетельствует об исключении какихто операций либо о переключении перцептивных описаний класса объектов на другие типы операций при изменении условий восприятия.

Для независимого подтверждения данных результатов была проведена вторая серия экспериментов, использующая несколько иные методические установки. В этих экспериментах проводилась двукратная процедура увеличения времени экспозиции тестов одного и того же набора, т. е. проводились эксперименты в условиях двукратного "прямого хода ". При этом испытуемые не знали ни в первой, ни во второй процедуре, какие изображения им будут предъявлены тестовые фигуры менялись в случайном порядке. Тем не менее даже такого неявного ознакомления с алфавитом изображений оказалось достаточно для изменения характеристик процесса восприятия. Результаты показали статистически значимое снижение порогов и длительностей всех стадий процесса восприятия в ходе второй процедуры "прямого хода ". Разница порогов соответствующих стадий (Т) равнялась 2,23,3 для аморфного восприятия, 6,93,5 и 12,73,3 для стадии наличия одного и двух фрагментов, 16,4 3,0 для стадии идентификации.

Таким образом, явное или неявное знание испытуемыми тестовых фигур ведет к явлениям типа "петли гистерезиса ", когда в условиях восприятия заранее известных фигур пороговые времена всех стадий узнавания уменьшаются, а некоторые ранние стадии восприятия, повидимому, вообще исключаются из процесса опознания.

Б. Характеристики изменения хода процесса восприятия при изменении алфавита тестовых фигур

Специфика изменения алфавита изображений в экспериментах данной серии заключалась в смене типа обратного тахистоскопического маскирования. Из общей методики обратного маскирования с очевидностью следует, что маскирующие изображения входят в число тестовых фигур, предъявляемых испытуемым для опознания. Ввиду этого смена маскирующих изображений может в принципе изменить ход процесса опознания, например, в связи с формированием другой системы разделяющих признаков, используемых для узнавания тестовых фигур данного набора.

В экспериментах данной серии использовались тестовые изображения в виде параллельных друг другу горизонтальных полос или линий и полос одинаковой длины и контрастности. Применялись маски двух типов: маска из случайно расположенных отрезков контурных линий (маска 1) либо маска с добавлением к отрезкам контуров также случайным образом расположенных пятен той же контрастности (маска 2), что делало такие маски более похожими на тестовые фигуры.

Результаты экспериментов, так же как и в ранее описанных сериях, свидетельствуют о наличии в процессе опознания устойчивой последовательности стадий аморфного восприятия, оценочной пофрагментной классификации и идентификации (табл. 2). Однако, исходя из целей данной серии, наибольший интерес представляет анализ ошибок, возникающих при оценке параметров тестовых фигур. Из табл. 2 видно, что для тестовых изображений, имеющих вид полос, смена маски приводит к росту порогов стадий аморфного восприятия и идентификации. При этом интересно отметить, что при маске 1 имели место только ошибки измерения контрастности и отсутствовали ошибки измерения ширины полос; при маске 2 имела

52

место обратная картина испытуемые делали ошибки только при измерении ширины полос и правильно оценивали их контрастность.

В табл. 2 б показано, что в случае тестовых фигур типа "линии полосы " при обоих типах маскирования имеют место и ошибки измерения контрастности, и ошибки измерения ширины полос; заметим при этом, что значения порогов проявления ошибочных операций измерения изменяются при смене масок. В результате можно сделать вывод, что в пределах стадии оценочной, пофрагментной классификации могут быть выделены отдельные операции процесса узнавания, в частности операции по измерению таких элементарных (и, казалось бы, труднодоступных для анализа) характеристик, как контрастность и ширина полос.

Использование общего методического приема, связанного с анализом ошибок при изменении условий восприятия (алфавита тестовых фигур, типа масок, дает, таким образом, принципиальную возможность выявления министадий процесса узнавания, связанных, например, с проведением различных измерительных операций.

Таблица 2

Ошибки измерения контрастности и ширины полос при смене условий восприятия

(стадия оценочной классификации)

Условия восприятия

Ошибки оценки

контраста

ширины линий

% ошибок

порог стадии, мс

% ошибок

порог стадии, мс

а. Тестовые фигуры: полосы

Маска № 1

Маска № 2

72,2

 

9,841,38

 

 

86,6

 

32,5 4,7

б. Тестовые фигуры: линии - полосы

Маска № 1

Маска № 2

72,0

19,0

12,32,3

24,3 2,2

93,3

76,2

20,22,2

34,92,6

3. Интегральная модель структуры процесса зрительного восприятия

Изложенные экспериментальные результаты позволяют рассматривать зрительное узнавание как контекстуальнозависимую последовательность этапов измерения характеристик сложных фрагментов изображений. Это означает наличие двух принципиальных особенностей процесса восприятия: а) существования некоторой устойчивой последовательности этапов, имеющих место при узнавании разных типов изображений в разных условиях восприятия, б) вариабельности характеристик процесса узнавания, заключающейся, в частности, в изменении порогов и длительностей отдельных стадий восприятия, появлении ошибок, типичных как для отдельных стадий, так и для контекста восприятия, что, повидимому, представляет собой проявление различных систем разделяющих признаков, используемых при восприятии различных наборов объектов.

Основой процесса является пофрагментное описание узнаваемых объектов, причем по мере продвижения процесса восприятия происходит узнавание все более сложно и детально описываемых фрагментов. В пользу предположений об этапности и пофрагментности хода зрительного узнавания говорят и многие литературные данные, в том числе результаты изучения фрагментарности восприятия изображений, стабилизированных относительно сетчатки, послеобразов [3], [6], [7], а также ранее упомянутые данные о работе нейронов детекторов сложных признаков [22][27], [30][32].

В итоге наши экспериментальные данные и данные литературы позволяют

53

сформулировать следующие основные положения модели процесса зрительного узнавания.

1. Зрительное узнавание представляет собой гибкий, зависимый от контекста восприятия (условия восприятия, алфавит объектов, преднастройки и установки) процесс описания одних, более сложных фрагментов через другие, более просто организованные фрагменты. Характерная черта этого процесса заключается в многократном измерении как целостных характеристик отдельных фрагментов (таких, как лошадь, длина, вытянутость, степень изрезанности и т.д.), так и характеристик взаимного соотношения фрагментов (пропорции частей, их взаимное расположение, пропорции частей и целого, соотношения между особыми точками фрагментов и пр.).

В этом плане важно отметить самостоятельную значимость операций по определению собственных характеристик отдельных фрагментов и характеристик их взаимного соотношения. По данным клиники локальных поражений широкой зрительной сферы коры мозга, за узнавание пространственных ситуаций и за узнавание сложных частей изображений отвечают различные структуры. Такой вывод следует из анализа данных по симптоматике предметной и пространственной форм зрительных агнозий [8], [10]. Ошибки типа фрагментарности восприятия при узнавании предметных изображений возникают при поражении височных и околовисочных областей мозга, ошибки в узнавании пространственных ситуаций при поражениях теменных областей.

Существенность для процессов зрительного восприятия как операций по измерению характеристик отдельных фрагментов, так и операций по измерению характеристик взаимоотношения разных фрагментов видна также и из того, что из клиники локальных поражений следует двойное представление этих процедур в доминантном и субдоминантном полушариях мозга.

Поражения теменных и теменнозатылочных областей доминантного полушария связаны с семантическими и синтаксическими дефектами восприятия пространственных схем; поражения теменных и теменнозатылочных областей субдоминантного полушария с нарушениями в узнавании не схематических, но конкретных пространственных ситуаций. Поражения височных и задневисочных областей доминантного полушария вызывают явления оптической предметной амнестической афазии и фрагментарности восприятия, когда у больных страдают способности к обобщенному предметному восприятию, к классификации и словесному называнию предметов. Поражения симметричных областей субдоминантного полушария вызывают нарушения других сторон предметного образа, таких, как способность к целостному наглядному восприятию предмета, способность к узнаванию конкретных знакомых объектов [8].

По нашему мнению, разница между операциями по определению собственных характеристик отдельных фрагментов (объектов) и операциями по определению характеристик взаимоотношения фрагментов (объектов) имеет важный семантический аспект. Суть дела заключается в том, что в первом случае при работе с объектом наряду с целостными характеристиками у объекта появляется собственное имя, название; во втором случае при работе с группой объектов мы имеем дело со сценой, принципиально не имеющей единого собственного имени. Примером может быть разница между некоей лужайкой, на которой определенным образом расположены кусты и группы деревьев, и вполне определенным сквером, имеющим собственное имя и представленным в нашем сознании как единый целостный объект.

При таком рассмотрении перцептивный образ лужайки скорее связан с деятельностью теменных отделов мозга, работающих с объектами внешнего мира как с пространственными сценами (конкретными или схематическими), в то время как перцептивный образ сквера скорее связан с работой височных отделов мозга, работающих с целостными объектами внешнего мира.

54

2. Процесс зрительного узнавания объекта происходит как результат сформированного к этому моменту инвариантного эталонного описания класса зрительных объектов, т. е. обобщенного перцептивного образа объектов данного типа. Структура перцептивного образа не является абсолютно жесткой, она меняется в зависимости от контекста восприятия, может быть более простой или более сложной, более инвариантной (инвариантной к большему числу параметров) или более индивидуально направленной, т. е. учитывающей значения таких характеристик, как ориентация в поле зрения, размер, ракурс и пр.

В итоге процесс узнавания того или иного объекта состоит из последовательности этапов и операций, протекающих под управлением соответствующего перцептивного образа (эталонного описания). В обычных условиях опознания множества объектов, расположенных на сложной зрительной сцене, в условиях частичного перекрытия и зрительного шума в процессе узнавания участвует большое число перцептивных образов. В принципе все эти эталонные описания могут работать параллельно и независимо друг от друга.

Однако во многих устоявшихся ситуациях повторного узнавания стандартных сцен естественно ожидать объединения нескольких перцептивных описаний в некоторую общую сетевую структуру, которая имеет общие этапы и операции, а также выделяет на зрительной сцене фрагменты, свойственные группам объектов разных классов. В общем случае начальные операции такой сети связаны с проверкой наличия и последующим выделением на зрительной сцене элементарных фрагментов, типа отрезков прямых разной ориентации, углов и пересечений, что соответствует работе классических нейронов детекторов Хьюбела и Визела. В ходе дальнейшей работы сети происходит проверка наличия на зрительной сцене более сложных и более специфических фрагментов, свойственных только некоторым группам объектов. Этим этапам узнавания в принципе должна соответствовать работа более специфических нейронных ансамблей, т. е. нейронов детекторов сложных признаков [22][27], [30][32].

3. Процесс восприятия представляет, таким образом, упорядоченную в соответствии со структурой эталонного описания (перцептивного образа) систему операций по выделению и измерению характеристик фрагментов изображений. При этом перцептивное описание построено по принципу "часть через части " и представляет собой структуру, в которой сложные фрагменты определяются через систему составляющих их более простых фрагментов.

Перцептивное описание необязательно содержит те или иные характеристики данного фрагмента в явном виде, оно может содержать только критерии правильности процедур поиска, выделения и отбора соответствующих фрагментов, например интервалы значений характеристик, координаты особых точек фрагментов без указания их конкретной формы или размера. Такой вариант может иметь место при опознании пространственных сцен, когда важным является не столько форма фрагмента, сколько его расположение относительно других фрагментов: при узнавании лица не столь важно, какую форму имеют глаза, рот или любые другие части, существенна схема их взаимного расположения. Именно таковы многие детские рисунки. Более того, можно представить изображение, в котором на месте глаз или любых других частей будут находиться фрагменты совершенно других, имеющих самостоятельное значение фигур, тем не менее коллаж такого типа будет легко опознан как некое стилизованное лицо.

Из сказанного следует, что перцептивное описание может быть представлено в двух видах: как декларативная и как процедурная конструкция. Декларативная форма представляет собой описание типа определения, построенное в синтаксисе типа "объект представляет собой структуру, обладающую следующими характеристиками, состоящую из фрагментов типа A, B, C и т. д. ". Процедурная форма представляет собой скорее не определение, но инструкцию к действию, построенную в синтаксисе типа "для выделения

55

Рис. Модель структуры сегментов перцептивного описания класса зрительных объектов

и опознания объекта следует среди множества фрагментов сцены найти фрагмент, обладающий следующими характеристиками... "

4. Наиболее устойчивой частью перцептивного описания является автономный сегмент этого описания. Сегмент перцептивного описания определяет характеристики и структуру некоторой части объекта (фрагмента изображения) и содержит следующую информацию: а) интегральные характеристики данной части, присущие ей как целостной единице восприятия, например значения ее площади, средней яркости, эксцентриситета, размеров и т.д.; б) характеристики и количество частей, составляющих данный фрагмент;

в) характеристики взаимного расположения частей относительно друг друга и относительно объекта в целом. Пример структуры сегмента описания приведен на рисунке.

Сегменты перцептивного описания, таким образом, имеют самостоятельное значение как системы, отображающие зрительную сущность того или иного типа фрагментов (частей объектов). Структура перцептивного описания такого рода дает возможность осуществления независимой и параллельной обработки зрительной сцены многими сегментами (принцип "автономии "). Наряду с этим такая структура перцептивного описания предполагает возможность гибкой перестройки самого перцептивного описания в зависимости от того, какие части объекта подвергнуты зашумлению или скрыты за другими объектами. Другими словами, структура перцептивного описания дает возможность ограничить число сегментов, участвующих в процессе восприятия и опознания (принцип "кворума ").

5. Основная стратегия работы модели перцептивного описания в ходе процесса восприятия заключается в первичном определении интегральных характеристик объекта,

т. е. параметров, описывающих

56

объект как целостную единицу восприятия. Как видно из рисунка, на этом этапе в работе участвуют только верхние сегменты перцептивного описания. Включение в работу сегментов нижележащих уровней, дающих более детальное и структурированное описание объекта, происходит не всегда, а только "по запросу " верхних уровней.

Такая стратегия шунтирования, в частности, дает возможность узнать объект в условиях отсутствия полной информации, например при плохой видимости или перекрытии некоторых его частей. Данная стратегия отражает полученные в экспериментальной части работы данные об измерении на начальных стадиях восприятия таких характеристик, как средняя яркость (усредненная по пространству яркость отдельных "пятен "), степень изрезанности контура, регулярность заполнения внутренности фрагмента без учета его внутренней детальной структуры.

Данная стратегия согласуется также с полученными в экспериментальной части работы результатами, говорящими об узнавании как о процессе истолкования, интерпретации элементов сетчаточного образа сегментами перцептивного описания. Действительно, по излагаемой модели сегменты перцептивного описания (как верхние, так и нижние) настроены на активный поиск на сложной зрительной сцене фрагментов с соответствующими параметрами. Результаты наших экспериментов по узнаванию схем лиц и гистерезису восприятия в условиях явного и неявного знания испытуемыми тестового материала говорят об узнавании как о процессе активного поиска.

В пользу интерпретационной модели узнавания свидетельствует также ряд литературных данных ([6], [14], [16], [17], [28], [29]), утверждающих, что процесс восприятия идет по схеме "сверху вниз ", что на первый взгляд противоречит стратегии "снизу вверх ", основанной на идее описания входной сцены сначала нейронами детекторами нижнего уровня с последующим подключением нейронных сетей, отвечающих за более сложные операции. С точки зрения предлагаемой модели такое противопоставление является в определенной степени искусственным.

Дело в том, что даже в рамках стратегии "снизу вверх " включению какойто элементарной исполнительской операции, например операции выделения угла или линии определенного наклона, должна предшествовать процедура прочтения или перевода в активное состояние соответствующих сегментов эталонного описания. Таким образом, в этом режиме также осуществляется направленный поиск фрагментов определенного типа с тем только отличием, что в процессе направленного поиска участвует небольшое количество сегментов эталонного описания одного уровня сложности.

ВЫВОДЫ

1. В ходе тахистоскопических экспериментов определялись пороговые времена отдельных стадий процесса опознания (времена предъявления тестовых фигур, необходимые для узнавания самих фигур либо их частей), а также пороги появления и типы ошибок, характерных для разных стадий узнавания.

2. Показано, что устойчивая последовательность стадий, имеющая место при узнавании тестовых изображений разных классов (геометрических фигур, схем лиц, текстур), связана с процедурами нескольких типов: процедурами измерения интегральных характеристик отдельных фрагментов, дающих описание фрагмента как целостной единицы восприятия; процедурами измерения характеристик взаимного соотношения отдельных фрагментов; процедурами по выдвижению и проверке гипотез о классе изображения на основании его пофрагментного описания.

3. Показано, что анализ ошибок восприятия дает возможность выявления и измерения характеристик отдельных министадий процесса опознания, например стадий, связанных с проведением различных измерительных операций.

4. Показано, что наряду с существованием устойчивой последовательности стадий имеет место вариабельность хода процесса опознания, которая проявляется в виде изменения пороговых значений отдельных стадий, их длительности, типов ошибок, характерных для этих стадий, а иногда и в виде выпадения отдельных стадий.

5. Описаны параметры вариабельности процесса восприятия, имеющей место при изменении условий восприятия. Показано, что пороговые значения и длительности отдельных стадий, так же как и типы ошибок, характерных для этих стадий, находятся в зависимости от контекста восприятия, а также от явного или неявного знания испытуемыми алфавита тестовых фигур.

6. На основании полученных результатов сформулированы основные положения интегральной модели процесса зрительного восприятия и опознания. В основе модели лежит положение об узнавании как о контекстно зависимом и перестраиваемом процессе поиска на пространственной сцене фрагментов, характеристики которых соответствуют критериям некоторого инвариантного перцептивного описания.

1. Бондарко В. М., Шелепин Ю. Л. К вопросу о восприятии целостности зрительных объектов // Сенсорные системы. 1996. Т. 10. № 1. С. 25 - 30.

2. Вертгеймер М. Продуктивное мышление. М.: Прогресс, 1987.

3. Глезер В. Д. и др. Зрительное опознание и его нейрофизиологические механизмы. Л.: Наука, 1975.

4. Зинченко В. П. Развитие зрения в контексте перспектив общего духовного развития человека // Вопр. психол. 1988. № 6. С. 15 - 30.

5. Зинченко В. П., Мунипов В. П. Основы эргономики. М.: Наука, 1979.

6. Зинченко В. П., Величковский В. М., Вучетич Г. Г. Функциональная структура зрительной памяти. М.: Издво МГУ, 1980.

7. Капран В. И. Фрагментация стабилизированного образа как средство изучения микрогенеза восприятия // Исследование функциональной структуры исполнительной деятельности. Труды ВНИИТЭ. Эргономика. 1980. № 19. С. 122 - 133.

8. Кок Е. П. Зрительные агнозии. М.: Медицина, 1967.

9. Кроль В. М. Зрительное узнавание как управляемый поиск сложных фрагментов // Сенсорные системы. 1995. Т. 9. № 1. С. 58 - 67.

10. Лурия А. Р. Высшие корковые функции человека. М.: Издво МГУ, 1962.

11. Невская А. А. И др. Временные характеристики опознания предметных изображений при фильтрации высоких пространственных частот // Физиология человека. 1987. Т. 13. № 5. С. 757 - 766.

12. Шехтер М. С. Образные компоненты знания и обучения // Вопр. психол. 1991. № 4. С. 50 - 58.

13. Brunas J., Young A. N., Ellis A. W. Repetition priming from incomplete faces: Evidence for to whole completion // Brit. J. Psychol. 1990. N 1. P. 43 - 56.

14. Cavanagh P., Arguin M., Treisman A. Effect of surface medium of visual search for orientation and size feature // J. Exp. Psychol.: Hum. Percept. and Perform. 1990. V. 16. N 3. P. 579 - 491.

15. Ditzinger T., Haken H. Oscillation or perception of ambiguous patterns // Biol. Cybern. 1989. V. 61. N 4. P. 279 - 287.

16. Goolkaasian P. The effect of size on the perception of ambiguous figures // Bull. Psychonom. Soc. 1991. V. 29. N 2. P. 161 - 164.

17. Gregory R. L. The lazy eye and the exploring brain // Proc. Roy. Inst. Great. Brit. Northwood. 1985. V. 50. P. 143 - 149.

18. Ito M. et al. Size and position invariance of neuronal responses in monkey interotemporal cortex // J. Neurophysiol. 1995. V. 73. N 1. P. 218.

19. Jonson N. F., Carnot M. J. On time differences in searching for letters in words and nonwords: Do they emerge during the initial encoding or the subsequent scan // Mem. and Cognit. 1990. V. 18. N 1. P. 31 - 39.

20. Jordan T. R. Superiority over single letters and influence of postmark boundaries // J. Exp. Psychol.: Hum. Percept. and Perform. 1990. V. 16. N 4. P. 893 - 909.

21. Kurtev A. D., Penchev A. N. Recognition of visual patterns and high frequency deficit // Acta Physiol. and Pharmac. Belg. 1991. V. 17. N 1. P. 7 - 12.

22. Kobatake E., Tanaka K. Neuronal selective complex object feature in the ventral visual pathway of the macaque cerebral cortex // J. Neurophysiol. 1994. V. 71. N 3. P. 856 - 867.

23. Logothetis N. K., Pauls J., Poggio T. Shape representation in the inferior temporal cortex of monkey // Curr. Biol. 1995. V. 5. N 5. P. 552 - 562.

24. Mikami A., Nakamura K., Kubota K. Neuronal responses to photographs in the superior temporal silcus of rhesus monkeys // Behav. Brain. 1994. V. 60. N 1. P. 1 - 13.

25. Nakamura K. et al. Visual responses properties of single neurons in temporal pole of behaving monkeys // J. Neurophisiol. 1994. V. 71. N 3. P. 1206 - 1221.

26. Rodman M. R., Scalaidhe S., Gross C. Response properties of neurons in temporal cortical visual areas of infant monkeys // J. Neurophisiol. 1993. V. 70. N 3. P. 1115 - 1136.

27. Rolls E. T., Bailis G. C. Size and contrast have only small effect on the responses to faces neurons in the cortex of the superior temporal sinus of the monkey // Exp. Brain Res. 1986. V. 65. N 1. P. 38 - 48.

28. Sanocki T. Effect of early common feature on from perception // Percept. and Psychophys. 1991. V. 50. N 5. P. 490 - 497.

29. Snak M. D., Walker J. T. Figureground organization of real and subjective contours: A new ambiguous figures, some novel measures of ambiguity and apparent distance across regions of figure and ground // Percept. and Psychophys. 1989. V. 46. N 2. P. 127 - 138.

30. Tanaka K. et al. Coding visual images of objects in the inferotemporal cortex of the macaque monkey // J. Neurophysiol. 1991. V. 66. N 1. P. 170 - 189.

31. Tovee M. J., Rolls E. T., Ramachandran V. S. Rapid visual learning in neurons of the primate temporal visual cortex // J. Neuroreport. 1996. V. 7. N 15 - 17. P. 2757 - 2760.

32. Yamane S., Kaji S., Kawano K. What fatial features active face neurons in the inferotemporal cortex of the monkey // Exp. Brain Res. 1988. V. 73. N 1. P. 209 - 214.

Поступила в редакцию 11. XI 1997 г.

источник неизвестен

Рубрика: 
Ключевые слова: 
+1
0
-1