Фреймы для представления знаний - Страница 5
1.5. Носит ли зрительное восприятие символьную форму
Можно ли действительно предполагать, что восприятие человеком трехмерных объектов столь фрагментарно и атомистично, что оно может быть представлено в терминах отношений между элементами двухмерных изображений? Давайте сразу же отделим друг от друга эти два вопроса: являются ли зрительные образы символьными и основаны ли они на двухмерных конструкциях. Первый вопрос имеет особое значение; не вызывает сомнения, что на некотором уровне зрительное восприятие протекает в основном в символьной форме. Разногласия могут быть между теми, кто, с одной стороны, придерживается несколько наивных концепций и считает вое приятие либо картиноподобным, либо протекающим на основе оперирования с воображаемыми геометрическим телами, и теми, кто, с другой стороны, основываясь на экспериментальных данных (см. Ж.Пиаже, Б.Инельдер,1956 и др.), доказывает, что многие возможные ограничения, вытекающие из символьных представлений, и в самом деле существуют.
Так, нам известно, что дети в своем творчестве, особенно в графике (впрочем, это относится и к взрослым) пользуются набором весьма ограниченных символьных ингредиентов (см., например, Е.Гомбрих(1959)). Перспективы и заслонения обычно представляются не такими, какие они есть на самом деле, а с помощью определенных условностей. Метрические соотношения сильно искажены; сложные формы изображаются с помощью специальных знаков, которые не пользуются для представления наиболее существенны! признаков. Представители "наивной" точки зрения обычно не признают подобных ухищрений и придерживаются мнения, что люди действительно "видят и манипулирую! образами, подобными картинам" так, что это нельзя объяснить с помощью дискретных описаний.
Что касается второго вопроса (являются ли образы двух- или трехмерными), то его на уровне символьный описаний не существует, ибо неподходящим становится здесь само понятие измерения. Каждый вид символьного описания объекта одним целям служит хорошо, а другим - плохо. Если заданы отношения "слева-от", "справа-от" и "находится-над" между элементами некоторой структуры и представлены они в виде маркеров, определенных на парах терминалов, то при проведении определенных манипуляций с объектом его описание, выполненное на этой основе, будет достаточным для предсказания местонахождения его отдельных элементов. Задача облегчается тем, что если, например, поворачивать куб, не меняя его ориентации в пространстве (не меняя грани, которой он соприкасается со столом), то определенные свойства этих отношений будут инвариантными к подобным перемещениям. Большинство предметов обычно имеет свои верхние и нижние части. Однако если положить куб на боковую грань, то предсказания, основанные на тех же самых описаниях, сделать будет значительно труднее: люди испытывают большие затруднения при слежении за гранями шестицветного куба (т.е. куба, каждая грань которого окрашена в разный цвет), если заставить их мысленно его поворачивать.
Если для тех же целей использовать более "характерные" отношения, такие как "следующий-за" или "быть-противоположным-к", то аналогичные описания изображений будут менее чувствительными к возможным поворотам объектов. В работах П. Уинстона(1970, 1971, 1972) мы видим, каким образом систематические замены отношений (например, "слева" вместо "сзади" или "справа" вместо "спереди") могут использоваться при имитации вращения предметов.
У. Хогарт осуждал тех художников, которые слишком мало времени уделяли совершенствованию своих представлений об окружавших их предметах. (Уильям Хогарт (1697-1764), выдающийся английский живописец, график и теоретик искусства, в 1753 г. опубликовал, свои известный теоретический трактат "Анализ красоты"). Он советовал тем, кто стремится получить правильные представления о расстояниях, отношениях и различиях между некоторыми существенными точками и линиями, принадлежащими, в худшем случае, даже наиболее асимметричным фигурам, постепенно вырабатывать в себе способность извлекать их из своей памяти, ибо это может во многом помочь тому, кто постоянно что-нибудь изобретает или рисует по памяти и способствует точному натурному воспроизведению предметов.
Таким образом, преднамеренная тренировка памяти в вопросах систематизации отношений между точками, лежащими на противоположных поверхностях тел, является, по мнению У. Хогарта, ключом к пониманию инвариантных отношений между видимыми и невидимыми частями изображений; они могут дать человеку информацию, достаточную для того, чтобы вообразить себя внутри какого-то предмета или мысленно очутиться в другой, практически недоступной точке наблюдения. Отсюда можно сделать вывод о том, что У.Хогарт отвергал "наивные" концепции в теории восприятия образов.
Некоторые люди полагают, что пространственные задачи решаются с помощью каким-то образом хранимого в памяти аналога трехмерной структуры. Если, однако, кто-либо и смог бы воссоздать такую модель, то для "интеллектуального глаза" сохранилась бы большая часть из тех традиционных проблем, которые относятся к реальному глазу, и, кроме того, появилась бы новая весьма трудная задача: создание (на основе двухмерных конструкций) образа какого-то гипотетически воображаемого предмета.
Хотя эти аргументы, как может показаться, свидетельствуют о целесообразности употребления двухмерных изображений для агрегирования и распознавания образов, их нельзя считать удовлетворительными для задач планирования и выполнения манипуляцпонкых операций. Более естественным выглядит другой вариант представления информации в той же символьной форме, но на базе основных геометрических форм. Так, телефонная трубка может быть описана с помощью двух усеченных сферических тел, соединенных изогнутым прямоугольным стержнем. В следующем параграфе будет рассмотрен вопрос о совместном использовании двух и более методов, качественно отличных друг от друга, для представления одного и того же объекта.
1.6. Видение комнаты
Познание окружающего мира с помощью органов зрения кажется нам непрерывным. Одной из причин этого является наше постоянное движение. Более глубокое объяснение заключается в том, что обычно наши ожидания "гладко" взаимодействуют с нашим зрительным восприятием. Предположим, что вам пришлось выйти из комнаты, закрыть за собой дверь, затем вернуться, чтобы ее открыть и обнаружить совершенно другую комнату. Вы были бы поражены. Смысл этой перемены был бы едва ли менее поразительным, чем внезапное, на ваших глазах, изменение всего мира.
Наивная теория феноменологической непрерывности утверждает, что скорость зрительного восприятия настолько велика, что наши образы могут изменяться с такой же скоростью, как и видимые нами сцены. Ниже я отдаю предпочтение альтернативной теории: изменения в основанных на фреймах представлениях человека происходят со своей собственной скоростью; система фреймов предпочитает производить небольшие изменения, как только это становится возможным, а иллюзия непрерывности возникает вследствие постоянства заданий терминалов, общих для фреймов различных видов. Таким образом, непрерывность зависит от подтверждения ожиданий, что, в свою очередь, зависит от быстроты доступа к запомненным знаниям об окружающем нас мире.
Перед тем, как войти в комнату, вы уже заранее знаете, что увидите комнату, а не какой-нибудь пейзаж. Обычно можно указать на это по типу двери, так же как и выбрать заранее фрейм, соответствующий виду новой комнаты. Часто люди просто предполагают наличие какой-то конкретной комнаты. В этом случае значения многих заданий терминалов уже определены.
Самый простой вариант фрейма комнаты - это подобие пустой внутренности коробки. Следуя нашей модели куба, можно считать, что структура верхнего уровня фрейма "комната" должна соответствовать схеме, показанной на рис.1.5.
Человек должен конкретизировать задания терминалов теми предметами, которые он видит. Если комната ему хорошо знакома, то некоторые задания уже заполнены данными (означены). В случае, когда отсутствуют какие-либо ожидания, на первой месте должно быть стремление выявить наиболее характерные геометрические признаки. Чтобы заполнить задания терминала "левая стена", можно вначале попытаться найти линии а и d, а затем углы ag и dg. Линию g найти в обычных условиях легко, поскольку она будет пересекаться при любом горизонтальном (на уровне глаз) осмотре помещения, проводимом слева направо. В конечном итоге углы ag, gb и Ьа должны соответствовать друг другу, так как все они являются частями одной и той же физической вершины.