<<
>>

16. Синергетика и распознавание образов

В начальных главах книги мы познакомились с явлениями, демонстри-рующими поведение различных систем в живой и неживой природе (гла-ва 2 — движение жидкости, 5 — восприятие образов).

Возникает вполне естественный вопрос: является ли аналогия между этими явлениями всего- навсего поверхностным сходством или же перед нами результат действия каких-то глубинных, основополагающих принципов? Иными словами, можем ли мы применить известные нам из синергетики принципы (включая и необходимые математические методы) к созданию модели мозга, способной к воспроизведению результатов деятельности живого мозга, связанных с восприятием? Поиском ответов на эти вопросы мы и намерены заняться в дальнейшем.

Что же это, в сущности, такое — распознавание? Чтобы разобраться в этом, обратимся к понятию так называемой ассоциативной памяти, впервые математически описанной Карлом Штайнбухом. В качестве примера воспользуемся телефонным справочником. Допустим, мы хотим узнать номер телефона известного нам человека по имени Алекс Мюллер; мы находим в справочнике это имя и напротив него видим искомый номер телефона — те.справочник дополняет известные нам данные (имя) ранее неизвестными (номер телефона). Нечто подобное происходит и при узна-вании нами людей: когда мы видим фрагмент лица некоего человека, наш мозг, обращаясь к ассоциативной памяти, «дополняет» недостающие детали, и если человек нам знаком, называет еще и его имя, или, по крайней мере, подтверждает, что с этим человеком мы уже когда-то встречались. Под ассоциативной памятью, таким образом, понимается дополнение неполного набора данных недостающими деталями.

Второй важный момент, позаимствованный нами из синергетики и пе-ренесенный в область восприятия, — это идея параметра порядка, поведение которого можно описать с помощью модели движения мяча по холмистой местности. Пример связи распознавания образов с динамикой параметра порядка представлен на рис.

16.1. В правой части рисунка помещена одна из уже знакомых нам «двойных» картинок — она воспринимается то как белая ваза на черном фоне, то как два черных профиля на белом фоне. Слева на рисунке изображен холмистый ландшафт, соответствующий такому двойному восприятию. Если мяч оказывается в левой долине, то это означает, что произошло «распознавание вазы», если же в правой — «распознавание лиц». Любое другое расположение мяча должно означать либо незавершенный процесс распознавания, либо отсутствие такового вообще. Так, при первом взгляде на «двойную» картинку мы еще не видим ни вазы, ни лиц — этому состоянию соответствует положение мяча на «вершине холма». Небольшое начальное воздействие или некоторая дополнительная информация (например, фраза «Назовите предмет, изображенный на черном фоне») оказываются решающими, т. е. определяют направление, в котором

Рис. 16.1. Распознавание образов и динамика параметра порядка. Рисунок, помещенный справа, уже встречался нам в этой книге (рис. 5.11). Человеку, впервые увидевшему этот рисунок, его содержание может показаться не совсем ясным. Если же такому человеку дать конкретное указание: «Рассмотрите, пожалуйста, эту картинку и назовите предмет, изображенный на черном фоне», то он очень быстро распознает в загадочном предмете вазу. Если же спросить его, что изображено на белом фоне, то он без труда распознает два лица, нарисованные в профиль. Такую бистабильность восприятия одного и того же изображения можно описать с помощью движения мяча по холмистой местности (рисунок слева). Устойчивые положения мяча соответствуют интерпретациям изображения «ваза» или «лица». Горизонтальная координата (д) снова выступает в роли параметра порядка. Начальная информация определяет положение мяча справа или слева от «вершины», после чего, по мере рассматривания картинки, мяч окончательно скатывается в одну из «долин» — это означает, что восприятие успешно завершено

покатится мяч, и, в итоге, конечное его положение, а значит, и конечное состояние («ваза» или «лица») системы восприятия у нас в мозге.

В дальнейшем мы увидим, что именно так и происходит различение разных объектов. Механизмы, действующие при распознавании двойственных изображений, мы еще будем обсуждать ниже, в главе 26. Пока же для наших целей вполне достаточно принять к сведению тот факт, что движением мяча по холмистой местности можно символически описать действительный процесс распознавания образов. Эта идея высказывалась нами (Г. X.) еще в начале 70-х годов и нашла свое отражение в вышедшей в 1977 году книге «Синергетика»1.

1H.Haken. Synergetik. Eine Einfuhrung. Springer, Berlin/Heidelberg, 1977.

Эта же идея лежит в основе разработанной Джоном Хопфилдом в 1981 году концепции нейрокомпьютера (об этом мы поговорим в главе 31).

И, наконец, наше наиважнейшее положение заключается в том, что распознавание образа есть не что иное, как создание образа. На первый взгляд, это может показаться парадоксальным, однако по некотором размышлении между двумя упомянутыми процессами обнаруживается фундаментальная аналогия.

Для начала рассмотрим процесс создания образа, с которым мы уже имели возможность познакомиться ближе в главе 2, посвященной изложению основных принципов синергетики. В качестве конкретного примера возьмем процесс возникновения ячеистой структуры в жидкости (рис. 2.13, левый столбец). Сначала в упорядоченном состоянии находится лишь часть жидкости. Это состояние порождает соответствующий параметр порядка, который в дальнейшем подчиняет себе все остальные возможные параметры порядка и приводит все частицы в данном объеме жидкости всоответ-ствующим образом организованное состояние. Этот процесс еще раз представлен на рис. 16.2, слева. Что же происходит при распознавании образа? Допустим, сначала мьг видим только один фрагмент лица, который и узнаем по каким-то отличительным особенностям (например, по форме носа). Теперь представим себе, что в нашем мозге — или в сконструированном по его подобию компьютере — эти уже опознанные черты порождают некий параметр порядка. Этот параметр порядка подчиняет себе другие возможные параметры порядка, соответствующие каким-то другим имеющимся в памяти лицам, в результате чего увиденный нами фрагмент однозначно сопоставляется с образом, соответствующим именно этому параметру порядка, и мы узнаем лицо знакомого нам человека.

Конечно, можно возразить, что создание ячеистой структуры в жидкости во много раз проще, нежели создание образа лица или каких-то других, еще более сложных картин. В этом и заключается суть сделанного нами поразительного открытия: процесс воссоздания образа абсолютно не зависит от сложности этого образа.

Иными словами, можно разработать систему (в чисто математической форме для начала), которая позволит реконструировать любой заданный образец исходя из каких-либо данных о его фрагменте.

17. Распознавание образов в синергетическом компьютере

создание образа распознавание образа

Как это принято в нашей книге, мы не будем останавливаться на аб-страктных принципах и излагать их на языке математики, а просто пока- ? ?????

¦ 1 ^^ '"«у* .— .III ... ^

элементы системы черты лица

Рис. 16.2. Аналогия между созданием образа и распознаванием образа. Слева — создание параметра порядка на основе элементов системы, находящихся в некотором упорядоченном состоянии (например, цилиндрических ячеек в жидкости, рис. 2.13), и последующее подчинение этому параметру порядка остальных элементов системы. Справа — распознавание образа (человеческого лица): создание параметра порядка на основе отдельных элементов (запомненных черт лица), и последующее подчинение этому параметру порядка остальных элементов распознаваемого изоб-ражения

жем, как эти принципы могут быть воплощены в жизнь и как при этом вновь и вновь возникает необходимость в привлечении синергетических концепций. Сначала опишем, какими видятся наши действия наблюдателю у экрана компьютерного монитора, а затем попытаемся проникнуть в задействованный «механизм» несколько глубже. Вскоре мы увидим, что слово «механизм» в данном случае можно использовать лишь условно, потому что хотя и мышление, и работа синергетического компьютера действительно представляют собой некие процессы, они все же очень отличаются от тех процессов, что происходят в обычных машинах, являясь, в сущности, типичными процессами самоорганизации. Более подробно мы поговорим об этом в последующих главах.

Рис. 17.1. Наложение на прототип растровой сетки. Фотография разделяется на клетки, называемые пикселями; в каждом пикселе определяется значение уровня серого

Итак, каковы же наши действия? Сначала делаются фотографические снимки нескольких лиц.

Для идентификации этих лиц каждая фотография помечается латинской буквой, выступающей в роли кодового обозначения. Разумеется, для кодовых обозначений можно взять и любые другие символы — например цифры. Затем на каждую фотографию накладывается растровая сетка, состоящая обычно из 60 строк и 60 столбцов (рис. 17.1) — в некоторых случаях, впрочем, эти значения могут быть и больше. Каждая ячейка этой сетки — так называемый пиксель — характеризуется определенным оттенком серого. Общая картина складывается, таким образом, из упорядоченного размещения всех этих пикселей, каждому из которых присвоено определенное значение, обозначающее соответствующий оттенок серого. Сама собой напрашивается аналогия с сетчаткой (для сравнения см. главу 10). Отдельные клетки сетчатки улавливают свет определенной ин-тенсивности. Состояние сетчатки в каждый момент времени описывается, следовательно, распределением световых точек различной интенсивности по всем фоторецепторным клеткам. Распределения значений оттенков серого, соответствующее разным лицам (рис. 17.2), определенным образом сохраняются в памяти компьютера. Сущность синергетического компьютера как раз и заключается в том, каким именно образом происходит сохранение этих данных и дальнейшее их использование для распознавания образов.

Опишем сначала задачу, поставленную перед компьютером. По предъявленному ему фрагменту одной из фотографий (например, фрагменту с глазами и носом), компьютеру предстоит не только успешно реконструировать все лицо, но и определить кодовую букву, которой обозначена фамилия изображенного на фотографии человека. Только при выполнении обоих требований лицо на фотографии может считаться опознанным. Такая задача оказывается компьютеру вполне по силам, о чем и свидетельствует ряд изображений на рис. 17.3 — последовательные этапы обработки компьюте-

Рис. 17.2. Примеры использованных нами в качестве прототипов лиц. Буквы служат для идентификации образов и в то же время выступают в роли кодового обозначения изображений

с А0 .

чяв • *

г -41 " '

Рис. 17.4. Если синергетичсскому компьютеру предъявлена только буква, служащая кодовым обозначением одного из сохраненных образов, то компьютеру удается воссоздать соответствующее лицо. При этом процесс распознавания, как и в предыдущем случае, проходит через стадию «размытости»

ром полученных данных. Изображения на рис. 17.4 отражают ход другого процесса: на этот раз компьютеру было предложено реконструировать лицо по известному — в данном случае буквенному — коду. Компьютер успешно справился и с этой задачей. Изображения, представленные на рис. 17.3

Рис. 17.3. Если синергетичсскому компьютеру предъявить фрагмент изображения лица (как на крайней левой картинке), то компьютер сможет воссоздать само лицо целиком и установить его кодовое обозначение. Изображения представляют собой снимки с монитора компьютера и иллюстрируют ход процесса распознавания. Интересно отметить, что на определенной стадии распознавания изображение лица выглядит «размытым»

и 17.4, сняты с монитора компьютера; по этим изображениям, представлен-ным в виде временных рядов, можно проследить ход всего эксперимента. Изображения эти «обсчитаны» нами на обыкновенном, последовательном, компьютере, который, впрочем, способен лишь моделировать то, что происходит при распознавании образов в синергетическом смысле. На таком компьютере можно просчитать и неоднократно упоминавшиеся в этой книге процессы образования ячеек в нагреваемой снизу жидкости (рис. 2.13), несмотря на то, что нам известно, что все ячейки образуются одновременно в результате самоорганизации. То же относится и к процессу распознавания образов: принцип параллельной одновременной обработки всех точек изображения помогает нам лучше понять концепцию, лежащую в основе синергетического компьютера. Упомянутое параллельное — т. е. одновременное во всех точках изображения (или пикселях) — изменение оттенка серого отчетливо видно на рис. 17.3. Как же происходит такая обработка?

<< | >>
Источник: Хакен Г., Хакен-Крелль М.. Тайны восприятия. — Москва: Институт компьютерных исследований, 2002, 272 стр.. 2002

Еще по теме 16. Синергетика и распознавание образов:

  1. Оглавление
  2. 1. Дух и материя
  3. 15. Что происходит после гиперкомплексных клеток?
  4. 16. Синергетика и распознавание образов
  5. 20. Еще одна сетевая реализация синергетического компьютера: «бабушкины клетки»
  6. 34. Восприятие есть создание реальности
  7. Список литературы и примечания
  8. Предметный указател