<<
>>

24. Плоские трансформацииизображений — альтернативное решение

Идея, лежащая в основе этого альтернативного решения, в сущности, чрезвычайно проста. Нужно создать в дополнение к той холмистой местности, которую мы строили в главе 19, еще одну подобную местность, форма которой отражала бы только различные смещения заданного образа относительно запомненного.

Мяч скатится в какую-нибудь долину, и по его положению отыщется «правильная» окрестность нуля и, соответственно, определится нужное смещение из запомненных, соответствующее смещению предложенного образа. Далее в дело вступает первоначальный ландшафт и помогает найти среди запомненных образов самый близкий к предъявленному с учетом уже известного смещения. То же самое относится и к поворотам образов, только шаг угла поворота не должен быть слишком велик во избежание возникновения нежелательных боковых долин (см. рис. 24.1). В остальном же этот способ функционирует очень хорошо, причем его можно еще усовершенствовать и тем самым совершенно исключить возникновение боковых долин. Холмистая местность при этом разглаживается, скрывая мелкие неровности и отчетливее выделяя большие перепады яркости. Больших же перепадов яркости можно добиться, как мы уже видели, с помощью низкочастотной фильтрации. Иными словами, «сглаживание» изображения приводит в действительности к сглаживанию потенциальной кривой, как это показано на рис. 24.2.

С помощью такой холмистой местности компьютер сможет также распознавать вытянутые в различных направлениях изображения (рис. 24.3). Возможно, не будет большим заблуждением предположить, что и в нашем мозге функционирует подобный механизм, постоянно стремящийся посредством изменения синаптических сил привести предлагаемые ему образы в соответствие с запомненными прототипами. Здесь, по всей видимости, мы

V 0,25

0,00 -0,25 0,75 1,00 1,25 1,50 ЭК

-2,0 -1,0 0,0 1,0 2,0 <р

V :0,25:

0,00;

-0,251

-2,0 -1,0 0,0 1,0 2,0

0,75 1,00 1,25 1,50 ЭК

''г,-*1.

! V ;0,25(

I

0,00: -0,25:

V 0,25

0,00 -0,25

. Л > V

-2,0 -1,0 0,0 1,0 2,0

0,75 1,00 1,25 1,50 ЭК

V 0,25

0,00 -0,25 -2,0 -1,0 0,0 1,0 2,0

0,75 1,00 1,25 1,50 ък Рис. 24.1. Прсдставлснный здесь ряд изображений лиц был предложен компьюте-ру в повернутом виде. Левый столбец: зависимости формы холмистого ландшафта от угла поворота изображения. Помимо главного минимума в середине, здесь име-ются и нежелательные боковые минимумы. Правый столбец: зависимости формы холмистого ландшафта от изменения масштаба изображения

Г»

-2,0 -1,0 ЭД) 1,0 2Д)

V; -ОД!1 -о^о: 0.75

л

-2.С -1,0 0,0 ЦО 2,0

2,0 1,0 0,0 1,0 2,0 „ -2,0 -1,0 0.0 1,0 2,0

-2А -1,0 0^) 1,0 2,0

\

\ У'г-ч

•V

к 2Л 1,0 0,0 1.0 2Л „

Рис. 24.2. Сглаживание холмистого ландшафта посредством «смазывания» изображения. Слева внизу: исходное изображение (Астсрикс); справа внизу: холмистый ландшафт, соответствующий этому изображению. Вверху: зависимости формы холмистого ландшафта от угла поворота изображения

Рис. 24.3. Деформированные изображения лица, которые компьютер без труда распознает

имеем дело е совершенно новой точкой зрения, прежде в литературе не обсуждавшейся. Упомянутое приведение в соответствие требует непрерывного динамического изменения сил синаптических связей. До сих пор предполагалось, что синаптические связи формируются исключительно в процессе обучения. Теперь же обнаруживается, что синаптические связи могут — и даже должны — подчиняться, помимо всего прочего, некой собственной динамике. Возможно, данное обстоятельство послужит начальным толчком к проведению экспериментов непосредственно на нейронах. Все эти моменты требуют, безусловно, дальнейшего всестороннего осмысления и обобщения — следует, к примеру, учитывать, что деформация изображения вовсе не обязана быть одинаковой вдоль всех направлений плоскости этого самого изображения.

Можно подумать и о возможности локальных искажений — таких, например, какие возникнут, если лицо нарисовать на резиновом коврике, а затем растягивать этот коврик в определенных участках. Учитывая, что зоны искажений на человеческом лице ограничены (они почти не затрагивают, например, лоб и нос, которые остаются относительно неподвижными по сравнению с тем, как изменяются глаза и рот), можно легко предположить в данном случае возможность компьютерного распознавания таких искаженных лиц (находящихся, например, в группе оживленно беседующих людей, либо просто демонстрирующих какие-либо эмоциональные состояния). Исследования вышеупомянутых проблем еще весьма далеки от завершения.

Только рассматривая этот альтернативный способ инвариантного распознавания образов, мы начинаем осознавать, что в основе восприятия лежит целый ряд динамических процессов непрерывного формирования синаптических связей. Эта картина полностью противоположна той, что обычно ассоциируется с восприятием. Мы наивно полагали, что мозг подобен фотопластинке, которая просто сохраняет сообщенные ей визуальные впечатления. Теперь мы знаем, что распознавание образов обеспечивается взаимодействием множества протекающих в мозге сложнейших процессов. Наш метод можно интерпретировать и так: показанный тестовый образ «подгоняется» мозгом под один из уже имеющихся у него запомненных образов. Так работает известная нам из психологии ассимиляция. И наоборот — что особенно интересно — математический формализм позволяет нам произвести совершенно иную интерпретацию: сохраненный образ может с таким же успехом и сам оказаться «подогнанным» под предложенный тестовый образ. Этот процесс психологи называют адаптацией.

Для синергетического компьютера оба эти процесса, по большей части, эквивалентны, и поэтому один из них может быть заменен другим без какого-либо ущерба. Для людей это, судя по всему, не всегда так, однако какой-либо информацией о подобных исследованиях мы не располагаем. Мы не думаем, что будущее решение проблемы восприятия состоит в конструировании каких-либо статических фильтров или шаблонов для компьютера — так же сложно представить себе создание чего-либо подобного и для мозга. Гораздо более разумным будет примириться с мыслью о том, что в мозге при восприятии протекают высоко сложные и взаимосвязанные процессы — это подтверждается и многочисленными экспериментальными данными, и результатами компьютерных исследований, которые мы еще будем обсуждать в дальнейшем.

<< | >>
Источник: Хакен Г., Хакен-Крелль М.. Тайны восприятия. — Москва: Институт компьютерных исследований, 2002, 272 стр.. 2002

Еще по теме 24. Плоские трансформацииизображений — альтернативное решение:

  1. 24. Плоские трансформацииизображений — альтернативное решение