Главная страница | План занятий семинара |
|
|
Занятие 3.
Распознавание образов: проблема, различные подходы и модели.
Основные источники:
Задачи:
Строение зрительной системы животных. Персептрон.
Зрение ориентировано на конкретные задачи. Основные задачи для живого
организма — найти пищу и избежать врага. Пример: лягушки и пауки видят
только движущиеся предметы. Животные не реагируют на свое изображение в
зеркале.
Предварительная обработка изображения. Сначала в мозг попадает только
грубая картина, содержащая только самую важную информацию, затем — более
точная. Если мозг оценивает ситуацию как опасную, или просто заинтересуется
чем-то в области видимости, то фокус внимания (центр зрачка) переводится
в эту «интересную» область на изображении. Фовеальное (боковое) зрение.
В состоянии стресса (пожар) человек «видит» только то, что важно для
решения задачи.
Сравнение с эталоном.
Проблема — большое количество эталонов, которые надо хранить, и медленная
процедура поиска. Кроме того, невозможно учесть различие в положении, ориентации,
размерах или расстояния до объекта, а также модификации формы объекта (человек
стоит, сидит, бежит, и т.д.).
Признаки.
Основные методы в машинном зрении основаны на использовании признаков
для обнаружения и опознания объектов. Для описания объектов используется
набор признаков (x1, x2, …, xN). N — размерность пространства признаков.
Признаком может служить, например: цвет, яркость, положение в пространстве,
ориентация.
Кластер-анализ.
Кластер-анализ — автоматическое распределение множества объектов (-образцов)
на классы. Классы определяются как компактные множества («облака») в пространстве
признаков: два объекта относятся к одному и тому же классу, если представляющие
их точки в пространстве признаков находятся рядом (в одном облаке).
Кластер-анализ применяется не только в ИИ и не только для машинного
зрения. Это универсальные алгоритмы, широко используемые для статистической
обработки данных. В том числе и в ситуациях, когда «правильная» классификация
объектов неизвестна.
Цель — классификация образов (отнести образ к определенному классу).
Основные подходы в кластер-анализе:
Модели.
Строится модель (=схема) объекта, описывающая основные составные части
и соотношения признаков — вне зависимости от размеров, ориентации и конфигурации
объекта.
Пример: нет «треугольника вообще» (каждый треугольник либо прямоугольный,
либо остроугольный, либо тупоугольный), «человека вообще» (мужчина/женщина,
старик/ребенок и т.п.)
Стратегия распознавания: строится гипотеза («Это дом»), которая затем
проверяется на соответствие модели («крыша, стена, дверь, окна»).
Сценарий — последовательность сцен. Для описания действий необходимы глаголы, возникают причинно-следственные связи. Необходимо оценивать роли объектов в ситуации, предсказывать дальнейшее развитие событий. «Эмоциональная оценка» ситуации («нейтрально», «угроза», «еда»).
Основная фундаментальная проблема —невозможность распознавания в отрыве от цели/задачи/контекста. В широком смысле описание сценария невозможно без «базы знаний». Т.е. опять упираемся в проблему представления и обработки знаний.