Главная страница План занятий семинара
Пред. занятие
 След. занятие

Занятие 3.
Распознавание образов: проблема, различные подходы и модели.

Основные источники:

План доклада.
  1. Основные проблемы.
  2. Зрение.
    1. Предварительная обработка изображений.
    2. Распознавание объектов.
    3. Распознавание сцен и сценариев.
    4. Физиология и психология.
1. Основные проблемы.


Задачи:


2. Зрение

Строение зрительной системы животных. Персептрон.

Зрение ориентировано на конкретные задачи. Основные задачи для живого организма — найти пищу и избежать врага. Пример: лягушки и пауки видят только движущиеся предметы. Животные не реагируют на свое изображение в зеркале.
Предварительная обработка изображения. Сначала в мозг попадает только грубая картина, содержащая только самую важную информацию, затем — более точная. Если мозг оценивает ситуацию как опасную, или просто заинтересуется чем-то в области видимости, то фокус внимания (центр зрачка) переводится в эту «интересную» область на изображении. Фовеальное (боковое) зрение.
В состоянии стресса (пожар) человек «видит» только то, что важно для решения задачи.

2a Предварительная обработка изображения в компьютере.

Выделение простых признаков и полей признаков. Прямые линии, углы, однородные области.

2b Распознавание объектов.

Сравнение с эталоном.
Проблема — большое количество эталонов, которые надо хранить, и медленная процедура поиска. Кроме того, невозможно учесть различие в положении, ориентации, размерах или расстояния до объекта, а также модификации формы объекта (человек стоит, сидит, бежит, и т.д.).

Признаки.
Основные методы в машинном зрении основаны на использовании признаков для обнаружения и опознания объектов. Для описания объектов используется набор признаков (x1, x2, …, xN). N — размерность пространства признаков. Признаком может служить, например: цвет, яркость, положение в пространстве, ориентация.

Кластер-анализ.
Кластер-анализ — автоматическое распределение множества объектов (-образцов) на классы. Классы определяются как компактные множества («облака») в пространстве признаков: два объекта относятся к одному и тому же классу, если представляющие их точки в пространстве признаков находятся рядом (в одном облаке).
Кластер-анализ применяется не только в ИИ и не только для машинного зрения. Это универсальные алгоритмы, широко используемые для статистической обработки данных. В том числе и в ситуациях, когда «правильная» классификация объектов неизвестна.

Цель — классификация образов (отнести образ к определенному классу).
Основные подходы в кластер-анализе:

Типы алгоритмов: Основная проблема кластер-анализа: трудно выделить информативные признаки. Не по любому набору признаков можно правильно классифицировать объекты.

Модели.
Строится модель (=схема) объекта, описывающая основные составные части и соотношения признаков — вне зависимости от размеров, ориентации и конфигурации объекта.
Пример: нет «треугольника вообще» (каждый треугольник либо прямоугольный, либо остроугольный, либо тупоугольный), «человека вообще» (мужчина/женщина, старик/ребенок и т.п.)
Стратегия распознавания: строится гипотеза («Это дом»), которая затем проверяется на соответствие модели («крыша, стена, дверь, окна»).

2c Распознавание сцен и сценариев.

Более сложная задача (и, на самом деле, более актуальная для ИИ — «анализ ситуации и принятие решения») — распознавание сцен (совокупность объектов, и взаимное расположение).
Проблемы: частично закрытые объекты.
Для описания сцен необходимы новые «понятия» — предлоги.

Сценарий — последовательность сцен. Для описания действий необходимы глаголы, возникают причинно-следственные связи. Необходимо оценивать роли объектов в ситуации, предсказывать дальнейшее развитие событий. «Эмоциональная оценка» ситуации («нейтрально», «угроза», «еда»).

Основная фундаментальная проблема —невозможность распознавания в отрыве от цели/задачи/контекста. В широком смысле описание сценария невозможно без «базы знаний». Т.е. опять упираемся в проблему представления и обработки знаний.

2d Физиология и психология.

Различные стратегии мозга при анализе зрительной информации.
Правое полушарие — образное, конкретное мышление, на основе накопления признаков.
Левое полушарие — логическое, структурное мышление, на основе модели (схемы) объекта.
 
Сайт создан в системе uCoz