Построение гендерного классификатора

31
Построение гендерного классификатора Результаты экспериментов и пути дальнейшего улучшения алгоритма Лев Шмаглит Ярославский государственный университет им. П.Г. Демидова 150000, г. Ярославль, ул. Советская, 14 Физический факультет Кафедра динамики электронных систем

Transcript of Построение гендерного классификатора

Page 1: Построение гендерного классификатора

Построение гендерного классификатора

Результаты экспериментов и пути дальнейшего улучшения алгоритма

Лев Шмаглит

Ярославский государственный университет им. П.Г. Демидова150000, г. Ярославль, ул. Советская, 14

Физический факультетКафедра динамики электронных систем

Page 2: Построение гендерного классификатора

2

План доклада:

1. Задача понимания изображений. Вводные замечания.

2. Построение гендерного классификатора. Результаты экспериментов.

3. Обзор современных подходов, позволяющих увеличить вероятность распознавания.

Page 3: Построение гендерного классификатора

3

Понимание изображений

Небо

Дорога

Знак

МашинаМашина

Машина

Машина

Машина

Машина

Здание

[Ivan Laptev. Human Action Recognition // MCVS 2011]

Page 4: Построение гендерного классификатора

4

Понимание изображений

[Andrew Zisserman. Visual Search and Recognition // MCVS 2011]

Набор классов

Детектирование

Автобус

Машина

РаспознаваниеКлассификация

Page 5: Построение гендерного классификатора

5

Детектирование• Сканирование

пирамиды масштабированных изображений окном

K

K

K

«не лицо»

«лицо»• Принятие решения

для каждого окна - классификация

Page 6: Построение гендерного классификатора

6

Классификация

Входной фрагмент

XКлассификатор

),,,,( 21 mXf

Скалярное число

Сравнение с порогом

Решение

Обучающий набор

iXОПТИМИЗАЦИЯ

;,,,, 21 miXE

Вектор данных

Машинное обучение

Page 7: Построение гендерного классификатора

7

Понимание изображений(компьютерное зрение)

Детектирование + Распознавание

Классификация(машинное обучение)

Оптимизация

Page 8: Построение гендерного классификатора

8

Сколько пикселей относится к «людям»?

[Ivan Laptev. Human Action Recognition // MCVS 2011]

Page 9: Построение гендерного классификатора

9

Сколько пикселей относится к «людям»?

[Ivan Laptev. Human Action Recognition // MCVS 2011]

Page 10: Построение гендерного классификатора

10

Сколько пикселей относится к «людям»?

[Ivan Laptev. Human Action Recognition // MCVS 2011]

Page 11: Построение гендерного классификатора

11

План доклада:

1. Задача понимания изображений. Вводные замечания.

2. Построение гендерного классификатора. Результаты экспериментов.

3. Обзор современных подходов, позволяющих увеличить вероятность распознавания.

Page 12: Построение гендерного классификатора

12

Постановка задачи

Исходное изображение

Изображение с выделенными лицами

Распознавание пола

мм

мжж

Применение:• системы видеонаблюдения• Digital Signage

Page 13: Построение гендерного классификатора

13

Пример работы алгоритма

Page 14: Построение гендерного классификатора

14

Схема работы алгоритма

Выделение лиц Алгоритм на базе обучающей процедуры

Sparse Network of Winnows

Входное изображение

Решение

Масштабирование выделенных фрагментов

Линейный классификатор:Линейный дискриминантный анализ (LDA);

Метод опорных векторов (SVM)

Преобразование с помощью ядерной функции

Выравнивание гистограммы яркости

Page 15: Построение гендерного классификатора

15

Алгоритм на базе SNoW

Вычисление SMQT признаков

001010010

Представление в виде вектора

82

Пересчет в виде

индекса

Wx

facex

Wx

nonfacex xMhxMh

Классификатор

Wx

ifacex xMhЕсли ))(( ))(())(( xMhxMh i

facexi

facex

))(())(( xMhxMh ifacexi

facex

Wxi

facex xMhЕсли ))((

Процедура обновления весов

Page 16: Построение гендерного классификатора

16

Классификаторы KDDA и SVMЛинейные классификаторы с использованием ядра

для внесения нелинейности:

ядерная функция Гаусса

KDDA SVM

ASAASA

ASAA

WTHT

BTWT

BTWT

A maxarg

m

iiii bXXkyXf

1

),(sgn)(

2

2

2121 exp),(

zz

zzk

Page 17: Построение гендерного классификатора

17

Методика обучения и тестирования

Выделение лиц (98,2%)Nilsson M., Nordberg J., Claesson I. Face Detection Using Local SMQT Features and Split Up

SNoW Classifier // Proceedings of IEEE Int. Conf. ICASSP, V. 2, P. 589-592, 2007

База изображений (2770 шт.)

Анализ работы алгоритмов

Удаление ложно выделенных фрагментовФормирование обучающей и тестовой баз выделенных фрагментов

Классификатор KDDA(81,5%)

Оптимизация параметров ядра с использованием кросвалидации и поиска по сетке

Классификатор SVM(89%)

ПредобработкаМасштабирование до разрешения 40 × 40 пикселей

Выравнивание гистограммы яркости

Обучающая база (300 шт.)

Тестовая база (100 шт.)

Page 18: Построение гендерного классификатора

18

База обучающих изображений

• 2770 изображений• фронтальные лица• равномерное освещение • однородный фон

Мужчины Женщины Дети

Page 19: Построение гендерного классификатора

19

Результаты экспериментов

Классификатор

KDDA

81,5%

Классификатор

SVM

89%

Page 20: Построение гендерного классификатора

20

План доклада:

1. Задача понимания изображений. Вводные замечания.

2. Построение гендерного классификатора. Результаты экспериментов.

3. Обзор современных подходов, позволяющих увеличить вероятность распознавания.

Page 21: Построение гендерного классификатора

21

Подходы связанные с модификацией схемы алгоритма

Выделение лиц Алгоритм на базе обучающей процедуры

Sparse Network of Winnows

Входное изображение

Решение

Масштабирование выделенных фрагментов

Линейный классификатор:Линейный дискриминантный анализ (LDA);

Метод опорных векторов (SVM)

Преобразование с помощью ядерной функции

Выравнивание гистограммы яркости

1. Уточнение области лица после его выделения

Выделенная область квадратная, она наложена на лицо не точно, как по положению, так и по масштабу

Реализация: а) оценка положения глаз б) выделение овальной маской, захватывающей определенный процент лицевых пикселей, классифицированных до этого по цвету; в) фильтрация краевых эффектов.

Потенциальный выигрыш: 3 - 5 %

Page 22: Построение гендерного классификатора

22

Подходы связанные с модификацией схемы алгоритма

Выделение лиц Алгоритм на базе обучающей процедуры

Sparse Network of Winnows

Входное изображение

Решение

Масштабирование выделенных фрагментов

Линейный классификатор:Линейный дискриминантный анализ (LDA);

Метод опорных векторов (SVM)

Преобразование с помощью ядерной функции

Выравнивание гистограммы яркости

2. Использование информации из областей рядом с лицом

Лица могут быть очень похожи, в то время как другие части тела и одежда могут сильно отличаться

Реализация: эмпирическое задание рамки, захватывающей нужные области, исходя из размера и положения детектированного лица

Потенциальный выигрыш: 5 - 10%

Page 23: Построение гендерного классификатора

23

Подходы связанные с модификацией схемы алгоритма

Выделение лиц Алгоритм на базе обучающей процедуры

Sparse Network of Winnows

Входное изображение

Решение

Масштабирование выделенных фрагментов

Линейный классификатор:Линейный дискриминантный анализ (LDA);

Метод опорных векторов (SVM)

Преобразование с помощью ядерной функции

Выравнивание гистограммы яркости

3. Переход в пространство признаков

Переход в пространство признаков позволяет достичь:

а) инвариантности к масштабу, освещенности, положению и т.п.;

б) выделения особенностей, характерных тому или иному классу.

Реализация: дескрипторы SIFT, PHOW, HOG, реализованные в библиотеках VL-Feet и OpenCV

Потенциальный выигрыш: 5 - 15%

Page 24: Построение гендерного классификатора

24

SIFT дескрипторы

[Andrew Zisserman. Visual Search and Recognition // MCVS 2011]

Вектор SIFT размерностью 128 Визуальное слово

Построение гистограммы визуальных слов

Page 25: Построение гендерного классификатора

25

HOG дескрипторы

[Andrew Zisserman. Visual Search and Recognition // MCVS 2011]

• Разбиение изображения на блоки• Вычисление гистограммы

градиентов

Page 26: Построение гендерного классификатора

26

Подходы связанные с модификацией схемы алгоритма

Выделение лиц Алгоритм на базе обучающей процедуры

Sparse Network of Winnows

Входное изображение

Решение

Масштабирование выделенных фрагментов

Линейный классификатор:Линейный дискриминантный анализ (LDA);

Метод опорных векторов (SVM)

Преобразование с помощью ядерной функции

Выравнивание гистограммы яркости

4. Использование всех трех цветовых компонент

Три – лучше, чем одна

Реализация: а) переход в пространство HSV б) вычисление признаков независимо для каждой из компонент

Потенциальный выигрыш: 1 - 5%

Page 27: Построение гендерного классификатора

27

Подходы связанные с модификацией схемы алгоритма

Выделение лиц Алгоритм на базе обучающей процедуры

Sparse Network of Winnows

Входное изображение

Решение

Масштабирование выделенных фрагментов

Линейный классификатор:Линейный дискриминантный анализ (LDA);

Метод опорных векторов (SVM)

Преобразование с помощью ядерной функции

Выравнивание гистограммы яркости

5. Усложнение ядра

Никогда заранее не известно, какое ядро будет лучше работать при конкретной задаче (полиномиальное, RBF, хи-квадрат и т.д.)

Кроме того, произведение (сложение) нескольких ядер, существенно увеличивает силу классификатора.

Реализация: SVM библиотеки: libSVM, SVMlight и т.д.

Потенциальный выигрыш: 5 - 10%

Page 28: Построение гендерного классификатора

28

Выделение лиц (98,2%)Nilsson M., Nordberg J., Claesson I. Face Detection Using Local SMQT Features and Split Up

SNoW Classifier // Proceedings of IEEE Int. Conf. ICASSP, V. 2, P. 589-592, 2007

База изображений (2770 шт.)

Анализ работы алгоритмов

Удаление ложно выделенных фрагментовФормирование обучающей и тестовой баз выделенных фрагментов

Классификатор KDDA(81,5%)

Оптимизация параметров ядра с использованием кросвалидации и поиска по сетке

Классификатор SVM(89%)

ПредобработкаМасштабирование до разрешения 40 × 40 пикселей

Выравнивание гистограммы яркости

Обучающая база (300 шт.)

Тестовая база (100 шт.)

Подходы связанные с модификацией схемы обучения

1. Увеличение обучающей базы

Обучающих изображений всегда не хватает

Реализация: а) поиск новых изображений б) размножение изображений путем применения ротации, аффинного преобразования, изменения яркости / контраста

Потенциальный выигрыш: 100%

Page 29: Построение гендерного классификатора

29

Выделение лиц (98,2%)Nilsson M., Nordberg J., Claesson I. Face Detection Using Local SMQT Features and Split Up

SNoW Classifier // Proceedings of IEEE Int. Conf. ICASSP, V. 2, P. 589-592, 2007

База изображений (2770 шт.)

Анализ работы алгоритмов

Удаление ложно выделенных фрагментовФормирование обучающей и тестовой баз выделенных фрагментов

Классификатор KDDA(81,5%)

Оптимизация параметров ядра с использованием кросвалидации и поиска по сетке

Классификатор SVM(89%)

ПредобработкаМасштабирование до разрешения 40 × 40 пикселей

Выравнивание гистограммы яркости

Обучающая база (300 шт.)

Тестовая база (100 шт.)

Подходы связанные с модификацией схемы обучения

2. Усложнение алгоритма оптимизации параметров ядра

Оптимизация ядра необходима, чтобы избежать переобучения и достигнуть наилучшей обобщающей способности

Реализация: а) кроссвалидация б) алгоритмы оптимизации (GA)

Потенциальный выигрыш: 1 - 10%

Page 30: Построение гендерного классификатора

30

Выделение лиц (98,2%)Nilsson M., Nordberg J., Claesson I. Face Detection Using Local SMQT Features and Split Up

SNoW Classifier // Proceedings of IEEE Int. Conf. ICASSP, V. 2, P. 589-592, 2007

База изображений (2770 шт.)

Анализ работы алгоритмов

Удаление ложно выделенных фрагментовФормирование обучающей и тестовой баз выделенных фрагментов

Классификатор KDDA(81,5%)

Оптимизация параметров ядра с использованием кросвалидации и поиска по сетке

Классификатор SVM(89%)

ПредобработкаМасштабирование до разрешения 40 × 40 пикселей

Выравнивание гистограммы яркости

Обучающая база (300 шт.)

Тестовая база (100 шт.)

Подходы связанные с модификацией схемы обучения

3. Применение древовидной (каскадной) структуры

Объединение решений нескольких классификаторов всегда дает преимущество в итоговой вероятности распознавания

Следующий слой классификатора можно обучать на ошибках предыдущего

Реализация: а) каскадная структура б) дерево (решающий лес)

Потенциальный выигрыш: 5 - 10%

Page 31: Построение гендерного классификатора

Построение гендерного классификатора

Результаты экспериментов и пути дальнейшего улучшения алгоритма

Лев Шмаглит

Ярославский государственный университет им. П.Г. Демидова150000, г. Ярославль, ул. Советская, 14

Физический факультетКафедра динамики электронных систем