Машинное обучение в Avito.Контекст - Андрей Остапец (Avito)

15
1 Strictly Confidential 1 Strictly Confidential 1 Машинное обучение в Авито.Контекст Андрей Остапец Старший аналитик

Transcript of Машинное обучение в Avito.Контекст - Андрей Остапец (Avito)

Page 1: Машинное обучение в Avito.Контекст - Андрей Остапец (Avito)

1Strictly Confidential 1Strictly Confidential 1

Машинное обучение в Авито.Контекст

Андрей Остапец

Старший аналитик

Page 2: Машинное обучение в Avito.Контекст - Андрей Остапец (Avito)

2Strictly Confidential 2Strictly Confidential 2

Зачем нужно машинное обучение в

Авито.Контекст?

Какая сейчас инфраструктура для обучения

моделей?

Что планируется в ближайшем будущем?

Page 3: Машинное обучение в Avito.Контекст - Андрей Остапец (Avito)

3Strictly Confidential 3Strictly Confidential 3

• На Авито есть реклама…

• Списываем деньги только в случае «чистого» клика по рекламному объявлению

• Нужно показывать только релевантные объявления

Реклама

Предсказание вероятности клика на конкретное объявление — ключевой ингредиент успеха!

Page 4: Машинное обучение в Avito.Контекст - Андрей Остапец (Avito)

4Strictly Confidential 4Strictly Confidential 4

Аукцион

Advert_id Bid CTR Bid * CTR Place

1 10 0.5 5 3-rd

2 8 0.8 6.4 1-st

3 8 0.7 5.6 2-nd

Page 5: Машинное обучение в Avito.Контекст - Андрей Остапец (Avito)

5Strictly Confidential 5Strictly Confidential 5

● Не менее 100,000 аукционов в минуту

● Во время проведения каждого аукциона предсказываются

вероятности для 10,000 объявлений

● Не более 100 миллисекунд на ответ для одного аукциона

Технические ограничения

Page 6: Машинное обучение в Avito.Контекст - Андрей Остапец (Avito)

6Strictly Confidential 6Strictly Confidential 6

● 50,000,000 обучающих примеров

● Миллионы признаков

● Способность переобучать модель несколько раз в сутки

● Возможность поддерживать несколько моделей

Особенности обучения

Page 7: Машинное обучение в Avito.Контекст - Андрей Остапец (Avito)

7Strictly Confidential 7Strictly Confidential 7

Выбор модели

Оптимизируем другие метрики!

AUC

LogLoss

CPM

CPC

CTRrCPM

Amnesty

Fill Rate

Long Clicks

Page 8: Машинное обучение в Avito.Контекст - Андрей Остапец (Avito)

8Strictly Confidential 8Strictly Confidential 8

● Логистическая регрессия:

● Feature hashing

● The FTRL-Proximal Online Learning Algorithm: улучшенная версия метода

стохастического градиента.

● Онлайн-алгоритм — простой и масштабируемый

The FTRL-Proximal Online Learning Algorithm

Page 9: Машинное обучение в Avito.Контекст - Андрей Остапец (Avito)

9Strictly Confidential 9Strictly Confidential 9

Можно ли обойтись без машинного обучения?

Page 10: Машинное обучение в Avito.Контекст - Андрей Остапец (Avito)

10Strictly Confidential 10Strictly Confidential 10

Инфраструктура обучения моделей

Page 11: Машинное обучение в Avito.Контекст - Андрей Остапец (Avito)

11Strictly Confidential 11Strictly Confidential 11

Фокус на мобильные устройства

Page 12: Машинное обучение в Avito.Контекст - Андрей Остапец (Avito)

12Strictly Confidential 12Strictly Confidential 12

Page 13: Машинное обучение в Avito.Контекст - Андрей Остапец (Avito)

13Strictly Confidential 13Strictly Confidential 13

Page 14: Машинное обучение в Avito.Контекст - Андрей Остапец (Avito)

14Strictly Confidential 14Strictly Confidential 14

Page 15: Машинное обучение в Avito.Контекст - Андрей Остапец (Avito)

15Strictly Confidential 15Strictly Confidential 15

Спасибо за внимание!