как работают яндекс.пробки
Transcript of как работают яндекс.пробки
Леонид Медников Аналитик сервиса Яндекс.Пробки
Яндекс.Пробки и статистика
О чём?
• Как работают Яндекс.Пробки
• Как сделать лучше
• Статистика
Принцип работы Яндекс.Пробок
55.749071 37.634781
Принцип работы Яндекс.Пробок
55.749071 37.634781
Посмотрим подробнее
• Где ехала машина? • Машина ли? J • Как ехали другие? • Что же здесь на самом деле? • И всё это в реальном времени на потоке от сотен тысяч машин
Схема работы Яндекс.Пробок
Посчитаем ручные затраты
Только в Москве длина дорог >4000 км Если закрашивать грубо, участками длиной 1 км И тратить на изучение ситуации и изменение статуса участка
10 секунд
На обновление всей карты потребуется
40 000 секунд т.е. >10 час
Чтобы обновлять карту каждые 4 минут нужно
> 150 человек
Как сделать лучше?
• Где ехала машина? • Машина ли? • Что же здесь на самом деле? • Ваши идеи…
Как проверить, что стало лучше?
Чтобы проверить, что стало лучше, нужно научиться измерять это «лучше». Как измерить качество пробок? Нужно сравниться с действительностью.
Сравниваем с действительностью
• Где ехала машина? • Машина ли? • Что же здесь на самом деле? • Метрика качества – посчитаем…
Уверены, что лучше?
Новый алгоритм 1 Число раз % от всех
Лучше 54 81% Хуже 13 19%
Новый алгоритм 2 Число раз % от всех
Лучше 5 83% Хуже 1 17%
Статистика
Случайные значения
Поиграем…
Статистика. Бросили монетку 3 раза. I II III Σ
0 0 0 0
0 0 1 1
0 1 0 1
0 1 1 2
1 0 0 1
1 0 1 2
1 1 0 2
1 1 1 3
Суммарно выпало раз Вероятность
0 1 0,125
1 3 0,375
2 3 0,375
3 1 0,125
Сумма 8 1
Формула для суммы 2N Всегда 1
N – число бросков, ���в нашем случае 3
Статистика. Случайные значения Пример. Сколько раз выпал «орёл» при N-кратном броске монеты. Любая комбинация равновероятна, всего 2N различных комбинаций, а значит вероятность любой комбинации 1 раз на 2N случаев. Получить в сумме 0 можно только одним способом. Получить в сумме 1 можно N способами. Получить в сумме k можно CN
k способами
Статистика
• Случайные значения • Среднее и наблюдаемое среднее
Посмотрим…
Статистика. Вероятность отклонения
Чтобы оценить, насколько вероятно такое отклонение, нужно посчитать сумму всех вероятностей в «хвосте». Например, здесь нужно посчитать сумму вероятностей выпадения 0, 1, 2, 3 раза.
Уверены, что лучше?
Новый алгоритм 1 Число раз % от всех
Лучше 54 81% Хуже 13 19%
Новый алгоритм 2 Число раз % от всех
Лучше 5 83% Хуже 1 17%
Статистика
• Случайные значения • Среднее и наблюдаемое среднее • Правильная (репрезентативная) выборка • Причинно-следственные связи
Итого
• Как работают Яндекс.Пробки GPS данные от водителей + алгоритмы
• Как сделать лучше Измеряем качество, сравнивая с действительностью
• Статистика Чем меньше измерений, тем больше случайная ошибка