DRIVER TELEMATICS ANALYSIS
Use telematic data to identify a driver signature
Що таке driver telematics?
В автомобіль поміщаєтьсяспеціальний прилад
Пристрій визначає наскількибезпечно водій водить і надсилає дані
страховій компанії
•Хороші водії економлять гроші на страхуванні•Погані водії не економлять•Страхова компанія ризикує менше•….•Profit!!!
Проблема aka “Постановка задачі”
Навіщо платити за пристрій. Чи не можна використати GPS який є в абсолютної більшості водіїв
DRIVER FINGERPRINT
Дані
2736 водіїв для кожного дані 200-ста
подорожей (щосекундні зрізи позиції)
з цих 200 подорожей певна кількість не належать відповідному водію
GOAL: визначити ймовірність належності
кожної подорожі до відповідного їй водія
Supervised підхід
Поїздки водія що нас цікавить
Випадкові поїздки інших водіїв
Мітка: 1 Мітка: 0
Кілька простих ознак + SVM
~54 – 62 %
Unsupervised підхід
Anomaly/Outlier detection: GMM + EM
~71%
Supervised again
Gradient boosted regression trees
менш чутливі до outlier в вибірці більш ефективні до
незбалансованих класів
Нові ознаки:• розподіл швидкості• розподіл прискорення/гальмування по швидкостях• розподіл відцентрового прискорення• час зупинок
Виклики та невдачі
Локальна оцінка результатів
Kalman filter лише погіршив
результати
Principal component analysis ~
Висновки
~77%• загрався з алгоритмами замість
того щоб досліджувати і писати більш індикативні ознаки
• AXA надала не дуже якісні дані
• брак досвіду та часу
Дякую за увагу!
Top Related