Anomáliadetektálás R-ben

15
Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Anomáliadetektálás R-rel Salánki Ágnes 2014.01.15.

Transcript of Anomáliadetektálás R-ben

Page 1: Anomáliadetektálás R-ben

Budapesti Műszaki és Gazdaságtudományi EgyetemMéréstechnika és Információs Rendszerek Tanszék

Anomáliadetektálás R-rel

Salánki Ágnes

2014.01.15.

Page 2: Anomáliadetektálás R-ben

Egy motiváció (1949)

Forrás: http://www.siam.org/meetings/sdm10/tutorial3.pdf

Hadlum vs. Hadlum

Page 3: Anomáliadetektálás R-ben

Egy motiváció (1949)

Forrás: http://www.siam.org/meetings/sdm10/tutorial3.pdf

Átlag: 280 nap(40 hét)

Mrs. Hadlum: 349

Page 4: Anomáliadetektálás R-ben

Anomália – definíció?

„más a generáló folyamat”

Page 5: Anomáliadetektálás R-ben

Anomália – definíció?

anomaly

surprise

rare eventnovelty

outlier

exception

aberration

peculiarity

discordant observations

Page 6: Anomáliadetektálás R-ben

Csoportosítás

Távolság alapú

o Befoglaló burok: depth

o MVE, MCD: MASS

o BACON: robustX

o DB: fields

Sűrűség alapú

o LOF: DMwR

o NNDB

Távolság?

Page 7: Anomáliadetektálás R-ben

Befoglaló burok

1D: min, max(belső: medián)

2D: bef. poligon

≥ 3D:

Befoglaló burok: depth::depth

Page 8: Anomáliadetektálás R-ben

MVE

Minimum VolumeEllipsoid…

Kimerítő kereséssel

MVE: MASS::cov.rob

Page 9: Anomáliadetektálás R-ben

BACON

Ha összefüggő, összefüggő…

BACON: robustX::mvBacon

Page 10: Anomáliadetektálás R-ben

DB

Hiába vagyunk a középpontban, ha

nincsenek szomszédaink

DB: fields::fields.rdist.near

Distance-basedapproach

Page 11: Anomáliadetektálás R-ben

LOF motiváció

𝑝2 sem, vagy 𝐶1 is?

Page 12: Anomáliadetektálás R-ben

LOF

Ha a szomszédaim

is magányosak,

nincs nagy gond

LOF: DMwR::lofactor

Local outlier factor

Page 13: Anomáliadetektálás R-ben

NNDB

Hol vannak a nagy váltások?

Page 14: Anomáliadetektálás R-ben

Amire mi használjuk: teljesítménymen.

Page 15: Anomáliadetektálás R-ben

Távolság vagy sűrűség alapú?

BACON: „elég messze van”

NNDB: „de homogén sűrűségű”