Anomáliadetektálás R-ben
-
Upload
salankia -
Category
Technology
-
view
297 -
download
0
Transcript of Anomáliadetektálás R-ben
Budapesti Műszaki és Gazdaságtudományi EgyetemMéréstechnika és Információs Rendszerek Tanszék
Anomáliadetektálás R-rel
Salánki Ágnes
2014.01.15.
Egy motiváció (1949)
Forrás: http://www.siam.org/meetings/sdm10/tutorial3.pdf
Hadlum vs. Hadlum
Egy motiváció (1949)
Forrás: http://www.siam.org/meetings/sdm10/tutorial3.pdf
Átlag: 280 nap(40 hét)
Mrs. Hadlum: 349
Anomália – definíció?
„más a generáló folyamat”
Anomália – definíció?
anomaly
surprise
rare eventnovelty
outlier
exception
aberration
peculiarity
discordant observations
Csoportosítás
Távolság alapú
o Befoglaló burok: depth
o MVE, MCD: MASS
o BACON: robustX
o DB: fields
Sűrűség alapú
o LOF: DMwR
o NNDB
Távolság?
Befoglaló burok
1D: min, max(belső: medián)
2D: bef. poligon
≥ 3D:
Befoglaló burok: depth::depth
MVE
Minimum VolumeEllipsoid…
Kimerítő kereséssel
MVE: MASS::cov.rob
BACON
Ha összefüggő, összefüggő…
BACON: robustX::mvBacon
DB
Hiába vagyunk a középpontban, ha
nincsenek szomszédaink
DB: fields::fields.rdist.near
Distance-basedapproach
LOF motiváció
𝑝2 sem, vagy 𝐶1 is?
LOF
Ha a szomszédaim
is magányosak,
nincs nagy gond
LOF: DMwR::lofactor
Local outlier factor
NNDB
Hol vannak a nagy váltások?
Amire mi használjuk: teljesítménymen.
Távolság vagy sűrűség alapú?
BACON: „elég messze van”
NNDB: „de homogén sűrűségű”