Откривање законитости у подацима (Data...

Post on 27-Jul-2020

6 views 0 download

Transcript of Откривање законитости у подацима (Data...

Откривање законитости у подацима (Data Mining)

Факултет организационих наука

Центар за пословно одлучивање

П4: DM Задаци

• Пословни проблеми

• Случајеви (Моб. телефонија, ГСС, DELL)

• Задаци дејта мајнинга

Циљеви предавања

• Препознавање стандардних проблема пословања

• Препознавање задатака ДМ

• Увод у процес откривања знања

ОЗП дефиниција

Дејта мајнинг (срп. Откривање законитости у подацима) је процес oтркивања

законитости у великој количини података користећи математичке, статистичке и

оптимизационе методе и технике.

Случај 1: Моб. телефонија

Компанија Т је најстарија компанија моб. телефоније у САД. Има највећи број

корисника и тржишно учешће од око 70%. На тржиште су почели да улазе и други

моб. оператери, и компанија је почела да губи свој тржишни удео. Све више

корисника узима услуге других оператера. Изгубљено је 5% корисника и претпоставља

се да ће тренд да се настави.

Случај 1: Моб. телефонија

Компанија Т не жели да губи више корисника и спремна је да побољша квалитет своје

услуге и да се суочи са новонасталим проблемима. Т води податке о својим

корисницима и то:

1. Податке о рачунима (задужења, плаћања, врсте услуга)

Случај 1: Моб. телефонија

1. Како Т може да унапреди своје пословање?

2. Да ли Т познаје свог клијента?

Пример уз случај 1: Подаци о кориснику

• Држава: категорички, 50 САД држава и Колумбија дистрикт

• Дужина рачуна: целобројни, колико је дуго рачун активан

• Код области: категорички

• Тел. број: део кључа за рачун

• Секретарица: биномни, да или не

• Укупна минута на дан: континуални, потрошени минути

• Укупан број позива: целобројни

• Укупно дневно задужење: континуални, базиран на претходна два

• Укупнио интернационалних минута: континуални,потрошени минути

• Укупан број интернационалних позива: целобројни

• Укупно интернационални задужење: континуални

• Број позива ка корисничком сервису: целовбројни тип

Дистрибуција атрибута

Дистрибуција атрибута (пример)

Дистрибуција атрибута (пример)

Дистрибуција атрибута

Дистрибуција атрибута

Дистрибуција атрибута

Дистрибуција атрибута

Подаци

Корелација података

Статистика

Статистика

Случај 2: Горска служба спасавања

Горска служба спасавања се бави спасавањем унесрећених лица на тешко приступачним теренима. Главна делатност ГСС-а током

зиме су ски патроле на Копаонику и Старој планини, а од 2008. године и на Златибору и Дивчибарима. ГСС прикупља податке о

повредама и уноси их у своју базу и на основу ње сваки дан предаје извештај

скијалишту о повредама.

Случај 2: Повредна листа

1. Подаци о спашеном (лични подаци)

2. Подаци о повреди (тип, локација, време, врем. услови, врста транспорта, врста помоћи, опрема)

3. Подаци о спациоцу (лични, службени)

Случај 2: ГСС

ГСС има жељу да унапреди скијашки спорт, у смислу, смањивања броја повреда, јер

сматра да има искуства и податке који им могу помоћи да то учине. С обзиром да је све више људи заинтересовано за скијање

и сноуборд и пошто је све већи број планина потребно покрити, ГСС жели да

смањи број повреда.

Случај 2: Питања

1. Које акције ГСС треба да предузме да би унапредио скијашки спорт?

2. Да ли му подаци о повредама могу помоћи при томе?

3. Како се може помоћи скијашима у превенцији повреда? Да ли је ово

узалудан задатак?

Пословне примене [TWM: Data and Text Mining]

1. Лојалност бренду и понашање купаца

2. Компетитивна предност

3. Моделовање одлучивања потрошача

4. Кредитна способност и откривање превара

5. Управљање односима са потрошачима

6. Директни и маркетинг на основу БП

7. Анализа потршачке корпе

Пословне примене

8. Моделовање одзива тржишта и предвиђање продаје

9. Сегментација тржишта

10. Политика цена

11. Позиционирање производа

12. Управљање информацијама

DM задаци

1. Редукција,

2. Процена (Регресија),

3. Класификација,

4. Кластеровање,

5. Предвиђање, и

6. Откривање асоцијативних правила

(АКО-ТАДА).

Редукција

1. Редукција атрибута

1. Шта се дешава ако се у модел не укључи одређени атрибут?

2. Шта се дешава уколико се у модел укључи битан атрибут?

2. Редукција случајева

Процена (Регресија)

1. Позвао сам 50 људи на прославу, колико пића би требао да набавим?

2. Ресторан припрема јела, колико од сваког јела треба да буде унапред припремљено?

Класификација

1. На који начин банка одлучује да даје кредит?

2. На који начин се на основу крвне слике одређује да ли је неко болестан или није?

Кластеровање

1. Који сегменти потрошача постоје?

2. Које групе студената постоје?

3. Како се групишу компаније у једној привреди?

Предвиђање

1. Која ће бити температура сутра?

2. Како ће се кретати цене акција за десет дана?

3. Ко ће да победи на светском првенству у фудбалу?

Асоцијативна правила

1. Ако купац купује Зајечарско пиво, тада ће купити и Домаћински чипс.

2. Ако запослени шаље више од 5 мејлова на сат не стиже да испуни своје радне задатке.

Примери Бостон Селтикси би желели да процене колико ће поена наредни противник да постигне против њих. Војни обавештајац жели да сазна о односу Чијата и Сунита у одређеном стратешком подручју. НОРАД одбрамбени рачунар треба да одлучи тренутно да ли је трептај на радару јато гусака или нуклеарни пројектил.

Примери

Политичар тражи најбољу групу да га подржи у одређеном округу донацијама.

Обевештајац жели да утврди да ли одређена секвенца (редослед) потеза на финансијском тржишту представља претњу терористичког напада.

Вол стрит аналитичар је замољен да анализира очекиване промене у цени акцији за скуп компанија са сличним рациом цена/принос.

DM задаци и алгоритми

1. DM задаци стварају потребу за DM. Задаци представљају део свакодневног одлучивања ДО.

2. DM алгоритми решавају DM задатке. Они служе за откривање патерна (законитости).

Следећи пут

• ОЗП алгоритми кластеровања и асоцијације