MODELY DISKRÉTNÍ VOLBY 3. cvičení
description
Transcript of MODELY DISKRÉTNÍ VOLBY 3. cvičení
![Page 1: MODELY DISKRÉTNÍ VOLBY 3. cvičení](https://reader036.fdocument.pub/reader036/viewer/2022081420/56815abc550346895dc87b3f/html5/thumbnails/1.jpg)
1
MODELY DISKRÉTNÍ VOLBY
3. cvičení
![Page 2: MODELY DISKRÉTNÍ VOLBY 3. cvičení](https://reader036.fdocument.pub/reader036/viewer/2022081420/56815abc550346895dc87b3f/html5/thumbnails/2.jpg)
2
Osnova
1. Podstata modelů diskrétní volby
2. Modely binární volbyLPM
Logitový
Probitový
3. AplikaceUkázka – cílení marketingových kampaní
![Page 3: MODELY DISKRÉTNÍ VOLBY 3. cvičení](https://reader036.fdocument.pub/reader036/viewer/2022081420/56815abc550346895dc87b3f/html5/thumbnails/3.jpg)
3
Podstata modelů diskrétní volby
Vychází z principu regrese
Používají se pro diskrétní endogenní proměnou
Princip: Jinak se rozhoduji mezi nekonečně mnoha alternativami a mezi dvěma (několika)
Vhodné pro marketingový výzkum a data mining apod.
![Page 4: MODELY DISKRÉTNÍ VOLBY 3. cvičení](https://reader036.fdocument.pub/reader036/viewer/2022081420/56815abc550346895dc87b3f/html5/thumbnails/4.jpg)
4
REGRESE
Y - SPOJITÁ Y - DISKRÉTNÍ
LOGISTICKÁ REGRESE
BINÁRNÍ MULTINOMICKÁ ORDINÁLNÍ
LINEÁRNÍ REGRESE
![Page 5: MODELY DISKRÉTNÍ VOLBY 3. cvičení](https://reader036.fdocument.pub/reader036/viewer/2022081420/56815abc550346895dc87b3f/html5/thumbnails/5.jpg)
5
Modely binární diskrétní volby(1)
Y nabývá pouze dvou hodnotZnačené: 0, 1
Na čem závisí, že zákazník zůstává u banky/operátora/pojišťovny nebo odchází.
Na čem závisí, zda zákazník vlastní daný produkt?
Na čem závisí to, že zákazník nesplatí úvěr?
Na čem závisí to, že zákazník podvádí banku?
...
![Page 6: MODELY DISKRÉTNÍ VOLBY 3. cvičení](https://reader036.fdocument.pub/reader036/viewer/2022081420/56815abc550346895dc87b3f/html5/thumbnails/6.jpg)
6
Modely binární diskrétní volby(2)
Lineární pravděpodobnostní model
Odhadnuté hodnoty udávají pravděpodobnost, že pro dané pozorování i bude Y rovno 1.
Problémy:Náhodné složky vykazují heteroskedasticitu – nutno odhadovat MZNČ, MVNČPravděpodobnost leží mimo interval <0,1>Interpretace modelu - linearita
0 1 1 ... k kY X X u
ˆ |i iY p E Y x
![Page 7: MODELY DISKRÉTNÍ VOLBY 3. cvičení](https://reader036.fdocument.pub/reader036/viewer/2022081420/56815abc550346895dc87b3f/html5/thumbnails/7.jpg)
Logitový model diskrétní binární volby
Využívá KDF logistického rozděleníMatematické hledisko pohledu – flexibilní a jednoduchá funkce
Smysluplná interpretace
Odhad pomocí MMV
0 1
0 1.
1
X
i X
ep
e
0 1( ) ln .1
i
i
pg X X
p
1
( ) ln ( ) ln( ) (1 ) ln(1 )n
i i i ii
L l y p y p
KDF Logistického rozdělení
0
0,5
1
-4 -3 -2 -1 0 1 2 3 4
x
p
![Page 8: MODELY DISKRÉTNÍ VOLBY 3. cvičení](https://reader036.fdocument.pub/reader036/viewer/2022081420/56815abc550346895dc87b3f/html5/thumbnails/8.jpg)
Probitový model diskrétní binární volby
Využívá KDF standardního normálního rozděleníMatematické hledisko pohledu – flexibilní a jednoduchá funkce
Smysluplná interpretace
Odhad pomocí MMV
0
0,5
1
-4 -3 -2 -1 0 1 2 3 4
p
x
KDF Normálního rozdělení
![Page 9: MODELY DISKRÉTNÍ VOLBY 3. cvičení](https://reader036.fdocument.pub/reader036/viewer/2022081420/56815abc550346895dc87b3f/html5/thumbnails/9.jpg)
9
Srovnání KDF normálního a logistického rozdělení
![Page 10: MODELY DISKRÉTNÍ VOLBY 3. cvičení](https://reader036.fdocument.pub/reader036/viewer/2022081420/56815abc550346895dc87b3f/html5/thumbnails/10.jpg)
10
Vyhodnocení modelů
LPM – Stejný princip jako pro KLRM
Logit, probitWaldův chí-kvadrát test
Score test
Test věrohodnostním poměrem
Modifikovaný R2
![Page 11: MODELY DISKRÉTNÍ VOLBY 3. cvičení](https://reader036.fdocument.pub/reader036/viewer/2022081420/56815abc550346895dc87b3f/html5/thumbnails/11.jpg)
11
APLIKACE
SpolečnostiBanky, úvěrové a finanční společnosti
Telekomunikační společnosti
Pojišťovny
Retailové společnosti ...
MarketingOdchod zákazníka
Pořízení produktu – cross sell
Risk managementNesplacení úvěru - Skóring
Podvod
![Page 12: MODELY DISKRÉTNÍ VOLBY 3. cvičení](https://reader036.fdocument.pub/reader036/viewer/2022081420/56815abc550346895dc87b3f/html5/thumbnails/12.jpg)
Marketingové kampaně
Cílené marketingové kampaně jako součást podlinkové komunikace se zákazníkem (z ang. BTL)
Firma oslovuje konkrétní skupinu zákazníků s konkrétní nabídkou (produkt, sleva...) pomocí různých komunikačních kanálů (dopis, email, sms, telefonát...)
ProblémVelké množství zákazníků
Které zákazníky oslovit?
Jaký produkt jim nabídnout?
Pomocí jakého komunikačního kanálu?
![Page 13: MODELY DISKRÉTNÍ VOLBY 3. cvičení](https://reader036.fdocument.pub/reader036/viewer/2022081420/56815abc550346895dc87b3f/html5/thumbnails/13.jpg)
Marketingové kampaně
Cíl:Vyšší odezva klientů na marketingové kampaně při stejných marketingových nákladech
Snížení marketingových nákladů při stejné odezvě klientů
Zvýšení zisků firmy
![Page 14: MODELY DISKRÉTNÍ VOLBY 3. cvičení](https://reader036.fdocument.pub/reader036/viewer/2022081420/56815abc550346895dc87b3f/html5/thumbnails/14.jpg)
Aplikace - zadání
Klíčovými produkty banky jsou spotřebitelské úvěry, kreditní karty a spořicí účty.
Úkol: zlepšit cílení marketingových kampaní, v současné době platí, že jsou klienti do kampaní vybíráni pomocí expertních pravidel.
Součástí řešení je spočítání pravděpodobnosti, že si klient pořídí dané produkty a nastavení automatizace počítání modelů s měsíčními intervaly.
![Page 15: MODELY DISKRÉTNÍ VOLBY 3. cvičení](https://reader036.fdocument.pub/reader036/viewer/2022081420/56815abc550346895dc87b3f/html5/thumbnails/15.jpg)
15
1. Krok – Příprava dat
Co vše víme o klientech banky?Socio demo: Věk, Pohlaví, Místo bydliště, Zaměstnání, Vzdělání
Behaviorální: Počet a typy produktů, doba využívání produktů, počet žádostí
Transakční data: obrat na účtech, zůstatek, průměrné příjmy,
Informace o kampaních, stížnostech klienta – komunikace klient - banka
Odkud bereme údaje?Primární zdroje: pobočky, call-centrum, internetové bankovnictví, účetní software ...
Co je klíčový krok v přípravě
dat?Unifikace a identifikace klienta
![Page 16: MODELY DISKRÉTNÍ VOLBY 3. cvičení](https://reader036.fdocument.pub/reader036/viewer/2022081420/56815abc550346895dc87b3f/html5/thumbnails/16.jpg)
1. Krok – Příprava dat
Pro jednotlivá období byla vytvořena analytická tabulka
Přidány odvozené (trendy, kategorie, průměry...) a transformované proměnné (kategorizace, logaritmická transformace
Práce s chybějícími hodnotami, odlehlými pozorováními ...
Počet klientů: cca 900 tis. (aktivní i neaktivní klienti)
Počet vysvětlujících proměnných: 1100
![Page 17: MODELY DISKRÉTNÍ VOLBY 3. cvičení](https://reader036.fdocument.pub/reader036/viewer/2022081420/56815abc550346895dc87b3f/html5/thumbnails/17.jpg)
17
2. Krok – Odhad modelu
Princip práce s daty a odhad modelu pro spotřebitelské úvěry
![Page 18: MODELY DISKRÉTNÍ VOLBY 3. cvičení](https://reader036.fdocument.pub/reader036/viewer/2022081420/56815abc550346895dc87b3f/html5/thumbnails/18.jpg)
<=0 0 - 7999 8000 - 19999 > =20000
0.0000%5.0000%
10.0000%15.0000%20.0000%25.0000%30.0000%35.0000%40.0000%45.0000%50.0000%
0.0000%
0.0100%
0.0200%
0.0300%
0.0400%
0.0500%
0.0600%
DISP_PROSTR
Velikost skupiny Y
2. Krok – Odhad modelu - Logit
Proměnná Báze Parametr Poměr šancí
P-hodnota
KONSTANTA -0,653 <,0001
NEAKTIVNI_KARTA -0,920 0.331 <,0001
REAG_KAMP_032 0,505 1.390 <,0001
ZADOST_CREDIT 1,734 4.187 <,0001
DPOSL_PRODUKT -0,033 0.957 <,0001
MAX_UVER_RAMEC 0,000 1.000 <,0001PROFESE - Delnik Zdravotnik 0,234 0.762 0,0038PROFESE - Duchodce Zdravotnik -1,201 0.154 <,0001PROFESE - Invalida Zdravotnik 0,158 0.621 0,4169PROFESE - Manager Zdravotnik 0,214 0.720 0,0801PROFESE - Ostatni Zdravotnik -0,223 0.433 0,2164PROFESE - Podnikatel Zdravotnik 0,333 0.810 0,0069PROFESE - Prodavac Zdravotnik -0,227 0.426 0,2356PROFESE - Ridic Zdravotnik 0,360 0.794 0,028PROFESE - Rizikovi Zdravotnik -0,028 0.478 0,9104PROFESE - StatniZam Zdravotnik 0,250 0.697 0,1637PROFESE - Technik Zdravotnik 0,041 0.592 0,7743PROFESE - Urednik Zdravotnik 0,077 0.627 0,5315DISP_PROSTR < =0 >= 20000 -0,550 0.590 <,0001DISP_PROSTR 1 - 7999 >= 20000 0,642 1.820 <,0001DISP_PROSTR 8000 - 19999 > =20000 0,124 1.014 0,2897
0,653 0,920 _ 0,505 _ _ 032 ...
0,653 0,920 _ 0,505 _ _ 032 ....
1
NEAKTIVNI KARTA REAG KAMP
i NEAKTIVNI KARTA REAG KAMP
ep
e
Výsledný model
Interpretace prametru:
Znaménka – zvyšuje se, snižuje pravděpodobnost
Poměr šancí – pro klienta, který žádal o úvěr, je 4,2 krát vyšší pravděpodobnost, že si vezme úvěr v daný měsíc, než u klienta, který o úvěr nežádal.
![Page 19: MODELY DISKRÉTNÍ VOLBY 3. cvičení](https://reader036.fdocument.pub/reader036/viewer/2022081420/56815abc550346895dc87b3f/html5/thumbnails/19.jpg)
19
2. Krok – Odhad modelu
Statistika „lift“ – vhodná pro nestatistické
uživatele modelu
0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95
0
2
4
6
8
10
12
14
16
18
20
Model Náhodně
% Zákazníků
Lif
t
2009
02
2009
03
2009
04
2009
05
2009
06
2009
07
2009
08
2009
09
2009
10
2009
110
1
2
3
4
5
6
7
8
Lif
t
![Page 20: MODELY DISKRÉTNÍ VOLBY 3. cvičení](https://reader036.fdocument.pub/reader036/viewer/2022081420/56815abc550346895dc87b3f/html5/thumbnails/20.jpg)
3. Krok - Implementace
9
4
5
6
7
8
3
2
1
500
100 000
100 000
50 000
50 000
20 000
20 000
10 000
1 000
Od Do9 0 499 5008 500 1 499 1 0007 1 500 11 499 10 0006 11 500 31 499 20 0005 31 500 51 499 20 0004 51 500 101 499 50 0003 101 500 151 499 50 0002 151 500 251 499 100 0001 251 500 351 499 100 0000 351 500 - -
Obchodnískóre
Pořadí klientů dle pravděpod.
nákupuVelikost skupiny
Převod pravděpodobnosti na obchodní skóre
![Page 21: MODELY DISKRÉTNÍ VOLBY 3. cvičení](https://reader036.fdocument.pub/reader036/viewer/2022081420/56815abc550346895dc87b3f/html5/thumbnails/21.jpg)
Co je vlastně výsledkem modelu
Výsledkem je „pravděpodobnost“
Výsledkem je skóre
Přepočet pravděpodobnost-> skóre
Obojí je ve campaign management system
Model se automaticky přepočítává každý měsíc
![Page 22: MODELY DISKRÉTNÍ VOLBY 3. cvičení](https://reader036.fdocument.pub/reader036/viewer/2022081420/56815abc550346895dc87b3f/html5/thumbnails/22.jpg)
Cíl: předpovědět odchod zákazníků
Náklady na získání nového klienta překračují náklady na udržení stávajícího klienta
S předstihem předpovědět:Storno smlouvy, účtu, služby, …Pokles využívání služeb
Vhodná kombinace s hodnotu zákazníkaOdcházející ziskové klienty nebo klienty s vysokým potenciálem si udržet -> vynaložit prostředky
Odcházející ztrátové klienty přenechat konkurenci
Aplikace DM – Odchod klientů
![Page 23: MODELY DISKRÉTNÍ VOLBY 3. cvičení](https://reader036.fdocument.pub/reader036/viewer/2022081420/56815abc550346895dc87b3f/html5/thumbnails/23.jpg)
Aplikace – Credit scoring / fraud detection
Credit scoring – výpočet pravděpodobnosti neplaceníPro nové úvěry/tarifní zákazníky (schvalování) – máme data:
ze žádosti,
z registrů (credit bureau, SOLUS),
z dalších zdrojů (demografické profily, výsledky cenzů atd.
Pro stávající úvěry/zákazníky (řízení rizik - kapitálová přiměřenost – Basel II)
![Page 24: MODELY DISKRÉTNÍ VOLBY 3. cvičení](https://reader036.fdocument.pub/reader036/viewer/2022081420/56815abc550346895dc87b3f/html5/thumbnails/24.jpg)
24
Aplikace – Fraud detection
Fraud detection – výpočet pravděpodobnosti podvodů
u pojistných událostí
kreditních karet
spotřebitelských úvěrů a jiných úvěrů
„praní špinavých peněz“
billingové podvody
![Page 25: MODELY DISKRÉTNÍ VOLBY 3. cvičení](https://reader036.fdocument.pub/reader036/viewer/2022081420/56815abc550346895dc87b3f/html5/thumbnails/25.jpg)
25
Zdroje
Hušek R, Pelikán J,: APLIKOVANÁ EKONOMETRIE, teorie a praxe
Hosmer D, Lemeshow S,: APPLIED LOGISTIC REGRESSION
Fíglová Z,: ANALÝZA MODELOV DISKRÉTNEJ VOLBY A ICH APLIKÁCIA
Eko-kom