Wstęp Analiza korelacji Przykłady Podsumowanie
Miary korelacji
Janusz Miśkiewicz
Instytut Fizyki Teoretycznej, Uniwersytetu Wrocławskiego,
pl. M.Borna 9, 50-204 Wrocław, Poland
5 Ogólnopolskie Sympozjum FENSWarszwa, 2010
J. Miśkiewicz IFT
Miary korelacji
Wstęp Analiza korelacji Przykłady Podsumowanie
Zagadnienie
◮ Istotą układów ekonomicznych jest ich wzajemneoddziaływanie (konkurencja, bądź współdziałanie).
◮ W fizyce zwykle budujemy model, który jest następnieweryfikowany doswiadczalnie.
◮ W gospodarce przedsiębiorstwa wzajemne relacje otaczajątajemnicą.
J. Miśkiewicz IFT
Miary korelacji
Wstęp Analiza korelacji Przykłady Podsumowanie
Zagadnienie
◮ W ekonomii istotnymi i naturalnymi są pytania o wzajemnerelacje:
◮ Czy dane podmioty są od siebie zależne?◮ Jeżeli tak to który jest dominujący?◮ Czy są niezależne wzajemnie, ale współzależne od podmiotu
trzeciego.◮ Jaki jest stopień zależności?
J. Miśkiewicz IFT
Miary korelacji
Wstęp Analiza korelacji Przykłady Podsumowanie
Zagadnienie
◮ W ekonomii istotnymi i naturalnymi są pytania o wzajemnerelacje:
◮ Czy dane podmioty są od siebie zależne?◮ Jeżeli tak to który jest dominujący?◮ Czy są niezależne wzajemnie, ale współzależne od podmiotu
trzeciego.◮ Jaki jest stopień zależności?
Korelacje
A = f (B)
J. Miśkiewicz IFT
Miary korelacji
Wstęp Analiza korelacji Przykłady Podsumowanie
Algorytm standardowy
◮ Miara odległości
◮ Macierz odległości
◮ Drzewo MST
◮ Własności otrzymanego drzewa MST: podmioty dominujące,klasyfikacja gałęzi przemysłu, analiza hierarchii itp.
J. Miśkiewicz IFT
Miary korelacji
Wstęp Analiza korelacji Przykłady Podsumowanie
Odległość ultrametryczna (UD)
◮ Definicja
DU(A,B)(t,T ) =
√1
2(1 − corr(t,T )(A,B)), (1)
corr(t,T )(A,B) =〈AB〉(t,T ) − 〈A〉(t,T )〈B〉(t,T )√
(〈A2〉(t,T ) − 〈A〉2(t,T ))(〈B2〉(t,T ) − 〈B〉2(t,T ))
,
(2)R. Mantegna, H. E. Stanley “An Introduction to
Econophysics”, Cambridge University Press, 2000
J. Miśkiewicz IFT
Miary korelacji
Wstęp Analiza korelacji Przykłady Podsumowanie
Własności UD
Zalety
◮ Właściwie klasyfikuje podmioty w kontekście optymalizacjiportfela.
◮ Wynika z teorii portfela optymalnego.
◮ Powszechnie stosowana.
◮ Weryfikuje korelacje liniowe.
J. Miśkiewicz IFT
Miary korelacji
Wstęp Analiza korelacji Przykłady Podsumowanie
Własności UD
Wady
◮ Odległość ultrametryczna rów.(1) bada korelacje liniowe◮ ai = i + w(0.5), bi = a2
i + w(0.5); g1(n) = DU(A,B)◮ ai = i + w(0.5), bi = a3
i + w(0.5); g2(n) = DU(A,B)◮ ai = i + w(0.5), bi = a4
i + w(0.5); g3(n) = DU(A,B)
0
0.05
0.1
0.15
0.2
0.25
0.3
0 200 400 600 800 1000
DU
n
g1(n)g2(n)g3(n)
J. Miśkiewicz IFT
Miary korelacji
Wstęp Analiza korelacji Przykłady Podsumowanie
Własności UD
Wady
◮ Odległość ta jest bardzo wrażliwa na zakłócenia (szum).◮ 〈A〉 = 0.5, 〈B〉 = 0.5; f1(n) = DU(A,B)◮ 〈A〉 = 0.5, 〈B〉 = 0.0; f2(n) = DU(A,B)◮ 〈A〉 = 0.5, bi = 5 ∗ ai + w(0.5); f3(n) = DU(A,B)
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
0 200 400 600 800 1000
DU
n
f1(n)f2(n)f3(n)
J. Miśkiewicz IFT
Miary korelacji
Wstęp Analiza korelacji Przykłady Podsumowanie
Własności UD
Wady
◮ Niech X będzie zmienną losową o skończonej warincji i funkcjąrozkładu pr. f (x) symetryczną względem wartości średniej tzn.f (x) = f (−x) dla x ∈ (−∞,∞). Wtedy definując zmiennąlosową Y = |X | otrzymujemy
corr(X ,Y ) = 0
J. Miśkiewicz IFT
Miary korelacji
Wstęp Analiza korelacji Przykłady Podsumowanie
Własności UD
Wady
◮ Jeżeli układ badany potraktujemy schematycznie:
Układ 1 ⇔ Układ 2
J. Miśkiewicz IFT
Miary korelacji
Wstęp Analiza korelacji Przykłady Podsumowanie
Własności UD
Wady
◮ Jeżeli układ badany potraktujemy schematycznie:
Układ 1 ⇔ Układ 2
⇑ ⇑
szum szum
J. Miśkiewicz IFT
Miary korelacji
Wstęp Analiza korelacji Przykłady Podsumowanie
Własności UD
Wady
Zakładając, że szum pojawia się w obu szeregach czasowychoraz że jest to szum biały,
A = A + WA, B = B + WB
bezpośrednim rachunkiem można pokazać, że
DU(A,B)(t,T ) =
√√√√1
2(1 −
〈AB〉 − 〈A〉〈B〉√(〈A2〉+ 〈W 2
A〉 − 〈A〉2)(〈B2〉+ 〈W 2
B〉 − 〈B〉2)
).
J. Miśkiewicz IFT
Miary korelacji
Wstęp Analiza korelacji Przykłady Podsumowanie
Odległości alternatywne
◮ Odległość Manhattan i odległości pochodne.◮ W podstawowej formie: DM(A,B) =
∑n
i=1|ai − bi |
◮ oraz uśredniona po długości szeregu:
DM(A,B) = 1
n
∑n
i=1|ai − bi |
◮ Zalety◮ Większa odporność na szum: np. dla ai > bi > 0 zakłócenie w
postaci A + W ,B + W , gdzie W jest białym szumem, ulegnie
zredukowaniu.◮ Ponadto dla miary DM należy zauważyć, że jest ona funkcją
długości szeregu czasowego.
J. Miśkiewicz IFT
Miary korelacji
Wstęp Analiza korelacji Przykłady Podsumowanie
Odległości alternatywne
Poczyńmy obserwację:
0
5
10
15
20
25
30
0 2 4 6 8 10
A,B
n
f(x)=2x, g(x)=3x
0
50
100
150
200
250
300
0 2 4 6 8 10A
,B
n
f(x)=2x, g(x)=3x2
J. Miśkiewicz IFT
Miary korelacji
Wstęp Analiza korelacji Przykłady Podsumowanie
Klasyfikacja korelacji
Aproksymując dyskretną zmienną długości ciągu zmienną ciągłą izakładając, że ai > bi
DM(A,B)(n) ≃
∫n
0
(a(t)− b(t)) dt
Wtedy funkcję korelacji można znaleźć jako:
f (n) =d(DM(A,B)(n))
dn,
J. Miśkiewicz IFT
Miary korelacji
Wstęp Analiza korelacji Przykłady Podsumowanie
Klasyfikacja korelacji
Szeregi badane:xi = ti + w(0.5),y1i= x2
i+ w(0.5),
y2i= x3
i+ w(0.5),
y3i= x4
i+ w(0.5).
-15
-10
-5
0
5
10
15
20
25
30
1 2 3 4 5 6 7 8 9 10D
Un
g1(n)g2(n)g3(n)f1(n)f2(n)f3(n)
Współczynniki kierunkowe dofitowanych prostych są:a1 ≈ 2.91, a2 ≈ 3.91, a3 ≈ 4.87, co obliczeniu pochodnej dajefunkcje wyjściowe.
◮ Miara Manhattan daje możliwość oszacowania charakterukorelacji pomiędzy podmiotami.
J. Miśkiewicz IFT
Miary korelacji
Wstęp Analiza korelacji Przykłady Podsumowanie
Przykład
Porównanie PKB Francji i Belgii – odległość DM
1970 1980 1990 20000
5.0´1011
1.0´1012
1.5´1012
2.0´1012
2.5´1012
2.4 2.6 2.8 3.0 3.2 3.4 3.6
29.0
29.5
30.0
30.5
31.0
Parametry dofitowanej prostej: y= 2.00x+ 23.82
J. Miśkiewicz IFT
Miary korelacji
Wstęp Analiza korelacji Przykłady Podsumowanie
Odległości alternatywne
◮ Odległości oparte na entropii.◮ Shanonna
S = −∑
i
pi ln pi
◮ Indeksie Theila
ThA(t,T ) =
t∑
i=t−T
(Ai∑t
j=t−T Aj
lnAi
〈A〉(t,T ))
◮ Kullbacka-Leiblera
d(p|q) =∑
pi lnpi
qi
,
J. Miśkiewicz IFT
Miary korelacji
Wstęp Analiza korelacji Przykłady Podsumowanie
Odległości alternatywne
◮ Entropia Shannona i index Theila transformują szeregi czasowedo szeregów entropii (zależne od długości okna czasowego)nastepnie do obliczenia odległości można zastosować zarównoodległość DU jak i DM.
◮ Miary oparte na entropii porównują złożoność informacyjnąszeregów czasowych.
◮ Entropia Shannona i Kullbacka-Leiblera wymaga poznaniafunkcji rozkładu prawdopodobieństwa.
J. Miśkiewicz IFT
Miary korelacji
Wstęp Analiza korelacji Przykłady Podsumowanie
Struktury sieciowe
◮ Minimalne drzewo rozpinające (MST)
◮ Łańcuch dwukierunkowy (BMLP)Konstrukcja rozpoczyna się od znalezienia najbliższychsąsiadów. Następnie poszukuje się najbliższego sąsiada dokażdego z końców i przyłączany jest bliższy z nich.
◮ Łańcuch jednokierunkowy (UMLP)Pierwszy element sieci jest narzucony, następnie do niego jestprzyłączany najbliższy sąsiad, który staje się końcem sieci.Węzły są przyłączane do końca sieci.
J. Miśkiewicz IFT
Miary korelacji
Wstęp Analiza korelacji Przykłady Podsumowanie
Ewolucja giełdy
Jako ilustrację własności odległości UD i ThD przedstawionezostaną własności sieci ewoluujących MST, BMLP i UMLP dlanastępujących grupy podmiotów giełdowych:
◮ WIG20: PEKAO, PKO BP, KGHM, PKN ORLEN, TPSA, BZWBK, ASSECO POLAND, CEZ, GETIN HOLDING, GTC,TVN, PBG, POLIMEXMS, BRE, LOTOS, CYFROWYPOLSAT, BIOTON.
◮ Wartości odpowiadają notowaniom zamkniecia w czasie od05.01.2009 do 30.04.2010.
J. Miśkiewicz IFT
Miary korelacji
Wstęp Analiza korelacji Przykłady Podsumowanie
Ewolucja giełdy
◮ S&P 500: ABB Ltd.( ABB), Apple Inc. (AAPL), Boeing Co.(BA), the Coca-Cola Company (KO), Emerson Electric Co.(EMR), General Electric Co. (GE), Hewlett-Packard Company(HPQ), Hitachi Ltd. (HIT), IBM (IBM), Intel Corporation(INTC), Johnson & Johnson (JNJ), Lockheed MartinCorporation (LMT), Microsoft Co. (MSFT), NorthropGrumman Corporation (NOC), Novartis AG (NVS),Colgate-Palmolive Co. (CL), Pepsico Inc. (PEP), Procter &Gamble Co. (PG), Tower Semiconductor LTD. (TSEM),Wisconsin Energy Corporation Co. (WEC).
◮ Wartości odpowiadają notowaniom zamkniecia w czasie od02.01.2009 to 30.04.2010.
J. Miśkiewicz IFT
Miary korelacji
Wstęp Analiza korelacji Przykłady Podsumowanie
NVS NOC LMT
HIT
JJJJJJJJJBA GE
ssssssssss
AAPL HPQ EMR ABB IBM
CL PG
ttttttttt
INTC TSEM
PEP KO JNJ MSFT
WEC
J. Miśkiewicz IFT
Miary korelacji
Wstęp Analiza korelacji Przykłady Podsumowanie
GPW
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
0.1
0.11
2009.06.01 2009.10.21 2010.03.15
mea
n di
stan
ce
time
ThD, WIG20, T1=50 days, T2=50 days
BMLPUMLP
MST
0.38
0.4
0.42
0.44
0.46
0.48
0.5
2009.06.01 2009.10.21 2010.03.15m
ean
dist
ance
time
UD, GPW, time window=100 days
BMLPUMLP
MST
J. Miśkiewicz IFT
Miary korelacji
Wstęp Analiza korelacji Przykłady Podsumowanie
S&P 500
0
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
2009.06.01 2009.10.21 2010.03.15
mea
n di
stan
ce
time
ThD, S&P 500, T1=50 days, T2=50 days
BMLPUMLP
MST
0.4
0.42
0.44
0.46
0.48
0.5
0.52
0.54
0.56
0.58
2009.06.01 2009.10.21 2010.03.15m
ean
dist
ance
time
UD, S&P 500, time window=100 days
BMLPUMLP
MST
J. Miśkiewicz IFT
Miary korelacji
Wstęp Analiza korelacji Przykłady Podsumowanie
Wnioski
◮ Odległość ultrametryczna upraszcza wybór podmiotów przykonstrukcji portfela.
◮ Odległość ultrametryczna bada czy istnieją korelacje liniowe,jest jednak wrażliwa na szum.
◮ Odległość Manchattan umożliwia kategoryzację korelacji jestteż bardziej odporna na szum.
◮ Odległości oparte na entropii pozwalają zaobserwowaćobecność czynników zewnętrznych.
J. Miśkiewicz IFT
Miary korelacji
Top Related