Kopulák alkalmazása a nem-élet...
Transcript of Kopulák alkalmazása a nem-élet...
Eötvös Loránd Tudományegyetem
Természettudományi Kar
Kopulák alkalmazása a nem-élet
biztosításokban
Biró Bianka
Alkalmazott matematikus BSc
Témavezet®:
Dr. Zempléni András
egyetemi docens
Valószín¶ségelméleti és Statisztika Tanszék
Budapest, 2016
Tartalomjegyzék
1. A kétdimenziós összefügg®ség modellezése 7
1.1. Mér®számok az összefügg®ség vizsgálatára . . . . . . . . . . . . . . . 8
1.1.1. Pearson-féle korrelációs együttható . . . . . . . . . . . . . . . 8
1.1.2. Rangkorrelációs együtthatók . . . . . . . . . . . . . . . . . . . 8
1.1.3. Farok-összefüggés . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.2. A kopulák és tulajdonságaik . . . . . . . . . . . . . . . . . . . . . . . 10
1.3. A kopulák f®bb fajtái . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.3.1. Elliptikus kopulák . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.3.2. Arkhimédeszi kopulák . . . . . . . . . . . . . . . . . . . . . . 13
1.3.3. A kopulafajták összehasonlítása . . . . . . . . . . . . . . . . . 17
1.4. A kopulák és a rangkorrelációs együtthatók kapcsolata . . . . . . . . 19
2. Módszerek kopulák illesztésére 22
2.1. A paraméterek maximum likelihood becslése . . . . . . . . . . . . . . 22
2.2. Kopula illesztése rangszámok segítségével . . . . . . . . . . . . . . . . 23
2.2.1. Empirikus kopulák . . . . . . . . . . . . . . . . . . . . . . . . 23
2.3. A megfelel® kopula kiválasztása és az illeszkedés pontossága . . . . . 24
2.4. Szimuláció Arkhimédeszi kopulákból . . . . . . . . . . . . . . . . . . 25
3. Kopula illesztése a vizsgált adatokra 27
3.1. Az adatok bemutatása . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.2. Kopula illesztése . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
4. Alkalmazás viszontbiztosítások díjkalkulációjára 32
4.1. A viszontbiztosítások . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
4.1.1. A matematikai modell . . . . . . . . . . . . . . . . . . . . . . 33
2
4.2. Peremeloszlások . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
4.3. Viszontbiztosítások árazása . . . . . . . . . . . . . . . . . . . . . . . 35
5. Összefoglalás 41
3
Köszönetnyilvánítás
Ezúton szeretnék köszönetet mondani témavezet®mnek, Zempléni Andrásnak,
aki mindvégig �gyelemmel kísérte a munkám, hasznos tanácsokkal látott el, és segí-
tett egy olyan téma kiválasztásában, aminek feldolgozására sokszor kikapcsolódás-
ként tekinthettem.
Hálás vagyok családomnak a tanulmányaim alatt nyújtott sok-sok biztatásért és
támogatásért, valamint barátaimnak, amiért végtelen türelemmel mellettem álltak a
legnehezebb napokban is. Közülük külön köszönet illeti Rácz Nórit, aki lelkesedésével
mindvégig motivált, és olykor szinte jobban várta a szakdolgozatom elkészültét, mint
jómagam.
Végül, de nem utolsó sorban, köszönettel tartozom Banáné Gyuró Juliannának,
Szauer Anitának és Kiss Zoltánnak, akik nélkül ma 1-valószín¶séggel olyan dologgal
foglalkoznék, ami kevésbé érdekel, mint a matematika.
4
Bevezetés
A biztosítás alapait már az ókorban lefektették a kínai keresked®k, akik a szállí-
tani kívánt árut több hajóra osztották szét, csökkentve ezzel a kockázatot, hogy egy
esetleges hajótörés során a teljes árukészlet kárbavesszen, továbbá közös pénzalapot
hoztak létre a veszteségek enyhítésére. Id®vel a díjak mértékét függ®vé tették töb-
bek közt a szállított árutól, valamint az út hosszától, viszont matematikai-statisztikai
alapjai nem voltak még a díjszámításnak.
A biztosításmatematika kialakulása a valószín¶ségszámítás és statisztika fejl®dé-
sével vonható párhuzamba, melynek kezdete a XVII. századra datálható. Az id®-
közben létrejött biztosítótársaságok különböz® kockázattípusok alapján hozták létre
termékeiket, a díjak számításában pedig egyre nagyobb szerepet játszottak külön-
böz® statisztikák és az egyes kockázatok eloszlásai is. Mára már számos terméket
találunk a piacon, a biztosítók pedig különböz® kockázatfügg® modellek és alapos
elemzések segítségével törekednek az optimális díjkalkulációra, és tartanak lépést a
kockázatok folyamatos változásával és a tudomány fejl®désével.
A modern biztosításokat két nagy csoportba, az élet- és nem-életbiztosítások közé
sorolhatjuk. Az életbiztosítási szerz®dések jellemz®en hosszútávúak, melyek során a
halálozás kockázata folyamatosan n®. A nem-életbiztosításokhoz általában egy éves,
lejáratkor hosszabbítható szerz®dések tartoznak, a kockázatok pedig lényegében ál-
landónak mondhatók. Ebbe az ágba soroljuk többek közt a felel®sség-, baleset- és
lakásbiztosításokat. Nem nehéz meggondolni, hogy a két ágnál jelent®sen eltér®ek
mind a tartalékképzés, mind a díjkalkuláció módszerei.
A dolgozatban els®ként kétdimenziós összefügg®séget szeretnénk modellelzni,
amiben a kopulafüggvények lesznek segítségünkre, melyek a XX. század végén kezd-
tek teret hódítani a biztosításmatematikán túl többek között pénzügyi matemati-
kában, biológiában, valamint hidrológiában is. A széleskör¶ alkalmazhatóság nem
meglep®, ugyanis számos területen van szükség arra, hogy összefügg® valószín¶-
5
ségi változók együttes eloszlását becsüljük, ez pedig kopulák segítségével egyszer¶en
megtehet® akár magasabb dimenzióban is. A modellt alkalmazva szeretnénk viszont-
biztosítások árazásába betekintést nyerni, melyhez felel®sségbiztosítások kárki�ze-
tési összegei, valamint a hozzájuk tartozó kárrendezési költségek állnak rendelkezé-
sünkre. Sejthet®, hogy ezek nem függetlenek egymástól, továbbá mivel a költségek
nem-életbiztosításoknál igen magasak lehetnek, a díjkalkuláció során sem mondha-
tók elhanyagolandónak.
Az els® fejezetben látni fogjuk, hogy miként jellemezhet® két valószín¶ségi változó
kapcsolata, és bemutatjuk magát a kétdimenziós összefügg®ségi modellt is. Ezután
a második fejezetben különböz® módszereket ismertetünk kopulák illesztésére, majd
a harmadik fejezetben alkalmazva mindezt az általunk vizsgált adatsorokra, ered-
ményként a kárki�zetések és költségek együttes eloszlására kapunk becslést. A ne-
gyedik fejezetben megvizsgáljuk az egyes peremeloszlásokat, majd összehasonlítjuk
az összefügg®ségi modell alapján számolt viszontbiztosítási díjakat a függetlennek
tekintett változók eloszlása alapján számoltakkal.
6
1. fejezet
A kétdimenziós összefügg®ség
modellezése
Amikor több valószín¶ségi változó együttes viselkedését szeretnénk vizsgálni, az
el®ször felmerül® kérdések egyike, hogy milyen kapcsolat áll fenn köztük. Amennyi-
ben függetlenek egymástól, az együttes eloszlásfüggvényük felírható az egyes vál-
tozók eloszlásfüggvényeinek szorzataként, ezek pedig a gyakorlatban is különböz®
statisztikai módszerekkel egyszer¶en becsülhet®k. Sok esetben viszont nincs ennyire
egyszer¶ dolgunk. Gyakran van szükség ugyanis arra, hogy olyan változók együttes
eloszlására adjunk becslést, melyek nem függetlenek egymástól. Összefügg® változók
esetén ez lényegesen bonyolultabb lehet, és a dimenziószám növekedésével is egyre
több akadályba ütközhetünk. Ebben lesznek segítségünkre a kopulafüggvények, me-
lyek az egydimenziós peremeloszlásokat kapcsolják össze az együttes eloszlással egy,
a változók közti összefüggésen alapuló paraméteren keresztül. Els®ként az összefüg-
g®ség leírásához használatos mér®számokat mutatjuk be, majd bevezetjük a kopulák
de�nícióját és ismertetjük a leggyakrabban használt fajtáikat [7] és [8] alapján. Mi-
vel a dolgozatban szerepl® alkalmazásban két változó közti kapcsolatot vizsgáljuk, a
következ® de�níciókat és tételeket a kétdimenziós esetre mondjuk ki, de magasabb
dimenzióra is analóg módon kiterjeszthet®k.
7
1.1. Mér®számok az összefügg®ség vizsgálatára
Amegfelel® kopula kiválasztásához alapvet® fontosságú, hogy ismerjük a változók
közti kapcsolatot, melyet különböz® mér®számokkal jellemezhetünk attól függ®en,
hogy lineáris kapcsolatot, konkordanciát vagy az eloszlás szélein jelentkez® farok-
összefüggést szeretnénk vizsgálni.
1.1.1. Pearson-féle korrelációs együttható
A Pearson-féle korrelációs együttható a leginkább elterjedt mér®szám, ami két
változó közti lineáris kapcsolat er®sségét, valamint irányát mutatja meg.
1.1.1. De�níció. Az X1 és X2 valószín¶ségi változók Pearson-féle korrelációs együtt-
hatója a
R(X1, X2) =cov(X1, X2)
D(X1)D(X2),
ahol cov(X1, X2) = E(X1X2)−E(X1)E(X2), továbbá D(X1), D(X2) > 0 rendre X1
és X2 szórásai, E pedig a várható értéket jelöli.
Amennyiben R(X1, X2) = 0, X1-et és X2-t korreálatlannak nevezzük. Normális
eloszlású valószín¶ségi változók esetében a korreálatlanság ekvivalens a független-
séggel, ellenben más eloszlásoknál ez nincs így. Ha a változók függetlenek, akkor
korreálatlanok, viszont a korreálatlanságból nem következtethetünk függetlenségre.
A Pearson-féle korrelációs együttható további hátránya, hogy érzékeny a kiemel-
ked®en nagy, illetve kicsi értékekre, valamint mivel nem invariáns a monoton transz-
formációra, az eredeti és a kopulából generált változókra kiszámolva is más-más
értéket kapunk.
1.1.2. Rangkorrelációs együtthatók
A Pearson-féle korrelációs együttható hátrányainak kiküszöböléséhez érdemes
bevezetnünk a rangkorrelációs együtthatók fogalmát.
Ha X1-et és X2-t egy-egy mintának tekintjük, ezek nagyság szerinti sorbarende-
zésével minden adatnak megfeleltethetünk egy-egy ún. rangszámot, ami azt mutatja
meg, hogy a szóbanforgó adat hányadik legnagyobb érték a rendezett mintában.
Ezeket a rangszámokat használva nem kell attól tartanunk, hogy a kiugró értékek
8
torzítanak az eredményen. A Spearman- és a Kendall-féle rangkorrelációs együttha-
tókkal a változók együttmozgását vizsgálhatjuk, utóbbi segítségével pedig egysze-
r¶en kifejezhetjük az Arkhimédeszi kopulák összefügg®ségi paraméterét is.
Kendall-féle τ
1.1.2. De�níció. Legyen (X11, X21) és (X12, X22) két független koordinátapár F-b®l.
Ekkor
ρτ (X1, X2) = P [(X11 −X12)(X21 −X22) > 0]− P [(X11 −X12)(X21 −X22) < 0]
a Kendall-féle rangkorrelációs együttható.
A de�nícióban szerepl® P [(X11 −X12)(X21 −X22) > 0] az egyez® (konkordáns)
párok valószín¶sége, míg P [(X11 −X12)(X21 −X22) < 0] az ellentétes (diszkordáns)
pároké. A konkordanciából arra következtethetünk, hogy az egyes változók nagy
értékei állnak összefüggésben, míg a diszkordancia arra utal, hogy az egyik változó
nagy, és a másik kis értékei között tapasztalhatunk összefüggést.
Spearman-féle ρ
A Spearman-féle rangkorrelációs együttható a rangszámok közti Pearson-féle kor-
reláció.
1.1.3. De�níció. Jelölje di az X1i- és X2i-hez tartozó rangszámok különbségét i =
1, 2, ..., n-re n-dimenziós vektorváltozók esetén. Ekkor a Spearman-féle rangkorrelá-
ciós együttható a
ρS = 1− 6∑d2i
n(n2 − 1).
Hasonlóan Pearson korrelációs együtthatójához, ρS és ρτ értékei is -1 és 1 között
helyezkednek el, szimmetrikusak, valamint 0-val való egyenl®ségük esetén egymástól
függetlennek tekintjük a változókat.
1.1.3. Farok-összefüggés
A gyakorlatban sokszor f®ként az extrém-értékek között fennálló konkordancia
kérdése az érdekes. Ennek vizsgálata azon a feltételes valószín¶ségen alapul, hogy
9
az egyik változó meghalad-e egy rögzített küszöbértéket azon feltétel mellett, hogy
a másikról tudjuk, hogy igen.
Jelölje S a változók együttes túlélésfüggvényét, azaz v ∈ [0, 1]-re
S(v, v) = P (F−11 (X1) > v, F−1
2 (X2) > v).
Ekkor λL-el jelölve az alsó és λU -val a fels® farok-összefüggést,
λL = limv→0
P (F−11 (X1) < v|F−1
2 (X2) < v),
λU = limv→1
P (F−11 (X1) > v|F−1
2 (X2) > v).
Amennyiben λL = 0, nem tapasztalhatunk bal oldali, λU = 0 esetén jobb oldali
farok-összefüggést az adatok közt. Az extrém-érték elmélet biztosítási alkalmazása-
iban λU vizsgálata széles körben elterjedt, ugyanis segítségével felmérhet® annak a
valószín¶sége, hogy egy nagy káresemény bekövetkezése más egyéb hasonló mérték¶
károkat von maga után.
1.2. A kopulák és tulajdonságaik
1.2.1. De�níció. Legyen U egy tetsz®leges [0, 1]2-beli vektorváltozó, melynek U1
és U2 marginálisai a [0, 1] intervallumonn egyenletes eloszlást követnek. Azon C :
[0, 1]2 → [0, 1] függvényeket, melyek felírhatók
C(u1, u2) = P (U1 ≤ u1, U2 ≤ u2) (1.1)
alakban, (kétdimenziós) kopuláknak nevezzük.
Mivel C egy kétdimenziós eloszlásfüggvényt de�niál, minden kopulára teljesülnek
az alábbi tulajdonságok:
1. C (0, u) = C (u, 0) = 0
2. C (1, u) = C (u, 1) = u, ∀u ∈ [0, 1]
3. C (v1, v2) + C (u1, u2) ≥ C (v1, u2) + C (u1, v2) , ∀(u1, u2) ∈ [0, 1]2; (v1, v2) ∈[0, 1]2], 0 ≤ u1 ≤ v1 ≤ 1; 0 ≤ u2 ≤ v2 ≤ 1
10
Vegyük észre, hogy minden kétdimenziós eloszlásfüggvényhez rendelhetünk ko-
pulát. Ismeretes ugyanis, hogy tetsz®leges folytonos valószín¶ségi változót integ-
ráltranszformációval [0, 1] intervallumon egyenletes eloszlásúvá transzformálhatunk,
azaz véve egy F1 eloszlásfüggvény¶ X1 és egy F2 eloszlásfüggvény¶ X2 változót,
j = 1, 2-re:
P (Fj(Xj) ≤ u) = P (Xj ≤ (F−1j )(u)) = Fj(F
−1j (u)) = u.
1.2.2. Megjegyzés. Amennyiben Fj nem invertálható, F−1j az általánosított inver-
zet jelöli.
Továbbá
C(u1, u2) = P (F1(x1) ≤ u1, F2(x2) ≤ u2) =
= P (X1 ≤ F−11 (u1), X2 ≤ F−1
2 (u2)) =
= F (F−11 (u1), F
−12 (u2)),
amib®l adódóan
C(F1(x1), F2(x2)) = F (x1, x2) (1.2)
egy kétváltozós eloszlásfüggvényt de�niál F1 és F2 marginálisokkal.
Ezáltal tehát a kopulák lehet®vé teszik számunkra, hogy a peremeloszlásokat kü-
lön vizsgáljuk az együttes eloszlástól, valamint magasabb dimenzióban is kényelmes
eszközként szolgálnak a változók együttes viselkedésének tanulmányozására.
A kopulák elméleti alapjait Wassily Hoe�ding fektette le 1940-ben, majd Mau-
rice Fréchet kezdte vizsgálni a kapcsolatot többdimenziós eloszlások és azok perem-
eloszlásai között. Mindezek után Abe Sklar 1959-ben mutatta meg, hogy bármely
többváltozós eloszlásfüggvény felírható az (1.2) alakban, továbbá a peremeloszlások
folytonossága esetén a kopula egyértelm¶. Ezt az eredményt foglalja össze az alábbi
tétel:
1.2.3. Tétel (Sklar). Legyenek X1 és X2 valószín¶ségi változók, melyek eloszlás-
függvényei rendre F1 és F2, együttes eloszlásfüggvényüket pedig jelölje F . Ekkor lé-
tezik egy C kopula, melyre
F (x1, x2) = C(F1(x1), F2(x2)).
F1 és F2 folytonossága esetén C egyértelm¶.
11
1.3. A kopulák f®bb fajtái
A leggyakrabban használt kopulákat két nagy családba, az elliptikus és Arkhimé-
deszi kopulák közé sorolhatjuk. A következ®kben ezen kopulacsaládok, és az ezekbe
tartozó nevezetes kopulák kerülnek bemutatásra.
1.3.1. Elliptikus kopulák
Az elliptikus kopulák sajátosságai, hogy valamely elliptikus eloszlásból származ-
tatjuk ®ket, ezáltal hasonlóan könnyen tudunk szimulálni is bel®lük, mint az ellipti-
kus eloszlásokból.
Az elliptikus eloszlások a többváltozós normális eloszlások általánosításai, melyek
számos biztosítási és pénzügyi alkalmazásban jelentenek hatékony eszközt különböz®
kockázatok eloszlásainak vizsgálatára.
1.3.1. De�níció. Az X = (X1, X2) valószín¶ségi vektorváltozót (µ,Σ, ζ) paramé-
ter¶ elliptikus eloszlásúnak mondjuk, ha karakteriszikus függvénye
φX(t) = exp(itTµ)ζ(tTΣt)
alakú, ahol µ egy kétdimenziós oszlopvektor, Σ egy 2× 2-es pozitív de�nit mátrix, ζ
pedig az ún. karakterisztikus generátorfüggvény.
A legfontosabb példa elliptikus eloszlásokra a normális és t-eloszlás. Az alábbi-
akban az ezekb®l származtatott kopulákat mutatjuk be.
Gauss-kopula
1.3.2. De�níció. Jelölje Φ az egy-, ΦR a kétdimenziós, R korrelációmátrixú stan-
dard normális eloszlás eloszlásfüggvényét. Ekkor a
CG(u1, u2) = ΦR(Φ−1(u1),Φ
−1(u2))
a kétdimenziós normális eloszlás kopuláit, a Gauss-kopulákat határozza meg.
A pozitív, illetve negatív paraméter¶ Gauss-kopulák közti különbséget az 1.1.
ábra szemlélteti, valamint az is jól látszik, hogy az összefügg®ség az eloszlás szélein
jelentkezik er®sebben.
12
1.1. ábra. Gauss-kopula pozitív és negatív paraméterrel
Student-féle t-kopula
1.3.3. De�níció. A Student-féle t-kopula a a kétdimenziós t-eloszlásból származta-
tott kopula, azaz
CR,ν(u1, u2) = tR,ν(t−1ν (u1), t
−1ν (u2)),
ahol ν a t-eloszlás szabadságfokát, R a változók korrelációmátrixát jelöli.
A kopula szélein az összefügg®ség er®ssége a korrelációtól és ν értékét®l függ,
valamint ahogy a paraméter ∞-hez közelít, CR,ν(u1, u2) → ΦR(u1, u2). A t-eloszlás
sajátossága továbbá, hogy az eloszlás szabadságfokával megegyez®, vagy annál ma-
gasabb rend¶ momentumai nem léteznek.
1.3.2. Arkhimédeszi kopulák
1.3.4. De�níció. Legyen ψ : [0, 1] → [0,∞] folytonos, szigorúan monoton csökken®
konvex függvény, melyre ψ(1) = 0, ψ(0) = ∞. A ψ[−1] : [0,∞] → [0, 1] függvényt ψ
pszeudo-inverzének nevezzük, ha
ψ[−1](t) =
{ψ−1, ha 0 ≤ t ≤ ψ(0)
0, ha ψ(0) ≤ t ≤ ∞.
1.3.5. Lemma. Legyen ψ a fenti de�níció feltételeinek eleget tev® függvény, mely-
nek pszeudo-inverze ψ[−1]. Ekkor ha C felírható
C(u1, u2) = ψ[−1](ψ(u1) + ψ(u2)) (1.3)
13
alakban, akkor C teljesíti a kopulák határaira vonatkozó feltételeket, azaz ∀u ∈ [0, 1]
C (0, u) = C (u, 0) = 0
C (1, u) = C (u, 1) = u.
Bizonyítás. A határokon vizsgálva (1.3) képlettel felírt függvényt,
C(u1, 0) = ψ[−1](ψ(u1) + ψ(0)) = 0,
C(u1, 1) = ψ[−1](ψ(u1) + ψ(1)) = ψ[−1](ψ(u1)) = u1.
A szimmetrikusságot kihasználva pedig adódik, hogy C(0, u2) = 0 és C(1, u2) = u2,
ez pedig pontosan az, amit be szerettünk volna látni. �Az alábbi tételben szükséges és elégséges feltételt kapunk annak igazolására,
hogy ψ egy, a [0, 1] intervallumon egyenletes eloszlású marginálisokkal rendelkez®
kétdimenziós eloszlásfüggvényt generál, és az (1.3) alakban felírt C valóban egy
kopulát határoz meg.
1.3.6. Tétel. Legyen ψ : [0, 1] → [0,∞] folytonos, szigorúan csökken® függvény,
melyre ψ(1) = 0, és legyen ψ pszeudo-inverze ψ[−1]. Ekkor C : [0, 1]2 → [0, 1],
melyre C(u1, u2) = ψ[−1](ψ(u1) + ψ(u2)) pontosan akkor de�niál egy kétdimenziós
kopulát, ha ψ konvex.
Bizonyítás. Láttuk, hogy C teljesíti a kopulák határaira vonatkozó feltételeket,
továbbá belátható, hogy
C(v2, u2)− C(v1, u2) ≤ v2 − v1. (1.4)
pontosan ψ konvexitása esetén áll fenn. Vegyük észre, hogy ezzel a felírással ekviva-
lens v1 ≤ v2-re a
v1 + ψ[−1](ψ(v2) + ψ(u2)) ≤ v2 + ψ[−1](ψ(v1) + ψ(u2)),
ami a = ψ(v1), b = ψ(v2) és c = ψ(u2) helyettesítéssel
ψ[−1](a) + ψ[−1](b+ c) ≤ ψ[−1](b) + ψ[−1](a+ c), (1.5)
14
ahol a ≥ b és c ≥ 0. Tegyük fel, hogy (1.4) fennáll és ψ[−1] teljesíti (1.5)-öt. Vá-
lasszunk egy tetsz®leges s és t számot a [0,∞] intervallumból, melyekre 0 ≤ s < t.
Ha a = s+t2, b = s és c = t−s
2, akkor
ψ[−1](s+ t
2) ≤ ψ[−1](s) + ψ[−1](t)
2.
Mivel ψ[−1] így teljesíti a konvexitás feltételeit, a tétel egyik irányát ezzel beláttuk.
A másik irány bizonyításához tegyük fel, hogy ψ[−1] konvex. Rögzítsük a, b és c
értékét a [0, 1] intervallumban úgy, hogy a ≥ b és c ≥ 0, továbbá legyen γ = a−ba−b+c
.
Így a = (1− γ)b+ γ(a+ c) és b+ c = γb+ (1− γ)(a+ c), amib®l
ψ[−1](a) ≤ (1− γ)ψ[−1](b) + γψ[−1](a+ c),
ψ[−1](b+ c) ≤ γψ[−1](b) + (1− γ)ψ[−1](a+ c).
Az egyenl®tlenségeket összeadva pont (1.5)-öt kapjuk, amivel a tétel másik felét is
igazoltuk. �A ψ által generált, C(u1, u2) = ψ[−1](ψ(u1) + ψ(u2)) alakban el®álló kopulákat
nevezzük Arkhimédeszi kopuláknak, melyek összefügg®ségi paraméterét a generá-
torfüggvény határozza meg. Az Arkhimédeszi kopulák általában - szemben az ellip-
tikusok családjával - felírhatók zárt alakban, valamint nem valamely többváltozós
eloszlásból származnak. Alapvet® tulajdonságaik közé tartozik a szimmetria és az
asszociativitás is, azaz:
1. C(u, v) = C(v, u)
2. C(C(u, v), z) = C(u,C(v, z))
Az Arkhimédeszi kopulákat a generátorfüggvény választásától függ®en különböz-
tethetjük meg egymástól, ψ tulajdonságai pedig jelent®sen befolyásolják a kopula
szélein jelentkez® bal és jobb oldali farok-összefüggését. Az alábbiakban a Frank-,
Clayton- és Gumbel-kopulákat fogjuk jellemezni és illusztrálni.
Frank-kopula
1.3.7. De�níció. Az α ∈ (−∞,∞) összefügg®ségi paraméter és ψ(t) = log(
eαt−1eα−1
)generátorfüggvény által meghatározott Frank-kopula:
CFr(u1, u2) = − 1
α· log(1 + (e−αu1 − 1)(e−αu2 − 1)
e−α − 1).
15
Mivel α ∈ (−∞,∞), el®fordulhat a marginálisok között negatív összefüggés is,
valamint meg�gyelhet®, hogy az eloszlás közepe nem szóródik. A Frank-kopula a
gyakorlatban olyan adatsorokra alkalmazható, melyeknél mind a kis, és mind a nagy
értékek közti összefüggés gyenge.
1.2. ábra. Frank-kopula pozitív és negatív paraméterrel
Clayton-kopula
1.3.8. De�níció. Az α ∈ (0,∞) összefügg®ségi paraméter¶ Clayton-kopula generá-
torfüggvénye a ψ(t) = t−α − 1, így a kopulát a következ® alakban íthatjuk fel:
CCl(u1, u2) = (u−α1 + u−α
2 − 1)−1/α.
Mivel α a pozitív félegyenesen helyezkedik el, nem tapasztalhatunk negatív össze-
függést a változók közt, továbbá ahogy α 0-hoz közelít, a marginálisok közti össze-
függ®ség mértéke is csökken.
A Clayton-kopulánál a bal oldali farok-összefüggés igen er®s, míg ehhez képest a
jobb oldali gyenge. Éppen ezért a gyakorlatban jól alkalmazható egymással korreáló
kockázatok vizsgálatára, többek között két életre szóló életbiztosítások árazásánál is.
Életbiztosításokkal foglalkozó szakemberek számára ugyanis ismert jelenség az ún.
"broken heart syndrom", azaz az összetört szív szindróma. Statisztikai eredmények
mutatják, hogy egy házaspár egyik tagjának elhalálozása után egy bizonyos id®in-
tervallumban a másikuk halálozási valószín¶sége is megn®, ez pedig a két életre szóló
életbiztosítások díjkalkulációjánál nem elhanyagolandó tényez®, kopulák segítségével
pedig jól modellezhet®.
16
Gumbel-kopula
1.3.9. De�níció. Ha α ∈ [1,∞) és a generátorfüggvény ψ(t) = (− log(t))α alakú,
akkor
CGu(u1, u2) = exp{−[(− log(u1))
α + (− log(u2))α]1/α
}a Gumbel-kopulát de�niálja.
Hasonlóan a Clayton-kopulához, nem tapasztalhatunk negatív összefüggést a
marginálisok között, viszont vele ellentétben er®s a farok-összefüggés a jobb, és
gyenge a bal oldalon. Éppen ezért, ha az általunk vizsgált adatsorok nagy érté-
kei er®sen korreálnak, míg a kisebbek kevésbé, a Gumbel-kopula jó választásnak
bizonyulhat.
1.3.3. A kopulafajták összehasonlítása
Láthattuk, hogy különböz® kopulához eltér® tulajdonságú paraméterek tartoz-
nak, valamint el®állításuk is többféleképp történhet. Az alábbi ábrákon ugyanolyan
összefügg®ségi paraméter mellett ábrázoljuk a bemutatott kopulákat, a Gauss- és
t-kopuláknak pedig a ν = 3 szabadságfokot választottuk.
Minden típusnál meg�gyelhet®, hogy milyen értékek között jelentkezik az er®sebb
összefügg®ség, valamint az eredeti peremeloszlások által okozott eltérés is. Az 1.3.
ábrán már τ = 0.4 esetén is jól látszik az összefüggés er®ssége a Clyaton-kopulán a
kicsi, míg a Gumbel-kopulán a nagy értékek közt, a Frank-, Gauss- és t-kopulánál
viszont magasabb korrelációnál jelentkezik ez szemléletesebben, ahogy azt a további
ábrák mutatják.
1.3. ábra. Arkhimédeszi kopulák ρτ = 0.4 rangkorrelációs együtthatóval
17
1.4. ábra. Arkhimédeszi kopulák ρτ = 0.6 rangkorrelációs együtthatóval
1.5. ábra. Elliptikus kopulák ρτ = 0.4 mellett, a t-kopula ν = 3 szabadságfokkal
A Gauss- és a t-kopula közti különbség f®ként a farok-összefüggésben nyilvánul
meg. A t-kopula rugalmas, mert amellett, hogy az eloszlás szélein fellép® összefüg-
g®séget is mutathatja, az eloszlás közepén fellép® összefügg®ség modellezésére is
alkalmas.
1.6. ábra. Elliptikus kopulák ρτ = 0.6 mellett, a t-kopula ν = 3 szabadságfokkal
18
1.4. A kopulák és a rangkorrelációs együtthatók kap-
csolata
Korábban már láttuk, hogy az összefügg®ségi mér®számok közül a Pearson-féle
korrelációs együttható nem invariáns a monoton transzformációra, így nem-elliptikus
eloszlású változókra alkalmazva félrevezet® eredményeket kaphatunk. Ennek elkerü-
lése érdekében vezettük be a rangkorrelációs együtthatókat. A Spearman-féle ρ és a a
Kendall-τ kopulákkal való kapcsolatát ismertetjük a következ®kben [8] segítségével,
ugyanis mindkét együttható kifejezhet® a kopulákból, továbbá utóbbi segítségével
az Arkhimédeszi kopulák paramétere is kiszámolható.
1.4.1. Állítás. Tetsz®leges C kopulából a Spearman-féle ρ értékét a
ρS(X1, X2) = 12
∫ 1
0
∫ 1
0
C(u1, u2)du1du2 − 3
integrál kiszámításával kaphatjuk meg.
Tegyük fel, hogy X1 eloszlásfüggvénye F1, X2-é pedig F2, és legyen F1(X1)∼U1,
F2(X2)∼U2. Ebb®l adódóan
ρS(X1, X2) = 12
∫ 1
0
∫ 1
0
C(u1, u2)du1du2 − 3 = 12E(U1, U2)− 3 =
=E(U1, U2)− 1
4112
=Cov(U1, U2)√D(U1)
√D(U2)
=
= ρ(F1(X1), F2(X2)).
Tehát ρS nemmás, mint azX1-b®l ésX2-ból integráltranszformációval kapott F1(X1)
és F2(X2) közti korrelációs együttható.
Nézzük most meg, mit mondhatunk el a kopulák és a Kendall-τ kapcsolatáról!
1.4.2. Állítás. A Kendall-τ a
ρτ (X1, X2) = 4
∫ 1
0
∫ 1
0
C(u1, u2)dC(u1, u2)− 1
formula segítségével fejezhetjük ki tetsz®leges C kopulából.
19
Bizonyítás. Láttuk, hogy ρτ az X1 és X2 közti konkordancia és diszkordancia
valószín¶ségének különbsége, azaz
ρτ (X1, X2) = P [(X11 −X12)(X21 −X22) > 0]− P [(X11 −X12)(X21 −X22) < 0].
Mivel X1 és X2 folytonos,
P [(X11 −X12)(X21 −X22) < 0] = 1− P [(X11 −X12)(X21 −X22) > 0],
így ρτ felírható ρτ (X1, X2) = 2P [(X11 −X12)(X21 −X22) > 0]− 1 alakban, melyb®l
átalakítással
P [(X11 −X12)(X21 −X22) > 0] =
= P [(X11 > X12), (X21 > X22)] + P [(X11 < X12), (X21 < X22)].
Ebb®l P [(X11 > X12), (X21 > X22)] = P [(X12 < X11), (X22 < X21)] =
=
∫ +∞
−∞
∫ +∞
−∞P [(X12 ≤ x1), (X22 ≤ x2)]dC(F1(x1), F2(x2)) =
∫ +∞
−∞
∫ +∞
−∞C(F1(x1), F2(x2))dC(F1(x1), F2(x2)),
ahol u1 = F1, u2 = F2 transzformációval
P [(X11 > X12), (X21 > X22)] =
∫ 1
0
∫ 1
0
C(u1, u2)dC(u1, u2).
Hasonlóan, P [(X11 < X12), (X21 < X22)] =
=
∫ +∞
−∞
∫ +∞
−∞P [(X12 > x1), (X22 > x2)]dC(F1(x1), F2(x2)) =
=
∫ +∞
−∞
∫ +∞
−∞[1− F1(x1)− F2(x2) + C(F1(x1), F2(x2))]dC(F1(x1), F2(x2)) =
=
∫ 1
0
∫ 1
0
[1− u1 − u2 + C(u1, u2)]dC(u1, u2).
Tudjuk, hogy C a [0, 1] intervallumon egyenletes eloszlású U1 és U2 változók együttes
eloszlása, így E(U1) = E(U2) =12, amib®l
P [(X11 < X12), (X21 < X22)] = 1− 1
2− 1
2+
∫ 1
0
∫ 1
0
C(u1, u2)dC(u1, u2) =
20
=
∫ 1
0
∫ 1
0
C(u1, u2)dC(u1, u2).
Tehát P [(X11 < X12), (X21 < X22)] + P [(X11 < X12), (X21 < X22)] =
P [(X11 −X12)(X21 −X22) > 0] = 2
∫ 1
0
∫ 1
0
C(u1, u2)dC(u1, u2),
amib®l következik, hogy
ρτ (X1, X2) = 2P [(X11 −X12)(X21 −X22) > 0]− 1 =
= 4
∫ 1
0
∫ 1
0
C(u1, u2)dC(u1, u2)− 1.
Ez pedig pontosan az, ami be szerettünk volna látni. �Ahogy már korábban említettük, a Kendall-τ segítségével meghatározhatjuk az
Arkhimédeszi kopulák összefügg®ségi paraméterét is. Ezt az alábbi táblázat foglalja
össze, ahol a Frank-kopula paraméterét kifejez® képletben D1(−α) = D1(α) +α2,
D1(α) =1
α
∫ α
0
t
et − 1dt.
Kopulacsalád ρτ
Clayton αα+2
Frank 1− 4α(D1(−α)− 1)
Gumbel 1− 1α
1.1. táblázat. α és ρτ közti kapcsolat
21
2. fejezet
Módszerek kopulák illesztésére
Ebben a fejezetben két jól alkalmazható módszert fogunk bemutatni a megfelel®
kopula kiválasztására, majd teszteljük a becslések pontosságát is.
2.1. A paraméterek maximum likelihood becslése
A kopula és a marginálisok paramétereinek becslésére a statisztika területén
gyakran használt maximum likelihood (ML) módszert fogjuk alkalmazni, melyben
[1] és [4] lesz segítségünkre. Legyen θ a becsülend® paraméterekb®l álló vektor.
Az ML-becslés lényege, hogy adott mintarealizáció mellett a paraméter becslése-
ként azt a θ-ot fogadjuk el, mely esetén maximális annak a valószín¶sége, hogy
az adott mintarealizációt kapjuk. A módszer az eme valószín¶séget tükröz® ún.
likelihood-függvényt maximalizálja, mely alatt a mintaelemek együttes valószín¶-
ségét, illetve s¶r¶ségfüggvényét értjük.
Sklar tételéb®l ismeretes, hogy egy 2-dimenziós F eloszlásfüggvény a hozzá tar-
tozó F1 és F2 peremeloszlások, valamint a C kopula segítségével az
F (x1, x2) = C(F1(x1), F2(x2))
alakban írható fel, melyb®l adódik, hogy X1 és X2 együttes s¶r¶ségfüggvénye
f(x1, x2) = c(F1(x1), F2(x2))f1(x1)f2(x2),
ahol c-vel a kopulához tartozó s¶r¶ségfüggvényt jelöljük.
Tekintsük a θ = (θ1, θ2, α) paramétervektort, melyben θ1 az X1, θ2 az X2 elosz-
lásának paramétereit tartalmazó vektorok, α pedig a kopula paramétere.
22
Ekkor a loglikelihood-függvény:
ℓ(θ) =n∑
i=1
log[c(F1(Xi1; θ1), F2(Xi2; θ2);α)] +n∑
i=1
2∑j=1
log fj(Xij; θj),
ahol (Xi1, Xi2) : i = 1, .., n független mintarealizációkat jelönlnek.
Ebb®l θ becslése: θ =argmaxℓ(θ)
Biztosítók kárki�zetéseinek vizsgálatakor gyakran feltételezhetjük, hogy azok log-
normális, Pareto-, Weibull- vagy valamely extrém-érték eloszlást követnek.
2.2. Kopula illesztése rangszámok segítségével
Bemutatunk egy olyan módszert is [3] alapján, melyben a kopula becslése nem
függ a peremeloszlásoktól, így nem kell attól tartanunk, hogy a marginálisok eset-
leges félreazonosítása módosítana az eredményen. Az egyes adatsorokhoz tartozó
rangszámok segítségével írjuk fel az empirikus kopulát, majd kiválasztjuk az ismert
Arkhimédeszi kopulák közül a legjobban illeszked®t.
2.2.1. Empirikus kopulák
Tekintsük az X(i) = (Xi1, Xi2) koordinátapárokat, majd rendezzük nagyság sze-
rinti sorba X1 és X2 elemeit. Az így kapott rendezett mintában Xij rangját Rij-vel
fogjuk jelölni, és az általuk meghatározott R(i) = (Ri1, Ri2) vektorok segítségével
írjuk fel az empirikus kopulát. Mivel a vizsgált kétdimenziós kopulák a [0, 1]2 egy-
ségnégyzeten vannak értelmezve, a rangokhoz hozzárendelünk egy-egy Ui ∈ [0, 1]2
ún. pszeudo-meg�gyelést az alábbi módon:
U (i) =R(i)
n+ 1,
mellyel ekvivalens de�níció az
Uij =n
n+ 1· Fj(Xij),
ahol Fj az Xj tapasztalati eloszlásfüggvényét jelöli.
23
Ezek alapján már fel tudjuk írni az empirikus kopulát, ami nem más, mint a
pszeudo-meg�gyelések tapasztalati eloszlásfüggvénye, azaz
Cn(u) =1
n·
n∑i=1
χ(Ui < u).
Mivel Cn konzisztens becslése a keresend® C-nek, így a minta elemszámának
növelésével egyre jobb becslését kapjuk a kopulának. A módszer további el®nye,
hogy C becslése a rangszámokból álló R(i) vektorokon alapul. Ezáltal pedig a kiugró
értékekre sem lesz érzékeny, mert nem a konkrét adatokkal számolunk.
Érdemes megjegyezni, hogy bár közelíteni tudtuk a kopulát az eredeti marginá-
lisok ismerete nélkül, a gyakorlatban nem kerülhetjük el ezek becslését sem. Ha az
eredeti adatokra illesztett eloszlásra vagyunk kíváncsiak, szükség van a peremelosz-
lásokra is.
2.3. A megfelel® kopula kiválasztása és az illeszke-
dés pontossága
Tekintsük a már korábban de�niált Cn empirikus kopulát, valamint a keresett C-
t becsl® Cθn-t a H0 : C ∈ Cθ nullhipotézis mellett. Az empirikust legjobban közelít®
kopula kiválasztásához az
Sn =n∑
i=1
(Cn(Ui)− Cθn(Ui))2
statisztika lesz segítségünkre. Ahogy azt már az el®z® szakaszban láttuk, minél na-
gyobb a minta elemszáma, Cn annál jobb becslése C-nek. Ezt kihasználva a dolgo-
zatban egy bootstrap-alapú illeszkedésvizsgálati módszert alkalmazunk.
A bootstrap eljárás a meglév® mintából generál véletlenszer¶en új mintákat, új
információt adva a mintáról a pontosabb becslés érdekében. A vizsgálat a követke-
z®képp zajlik:
1. Az U1, ..., Un pszeudo-meg�gyelések alapján felírjuk az empirikus kopulát, majd
C θ paraméterét becsüljük θn segítségével.
2. Kiszámoljuk az Sn statisztika értékét.
24
3. Veszünk egy nagy n egészt és minden k ∈ {1, ..., N}-re megismételjük az alábbi
lépéseket:
• A Cθn kopulából generálunk egy X(k)1 , ..., X
(k)n véletlen mintát és kiszá-
moljuk az ezekhez tartozó U (k)1 , ..., U
(k)n pszeudo-meg�gyeléseket.
• Felírjuk a
C(k)n (u) =
1
n
n∑i=1
χ(U(k)i ≤ u), u ∈ [0, 1]2
empirikus kopulát és U (k)1 , ..., U
(k)n -ból kiszámoljuk θ(k)n -t.
• H0 fennállása mellett megadjuk Sn egy közelít® realizációját:
S(k)n =
n∑i=1
(C(k)n (U
(k)i )− C
θ(k)n(U
(k)i ))
2
• A próba p-értékének közelítése:
1
n
n∑i=1
χ(S(k)n ≥ Sn)
A próbát végrehajtjuk minden szóbajöv® kopulára, és végül a p-értékek, az egyes
kopulafajták ismert tulajdonságai, valamint az elkészített ábrák segítségével választ-
juk ki azt a kopulát, amely a legjobban leírja a változók közti összefüggést.
A módszer segítségével bár megbízható eredményt kapunk a legjobban illeszked®
paraméteres kopula kiválasztásához, hátránya, hogy rendkívül lassú, ugyanis minden
lépésben véletlen számokat generálunk, emellett pedig szükség van a kopula para-
métereinek becsléseire is. Amennyiben nagy elemszámú minta áll rendelkezésünkre,
érdemes más illeszkedésvizsgálati módszert alkalmazni, ami nem a bootstrap eljárást
veszi alapul.
2.4. Szimuláció Arkhimédeszi kopulákból
A kopulák lehet®vé teszik számunkra, hogy egyszer¶en szimuláljunk többdimen-
ziós eloszlásokból. Szükségünk van egy algoritmusra, aminek segítségével el®állítha-
tunk egy olyan X1 és X2 változót, melyek együttes eloszlásfüggvénye
F (x1, x2) = C(F1(X2), F2(X2)). Az Arkhimédeszi kopulák esetében láttuk, hogy
C(u1, u2) = ψ−1(ψ(u1) + ψ(u2)).
25
Ismerve X1 és X2 együttes eloszlását, X2 rekurzívan el®állítható ennek X1-re
vonatkozó feltételes eloszlásának segítségével, ahogy ez [2]-ben is olvasható. Az al-
goritmus a következ®:
1. Els®ként generálunk egy U1 és U2 [0, 1] intervallumon egyenletes eloszlású vál-
tozót.
2. El®állítjuk X1-et: X1 = F−11 (U1), és c0-t 0-nak tekintjük.
3. Rekurzívan X2-t
U2 = F2(X2|x1) =ψ−1 (ψ(F1(x1)) + ψ (F2(x2)))
ψ−1(ψ(F1(x1))
megoldásaként számítjuk ki.
26
3. fejezet
Kopula illesztése a vizsgált adatokra
Utalunk már rá korábban, hogy a kopulák jelent®s szerepet játszanak a bizto-
sítások területén. A dolgozatban egy nem-élet biztosítási alkalmazást mutatunk be
Edward W. Frees és Emiliano A. Valdez Understanding relationships using copulas
[2] cím¶ cikke alapján, melyhez rendelkezésünkre áll egy biztosítótársaság 1500 fele-
l®sségbiztosításának kárki�zetéséb®l álló adatsor, valamint az egyes károkhoz tartozó
kárrendezési költségek. Ebben a fejezetben ezek együttes eloszlásának meghatáro-
zása a célunk, melyhez az el®z® fejezetben de�niált Arkhimédeszi kopulák lesznek
segítségünkre.
3.1. Az adatok bemutatása
Jelölje ezentúl X1 a kárki�zetésekb®l, X2 a költségekb®l álló 1500 elem¶ mintát.
Ahogy a 3.1. táblázatból is látszik, ugyanakkora kárki�zetési összegekhez tartozhat-
nak lényegesen eltér® költségek, viszont el®forfulhat, hogy egyes károknál a kárren-
dezési költségek sokkal magasabbak, mint maga a kártérítés. Feltételezhet® azonban,
hogy magas költségek f®ként nagy károkhoz tartoznak.
A 3.2. táblázat a két minta alapstatisztikáit foglalja össze. Láthatjuk, hogy mind
a kártérítések, mind a költségek közt csak pozitív értékek szerepelnek, viszont el®for-
dulhatna akár olyan helyzet is, hogy tartalmaz az adatsor költség nélküli kártérítést
vagy éppen költségeket, melyek olyan károk bekövezésekor keletkeztek, amiket végül
a biztosító nem �zetett ki. Az ilyen esetek vizsgálatát külön kellene elvégeznünk egy
speciálisabb modell segítségével.
27
X1 X2
24 5658
1974 775
2250 2182
2250 8204
14500 625
3.1. táblázat. Részlet az adatokból
X1 X2
Minimum 10 15
Maximum 2173595 501863
Átlag 41208 12588
Medián 12000 5471
Szórás 102747,7 28145,64
3.2. táblázat. Alapstatisztikák
Az már el®zetes vizsgálatok nélkül is sejthet®, és a 3.1 ábra is jól mutatja, hogyX1
és X2 nem független egymástól. Példaként gondoljunk csak arra, hogy egy nagyobb
irodaházban bekövetkezett t¶zesetkor amellett, hogy a biztosítónak feltehet®en igen
magas kártérítést kell ki�zetni, a kárfelmérés is jelent®s költségekkel jár.
Ahogy már az 1.3. szakaszban is láttuk, a Pearson-féle korrelációs együttható
helyett érdemesebb a rangkorrelációs együtthatók segítségével vizsgálni a kárki�-
zetések és költségek közti kapcsolatot. A Kendall-féle τ -t és a Spearman-féle ρ-t
meghatározva így azt kapjuk, hogy
ρτ = 0, 315,
ρS = 0, 452,
ami egyrészt er®s összefügg®séget mutat, másrészt arra enged következtetni, hogy
f®ként a nagyobb károkhoz tartoznak magas költségek.
28
3.1. ábra. A kárki�zetések és költségek logaritmikus skálán
3.2. Kopula illesztése
Miután megállapítottuk, hogy milyen kapcsolat áll fenn a változók közt, neki-
láthatunk a kopulák illesztésének. Erre a 2.2. szakaszban bemutatott rangszámokon
alapuló módszert fogjuk alkalmazni, így tehát az X1- és X2-höz tartozó perem-
eloszlások ismerete nélkül is becsülhetjük a változók együttes eloszlását. Érdemes
megjegyezni, hogy a legtöbbször - mint ahogy jelen dolgozatban sem - nem tudjuk
teljesen elkerülni a peremeloszlások vizsgálatát, azt azonban igen, hogy egy kevésbé
jó becslés a kopula becslésén is rontson. A marginálisokkal b®vebben a következ®
fejezetben foglalkozunk majd.
El®ször a rangszámok és pszeudo-meg�gyelések segítségével elkészítjük az em-
pirikus kopulát, melyhez a [0, 1] intervallumba transzformált adatokat a 3.2. ábra
szemlélteti.
Jól látszik a nagy értékek közti er®s farok-összefüggés, és meg�gyelhet® né-
hány függ®leges sáv is, melyeknek nem érdemes nagy jelent®séget tulajdonítanunk,
ugyanis jogosan feltételezhetjük, hogy mindez annak következménye, hogy a bizto-
sító törekedett kerek kártérítési összegek meghatározására.
29
3.2. ábra. A [0,1] intervallumba transzformált adatok
Ahogy már korábban is láttuk, hogy az Arkhimédeszi kopulák paraméterei ki-
fejezhet®k a Kendall-τ -ból, így ρτ = 0, 315 mellett a Gumbel-, Frank- és Clayton-
kopulához tartozó α értékek:
α
Gumbel 1,461
Frank 3,094
Clayton 0,921
3.3. táblázat. ρτ = 0, 315-höz tartozó α értékek
Ezek alapján ki kell választanunk, melyik kopulafajtára a legkisebb az eltérés az
empirikus kopulához képest, és ellen®riznünk, hogy a legkisebb eltérés elfogadható-
e. Ehhez a korábban bemutatott illeszkedésvizsgálati próbát végezzük el, melynek
eredményeit a 3.4. táblázat foglalja össze. Emlékeztet®ül, a paraméteres és empirikus
kopula közti négyzetes eltérést az Sn próbastatisztika értéke mutatja.
Sn α
Gumbel 0,1073 1,442
Frank 0,1906 3,075
Clayton 1,0286 0,506
3.4. táblázat. Illeszkedésvizsgálat eredeményei
30
Láthatjuk, hogy a különbség a Gumbel-kopula esetén a legkisebb, viszont a próba
a Frank-kopulára sem mutat rossz illeszkedést.
Érdemes mindenesetre megnézni gra�kusan is, hogyan viszonyulnak egymáshoz
a Gumbel-, Frank-, illetve Clayton-kopulából vett minták az egységnégyzeten. Ezt
egyszer¶en megtehetjük, ugyanis a paraméterek ismeretében felírhatjuk a vizsgált
kopulákat, és mintavételezhetünk is bel®lük.
Az ábrán is meg�gyelhet®, hogy míg a Clayton-kopulát teljesen elvethetjük, a
Gumbel-kopula illeszkedése valóban jónak bizonyul, tehát elfogadhatjuk a kárki�ze-
tések és költségek együttes eloszlásaként.
31
4. fejezet
Alkalmazás viszontbiztosítások
díjkalkulációjára
A fejezet célja egy viszontbiztosítási díjkalkuláció a kapott eredmények segítségé-
vel, melyek alapján a biztosító kárki�zetéseit és az egyes károkhoz tartozó költségeket
összefügg®nek tekintjük. Megmutatjuk továbbá Frees és Valdez [2] és Marco Micocci,
Giovanni Masala [6] cikkei alapján, hogy mennyivel módosulna a helyzet, ha füg-
getlenséget feltételeznénk. Ejtsünk el®ször néhány szót a viszontbiztosításokról [5]
segítségével!
4.1. A viszontbiztosítások
A biztosítók pénzügyi stabilitását és �zet®képességét különösen a kis valószí-
n¶ség¶ nagy károk, valamint a kumulálódó károk sodorhatják veszélybe. Érdemes
tehát megfontolni, hogy mekkora kárt tud a biztosító ki�zetni anélkül, hogy felbo-
rulna a pénzügyi egyensúlya, valamint mit lehet tenni a ki�zetend® kárösszeg nem
várt növekedése ellen. Mit tesz a felel®sségteljes lakástulajdonos, akinek egy esetleges
t¶zeset vagy betörés után keletkezett költségek komoly anyagi problémát jelentené-
nek, de jövedelméb®l szívesen áldoz a biztonságérzetre? Biztosítást köt. Ugyanezt
teszi egy biztosítótársaság is. A beérkezett biztosítási díj egy részét átengedve egy
másik biztosítónak (viszontbiztosító), az kötelezettséget vállal, hogy az el®bbinek
(direkt biztosító) az általa ki�zetett szolgáltatások egy részét megtéríti. Ezt nevezik
viszontbiztosításnak, melyet gyakran emlegetnek a "biztosítók biztosítása"-ként is.
32
Az árazás és kockázatmegosztás szempontjából megkülönböztethetünk arányos
és nem arányos viszontbiztosítási formákat. El®bbi lényege, hogy amilyen arányban
vállal kockázatot a viszontbiztosító, olyan arányban részesedeik a direkt biztosítóhoz
beérkez® díjból is. Bár az arányos viszontbiztosítások jelentik a legkisebb kockázatot
a direkt és viszontbiztosító számára is, nem mindig el®nyös az arányos viszontbizto-
sítás egyik fél számára sem.
A nem arányos viszontbiztosítási formáknál a direkt biztosító megtarthatja ma-
gának azokat a kockázatokat, amiket az alacsony maximális kárnagyság miatt pénz-
ügyi kapacitása elbírna, viszontbiztosítást pedig csak egy bizonyos kárösszeg túllé-
pése esetére köt. Ez az ún. kockázati alapú kártöbblet-viszontbiztosítás (Excess of
Loss, XL). Mindez persze a viszontbiztosító számára is kedvez® abból a szempont-
ból, hogy mivel csak a ritka károkból vállal egy meghatározott részt, lényegesen
alacsonyabbak az adminisztrációs költségei. Hátránya azonban, hogy a direkt biz-
tosító bátrabban vállal nagyobb kockázatokat, mint arányos viszontbiztosítási szer-
z®dés esetén. Erre megoldást jelenthet a kvóta és az XL-viszontbiztosítás kombiná-
lása, melynél a viszontbiztosító azon kárki�zetésekb®l vállal részt, melyek a direkt
biztosító saját megtartásánál magasabbak, viszont megszab egy határt arra, hogy
legfeljebb mekkora összegig térít a direkt biztosítónak saját pénzügyi egyensúlya
fenntartása érdekében. Ennek matematikai modelljét fogjuk a következ®kben ismer-
tetni.
4.1.1. A matematikai modell
A korábbi jelölésekkel legyen a ki�zetend® kárösszeg X1, melynek eloszlását F1
jelöli. Egy viszontbiztosítónak járó P1 díj, és egy x ki�zetend® kárigény esetén a di-
rekt biztosító Tx összeget �zet ki, ez az ún. saját megtartása, a maradék x−Tx pediga viszontbiztosító részesedése, ahol T egy mérhet® függvényt jelöl. Ha a díjszámí-
táshoz a várható érték elvet használjuk és Fv jelöli a viszontbiztosító részesedésének
eloszlását, akkor a viszontbiztosítónak járó díj
P1 =
∫xdFv(x) =
∫(x− Tx)dF1(x).
Érdemes megjegyezni, hogy T mérhet®sége miatt az integrál létezik és feltehetjük,
hogy véges.
Nézzük most azt az esetet, amikor az XL-viszontbiztosítást kombináljuk a kvó-
33
tával. A direkt biztosító saját megtartását jelöljük R-rel. Ekkor a direkt biztosító
azokra a kockázatokra köt viszontbitosítást, melyeknél a kárösszeg R-nél magasabb,
viszont ezek R feletti részét is -jelen esetben a kárrrendezési költségek arányában-
bizonyos mértékben maga téríti, míg a viszontbiztosító is szab egy L összeghatárt
(kapacitás), ameddig a kockázatot vállalni tudja, így kárki�zetés ezen felüli része is
a direkt biztosítót terheli. Tekintsük a korábban bevezetett károkhoz tartozó X1 és
költségekhez tartozó X2 változót. Könny¶ meggondolni, hogy ez alapján a viszont-
biztosítót terhel® összeg
g(X1, X2) = X1 − TX1 =
0, ha X1 < R
X1 −R + X1−RX1
X2, ha R ≤ X1 < L
L−R + L−RLX2, ha X1 ≥ L,
aminek várható értéke adja meg a viszontbiztosítási díj becslését. Ez kiszámolható
numerikus integrálással, valamint X1 és X2 együttes eloszlásából való szimulációval
is.
Ezek segítségével a viszontbiztosítási díj becslése:
g(X1, X2) =1
nsim
nsim∑i=1
g(X1i, X2i)
az
se(g(L,R)) =
√1
nsim
∑nsimi=1 g(X1i, X2i)2 − g(L,R)2
nsim
standard hibával, ahol nsim a szimulációk számát jelöli.
4.2. Peremeloszlások
Mivel a viszontbiztosítás szempontjából egy bizonyos küszöb feletti károk az
igazán érdekesek, kézenfekv® megoldás ezekre az adatokra valamely extrém-érték
eloszlást illeszteni.
Els®ként a vizsgált adatsorokra egymástól függetlenül illesztjük a nagy károk
modellezésekor gyakran használatos általánosított Pareto eloszlást, melyre egy u
küszöb esetén
P (X − u < y|X > u) ≈ 1− (1 +ξy
σ)−
1ξ ,
ha y > 0 és 1 + ξyσ> 0, ahol σ = σ + ξ(µ− u) és µ, σ, ξ az eloszlás paraméterei.
34
Az eloszlás megfelel® illeszkedése esetén tetsz®leges u függvényében ábrázolva
X − u átlaga lineáris függvényhez közelít. A küszöböt mind a kártérítések, mind
a költségek esetén a hozzájuk tartozó kvantilisfüggvények segítségével határoztuk
meg. Azokat az értékeket tekintjük extrémnek, melyek az adatok 95 százalékánál
nagyobbak, így X1-nél 170000, X2-nél 45945 lett a választott küszöbérték. Az elosz-
lás paramétereit maximum likelihood módszerrel becsüljük. Ez alapjánX1 eloszlását
a ξ1 =0,18 alak és σ1 =165324,98 skála paraméter jellemzi, míg X2 esetén ezek az
értékek ξ2 =0,6 és σ2 =24777,47.
Azt, hogy a feltételezett eloszlás milyen pontosan illeszkedik az adatokra, több-
féleképpen is ellen®rizhetjük. A folytonos eloszlások illeszkedésvizsgálatára gyakran
használt Kolmogorov-Smirnov próba helyett egy er®sebb, bootstrap-alapú próbát
végzünk, ami tesztel nemnegatív, illetve negatív alak paraméterrel egyaránt, és ak-
kor utasít el, ha mind a pozitív, mind a negatív paraméterrel vett próba elutasításra
kerül.
A próbát az X1-re, valamint az illesztett eloszlására alkalmazva a p-érték 0,3253,
tehát a ξ1 =0,18, σ1 =165324,98 paraméter¶ GPD-t elfogadjuk. Ugyanezt X2-re is
elvégezve a p-érték 0,8318, így a ráillesztett ξ2 =0,6, σ2 =24777,47 paraméter¶ GPD
is elfogadásra kerül.
Mindezt alátámasztják az alábbi ábrák is, melyeken a tapasztalati, illetve az
illesztett eloszlásfüggvények kvantiliseit ábrázoljuk egymással szemben.
A kártérítésekhez és költségekhez tartozó QQ-ploton is találunk 1-2 kilógó ér-
téket, ezt viszont elkerülni nem tudjuk, legfeljebb a megfelel® eloszlás illesztésével
csökkenthetjük a számukat.
4.3. Viszontbiztosítások árazása
Miután ismerjük a kárki�zetések és költségek egydimenziós, valamint együttes
eloszlását is, elvégezhetjük a szimulációt a Gumbel-kopulából. Az erre bemutatott
algoritmussal 50000 szimulációt végezve generálunk egy új mintát, majd ennnek
segítségével becsülhetjük a viszontbiztosítót várhatóan terhel® összegeket annak ka-
pacitása és a direkt biztosító saját megtartása függvényében.
Különböz® kapacitásokra megvizsgáltuk, várhatóan mekkora díjat kellene leg-
alább el®írnia a viszontbiztosítónak, hogy fedezni tudja a kártérítésekb®l fakadó ki-
adásait R és L egymáshoz való arányától függ®en. A szimulációkat a 2.4. szakaszban
35
4.1. ábra. Kártérítésekhez tartozó QQ-plot
4.2. ábra. Költségekhez tartozó QQ-plot
bemutatott módszer alapján végeztük el, majd számoltuk ki ezek alapján g értékét.
El®zetesen is sejthet®, hogy magasabb kapacitásokhoz magasabb értékek is tar-
toznak, amik viszont csökkennek, ahogy R és L aránya 1-hez közelít. Ebben az
esetben nyilván kisebb tartományban van a viszontbiztosítónak �zetési kötelezett-
36
sége, valamint a képletb®l is látható, hogy ekkor a kárrendezési költségek is csak
csekély mértékben befolyásolják a direkt biztosító számára �zetend® összeget. Az
eredményeket a 4.1. táblázat mutatja.
R/L
L 0 0,25 0,5 0,75 0,95
10000 75270 56020 37192 18532 3699
50000 108780 78625 51056 25000 4931
100000 141723 98751 62445 29657 5677
500000 239973 119033 58442 23037 3966
1000000 261459 86005 33640 11228 1752
4.1. táblázat. Viszontbiztosítási díjak becslése a Gumbel-kopulából szimulált adatok
alapján
Ahogy sejtettük is, RLnövekedésével egyre nagyobb mértékben csökkennek az
értékek, míg L emelkedédésével n®nek. Meg�gyelhet® azonban, hogy a 100000 és
500000 kapacitások közt RL
= 0, 5, míg 500000 és 1000000 között már RL
= 0, 25-
t®l ugyanazon arányokhoz alacsonyabb értékek tartoznak. Ennek oka az lehet, hogy
míg a szimulált adatok 56,11 százaléka nagyobb 100000-nél, 500000-nél már csak
8,67, 1000000-nál pedig 1,5 százaléka nagyobb, tehát a nagy károk bekövetkezésének
valószín¶sége jelent®sen kisebb, és mivel kevesebb a kár, magasabb limitnél az egy
kárra es® díjak is alacsonyabbak lesznek. A limitválasztásban nagy szerepet játszanak
a kvantilisek, így érdemes ezekre is vetni egy pillantást.
Kvantilisek
0,25 0,5 0,75 0,95
55248,9 123888,3 247166,2 605958,6
4.2. táblázat. A kárki�zetések kvantilisei a szimulált adatok alapján
Nézzük most meg, miként alakulnának ezek a díjak, ha nem vennénk �gyelembe
a kárki�zetések és költségek közti összefügg®séget, és vessük össze a kopula-modell
alapján számolt eredményekkel. Ehhez fenti táblázat értékeit fogjuk összehasonlítani
azon értékekkel, melyeket pusztán F1 és F2-b®l szimulált adatokra kapunk.
37
R/L
L 0 0,25 0,5 0,75 0,95
10000 72395 53212 35143 17467 3471
50000 105857 72663 45847 21838 4237
100000 138530 89025 53683 25000 4695
500000 236357 98805 44211 15991 2542
1000000 258195 66811 23362 7632 1111
4.3. táblázat. A becsült viszontbiztosítási díjak az F1 és F2 eloszlásokból függetlenül
vett szimulációk alapján
Látható, hogy bár az így kapott értékek hasonlóak a 4.1. táblázatbeliekhez, mind
alacsonyabbak azoknál. A kopulából szimulált adatokra kiszámított díjak a 4.3. táb-
lázat értékeihez viszonyított arányát a 4.4. táblázat tartalmazza, az alábbi ábrán
pedig az egyes kapacitásszinteken rajzoltuk ki a az RLarányokhoz tartozó viszontbiz-
tosítási díjakat mind a Gumbel-kopulán, mind a függetlenségen alapuló díjszámítás
esetén.
Az, hogy az arány minden egyes értékpárnál 1-nél nagyobb, azaz a kopula alapján
számolt értékekek magasabbak, arra utal, hogy a változók függetlenként kezelése
esetén alulárazottak lennének a viszontbiztosítások.
R/L
L 0 0,25 0,5 0,75 0,95
10000 1,04 1,05 1,06 1,06 1,07
50000 1,03 1,08 1,11 1,14 1,16
100000 1,02 1,11 1,16 1,19 1,21
500000 1,02 1,21 1,32 1,44 1,56
1000000 1,01 1,29 1,44 1,47 1,58
4.4. táblázat. Összefügg® és független változók alapján számolt díjak aránya
Jól látszik, hogy ez akkor jelentkezik a leger®sebben, ha mind a viszontbiztosító
kapacitása, mind a direkt biztosító saját megtartása magas. Ennek f®ként az az
oka, hogy az eloszlások szélei sokkal érzékenyebbek arra, ha rosszul azonosítjuk az
eloszlást.
38
4.3. ábra. Viszontbiztosítási díjak alakulása különböz® L értékekre
F®ként olyan esetekben, mikor a direkt biztosító saját megtartása alacsony, el®-
fordulhat, hogy az arány 1-nél kisebb. Ez túlárazásra utal, így ez f®ként a direkt
biztosító szempontjából hasznos információ.
Az illeszkedésvizsgálatnál láttuk, hogy a Gumbel-kopula mellett a Frank-kopula
is egész jól illeszkedik, így érdemes megvizsgálnunk azt is, melyen eredményeket
kapunk, ha abból szimulálunk adatokat. Ezt foglalja össze a 4.5. táblázat.
Ha összevetjük a Gumbel-kopulából szimulált adatokhoz tartozó táblázattal, lát-
hatjuk, hogy nincs jelent®s eltérés az eredmények közt. Meg�gyelhet® azonban, hogy
a Frank-kopulából szimulálva alacsonyabbak az értékek, és ehhez az összefügg®ségi
modellhez viszonyítva kevésbé alulárazottak a viszontbiztosítások, ha függetlennek
tekintjük a változókat. Mindemellett L = 1000000 kapacitás esetén túlárazást is
tapasztalhatunk, ami egyrészt akkor jelentkezik, amikor a direkt biztosító a teljes
kockázatot átadja a viszontbiztosítónak, másrészt mikor a saját megtartása és a
viszontbiztosító kapacitása egyaránt magas.
39
R/L
L 0 0,25 0,5 0,75 0,95
10000 73183 54464 36138 18008 3592
50000 106691 76795 49669 24177 4745
100000 139081 95731 59736 28168 5390
500000 236792 110028 49978 18106 2889
1000000 257252 72104 23792 7109 1016
4.5. táblázat. A Frank-kopulából szimulált adatok alapján becsült viszontbiztosítási
díjak
R/L
L 0 0,25 0,5 0,75 0,95
10000 1,01 1,02 1,03 1,03 1,03
50000 1,01 1,06 1,08 1,12 1,12
100000 1,001 1,08 1,11 1,13 1,15
500000 1,001 1,11 1,13 1,13 1,14
1000000 0,99 1,08 1,02 0,93 0,91
4.6. táblázat. Frank-kopulából való szimulációval kapott eredmények aránya a füg-
getlenségen alapuló értékekhez
Vegyük észre, hogy a Gumbel-kopulánál pont az L = 1000000 és RL
= 0, 95
esetben az összefügg®ségi modellb®l számolt díj 1,58-szorosa volt a függetlenségen
alapulónak, míg ez az arány a Frank-kopulánál 0,91. Ennek oka az lehet, hogy a jobb
oldali farok-összefüggés lényegesen er®sebben jelentkezik a Gumbel-kopulánál, mint
a Frank-félénél, éppen ezért érdemesebb is az el®bbit illesztenünk a rendelkezésünkre
álló adatokra.
40
5. fejezet
Összefoglalás
A dolgozatban bemutattam, miként tudjuk két valószín¶ségi változó közti kap-
csolatot vizsgálni, és ezen összefügg®ség segítségével a változók együttes eloszlását
becsülni. Eszközül erre a kopulák szolgáltak, melyek konkrét adatsorokra való illesz-
téséhez két módszert ismertettünk, valamint bemutattunk egy illeszkedésvizsgálati
próbát is, ami alapján kiválasztható, melyik a legjobban illeszked® elméleti kopula,
amib®l a marginálisok ismeretében szimulációkat is végezhetünk.
Mindez alapján jellemezni tudtuk egy biztosítótársaság kárki�zetései és költsé-
gei közti összefügg®séget, valamint becslést adtunk ezek együttes eloszlására, majd
a peremeloszlásokra is. Ezeket felhasználva megmutattuk, miként változik a viszont-
biztosítási díj különböz® direkt biztosítói saját megtartás, és viszontbiztosítói kapa-
citás esetén. Els®ként a díjak várható értékének kiszámítása az illeszkedésvizsgálat
után választott Gumbel-kopulából szimulált adatok alapján történt, majd megmu-
tattuk, mennyiben változnának a díjak, ha függetlenséget feltételezve szimplán a
peremeloszlásokból el®állított együttes eloszlásfüggvényb®l szimulálnánk a díjszá-
mításhoz, továbbá amennyiben egy másik, hasonlóan jó illeszkedést mutató kopu-
lából, a Frank-kopulából szimulálnánk. Végül pedig felismertük, hogy a költségeket
függetlennek tekintve alulárazottak lennének a viszontbiztosítások, továbbá a nem
megfelel® összefügg®ségi modell alkalmazása is lényegesen torzíthat az eredménye-
ken.
A dolgozatban szerepl® ábrák elkészítéséhez, és a számítások elvégzéséhez az R
programcsomagot használtam.
41
Irodalomjegyzék
[1] Bolla Marianna, Krámli András. Statisztikai következtetések elmélete (2005)
[2] Edward W. Frees, Emiliano A Valdez. Understanding relationships using copulas,
North American Actuarial Journal (1998)
[3] Ivan Kojadinovic, Jun Yan.Modeling Multivariate Distributions with Continuous
Margins Using the copula R package, Journal of Statistical Software (2010)
[4] Jun Yan. Enjoy the Joy of Copulas: With a Package copula, Journal of Statistical
Software (2007)
[5] Kerényi István. Viszontbiztosítás, Aktuárius jegyzetek (2011)
[6] Marco Micocci, Giovanni Masala. Loss-ALAE modeling through a copula depen-
dence structure, Investment Management and Financial Innovations (2009)
[7] Pravin K. Trivedi, David M. Zimmer. Copula modeling: An Introducion for Prac-
titioners, Foundations and Trends in Econometrics (2005)
[8] Roger B. Nelsen. An Introduction to Copulas, Springer Series in Statistics (2006)
42