Kopulák alkalmazása a nem-élet...

Eötvös Loránd Tudományegyetem

Természettudományi Kar

Kopulák alkalmazása a nem-élet

biztosításokban

Biró Bianka

Alkalmazott matematikus BSc

Témavezet®:

Dr. Zempléni András

egyetemi docens

Valószín¶ségelméleti és Statisztika Tanszék

Budapest, 2016

Tartalomjegyzék

1. A kétdimenziós összefügg®ség modellezése 7

1.1. Mér®számok az összefügg®ség vizsgálatára . . . . . . . . . . . . . . . 8

1.1.1. Pearson-féle korrelációs együttható . . . . . . . . . . . . . . . 8

1.1.2. Rangkorrelációs együtthatók . . . . . . . . . . . . . . . . . . . 8

1.1.3. Farok-összefüggés . . . . . . . . . . . . . . . . . . . . . . . . . 9

1.2. A kopulák és tulajdonságaik . . . . . . . . . . . . . . . . . . . . . . . 10

1.3. A kopulák f®bb fajtái . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

1.3.1. Elliptikus kopulák . . . . . . . . . . . . . . . . . . . . . . . . . 12

1.3.2. Arkhimédeszi kopulák . . . . . . . . . . . . . . . . . . . . . . 13

1.3.3. A kopulafajták összehasonlítása . . . . . . . . . . . . . . . . . 17

1.4. A kopulák és a rangkorrelációs együtthatók kapcsolata . . . . . . . . 19

2. Módszerek kopulák illesztésére 22

2.1. A paraméterek maximum likelihood becslése . . . . . . . . . . . . . . 22

2.2. Kopula illesztése rangszámok segítségével . . . . . . . . . . . . . . . . 23

2.2.1. Empirikus kopulák . . . . . . . . . . . . . . . . . . . . . . . . 23

2.3. A megfelel® kopula kiválasztása és az illeszkedés pontossága . . . . . 24

2.4. Szimuláció Arkhimédeszi kopulákból . . . . . . . . . . . . . . . . . . 25

3. Kopula illesztése a vizsgált adatokra 27

3.1. Az adatok bemutatása . . . . . . . . . . . . . . . . . . . . . . . . . . 27

3.2. Kopula illesztése . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

4. Alkalmazás viszontbiztosítások díjkalkulációjára 32

4.1. A viszontbiztosítások . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

4.1.1. A matematikai modell . . . . . . . . . . . . . . . . . . . . . . 33

2

4.2. Peremeloszlások . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

4.3. Viszontbiztosítások árazása . . . . . . . . . . . . . . . . . . . . . . . 35

5. Összefoglalás 41

3

Köszönetnyilvánítás

Ezúton szeretnék köszönetet mondani témavezet®mnek, Zempléni Andrásnak,

aki mindvégig �gyelemmel kísérte a munkám, hasznos tanácsokkal látott el, és segí-

tett egy olyan téma kiválasztásában, aminek feldolgozására sokszor kikapcsolódás-

ként tekinthettem.

Hálás vagyok családomnak a tanulmányaim alatt nyújtott sok-sok biztatásért és

támogatásért, valamint barátaimnak, amiért végtelen türelemmel mellettem álltak a

legnehezebb napokban is. Közülük külön köszönet illeti Rácz Nórit, aki lelkesedésével

mindvégig motivált, és olykor szinte jobban várta a szakdolgozatom elkészültét, mint

jómagam.

Végül, de nem utolsó sorban, köszönettel tartozom Banáné Gyuró Juliannának,

Szauer Anitának és Kiss Zoltánnak, akik nélkül ma 1-valószín¶séggel olyan dologgal

foglalkoznék, ami kevésbé érdekel, mint a matematika.

4

Bevezetés

A biztosítás alapait már az ókorban lefektették a kínai keresked®k, akik a szállí-

tani kívánt árut több hajóra osztották szét, csökkentve ezzel a kockázatot, hogy egy

esetleges hajótörés során a teljes árukészlet kárbavesszen, továbbá közös pénzalapot

hoztak létre a veszteségek enyhítésére. Id®vel a díjak mértékét függ®vé tették töb-

bek közt a szállított árutól, valamint az út hosszától, viszont matematikai-statisztikai

alapjai nem voltak még a díjszámításnak.

A biztosításmatematika kialakulása a valószín¶ségszámítás és statisztika fejl®dé-

sével vonható párhuzamba, melynek kezdete a XVII. századra datálható. Az id®-

közben létrejött biztosítótársaságok különböz® kockázattípusok alapján hozták létre

termékeiket, a díjak számításában pedig egyre nagyobb szerepet játszottak külön-

böz® statisztikák és az egyes kockázatok eloszlásai is. Mára már számos terméket

találunk a piacon, a biztosítók pedig különböz® kockázatfügg® modellek és alapos

elemzések segítségével törekednek az optimális díjkalkulációra, és tartanak lépést a

kockázatok folyamatos változásával és a tudomány fejl®désével.

A modern biztosításokat két nagy csoportba, az élet- és nem-életbiztosítások közé

sorolhatjuk. Az életbiztosítási szerz®dések jellemz®en hosszútávúak, melyek során a

halálozás kockázata folyamatosan n®. A nem-életbiztosításokhoz általában egy éves,

lejáratkor hosszabbítható szerz®dések tartoznak, a kockázatok pedig lényegében ál-

landónak mondhatók. Ebbe az ágba soroljuk többek közt a felel®sség-, baleset- és

lakásbiztosításokat. Nem nehéz meggondolni, hogy a két ágnál jelent®sen eltér®ek

mind a tartalékképzés, mind a díjkalkuláció módszerei.

A dolgozatban els®ként kétdimenziós összefügg®séget szeretnénk modellelzni,

amiben a kopulafüggvények lesznek segítségünkre, melyek a XX. század végén kezd-

tek teret hódítani a biztosításmatematikán túl többek között pénzügyi matemati-

kában, biológiában, valamint hidrológiában is. A széleskör¶ alkalmazhatóság nem

meglep®, ugyanis számos területen van szükség arra, hogy összefügg® valószín¶-

5

ségi változók együttes eloszlását becsüljük, ez pedig kopulák segítségével egyszer¶en

megtehet® akár magasabb dimenzióban is. A modellt alkalmazva szeretnénk viszont-

biztosítások árazásába betekintést nyerni, melyhez felel®sségbiztosítások kárki�ze-

tési összegei, valamint a hozzájuk tartozó kárrendezési költségek állnak rendelkezé-

sünkre. Sejthet®, hogy ezek nem függetlenek egymástól, továbbá mivel a költségek

nem-életbiztosításoknál igen magasak lehetnek, a díjkalkuláció során sem mondha-

tók elhanyagolandónak.

Az els® fejezetben látni fogjuk, hogy miként jellemezhet® két valószín¶ségi változó

kapcsolata, és bemutatjuk magát a kétdimenziós összefügg®ségi modellt is. Ezután

a második fejezetben különböz® módszereket ismertetünk kopulák illesztésére, majd

a harmadik fejezetben alkalmazva mindezt az általunk vizsgált adatsorokra, ered-

ményként a kárki�zetések és költségek együttes eloszlására kapunk becslést. A ne-

gyedik fejezetben megvizsgáljuk az egyes peremeloszlásokat, majd összehasonlítjuk

az összefügg®ségi modell alapján számolt viszontbiztosítási díjakat a függetlennek

tekintett változók eloszlása alapján számoltakkal.

6

1. fejezet

A kétdimenziós összefügg®ség

modellezése

Amikor több valószín¶ségi változó együttes viselkedését szeretnénk vizsgálni, az

el®ször felmerül® kérdések egyike, hogy milyen kapcsolat áll fenn köztük. Amennyi-

ben függetlenek egymástól, az együttes eloszlásfüggvényük felírható az egyes vál-

tozók eloszlásfüggvényeinek szorzataként, ezek pedig a gyakorlatban is különböz®

statisztikai módszerekkel egyszer¶en becsülhet®k. Sok esetben viszont nincs ennyire

egyszer¶ dolgunk. Gyakran van szükség ugyanis arra, hogy olyan változók együttes

eloszlására adjunk becslést, melyek nem függetlenek egymástól. Összefügg® változók

esetén ez lényegesen bonyolultabb lehet, és a dimenziószám növekedésével is egyre

több akadályba ütközhetünk. Ebben lesznek segítségünkre a kopulafüggvények, me-

lyek az egydimenziós peremeloszlásokat kapcsolják össze az együttes eloszlással egy,

a változók közti összefüggésen alapuló paraméteren keresztül. Els®ként az összefüg-

g®ség leírásához használatos mér®számokat mutatjuk be, majd bevezetjük a kopulák

de�nícióját és ismertetjük a leggyakrabban használt fajtáikat [7] és [8] alapján. Mi-

vel a dolgozatban szerepl® alkalmazásban két változó közti kapcsolatot vizsgáljuk, a

következ® de�níciókat és tételeket a kétdimenziós esetre mondjuk ki, de magasabb

dimenzióra is analóg módon kiterjeszthet®k.

7

1.1. Mér®számok az összefügg®ség vizsgálatára

Amegfelel® kopula kiválasztásához alapvet® fontosságú, hogy ismerjük a változók

közti kapcsolatot, melyet különböz® mér®számokkal jellemezhetünk attól függ®en,

hogy lineáris kapcsolatot, konkordanciát vagy az eloszlás szélein jelentkez® farok-

összefüggést szeretnénk vizsgálni.

1.1.1. Pearson-féle korrelációs együttható

A Pearson-féle korrelációs együttható a leginkább elterjedt mér®szám, ami két

változó közti lineáris kapcsolat er®sségét, valamint irányát mutatja meg.

1.1.1. De�níció. Az X1 és X2 valószín¶ségi változók Pearson-féle korrelációs együtt-

hatója a

R(X1, X2) =cov(X1, X2)

D(X1)D(X2),

ahol cov(X1, X2) = E(X1X2)−E(X1)E(X2), továbbá D(X1), D(X2) > 0 rendre X1

és X2 szórásai, E pedig a várható értéket jelöli.

Amennyiben R(X1, X2) = 0, X1-et és X2-t korreálatlannak nevezzük. Normális

eloszlású valószín¶ségi változók esetében a korreálatlanság ekvivalens a független-

séggel, ellenben más eloszlásoknál ez nincs így. Ha a változók függetlenek, akkor

korreálatlanok, viszont a korreálatlanságból nem következtethetünk függetlenségre.

A Pearson-féle korrelációs együttható további hátránya, hogy érzékeny a kiemel-

ked®en nagy, illetve kicsi értékekre, valamint mivel nem invariáns a monoton transz-

formációra, az eredeti és a kopulából generált változókra kiszámolva is más-más

értéket kapunk.

1.1.2. Rangkorrelációs együtthatók

A Pearson-féle korrelációs együttható hátrányainak kiküszöböléséhez érdemes

bevezetnünk a rangkorrelációs együtthatók fogalmát.

Ha X1-et és X2-t egy-egy mintának tekintjük, ezek nagyság szerinti sorbarende-

zésével minden adatnak megfeleltethetünk egy-egy ún. rangszámot, ami azt mutatja

meg, hogy a szóbanforgó adat hányadik legnagyobb érték a rendezett mintában.

Ezeket a rangszámokat használva nem kell attól tartanunk, hogy a kiugró értékek

8

torzítanak az eredményen. A Spearman- és a Kendall-féle rangkorrelációs együttha-

tókkal a változók együttmozgását vizsgálhatjuk, utóbbi segítségével pedig egysze-

r¶en kifejezhetjük az Arkhimédeszi kopulák összefügg®ségi paraméterét is.

Kendall-féle τ

1.1.2. De�níció. Legyen (X11, X21) és (X12, X22) két független koordinátapár F-b®l.

Ekkor

ρτ (X1, X2) = P [(X11 −X12)(X21 −X22) > 0]− P [(X11 −X12)(X21 −X22) < 0]

a Kendall-féle rangkorrelációs együttható.

A de�nícióban szerepl® P [(X11 −X12)(X21 −X22) > 0] az egyez® (konkordáns)

párok valószín¶sége, míg P [(X11 −X12)(X21 −X22) < 0] az ellentétes (diszkordáns)

pároké. A konkordanciából arra következtethetünk, hogy az egyes változók nagy

értékei állnak összefüggésben, míg a diszkordancia arra utal, hogy az egyik változó

nagy, és a másik kis értékei között tapasztalhatunk összefüggést.

Spearman-féle ρ

A Spearman-féle rangkorrelációs együttható a rangszámok közti Pearson-féle kor-

reláció.

1.1.3. De�níció. Jelölje di az X1i- és X2i-hez tartozó rangszámok különbségét i =

1, 2, ..., n-re n-dimenziós vektorváltozók esetén. Ekkor a Spearman-féle rangkorrelá-

ciós együttható a

ρS = 1− 6∑d2i

n(n2 − 1).

Hasonlóan Pearson korrelációs együtthatójához, ρS és ρτ értékei is -1 és 1 között

helyezkednek el, szimmetrikusak, valamint 0-val való egyenl®ségük esetén egymástól

függetlennek tekintjük a változókat.

1.1.3. Farok-összefüggés

A gyakorlatban sokszor f®ként az extrém-értékek között fennálló konkordancia

kérdése az érdekes. Ennek vizsgálata azon a feltételes valószín¶ségen alapul, hogy

9

az egyik változó meghalad-e egy rögzített küszöbértéket azon feltétel mellett, hogy

a másikról tudjuk, hogy igen.

Jelölje S a változók együttes túlélésfüggvényét, azaz v ∈ [0, 1]-re

S(v, v) = P (F−11 (X1) > v, F−1

2 (X2) > v).

Ekkor λL-el jelölve az alsó és λU -val a fels® farok-összefüggést,

λL = limv→0

P (F−11 (X1) < v|F−1

2 (X2) < v),

λU = limv→1

P (F−11 (X1) > v|F−1

2 (X2) > v).

Amennyiben λL = 0, nem tapasztalhatunk bal oldali, λU = 0 esetén jobb oldali

farok-összefüggést az adatok közt. Az extrém-érték elmélet biztosítási alkalmazása-

iban λU vizsgálata széles körben elterjedt, ugyanis segítségével felmérhet® annak a

valószín¶sége, hogy egy nagy káresemény bekövetkezése más egyéb hasonló mérték¶

károkat von maga után.

1.2. A kopulák és tulajdonságaik

1.2.1. De�níció. Legyen U egy tetsz®leges [0, 1]2-beli vektorváltozó, melynek U1

és U2 marginálisai a [0, 1] intervallumonn egyenletes eloszlást követnek. Azon C :

[0, 1]2 → [0, 1] függvényeket, melyek felírhatók

C(u1, u2) = P (U1 ≤ u1, U2 ≤ u2) (1.1)

alakban, (kétdimenziós) kopuláknak nevezzük.

Mivel C egy kétdimenziós eloszlásfüggvényt de�niál, minden kopulára teljesülnek

az alábbi tulajdonságok:

1. C (0, u) = C (u, 0) = 0

2. C (1, u) = C (u, 1) = u, ∀u ∈ [0, 1]

3. C (v1, v2) + C (u1, u2) ≥ C (v1, u2) + C (u1, v2) , ∀(u1, u2) ∈ [0, 1]2; (v1, v2) ∈[0, 1]2], 0 ≤ u1 ≤ v1 ≤ 1; 0 ≤ u2 ≤ v2 ≤ 1

10

Vegyük észre, hogy minden kétdimenziós eloszlásfüggvényhez rendelhetünk ko-

pulát. Ismeretes ugyanis, hogy tetsz®leges folytonos valószín¶ségi változót integ-

ráltranszformációval [0, 1] intervallumon egyenletes eloszlásúvá transzformálhatunk,

azaz véve egy F1 eloszlásfüggvény¶ X1 és egy F2 eloszlásfüggvény¶ X2 változót,

j = 1, 2-re:

P (Fj(Xj) ≤ u) = P (Xj ≤ (F−1j )(u)) = Fj(F

−1j (u)) = u.

1.2.2. Megjegyzés. Amennyiben Fj nem invertálható, F−1j az általánosított inver-

zet jelöli.

Továbbá

C(u1, u2) = P (F1(x1) ≤ u1, F2(x2) ≤ u2) =

= P (X1 ≤ F−11 (u1), X2 ≤ F−1

2 (u2)) =

= F (F−11 (u1), F

−12 (u2)),

amib®l adódóan

C(F1(x1), F2(x2)) = F (x1, x2) (1.2)

egy kétváltozós eloszlásfüggvényt de�niál F1 és F2 marginálisokkal.

Ezáltal tehát a kopulák lehet®vé teszik számunkra, hogy a peremeloszlásokat kü-

lön vizsgáljuk az együttes eloszlástól, valamint magasabb dimenzióban is kényelmes

eszközként szolgálnak a változók együttes viselkedésének tanulmányozására.

A kopulák elméleti alapjait Wassily Hoe�ding fektette le 1940-ben, majd Mau-

rice Fréchet kezdte vizsgálni a kapcsolatot többdimenziós eloszlások és azok perem-

eloszlásai között. Mindezek után Abe Sklar 1959-ben mutatta meg, hogy bármely

többváltozós eloszlásfüggvény felírható az (1.2) alakban, továbbá a peremeloszlások

folytonossága esetén a kopula egyértelm¶. Ezt az eredményt foglalja össze az alábbi

tétel:

1.2.3. Tétel (Sklar). Legyenek X1 és X2 valószín¶ségi változók, melyek eloszlás-

függvényei rendre F1 és F2, együttes eloszlásfüggvényüket pedig jelölje F . Ekkor lé-

tezik egy C kopula, melyre

F (x1, x2) = C(F1(x1), F2(x2)).

F1 és F2 folytonossága esetén C egyértelm¶.

11

1.3. A kopulák f®bb fajtái

A leggyakrabban használt kopulákat két nagy családba, az elliptikus és Arkhimé-

deszi kopulák közé sorolhatjuk. A következ®kben ezen kopulacsaládok, és az ezekbe

tartozó nevezetes kopulák kerülnek bemutatásra.

1.3.1. Elliptikus kopulák

Az elliptikus kopulák sajátosságai, hogy valamely elliptikus eloszlásból származ-

tatjuk ®ket, ezáltal hasonlóan könnyen tudunk szimulálni is bel®lük, mint az ellipti-

kus eloszlásokból.

Az elliptikus eloszlások a többváltozós normális eloszlások általánosításai, melyek

számos biztosítási és pénzügyi alkalmazásban jelentenek hatékony eszközt különböz®

kockázatok eloszlásainak vizsgálatára.

1.3.1. De�níció. Az X = (X1, X2) valószín¶ségi vektorváltozót (µ,Σ, ζ) paramé-

ter¶ elliptikus eloszlásúnak mondjuk, ha karakteriszikus függvénye

φX(t) = exp(itTµ)ζ(tTΣt)

alakú, ahol µ egy kétdimenziós oszlopvektor, Σ egy 2× 2-es pozitív de�nit mátrix, ζ

pedig az ún. karakterisztikus generátorfüggvény.

A legfontosabb példa elliptikus eloszlásokra a normális és t-eloszlás. Az alábbi-

akban az ezekb®l származtatott kopulákat mutatjuk be.

Gauss-kopula

1.3.2. De�níció. Jelölje Φ az egy-, ΦR a kétdimenziós, R korrelációmátrixú stan-

dard normális eloszlás eloszlásfüggvényét. Ekkor a

CG(u1, u2) = ΦR(Φ−1(u1),Φ

−1(u2))

a kétdimenziós normális eloszlás kopuláit, a Gauss-kopulákat határozza meg.

A pozitív, illetve negatív paraméter¶ Gauss-kopulák közti különbséget az 1.1.

ábra szemlélteti, valamint az is jól látszik, hogy az összefügg®ség az eloszlás szélein

jelentkezik er®sebben.

12

1.1. ábra. Gauss-kopula pozitív és negatív paraméterrel

Student-féle t-kopula

1.3.3. De�níció. A Student-féle t-kopula a a kétdimenziós t-eloszlásból származta-

tott kopula, azaz

CR,ν(u1, u2) = tR,ν(t−1ν (u1), t

−1ν (u2)),

ahol ν a t-eloszlás szabadságfokát, R a változók korrelációmátrixát jelöli.

A kopula szélein az összefügg®ség er®ssége a korrelációtól és ν értékét®l függ,

valamint ahogy a paraméter ∞-hez közelít, CR,ν(u1, u2) → ΦR(u1, u2). A t-eloszlás

sajátossága továbbá, hogy az eloszlás szabadságfokával megegyez®, vagy annál ma-

gasabb rend¶ momentumai nem léteznek.

1.3.2. Arkhimédeszi kopulák

1.3.4. De�níció. Legyen ψ : [0, 1] → [0,∞] folytonos, szigorúan monoton csökken®

konvex függvény, melyre ψ(1) = 0, ψ(0) = ∞. A ψ[−1] : [0,∞] → [0, 1] függvényt ψ

pszeudo-inverzének nevezzük, ha

ψ[−1](t) =

{ψ−1, ha 0 ≤ t ≤ ψ(0)

0, ha ψ(0) ≤ t ≤ ∞.

1.3.5. Lemma. Legyen ψ a fenti de�níció feltételeinek eleget tev® függvény, mely-

nek pszeudo-inverze ψ[−1]. Ekkor ha C felírható

C(u1, u2) = ψ[−1](ψ(u1) + ψ(u2)) (1.3)

13

alakban, akkor C teljesíti a kopulák határaira vonatkozó feltételeket, azaz ∀u ∈ [0, 1]

C (0, u) = C (u, 0) = 0

C (1, u) = C (u, 1) = u.

Bizonyítás. A határokon vizsgálva (1.3) képlettel felírt függvényt,

C(u1, 0) = ψ[−1](ψ(u1) + ψ(0)) = 0,

C(u1, 1) = ψ[−1](ψ(u1) + ψ(1)) = ψ[−1](ψ(u1)) = u1.

A szimmetrikusságot kihasználva pedig adódik, hogy C(0, u2) = 0 és C(1, u2) = u2,

ez pedig pontosan az, amit be szerettünk volna látni. �Az alábbi tételben szükséges és elégséges feltételt kapunk annak igazolására,

hogy ψ egy, a [0, 1] intervallumon egyenletes eloszlású marginálisokkal rendelkez®

kétdimenziós eloszlásfüggvényt generál, és az (1.3) alakban felírt C valóban egy

kopulát határoz meg.

1.3.6. Tétel. Legyen ψ : [0, 1] → [0,∞] folytonos, szigorúan csökken® függvény,

melyre ψ(1) = 0, és legyen ψ pszeudo-inverze ψ[−1]. Ekkor C : [0, 1]2 → [0, 1],

melyre C(u1, u2) = ψ[−1](ψ(u1) + ψ(u2)) pontosan akkor de�niál egy kétdimenziós

kopulát, ha ψ konvex.

Bizonyítás. Láttuk, hogy C teljesíti a kopulák határaira vonatkozó feltételeket,

továbbá belátható, hogy

C(v2, u2)− C(v1, u2) ≤ v2 − v1. (1.4)

pontosan ψ konvexitása esetén áll fenn. Vegyük észre, hogy ezzel a felírással ekviva-

lens v1 ≤ v2-re a

v1 + ψ[−1](ψ(v2) + ψ(u2)) ≤ v2 + ψ[−1](ψ(v1) + ψ(u2)),

ami a = ψ(v1), b = ψ(v2) és c = ψ(u2) helyettesítéssel

ψ[−1](a) + ψ[−1](b+ c) ≤ ψ[−1](b) + ψ[−1](a+ c), (1.5)

14

ahol a ≥ b és c ≥ 0. Tegyük fel, hogy (1.4) fennáll és ψ[−1] teljesíti (1.5)-öt. Vá-

lasszunk egy tetsz®leges s és t számot a [0,∞] intervallumból, melyekre 0 ≤ s < t.

Ha a = s+t2, b = s és c = t−s

2, akkor

ψ[−1](s+ t

2) ≤ ψ[−1](s) + ψ[−1](t)

2.

Mivel ψ[−1] így teljesíti a konvexitás feltételeit, a tétel egyik irányát ezzel beláttuk.

A másik irány bizonyításához tegyük fel, hogy ψ[−1] konvex. Rögzítsük a, b és c

értékét a [0, 1] intervallumban úgy, hogy a ≥ b és c ≥ 0, továbbá legyen γ = a−ba−b+c

.

Így a = (1− γ)b+ γ(a+ c) és b+ c = γb+ (1− γ)(a+ c), amib®l

ψ[−1](a) ≤ (1− γ)ψ[−1](b) + γψ[−1](a+ c),

ψ[−1](b+ c) ≤ γψ[−1](b) + (1− γ)ψ[−1](a+ c).

Az egyenl®tlenségeket összeadva pont (1.5)-öt kapjuk, amivel a tétel másik felét is

igazoltuk. �A ψ által generált, C(u1, u2) = ψ[−1](ψ(u1) + ψ(u2)) alakban el®álló kopulákat

nevezzük Arkhimédeszi kopuláknak, melyek összefügg®ségi paraméterét a generá-

torfüggvény határozza meg. Az Arkhimédeszi kopulák általában - szemben az ellip-

tikusok családjával - felírhatók zárt alakban, valamint nem valamely többváltozós

eloszlásból származnak. Alapvet® tulajdonságaik közé tartozik a szimmetria és az

asszociativitás is, azaz:

1. C(u, v) = C(v, u)

2. C(C(u, v), z) = C(u,C(v, z))

Az Arkhimédeszi kopulákat a generátorfüggvény választásától függ®en különböz-

tethetjük meg egymástól, ψ tulajdonságai pedig jelent®sen befolyásolják a kopula

szélein jelentkez® bal és jobb oldali farok-összefüggését. Az alábbiakban a Frank-,

Clayton- és Gumbel-kopulákat fogjuk jellemezni és illusztrálni.

Frank-kopula

1.3.7. De�níció. Az α ∈ (−∞,∞) összefügg®ségi paraméter és ψ(t) = log(

eαt−1eα−1

)generátorfüggvény által meghatározott Frank-kopula:

CFr(u1, u2) = − 1

α· log(1 + (e−αu1 − 1)(e−αu2 − 1)

e−α − 1).

15

Mivel α ∈ (−∞,∞), el®fordulhat a marginálisok között negatív összefüggés is,

valamint meg�gyelhet®, hogy az eloszlás közepe nem szóródik. A Frank-kopula a

gyakorlatban olyan adatsorokra alkalmazható, melyeknél mind a kis, és mind a nagy

értékek közti összefüggés gyenge.

1.2. ábra. Frank-kopula pozitív és negatív paraméterrel

Clayton-kopula

1.3.8. De�níció. Az α ∈ (0,∞) összefügg®ségi paraméter¶ Clayton-kopula generá-

torfüggvénye a ψ(t) = t−α − 1, így a kopulát a következ® alakban íthatjuk fel:

CCl(u1, u2) = (u−α1 + u−α

2 − 1)−1/α.

Mivel α a pozitív félegyenesen helyezkedik el, nem tapasztalhatunk negatív össze-

függést a változók közt, továbbá ahogy α 0-hoz közelít, a marginálisok közti össze-

függ®ség mértéke is csökken.

A Clayton-kopulánál a bal oldali farok-összefüggés igen er®s, míg ehhez képest a

jobb oldali gyenge. Éppen ezért a gyakorlatban jól alkalmazható egymással korreáló

kockázatok vizsgálatára, többek között két életre szóló életbiztosítások árazásánál is.

Életbiztosításokkal foglalkozó szakemberek számára ugyanis ismert jelenség az ún.

"broken heart syndrom", azaz az összetört szív szindróma. Statisztikai eredmények

mutatják, hogy egy házaspár egyik tagjának elhalálozása után egy bizonyos id®in-

tervallumban a másikuk halálozási valószín¶sége is megn®, ez pedig a két életre szóló

életbiztosítások díjkalkulációjánál nem elhanyagolandó tényez®, kopulák segítségével

pedig jól modellezhet®.

16

Gumbel-kopula

1.3.9. De�níció. Ha α ∈ [1,∞) és a generátorfüggvény ψ(t) = (− log(t))α alakú,

akkor

CGu(u1, u2) = exp{−[(− log(u1))

α + (− log(u2))α]1/α

}a Gumbel-kopulát de�niálja.

Hasonlóan a Clayton-kopulához, nem tapasztalhatunk negatív összefüggést a

marginálisok között, viszont vele ellentétben er®s a farok-összefüggés a jobb, és

gyenge a bal oldalon. Éppen ezért, ha az általunk vizsgált adatsorok nagy érté-

kei er®sen korreálnak, míg a kisebbek kevésbé, a Gumbel-kopula jó választásnak

bizonyulhat.

1.3.3. A kopulafajták összehasonlítása

Láthattuk, hogy különböz® kopulához eltér® tulajdonságú paraméterek tartoz-

nak, valamint el®állításuk is többféleképp történhet. Az alábbi ábrákon ugyanolyan

összefügg®ségi paraméter mellett ábrázoljuk a bemutatott kopulákat, a Gauss- és

t-kopuláknak pedig a ν = 3 szabadságfokot választottuk.

Minden típusnál meg�gyelhet®, hogy milyen értékek között jelentkezik az er®sebb

összefügg®ség, valamint az eredeti peremeloszlások által okozott eltérés is. Az 1.3.

ábrán már τ = 0.4 esetén is jól látszik az összefüggés er®ssége a Clyaton-kopulán a

kicsi, míg a Gumbel-kopulán a nagy értékek közt, a Frank-, Gauss- és t-kopulánál

viszont magasabb korrelációnál jelentkezik ez szemléletesebben, ahogy azt a további

ábrák mutatják.

1.3. ábra. Arkhimédeszi kopulák ρτ = 0.4 rangkorrelációs együtthatóval

17

1.4. ábra. Arkhimédeszi kopulák ρτ = 0.6 rangkorrelációs együtthatóval

1.5. ábra. Elliptikus kopulák ρτ = 0.4 mellett, a t-kopula ν = 3 szabadságfokkal

A Gauss- és a t-kopula közti különbség f®ként a farok-összefüggésben nyilvánul

meg. A t-kopula rugalmas, mert amellett, hogy az eloszlás szélein fellép® összefüg-

g®séget is mutathatja, az eloszlás közepén fellép® összefügg®ség modellezésére is

alkalmas.

1.6. ábra. Elliptikus kopulák ρτ = 0.6 mellett, a t-kopula ν = 3 szabadságfokkal

18

1.4. A kopulák és a rangkorrelációs együtthatók kap-

csolata

Korábban már láttuk, hogy az összefügg®ségi mér®számok közül a Pearson-féle

korrelációs együttható nem invariáns a monoton transzformációra, így nem-elliptikus

eloszlású változókra alkalmazva félrevezet® eredményeket kaphatunk. Ennek elkerü-

lése érdekében vezettük be a rangkorrelációs együtthatókat. A Spearman-féle ρ és a a

Kendall-τ kopulákkal való kapcsolatát ismertetjük a következ®kben [8] segítségével,

ugyanis mindkét együttható kifejezhet® a kopulákból, továbbá utóbbi segítségével

az Arkhimédeszi kopulák paramétere is kiszámolható.

1.4.1. Állítás. Tetsz®leges C kopulából a Spearman-féle ρ értékét a

ρS(X1, X2) = 12

∫ 1

0

∫ 1

0

C(u1, u2)du1du2 − 3

integrál kiszámításával kaphatjuk meg.

Tegyük fel, hogy X1 eloszlásfüggvénye F1, X2-é pedig F2, és legyen F1(X1)∼U1,

F2(X2)∼U2. Ebb®l adódóan

ρS(X1, X2) = 12

∫ 1

0

∫ 1

0

C(u1, u2)du1du2 − 3 = 12E(U1, U2)− 3 =

=E(U1, U2)− 1

4112

=Cov(U1, U2)√D(U1)

√D(U2)

=

= ρ(F1(X1), F2(X2)).

Tehát ρS nemmás, mint azX1-b®l ésX2-ból integráltranszformációval kapott F1(X1)

és F2(X2) közti korrelációs együttható.

Nézzük most meg, mit mondhatunk el a kopulák és a Kendall-τ kapcsolatáról!

1.4.2. Állítás. A Kendall-τ a

ρτ (X1, X2) = 4

∫ 1

0

∫ 1

0

C(u1, u2)dC(u1, u2)− 1

formula segítségével fejezhetjük ki tetsz®leges C kopulából.

19

Bizonyítás. Láttuk, hogy ρτ az X1 és X2 közti konkordancia és diszkordancia

valószín¶ségének különbsége, azaz

ρτ (X1, X2) = P [(X11 −X12)(X21 −X22) > 0]− P [(X11 −X12)(X21 −X22) < 0].

Mivel X1 és X2 folytonos,

P [(X11 −X12)(X21 −X22) < 0] = 1− P [(X11 −X12)(X21 −X22) > 0],

így ρτ felírható ρτ (X1, X2) = 2P [(X11 −X12)(X21 −X22) > 0]− 1 alakban, melyb®l

átalakítással

P [(X11 −X12)(X21 −X22) > 0] =

= P [(X11 > X12), (X21 > X22)] + P [(X11 < X12), (X21 < X22)].

Ebb®l P [(X11 > X12), (X21 > X22)] = P [(X12 < X11), (X22 < X21)] =

=

∫ +∞

−∞

∫ +∞

−∞P [(X12 ≤ x1), (X22 ≤ x2)]dC(F1(x1), F2(x2)) =

∫ +∞

−∞

∫ +∞

−∞C(F1(x1), F2(x2))dC(F1(x1), F2(x2)),

ahol u1 = F1, u2 = F2 transzformációval

P [(X11 > X12), (X21 > X22)] =

∫ 1

0

∫ 1

0

C(u1, u2)dC(u1, u2).

Hasonlóan, P [(X11 < X12), (X21 < X22)] =

=

∫ +∞

−∞

∫ +∞

−∞P [(X12 > x1), (X22 > x2)]dC(F1(x1), F2(x2)) =

=

∫ +∞

−∞

∫ +∞

−∞[1− F1(x1)− F2(x2) + C(F1(x1), F2(x2))]dC(F1(x1), F2(x2)) =

=

∫ 1

0

∫ 1

0

[1− u1 − u2 + C(u1, u2)]dC(u1, u2).

Tudjuk, hogy C a [0, 1] intervallumon egyenletes eloszlású U1 és U2 változók együttes

eloszlása, így E(U1) = E(U2) =12, amib®l

P [(X11 < X12), (X21 < X22)] = 1− 1

2− 1

2+

∫ 1

0

∫ 1

0

C(u1, u2)dC(u1, u2) =

20

=

∫ 1

0

∫ 1

0

C(u1, u2)dC(u1, u2).

Tehát P [(X11 < X12), (X21 < X22)] + P [(X11 < X12), (X21 < X22)] =

P [(X11 −X12)(X21 −X22) > 0] = 2

∫ 1

0

∫ 1

0

C(u1, u2)dC(u1, u2),

amib®l következik, hogy

ρτ (X1, X2) = 2P [(X11 −X12)(X21 −X22) > 0]− 1 =

= 4

∫ 1

0

∫ 1

0

C(u1, u2)dC(u1, u2)− 1.

Ez pedig pontosan az, ami be szerettünk volna látni. �Ahogy már korábban említettük, a Kendall-τ segítségével meghatározhatjuk az

Arkhimédeszi kopulák összefügg®ségi paraméterét is. Ezt az alábbi táblázat foglalja

össze, ahol a Frank-kopula paraméterét kifejez® képletben D1(−α) = D1(α) +α2,

D1(α) =1

α

∫ α

0

t

et − 1dt.

Kopulacsalád ρτ

Clayton αα+2

Frank 1− 4α(D1(−α)− 1)

Gumbel 1− 1α

1.1. táblázat. α és ρτ közti kapcsolat

21

2. fejezet

Módszerek kopulák illesztésére

Ebben a fejezetben két jól alkalmazható módszert fogunk bemutatni a megfelel®

kopula kiválasztására, majd teszteljük a becslések pontosságát is.

2.1. A paraméterek maximum likelihood becslése

A kopula és a marginálisok paramétereinek becslésére a statisztika területén

gyakran használt maximum likelihood (ML) módszert fogjuk alkalmazni, melyben

[1] és [4] lesz segítségünkre. Legyen θ a becsülend® paraméterekb®l álló vektor.

Az ML-becslés lényege, hogy adott mintarealizáció mellett a paraméter becslése-

ként azt a θ-ot fogadjuk el, mely esetén maximális annak a valószín¶sége, hogy

az adott mintarealizációt kapjuk. A módszer az eme valószín¶séget tükröz® ún.

likelihood-függvényt maximalizálja, mely alatt a mintaelemek együttes valószín¶-

ségét, illetve s¶r¶ségfüggvényét értjük.

Sklar tételéb®l ismeretes, hogy egy 2-dimenziós F eloszlásfüggvény a hozzá tar-

tozó F1 és F2 peremeloszlások, valamint a C kopula segítségével az

F (x1, x2) = C(F1(x1), F2(x2))

alakban írható fel, melyb®l adódik, hogy X1 és X2 együttes s¶r¶ségfüggvénye

f(x1, x2) = c(F1(x1), F2(x2))f1(x1)f2(x2),

ahol c-vel a kopulához tartozó s¶r¶ségfüggvényt jelöljük.

Tekintsük a θ = (θ1, θ2, α) paramétervektort, melyben θ1 az X1, θ2 az X2 elosz-

lásának paramétereit tartalmazó vektorok, α pedig a kopula paramétere.

22

Ekkor a loglikelihood-függvény:

ℓ(θ) =n∑

i=1

log[c(F1(Xi1; θ1), F2(Xi2; θ2);α)] +n∑

i=1

2∑j=1

log fj(Xij; θj),

ahol (Xi1, Xi2) : i = 1, .., n független mintarealizációkat jelönlnek.

Ebb®l θ becslése: θ =argmaxℓ(θ)

Biztosítók kárki�zetéseinek vizsgálatakor gyakran feltételezhetjük, hogy azok log-

normális, Pareto-, Weibull- vagy valamely extrém-érték eloszlást követnek.

2.2. Kopula illesztése rangszámok segítségével

Bemutatunk egy olyan módszert is [3] alapján, melyben a kopula becslése nem

függ a peremeloszlásoktól, így nem kell attól tartanunk, hogy a marginálisok eset-

leges félreazonosítása módosítana az eredményen. Az egyes adatsorokhoz tartozó

rangszámok segítségével írjuk fel az empirikus kopulát, majd kiválasztjuk az ismert

Arkhimédeszi kopulák közül a legjobban illeszked®t.

2.2.1. Empirikus kopulák

Tekintsük az X(i) = (Xi1, Xi2) koordinátapárokat, majd rendezzük nagyság sze-

rinti sorba X1 és X2 elemeit. Az így kapott rendezett mintában Xij rangját Rij-vel

fogjuk jelölni, és az általuk meghatározott R(i) = (Ri1, Ri2) vektorok segítségével

írjuk fel az empirikus kopulát. Mivel a vizsgált kétdimenziós kopulák a [0, 1]2 egy-

ségnégyzeten vannak értelmezve, a rangokhoz hozzárendelünk egy-egy Ui ∈ [0, 1]2

ún. pszeudo-meg�gyelést az alábbi módon:

U (i) =R(i)

n+ 1,

mellyel ekvivalens de�níció az

Uij =n

n+ 1· Fj(Xij),

ahol Fj az Xj tapasztalati eloszlásfüggvényét jelöli.

23

Ezek alapján már fel tudjuk írni az empirikus kopulát, ami nem más, mint a

pszeudo-meg�gyelések tapasztalati eloszlásfüggvénye, azaz

Cn(u) =1

n·

n∑i=1

χ(Ui < u).

Mivel Cn konzisztens becslése a keresend® C-nek, így a minta elemszámának

növelésével egyre jobb becslését kapjuk a kopulának. A módszer további el®nye,

hogy C becslése a rangszámokból álló R(i) vektorokon alapul. Ezáltal pedig a kiugró

értékekre sem lesz érzékeny, mert nem a konkrét adatokkal számolunk.

Érdemes megjegyezni, hogy bár közelíteni tudtuk a kopulát az eredeti marginá-

lisok ismerete nélkül, a gyakorlatban nem kerülhetjük el ezek becslését sem. Ha az

eredeti adatokra illesztett eloszlásra vagyunk kíváncsiak, szükség van a peremelosz-

lásokra is.

2.3. A megfelel® kopula kiválasztása és az illeszke-

dés pontossága

Tekintsük a már korábban de�niált Cn empirikus kopulát, valamint a keresett C-

t becsl® Cθn-t a H0 : C ∈ Cθ nullhipotézis mellett. Az empirikust legjobban közelít®

kopula kiválasztásához az

Sn =n∑

i=1

(Cn(Ui)− Cθn(Ui))2

statisztika lesz segítségünkre. Ahogy azt már az el®z® szakaszban láttuk, minél na-

gyobb a minta elemszáma, Cn annál jobb becslése C-nek. Ezt kihasználva a dolgo-

zatban egy bootstrap-alapú illeszkedésvizsgálati módszert alkalmazunk.

A bootstrap eljárás a meglév® mintából generál véletlenszer¶en új mintákat, új

információt adva a mintáról a pontosabb becslés érdekében. A vizsgálat a követke-

z®képp zajlik:

1. Az U1, ..., Un pszeudo-meg�gyelések alapján felírjuk az empirikus kopulát, majd

C θ paraméterét becsüljük θn segítségével.

2. Kiszámoljuk az Sn statisztika értékét.

24

3. Veszünk egy nagy n egészt és minden k ∈ {1, ..., N}-re megismételjük az alábbi

lépéseket:

• A Cθn kopulából generálunk egy X(k)1 , ..., X

(k)n véletlen mintát és kiszá-

moljuk az ezekhez tartozó U (k)1 , ..., U

(k)n pszeudo-meg�gyeléseket.

• Felírjuk a

C(k)n (u) =

1

n

n∑i=1

χ(U(k)i ≤ u), u ∈ [0, 1]2

empirikus kopulát és U (k)1 , ..., U

(k)n -ból kiszámoljuk θ(k)n -t.

• H0 fennállása mellett megadjuk Sn egy közelít® realizációját:

S(k)n =

n∑i=1

(C(k)n (U

(k)i )− C

θ(k)n(U

(k)i ))

2

• A próba p-értékének közelítése:

1

n

n∑i=1

χ(S(k)n ≥ Sn)

A próbát végrehajtjuk minden szóbajöv® kopulára, és végül a p-értékek, az egyes

kopulafajták ismert tulajdonságai, valamint az elkészített ábrák segítségével választ-

juk ki azt a kopulát, amely a legjobban leírja a változók közti összefüggést.

A módszer segítségével bár megbízható eredményt kapunk a legjobban illeszked®

paraméteres kopula kiválasztásához, hátránya, hogy rendkívül lassú, ugyanis minden

lépésben véletlen számokat generálunk, emellett pedig szükség van a kopula para-

métereinek becsléseire is. Amennyiben nagy elemszámú minta áll rendelkezésünkre,

érdemes más illeszkedésvizsgálati módszert alkalmazni, ami nem a bootstrap eljárást

veszi alapul.

2.4. Szimuláció Arkhimédeszi kopulákból

A kopulák lehet®vé teszik számunkra, hogy egyszer¶en szimuláljunk többdimen-

ziós eloszlásokból. Szükségünk van egy algoritmusra, aminek segítségével el®állítha-

tunk egy olyan X1 és X2 változót, melyek együttes eloszlásfüggvénye

F (x1, x2) = C(F1(X2), F2(X2)). Az Arkhimédeszi kopulák esetében láttuk, hogy

C(u1, u2) = ψ−1(ψ(u1) + ψ(u2)).

25

Ismerve X1 és X2 együttes eloszlását, X2 rekurzívan el®állítható ennek X1-re

vonatkozó feltételes eloszlásának segítségével, ahogy ez [2]-ben is olvasható. Az al-

goritmus a következ®:

1. Els®ként generálunk egy U1 és U2 [0, 1] intervallumon egyenletes eloszlású vál-

tozót.

2. El®állítjuk X1-et: X1 = F−11 (U1), és c0-t 0-nak tekintjük.

3. Rekurzívan X2-t

U2 = F2(X2|x1) =ψ−1 (ψ(F1(x1)) + ψ (F2(x2)))

ψ−1(ψ(F1(x1))

megoldásaként számítjuk ki.

26

3. fejezet

Kopula illesztése a vizsgált adatokra

Utalunk már rá korábban, hogy a kopulák jelent®s szerepet játszanak a bizto-

sítások területén. A dolgozatban egy nem-élet biztosítási alkalmazást mutatunk be

Edward W. Frees és Emiliano A. Valdez Understanding relationships using copulas

[2] cím¶ cikke alapján, melyhez rendelkezésünkre áll egy biztosítótársaság 1500 fele-

l®sségbiztosításának kárki�zetéséb®l álló adatsor, valamint az egyes károkhoz tartozó

kárrendezési költségek. Ebben a fejezetben ezek együttes eloszlásának meghatáro-

zása a célunk, melyhez az el®z® fejezetben de�niált Arkhimédeszi kopulák lesznek

segítségünkre.

3.1. Az adatok bemutatása

Jelölje ezentúl X1 a kárki�zetésekb®l, X2 a költségekb®l álló 1500 elem¶ mintát.

Ahogy a 3.1. táblázatból is látszik, ugyanakkora kárki�zetési összegekhez tartozhat-

nak lényegesen eltér® költségek, viszont el®forfulhat, hogy egyes károknál a kárren-

dezési költségek sokkal magasabbak, mint maga a kártérítés. Feltételezhet® azonban,

hogy magas költségek f®ként nagy károkhoz tartoznak.

A 3.2. táblázat a két minta alapstatisztikáit foglalja össze. Láthatjuk, hogy mind

a kártérítések, mind a költségek közt csak pozitív értékek szerepelnek, viszont el®for-

dulhatna akár olyan helyzet is, hogy tartalmaz az adatsor költség nélküli kártérítést

vagy éppen költségeket, melyek olyan károk bekövezésekor keletkeztek, amiket végül

a biztosító nem �zetett ki. Az ilyen esetek vizsgálatát külön kellene elvégeznünk egy

speciálisabb modell segítségével.

27

X1 X2

24 5658

1974 775

2250 2182

2250 8204

14500 625

3.1. táblázat. Részlet az adatokból

X1 X2

Minimum 10 15

Maximum 2173595 501863

Átlag 41208 12588

Medián 12000 5471

Szórás 102747,7 28145,64

3.2. táblázat. Alapstatisztikák

Az már el®zetes vizsgálatok nélkül is sejthet®, és a 3.1 ábra is jól mutatja, hogyX1

és X2 nem független egymástól. Példaként gondoljunk csak arra, hogy egy nagyobb

irodaházban bekövetkezett t¶zesetkor amellett, hogy a biztosítónak feltehet®en igen

magas kártérítést kell ki�zetni, a kárfelmérés is jelent®s költségekkel jár.

Ahogy már az 1.3. szakaszban is láttuk, a Pearson-féle korrelációs együttható

helyett érdemesebb a rangkorrelációs együtthatók segítségével vizsgálni a kárki�-

zetések és költségek közti kapcsolatot. A Kendall-féle τ -t és a Spearman-féle ρ-t

meghatározva így azt kapjuk, hogy

ρτ = 0, 315,

ρS = 0, 452,

ami egyrészt er®s összefügg®séget mutat, másrészt arra enged következtetni, hogy

f®ként a nagyobb károkhoz tartoznak magas költségek.

28

3.1. ábra. A kárki�zetések és költségek logaritmikus skálán

3.2. Kopula illesztése

Miután megállapítottuk, hogy milyen kapcsolat áll fenn a változók közt, neki-

láthatunk a kopulák illesztésének. Erre a 2.2. szakaszban bemutatott rangszámokon

alapuló módszert fogjuk alkalmazni, így tehát az X1- és X2-höz tartozó perem-

eloszlások ismerete nélkül is becsülhetjük a változók együttes eloszlását. Érdemes

megjegyezni, hogy a legtöbbször - mint ahogy jelen dolgozatban sem - nem tudjuk

teljesen elkerülni a peremeloszlások vizsgálatát, azt azonban igen, hogy egy kevésbé

jó becslés a kopula becslésén is rontson. A marginálisokkal b®vebben a következ®

fejezetben foglalkozunk majd.

El®ször a rangszámok és pszeudo-meg�gyelések segítségével elkészítjük az em-

pirikus kopulát, melyhez a [0, 1] intervallumba transzformált adatokat a 3.2. ábra

szemlélteti.

Jól látszik a nagy értékek közti er®s farok-összefüggés, és meg�gyelhet® né-

hány függ®leges sáv is, melyeknek nem érdemes nagy jelent®séget tulajdonítanunk,

ugyanis jogosan feltételezhetjük, hogy mindez annak következménye, hogy a bizto-

sító törekedett kerek kártérítési összegek meghatározására.

29

3.2. ábra. A [0,1] intervallumba transzformált adatok

Ahogy már korábban is láttuk, hogy az Arkhimédeszi kopulák paraméterei ki-

fejezhet®k a Kendall-τ -ból, így ρτ = 0, 315 mellett a Gumbel-, Frank- és Clayton-

kopulához tartozó α értékek:

α

Gumbel 1,461

Frank 3,094

Clayton 0,921

3.3. táblázat. ρτ = 0, 315-höz tartozó α értékek

Ezek alapján ki kell választanunk, melyik kopulafajtára a legkisebb az eltérés az

empirikus kopulához képest, és ellen®riznünk, hogy a legkisebb eltérés elfogadható-

e. Ehhez a korábban bemutatott illeszkedésvizsgálati próbát végezzük el, melynek

eredményeit a 3.4. táblázat foglalja össze. Emlékeztet®ül, a paraméteres és empirikus

kopula közti négyzetes eltérést az Sn próbastatisztika értéke mutatja.

Sn α

Gumbel 0,1073 1,442

Frank 0,1906 3,075

Clayton 1,0286 0,506

3.4. táblázat. Illeszkedésvizsgálat eredeményei

30

Láthatjuk, hogy a különbség a Gumbel-kopula esetén a legkisebb, viszont a próba

a Frank-kopulára sem mutat rossz illeszkedést.

Érdemes mindenesetre megnézni gra�kusan is, hogyan viszonyulnak egymáshoz

a Gumbel-, Frank-, illetve Clayton-kopulából vett minták az egységnégyzeten. Ezt

egyszer¶en megtehetjük, ugyanis a paraméterek ismeretében felírhatjuk a vizsgált

kopulákat, és mintavételezhetünk is bel®lük.

Az ábrán is meg�gyelhet®, hogy míg a Clayton-kopulát teljesen elvethetjük, a

Gumbel-kopula illeszkedése valóban jónak bizonyul, tehát elfogadhatjuk a kárki�ze-

tések és költségek együttes eloszlásaként.

31

4. fejezet

Alkalmazás viszontbiztosítások

díjkalkulációjára

A fejezet célja egy viszontbiztosítási díjkalkuláció a kapott eredmények segítségé-

vel, melyek alapján a biztosító kárki�zetéseit és az egyes károkhoz tartozó költségeket

összefügg®nek tekintjük. Megmutatjuk továbbá Frees és Valdez [2] és Marco Micocci,

Giovanni Masala [6] cikkei alapján, hogy mennyivel módosulna a helyzet, ha füg-

getlenséget feltételeznénk. Ejtsünk el®ször néhány szót a viszontbiztosításokról [5]

segítségével!

4.1. A viszontbiztosítások

A biztosítók pénzügyi stabilitását és �zet®képességét különösen a kis valószí-

n¶ség¶ nagy károk, valamint a kumulálódó károk sodorhatják veszélybe. Érdemes

tehát megfontolni, hogy mekkora kárt tud a biztosító ki�zetni anélkül, hogy felbo-

rulna a pénzügyi egyensúlya, valamint mit lehet tenni a ki�zetend® kárösszeg nem

várt növekedése ellen. Mit tesz a felel®sségteljes lakástulajdonos, akinek egy esetleges

t¶zeset vagy betörés után keletkezett költségek komoly anyagi problémát jelentené-

nek, de jövedelméb®l szívesen áldoz a biztonságérzetre? Biztosítást köt. Ugyanezt

teszi egy biztosítótársaság is. A beérkezett biztosítási díj egy részét átengedve egy

másik biztosítónak (viszontbiztosító), az kötelezettséget vállal, hogy az el®bbinek

(direkt biztosító) az általa ki�zetett szolgáltatások egy részét megtéríti. Ezt nevezik

viszontbiztosításnak, melyet gyakran emlegetnek a "biztosítók biztosítása"-ként is.

32

Az árazás és kockázatmegosztás szempontjából megkülönböztethetünk arányos

és nem arányos viszontbiztosítási formákat. El®bbi lényege, hogy amilyen arányban

vállal kockázatot a viszontbiztosító, olyan arányban részesedeik a direkt biztosítóhoz

beérkez® díjból is. Bár az arányos viszontbiztosítások jelentik a legkisebb kockázatot

a direkt és viszontbiztosító számára is, nem mindig el®nyös az arányos viszontbizto-

sítás egyik fél számára sem.

A nem arányos viszontbiztosítási formáknál a direkt biztosító megtarthatja ma-

gának azokat a kockázatokat, amiket az alacsony maximális kárnagyság miatt pénz-

ügyi kapacitása elbírna, viszontbiztosítást pedig csak egy bizonyos kárösszeg túllé-

pése esetére köt. Ez az ún. kockázati alapú kártöbblet-viszontbiztosítás (Excess of

Loss, XL). Mindez persze a viszontbiztosító számára is kedvez® abból a szempont-

ból, hogy mivel csak a ritka károkból vállal egy meghatározott részt, lényegesen

alacsonyabbak az adminisztrációs költségei. Hátránya azonban, hogy a direkt biz-

tosító bátrabban vállal nagyobb kockázatokat, mint arányos viszontbiztosítási szer-

z®dés esetén. Erre megoldást jelenthet a kvóta és az XL-viszontbiztosítás kombiná-

lása, melynél a viszontbiztosító azon kárki�zetésekb®l vállal részt, melyek a direkt

biztosító saját megtartásánál magasabbak, viszont megszab egy határt arra, hogy

legfeljebb mekkora összegig térít a direkt biztosítónak saját pénzügyi egyensúlya

fenntartása érdekében. Ennek matematikai modelljét fogjuk a következ®kben ismer-

tetni.

4.1.1. A matematikai modell

A korábbi jelölésekkel legyen a ki�zetend® kárösszeg X1, melynek eloszlását F1

jelöli. Egy viszontbiztosítónak járó P1 díj, és egy x ki�zetend® kárigény esetén a di-

rekt biztosító Tx összeget �zet ki, ez az ún. saját megtartása, a maradék x−Tx pediga viszontbiztosító részesedése, ahol T egy mérhet® függvényt jelöl. Ha a díjszámí-

táshoz a várható érték elvet használjuk és Fv jelöli a viszontbiztosító részesedésének

eloszlását, akkor a viszontbiztosítónak járó díj

P1 =

∫xdFv(x) =

∫(x− Tx)dF1(x).

Érdemes megjegyezni, hogy T mérhet®sége miatt az integrál létezik és feltehetjük,

hogy véges.

Nézzük most azt az esetet, amikor az XL-viszontbiztosítást kombináljuk a kvó-

33

tával. A direkt biztosító saját megtartását jelöljük R-rel. Ekkor a direkt biztosító

azokra a kockázatokra köt viszontbitosítást, melyeknél a kárösszeg R-nél magasabb,

viszont ezek R feletti részét is -jelen esetben a kárrrendezési költségek arányában-

bizonyos mértékben maga téríti, míg a viszontbiztosító is szab egy L összeghatárt

(kapacitás), ameddig a kockázatot vállalni tudja, így kárki�zetés ezen felüli része is

a direkt biztosítót terheli. Tekintsük a korábban bevezetett károkhoz tartozó X1 és

költségekhez tartozó X2 változót. Könny¶ meggondolni, hogy ez alapján a viszont-

biztosítót terhel® összeg

g(X1, X2) = X1 − TX1 =

0, ha X1 < R

X1 −R + X1−RX1

X2, ha R ≤ X1 < L

L−R + L−RLX2, ha X1 ≥ L,

aminek várható értéke adja meg a viszontbiztosítási díj becslését. Ez kiszámolható

numerikus integrálással, valamint X1 és X2 együttes eloszlásából való szimulációval

is.

Ezek segítségével a viszontbiztosítási díj becslése:

g(X1, X2) =1

nsim

nsim∑i=1

g(X1i, X2i)

az

se(g(L,R)) =

√1

nsim

∑nsimi=1 g(X1i, X2i)2 − g(L,R)2

nsim

standard hibával, ahol nsim a szimulációk számát jelöli.

4.2. Peremeloszlások

Mivel a viszontbiztosítás szempontjából egy bizonyos küszöb feletti károk az

igazán érdekesek, kézenfekv® megoldás ezekre az adatokra valamely extrém-érték

eloszlást illeszteni.

Els®ként a vizsgált adatsorokra egymástól függetlenül illesztjük a nagy károk

modellezésekor gyakran használatos általánosított Pareto eloszlást, melyre egy u

küszöb esetén

P (X − u < y|X > u) ≈ 1− (1 +ξy

σ)−

1ξ ,

ha y > 0 és 1 + ξyσ> 0, ahol σ = σ + ξ(µ− u) és µ, σ, ξ az eloszlás paraméterei.

34

Az eloszlás megfelel® illeszkedése esetén tetsz®leges u függvényében ábrázolva

X − u átlaga lineáris függvényhez közelít. A küszöböt mind a kártérítések, mind

a költségek esetén a hozzájuk tartozó kvantilisfüggvények segítségével határoztuk

meg. Azokat az értékeket tekintjük extrémnek, melyek az adatok 95 százalékánál

nagyobbak, így X1-nél 170000, X2-nél 45945 lett a választott küszöbérték. Az elosz-

lás paramétereit maximum likelihood módszerrel becsüljük. Ez alapjánX1 eloszlását

a ξ1 =0,18 alak és σ1 =165324,98 skála paraméter jellemzi, míg X2 esetén ezek az

értékek ξ2 =0,6 és σ2 =24777,47.

Azt, hogy a feltételezett eloszlás milyen pontosan illeszkedik az adatokra, több-

féleképpen is ellen®rizhetjük. A folytonos eloszlások illeszkedésvizsgálatára gyakran

használt Kolmogorov-Smirnov próba helyett egy er®sebb, bootstrap-alapú próbát

végzünk, ami tesztel nemnegatív, illetve negatív alak paraméterrel egyaránt, és ak-

kor utasít el, ha mind a pozitív, mind a negatív paraméterrel vett próba elutasításra

kerül.

A próbát az X1-re, valamint az illesztett eloszlására alkalmazva a p-érték 0,3253,

tehát a ξ1 =0,18, σ1 =165324,98 paraméter¶ GPD-t elfogadjuk. Ugyanezt X2-re is

elvégezve a p-érték 0,8318, így a ráillesztett ξ2 =0,6, σ2 =24777,47 paraméter¶ GPD

is elfogadásra kerül.

Mindezt alátámasztják az alábbi ábrák is, melyeken a tapasztalati, illetve az

illesztett eloszlásfüggvények kvantiliseit ábrázoljuk egymással szemben.

A kártérítésekhez és költségekhez tartozó QQ-ploton is találunk 1-2 kilógó ér-

téket, ezt viszont elkerülni nem tudjuk, legfeljebb a megfelel® eloszlás illesztésével

csökkenthetjük a számukat.

4.3. Viszontbiztosítások árazása

Miután ismerjük a kárki�zetések és költségek egydimenziós, valamint együttes

eloszlását is, elvégezhetjük a szimulációt a Gumbel-kopulából. Az erre bemutatott

algoritmussal 50000 szimulációt végezve generálunk egy új mintát, majd ennnek

segítségével becsülhetjük a viszontbiztosítót várhatóan terhel® összegeket annak ka-

pacitása és a direkt biztosító saját megtartása függvényében.

Különböz® kapacitásokra megvizsgáltuk, várhatóan mekkora díjat kellene leg-

alább el®írnia a viszontbiztosítónak, hogy fedezni tudja a kártérítésekb®l fakadó ki-

adásait R és L egymáshoz való arányától függ®en. A szimulációkat a 2.4. szakaszban

35

4.1. ábra. Kártérítésekhez tartozó QQ-plot

4.2. ábra. Költségekhez tartozó QQ-plot

bemutatott módszer alapján végeztük el, majd számoltuk ki ezek alapján g értékét.

El®zetesen is sejthet®, hogy magasabb kapacitásokhoz magasabb értékek is tar-

toznak, amik viszont csökkennek, ahogy R és L aránya 1-hez közelít. Ebben az

esetben nyilván kisebb tartományban van a viszontbiztosítónak �zetési kötelezett-

36

sége, valamint a képletb®l is látható, hogy ekkor a kárrendezési költségek is csak

csekély mértékben befolyásolják a direkt biztosító számára �zetend® összeget. Az

eredményeket a 4.1. táblázat mutatja.

R/L

L 0 0,25 0,5 0,75 0,95

10000 75270 56020 37192 18532 3699

50000 108780 78625 51056 25000 4931

100000 141723 98751 62445 29657 5677

500000 239973 119033 58442 23037 3966

1000000 261459 86005 33640 11228 1752

4.1. táblázat. Viszontbiztosítási díjak becslése a Gumbel-kopulából szimulált adatok

alapján

Ahogy sejtettük is, RLnövekedésével egyre nagyobb mértékben csökkennek az

értékek, míg L emelkedédésével n®nek. Meg�gyelhet® azonban, hogy a 100000 és

500000 kapacitások közt RL

= 0, 5, míg 500000 és 1000000 között már RL

= 0, 25-

t®l ugyanazon arányokhoz alacsonyabb értékek tartoznak. Ennek oka az lehet, hogy

míg a szimulált adatok 56,11 százaléka nagyobb 100000-nél, 500000-nél már csak

8,67, 1000000-nál pedig 1,5 százaléka nagyobb, tehát a nagy károk bekövetkezésének

valószín¶sége jelent®sen kisebb, és mivel kevesebb a kár, magasabb limitnél az egy

kárra es® díjak is alacsonyabbak lesznek. A limitválasztásban nagy szerepet játszanak

a kvantilisek, így érdemes ezekre is vetni egy pillantást.

Kvantilisek

0,25 0,5 0,75 0,95

55248,9 123888,3 247166,2 605958,6

4.2. táblázat. A kárki�zetések kvantilisei a szimulált adatok alapján

Nézzük most meg, miként alakulnának ezek a díjak, ha nem vennénk �gyelembe

a kárki�zetések és költségek közti összefügg®séget, és vessük össze a kopula-modell

alapján számolt eredményekkel. Ehhez fenti táblázat értékeit fogjuk összehasonlítani

azon értékekkel, melyeket pusztán F1 és F2-b®l szimulált adatokra kapunk.

37

R/L

L 0 0,25 0,5 0,75 0,95

10000 72395 53212 35143 17467 3471

50000 105857 72663 45847 21838 4237

100000 138530 89025 53683 25000 4695

500000 236357 98805 44211 15991 2542

1000000 258195 66811 23362 7632 1111

4.3. táblázat. A becsült viszontbiztosítási díjak az F1 és F2 eloszlásokból függetlenül

vett szimulációk alapján

Látható, hogy bár az így kapott értékek hasonlóak a 4.1. táblázatbeliekhez, mind

alacsonyabbak azoknál. A kopulából szimulált adatokra kiszámított díjak a 4.3. táb-

lázat értékeihez viszonyított arányát a 4.4. táblázat tartalmazza, az alábbi ábrán

pedig az egyes kapacitásszinteken rajzoltuk ki a az RLarányokhoz tartozó viszontbiz-

tosítási díjakat mind a Gumbel-kopulán, mind a függetlenségen alapuló díjszámítás

esetén.

Az, hogy az arány minden egyes értékpárnál 1-nél nagyobb, azaz a kopula alapján

számolt értékekek magasabbak, arra utal, hogy a változók függetlenként kezelése

esetén alulárazottak lennének a viszontbiztosítások.

R/L

L 0 0,25 0,5 0,75 0,95

10000 1,04 1,05 1,06 1,06 1,07

50000 1,03 1,08 1,11 1,14 1,16

100000 1,02 1,11 1,16 1,19 1,21

500000 1,02 1,21 1,32 1,44 1,56

1000000 1,01 1,29 1,44 1,47 1,58

4.4. táblázat. Összefügg® és független változók alapján számolt díjak aránya

Jól látszik, hogy ez akkor jelentkezik a leger®sebben, ha mind a viszontbiztosító

kapacitása, mind a direkt biztosító saját megtartása magas. Ennek f®ként az az

oka, hogy az eloszlások szélei sokkal érzékenyebbek arra, ha rosszul azonosítjuk az

eloszlást.

38

4.3. ábra. Viszontbiztosítási díjak alakulása különböz® L értékekre

F®ként olyan esetekben, mikor a direkt biztosító saját megtartása alacsony, el®-

fordulhat, hogy az arány 1-nél kisebb. Ez túlárazásra utal, így ez f®ként a direkt

biztosító szempontjából hasznos információ.

Az illeszkedésvizsgálatnál láttuk, hogy a Gumbel-kopula mellett a Frank-kopula

is egész jól illeszkedik, így érdemes megvizsgálnunk azt is, melyen eredményeket

kapunk, ha abból szimulálunk adatokat. Ezt foglalja össze a 4.5. táblázat.

Ha összevetjük a Gumbel-kopulából szimulált adatokhoz tartozó táblázattal, lát-

hatjuk, hogy nincs jelent®s eltérés az eredmények közt. Meg�gyelhet® azonban, hogy

a Frank-kopulából szimulálva alacsonyabbak az értékek, és ehhez az összefügg®ségi

modellhez viszonyítva kevésbé alulárazottak a viszontbiztosítások, ha függetlennek

tekintjük a változókat. Mindemellett L = 1000000 kapacitás esetén túlárazást is

tapasztalhatunk, ami egyrészt akkor jelentkezik, amikor a direkt biztosító a teljes

kockázatot átadja a viszontbiztosítónak, másrészt mikor a saját megtartása és a

viszontbiztosító kapacitása egyaránt magas.

39

R/L

L 0 0,25 0,5 0,75 0,95

10000 73183 54464 36138 18008 3592

50000 106691 76795 49669 24177 4745

100000 139081 95731 59736 28168 5390

500000 236792 110028 49978 18106 2889

1000000 257252 72104 23792 7109 1016

4.5. táblázat. A Frank-kopulából szimulált adatok alapján becsült viszontbiztosítási

díjak

R/L

L 0 0,25 0,5 0,75 0,95

10000 1,01 1,02 1,03 1,03 1,03

50000 1,01 1,06 1,08 1,12 1,12

100000 1,001 1,08 1,11 1,13 1,15

500000 1,001 1,11 1,13 1,13 1,14

1000000 0,99 1,08 1,02 0,93 0,91

4.6. táblázat. Frank-kopulából való szimulációval kapott eredmények aránya a füg-

getlenségen alapuló értékekhez

Vegyük észre, hogy a Gumbel-kopulánál pont az L = 1000000 és RL

= 0, 95

esetben az összefügg®ségi modellb®l számolt díj 1,58-szorosa volt a függetlenségen

alapulónak, míg ez az arány a Frank-kopulánál 0,91. Ennek oka az lehet, hogy a jobb

oldali farok-összefüggés lényegesen er®sebben jelentkezik a Gumbel-kopulánál, mint

a Frank-félénél, éppen ezért érdemesebb is az el®bbit illesztenünk a rendelkezésünkre

álló adatokra.

40

5. fejezet

Összefoglalás

A dolgozatban bemutattam, miként tudjuk két valószín¶ségi változó közti kap-

csolatot vizsgálni, és ezen összefügg®ség segítségével a változók együttes eloszlását

becsülni. Eszközül erre a kopulák szolgáltak, melyek konkrét adatsorokra való illesz-

téséhez két módszert ismertettünk, valamint bemutattunk egy illeszkedésvizsgálati

próbát is, ami alapján kiválasztható, melyik a legjobban illeszked® elméleti kopula,

amib®l a marginálisok ismeretében szimulációkat is végezhetünk.

Mindez alapján jellemezni tudtuk egy biztosítótársaság kárki�zetései és költsé-

gei közti összefügg®séget, valamint becslést adtunk ezek együttes eloszlására, majd

a peremeloszlásokra is. Ezeket felhasználva megmutattuk, miként változik a viszont-

biztosítási díj különböz® direkt biztosítói saját megtartás, és viszontbiztosítói kapa-

citás esetén. Els®ként a díjak várható értékének kiszámítása az illeszkedésvizsgálat

után választott Gumbel-kopulából szimulált adatok alapján történt, majd megmu-

tattuk, mennyiben változnának a díjak, ha függetlenséget feltételezve szimplán a

peremeloszlásokból el®állított együttes eloszlásfüggvényb®l szimulálnánk a díjszá-

mításhoz, továbbá amennyiben egy másik, hasonlóan jó illeszkedést mutató kopu-

lából, a Frank-kopulából szimulálnánk. Végül pedig felismertük, hogy a költségeket

függetlennek tekintve alulárazottak lennének a viszontbiztosítások, továbbá a nem

megfelel® összefügg®ségi modell alkalmazása is lényegesen torzíthat az eredménye-

ken.

A dolgozatban szerepl® ábrák elkészítéséhez, és a számítások elvégzéséhez az R

programcsomagot használtam.

41

Irodalomjegyzék

[1] Bolla Marianna, Krámli András. Statisztikai következtetések elmélete (2005)

[2] Edward W. Frees, Emiliano A Valdez. Understanding relationships using copulas,

North American Actuarial Journal (1998)

[3] Ivan Kojadinovic, Jun Yan.Modeling Multivariate Distributions with Continuous

Margins Using the copula R package, Journal of Statistical Software (2010)

[4] Jun Yan. Enjoy the Joy of Copulas: With a Package copula, Journal of Statistical

Software (2007)

[5] Kerényi István. Viszontbiztosítás, Aktuárius jegyzetek (2011)

[6] Marco Micocci, Giovanni Masala. Loss-ALAE modeling through a copula depen-

dence structure, Investment Management and Financial Innovations (2009)

[7] Pravin K. Trivedi, David M. Zimmer. Copula modeling: An Introducion for Prac-

titioners, Foundations and Trends in Econometrics (2005)

[8] Roger B. Nelsen. An Introduction to Copulas, Springer Series in Statistics (2006)

42

Kopulák alkalmazása a nem-élet...

Documents

Transcript of Kopulák alkalmazása a nem-élet...