ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに •...

47
2003年11月8日 1 ノンパラメトリック回帰分析 生命表 慶應義塾大学 総合政策学部 小暮 厚之 [email protected] 日本保険・年金リスク学会第1回大会 共催:慶應義塾大学 政策・メディア研究科 21世紀COE「日本・アジアにおける総合政策学」 金融工学による保険・保証の分析 プロジェクト

Transcript of ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに •...

Page 1: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

2003年11月8日 1

ノンパラメトリック回帰分析と

生命表

慶應義塾大学 総合政策学部

小暮 厚之

[email protected]

日本保険・年金リスク学会第1回大会共催:慶應義塾大学 政策・メディア研究科

21世紀COE「日本・アジアにおける総合政策学」

金融工学による保険・保証の分析 プロジェクト

Page 2: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

2

はじめに

• 「生命表」は,特定の人口集団の死亡確率を表すもので

あり,生命保険の料率や年金の計算基礎を与える.

それは,各年齢に対して「1年以内に死亡する確率」を与える.

• 生命表は,基礎データからの単純な「粗死亡率」を「補整」することによって得られる.

• 本報告では,「生保標準生命表1996」を例にとって,ノンパラメトリック回帰の観点から「補整」を考察する.

Page 3: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

3

生命表(1)「生保標準生命表1996」(男子) より

3.48 491.44 390.84 291.15 190.17 9

3.21 481.33 380.84 281.09 180.19 8

2.96 471.22 370.85 270.94 170.21 7

2.73 461.13 360.85 260.73 160.22 6

2.51 451.05 350.86 250.52 150.22 5

2.29 440.98 340.88 240.34 140.24 4

2.08 430.92 330.92 230.22 130.33 3

1.88 420.88 320.99 220.15 120.50 2

1.71 410.85 311.07 210.14 110.76 1

1.56 400.84 301.14 200.15 101.10 0

1000qxx1000qxx1000qxx1000qxx1000qxx

死亡率年齢死亡率年齢死亡率年齢死亡率年齢死亡率年齢

Page 4: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

4age(years)

mor

talit

y R

ate(

perm

ills)

0 10 20 30 40 50

12

3

生保標準生命表死亡率

粗死亡率

生命表(2)生保標準死亡率と粗死亡率

Page 5: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

5

<定義>x歳になったばかりの人が1年以内に死亡する確率

ただし,Tx = x 歳の人の余命年数(確率変数)

生命表(3)死亡率

Page 6: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

6

生命表(4)死亡率のパラメトリック・モデル

• Weibull法則

•Makeham-Gompertz法則

参考:荒井 昭 (2001) 「生命表に関する一考察:生命関数の数式近似」

アクチュアリー会会報 No.54(第2分冊)

Page 7: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

7

生命表(5)補整(Graduation)

• 基礎データ(粗死亡率)は,既存のパラメトリック・モデルにうまくあてはまらない

• パラメトリック・モデルをフィットさせる代わりに,基礎データをノンパラメトリックに平滑化して,真の死亡率を推定する.これを「補整」(graduation)という.

Page 8: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

8

基礎データと粗死亡率(1)生保標準生命表(男子)

• 生保22社の契約者のデータ

• 観察年数

15歳以上:1989-1991年(有審査)

14歳以下:1986-1991年(有無審査)

Page 9: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

9

基礎データと粗死亡率(2)Lexis Diagram

観測期間

X歳

X+1歳

Page 10: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

10

粗死亡率

• ex=経過契約件数

=Lexi Diagramの各線分の縦方向の長さの和• dx=死亡数

=Lexi Diagramで観測される死亡数

基礎データと粗収益(3)粗死亡率

その他の定義

Page 11: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

11

生保標準生命表の補整(1)3段階の補整

• 1次補整

「数学的危険論」による補整

• 2次補整

Grevilleの補整=移動平均による平滑化

• 3次補整

52歳以上の粗死亡率データにMakeham-Gompertz法則をあてはめる

いわゆる補整(Graduation)

Page 12: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

12

生保標準生命表の補整(2)第1次補整値

ここで

は N(μ, σ2)の密度関数

なぜ400万件か⇒想定保険会社の契約件数?第1次補整値=「想定保険会社」にとっての死亡率の上限(上側2.5%点)

粗死亡率

Page 13: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

13

生保標準生命表の補整(3)第2次補整:移動平均

Grevilleの3次13項式

ここで

Page 14: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

14

j

aj

-6 -4 -2 0 2 4 6

0.0

0.05

0.10

0.15

0.20

0.25

Grevilleの3次13項

移動平均

の加重

3次の移動

平均の性質

生保標準生命表の補整(4)第2次補整:移動平均の性質

Page 15: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

15

平滑化の意味(1)第2次補整値

2次補整値

1次補整値

これを考える!

Page 16: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

16

平滑化の意味(2)粗死亡率データの構造

• データ

• 構造

真の死亡率 誤差項

年齢

粗死亡率

Page 17: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

17

平滑化の意味(3)

移動平均の期待値

xの近傍で成立,qが3次関数ならば厳密に成立

3次の移動

平均の性質

Page 18: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

18

平滑化の意味(4)

移動平均の分散

もしも誤差分散が一定ならば,分散は5分の1に減少!

Page 19: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

19

ノンパラメトリック回帰 (1)基本モデル

被説明変数:粗死亡率説明変数:年齢

誤差分散

基準化誤差項

に関する統計的推測補整とは ⇒

Page 20: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

20

ノンパラメトリック回帰(2)様々な補整法

• カーネル法いわゆるカーネル法の応用

(c.f. Copas, J and Haberman,1983) 「漸近理論」が主体,境界問題

• 局所回帰法通常の回帰分析の拡張としてモデリング

「有限標本理論」

• 局所尤度法通常の一般化線形モデルの拡張としてモデリング

Page 21: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

21

カーネル法としての移動平均補整Nadaraya-Watsonカーネル推定量

ここで K:カーネル関数, h:バンド幅(>0)

もしも とおくと

ただし

Page 22: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

22

カーネル法としての移動平均補整(2) カーネル関数の形状

Kernel functions

z

K(z

)

-1.0 -0.5 0.0 0.5 1.0

0.0

0.5

1.0

1.5Triweight:K(z)=(32/35)(1-z2)3

4次オーダー

Page 23: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

23

カーネル法としての移動平均補整(3)

Grevilleの3次13項式移動平均(生保標準生命表)は

1. 4次オーダーカーネル推定量

2. 13項式は,最近傍の13個の観測値を用いる

バンド幅に対応する

と理解できる

移動平均をカーネル平滑化の特殊ケースと考えることによって,

カーネル法の理論を用いることができる.

Page 24: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

24

カーネル法としての移動平均補整(4)カーネル法の問題点

• 補整の境界問題xが境界0に近いとき,カーネル推定量はバイアスが大きくなる(境界問題).境界に近い点では,通常のカーネルと異なる「境界修正カーネル関数」を用いる (Gabin,Haberman and Verrall, 1995).

⇒より統一的な平滑化が望まれる.

• カーネル法は特殊?カーネル法は,他の一般的統計手法(回帰分析や最尤法)とは異質(?),漸近理論が主体

⇒通常の統計手法に近い方法が望まれる.

Page 25: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

25

局所回帰モデル(1)

• 点xにおける平均死亡関数q(x)のテイラー近似

局所最小2乗法(移動最小2乗法)

局所回帰推定値

Page 26: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

26Age (years)

Mor

talit

y R

ate

(per

mills

)

0 10 20 30 40 50

0.0

0.5

1.0

1.5

2.0

2.5

3.0

o

o

o

oo

o o o o o o o o o oo

o

oo o o

o o o o o o o o o o o o o oo

o o oo

oo

oo

o

o

o o

o

o

Local Cubic Estimator with h=NN(0.5)

局所回帰モデル(2)3種類の選択:(K=カーネル関数, p=次数, h=バンド幅,)

•K=Triweight•p=3•h=最近傍の

50%の観測値

LocfitBy

Clive (Catherine)Loader

Page 27: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

27

局所回帰モデル(3)通常の線形モデルとの類似

• 局所最小2乗推定量

ここで被説明変数

ベクトル射影行列

Page 28: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

28

局所回帰モデル(4)残差と自由度

•回帰ベクトル

•ハット行列

•残差ベクトル

•自由度 「パラメータの個数」

の一般化

Page 29: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

29

局所回帰モデル(5)クロスバリデーション

• クロスバリデーション

ここで, は i番目の観測値を除いた残りの

(n-1)個の観測値からの の推定値

Page 30: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

30

Degree= 1

Fitted DF

GC

V

3 4 5 6 7 8 9

0.02

0.06

0.10

0.14

Degree= 2

Fitted DF

GC

V

4 6 8 10 12 14 16

0.02

0.04

0.06

Degree= 3

Fitted DF

GC

V

4 6 8 10 12 14 16

0.02

0.03

0.04

Degree= 4

Fitted DF

GC

V

5 10 15 20

0.01

50.

020

0.02

5

局所回帰モデル(6)GCVによる次数の選択(a)

• 自由度mは,異なるバンド 幅hに

対応.

• hは,最近傍の観測値の20%から100%まで(5%刻み)

自由度m

•h↑⇒ m↑

Page 31: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

31

Degree= 5

Fitted DF

GC

V

10 15 20

0.01

20.

016

0.02

0Degree= 6

Fitted DF

GC

V

10 15 20 25 30

0.02

0.04

0.06

0.08

Degree= 7

Fitted DF

GC

V

10 15 20 25 30

0.02

0.04

0.06

0.08

Degree= 8

Fitted DF

GC

V

15 20 25 30 35 40

0.0

0.1

0.2

0.3

0.4

局所回帰モデル(7)GCVによる次数の選択(b)

Page 32: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

32

局所回帰モデル(8)GCVによるカーネル関数の選択

Epanecnikov

Fitted DF

GC

V

10 15 20

0.01

20.

016

0.02

0

Rectangular

Fitted DF

GC

V

6 8 10 12 14 16 18 20

0.01

20.

016

0.02

0

Triweight

Fitted DF

GC

V

10 15 20 25

0.01

20.

016

0.02

0

Gaussian

Fitted DFG

CV

8 10 12 14 16 18 20

0.01

20.

016

0.02

0

Page 33: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

33

局所回帰モデル(9)選択されたモデル

Age (years)

Mor

talit

y R

ate

(per

mill)

0 10 20 30 40 50

0.0

0.5

1.0

1.5

2.0

2.5

3.0

o

o

o

oo

o o o o o o o o o oo

o

oo o o

o o o o o o o o o o o o o oo

o o oo

oo

oo

o

o

o o

o

o

Age (years)

Res

idua

ls (p

erm

ill)

0 10 20 30 40 50

-0.4

-0.2

0.0

0.2

推定式 残差

K=Epanchnikov, p=5,h=NN(0.65))

Page 34: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

34

局所回帰モデル(10)標準生命表死亡率 VS 局所回帰補整値

Age (years)

Mor

talit

yRat

e (p

erm

ill)

0 10 20 30 40 50

12

3

生保標準生命表

局所回帰補整値

Page 35: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

35

加重局所回帰法(1)

死亡率データは,

は試行回数が , 成功確率が

の2項分布に従うと考えれば

死亡数 契約数

Page 36: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

36

加重局所回帰法 (2)粗死亡率の標準偏差

Age (years)

Sta

ndar

d D

evia

tion

0 10 20 30 40 50

02*

10^-

84*

10^-

86*

10^-

88*

10^-

810

^-7

Standard Deviations of Crude Mortality Rates

Page 37: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

37

加重局所回帰法(3)分散安定化変換

Page 38: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

38Age (years)

Mor

talit

y R

ate

(per

mill)

0 10 20 30 40 50

0.0

0.5

1.0

1.5

2.0

2.5

3.0

K=Epanechnikov, p=4, h=NW(0.8)

加重局所回帰モデル

加重局所最小2乗法(4)選択されたモデル

通常の局所回帰モデル

Page 39: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

39

加重局所回帰法 (5)生保標準生命表死亡率VS加重局所回帰補整値

Age (years)

Mor

talit

yRat

e (p

erm

ill)

0 10 20 30 40 50

12

3

生保標準生命表死亡率

加重局所回帰補整値

Page 40: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

40

局所尤度モデル(1)死亡率データの尤度

• diが試行回数 ei,成功(死亡)確率 q(xi) の2項

確率分布に従うとき,死亡率の対数尤度は

ただし

(ロジスティック・リンク)

Page 41: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

41

局所尤度モデル(2)

対数尤度

局所尤度推定量

Page 42: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

42

局所尤度モデル (3)クロスバリデーション

ここで, は i番目の観測値を除いた残りの

n-1個の観測値からの の推定値

通常の最尤推定量 局所尤度法による推定量

Page 43: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

43

局所尤度モデル(4)選択されたモデル

Age (years)

Mor

talit

y R

ate

(per

mill

)

0 10 20 30 40 50

0.5

1.0

1.5

2.0

2.5

3.0

局所尤度

加重局所回帰

K=Epanecnhikov, p=3, h=NN(0.6))

Page 44: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

44

局所尤度モデル(5)生保標準生命表死亡率 VS局所尤度補整値

Age (years)

Mor

talit

yRat

e (p

erm

ill)

0 10 20 30 40 50

12

3

生保標準生命表

局所尤度法補整値

Page 45: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

45

粗死亡率データ を2項分布以外の分布で

モデル化する方が適切かもしれない.

局所尤度モデル(6)将来の課題

「ポアソン分布」+「ガンマ分布」

• dxが平均が のポアソン分布に従う.

ここで はx+0.5歳の死力

• exがパラメータが

のガンマ分布に従う.

例えば:

Page 46: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

46

まとめ

• ノンパラメトリック回帰の考え方を利用することにより,より「客観的」で「アカウンタブル」な補整(graduation) が可能となる.

• 特に,現行の生保標準生命表の補整(Grevilleの移動平均)では,バンド幅が短すぎることが示唆される.

• 将来,様々な(より細分化された)人口集団に対する保険を考えるとき,ノンパラメトリック回帰はさらに有用な生命表作成の手段を提供すると期待される.

Page 47: ノンパラメトリック回帰分析 と 生命表JARIP.pdf2 はじめに • 「生命表」は,特定の人口集団の死亡確率を表すもので あり,生命保険の料率や年金の計算基礎を与える.

47

参考文献

二見 隆 「生命保険数学」 上巻 (1992) 生命保険文化研究所

Copas, J and Haberman (1983) “Non-parametric Graduation Using Kernel Methods,” Journal of the Institute of Actuaries, 118, 135-156.

Fan J. and Gijbels, I (1996) Local Polynomial Modelling and Its Applications, Chapman and Hall.

Gavin, G., Haberman, S. and Verrall, R. (1995): "Graduation by Kernel and Adaptive Kernel Methods with a Boundary Correction," Transactions of Society of Actuaries, 47, 173-209

Gerber, H.(1991) Life Insurance Mathematics, Springer.