GPモデルを用いた日最大降水量の推定とその比較 -...

1
7. ・GEVモデルとGPモデルを用いて最大降水量を再現レベル200年で推定す ることができた. ・本研究ではGEVモデルとGPモデルであれば,扱うデータ数がより多いGP モデルを用いた方が精度が良いという結果を得ることができた. 3.GEVモデル GEVモデルに当てはめるブロック最大データ(黒点) ・GEV(μ,σ,ξ)からの確率標本を をその実現値とする. ・μとσはzの基準化定数. ・分布関数 ・密度関数 4.GPモデル GPモデルに当てはめる閾値超過データ(黒点) ・GP(σ,ξ)からの確率標本を をその実現値とする. ・分布関数 ・密度関数 z 1 , z 2 , , z n ξ≥-0.5 漸近有効 で漸近正規性 を持つ -1<ξ<-0.5 一般に存在するが漸近有効か は未解決 ξ≤-1 一般に存在しない GP (1, ξ ) H ξ ( y ) = 1 1 + ξ y ( ) + 1 ξ ( a ) + = max{a,0} H ξ y 1 , y 2 , , y n 6.実測値データによるフィッティング ・GEVモデル 神戸(1983-2013)の年最大日降水量を使用する. 実測値データ 分布への当てはめ診断図 ・GPモデル 閾値を定め,それを超過したデータを使用する. 実測値データ 標本平均超過関数 各uでのパラメータの推定値 分布への当てはめ診断図 結果 ・GEVモデルとGPモデルのどちらも となり,データは裾の厚い分 に従うという同様の結果が得られた. ・形状パラメータと再現レベル200年の推定値に注目すると,本研究では GPモデルの方がGEVモデルに比べて標準誤差が小さく推定の精度が良いとがわかった. ・本研究では,実測値データは神戸の1983年から2013年までのものを使用 し,GEVモデルのブロック最大データのブロックの大きさを1年としたため データ数は30個となった.それに対してGPモデルでは,閾値u=40を超える 全てのデータを用いため,データ数は184となった.故に二つのモデルの精 度の差は標本数によるものであった考えられる. ξ > 0 パラメーターの最尤 推定値(標準誤差) より神戸の日最大降水量 はFréchet分布に従い, 再現期間 200年の再現レベル  の95%信頼 区間は[193.2261,1248.500] より神戸の日最大降水量はパ レート分布に従い,再現期間200年の 再現レベル の95%信頼区間は [138.10,506.425]であった. ξ > 0 z 1/200 z 200 Z 1 , Z 2 , , Z n Y 1 , Y 2 , , Y n ・分布Fを持つ確率変数をXとする (分布Fの上限)とする ・閾値超過データ の分布について 考える u ω F X u X u | X > u ξ > 0.5 ・独立で同一分布に従う確率変数列 ・分布関数 を大きさの順に並べた 順序統計量 ・極致統計量(ブロック最大デ-タ) X 1 , X 2 , , X n F ( x ) = P ( X i x ), i = 1, 2, , n X (1: n ) X (2: n ) ! X ( n : n ) n Z = ( n:n ) X = max{ 1 X , 2 X ,..., n X } = 1 i n max i X X n パラメーターの最尤 推定値(標準誤差) GEVモデルとGPモデルを用いた日最大降水量の推定とその比較 総合数理学部 現象数理学科 池田研究室 4年 今田 寛 1.序論・背景 災害や事故という現象は我々の生活の至る所に潜んでおり,関連する 観測データに異常に大きな値が現れることが多い. 従って一定期間の 内にどのくらいの頻度でどれくらいの大きな値が起こるかを予測する ことができれば,それらの災害に備えることができるであろう. 2. 神戸(1983-2013)の日合計降水量を扱い,それが従うモデルである極値 統計学のGEVモデルとGPモデルを用いて解析する,そして,再現レベル 200年で最大降水量の95%信頼区間を推定し,モデルの精度を比較する 事を目的とする. 5.GEVモデル・GPモデルの性質 Weibull分布 ベータ分布 取りうる値の 上限が有界 Gumbel分布 指数分布 裾が指数減衰 Frechet分布 パレート分布 裾が厚い 母集団分布F吸引領域 近似できる分布 分布の性質 (G ξ , ξ < 0) (G 0 ) (G ξ , ξ > 0) Weibull分布 取りうる値の 上限が有界 Gumbel分布 裾が指数減衰 Fréchet分布 裾が厚い パラメータの値 近似できる分布 分布の性質 ξ < 0 ξ = 0 ξ > 0 ξ > 0 ˆ μ = 108.1(7.636) ˆ σ = 35.82(6.02) ˆ ξ = 0.1429(0.1865) ˆ σ = 19.15(2.161) ˆ ξ = 0.1317(0.1865) g ( z ) = 1 σ 1 + ξ z μ σ + 1 ξ 1 exp 1 + ξ z u σ + 1 ξ G ( z ) = G ξ z μ σ = exp 1 + ξ z u σ + 1 ξ H ( y ) = H ξ y σ = 1 1 + ξ y σ + 1 ξ ( ξ 0) 1 exp y σ ( ξ = 0) h ( y ) = 1 σ h ξ y σ = 1 σ 1 + ξ y σ + 1 ξ 1 ( ξ 0) 1 σ exp y σ ( ξ = 0)

Transcript of GPモデルを用いた日最大降水量の推定とその比較 -...

Page 1: GPモデルを用いた日最大降水量の推定とその比較 - 明治大学ikeda/laboratory/pdf/2018/imada.pdf7. ・GEVモデルとGPモデルを用いて最大降水量を再現レベル200年で推定す

7.・GEVモデルとGPモデルを用いて最大降水量を再現レベル200年で推定することができた.・本研究ではGEVモデルとGPモデルであれば,扱うデータ数がより多いGPモデルを用いた方が精度が良いという結果を得ることができた.

3.GEVモデルGEVモデルに当てはめるブロック最大データ(黒点)・GEV(μ,σ,ξ)からの確率標本を・をその実現値とする.・μとσはzの基準化定数.・分布関数・密度関数

4.GPモデル

GPモデルに当てはめる閾値超過データ(黒点)・GP(σ,ξ)からの確率標本を・をその実現値とする.・分布関数・密度関数

z1, z2 ,…, zn ξ≥-0.5 漸近有効で漸近正規性を持つ

-1<ξ<-0.5 一般に存在するが漸近有効かは未解決

ξ≤-1 一般に存在しない

GP(1,ξ )

Hξ (y) =1− 1+ξ y( )+

−1ξ

(a)+=max{a,0}

Hξy1, y2 ,…, yn

6.実測値データによるフィッティング・GEVモデル神戸(1983-2013)の年最大日降水量を使用する. 実測値データ   分布への当てはめ診断図

・GPモデル閾値を定め,それを超過したデータを使用する.

実測値データ 標本平均超過関数 各uでのパラメータの推定値     分布への当てはめ診断図

結果・GEVモデルとGPモデルのどちらも   となり,データは裾の厚い分布に従うという同様の結果が得られた.・形状パラメータと再現レベル200年の推定値に注目すると,本研究ではGPモデルの方がGEVモデルに比べて標準誤差が小さく推定の精度が良いことがわかった.・本研究では,実測値データは神戸の1983年から2013年までのものを使用し,GEVモデルのブロック最大データのブロックの大きさを1年としたためデータ数は30個となった.それに対してGPモデルでは,閾値u=40を超える全てのデータを用いため,データ数は184となった.故に二つのモデルの精度の差は標本数によるものであった考えられる.

ξ > 0

パラメーターの最尤推定値(標準誤差)

   より神戸の日最大降水量はFréchet分布に従い, 再現期間200年の再現レベル  の95%信頼区間は[193.2261,1248.500]

① ②

③ ④

   より神戸の日最大降水量はパレート分布に従い,再現期間200年の再現レベル の95%信頼区間は[138.10,506.425]であった.

ξ > 0

z1/200

z200

Z1,Z2 ,…,Zn

Y1,Y2 ,…,Yn

・分布Fを持つ確率変数をXとする 

      

・   (分布Fの上限)とする

・閾値超過データ

・の分布について

考える

u→ωF

X −u

X −u | X > u

ξ > −0.5

・独立で同一分布に従う確率変数列

          

・分布関数

  

・ を大きさの順に並べた

 順序統計量

        

・極致統計量(ブロック最大デ-タ)

X1,X 2 ,…,XnF (x) = P(Xi ≤ x),i =1,2,…,n

X (1: n) ≤ X (2 : n) ≤!≤ X (n : n)

nZ =(n:n)X =max{

1X ,2X ,...,

nX }=1≤i≤nmax iX

Xn

パラメーターの最尤推定値(標準誤差)

GEVモデルとGPモデルを用いた日最大降水量の推定とその比較

総合数理学部 現象数理学科 池田研究室 4年 今田 寛

1.序論・背景災害や事故という現象は我々の生活の至る所に潜んでおり,関連する観測データに異常に大きな値が現れることが多い. 従って一定期間の内にどのくらいの頻度でどれくらいの大きな値が起こるかを予測することができれば,それらの災害に備えることができるであろう.

2.神戸(1983-2013)の日合計降水量を扱い,それが従うモデルである極値統計学のGEVモデルとGPモデルを用いて解析する,そして,再現レベル200年で最大降水量の95%信頼区間を推定し,モデルの精度を比較する事を目的とする.

5.GEVモデル・GPモデルの性質

Weibull分布 ベータ分布 取りうる値の上限が有界

Gumbel分布 指数分布 裾が指数減衰

Frechet分布 パレート分布 裾が厚い

母集団分布Fの吸引領域

近似できる分布 分布の性質

(Gξ ,ξ < 0)

(G0 )

(Gξ ,ξ > 0)

Weibull分布 取りうる値の上限が有界

Gumbel分布 裾が指数減衰

Fréchet分布 裾が厚い

パラメータの値 近似できる分布 分布の性質

ξ < 0

ξ = 0

ξ > 0

ξ > 0

µ̂ =108.1(7.636)σ̂ = 35.82(6.02)ξ̂ = 0.1429(0.1865)

σ̂ =19.15(2.161)ξ̂ = 0.1317(0.1865)

g(z) = 1σ1+ξ z −µ

σ

⎝⎜

⎠⎟

⎣⎢

⎦⎥+

−1ξ−1

exp − 1+ξ z −uσ

⎝⎜

⎠⎟

⎣⎢

⎦⎥+

−1ξ

⎨⎪

⎩⎪

⎬⎪

⎭⎪

G(z) =Gξ

z −µσ

⎝⎜

⎠⎟= exp − 1+ξ z −u

σ

⎝⎜

⎠⎟

⎣⎢

⎦⎥+

−1ξ

⎨⎪⎪

⎩⎪⎪

⎬⎪⎪

⎭⎪⎪

H (y) = Hξ

⎝⎜

⎠⎟=

1− 1+ξ yσ

⎝⎜

⎠⎟+

−1ξ

(ξ ≠ 0)

1− exp −yσ

⎝⎜

⎠⎟ (ξ = 0)

⎪⎪⎪

⎪⎪⎪

h(y) = 1σhξ

⎝⎜

⎠⎟=

1σ1+ξ y

σ

⎝⎜

⎠⎟+

−1ξ−1

(ξ ≠ 0)

1σexp −

⎝⎜

⎠⎟ (ξ = 0)

⎪⎪⎪

⎪⎪⎪