リンクの接続関係を利用した ネットワーク上の 点事象集積検出...

22
リンクの接続関係を利用した ネットワーク上の 点事象集積検出法の提案 井上 東北大学 2013/2/16 「平成24年度 全体報告会@CSIS」

Transcript of リンクの接続関係を利用した ネットワーク上の 点事象集積検出...

Page 1: リンクの接続関係を利用した ネットワーク上の 点事象集積検出 …gis.sk.tsukuba.ac.jp/2012-15_GIS-ASA/20130216/inoue.pdf · GPS付き携帯電話,Web mapping,

リンクの接続関係を利用した ネットワーク上の

点事象集積検出法の提案

井上 亮

東北大学

2013/2/16 「平成24年度 全体報告会@CSIS」

Page 2: リンクの接続関係を利用した ネットワーク上の 点事象集積検出 …gis.sk.tsukuba.ac.jp/2012-15_GIS-ASA/20130216/inoue.pdf · GPS付き携帯電話,Web mapping,

詳細な位置情報を備えたデータ入手可能性の拡大

情報公開・活用の推進 統計情報の有効活用を目指す施策の進展 「オープンガバメント」施策の進展

地理空間情報取得・利活用の普及 GPS付き携帯電話,Web mapping, ユーザ作成データ (OSM, ジオタグ付きTwitter,…)

詳細な位置を有する様々な情報を利用し, 小領域内の事象の空間解析を実行できる 環境の整備が進展している

2 地理空間情報 入手環境の変化

Page 3: リンクの接続関係を利用した ネットワーク上の 点事象集積検出 …gis.sk.tsukuba.ac.jp/2012-15_GIS-ASA/20130216/inoue.pdf · GPS付き携帯電話,Web mapping,

3 去年の発表では…

集積空間領域

µ0 2 4 6 8 101

km

Most Likely Cluster

取引年

時刻・位置情報を持つ点データを用い, 町丁目などの領域を空間集積検出の最小単位として 点の集積期間・領域を検索する方法を「空間スキャン統計」をベースに提案.

⇒東京23区内の不動産取引データを用いて実験.

入力点事象データ

本年度は,より詳細な位置を利用した集積領域の抽出を検討

Page 4: リンクの接続関係を利用した ネットワーク上の 点事象集積検出 …gis.sk.tsukuba.ac.jp/2012-15_GIS-ASA/20130216/inoue.pdf · GPS付き携帯電話,Web mapping,

4 分析対象データのイメージ

● 犯罪発生地点 ● 交通事故発生地点

社会経済活動に関するデータを詳細な位置を利用し分析する場合 道路などネットワーク形状を考慮して,点間の近接性を評価することが不可欠.

本研究の目的 ⇒「空間スキャン統計」をネットワーク分析への拡張を目指す

Page 5: リンクの接続関係を利用した ネットワーク上の 点事象集積検出 …gis.sk.tsukuba.ac.jp/2012-15_GIS-ASA/20130216/inoue.pdf · GPS付き携帯電話,Web mapping,

5

① 空間上で集積候補領域を設定 Kulldorff & Nagarwalla (1995): 円形 Kulldorff (2006): 楕円; Kulldorff (1997): 円内に重心が含まれる空間集計単位; Duczmal & Assunção (2004), Tango & Takahashi (2005), Yao et al. (2011), 糟谷・井上 (2012): 隣接する空間集計単位の組み合わせ

② 点事象の分布はポアソン分布に従うと仮定. H1 対立仮説: 集積領域内は領域外より点事象の分布密度が高い H0 帰無仮説: 集積領域の内外で点事象の分布密度に違いがない 集積領域の候補について,二つの仮説に基づく尤度の比,尤度比を記録することとする

③ 分析対象の時空間領域内を,①で定めた集積候補領域を用いて走査. 尤度比が最大となる候補を探し,Most Likely Cluster (MLC)とする.

空間スキャン統計

0

if

1 otherwise

n N n Nn N n N n N

Lv V v V v V

L

0

!

!

i

i

n N nN

i

x

NN

i

x

e n N nL v

N v V v

e NL v

N V

尤度比

分析対象領域

点数 N,面積 V

候補領域

点数 n,面積 v

④ MLC の有意性をモンテカルロシミュレーションを用いて検定. ランダム点分布の下でのMLCの尤度比分布を求め,データから得られる尤度比と比較

H0

H1

Page 6: リンクの接続関係を利用した ネットワーク上の 点事象集積検出 …gis.sk.tsukuba.ac.jp/2012-15_GIS-ASA/20130216/inoue.pdf · GPS付き携帯電話,Web mapping,

6 空間スキャン統計をネットワークに拡張した既往研究

Shiode (2011) ネットワーク上の任意の点から, ネットワーク上距離が一定距離以内の範囲を集積候補領域として設定 ユークリッド空間上での円形候補領域に相当

Shiode & Shiode (2012) Shiode (2011)を時空間に拡張

Page 7: リンクの接続関係を利用した ネットワーク上の 点事象集積検出 …gis.sk.tsukuba.ac.jp/2012-15_GIS-ASA/20130216/inoue.pdf · GPS付き携帯電話,Web mapping,

7 ネットワーク上の集積候補領域設定

集積候補領域の設定において 「任意の点から一定のネットワーク距離以内の場所をすべて含む」 という仮定は妥当か?

もしも 「ひったくりが裏通りだけで起こる (大通りでは起きない)」 なら

大通り

裏通り

ひったくり発生地点

集積領域の中心点

集積領域

ある点を中心に一定距離以内を 集積候補領域と設定するルールでは, 犯罪が起こっていない大通りも 集積領域として検出されてしまう ⇒ 不合理な場合あり

そこで,分析対象ネットワークを「性質が等しい領域」を表すリンクに分割, リンクを集積候補領域の最小単位と考え, 接続しているリンクの組み合わせを集積候補領域として設定する. ⇒ 去年の提案手法を,空間領域→リンク にしただけで適用可能.

Page 8: リンクの接続関係を利用した ネットワーク上の 点事象集積検出 …gis.sk.tsukuba.ac.jp/2012-15_GIS-ASA/20130216/inoue.pdf · GPS付き携帯電話,Web mapping,

8 提案手法

左図の範囲を対象に分析を行う場合, リンクの組み合わせ (1), (2), (3), (4) (1, 2), (1, 3), (1, 4), (2, 3), (2, 4), (3, 4) (1, 2, 3), (1, 2, 4), (1, 3, 4), (2, 3, 4) を集積候補領域として尤度比を算出. ↓ (1, 3): 尤度比最大の集積候補領域

接続リンクの組み合わせを,集積候補領域として設定し, 尤度比を用いて最も有意な集積を検出する

しかし,リンク数が多くなると,組み合わせ数は爆発的に増加 → 一度にすべての組み合わせを考慮することは不可能 対象ネットワークを分割し,部分ごとに尤度比が大きい領域を検索, 見つかった領域を結合していき,全体で尤度比が大きい領域を見つける.

Page 9: リンクの接続関係を利用した ネットワーク上の 点事象集積検出 …gis.sk.tsukuba.ac.jp/2012-15_GIS-ASA/20130216/inoue.pdf · GPS付き携帯電話,Web mapping,

9 提案手法

(1) 点が分布しているリンクを それぞれ集積候補領域と設定

Page 10: リンクの接続関係を利用した ネットワーク上の 点事象集積検出 …gis.sk.tsukuba.ac.jp/2012-15_GIS-ASA/20130216/inoue.pdf · GPS付き携帯電話,Web mapping,

10 提案手法

(1) 点が分布しているリンクを それぞれ集積候補領域と設定 (2) 集積候補領域をランダムに選び その領域に接続する領域を まとめて小領域を作成 すべての集積候補領域が 小領域に含まれるまで繰り返す

Page 11: リンクの接続関係を利用した ネットワーク上の 点事象集積検出 …gis.sk.tsukuba.ac.jp/2012-15_GIS-ASA/20130216/inoue.pdf · GPS付き携帯電話,Web mapping,

11 提案手法

(1) 点が分布しているリンクを それぞれ集積候補領域と設定 (2) 集積候補領域をランダムに選び その領域に接続する領域を まとめて小領域を作成 すべての集積候補領域が 小領域に含まれるまで繰り返す (3) 各小領域内で,最も尤度比が高い領域の組み合わせを探し 次の段階の集積候補領域として記録 また,小領域外の他の候補領域と繋がる領域も 次の段階の集積候補領域として記録

Page 12: リンクの接続関係を利用した ネットワーク上の 点事象集積検出 …gis.sk.tsukuba.ac.jp/2012-15_GIS-ASA/20130216/inoue.pdf · GPS付き携帯電話,Web mapping,

12 提案手法

(1) 点が分布しているリンクを それぞれ集積候補領域と設定 (2) 集積候補領域をランダムに選び その領域に接続する領域を まとめて小領域を作成 すべての集積候補領域が 小領域に含まれるまで繰り返す (3) 各小領域内で,最も尤度比が高い領域の組み合わせを探し 次の段階の集積候補領域として記録 また,小領域外の他の候補領域と繋がる領域も 次の段階の集積候補領域として記録 (4) 得られた集積候補領域を用いて(2)(3)を繰り返す 集積候補領域が1つになったら終了.

Page 13: リンクの接続関係を利用した ネットワーク上の 点事象集積検出 …gis.sk.tsukuba.ac.jp/2012-15_GIS-ASA/20130216/inoue.pdf · GPS付き携帯電話,Web mapping,

13 実行可能性の検証 (仙台市青葉区・居酒屋の集積)

<対象地域> 仙台市青葉区

<道路ネットワークデータ> Open Street Map (2012年12月時点) リンク数: 11,368本 リンク長: 1,358km

<店舗位置データ> 座標付き電話帳「テレポイント®Pack!」

CSISの共同研究を通じて入手

「居酒屋(501件)」の位置を使用

電話帳の店舗位置データを用いて,ネットワーク上の点集積検出を試行する

モンテカルロシミュレーションを用いて作成した ランダム分布における尤度比分布を利用し

有意水準1%の検定を行う

Page 14: リンクの接続関係を利用した ネットワーク上の 点事象集積検出 …gis.sk.tsukuba.ac.jp/2012-15_GIS-ASA/20130216/inoue.pdf · GPS付き携帯電話,Web mapping,

14

集積ID 対数尤度比 店舗数(件) リンク長(km) 店舗数/全店舗数(%)リンク長/総リンク長(%)MLC 955.6 213 3.06 42.5 0.225

2 70.9 14 0.16 2.8 0.0113 66.3 17 0.64 3.4 0.0474 66.7 16 0.49 3.2 0.0365 48.3 10 0.17 2.0 0.0126 45.7 12 0.59 2.4 0.0437 41.0 11 0.62 2.2 0.0458 39.7 9 0.27 1.8 0.0209 35.1 6 0.04 1.2 0.003

10 29.4 8 0.53 1.6 0.03911 27.7 7 0.36 1.4 0.02712 27.5 7 0.39 1.4 0.02913 26.8 4 0.01 0.8 0.00114 21.4 5 0.21 1.0 0.01515 20.6 5 0.25 1.0 0.01916 20.5 6 0.63 1.2 0.04717 19.8 5 0.32 1.0 0.02318 19.0 5 0.38 1.0 0.02819 18.5 4 0.14 0.8 0.01020 15.9 4 0.27 0.8 0.02021 13.8 4 0.48 0.8 0.03522 13.8 3 0.12 0.6 0.00923 13.7 3 0.12 0.6 0.00924 13.3 3 0.14 0.6 0.010

実行可能性の検証 (仙台市青葉区・居酒屋の集積)

Page 15: リンクの接続関係を利用した ネットワーク上の 点事象集積検出 …gis.sk.tsukuba.ac.jp/2012-15_GIS-ASA/20130216/inoue.pdf · GPS付き携帯電話,Web mapping,

15 実行可能性の検証 (仙台市青葉区・居酒屋の集積)

仙台駅

青葉通り

広瀬通り

定禅寺通り

国分町

繁華街の領域が 抽出できているように見える

Page 16: リンクの接続関係を利用した ネットワーク上の 点事象集積検出 …gis.sk.tsukuba.ac.jp/2012-15_GIS-ASA/20130216/inoue.pdf · GPS付き携帯電話,Web mapping,

16 実行可能性の検証 (仙台市青葉区・居酒屋の集積)

定禅寺通り

今回使用した道路データでは, 広幅員街路のリンクは 方向別に作成されている ⇒広幅員街路をまたぐ 集積として検出されない

[課題] リンクの「構成」「接続関係」を 重視した集積検出方法であるため ネットワークデータの作成方法に 検出結果が大きく依存

このネットワークデータの場合は, 点がないリンクも 点があるリンクに繋がる場合は 分析対象として残すと, 広幅員街路をまたぐ集積を検出可能. ただし,この対応も ネットワークデータの作成方法に依存

広瀬通り

Page 17: リンクの接続関係を利用した ネットワーク上の 点事象集積検出 …gis.sk.tsukuba.ac.jp/2012-15_GIS-ASA/20130216/inoue.pdf · GPS付き携帯電話,Web mapping,

17

集積ID 対数尤度比 店舗数(件) リンク長(km) 店舗数/全店舗数(%) リンク長/総リンク長(%)MLC 1390.3 363 12.99 72.5 0.956

2 52.0 14 1.27 2.8 0.0943 41.0 12 1.62 2.4 0.1204 38.6 6 0.04 1.2 0.0035 33.7 8 0.56 1.6 0.0426 29.0 4 0.01 0.8 0.0017 19.8 5 0.51 0.1 0.0378 17.6 4 0.27 0.8 0.0209 15.5 4 0.48 0.8 0.035

10 13.6 2 0.01 0.4 0.001

実行可能性の検証 (仙台市青葉区・居酒屋の集積)

Page 18: リンクの接続関係を利用した ネットワーク上の 点事象集積検出 …gis.sk.tsukuba.ac.jp/2012-15_GIS-ASA/20130216/inoue.pdf · GPS付き携帯電話,Web mapping,

18 実行可能性の検証 (仙台市青葉区・居酒屋の集積)

仙台駅

Page 19: リンクの接続関係を利用した ネットワーク上の 点事象集積検出 …gis.sk.tsukuba.ac.jp/2012-15_GIS-ASA/20130216/inoue.pdf · GPS付き携帯電話,Web mapping,

19 実行可能性の検証 (東京都千代田区・家電量販店の集積)

Page 20: リンクの接続関係を利用した ネットワーク上の 点事象集積検出 …gis.sk.tsukuba.ac.jp/2012-15_GIS-ASA/20130216/inoue.pdf · GPS付き携帯電話,Web mapping,

20 実行可能性の検証 (東京都千代田区・精密機器の集積)

Page 21: リンクの接続関係を利用した ネットワーク上の 点事象集積検出 …gis.sk.tsukuba.ac.jp/2012-15_GIS-ASA/20130216/inoue.pdf · GPS付き携帯電話,Web mapping,

おわりに 21

本研究では リンクを集積検出の最小単位・ 接続するリンクの組み合わせを集積領域の空間形状の候補とし ネットワーク上の点集積を検出する方法を提案した.

課題

(1)提案手法は,無作為に候補を選別し,集計操作用領域を作成. ⇒ 選び方により異なる集積検出結果が得られる. 安定的に尤度比の高い集積領域を検出できるようにするため, 集計操作用領域の設定に関して検討が必要.

(2)空間スキャン統計をベースにした方法では, 『対象領域に集積が1箇所ある(しかない)』という仮説を用いて 集積領域を探索.(2番目以降の集積は,「それまでに検出された集積が存在」という条件の下での検出) 一方,Mori and Smith (2010)は, 複数の集積領域が存在することにも対応した検出法を提案. ⇒ 複数集積領域の存在を考慮したモデルへの拡張が不可欠.

Page 22: リンクの接続関係を利用した ネットワーク上の 点事象集積検出 …gis.sk.tsukuba.ac.jp/2012-15_GIS-ASA/20130216/inoue.pdf · GPS付き携帯電話,Web mapping,

おわりに 22

拡張の方向性

・昨年の報告で行ったように,時空間上での集積検出へと拡張 ・時間と共に拡大・移動・縮小する集積領域の検出 (ネットワーク上に限らず)これまでに提案されている方法では, 時空間分析を行う際の重要な関心事である

「集積地域は時間の経過につれて どこで発生,拡大,移動,収束したのか?」

という問いに答えることができない.

提案手法は,空間を離散的に扱うことにより, 柔軟な空間形状の集積を検出する方法.

時間も離散的に扱えば,同様のアプローチで, 時間と共に変化する空間形状が変化する集積の検出が可能になると 期待できる.