地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進...

73
地理統計データ 閲覧アプリケーション 『Seseki』を活用した 地域課題分析の促進 三好 邦彦 (釧路公立大学 皆月研究室 学術研究員)

Transcript of 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進...

Page 1: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進三好 邦彦 (釧路公立大学 皆月研究室 学術研究員)

Page 2: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進
Page 3: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

目次1. 自己紹介

2. オープンデータとは

3. 動向1. 世界の動向

2. 日本の動向

3. 北海道の動向

4. アプリケーション Seseki の紹介

5. 演習

Page 4: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

自己紹介経歴◦ 十勝地方幕別町出身

◦ 2002年4月~2008年3月札幌にて大学生時代を送る

◦ 2008年4月~現在 : 精密機器メーカーにて情報技術の研究開発に従事

◦ 2016年4月~現在 : 釧路公立大学皆月研究室学術研究員(遠隔)

受賞歴◦ 2015年北海道オープンデータハッカソンクリプトンフューチャーメディア賞

◦ 2016年アーバンデータチャレンジ2015 ファイナルアプリケーション部門金賞

その他◦ とかち東京クラブ事務局長

◦ 関東在住十勝出身者のゆるいコミュニティ、関東で北海道と十勝を発信中

◦ ホッキョクグマ好き(ミルクに会いたい)

http://colspan.hatenablog.com/

Page 5: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

観光客統計データをクラスタリング

http://colspan.github.io/clustering_hokkaido_tourism/

Page 6: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

北海道観光客統計データ閲覧くん

北海道オープンデータハッカソンクリプトンフューチャーメディア賞受賞

http://labo.colspan.net/hokkaido_tourism/

Page 7: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進
Page 8: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

Seseki

アーバンデータチャレンジ2015 アプリ部門金賞

Page 9: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

オープンデータとは

Page 10: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

Google検索すると3000万件もヒットする

バズワード

Page 11: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

喜多耕一氏,北海道のオープンデータを推進してみたhttp://www.slideshare.net/KouichiKita/ss-63861578

Page 12: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

喜多耕一氏,北海道のオープンデータを推進してみたhttp://www.slideshare.net/KouichiKita/ss-63861578

Page 13: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

喜多耕一氏,北海道のオープンデータを推進してみたhttp://www.slideshare.net/KouichiKita/ss-63861578

Page 14: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

喜多耕一氏,北海道のオープンデータを推進してみたhttp://www.slideshare.net/KouichiKita/ss-63861578

Page 15: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

具体的に何が起こっているのか?

Page 16: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

オープンデータが変えたこと1. 行政がデータを市民に開放し,活用を促した

2. 市民が開放されたデータを活用し始めた

3. 行政の手が回らない課題に対して市民が解決策を導き出した

Page 17: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

オープンデータが変えたこと1. 行政がデータを市民に開放し,活用を促した

2. 市民が開放されたデータを活用し始めた

3. 行政の手が回らない課題に対して市民が解決策を導き出した

Page 18: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

内閣官房情報通信技術(IT)総合戦略室

Page 19: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

日本の動向 1/3オープンデータ地方公共団体のための手引書◦ http://www.kantei.go.jp/jp/singi/it2/densi/kettei/opendata_tebikisyo.pdf

E-Stat◦ https://www.e-stat.go.jp/

Data.go.jp◦ http://www.data.go.jp/

オープンデータプラットフォーム◦ http://odp.jig.jp/

Page 20: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

日本の動向 2/3

http://fukuno.jig.jp/app/opendatacity/pref.html

Page 21: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

北海道の事例 : 行政系

北海道庁 室蘭市 札幌市森町

その他 :八雲町,旭川市,小樽市,函館市

Page 22: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

オープンデータが変えたこと1. 行政がデータを市民に開放し,活用を促した

2. 市民が開放されたデータを活用し始めた

3. 行政の手が回らない課題に対して市民が解決策を導き出した

Page 23: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

日本の動向 3/3コミュニティ◦ Code for Japan (http://code4japan.org/)

◦ OSGeo.JP (http://www.osgeo.jp/)

コンテスト◦ アーバンデータチャレンジ(http://urbandata-challenge.jp/)

◦ LODチャレンジ(http://lodc.jp/2016/)

◦ マッシュアップアワーズ(http://mashupaward.jp/)

Page 24: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

北海道の事例 : コミュニティ

ハウモリ(森町) Code for Sapporo

Page 25: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

オープンデータが変えたこと1. 行政がデータを市民に開放し,活用を促した

2. 市民が開放されたデータを活用し始めた

3. 行政の手が回らない課題に対して市民が解決策を導き出した

Page 26: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

主要事例Open DATA METIサイトオープンデータの活用事例~海外及び日本の事例~

http://datameti.go.jp/wp-content/uploads/2014/01/03b558b1126807662402d3ebb9a98605.pdf

Page 27: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

主な活用パターン①

課題を持ったアプリを作れる市民

オープンデータ情報開示請求無しで入手可

二次利用可

アプリ

市民

Page 28: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

City Dashboardhttp://citydashboard.org/london/

さっぽろ保育園マップhttp://papamama.codeforsapporo.org/

5374(ごみなし)http://5374.jp/

Page 29: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

課題発見解決策検討

主な活用パターン②

私達オープンデータ情報開示請求無しで入手可

二次利用可

表計算ソフトで分析

地図化して分析

読んで分析

Page 30: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

私達にとってのオープンデータ

Page 31: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

北海道は広い

http://matome.naver.jp/odai/2141656249037467201/2141657694257177203

Page 32: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

データ入手

地図化 分析

Page 33: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

オープンデータには位置に紐づく情報が多い

Page 34: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

数字の羅列のままではとても手間がかかる…

データの価値判断

市町村ランキング作成

地理関係把握

関連のある項目探し

Page 35: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

地図化すれば一目瞭然!

Page 36: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

地図化の先行事例

CC BY Qgis勉強会厚沢部シリーズ 2015_04http://www.slideshare.net/KouichiKita/qgis-201504-47376882

行政系サービス 地理情報可視化ソフトウェア

RESAS

国土情報ウェブマッピングシステム

CARTO

QGIS

Page 37: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

先行事例の課題行政系サービス◦ 動作が軽快ではない

◦ 目的データにたどり着くまでに時間がかかる

◦ 地方のデータが荒い場合がある

◦ 自分のデータを登録できない

地理情報可視化ソフトウェア◦ 操作の習得に時間を要する

◦ 地図データの調達が煩雑である

◦ プログラミングかそれに近い作業が発生する

Page 38: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

自力で可視化をするにはプログラミングが必要な場合も

地理情報特有の高度なスキルが必要

Page 39: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

簡単にするアプリを作りました

Page 40: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

アプリケーション概要市町村単位で集計されたデータの閲覧アプリ「Seseki」を開発

※「セセキ」 = アイヌ語で「温泉」を意味する単語観光の中心である温泉を軸に様々な観光戦略が湧いてくることを祈願し、この名前をつけた。

http://bit.ly/seseki_hokkaido

Page 41: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

目的・目標

住んでいる地域を中心に分析する

自分で用意したデータを入力できる

自分のパソコンでも簡単に使える

新たなスキルがほとんどいらない

軽快に操作できる

Page 42: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

Step1 データをExcel等で整形

Step2 整形済データを入力 CSV

CSV

(方法1)CSVファイルを開く (方法2)スプレッドシートにペースト

Page 43: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

Step3 閲覧する

ヒートマップ表示&画像保存 ランキング 項目切替

市町村名表示 市町村の各データ一覧

http://bit.ly/seseki_hokkaido

Page 44: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

受付可能なCSVファイル

題名

1行1市町村

項目名

市町村名

統計値

Page 45: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

デモ

http://bit.ly/seseki_hokkaido

Page 46: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

ドーナツ化現象が顕著に観察できる

[出典]北海道庁市町村別面積・人口・世帯数等の状況

Page 47: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

北海道には牛が人よりも多い市町村が51もある

順位 市町村名飼育頭数の人口比

1 士幌町 10.94

2 別海町 7.00

3 標茶町 6.79

4 上士幌町 6.70

5 鶴居村 5.56

6 鹿追町 5.53

7 清水町 5.45

8 新得町 4.98

9 大樹町 4.87

10 豊頃町 4.83[出典]独立行政法人家畜改良センター届出情報の統計-目的別索引-牛の個体識別情報検索サービス

Page 48: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

東京近郊版も公開中

http://bit.ly/seseki_tokyo

Page 49: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

演習1サンプルデータをご自由に御覧ください

◦ サンプルデータ01~03には「注目」データに目印がついています

Page 50: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

演習2「住民基本台帳人口・世帯数及び人口動態」のデータから「人口に占める外国人の割合」を求めてみましょう

1. 変換済みCSVファイルのダウンロード

2. ExcelでCSVファイルを開く

3. セルAX2に数式「=M2/B2」を代入

4. AX列全てに3の式をフィルコピー

5. CSVファイルに上書き保存

6. CSVファイルをSesekiで開く

Page 51: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

回答例

Page 52: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

Q. 他の情報源(e-STAT等)から自分でデータを入力するには?

Page 53: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

A. 下記のCSVファイルを手作業で作ります

題名

1行1市町村

項目名

市町村名

統計値

Page 54: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

公開されているデータにはこのようなものが多いです

商業統計調査統計表一覧平成26年商業統計確報 第3巻 産業編(市区町村表)https://www.e-stat.go.jp/SG1/estat/GL08020103.do?_toGL08020103_&tclassID=000001066198&cycleCode=0&requestSender=dsearch

この書式からの市町村名の整形に時間がかかります

Page 55: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

Sesekiを始めとした自動化ソフトウェアは融通が効きません

665 弟 子 屈 町

• 連番等の数値と市町村名が交じると読めなくなります• スペースは自動的に読み飛ばせません

弟子屈町

Page 56: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

Excelによる整形例

数値を消す全角スペースを消す

Page 57: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

しかしながら中には例外も…

半角スペース…

自動化する技術はまだありません目視確認が必要です

Page 58: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

データ整形

可視化 分析

実はここが一番大変??

Page 59: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

機械と人の違い

純粋なデータ

人にとって可読性の高い書式

機械にとって可読性の高い書式

罫線がわかりやすく引かれている定期的にページが区切られる

1行ずつ、1列ずつデータの意味が明記される同じ書式で列挙されるワークシートやファイルをまたがない表記が統一されている

Page 60: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

機械と人の違い

純粋なデータ

人にとって可読性の高い書式

機械にとって可読性の高い書式

罫線がわかりやすく引かれている定期的にページが区切られる

1行ずつ、1列ずつデータの意味が明記される同じ書式で列挙されるワークシートやファイルをまたがない表記が統一されている

数種類のデータだけなら手作業でも良いが、数十になると心が折れる…

要変換

Page 61: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

プログラミングができれば自動化できますが、誰もができるわけではありません

Page 62: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

機械と人の違い

純粋なデータ

人にとって可読性の高い書式

機械にとって可読性の高い書式

罫線がわかりやすく引かれている定期的にページが区切られる

1行ずつ、1列ずつデータの意味が明記される同じ書式で列挙されるワークシートやファイルをまたがない表記が統一されている

Page 63: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

コンピュータに優しいデータを普及させていきませんか?

[出典]北海道庁市町村別面積・人口・世帯数等の状況

Page 64: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

ご静聴ありがとうございました

Page 65: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

参考資料

Page 66: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

アンケートによる評価質問内容◦ アプリケーション操作の難易度に関する質問

◦ 各機能の貢献度に関する質問

◦ 市町村の特徴把握に役立つ方法に関する質問

◦ データ入力の難易度に関する質問

対象者 : 計34名◦ 市立釧路総合病院

◦ 釧路市役所

知って

いる,

21

知らな

い, 13

中央省庁や地方自治体の統計データがWebサイトで入手可能であることを

中央省庁や地方自治体の統計データに対する分析経験が

ある,

20

ない, 4

無回

答, 10

Page 67: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

アプリケーション操作の難易度に関する質問◦ アプリケーション起動直後の画面から迷いなく操作はできましたか?

よくできた, 7

できた, 14

どちらでもない, 8

できな

かった,

3

まったくできなかっ

た, 1

Page 68: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

各機能の貢献度に関する質問①ヒートマップ表示

②表示項目切り替え

③ランキング表示

④マウス指示による

市町村名重畳表示

⑤市町村別項目

一覧表示

⑥チュートリアル

1点 1名 (2.9%) 2名 (5.9%) 2名 (5.9%) 2名 (5.9%) 2名 (5.9%) 0名 (0.0%)

2点3名 (8.8%) 2名 (5.9%) 4名 (11.8%) 3名 (8.8%) 3名 (8.8%) 3名 (8.8%)

3点9名 (26.5%) 11名 (32.4%) 5名 (14.7%) 7名 (20.6%) 9名 (26.5%) 13名 (38.2%)

4点10名 (29.4%) 6名 (17.6%) 11名 (32.4%) 10名 (29.4%) 8名 (23.5%) 9名 (26.5%)

5点10名 (29.4%) 12名 (35.3%) 11名 (32.4%) 11名 (32.4%) 11名 (32.4%) 3名 (8.8%)

4点以上の回答が50%超

Page 69: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

市町村の分析方法に関する質問A表示項目切り替え

による複数観点観察

B他の市町村との

相対比較

C地理関係の把握

D統計値の

経年変化の把握

E複数の統計値の

複合計算値の閲覧

1点 0名(0.0%) 1名 (2.9%) 0名 (0.0%) 0名 (0.0%) 0名 (0.0%)2点 3名(8.8%) 4名 (11.8%) 4名 (11.8%) 5名 (14.7%) 5名 (14.7%)3点 11名 (32.4%) 9名 (26.5%) 17名 (50.0%) 15名 (44.1%) 16名 (47.1%)4点 13名 (38.2%) 9名 (26.5%) 8名 (23.5%) 7名 (20.6%) 8名 (23.5%)5点 6名 (17.6%) 10名 (29.4%) 4名 (11.8%) 6名 (17.6%) 4名 (11.8%)

Page 70: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

データ入力の難易度に関する質問ファイル入力

ダイアログボックスに

よる入力

テキストデータのコ

ピー・アンド・ペースト

による入力

Excel

データのコピー・

アンド・ペーストによる

入力

北海道庁公開データ

の本アプリ形式への

手作業変換

自作の複合計算値を

作成・アプリへ入力

1点 0名 (0.0%) 0名 (0.0%) 0名 (0.0%) 0名 (0.0%) 0名 (0.0%)2点 2名 (5.9%) 1名 (2.9%) 1名 (2.9%) 1名 (2.9%) 2名 (5.9%)3点 20名 (58.8%) 15名 (44.1%) 16名 (47.1%) 20名 (58.8%) 21名 (61.8%)4点 10名 (29.4%) 16名 (47.1%) 13名 (38.2%) 10名 (29.4%) 9名 (26.5%)5点 0名 (0.0%) 0名 (0.0%) 2名 (5.9%) 1名 (2.9%) 0名 (0.0%)5点=とても難しい,4点=難しい,3点=ふつう,2点=やさしい,1点=とてもやさしい

半数が「ふつう」と回答していることから難易度は適正コピー・アンド・ペーストによる入力方法には追加要望の調査・改善が必要

Page 71: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

考察「新たなスキルがほとんどいらない」「軽快に動作する」アプリケーションを実現する目標を達成できた

【各機能の貢献度に関する質問】: 4点以上の回答が50%超◦ 「⑥チュートリアル」を除く

◦ 事前に用意しておいたサンプルデータが利用者の興味や関心に不合致だったためと追加調査で判明 : データの準備・分析の誘導が重要

【市町村の分析方法に関する質問】◦ 「A表示項目切り替えによる複数観点観察」「B他の市町村との相対比較」において4点以上が50%超◦ 注目する市町村の特徴を捉える上で,この2つの手法をスムーズに行えることが,分析ツールの重要な要件であると考えられる.

Page 72: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

今後の展望Githubにおける公開開発

https://github.com/colspan/seseki_viewer◦ 地図を差し替えればどこにでも対応できます

◦ 現在私ひとりであるため縁のある場所から作っています…

◦ Webの汎用技術を組み合わせて作っています◦ D3.js, jQuery, GeoJSON, TopoJSON, handsontable, materialize-css

◦ Fork, Pull Request歓迎します!◦ 他地域版への展開や機能改善にご協力いただける方を探しています

本アプリケーションを活用した地域課題の深掘り◦ 医療拠点の可視化,病院・医師の配置検証

◦ 台風被害の可視化,活動拠点の効果検証

http://bit.ly/seseki_hokkaido

Page 73: 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進

オープンデータの闇ファイルがリンク切れで入手できない

Excelファイルのバージョンが年度によって違う

ワークシート数が20とか30とかある

平気でセルを結合する

空行を使って改ページをしている

集計行と単位行の区別がなく列挙されている

全角スペースでうめつくされた謎の40列

全角文字と半角文字が不規則に混在する (2016 年 4月)

誤記・表記ゆれが多数 (中礼内、オホーツ)

200列もデータが並んでいるのはいいけど、集計したい順に並んでいない

合併前後のデータの分離・合算が使う側の作業になっている

有意義な情報なのに、集計だけでもつらい