地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進...
-
Upload
kunihiko-miyoshi -
Category
Presentations & Public Speaking
-
view
210 -
download
0
Transcript of 地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進...
地理統計データ閲覧アプリケーション『Seseki』を活用した地域課題分析の促進三好 邦彦 (釧路公立大学 皆月研究室 学術研究員)
目次1. 自己紹介
2. オープンデータとは
3. 動向1. 世界の動向
2. 日本の動向
3. 北海道の動向
4. アプリケーション Seseki の紹介
5. 演習
自己紹介経歴◦ 十勝地方幕別町出身
◦ 2002年4月~2008年3月札幌にて大学生時代を送る
◦ 2008年4月~現在 : 精密機器メーカーにて情報技術の研究開発に従事
◦ 2016年4月~現在 : 釧路公立大学皆月研究室学術研究員(遠隔)
受賞歴◦ 2015年北海道オープンデータハッカソンクリプトンフューチャーメディア賞
◦ 2016年アーバンデータチャレンジ2015 ファイナルアプリケーション部門金賞
その他◦ とかち東京クラブ事務局長
◦ 関東在住十勝出身者のゆるいコミュニティ、関東で北海道と十勝を発信中
◦ ホッキョクグマ好き(ミルクに会いたい)
http://colspan.hatenablog.com/
観光客統計データをクラスタリング
http://colspan.github.io/clustering_hokkaido_tourism/
北海道観光客統計データ閲覧くん
北海道オープンデータハッカソンクリプトンフューチャーメディア賞受賞
http://labo.colspan.net/hokkaido_tourism/
Seseki
アーバンデータチャレンジ2015 アプリ部門金賞
オープンデータとは
Google検索すると3000万件もヒットする
バズワード
喜多耕一氏,北海道のオープンデータを推進してみたhttp://www.slideshare.net/KouichiKita/ss-63861578
喜多耕一氏,北海道のオープンデータを推進してみたhttp://www.slideshare.net/KouichiKita/ss-63861578
喜多耕一氏,北海道のオープンデータを推進してみたhttp://www.slideshare.net/KouichiKita/ss-63861578
喜多耕一氏,北海道のオープンデータを推進してみたhttp://www.slideshare.net/KouichiKita/ss-63861578
具体的に何が起こっているのか?
オープンデータが変えたこと1. 行政がデータを市民に開放し,活用を促した
2. 市民が開放されたデータを活用し始めた
3. 行政の手が回らない課題に対して市民が解決策を導き出した
オープンデータが変えたこと1. 行政がデータを市民に開放し,活用を促した
2. 市民が開放されたデータを活用し始めた
3. 行政の手が回らない課題に対して市民が解決策を導き出した
内閣官房情報通信技術(IT)総合戦略室
日本の動向 1/3オープンデータ地方公共団体のための手引書◦ http://www.kantei.go.jp/jp/singi/it2/densi/kettei/opendata_tebikisyo.pdf
E-Stat◦ https://www.e-stat.go.jp/
Data.go.jp◦ http://www.data.go.jp/
オープンデータプラットフォーム◦ http://odp.jig.jp/
日本の動向 2/3
http://fukuno.jig.jp/app/opendatacity/pref.html
北海道の事例 : 行政系
北海道庁 室蘭市 札幌市森町
その他 :八雲町,旭川市,小樽市,函館市
オープンデータが変えたこと1. 行政がデータを市民に開放し,活用を促した
2. 市民が開放されたデータを活用し始めた
3. 行政の手が回らない課題に対して市民が解決策を導き出した
日本の動向 3/3コミュニティ◦ Code for Japan (http://code4japan.org/)
◦ OSGeo.JP (http://www.osgeo.jp/)
コンテスト◦ アーバンデータチャレンジ(http://urbandata-challenge.jp/)
◦ LODチャレンジ(http://lodc.jp/2016/)
◦ マッシュアップアワーズ(http://mashupaward.jp/)
北海道の事例 : コミュニティ
ハウモリ(森町) Code for Sapporo
オープンデータが変えたこと1. 行政がデータを市民に開放し,活用を促した
2. 市民が開放されたデータを活用し始めた
3. 行政の手が回らない課題に対して市民が解決策を導き出した
主要事例Open DATA METIサイトオープンデータの活用事例~海外及び日本の事例~
http://datameti.go.jp/wp-content/uploads/2014/01/03b558b1126807662402d3ebb9a98605.pdf
主な活用パターン①
課題を持ったアプリを作れる市民
オープンデータ情報開示請求無しで入手可
二次利用可
アプリ
市民
City Dashboardhttp://citydashboard.org/london/
さっぽろ保育園マップhttp://papamama.codeforsapporo.org/
5374(ごみなし)http://5374.jp/
課題発見解決策検討
主な活用パターン②
私達オープンデータ情報開示請求無しで入手可
二次利用可
表計算ソフトで分析
地図化して分析
読んで分析
私達にとってのオープンデータ
北海道は広い
http://matome.naver.jp/odai/2141656249037467201/2141657694257177203
データ入手
地図化 分析
オープンデータには位置に紐づく情報が多い
数字の羅列のままではとても手間がかかる…
データの価値判断
市町村ランキング作成
地理関係把握
関連のある項目探し
地図化すれば一目瞭然!
地図化の先行事例
CC BY Qgis勉強会厚沢部シリーズ 2015_04http://www.slideshare.net/KouichiKita/qgis-201504-47376882
行政系サービス 地理情報可視化ソフトウェア
RESAS
国土情報ウェブマッピングシステム
CARTO
QGIS
先行事例の課題行政系サービス◦ 動作が軽快ではない
◦ 目的データにたどり着くまでに時間がかかる
◦ 地方のデータが荒い場合がある
◦ 自分のデータを登録できない
地理情報可視化ソフトウェア◦ 操作の習得に時間を要する
◦ 地図データの調達が煩雑である
◦ プログラミングかそれに近い作業が発生する
自力で可視化をするにはプログラミングが必要な場合も
地理情報特有の高度なスキルが必要
簡単にするアプリを作りました
アプリケーション概要市町村単位で集計されたデータの閲覧アプリ「Seseki」を開発
※「セセキ」 = アイヌ語で「温泉」を意味する単語観光の中心である温泉を軸に様々な観光戦略が湧いてくることを祈願し、この名前をつけた。
http://bit.ly/seseki_hokkaido
目的・目標
住んでいる地域を中心に分析する
自分で用意したデータを入力できる
自分のパソコンでも簡単に使える
新たなスキルがほとんどいらない
軽快に操作できる
Step1 データをExcel等で整形
Step2 整形済データを入力 CSV
CSV
(方法1)CSVファイルを開く (方法2)スプレッドシートにペースト
Step3 閲覧する
ヒートマップ表示&画像保存 ランキング 項目切替
市町村名表示 市町村の各データ一覧
http://bit.ly/seseki_hokkaido
受付可能なCSVファイル
…
…
題名
1行1市町村
項目名
市町村名
…
統計値
ドーナツ化現象が顕著に観察できる
[出典]北海道庁市町村別面積・人口・世帯数等の状況
北海道には牛が人よりも多い市町村が51もある
順位 市町村名飼育頭数の人口比
1 士幌町 10.94
2 別海町 7.00
3 標茶町 6.79
4 上士幌町 6.70
5 鶴居村 5.56
6 鹿追町 5.53
7 清水町 5.45
8 新得町 4.98
9 大樹町 4.87
10 豊頃町 4.83[出典]独立行政法人家畜改良センター届出情報の統計-目的別索引-牛の個体識別情報検索サービス
演習1サンプルデータをご自由に御覧ください
◦ サンプルデータ01~03には「注目」データに目印がついています
演習2「住民基本台帳人口・世帯数及び人口動態」のデータから「人口に占める外国人の割合」を求めてみましょう
1. 変換済みCSVファイルのダウンロード
2. ExcelでCSVファイルを開く
3. セルAX2に数式「=M2/B2」を代入
4. AX列全てに3の式をフィルコピー
5. CSVファイルに上書き保存
6. CSVファイルをSesekiで開く
回答例
Q. 他の情報源(e-STAT等)から自分でデータを入力するには?
A. 下記のCSVファイルを手作業で作ります
…
…
題名
1行1市町村
項目名
市町村名
…
統計値
公開されているデータにはこのようなものが多いです
商業統計調査統計表一覧平成26年商業統計確報 第3巻 産業編(市区町村表)https://www.e-stat.go.jp/SG1/estat/GL08020103.do?_toGL08020103_&tclassID=000001066198&cycleCode=0&requestSender=dsearch
この書式からの市町村名の整形に時間がかかります
Sesekiを始めとした自動化ソフトウェアは融通が効きません
665 弟 子 屈 町
• 連番等の数値と市町村名が交じると読めなくなります• スペースは自動的に読み飛ばせません
弟子屈町
Excelによる整形例
数値を消す全角スペースを消す
しかしながら中には例外も…
半角スペース…
自動化する技術はまだありません目視確認が必要です
データ整形
可視化 分析
実はここが一番大変??
機械と人の違い
純粋なデータ
人にとって可読性の高い書式
機械にとって可読性の高い書式
罫線がわかりやすく引かれている定期的にページが区切られる
1行ずつ、1列ずつデータの意味が明記される同じ書式で列挙されるワークシートやファイルをまたがない表記が統一されている
機械と人の違い
純粋なデータ
人にとって可読性の高い書式
機械にとって可読性の高い書式
罫線がわかりやすく引かれている定期的にページが区切られる
1行ずつ、1列ずつデータの意味が明記される同じ書式で列挙されるワークシートやファイルをまたがない表記が統一されている
数種類のデータだけなら手作業でも良いが、数十になると心が折れる…
要変換
プログラミングができれば自動化できますが、誰もができるわけではありません
機械と人の違い
純粋なデータ
人にとって可読性の高い書式
機械にとって可読性の高い書式
罫線がわかりやすく引かれている定期的にページが区切られる
1行ずつ、1列ずつデータの意味が明記される同じ書式で列挙されるワークシートやファイルをまたがない表記が統一されている
コンピュータに優しいデータを普及させていきませんか?
[出典]北海道庁市町村別面積・人口・世帯数等の状況
ご静聴ありがとうございました
参考資料
アンケートによる評価質問内容◦ アプリケーション操作の難易度に関する質問
◦ 各機能の貢献度に関する質問
◦ 市町村の特徴把握に役立つ方法に関する質問
◦ データ入力の難易度に関する質問
対象者 : 計34名◦ 市立釧路総合病院
◦ 釧路市役所
知って
いる,
21
知らな
い, 13
中央省庁や地方自治体の統計データがWebサイトで入手可能であることを
中央省庁や地方自治体の統計データに対する分析経験が
ある,
20
ない, 4
無回
答, 10
アプリケーション操作の難易度に関する質問◦ アプリケーション起動直後の画面から迷いなく操作はできましたか?
よくできた, 7
できた, 14
どちらでもない, 8
できな
かった,
3
まったくできなかっ
た, 1
各機能の貢献度に関する質問①ヒートマップ表示
②表示項目切り替え
③ランキング表示
④マウス指示による
市町村名重畳表示
⑤市町村別項目
一覧表示
⑥チュートリアル
1点 1名 (2.9%) 2名 (5.9%) 2名 (5.9%) 2名 (5.9%) 2名 (5.9%) 0名 (0.0%)
2点3名 (8.8%) 2名 (5.9%) 4名 (11.8%) 3名 (8.8%) 3名 (8.8%) 3名 (8.8%)
3点9名 (26.5%) 11名 (32.4%) 5名 (14.7%) 7名 (20.6%) 9名 (26.5%) 13名 (38.2%)
4点10名 (29.4%) 6名 (17.6%) 11名 (32.4%) 10名 (29.4%) 8名 (23.5%) 9名 (26.5%)
5点10名 (29.4%) 12名 (35.3%) 11名 (32.4%) 11名 (32.4%) 11名 (32.4%) 3名 (8.8%)
4点以上の回答が50%超
市町村の分析方法に関する質問A表示項目切り替え
による複数観点観察
B他の市町村との
相対比較
C地理関係の把握
D統計値の
経年変化の把握
E複数の統計値の
複合計算値の閲覧
1点 0名(0.0%) 1名 (2.9%) 0名 (0.0%) 0名 (0.0%) 0名 (0.0%)2点 3名(8.8%) 4名 (11.8%) 4名 (11.8%) 5名 (14.7%) 5名 (14.7%)3点 11名 (32.4%) 9名 (26.5%) 17名 (50.0%) 15名 (44.1%) 16名 (47.1%)4点 13名 (38.2%) 9名 (26.5%) 8名 (23.5%) 7名 (20.6%) 8名 (23.5%)5点 6名 (17.6%) 10名 (29.4%) 4名 (11.8%) 6名 (17.6%) 4名 (11.8%)
データ入力の難易度に関する質問ファイル入力
ダイアログボックスに
よる入力
テキストデータのコ
ピー・アンド・ペースト
による入力
Excel
データのコピー・
アンド・ペーストによる
入力
北海道庁公開データ
の本アプリ形式への
手作業変換
自作の複合計算値を
作成・アプリへ入力
1点 0名 (0.0%) 0名 (0.0%) 0名 (0.0%) 0名 (0.0%) 0名 (0.0%)2点 2名 (5.9%) 1名 (2.9%) 1名 (2.9%) 1名 (2.9%) 2名 (5.9%)3点 20名 (58.8%) 15名 (44.1%) 16名 (47.1%) 20名 (58.8%) 21名 (61.8%)4点 10名 (29.4%) 16名 (47.1%) 13名 (38.2%) 10名 (29.4%) 9名 (26.5%)5点 0名 (0.0%) 0名 (0.0%) 2名 (5.9%) 1名 (2.9%) 0名 (0.0%)5点=とても難しい,4点=難しい,3点=ふつう,2点=やさしい,1点=とてもやさしい
半数が「ふつう」と回答していることから難易度は適正コピー・アンド・ペーストによる入力方法には追加要望の調査・改善が必要
考察「新たなスキルがほとんどいらない」「軽快に動作する」アプリケーションを実現する目標を達成できた
【各機能の貢献度に関する質問】: 4点以上の回答が50%超◦ 「⑥チュートリアル」を除く
◦ 事前に用意しておいたサンプルデータが利用者の興味や関心に不合致だったためと追加調査で判明 : データの準備・分析の誘導が重要
【市町村の分析方法に関する質問】◦ 「A表示項目切り替えによる複数観点観察」「B他の市町村との相対比較」において4点以上が50%超◦ 注目する市町村の特徴を捉える上で,この2つの手法をスムーズに行えることが,分析ツールの重要な要件であると考えられる.
今後の展望Githubにおける公開開発
https://github.com/colspan/seseki_viewer◦ 地図を差し替えればどこにでも対応できます
◦ 現在私ひとりであるため縁のある場所から作っています…
◦ Webの汎用技術を組み合わせて作っています◦ D3.js, jQuery, GeoJSON, TopoJSON, handsontable, materialize-css
◦ Fork, Pull Request歓迎します!◦ 他地域版への展開や機能改善にご協力いただける方を探しています
本アプリケーションを活用した地域課題の深掘り◦ 医療拠点の可視化,病院・医師の配置検証
◦ 台風被害の可視化,活動拠点の効果検証
http://bit.ly/seseki_hokkaido
オープンデータの闇ファイルがリンク切れで入手できない
Excelファイルのバージョンが年度によって違う
ワークシート数が20とか30とかある
平気でセルを結合する
空行を使って改ページをしている
集計行と単位行の区別がなく列挙されている
全角スペースでうめつくされた謎の40列
全角文字と半角文字が不規則に混在する (2016 年 4月)
誤記・表記ゆれが多数 (中礼内、オホーツ)
200列もデータが並んでいるのはいいけど、集計したい順に並んでいない
合併前後のデータの分離・合算が使う側の作業になっている
有意義な情報なのに、集計だけでもつらい