Post on 13-Jul-2015
開放內容的衝擊
開放街圖和維基百科在臺發展
以及如何可能影響政府
201411/08 g0v Summit 2014 米零時政府 陳瑞霖啥
● TechNews 科技新報部落客
● 中華民國維基協會監事長
● OpenStreetMap Mapper
● 關注 Cultural Data 的議題
● 關心 Open Data
我是 Dennis(Supaplex)
今天想談的
● 開放街圖的資料
● 維基百科的文化性資料
如何取得資料 ?
● 買
● 合法的抄
● 砍 - 開發者、 g0v 社群成員的作法
Ronny Wang Github
無法取得資料怎麼辦 ?
● 除了政府 / 公司 有沒有其他取得資料方式 ?
● 也許群 編輯的資料庫是另一個途徑眾
Westeros.org fan site
http://awoiaf.westeros.org/index.php/A_Game_of_Thrones
手動 copy 維基內容
正規的要資料方式?● API
MediaWiki
Foursquare 的地圖
群 共編的資料眾
● 維基百科
– 英文 4,638,088 筆條目
– 中文 786,450 筆條目 (2014-11-3)
● 開放街圖
– 38G 的點線面資料 (2014-11-3)
●英文邁向五百萬筆條目
開放街圖註冊用戶邁向二百萬
http://wiki.openstreetmap.org/wiki/File:Osmdbstats1_users.png
http://wiki.openstreetmap.org/wiki/File:Osmdbstats2.png
開放街圖 OpenStreetMap
● 2004年成立
● 受維基百科的 發啟
● 群 共編的地圖眾
● 開放的地理圖資
● 許多網站使用:
Foursquare、 Apple
Photo、 Flickr、維基百科
三鶯部落、溪州部落
印度公園主題地圖
開放街圖資料取得● Planet.osm
– 分國家的 mirror
● OpenStreetMap API● Overpass API
Geofabrik Download
http://download.geofabrik.de/asia/taiwan.html
Youbike資料
http://overpass-turbo.eu/s/5Kp
登山步道
與政府的互動
● 紐約市建築繪入開放街圖
● 英國 Royal Mail郵筒資料
紐約市地址資料
http://wiki.openstreetmap.org/wiki/File:NYC_buildings.png
與政府打交道最壞的狀況
● 不一定會理你
● 不一定能達成雙方滿意的協議
● 可能會告你
如果政府不理你
● 繼續遊說
● 號召 民行動鄉
Free Our Data 運動
● 英國衛報發動
● 2006 年
● Freedom of Information Request
● 抗議政府機關拿納稅人錢收集的資料卻要收費
● 英國開放資料運動的前身
Royal Mail 的郵筒位置
● 2008 年 5 月
● Freedom of Information request to Royal Mail
結果● Royal Mail 釋出 116,000 郵筒位置
● 有人將 pdf 裡的郵筒位置轉成純文字檔 csv 格式
● 有人用郵筒資料做網站
● Royal Mail 宣稱對這些資料擁有著作權,威脅告提供網站 詢系統的人查
● 位置不精確
● 後續有人要求公 收信時間、更正錯誤佈
今天想談的
● 開放街圖的資料
● 維基百科的文化性資料
維基百科的文化性資料
● 維基百科的文化性資產條目
● 2013 維基愛古蹟 @ 臺灣比賽
臺北府城北門
臺北市文化資產列表
維基愛古蹟
● 2010 年荷蘭維基社群發起
● 2011 年擴大至歐洲各國
● 2012 年走向全世界
● 2013 年台灣首次參加
維基愛古蹟
● 社群發起的古蹟攝影比賽
● 去年臺灣有辦地區初賽
● 要「結構化」的古蹟清單
資料要求格式-古蹟結構化清單 ● unique id - 能識別古蹟的 unique id (必須 )
● 名稱 – 古蹟的名稱(高度建議)
● 描述 - 古蹟的描述 (選擇 )
● 種類 - 古蹟種類 (選擇 )
● 地址 - 古蹟的地址 (建議 )
● 行政區 - 古蹟所在的行政區 (建議 )
● 經緯度 - 經緯度 (強烈建議 )
● 圖片 - 古蹟的圖片 (必須 )
要資料的過程
● 去電文化資產局表明需要古蹟、歷史建築清單
● 承辦人表示上網站 詢即可查
– 文化資產 詢查
– http://www.boch.gov.tw/boch/frontsite/cultureassets/CultureAssetsAction.do?method=doEnterTotal&menuId=310&siteId=101
要資料的困難(溝通)
● 承辦人不懂需要的格式
● 網頁介面 詢得不到要的資料查
– Caseid
– 經緯度
● 要上班,沒那麼多時間與公家機關打交道
● 決定以遊擊隊的方式進行,嘗試爬資料
詢介面查
● 古蹟 caseid
● 古蹟經緯度
數位典藏計畫
● 共十年的長期計畫
● 將典藏單位的文物數位化
● 期待加 運用值
● 很多鎖在資料庫裡
● 開放資料 - 科技部不要跑
故宮合作社 - 產品目錄
故宮合作社
● 釋出沒什麼用的後設資料
● 還沒有一張展品數位化影像釋出
● 販賣獨佔的數位化資料
● 文資法保障的獨門生意
● Copy fraud
● 不是開放資料
Copyfraud
● 法律學者 Jason Mazzone 提出
● 定議:將原應屬於公有領域的內容,視為有著作權,過渡衍生其權利
● 例子:複製谿山行旅圖圖片沒侵犯范 權利,而是故宮寬
● 例子:不能自行去故宮拍攝展品,而是要買故宮的商品
https://en.wikipedia.org/wiki/File:EVIL_PUBLISHERS_-_Flickr_-_Pierre-Selim.jpg
by Pierre-Selim by Pierre-Selim
政府應放出更多資料
● 促進新形態產業發展
● 幫助不同興趣團體
結論● 資料的開放性需要不斷努力
● 也許群 編輯的方式能補充開放政府資料的不眾
足
http://data.gov.tw/node/7964
謝謝大家
● 臉書社團: OpenStreetMap 台灣
● 臉書社團:臺灣維基社群 Taiwan Wikipedia
Community