03. 討論事項(二) 國際評比強化作法簡報

24
以以以以以以以Open Data Index 以以 以以以以以以以以以以以以以以以以 以以以以以以以以以以 104 以 6 以 1 以 1

Transcript of 03. 討論事項(二) 國際評比強化作法簡報

以開放資料指標( Open Data Index )為例

台灣開放資料評比排名提升對策分析

行政院科技會報辦公室104 年 6 月 1 日

1

何謂開放資料指標 (Open Data Index) ?

2

何謂開放資料指標( Open Data Index )?

指標簡介:英國開放資料推動組織『開放知識基金會( Open Knowledge Foundation)』研擬之政府開放資料評鑑指標,目的在於檢核世界各國重要開放資料集 (Dataset)之開放程度,包括資料集是否已開放 (Accessibility)?資料集是否易於使用 (Availability)?此評估指標並非官方報告,而是從公民角度以集體智慧 (Crowdsourcing)方式進行開放資料程度的獨立評估

評比公布: 2015年 1月發布第二次評估結果, 2015年底預計發布第三次評估結果

評比方式:分為兩階段,首先由關注開放資料的社群 (稱為 volunteer contributor,任何人均可,無資格限制 )提出評比分數 (Submission,結果不公開 ),再由 OKF認可的專家 (Expert Reviewer)進行第二階段的評比結果審核,並正式公告評估結果

涵蓋國家:包含歐、美、亞洲、拉丁美洲,全球超過 97個國家 (或區域 )

說明:顏色偏綠分數越高,顏色偏紅則分數越低

3

受評鑑之十大重要資料集項目資料集 (Dataset) 評鑑項目

參考 G8 Open Data Charter公布的關鍵資料集類別,進行評核1. 交通時刻表 (Transport timetables):大眾運輸交通時刻表資料 (特別指國家層級、寡佔的交通服務 , ex:高鐵、台鐵 )

2. 政府預算 (Government budget):政府部門年度規劃之預算資料3. 政府支出 (Government spending):政府部門實際之支出交易記錄,例如人事費中的薪酬成本,業務費中的勞務與產品採購內容,且金額超過 10萬美元即須公開

4. 選舉結果 (Election results):中央或地方選舉結果5. 公司登記 (Company register):包括公司行號、統一編號、住址等資料(並不需要詳細的財務數據、資產負債表)

6. 地理圖資 (National map):尺度在 1:250,000 (即 1cm = 2.5km)以上的高階地圖。

7. 國家統計數據 (National statistics): GDP、失業率以及人口數量等關鍵的人口普查與經濟統計數據,如每季 GDP或年度人口統計的匯總資料(Aggregate data)均可被採納

8. 法律規範 (Legislation):國家的法律和法規9. 郵遞區號 (Postcodes/Zipcodes):郵遞區號或可對應經緯度位置的國家座標資料庫10.污染散播 (Emissions of pollutants):對人體有直接或潛在危害的空氣污染物,其排放總量資料 (包含溫室氣體、一氧化碳、氮氧化物、懸浮微粒 )

4

OKFN 建議以國家級 data.gov 網站為優先評鑑

OKFN的教戰手冊中,指導 submitter如何尋找資料集。依其方法,可佐證若將資料集放在國家級的 data.gov.xxx 平台,則資料集最優先被找到,評比分數自然就高。

5

開放資料指標評鑑示意圖(以交通時刻表為例)

「資料存在 (exist) 」:政府部門確實有此因業務而產生的資料集【權重5 】「資料為數位化格式(digital) 」:資料集以數位化儲存方式 ( 網路或實體硬碟中 ) 【權重 5 】

「資料為免費可用 (free) 」:不需收取費用 ) 【權重 15 】

「資料可以整包 (in bulk) 下載」:在滿足資料容易存取的目的下,同一種類資料集可一次在網站上整包直接下載,無須分批下載原始檔案,亦不需再經過資料庫查詢篩選【權重 10 】「資料即時更新(update) 」:依據不同資料集屬性有不同更新頻率,若即時交通時刻就需頻繁更新【權重 10 】

「資料可以公開 (Publicly)取得」:資料可以直接在data.gov.tw 單一入口網站(portal)或官方網站公開下載,不需特別註冊登入【權重 5 】「資料為機器可讀(machine readable) 」:必須符合以下格式: XLS、CSV、 JSON、 XML 才可視為機器可讀【權重 15 】「資料為開放授權 (openly licensed) 」:採用政府資料開放平台使用規範,符合開放資料精神【權重 30 】

「資料可線上 (online) 取得」:資料可以在網路上( 透過Website, URL) 下載(或許需要註冊 ) 【權重5 】

6

2014 年開放資料指標評比結果

7

2014 年評比排名結果分析

標竿國家排名

交通時刻表

政府預算

政府支出

選舉結果

公司登記

國家統計數據

地理圖資

法律規範

郵遞區號

污染擴散

總分

1. 英國 100 90 100 100 100 90 100 100 100 90 970

2. 丹麥 60 100 40 100 85 90 100 60 100 90 830

3. 法國 70 100 10 100 50 100 100 70 100 100 800

4. 芬蘭 100 90 10 100 55 100 100 70 45 60 730

5. 澳洲 45 100 10 100 70 100 100 45 90 60 720

5. 紐西蘭

45 100 10 100 60 100 100 100 45 60 720

7. 挪威 90 70 10 100 100 100 100 30 10 100 710

8. 美國 45 100 10 70 15 100 100 100 90 70 700

9. 德國 25 100 10 100 30 100 100 100 25 100 690

10. 印度 45 100 10 70 100 100 40 100 10 100 680

11. 台灣 100 70 10 45 90 50 70 75 70 90 670

19. 日本 45 70 10 70 30 70 70 75 100 70 610

28. 南韓 90 70 10 45 60 60 40 55 10 90 530

前十名概況:英國、丹麥、法國位居前三名,美國第 8,印度異軍突起由第 27 躍居第 10。 資料集評比:『政府支出』資料集為各國開放罩門,僅英國獲得滿分,其餘資料集得分有高有

低,各國家均有改善空間 (如挪威之郵遞區號僅得 10分、美國之公司登記為 15分 ) 台灣排名為第 11 名,與美國、德國、印度相距不遠,有相當機會迎頭趕上

8

英國連續兩年評比居全球之冠,值得學習

英國已連續兩年 (2013 & 2014年 ) 取得開放資料指標評鑑冠軍, 10大關鍵開放資料集 (Dataset)開放程度 (Availability)總分平均高達 97分

因英國大力推動開放資料授權 (Open Government License for public sector information)與開放資料平台建置 (data.gov.uk),故其 10大關鍵開放資料集均符合:可公開取得、免費使用、機器可讀、特定網站下載、與開放授權等衡量標準,僅少數資料集因無法批次下載 ( 汙染排放、國家統計 )或是即時更新 (政府預算 )而未獲得滿分

9

印度將資料集上傳至 data.gov.in 平台

大幅提升排名

資料來源:http://index.okfn.org/place/india/

2014 年

2013 年 NO. 27

NO. 10

將國家統計、公司登記、法律規範、政府預算、環境汙染等資料集均

放置在 data.gov.in 網站大幅提升整體排名

10

影響台灣排名提升之關鍵資料集問題分析

11

台灣最具改進空間的前三項評估指標政府支出、選舉結果、國家統計數據

指標評比分數低落關鍵在於缺乏『整包批次下載』與『開放資料授權』;亦有『資料是否免費』、『資料可否線上下載』、『資料即時更新』與『機器可讀』等問題

資料是否存在

是否為數位化格式

是否可公開取得

是否可免費使用

是否可線上取得

是否為機器可讀

是否可批次下載

是否為開放授權

是否即時更新

總分

交通時刻 O O O O O O O O O 100

政府預算 O O O O O O O X O 70

政府支出 O O X X X X X X X 10

選舉結果 O O O ? O O X X O 45

公司登記 O O O O O O X O O 90

地理圖資 O O O O O O O X O 70

國家統計數據 O O O O O O X X X 50

法律規範 O O O O O X X O O 75

郵遞區號 O O O O O O O ? O 70

汙染散播 O O O O O O X O O 90O 代表得分, X 代表失分,?代表不確定 12

台灣『政府支出』開放資料集須改善之問題主計總處公告資料非詳細交易資料影響評比結果

台灣政府 103 全年度支出(決算)提供彙整的整合資料,包含有:• 經常支出:人事費 (6 億 )、業務費 (2 億 )、獎補助費 (2 百萬 )

• 資本支出:設備及投資 (2.9 千萬 )

細項拆解

一級單位「歲出用途別決算分析表」

•OKFN認為主計處網站所提供資料是已彙整的整合資料(Aggregated data ),而非詳細的交易 (transactional spending data) 原始資料 (raw data)。•故此資料集僅符合

「資料存在」與「資料已數位化」兩項評估指標,其餘評估指標得分均為 0。

比較

非詳細之單筆交易支出資料,即非 raw data

不符合開放資料要求

評比結果分析

行政院主計總處「統計專區」首頁 ->中央政府總決算 -> 歲出機關決算總表 .xls

13

英國『政府支出』開放資料集內容 『政府支出』資料集內容為各部門每筆「原始交易支出明細」,而非

「彙整」後的整合資料

政府部門名稱 交易時間 交易費用明細 交易費用種類

供應商 交易編號 交易金額 交易備註說明

14

『政府支出』資料集改善借鏡案例英國強調開放透明,「政府支出」徹底公開

• 符合 Open Data Index 定義:細節包含各組織名稱、單位支出金額、公共支出統計分析類別名稱與編碼( PESA) (包含折舊、薪資成本、採購勞務與商品、資產購入等內容 )

• 政策明訂開放:中央政府規定需定期公布滿 2萬 5 千元的交易名單,甚至有些部門還規定需公布 500英鎊以內的

• 資料開放授權:財政部 (HM Treasury)的「 COIN/OSCAR 」資料庫 (Online System for Central Accounting and Reporting)採用UK Open Government License,該資料庫資料集滿足免費、線上取得、機器可讀、批次下載、即時更新與開放授權等多重衡量條件

評比得分關鍵分析

15

台灣『選舉結果』開放資料集須改善之問題

需改善之關鍵議題1. 資料無法批次下載2. 資料未開放授權3. 不確定資料是否可免費取得?

現況

評比

http://db.cec.gov.tw/ 1. 無法批次下載:資料需要逐層點選,才能知道詳細得票明細,或檔案提供「 Zip 壓縮檔」

2. 未開放授權:版權限制,網頁註明「中央選舉委員會 版權所有」

3. 不確定資料是否免費可得:網站中沒有資料使用規範,不確定是否免費

評比結果分析

16

英國『選舉結果』開放資料集推動做法

• 開放資料內容:含括英國中央、地方政府以及歐盟議會選舉結果

• 開放資料使用:可批次下載、提供CSV/Excel 檔案格式

• 資料開放授權: 2013年 10月,英國選委會 (Electoral Commission)於其官方網站公布網站使用條款,宣稱所屬資料集均適用 Open Government License,可免費下載、再利用 17

台灣『國家統計數據』開放資料集須改善之問題

http://www.dgbas.gov.tw 1. 無法批次下載:資料需要逐層點選(如另開視窗到「內政部統計月報」)

2. 未開放授權:網頁註明「行政院主計總處版權所有 CopyRight 」

3. 未及時更新:資料張貼時間為 2006/2/21

無法在單一平台,整批下載

評比結果分析

以全國統計資料 -> 「人口」 -> 人口靜態統計為例,需逐層點選、另開網頁到「內政部統計月報」方可下載!平台一:主計總處官網

平台二:內政部統計月報

1

3

平台三:政府資料開放平台

2 資料所有權橫跨其他業務單位( e.g. 內政部),同時涉及戶籍法的規費限制,現階段暫時無法開放授權 18

英國『國家統計數據』開放資料集推動做法 主管機關:國家統計局 (Office of

National Statistics) 資料屬性:國家層級之經濟與人口資料 (如:人口普查、GDP、失業率… )

資料授權:所有資料均適用開放資料授權 (Open Government License for public sector information)

開放資料集滿足以下要求 可公開取得 免費使用 機器可讀 ( 主要為 excel, 亦

有 CSV & XML格式檔案 ) 特定網站下載

19

台灣開放資料集其他問題資料集授權條件不一致:郵遞區號

下載途徑一:原業務單位所屬網頁 下載途徑二:政府資料開放平台

資料集授權條件不一致: OKFN不易評鑑,民眾也無所適從

授權條款不一致

沒有開放授權:網頁標示-「中華郵政版權所有」

有開放授權:但非機器可讀取格式 (txt)

20

開放資料集改善狀況與台灣排名提升建議

21

十大開放資料集之開放程度改善現況 除了『交通時刻表』外,『選舉結果』、『公司登記』與『汙染散播』均已完全改進,得分滿分。 總得分由 2014年的 670分,增加為 745分,假設其他國家分數不變的話,將躍升為第 4 名

資料是否存在

是否為數位化格式

是否可公開取得

是否可免費使用

是否可線上取得

是否為機器可讀

是否可批次下載

是否為開放授權

是否即時更新

總分

交通時刻 O O O O O O O O O 100

政府預算 O O O O O O O ? O 70

政府支出 O O X X X X X X X 10

選舉結果 O O O O O O 100

公司登記 O O O O O O O O 100

地理圖資 O O O O O O O X O 70

國家統計數據 O O O O O O X ? X 50

法律規範 O O O O O X X O O 75

郵遞區號 O O O O O O O ? O 70

汙染散播 O O O O O O O O 100O 代表得分、 X 代表失分、?代表不確定、 代表已改進

OK OK OK

OK

OK

22OK 備註:上述評比來源為各部會之官方網站

台灣排名提升改善建議 短期:

建議 10大關鍵資料集之主政單位均應將其開放資料集於 data.gov.tw 平台同步完整開放

開放資料集於主政單位官網與 data.gov.tw 平台之開放條件應相同 (如郵遞區號資料集之授權條件問題 )

長期:建議中央所屬部會均應落實開放資料政策之推動由上而下推動開放資料政策,強化公務員之政府資料開放意識與文化

全面盤點部會所屬資料集,提升開放資料集之品質與可用性

鼓勵各部會開立資料相關 (data-related) 教育課程 (如open data policy, big data analysis、 data privacy risk…),以提升公務員對於資料的了解與運用能力 23

提請討論

24