NCDR出國報告書 Belmont Forum 郭士筠劉子明1017 (002) · (Working Group 、Interest...

27
i NCDR-106-02-B-013 經費來源:□01 公務 ■02 非公務 機密(E): □是 ■否 出國類別: □ A 考察/訪問 ■ B 學術會議/研討會 C 進修/研究 □ D 工作會議 「研究數據聯盟第十次全體會議」暨「貝爾蒙特論壇數位 基礎設施與資料管理合作研究案監督委員會議」 Research Data Alliance the 10th Plenary Meeting & BF EIDM CRA Oversight Committee Meeting 出國報告書 單位名稱: 國家災害防救科技中心 氣候變遷組 出國人姓名職稱: 郭士筠 助理研究員 劉子明 專案助理研究員 出國地點: 加拿大蒙特婁 出國日期: 民國 106 年 9 月 17 日至 106 年 9 月 25 日 報告日期: 民國 106 年 10 月 30 日

Transcript of NCDR出國報告書 Belmont Forum 郭士筠劉子明1017 (002) · (Working Group 、Interest...

  • i

    NCDR-106-02-B-013

    經費來源:□01 公務 ■02 非公務

    機密(E): □是 ■否

    出國類別: □ A 考察/訪問 ■ B 學術會議/研討會

    □ C 進修/研究 □ D 工作會議

    「研究數據聯盟第十次全體會議」暨「貝爾蒙特論壇數位

    基礎設施與資料管理合作研究案監督委員會議」

    Research Data Alliance the 10th Plenary Meeting & BF EIDM CRA Oversight Committee Meeting

    出國報告書

    單位名稱: 國家災害防救科技中心 氣候變遷組

    出國人姓名職稱: 郭士筠 助理研究員

    劉子明 專案助理研究員

    出國地點: 加拿大蒙特婁

    出國日期: 民國 106 年 9 月 17 日至 106 年 9 月 25 日

    報告日期: 民國 106 年 10 月 30 日

  • ii

    摘 要

    研究數據聯盟(Research Data Alliance,簡稱 RDA)匯集來自各

    國的研究人員,希望可以群策群力達到資料公開共享的目標,本次會

    議為 RDA 第十次全體會議,於加拿大蒙特婁召開,會議主軸為「更

    好的數據、更好的決策(Better Data, Better Decision;BD2)。此外,

    貝爾蒙特論壇同時召開「貝爾蒙特論壇數位基礎設施與資料管理合作

    研究案監督委員會議(Belmont Forum EIDM CRA Oversight Committee

    Meeting)」,目的在追蹤四個行動議題小組(Action Theme)的進度,

    並討論 Belmont Forum 聖保羅大會提案事項、後續發展進度等。

    本中心郭士筠助理研究員及劉子明助理研究員隨同科技部自然

    司代表李明旭教授代表出席與會。本次參與此兩項會議,目的有三項:

    1) 與 RDA 會員廣泛交流,了解各研究群組(WG, IG, BoF)之推動

    進展與經驗,做為接下來四年期計畫規劃之參考;2) 以海報方式於

    RDA 大會發表計畫成果「Climate Change Research Data Service in

    Taiwan」;3) 參與監督委員會議,展現科技部對 e-IDM 的重視與投

    入,並確認 CRA 計畫徵求之規劃與進展。本報告詳述本次會議重點

    紀要與成果,以及兩位同仁的參與心得與對中心之建議,以及整體出

    國效益,以提供中心其他同仁參考。

  • iii

    目 次

    1. 目的…………………………….………….…………..……………..4

    2. 參與會議紀要 ………………………………………………………5

    3. 心得及建議……………..…..…………………… ………………...21

    4. 出國效益……………..……………………………………………..22

    附錄一:發表海報…………………………………………………… 23

    附錄二:會議照片…………………………………………………… 24

  • 4

    1. 目的 研究數據聯盟(Research Data Alliance,簡稱 RDA)於 2012 年 8

    月,在美國、歐盟及澳洲國家級科學單位的資助下,以「跨領域、跨

    國際之科學數據公開共享以解決社會面臨的問題」為宗旨而成立。以

    開放 (Openness)、共識(Consensus)、平衡(Balance)、和諧

    (Harmonization)、社群驅動(Community-driven)以及非營利 (Non-

    profit)為指導原則,透過不同議題的研究群組(Working Group, WG)、

    工作小組(Interest Group, IG)以及新興議題小組(Birds of a Feather

    Group, BoF),來自各國的研究人員可以群策群力達到資料公開共享

    的目標。RDA 會員之間透過每半年一次的全體會議(Plenary Meeting)

    分享推動及技術研發成果,本次會議為 RDA 第十次全體會議,於加

    拿大蒙特婁召開,會議主軸為「更好的數據、更好的決策(Better Data,

    Better Decision;BD2)。

    此外,貝爾蒙特論壇為全球近 20 個會員國家共同成立之國際組

    織,目的在資助能符合社會需求、提供關鍵知識與能力、回應環境變

    遷及永續發展議題的各項跨國協調合作研究行動(Collaborative

    Research Actions,簡稱 CRA),其中一項 CRA 為「數位基礎設施與

    資料管理(E-Infrastructure and Data Management)」,RDA 第十次全體

    會議結束後,隨即召開「貝爾蒙特論壇數位基礎設施與資料管理合作

    研究案監督委員會議(Belmont Forum EIDM CRA Oversight Committee

    Meeting)」,目的在討論本 CRA 於明年徵求計畫的規劃。

    因我國科技部擬參與此跨國研究計畫徵求,故派員參與本次兩項

    會議,目的有三項:1) 與 RDA 會員廣泛交流,了解各研究群組(WG,

    IG, BoF)之推動進展與經驗,做為接下來四年期計畫規劃之參考;2)

    以海報方式於 RDA 大會發表計畫成果「Climate Change Research Data

    Service in Taiwan」;3) 參與監督委員會議,展現科技部對 e-IDM 的

    重視與投入,並確認 CRA 計畫徵求之規劃與進展。

  • 5

    2. 參與會議紀要 2.1 會議議程

    本次會議歷時四天,前三天(9/19~9/21)為研究數據聯盟第十次

    全體會議(Research Data Alliance the 10th Plenary Meeting,簡稱 RDA),

    第四天(9/22)為貝爾蒙特論壇電子基礎設施與資料管理合作研究案

    監督委員會議(BF EIDM CRA Oversight Committee Meeting,簡稱 BF

    EIDM OC Meeting)。其中,RDA 會議除了每天的大會(Plenary

    Session),以及海報展覽(Poster Session)之外,更包含 8 場次分組會

    議(Break out Session),每一場次皆有不同議題的工作小組會議

    (Working Group、Interest Group、Birds of a Feather Group),RDA 會

    議議程如表 1,而 RDA 各分組會議之工作小組會議議題如表 2,BF

    EIDM OC Meeting 議程如表 3 所示。

    表 1、會議議程 19-Sep 20-Sep 21-Sep 22-Sep

    0730-08000800-08300830-09000900-0930 Welcome0930-10001000-10301030-1100 Coffee break & Poster session Coffee break & Poster session Break1100-1130 Coffee break & Poster session1130-12001200-1230 Discussion1230-13001300-13301330-1400

    1400-1430

    1430-1500

    1500-1530 Coffee break &| Poster session AT1 Update: Coordination

    1530-1600 Coffee break & Poster session Break

    1600-1630

    1630-1700

    1700-1730

    1730-1800

    1800-1830

    1830-1900

    1900-1930

    1930-2000

    2000~

    Next Step Discussion

    AT4 Update: HumanDemension/Capacity Building

    AT3 Update: e-Infrastructure

    Lunch

    AT2 Update: Data Policy

    Opening Plenary session

    Breakout 1 - WG/IG/BoFWorking Meetings

    Breakout 7 - WG/IG/BoFWorking Meetings

    Breakout 8 - WG/IG/BoFWorking Meetings

    Closing Plenary Session Lunch break & Poster session

    Breakout 2 - WG/IG/BoFWorking Meetings

    Breakout 3 - WG/IG/BoFWorking Meetings

    Social event

    Women in RDA - Breakfast

    Plenary Session: RDARecommendations & Adoption

    Breakout 4 - WG/IG/BoFWorking Meetings

    Lunch break & Poster session

    Breakout 5 - WG/IG/BoFWorking Meetings

    Breakout 6 - WG/IG/BoFWorking Meetings

    Plenary Session

    Social dinner

    RDA for Newcomers

  • 6

    表 2、各分組會議之工作小組會議議題 Breakout 1 - WG/IG/BoF Working

    Meetings Breakout 2 - WG/IG/BoF Working

    Meetings • BoF EarthCube International Partnerships• BoF for Research Funders on the Topic of Open Research and Data Management • BoF Systems, Technologies and Data Flows of the Research Data • WG Array Databases Assessment • WG Data Description Registry Interoperability (DDRI) • WG Data Type Registries & #2 • WG QoS-DataLC Definitions • IG Chemistry Research Data • IG Data Discovery Paradigms • IG Data policy standardisation and implementation

    • BoF Engaging early career researchers and professionals • BoF An Open Research Data Survey • BoF Identifying common services across the Digital Humanities sector and the underlying standards • WG Empirical Humanities • IG International Indigenous Data Sovereignty • IG Mapping the Landscape • IG Software Source Code • Joint meeting: IG Chemistry Research Data, IG Biodiversity Data Integration, IG Domain Repositories • Joint meeting: IG Metadata, WG Metadata Standards Catalog, IG Data in Context, IG Research Data Provenance

    Breakout 3 - WG/IG/BoF Working Meetings

    Breakout 4 - WG/IG/BoF Working Meetings

    • WG Agrisemantics • WG Provenance Patterns • WG RDA / TDWG Metadata Standards for attribution of physical and digital collections stewardship • IG Archives and Records Professionals for Research Data • IG Data Fabric • IG Data for Development • IG Geospatial • IG Linguistics Data • IG PID • Joint meeting: WG BioSharing Registry: connecting data policies, standards & databases in life sciences, IG ELIXIR Bridging Force

    • BoF Adopting RDA Products: A Roundtable • BoF Data Citation Metadata Elements • BoF Test Bed • WG Research Data Repository Interoperability • IG Libraries for Research Data • IG RDA/NISO Privacy Implications of Research Data Sets • IG RDA/WDS Publishing Data Cost Recovery for Data Centres • IG Virtual Research Environment (VRE-IG) • IG Vocabulary Services

  • 7

    表 2、各分組會議之工作小組會議議題(續)

    Breakout 5 - WG/IG/BoF Working Meetings

    Breakout 6 - WG/IG/BoF Working Meetings

    • BoF Data Management Records and Persistent identifiers • BoF OECD-GSF/WDS: International Coordination of Data Infrastructures for Open Science • BoF Make Data Count • WG Research Data Collections • IG Federated Identity Management • IG RDA/CODATA Legal Interoperability: Beyond Creative Commons Licenses: what are the legal barriers to data sharing? • IG From Observational Data to Information • IG Weather, climate and air quality • Joint meeting: IG Active Data Management Plans, IG Domain Repositories • Joint meeting: IG Global Water Information (GWIIG) , IG DFT, IG Biodiversity Data Integration

    • BoF Research Data Management (RDM) vocabularies • BoF The Digital Representation of Scientific Units of Measure • WG Brokering Framework • WG Data Citation • WG RDA/WDS Scholarly Link Exchange (Scholix) • WG RDA/CODATA Summer Schools in Data Science and Cloud Computing in the Developing World • IG Agricultural Data (IGAD) • IG Data Rescue • IG Long tail of research data

    Breakout 7 - WG/IG/BoF Working Meetings

    Breakout 8 - WG/IG/BoF Working Meetings

    • WG PID Kernel Information • IG Data Foundations and Terminology • IG Digital Practices in History and Ethnography • IG Health Data • IG Marine Data Harmonization • IG Physical Samples and Collections in the Research Data Ecosystem • IG Preservation Tools, Techniques, and Policies • IG RDA/WDS Certification of Digital Repositories • IG Small Unmanned Aircraft Systems (sUAS) Data • Joint meeting: IG RDA/CODATA Materials Data, Infrastructure & Interoperability, WG International Materials Resource Registries

    • BoF Health Data and Blockchain • BoF Persistent Identification of Instruments • WG Data Versioning • WG WDS/RDA Assessment of Data Fitness for Use • IG Disciplinary Interoperability Framework • IG Education and Training on handling of research data • IG Ethics and Social Aspects of Data • IG Repository Platforms for Research Data • IG Global Water Information • IG National Data Services • IG Repository Platforms for Research Data

  • 8

    表 3、BF EIDM OC Meeting 議程 8:45 am Convene (with Coffee/Tea)9:00 am Welcome, introductions, and  key outcomes‐input desired (Bob Samors) 9:15 am e‐I&DM leadership transitions (Maria Uhle)9:30 am AT4: Human Dimensions/Capacity Building Update (Rowena Davis/Bob Samors)   Activities and accomplishments since last Oversight Committee meeting 

    Curricula recommendations (in context of larger Belmont transdisc training)  Continuity of effort/broadening engagement among Belmont Forum members 

    10:30 am Break10:50 am AT3: e‐Infrastructures Update (Jean‐Pierre Vilotte, Ming‐Hsu Li)  Personnel changes since last Oversight Committee Meeting 

    Development of    HYPERLINK "https://drive.google.com/open?id=0B5KhNWEt1MuFLTJJUEMxemVQNVU" Science‐driven e‐Infrastructure Innovation (SEI) for the Enhancement of Transnational and Interdisciplinary Data Use in Environmental Change Research Concept Note & Annex and goals of expected Collaborative Research Action (CRA)  Next steps 

    11:30 am Discussion of upcoming events/opportunities:  Belmont Forum Asia‐Oceania Info Day, October, 2017, Taipei (Ming‐Hsu 

    Li)  AOGS, Hawaii, June 2018 (Ming‐Hsu Li)  CODATA, Future Earth, GEO, RDA, WDS 

    12:15 pm Lunch1:30 pm AT2: Data Policy Update (Carrie Seltzer, Sarah Callaghan)  Activities and accomplishments since last Oversight Committee meeting 

    o Data Planningo Belmont Forum member survey/outreach on data policies o Security Advisory Groupo Publishing Workshop (Fiona Murphy)

    AT2 leadership transition and need for broader engagement by Belmont Forum members 

    o NERC ‐ Sarah Callaghan ‐ replaced Mark Thorley July 2017; funded through December 2017 o NSF ‐ Carrie Seltzer ‐ AAAS Fellow through Aug 2018 

    3:00 pm AT1: Coordination Update (Bob Samors, Tina Lee, Rowena Davis)  Preparations for Belmont Forum Plenary (November 2017) 

    Website/Knowledge Hub  Outreach activities and accomplishments since last OC Mtg  Future initiatives 

    3:45 pm Break4:00 pm Next Steps and e‐I&DM Recap  Preparations for Belmont Forum Plenary (November 2017) 

    Strategies/actions for broadening BF member participation in e‐I&DM  Possible locations of 2018 Oversight Committee meetings  Any Other Business? 

    5:00 pm Adjourn

  • 9

    2.2 RDA 會議重點摘錄

    1. 每天大會(Plenary Session)

    (1) 專題演講:Deep Learning for Data-Driven AI

    本次大會的參與者來自 30 個國家,總計超過 430 位,在第一天

    的開幕大會的專題演講中邀請到蒙特婁大學的 Yoshua Bengio 教授,

    演講主題「Deep Learning for Data-Driven AI」,提及不論是人工智慧

    (artificial intelligence)、機器學習 machine learning、或是深度學習

    (deep learning),皆需要巨量資料,因次資料也是「新石油(New Oil)」,

    意旨資料為新興能源,能更有效地幫助我們。但前提是必須了解哪些

    資料是可及性的?哪些資料是被需要的?我們又必須進行哪些處理

    程序才能獲得可用的資料?

    此外,電腦必須自我學習,也必須由自身經驗中獲取錯誤並成長,

    因次訓練資料有其必要性。問題不在於資料的格式需要統一,而是在

    於資料格式的一致性,也就是說同一來源的資料若能維持一致的格式,

    便能進行資料統整與一致性的工作(Data Harmonization)。

    Yoshua Bengio 教授亦說明目前 AI 遭遇到的倫理道德議題,包括

    有:Data Ownership、隱私權與資料共享的社會價值、第三方資料信

    託單位、有責任發展及使用 AI,以及就業率等考量。

    (2) 座談:Data Policy Trends and their Impact on RDA

    首先,針對重要的資料政策(Data Policy),與談人 Matthew Lucas

    提及加拿大 SSHRC 三項關鍵元素及條件,分別是 Institutional Strategy,

    Data Management Plan,Data Repository。與談人 Shelley Stall 提及 AGU

    的資料發表指引中,資料透明度的重要性,研究者在發表論文時必須

    要將資料上傳至資料儲存單位中。與談人 Simon Hodson 提及

    CODATA 注重公平正義的原則。

  • 10

    2. 海報展覽(Poster Session)

    本次會議共有 60 篇海報、分作兩輪的方式(一輪 30 篇)進行展

    示,海報內容涵蓋議題十分多元,完整列表請見表 4。我們於本次會

    議以「Climate Change Research Data Service in Taiwan」為題發表海報,

    此海報介紹 TCCIP 計畫之氣候資料服務,包含資料清單與服務範圍,

    並介紹 TCCIP 提供之氣候知識基礎。完整海報內容請見附錄一。

    表 4、RDA 海報列表 NO. Poster Title 1 The Art and Drudgery of Data Curation 2 A Guide for Reproducible Research 3 Social Media, Trust, and Open Data: RDA Fellowship Studies 4 EOSCpilot.eu - Supporting the development of the European Open

    Science Cloud (EOSC) 5 EUBra-BIGSEA: Europe - Brazil Collaboration of Big Data Scientific

    Research through Cloud-Centric Applications 6 Surveying discipline-specific data management practices 7 Developing a Data Management Guide for Researchers 8 R Data: An Intuitive Platform to Automate Research Workflow 9 Data are the essence of researcher’s life 10 PUMA: PUblication Metadata Analytics - first results 11 Qualifying the city for the Pedestrian - a cartographical subject and a

    current challenge to the public urban planning (São Paul 12 BlueBRIDGE - Competitive Call for data driven SMEs 13 Expanding the U.S. Federal Data Curation Community: Year 01 at the

    National Transportation Library 14 ImPACT (Infrastructure for Privacy-Assured CompuTations) 15 Endangered Data? Determining Data at Risk 16 mQoL Living Lab: Behavioural Data Gathering in Mobile Settings via

    Wearables and Smartphones for Better Quality of Life 17 Disseminating Open Source Software with Open Data: A Case Study

    from a Scientific Data Center 18 Data Quality Principles Applied to Agricultural Research 19 Roughness in Cities – Reduction of heat stress in urban structures by

    micro scale models 20 FAIR data management in collaborative projects using BEXIS 2 21 Identifiers for Scientific Protocols: A report on the state of the art 22 EVER-EST: creating a virtual research environment for the Earth Sciences 23 Advancing Rights Management Metadata Best Practices across Open

    and Closed Data Sharing Communities

  • 11

    24 The Community for Data Integration (CDI): connection and collaboration with the Research Data Alliance

    25 SWORD V3 Project 26 Data2Paper 27 A need for long-term observations: Strategizing Data Rescue of Physical

    Environmental/Climate Data

    表 4、RDA 海報列表(續) 28 Enabling Semantic Data Management in the Biodiversity Domain 29 Tracing Data - Data Citation Roadmap for Finland 30 How Open Data Entrepreneurs Advance Institutional Change 31 Ontology of data tasks based on GBIF data papers 32 Climate Change Research Data Service in Taiwan 33 Guerrilla Archivist, Decision Engineer or Truth Team? Next Generation

    Data Roles, Services and Education Challenges 34 Use of Critical Care at the End of Life: Protocol for a National

    Observational Study 35 Unearthing the goldmine of Local Authority data 36 The World Data System – Your partner in data collaboration 37 Pluridisciplinary aspects of Natural Language Processing (NLP), text

    mining and Geographical Information Science (GIS) 38 Catalog of Union Data Standards 39 Data Curation Network: A Cross-Institutional Staffing Model for Curating

    Research Data 40 Data Life Cycle in Practice: An experience report from GFBio 41 Rescuing Southern Ocean mooring data from the depths of filing

    cabinets 42 The Curating for Reproducibility (CURE) Consortium 43 Common data services supporting multiple research communities and

    individuals - EUDAT Data Services 44 INTERACT: FAIR Data from Cold Region Research Stations 45 GTN-P borehole data management towards global assessment of

    permafrost temperature change 46 Towards Indigenous Data Governance in the United States 47 PANGAEA - more than 20 years serving the earth science community

    with data archiving and publication 48 Research Data Preservation with Archivematica 49 Enabling FAIR Data 50 OpenAIRE-Connect: Introducing and Implementing the Concept of Open

    Science as a Service 51 Analyzing and Improving the Performance of Dynamic Message Sign 52 Big Data Curation & Education: Training Students to Crawl The Web For

    Neuroscience Data 53 Virtual Reality: Exploring Data in New Directions and Dimensions

  • 12

    54 Developing a Framework to Guide Public Health Functions when utilizing data from Online Health Communities

    55 EarthCube Council of Data Facilities Registry Prototype 56 Three-Dimensional Data at Origin: Mapping Methods to Publishing

    Infrastructure 57 Weaving Data Fabric for the Empirical Humanities: Flexible Metadata,

    Meshwork, and Other Challenges 58 NBDC – The central infrastructure for data repository and portal for

    open life science data in Japan 59 SuAVE: a New Tool for Exploratory Collaborative Analysis of Image

    Collections and Surveys 60 EarthCube Data Discovery Hub: Enhancing, Curating and Finding Data

    across Multiple Sources

    3. 分組會議(Breakout Session)

    (1) Breakout session 1 BoF Open Research and Data Management

    本分組會議是針對「開放研究與資料管理」的起始小組(Birds of

    a feather Group,簡稱 BoF),會議中提及「研究透明」、「利害關係人

    參與資料政策發展」、「資料儲存 Data Repository」等議題的重要性,

    會議中有以下幾項重點:

    除了一些工具及誘因的提供之外(資源、經費、專業、技術、設

    備等),更應該進行開放資料的「文化改變」,也就是還可以做什

    麼努力來改變整體氛圍,讓研究者願意開放資料。

    未來可能將「資料提供」與「學術誠信」以及「資料取得權限」

    掛勾,也就是說不提供資料將被視為學術欺騙,或是不提供資料

    亦將無法獲得資料。

    有一些國家已經開始施行資料政策,例如:加拿大 funding agency

    在一年半之內,開始要求研究者提出 Data Management Plan。

    目前有 funding agency 與 publisher 一起合作的可能性,兩者可能

    會一起要求研究者必須要有 DMP,也可能要求要研究者將資料

    儲存在第三方 data repository。

  • 13

    未來必須要有教育訓練,訓練新進研究人員。

    資料管理者必須與研究團隊密切合作。

    (2) Breakout session 2 IG Mapping the landscape

    本分組會議希望能以圖像的方式勾勒出全世界各國在開放資料

    方面的進展,會議中有許多案例報告,例如:OIL-E(Open Information

    Linking for Environmental Research Infrastructures)針對環境研究基礎

    設施在連結開放資訊的努力,並以心智圖的方式呈現。而 Earthcube

    則以故事地圖 Story Map 的方式將國際上的努力與進展呈現出來(圖

    1)。

    圖 1、OIL-E 與 Earthcube 的圖像

    (3) Breakout session 3 IG Agricultural Data

    本分組會議是農業資料的 Interest Group,與談者召開 On-Farm

    Data Sharing Meeting,讓農民分享資料,研究者也透過農民取得資料,

    但是也遭遇一些問題,例如:研究者與農民之間的關係為社交網絡或

    義務、農民希望取得公平且對等的回饋、資料用途是否限定在非營利

    與研究等等。更有提及評估指標(Agrisemantics),但對於農業資料與

    氣候資料之連結較少。

    (4) Breakout session 4 BoF Test Bed

    Test Bed 是經由 RDA 的成員大量參與測試和評估 RDA 的多元

  • 14

    使用或其他活動的產出。Test Bed 乃利用試驗環境去評估一個或多個

    RDA 輸出與實際相關的案例,因此可以做為系統的努力成果。他們

    可能已經跨越機構或學科,並可能對第三方用戶開放,儘管後面的這

    些並沒有被要求。此會議主要目的在了解目前各項 Test Bed 的進度、

    遭遇問題與後續方向。目前共有 7 個 Test Bed,這 7 個 Test Bed 可能

    是某個大型計畫或組織,為了簡單區分各 Test Bed 類型或是進度,而

    利用圖 2 所述之 3 個分類來區分,Stage 1 是只有使用一個 RDA 建議

    項目(或稱輸出);Stage 2 是使用多項輸出,永續性尚可;Stage 3 則是

    使用多項輸出,具有永續性且有後續管理。RDA 的建議產品

    (recommendations) 及 輸 出 可 見 https://www.rd-

    alliance.org/recommendations-and-outputs/all-recommendations-and-

    outputs。目前 7 個 Test Bed 名稱、使用的建議項目、以及進度可由圖

    3 得知。任何計畫產品所重視的都是後續的使用與回饋,而 RDA 利

    用 Test Bed 這個 BoF 來進行此工作,可以說是完善了 RDA 使用與回

    饋的機制。

    圖 2、Test Bed 的分類或進度區分

  • 15

    圖 3、Test Bed 名稱、使用的建議項目、以及進度

    (5) Breakout session 5 IG From Observational Data to Information

    此 IG 的目標是提高資料轉換成資訊之關係的共同理解,主要是

    針對環境研究基礎設施的觀測資料和關於資料環境的語義資訊。雖然

    “資料”與“資訊”這兩個字常被使用,但背後的意義卻很少被了解。通

    常“資料”被理解為以行和列組織的值,實際上有觀察資料,實驗資料,

    模擬資料;有特徵,趨勢,地理空間資料集;主要資料,次要資料,

    衍生資料,操作資料,元資料。此外,我們越來越多地從資料挖掘資

    訊和將資訊轉移到知識中。然而,挖掘的資訊是什麼,以及如何在研

    究基礎設施中表達和記錄資訊仍然是模糊的。而知識更複雜,需要澄

    清哪些資料,資訊和可能的知識,以及這些概念在研究基礎設施環境

    中的關聯性為何?因此才成立此 IG 來推動與釐清相關問題。

    (6) Breakout session BoF Research Data Management (RDM)

    vocabularies

    主要是為了訂定 RDM 通用詞彙表而召開此 BoF,目前已有許多

    計畫或單位正在訂定 RDM 詞彙表,因此需要藉由此 BoF 去了解目前

  • 16

    的差距、重複工作、潛在的協同效益和未決問題,並確定發展詞彙表

    的良好做法,以及合作、協作和將保握重複數據刪除的機會。

    目前可以參考的 RDM 詞彙案例有: IRiDiuM ‐ International Research Data Management glossary  RDA Data Fabric IG  CASRAI Research administration glossary  Science Europe Data Glossary  W3C Data Exchange WG (DXWG)  ISO 5127 Foundations and Vocabulary  Big Data at NIST    DDI ‐ Data Documentation Initiative COUNTER Code of Practice

    會議中幾點建議如下:

    1. 應製作索引庫存。

    2. 與不同詞彙的創作者交談,並嘗試了解他們要完成的內容。

    3. 有三個選項可以處理詞彙重複,以避免詞彙相近或重複。

    a. 創建一個抽象的標準,並嘗試合併或擬合相似的詞彙。但有

    丟失細節的風險。

    b. 離開詞彙,並在它們之間找到一個映射,並保留映射上的來

    源。

    c. 建立一個更高級別,但更複雜的詞彙,可以滿足相似的要求。

    4. 本體論可以參考 FAIR 原則

    (7) Breakout session 7 IG Health Data

    本分組會議是健康資料的 Interest Group,由會議中可以發現健康

    領域(包含醫學、生物醫學)對於研究資料開放的推動相對較具體,

    也有時程上的規劃。會議中首先探討了幾項使用者關切的議題,包括

    data access and protection , data-based healthcare for personalized

    medicine,data literacy,patient data, drug and clinical trials data,block

    chain application to health data 等。更探討了目前研究資源浪費的問題

  • 17

    (50-85%),資料開放與共享將有效解決資源重覆與浪費的問題,與

    談者報告可以以文獻方式評量研究效度。最後,更探討目前資料保護

    議題的重要性,並從法規的角度,回顧了美國及歐盟在健康資料保護

    上的規範,美國模式偏向 sectional self-regulatory approach,歐盟模式

    則偏向 comprehensive data protection laws。

    (8) Breakout session 8 IG Disciplinary Interoperability Framework

    目前 RDA 中已有約 20~25 個領域團體(disciplinary),但不同領

    域團體之間如何互動、交流、乃至於合作即是一大問題。因此,這個

    IG 的目標即在:(i) Identifying the commonalities between the disciplinary

    groups, (ii) harmonising technical and sociocultural requirements relevant

    to their research data needs, (iii) connecting groups, and (iv) performing

    outreach activities, were identified as the main items to be included in the

    mission of such a group。並以價值與可行度評估 10 項工作,右上角為

    容易達成且高價值的 Quick wins、右下角為雖然難達成但是高價值的

    Long runs、左上角為容易達成但卻較低價值(圖 4)。

    圖 4、十項工作評估

  • 18

    2.3 BF EIDM CRA OC 會議重點摘錄

    本次會議為半年一次的 BF EIDM 工作會議,會議中追蹤四個行

    動議題小組(Action Theme,簡稱 AT)的進度,並討論 Belmont Forum

    大會提案事項、後續發展進度、下次會議時間地點等等。以下提供四

    個行動議題小組,以其其他重要事項之會議摘錄。

    1. AT1: Coordination Office Update

    專注於三 C:Communication, Coordination, Collaboration,盡力協助各

    AT 之工作,以及與 BF 秘書處之聯繫協調工作。

    工作進度:

    聖保羅大會相關報告(進度與後續建議事項)之準備(in Sao

    Paulo, Brazil, November 2017)

    EIDM 新網站籌備,目標對象包含 public、researcher、funder

    2018 年優先工作事項:

    Release new e-IDM website

    Integrate all co-lead agencies into SCG

    Expand outreach to collaboration

    Work with GPC for regional outreach

    Begin to develop a BF-relevant Map of Landscape (funders, projects,

    policies, outcomes useful to both funders and researchers)

    2. AT2: Data Planning

    工作進度:

    收整 BF 各會員國、各機構的 data management plan,但在聯絡人

    方面遭遇困難

    範例:SPARC

    撰寫 Belmont CRA Data Management Plan (DMP)

    RDA/CODATA Legal Interoperability WG 發表了 6 個原則

  • 19

    完成 e-I&DM publishing workshop

    下一步:與出版商的可能合作

    3. AT3: e-Infrastructures Exemplars

    工作進度:

    完成 workshop,界定需求

    完成 SEI Concept Note 以及附錄案例 (3-4 yr funding track)

    下一步:接下來會由 GPC 接手 Call 的撰寫,並希望在聖保羅大會可以

    提出,並通過 Call,預計在 2018 年開始

    4. AT4: Human Dimensions/Capacity Building

    工作進度:

    完成 skills gap analysis, curricula workshop, curricula development

    and recommendations

    課程包含五大核心技能:programming, environmental data, visualization,

    data management, and interdisciplinary data exchange

    下一步:希望在聖保羅大會取得課程的 endorsement

    5. 聖保羅大會(11 月)事務

    修改 BF Plenary Final Report,並提出以下 Request

    To note the significant progress of the e-I&DM Project over the last year.

    To provide additional support for AT2 Data Planning from at least one

    other Belmont Forum member, beyond NERC and NSF.

    To approve a 3-4 year Collaborative Research Action (CRA) funding

    call designed to provide targeted support to initiatives that are well-

    positioned to solve one or more of the methodological, technological,

    and/or procedural challenges currently facing environmental science

  • 20

    researchers working with large, complex and multi-source data sets.

    To endorse the recommended Belmont Forum Curricula, and create

    mechanisms to share best practice, including convening a working group

    of Belmont Forum agencies on sharing of existing short courses—

    making attendance open to partners — with a pilot sharing scheme to

    be developed, and to develop new priority training activities, which may

    be in partnership with other organisations. The coordination of these

    actions will require a minimum additional 0.4 FTE to assist the Belmont

    Forum agencies.

    To support for Liaison for Data Management issues from each BF

    agency and to support for staff resources to continue e-I&DM

    collaboration with data publishers

    6. 其他事項

    Asia Pacific Information Day:會適當宣傳 Eidm

    AOGS 會提出一個 special session

    下次 OSM 會議時間地點:Asia-Oceania Geosciences (AOGS), Honolulu,

    Hawaii 3-8 June 2018

  • 21

    3. 心得與建議 3.1 心得

    本次參與會議,有以下幾點心得:

    1. 參與 RDA 的與會人員多是各個領域的資料科學家,對於開放資

    料,尤其是開放研究資料的議題討論很熱烈,但是,若要成功達

    到開放資料、開放研究、開放科學的願景,各個領域研究者的參

    與卻是必要的,這點可能是未來必須要考量的。

    2. 未來 Funding Agency 與出版商未來可能合作,這點對於研究者可

    能形成一個必須要開放資料的大環境氛圍,此外,更有與會者提

    出將開放資料與學術誠信掛鉤的意見,這兩點對於研究者可能會

    形成壓力,但是否會引起反彈,可能有待觀察,但是台灣的研究

    者可能必須要開始做好準備。

    3.2 建議

    本次參與會議,因為與下一階段氣候變遷科研計畫之執行方向有

    密切關聯,故針對台灣的開放資料發展與後續氣候變遷計畫提出以下

    幾點建議:

    1. 本次會議發現許多國家開始有計畫性的推動其開放資料、開放研

    究、資料管理計畫,例如,加拿大要在約一年之間落實資料管理計

    畫。而國際間也開始有 Funding Agency 與出版商共同合作要求研

    究者在申請或完成研究計畫、發表文章時不僅必須繳交資料管理

    計畫,甚至必須將資料繳交至第三方的資料儲存單位。面對此國際

    趨勢,建議科技部必須開始著手進行開放資料、開放研究、開放科

    學的總體規劃(Master Plan),其中可能包含評估台灣資料科學專

    業人才供給與需求,以及相關教育訓練。

    2. 而針對本中心氣候變遷計畫,因 TCCIP 已儲存有我國氣候歷史觀

    測資料,但是國際上趨勢,資料儲存單位可能必需要通過相關驗證

  • 22

    程序(Certify),故在下一階段中,建議必須完成相關驗證之程序。

    此外,接下來可能必須聘請資料科學專業人才,一方面建構台灣氣

    候資料數位基礎設施之架構,二方面必須加強資料科學與氣候領

    域、水文、災害領域專家之合作。

    4. 出國效益 本次我們奉派出席「研究數據聯盟第十次全體會議」暨「貝爾蒙

    特論壇數位基礎設施與資料管理合作研究案監督委員會議」,出國效

    益如下:

    了解 RDA 會員之間最新發展,以及國際間對於開放資料關切的

    議題,將這些國際趨勢帶回台灣。

    將台灣推動氣候變遷數位基礎建設之經驗分享給 BF Oversight

    Meeting,並展現我國科技部支持 Eidm 之決心。

    配合科技部順利推動大型國際學術交流活動。

  • 23

    附錄一、發表海報(Climate Change Research Data Service in Taiwan)

  • 24

    附錄二、會議照片

    1. RDA 會議照片

    開幕式:貴賓致詞

    開幕式:專題演講:Deep Learning for Data-Driven AI

    開幕 Plenary 的座談:Data Policy Trends and their Impact on RDA

  • 25

    開幕 Plenary 的座談(取自 RDA 網站)

    Breakout session 1 BoF Open Research and Data Management

    Breakout session 2 IG Mapping the landscape

  • 26

    Breakout session 3 IG Agricultural Data

    Breakout session 7 IG Health Data

    劉子明博士展示海報

  • 27

    2. EIDM Oversight Meeting 照片

    會議討論

    李老師報告 AP Information Day

    會議簡報