Tutkimuksen sähköinen vallankumous Juha Haataja · Suomessa on selkeä tietopolitiikka, jota...

Post on 05-Jul-2020

0 views 0 download

Transcript of Tutkimuksen sähköinen vallankumous Juha Haataja · Suomessa on selkeä tietopolitiikka, jota...

TTA-hankkeen esittely

Pirjo-Leena Forsström

TTA-hankkeen pääsihteeri

Tutkimuksen tietoaineistot TTA

Opetus- ja kulttuuriministeriön TTA-hanke edistää tietoaineistojen

kuvausten yhtenäistämistä, säilytystä ja käyttöä

Hankkeessa tuotetaan tätä tukemaan:

• tutkimuksen tietoaineistojen prosessikartta

• tietoinfrastruktuurin palvelukokonaisuuden suunnittelu

• metatietomalli tutkimustiedon hallinnalle

• yhteinen metatietokatalogi/hakupalvelu tutkimusaineistoille

• tallennuspalvelu tutkimuksen tietoaineistoille

• yhteisen pitkäaikaissäilytysratkaisun valmistelu

TTA-palvelukokonaisuus edistää tutkimuksen tietoaineistojen

kansallista, eurooppalaista ja kansainvälistä yhteentoimivuutta.

Toimenpiteitä tietoaineistojen hyödyntämisen parantamiseksi

TTA-VISIO Suomessa on selkeä tietopolitiikka, jota yhteiset sähköiset palvelut tukevat.

Julkisen sektorin hallinnoimat tietoaineistot sekä julkisen tutkimusrahoituksen tuella syntyneet tietoaineistot ovat lainsäädännön ja yhtenäisten käyttöehtojen ohjaamina pääsääntöisesti maksutta yhteiskunnan hyödynnettävissä.

Pitkäjänteinen tietoinfrastruktuurin kehittämisen ja ylläpidon rahoitusjärjestelmä takaa, että olemassa olevat ja uudet tietoaineistot kuvaillaan ja ne ovat helposti löydettävissä ja otettavissa käyttöön tietoverkossa olevien palveluiden avulla.

Kannustava ja oikeudenmukainen meriittijärjestelmä varmistaa uusien, laadukkaiden tietoaineistojen liittämisen tietoinfrastruktuuriin.

TTA-hankkeen hyödyt

Keskitettyä tietoa tutkimuksen tietoaineistoista: helpompi löytää, helpompi käyttää

Yhtenäisempiä käytäntöjä aineistojen hallintaan

Yhteentoimivuuden lisääntyminen: metatietomalli, rajapinnat

Monipuolisen palvelukokonaisuuden kehitys

Tietoaineistojen säilymisen turvaaminen

Säilyminen ja löytyminen epävarmaa

Säilymistodennäköisyys kasvaa, löydettävyys kasvaa

Paikallinen

Jaettu

TTA palvelu-arkki-

tehtuuri

TTA-palvelut

TTA-KATA - metadatakatalogi TTA-AVAA – avointen aineistojen

julkaisualusta TTA-IDA – tutkimusaineistojen

tallennuspalvelu www.tdata.fi –datanhallinnan opas TTA User forum – käyttäjäyhteisö Metatietomalli PAS

TTA-palvelut 2013

Perustuvat avoimen lähdekoodin ratkaisuihin

IDA – tallennuspalvelu (käytössä) (iRoDS)

KATA –metadatakatalogi (pilotissa) (CKAN)

AVAA –avoimen datan julkaisualusta (käytössä) (Liferay)

PAS – Pitkäaikaissäilytys (2015), pilotit alkavat 2014 (useita OS komponetteja)

KATA-metadatakatalogi

KATA-projektin tavoitteet

Rakentaa palvelu, joka: helpottaa tutkimuskäyttöön saatavilla olevien aineistojen

löytämistä, hyödyntämistä ja uudelleenkäyttöä luo yhtenäistä käyttöehto- ja käyttöoikeuskulttuuria:

omistajuus ja hyödyntämisoikeustiedot kytkettynä aineistoon

synnyttää meriitin tutkijalle ja antaa tietoa rahoittajatahoille

palvelu, jonne omat tutkimusdatat voi tuoda näkyville ohjaa metadatan syöttössä ja tukee muiden datojen

kanssa yhtenäisestä kuvailua pitkäaikaissäilytykseen

KATA-metadatakatalogi

tutkija voi tuoda oman tutkimusaineistonsa muiden tutkijoiden tietoisuuteen KATAn avulla

katalogiin ei tallenneta itse aineistoa, vaan sen metatiedot, joiden perusteella muut tutkijat voivat löytää aineiston ja saavat tiedon siitä, miten he voivat saada aineiston käyttöönsä

helpottaa metatiedon syöttöä ja muiden datojen kanssa yhtenäistä kuvailua; aineisto kuvaillaan vähintään TTA:n minimimetatietomallin mukaisesti

laadukkaan kuvailukulttuurin edistäminen erityisesti minimimetatietomallin avulla

monipuoliset hakuominaisuudet, joilla voi hakea keskitetysti useiden kohteiden dataa

metadatan massatuontimahdollisuus

KATA

katalogi nyt valmiina testattavaksi ennen varsinaista käyttöönottoa

kiinnostusta toimia testaajana?

AVAA – avointen aineistojen julkaisualusta

AVAA-projekti

Tavoitteena on tarjota web-pohjaisia välineitä eri tieteenalojen tutkimusdatan avoimen saatavuuden edistämiseen

yleiskäyttöisten välineiden rakentaminen on haasteellista mm. tieteenalojen aineistojen erilaisuus ja erilaiset tarpeet, esim. arkeologien kuva-aineistot vs. kielitieteilijöiden tekstikorpukset vs. numeerinen hiukkasfysiikan data

valittiin linja, jossa edetään yksittäistapausten kautta ja pyritään tunnistamaan mahdollisimman yleistettävissä olevia esimerkkejä sekä kehittämään apuvälineitä näiden tukemiseen

aloitettiin kolmen eri tieteenalan avoimen datan pilottisovellusten kehityksellä

pilottien tarkoitus on tarjota kokemusta

Opetussovellus Cernin CMS-kokeen avoimen hiukkasfysiikan aineiston hyödyntämiseksi lukio-opetuksessa valmistuu 2014 (ks. Cernin artikkeli) ◦Julkaistavan alkuperäisen formaatin lisäksi aineisto muunnetaan yksinkertaisempaan, avoimeen, koneluettavaan formaattiin ohjelmallista hyödyntämistä varten (tällä hetkellä JSON)

Ilmakehätieteiden SMEAR-ryhmän mittausdatan visualisointi, JSON-rajapintajakelu ja avoin lataus CSV-taulukkoina sekä HDF5-muodossa

Paikkatietoaineistojen rajapintajakelu, testitapauksena OpenStreetMap WMS -palvelu ETRS-TM35FIN-koordinaatistossa

Vuoden 2014 aikana WMS- ja WFS-rajapintapalvelut Kotimaisten kielten keskuksen murrekartta-aineistojen jakeluun

AVAA-pilotti SmartSMEAR on Helsingin yliopiston SMEAR-tutkimusasemien (Station for Measuring Ecosystem-Atmosphere

Relations) tietokannassa olevan mittaustiedon visualisointi- ja lataustyökalu.

CMS-pilottia käsitteleviä artikkeleja on julkaistu useassa arvostetussa aikakauslehdessä ja Cernin etusivulla: International Science Grid This Week (27.11.2013): LHC

data to be made public via open-access initiative

Nature - International Weekly Journal of Science (26.11.2013): LHC plans for open data future

Cern web home site (15.11.2013): LHC data to be made public via open access initiative

AVAA beta –pilottiportaali on 2.12. alkaen avoinna verkossa osoitteessa avaa.tdata.fi

Kysyttävää? avaa@csc.fi

IDA-tallennuspalvelu CSC – Tieteen tietotekniikan keskus Oy

IDA tallennuspalvelu

Yhteinen tallennuspalvelu tutkimuksen digitaalisten tietoaineistojen säilyttämiseksi ja uudelleenkäytön lisäämiseksi

Tietoaineistojen ja metatiedon turvallinen säilytys

Datan säilyminen eheänä ja muuttumattomana turvataan kopioiden ja niiden eheyden hallinnalla

IDA-palvelussa tarjotaan 2017 loppuun saakka noin 3

petatavun (PT) tallennuskapasiteetin käyttöoikeuksia:

Korkeakouluille varattu yhteensä 1 PT

Suomen Akatemian projektit yhteensä 1 PT

Erityishankkeet,1 PT

IDA tallennuspalvelun käyttäjäksi

Yliopistoilla käyttöoikeusosuudet, päättävät itse miten oikeus jaetaan.

Yliopistojen nimeämät IDA-yhteyshenkilöt linkkeinä yliopistojen ja CSC:n välillä. Lista yhteyshenkilöistä www.csc.fi/sivut/ida/esittely -sivulla

Käyttölupalomake samalta www.csc.fi/sivut/ida/esittely -sivuilta, toimitetaan yhteyshenkilön allekirjoituksella varustettuna CSC:lle.

TTA datanhallinnan opas ja käyttäjäfoorumi

Datanhallinnan opas http://www.tdata.fi

• Datanhallinnan suunnittelu

• Datan säilyttäminen

• Datan jakaminen ja julkaiseminen

• Datan hakeminen ja uudelleenkäyttö

• Datan käsittely ja prosessointi CSC:llä

• Tutkimusprosessi ja data

Paljon ohjeita, esimerkkejä ja valistusta tutkimusdatan hallintaan ja valmisteluun (kuvailu, lisenssit, formaatit)

Avoin keskustelufoorumi TTA-palvelujen käyttäjille

Tuetaan käyttäjiä TTA-palvelujen käyttöönotossa

Luodaan käyttäjien välille yhteys

Kerätään palautetta palveluista

Jaetaan tietoa

Kartoitetaan kehittämistarpeita

Uusien käyttäjien saaminen

Sähköinen ympäristö tiiviisti muiden TTA-palveluiden yhteydessä, avataan vuoden 2014 alussa

User forum -tilaisuuksia keväällä 2014. Ensimmäinen IDA-yhteyshenkilötapaamisen yhteydessä

Kiitokset ja yhteystiedot

KATA-projektitiimi Pinja Koskinen, projektipäällikkö Mikko Koho Juho Lehtonen Mikael Karlsson AVAA-projektitiimi Tanja Kantola, projektipäällikkö Pekka Järveläinen, projektipäällikkö IDA Jorma Paananen www.tdata.fi Irina Kupiainen TTA User Forum Johanna Blomqvist