Digitaalisten aineistojen kansallinen kuvausjärjestelmä

30
10.11.2016 1 DIGITAALISTEN TIETOAINEISTOJEN kansallinen kuvausjärjestelmä THL, Tilastokeskus, Tietoarkisto, Sitra

Transcript of Digitaalisten aineistojen kansallinen kuvausjärjestelmä

Page 1: Digitaalisten aineistojen kansallinen kuvausjärjestelmä

10.11.2016 1

DIGITAALISTEN TIETOAINEISTOJENkansallinen kuvausjärjestelmä

THL, Tilastokeskus, Tietoarkisto, Sitra

Page 2: Digitaalisten aineistojen kansallinen kuvausjärjestelmä

10.11.2016 2

SITRAN ISAACUS-

ESITUOTANTOHANKKEITA 2016–2017

TIETOAINEISTOJEN KUVAUKSET JA METADATA

– Digitaalisten tietoaineistojen kansallinen kuvausjärjestelmä.

– THL, Tilastokeskus ja Tietoarkisto (CSC, HUS, VSSHP).

SÄHKÖINEN KÄYTTÖLUPAHAKEMUS- SEKÄINFORMAATIO- JA TUKIPALVELU

– Rekisteritutkimuksille ja eettisille lausunnoille.

– Kansallisarkisto.

ETÄKÄYTTÖJÄRJESTELMÄ

– Tilastokeskus ja THL.

TIETOALTAAT

– HUS, VSSHP, Istekki Oy.

BIOPANKIT

– BBMRI.fi.

Page 3: Digitaalisten aineistojen kansallinen kuvausjärjestelmä

Laki sosiaali- ja terveysalan

tutkimus- ja

kehittämiskeskuksen (Stakes)

tilastotoimesta

Muita muuttuvia lakeja:

Henkilötietolaki, Julkisuuslaki, Biopankkilaki, Tartuntatautilaki,

Laki sosiaalihuollon asiakkaan asemasta ja oikeuksista,

Laki kuolemansyyn selvittämisestä,

Laki sähköisestä lääkemääräyksestä

Laki terveydenhuollon

valtakunnallisista

henkilörekistereistä

Laki sosiaali- ja terveystietojen

tietoturvallisesta

hyödyntämisestä

Laki Terveyden ja hyvinvoinnin

laitoksesta annetun lain

muuttamisesta

Tietosuoja-asetusLaki sosiaali- ja terveydenhuollon

asiakastietojen sähköisestä

käsittelystä

Sosiaali- ja

terveydenhuollon

järjestämislaki

Kumottavat lait: Uudet/uudistetut lait:

Säädösympäristön muutoksia:

SOTE-TIETOJEN TOISSIJAISEN KÄYTÖN

LAKITYÖRYHMÄ 1.4.2015–31.12.2016

Kliinisiä lääketutkimuksia koskeva

asetus

EU:

Page 4: Digitaalisten aineistojen kansallinen kuvausjärjestelmä

10.11.2016 4

Page 5: Digitaalisten aineistojen kansallinen kuvausjärjestelmä

10.11.2016 5

METADATAHANKE

1.7.2016 – 15.12.2017

Aineistojen kuvailu ja kuvailutietojen julkaisu.

Yhtenäisten kuvaustapojen kehittäminen.

Rakennetaan kuvausvälineet, joita voidaan käyttää aineistojen keruuorganisaatioissa.

Roadmap: Metadata tietotuotannon elinkaarta tukemassa.

Page 6: Digitaalisten aineistojen kansallinen kuvausjärjestelmä

Tehdään olemassa olevien aineistojen löytäminen ja hyödyntämisen suunnittelu helpoksi tutkijoille ja kehittäjille kuvailutietojen ja hakutermien avulla.

15.11.2016

Page 7: Digitaalisten aineistojen kansallinen kuvausjärjestelmä

Tehdään olemassa olevien aineistojen löytäminen ja hyödyntämisen suunnittelu helpoksi tutkijoille ja kehittäjille kuvailutietojen ja hakutermien avulla.

15.11.2016

Page 8: Digitaalisten aineistojen kansallinen kuvausjärjestelmä

Rakennetaan yhtenäiset kuvaustavat ja -välineet, joita voidaan käyttää aineistojen keruuorganisaatioissa

15.11.2016 8

Page 9: Digitaalisten aineistojen kansallinen kuvausjärjestelmä

ROADMAP: Uusien aineistojen osalta metatietoja aletaan tuottaa aineiston elinkaaren aikana lähtien aineiston suunnitteluvaiheesta

15.11.2016 9

Page 10: Digitaalisten aineistojen kansallinen kuvausjärjestelmä

HANKKEEN TÄRKEIMMÄT TUOTOKSET

1. Tietomalli, käsitemalli, arkkitehtuurikuvaus ja keskeistentietokenttien määrittely digitaalisten tietoaineistojenmuuttujatasoisen kuvailun, ylläpidon ja julkaisun tueksi.

2. Hankitaan tai kehitetään muuttujatasoisten aineistojenkuvaus- ja ylläpitotyökalu (kuvauskanta ja metadataeditori).

3. Kehitetään kuvaus- ja ylläpito-ohjeistus rekisterinpitäjillesisältäen tiekartan ohjaavan metadatan(prosessimetadatan) generoinnille ja hyödyntämiselle.

4. Kuvataan valitut pilottiaineistot.

5. Julkaistaan kuvatut aineistot aineistokatalogissa.

6. Siirretään järjestelmä tekniselle ylläpitäjälle.

10.11.2016 THL, Tilastokeskus, Tietoarkisto, Sitra 10

Page 11: Digitaalisten aineistojen kansallinen kuvausjärjestelmä

AIKATAULU

Q4/2016: Julkaistaan 100 THL:n AJR-aineistoa. (Q4/2016.)

Q4/2016: Selvitys metadatatietomalleista ja kansallinentietomalli ja arkkitehtuuri. (iteraatio 2017.)

Q2/2017: Hankitaan/kehitetään IT-työväline metadatankuvailuun.

Q2/2017: Kuvaillaan valitut pilottiaineistot.

Q3/2017: Julkaistaan pilottiaineistot olemassa olevassa tai uudessa metadatakatalogissa.

Q3/2017: Siirretään palvelujen tekninen ylläpito CSC:lle.

2017: Yhteinen kansallinen pilotti etä- ja lupahankkeidenkanssa.

10.11.2016 THL, Tilastokeskus, Tietoarkisto, Sitra 11

Page 12: Digitaalisten aineistojen kansallinen kuvausjärjestelmä

KUVATTAVAT PILOTTIAINEISTOT

AJR-aineistot (THL, 12/2016 – suppeat tiedot)

Terveydenhuollon hoitoilmoitusrekisteri (THL)

Aikuisten terveys-, hyvinvointi- ja palvelututkimus (THL)

Finriski/Finterveys (1992?–) (THL)

Ortopedisten endoproteesien rekisteri (THL+HUS+VSSHP)

Selkäkirurgian rekisteri (HUS+VSSHP)

Kuolemansyytilaston tutkimusaineisto (Tilastokeskus)

Perus-, perhe-, tutkinto-, työssäkäynti- ja tulotietojenvalmismoduulit (Tilastokeskus)

Kelan aineisto: Erityiskorvausoikeuksien tietokanta?

10.11.2016 THL, Tilastokeskus, Tietoarkisto, Sitra 12

Page 13: Digitaalisten aineistojen kansallinen kuvausjärjestelmä

VÄLITUOTOKSET 10.11.2016

1. Nykytilakartoitus ja alustavien testien tulokset 0.5;

2. Metadata-arkkitehtuurikuvaus 0.5;

3. Käsitemalli 0.5;

4. Tietomallin implementointisuunnitelma 0.5;

5. Vaatimusmäärittely 0.5;

15.11.2016 THL, Tilastokeskus, Tietoarkisto, Sitra 13

Page 14: Digitaalisten aineistojen kansallinen kuvausjärjestelmä

NYKYTILAKARTOITUS 0.5: METATIETOTARPEITA Kansallinen aineistoluettelo-, haku- ja latauspalvelu tietojen

toissijaisille käyttäjille.

Sähköinen käyttölupajärjestelmä/käyttölupakäsittely.

Aineistonhallintasuunnitelma rahoittajalle.

Rekisteriseloste ja tieteellisen tutkimuksen rekisteriseloste.

Muuttuja- ja kysymystietopankki.

Kyselylomakkeiden rakentaminen ja suunnittelu.

Tietopoimintojen määrittely tiedonantajille (esim. Hilmo-tiedonkeruu.)

Tietokantojen metadatakuvaukset.

Eurostatin edellyttämät metadatakuvaukset.

Saatavuustiedot ja suorat jakaumat tietojen käyttäjille.

Tietojen analyysi ja raportointi.

15.11.2016 THL, Tilastokeskus, Tietoarkisto, Sitra 14

Page 15: Digitaalisten aineistojen kansallinen kuvausjärjestelmä

KYTKENNÄT

Indikaattorimetadata

Julkaisujen metadata

15.11.2016 THL, Tilastokeskus, Tietoarkisto, Sitra 15

Page 16: Digitaalisten aineistojen kansallinen kuvausjärjestelmä

GSIMHelsinki ModelGSBPMEARPIJHS Rekisteritiedon metatiedotCommon Structure of Statistical Information CoSSIDDI Codebook DDI-CDDI Lifecycle DDI-LMinimum Information About BIobank data Sharing MIABISTTA-minimimetatietomalliATT-metatietomalliMetaformTHL:n AJR-metadataDublin Core Metadata Initiative DCMIData Catalog Vocabulary DCAT

Single Integrated Metadata Structure SIMSStatistical Data and Metadata eXchange SDMXFINTOTEROMESHFinMESHTK:n luokituksetDDI CVsMIABIS-sanastotSKOSXKOSFOAFADMSDDI DiscoORG

Tietoarkisto | www.fsd.uta.fi

16

Page 17: Digitaalisten aineistojen kansallinen kuvausjärjestelmä

Mallien arviointi ja valitseminen: yleisiä kriteereitä

sisältää tarvittavat tietoelementit resurssin kuvailuun

sisältää mahdollisuuden kontrolloida/rajoittaa tietoelementtien sisältöä

pitää tukea sanastojen/sovittujen koodien käyttöä

pitää tukea metadatan ja kuvailtavien objektien versiointia

pitää tukea PIDien käyttöä

pitää olla käyttäjäyhteisö

pitää olla dokumentoitu, saatavilla ohjeistusta ja esimerkkejä

standardilla pitää olla kehittäjä/ylläpitäjäyhteisö

avoin, ei-kaupallinen

Tietoarkisto | www.fsd.uta.fi

17

Page 18: Digitaalisten aineistojen kansallinen kuvausjärjestelmä

NYKYTILAKARTOITUS 0.5

Termieditori (THL)

TopBraid-sanastoeditori (kaupallinen)

Muuttujaeditoridemo (Tilastokeskus)

Colectica (kaupallinen)

Luokituseditori (Tilastokeskus)

Metka (Tietoarkisto)

DDI Disco -editoriproto (THL)

Lomakepalvelu (THL)

Metaform (THL)

AJR (THL)

RUT/Metadataverktyg (Vetenskapsrådet, Ruotsi)

15.11.2016 18

Page 19: Digitaalisten aineistojen kansallinen kuvausjärjestelmä

JÄRJESTELMÄN ARKKITEHTUURI JA KANSALLINEN VIITEKEHYS 0.5

15.11.2016 THL, Tilastokeskus, Tietoarkisto, Sitra 19

Page 20: Digitaalisten aineistojen kansallinen kuvausjärjestelmä

VAATIMUSMÄÄRITTELY 0.5

Aineistokuvausten kansallinen kuvauskanta

Aineisto- ja muuttujatason metatietoeditori

Kansallinen aineistokatalogi

15.11.2016 THL, Tilastokeskus, Tietoarkisto, Sitra 20

Page 21: Digitaalisten aineistojen kansallinen kuvausjärjestelmä

KÄSITEMALLI 0.5

15.11.2016 THL, Tilastokeskus, Tietoarkisto, Sitra 21

Page 22: Digitaalisten aineistojen kansallinen kuvausjärjestelmä

TIETOMALLIN IMPLEMENTOINTISUUNNITELMA 0.5

10.11.2016 22

AINEISTOTYYPPI KUVAUS

Valtakunnalliset keskusrekisterit THL, Kela, Tilastokeskus, Väestörekisterikeskus,

jne.

Kanta Valtakunnallinen potilastiedon arkisto ja

sähköinen resepti

Kliiniset potilasaineistot Tietoaltaista tai lähdejärjestelmistä

Kliiniset laaturekisterit Rakenteiset kliiniset sairaus- ja

toimenpidekohtaiset rekisterit

Väestötutkimukset FinTerveys/Finriski, Aikuisten terveys-,

hyvinvointi- ja palvelututkimus ATH, jne.

Muut tutkimus- ja näyteaineistot Yksittäiset poikkileikkaus- ja

pitkittäistutkimusaineistot

MyData OmaKannan/PHR:n ja appsien tiedot

Biopankkeihin siirretyt näytteet

ja tiedot

Biopankkilain mukaisesti biopankkien

(palveluoperaattorin?) kautta

Page 23: Digitaalisten aineistojen kansallinen kuvausjärjestelmä

SEURAAVAT ASKELEET

• 9.11.–16.11. Välituotosten kommenttikierros.• 30.11. Nykytilaselvitys 1.0 valmis.• 13.12 Kansallisen kuvauskannan, editorin ja katalogin vaatimusmäärittely, v. 1.0. valmis.

• 13.12 Metadata-arkkitehtuurikuvaus, v. 1.0 valmis. • 13.12 Tietomallin implementointisuunnitelma, v. 1.0 valmis.

• 13.12. 100 AJR-aineistoa julkaistaan THL.fi:ssä.• Marras-joulukuu: IT-työn tilauksen valmistelu.• 31.1.2017. Käsitemalli, v. 1.0 valmis.

15.11.2016 THL, Tilastokeskus, Tietoarkisto, Sitra 23

Page 24: Digitaalisten aineistojen kansallinen kuvausjärjestelmä

KOMMENTTIKIERROS (1/5)

1) Metadata-arkkitehtuuri 0.5. Arkkitehtuuridokumenttiluonnoksessa ehdotetaan, että rakennetaan kansallinen aineistokuvausten kuvauskanta. Kuvauskantaan voidaan tuoda rajapinnan kautta valmiita metadatakuvauksia organisaatioiden omista kuvauskannoista tai kehitettävällä metadataeditorilla. Keskeisimmillä tietoja hallinnoivilla organisaatioilla, kuten Tilastokeskuksella ja THL:llä, olisi omat versionsa metadataeditorista. Kansallisia kuvauksia julkaistaisiin kansallisessa aineistokatalogissa ja niitä voitaisiin hyödyntää myös muihin käyttötarkoituksiin. Mitä mieltä olet arkkitehtuurimallin toimivuudesta?

15.11.2016 THL, Tilastokeskus, Tietoarkisto, Sitra 24

Page 25: Digitaalisten aineistojen kansallinen kuvausjärjestelmä

KOMMENTTIKIERROS (2/5)

2) Mitä mieltä olet suunniteltujen välineiden (kuvauskanta, metadataeditori, kansallinen metadatakatalogi) tarpeellisuudesta ja niille esitetyistä vaatimuksista?

15.11.2016 THL, Tilastokeskus, Tietoarkisto, Sitra 25

Page 26: Digitaalisten aineistojen kansallinen kuvausjärjestelmä

KOMMENTTIKIERROS (3/5)

3) Käsitemalli 0.5. Tuotettu käsitemalliluonnos on rakennettu lähtien liikkeelle jo olemassa olevista aineistokatalogeista, eikä olemassa olevista standardeista. Katalogeihin perustuvaa mallia on työstetty eteenpäin ja täydennetty eräillä GSIM-mallin piirteillä.Toinen tapa olisi ollut lähteä liikkeelle jostakin valmiista standardista, ja määritellä käsitemalli siitä lähtien. Kummallakin lähestymistavalla on vahvuutensa ja heikkoutensa. Onko valittu tapa oikea? Miksi? Jos käsitemallin pohjana tulee olla jokin standardi, mikä ja mistä syystä?

15.11.2016 THL, Tilastokeskus, Tietoarkisto, Sitra 26

Page 27: Digitaalisten aineistojen kansallinen kuvausjärjestelmä

KOMMENTTIKIERROS (4/5)

4) Ehdotettu arkkitehtuuri- ja käsitemalli edellyttävät nykyiset organisaatiorajat ylittävää hallintamallia. Kansallisesti ylläpidettävä metadatakokonaisuus vaatisi eri organisaatioiden yhteistoimintaa. Lähdetäänkö organisaatiorajat ylittävän hallintamallin tielle, vai onko tämä liian kunnianhimoinen tavoite? Pystyvätkö suomalaiset julkishallinnon organisaatiot yhdessä pitämään yllä kansallista tietoaineistojen metadataa? Mikä voisi olla vaihtoehtoinen malli?

15.11.2016 THL, Tilastokeskus, Tietoarkisto, Sitra 27

Page 28: Digitaalisten aineistojen kansallinen kuvausjärjestelmä

KOMMENTTIKIERROS (5/5)

5) Onko dokumenteissa asioita, joita ei ole vielä osattu ottaa lainkaan huomioon? Mitä?

15.11.2016 THL, Tilastokeskus, Tietoarkisto, Sitra 28

Page 29: Digitaalisten aineistojen kansallinen kuvausjärjestelmä

10.11.2016 29

Page 30: Digitaalisten aineistojen kansallinen kuvausjärjestelmä

KIITOS!

10.11.2016 30

Yhteydenotot:

[email protected] thl.fi