Post on 01-Nov-2014
description
Cursus Open Data De Haagse Hogeschool
sept – nov 2013
1
Waarom van Open Dataeen bestuurlijke en commerciële kijk op het belang ervan
9 sept 2013
3Over …http://www.ordina.com/nl-nl/over-ordina/profiel/
ORDINADE BEDENKERS, BOUWERS EN BEHEERDERSVAN DE DIGITALE WERELD
Joep Creusen• Solution, Business en Enterprise Architect (zeg maar: IT architect)• Data modellering, data governance en applicatie integratie• Linked Data trend-watcher
4Waarom van Open DataAgenda
1 – Wat is Open Data
2 – Baten van Open Data (commercieel, bestuurlijk)
3 – Linked Open Data
4 – Omgevingsfactoren
5Wat is Open Data?De essentie
Open Data is net alsandere documenten op internet.
Maar dan gemakkelijk gemaakt voorhergebruik van de afzonderlijke gegevens.
6
internet als verzameling webpagina’s/documenten
internet als verzameling herbruikbare entiteiten
Hergebruik van afzonderlijke gegevensVan documenten naar gegevensentiteiten
http
://w
ww
.itpe
dia.
nl/2
011
/05/
31/
web
-3-0
-sem
antis
ch-w
eb/
7Wat is Open Data?https://data.overheid.nl/
a. De data is openbaar;
b. Er berust geen auteursrecht of andere rechten van derden op;
c. De data zijn bekostigd uit publieke middelen, beschikbaar gesteld voor de uitvoering van die taak;
d. De data voldoen bij voorkeur aan ‘open standaarden’ (geen barrières voor het gebruik door ICT-gebruikers of door ICT-aanbieders);
e. Open Data is bij voorkeur computer-leesbaar, zodat zoekmachines informatie in documenten kunnen vinden.
8Computer-leesbaar??Voorbeeldje: http://www.infomil.nl/onderwerpen/klimaat-lucht/ner/ …
9Van opmaak- naar betekenisgeoriënteerd Gestandaardiseerde metadatering
Webpagina document Open Data document
10Waarom van Open DataAgenda
1 – Wat is Open Data
2 – Baten van Open Data (commercieel, bestuurlijk)
3 – Linked Open Data
4 – Omgevingsfactoren
11Waarom Open DataBaten
A - Het is goed voor iedereen (+ reciprociteit)
B - Het verkoopt zichzelf - de app dan
C - Het helpt andere producten te verkopen
D - Het levert kostenbesparingen
12Waarom Open DataTakeaway 1
A - Het is goed voor iedereen (+ reciprociteit)
B - Het verkoopt zichzelf - de app dan
C - Het helpt andere producten te verkopen
D - Het levert kostenbesparingen
13Waarom Open DataTakeaway 2
A - Het is goed voor iedereen (+ reciprociteit)
B - Het verkoopt zichzelf - de app dan
C - Het helpt andere producten te verkopen
D - Het levert kostenbesparingen
* ... en nog méér als we het kunnen LINKEN
}*
14CasusReizigersinformatie voor grootstedelijk OV
http://www.youtube.com/watch?v=URmKRTU-hxQ Gov 2.0 Expo 2010: Joshua Robin, "Unlocking Real-Time Data"
The Boston T: (2009)
15CasusReizigersinformatie voor grootstedelijk OV
“Goede reisinformatie is geen verleider,” zegt hoofd marketing & vervoerontwikkeling bij HTM
Joep ten Brink. “Maar geen verleiding zonder goede reisinformatie.
Zeker nu we het moeten gaan doen met minder geld van de belastingbetaler en
meer geld van de reiziger.”
Dichter bij huis:
http://stefan.konink.de/contrib/openov/govi-nieuwsbrief-15.pdf
16Welke verleider wil je ondersteunen?Commercieel belang: OEFENING
Met behulp van de Open Transportation Data konden lokale leveranciersgoedkoop eenvoudige countdown signs leveren.
Wie was de eerste afnemer van deze Countdown Signs?
17Welke verleider wil je ondersteunen?OEFENING: De eerste afnemer van de Countdown Signs?
De Starbucks in de winkelstraat
met een Countdown Sign boven de counter kunnen klanten- in de winkel (en niet buiten op straat wachtend) -
zien hoeveel tijd ze hebben voor nog een kop koffie
18Commercieel belang van Open DataZoek de C-tjes
A - Het is goed voor iedereen (+ reciprociteit)
B - Het verkoopt zichzelf - de app dan
C - Het helpt andere producten te verkopen
D - Het levert kostenbesparingen
Moraal: vind de link tussen de data en de koffie
19Voorbeeld van baten (1)Vrije parkeerplaatsen
A - Het is goed voor iedereen
B - Het verkoopt zichzelf
C - Het verkoopt andere producten
D - Het levert kostenbesparingen
B
A
CverhoogdebezettingP-plaats
20Voorbeeld van baten (2)Wob
A - Het is goed voor iedereen
B - Het verkoopt zichzelf
C - Het verkoopt andere producten
D - Het levert kostenbesparingen
D
21Open Data voor gemeentenChecklist op data.overheid.nl/voor-gemeenten/top-20
22Wat levert het op? data.overheid.nl/handreiking/Wat-levert-het-op-voor-de-overheid
Zelfd
e bo
odsc
hap
in Ie
rland
:
http
://w
ww.
yout
ube.
com
/wat
ch?v
=Bkd
RQ
ipqo
dE• Financiële besparing
• Verhoging datakwaliteit
• Versterking van de legitimiteit
• Vergroting van de externe oriëntatie van de organisatie
• Standaardisatievoordelen
23De waarde van Open DataKamerbrief 8 juni 2012
24Open Data Benefits (UK)A report for the Department for Business, Innovation and Skills
Key research findings
Value to consumers, businesses and the public sector between £1.2 billion and £2.2 billion
much larger downstream impacts affecting all areas of society beyond the direct customer.
MARKET ASSESSMENT OF PUBLIC SECTOR INFORMATION Written by Deloitte MAY 2013
There is a link between the provision and use/re-use of public sector information and
economic growth.
25Waarom van Open DataAgenda
1 – Wat is Open Data
2 – Baten van Open Data (commercieel, bestuurlijk)
3 – Linked Open Data
4 – Omgevingsfactoren
26Het wereld voedsel probleemMeerdere factoren, meerdere datasets
The Global Hunger Index (GHI) […] provides insights into the drivers of hunger. By raising awareness and understanding of regional and country differences in hunger, the GHI aims to trigger actions to reduce hunger
http://semanticweb.com/fighting-global-hunger-with-semantics-and-how-you-can-help_b38141
The IFPRI decided to provide the GHI as Linked Open Data so that it can be combined with other relevant information and […] indirectly contribute to direct global hunger solutions
27
buslocatiebusroutebuslocatie
werk a/d wegbusroutebuslocatie
uitgaans-agendawerk a/d wegbusroutebuslocatie
Het voordeel van Linked Open Data (LOD)Hoe meer gelinkte datasets, des te meer toegevoegde waarde
toegevoegde waarde
28Wat noemen we Linked Data?(Voor IT-ers:) W3C, Tim Berners-Lee, Semantic Web
LOD
Linked Data
Open Data
(5 !)
Linked Data is data die is gepubliceerd m.b.v. standaarden (RDF, SPARQL) waarmee makkelijk verbanden gelegd kunnen worden tussen verschillende datasets
29Linked Data sterren (toe)passen op Open DataIdealiter gebruik je RDF formaat (atomaire data, z.g. “triples”)
Er berust geen auteursrecht of andere rechten van derden op;
De data voldoen bij voorkeur aan ‘open standaarden’
Open Data is bij voorkeur computer-leesbaar
bij voorkeurOpen Data ≥ 3 DATA
30Ander aspect van Open Data publiceren Bulk (down te loaden bestand) versus gedoseerd (online API)
BESTAND API
31“Gebruikersgemak” Open Datais afhankelijk van bij publicatie toegepaste standaarden
minder afhankelijk van verbinding
ingebouwde selectielogica
computer-leesbaar
vrij van rechten
simpel te linken aan andere datasets
openformaat
“triple”formaat
on
lin
ed
ow
n t
e lo
aden
BE
STA
ND
SPARQL
RDF
API
proprietaryformaat
paywall API
CSV, …Excel, …
≥ 4 DATA2 DATA 3 DATA
AP
I
actualiteit niet gegarandeerd !
32Duurzaamheid (≠ -gebruikersgemak)VB: RaadsInformatieSystemen en de Archiefwet
Houdbaarheid van bijvoorbeeld Word ?Wie kan nog Word 3.1 of Word 95 inlezen ?
Niet duurzaam: Microsoft Word Excel Windows Media Flash Video BMP PowerPoint Apple iWork, Keynote
Twijfelgevallen: OpenOffice (.odf, .odt, .sxw) PostScript.
Wel duurzaam: PDF HTML mits conform Webrichtlijnen JPEG PNG MPEG MP3 en MP4 SOAP XML
API
( )
(een)standaard
voor
33Kwaliteit Open Data publicatieSamenvatting
Open Data
met open API
Linked (RDF, SPARQL)
34Waarom Open DataTakeaway 1
A - Het is goed voor iedereen (+ reciprociteit)
B - Het verkoopt zichzelf - de app dan
C - Het helpt andere producten te verkopen
D - Het levert kostenbesparingen
35Waarom Open DataTakeaway 2
A - Het is goed voor iedereen (+ reciprociteit)
B - Het verkoopt zichzelf - de app dan
C - Het helpt andere producten te verkopen
D - Het levert kostenbesparingen
* ... en nog méér als we het kunnen LINKEN
}*
36Waarom van Open DataAgenda
1 – Wat is Open Data
2 – Baten van Open Data (commercieel, bestuurlijk)
3 – Linked Open Data
4 – Omgevingsfactoren
37Burger verwacht state-of-the-art servicestate-of-the-art = APP User Experience
• Appification of the world
• Icoon klikken ; webadres tikken !
• Consument bepaalt zelf
hoe hij/zij informatie zoekt
• App (meer nog dan het web zelf)
ontkoppelt produceren & consumeren van data
38Appification of the worldOntkoppelt produceren & consumeren van data
http://www.forbes.com/sites/anthonykosner/2012/12/16/forecast-2013-the-appification-of-everything-will-turn-the-web-into-an-app-o-verse/
Instead of thinking about the web as a hierarchical tree of documents we need to start thinking about all of that content as an underlying
service layer for application-based interfaces [ API]
39Data producent data consument Evolutie informatievoorziening
systeem
opslag
in uit
systeem
opslag
in uitapp
40Data consument bepaalt integratiebehoefte !Koppelen van datasets door integratie in de APP
systeem
opslag
systeem
opslag
systeem
opslag
integratie
app
LinkedOpen Data
41Generieke integratielogica infrastructuurKoppelen door standaardisatie datacenters + integratie via de cloud
http
systeem
opslag
systeem
opslag
systeem
opslag
app
RD
FR
DF
RD
F
SPARQL
SPARQL
SPARQL
http APP koppelt metéén SPARQL endpoint
en linkt naar keuze
Linked Open Data
42Rendement op investeringVerschil in life-cycle: datacenter – front end
http://www.slideshare.net/cavlec/rdf-rda-and-other-tlas
43Transparante overheidDé standaard
44Decentrale regelgevingZie Kennis- en Exploitatiecentrum Officiële Overheidspublicaties
• Wet elektronische bekendmaking
• Dienstenloket
• Centrale Voorziening Decentrale Regelgeving
• …
45Andere bestaande regelgeving en richtlijnen?Concept actieplan Open overheid
46Handreiking / handboekStappenplan van de overheid
47Ander handboekhttp://www.hackdeoverheid.nl/wat-is-opendata/
‘Ik b
en e
en a
mb
ten
aar
en w
il d
ata
op
en m
aken
’
48Ook Europa is het nu eens over Open DataRICHTLIJN 2013/37/EU VAN HET EUROPEES PARLEMENT EN DE RAAD
Artikel 5 Beschikbare formaten 1. Openbare lichamen stellen hun documenten ter beschikking in de reeds bestaande formaten of talen en, indien mogelijk en passend, in een open en machinaal leesbaar formaat, samen met hun metadata. Zowel het formaat als de metadata dient voor zover mogelijk aan formele open standaarden te voldoen.
Artikel 9 Praktische regelingen De lidstaten stellen praktische regelingen vast die het zoeken naar voor hergebruik beschikbare documenten vereenvoudigen, zoals overzichtslijsten van de belangrijkste documenten met relevante metagegevens, die indien mogelijk en passend online en in machinaal leesbare formaten toegankelijk zijn„ en portaalsites met links naar de overzichtslijsten. Indien mogelijk vergemakkelijken de lidstaten het taaloverschrijdend zoeken naar documenten.
De lidstaten moeten de richtlijn voor 18 juli 2015 implementeren in hun eigen wetgeving. In Nederland gebeurt dat waarschijnlijk via wijziging van de Wet openbaarheid Bestuur en de Archiefwet.
49En intussen wordt er al van alles gepubliceerdRijp en groen …
dat
aset
s b
esch
ikb
aar
in m
eerd
ere
form
aten
…
50
http
://w
ww
.city
sdk.
eu/a
bout
-the
-pro
ject
/
http
://c
itysd
k.w
aag.
org/
En er is ook (Europese) hulpHelping cities to open their data - giving developers the tools they need
51Bezuinigen door Open Data investeringenBezuinig door stroomlijnen van je organisatie
informatievoorziening
stroomli jnt organisat ieprocessen
(Linked) Open Data
stroomli jnt informatievoorziening
52Waarom van Open DataAgenda
1 – Wat is Open Data
2 – Baten van Open Data (commercieel, bestuurlijk)
3 – Linked Open Data
4 – Omgevingsfactoren er zijn ook belemmeringen
53Geschikt voor publicatie?Doe de toets
a. De data is openbaar;
b. Er berust geen auteursrecht of andere rechten van derden op;
c. De data zijn bekostigd uit publieke middelen, beschikbaar gesteld voor de uitvoering van die taak;
d. De data voldoen bij voorkeur aan ‘open standaarden’ (geen barrières voor het gebruik door ICT-gebruikers of door ICT-aanbieders);
e. Open Data is bij voorkeur computer-leesbaar, zodat zoekmachines informatie in documenten kunnen vinden.
en ook:
- technische toets
- Inhoudelijke integriteits toets
54Zóo 2012 ?Casuscitaat KOOP in COLLEGE STANDAARDISATIE CS 12-06-05
“Voor de vindbaarheid van data moet er een paradigmashift plaatsvinden. Er wordt nog veel zelf georganiseerd binnen de eigen muren, maar dat zou eigenlijk moeten zonder muren eromheen. Eigenlijk moet men
er van meet af aan van uit gaan dat overheidsdata Open Data is.
Er wordt nu nog veel gedacht in „mijn data‟ en aarzelingen zoals als de data „open‟ wordt is het dan nog mijn data. Maar collecties vullen elkaar aan, moeten overlap hebben. Dit maakt het beeld completer. Het belang, de noodzaak om gevonden te worden ontbreekt nog. Er wordt vaak nog voor een traditionele manier van publiceren gekozen – via communicatieafdelingen etc. – in plaats van het online zetten van de data.”
55In de herhaling: waarom Linked Open DataCasuscitaat KOOP in COLLEGE STANDAARDISATIE CS 12-06-05
“Voor de vindbaarheid van data moet er een paradigmashift plaatsvinden. Er wordt nog veel zelf georganiseerd binnen de eigen muren, maar dat zou eigenlijk moeten zonder muren eromheen. Eigenlijk moet men er van meet af aan van uit gaan dat overheidsdata Open Data is.
Er wordt nu nog veel gedacht in „mijn data‟ en aarzelingen zoals als de data „open‟ wordt is het dan nog mijn data. Maar collecties vullen elkaar aan, moeten overlap hebben. Dit maakt het beeld completer. Het belang, de noodzaak om gevonden te worden ontbreekt nog. Er wordt vaak nog voor een traditionele manier van publiceren gekozen – via communicatieafdelingen etc. – in plaats van het online zetten van de data.”
Linked Data regelt dat
56Maar: vandaag, meer dan een jaar later …koop.overheid.nl/producten/linked-data gaat nog niet heel snel
BEETJE
J
AMMER …
57Publicatie door datacenterLinked (met RDF/SPARQL) = paradigma shift veranderdrempel
• Bestaande dataset bestand beschikbaar stellenbusiness as usual (NB: exportfrequentie?)
• API per backoffice systeembusiness as usual (NB: security? beschikbaarheid?)
• API over meerdere systemen heenserious business €€ (meestal)
• Publiceren met RDF via triplestore, API = SPARQLparadigma shift (relationele model links laten liggen +
anders omgaan met metadata)
58Hoe wil je data ontsluiten vanuit een APP ?binnen de mogelijkheden die de gepubliceerde datasets bieden
BESTAND
API
http://www.pilod.nl/index.php?title=Boek/GeurtsEtAl
dit
zijn
nie
t T
im’s
ste
rren
API =
S
PARQL
59Welke API standaardenAPP bouwers hebben zo hun stijlen veranderdrempel ?
SOAP SPARQL
OData
REST/JSON
flexibel
ingewikkeld
lean & mean
houtje-touwtje
structuur
log
60Wijzigingen in data, applicaties, infrastructuurKosten datacenter
• Datasets ontsluiten en publiceren éénmalige kosten
• Kosten voor onderhoud ontsluiting terugkerende kosten !
• Goede afspraken maken over toekomstvastheid publicatie !
• Toekomst: Linked Open Data architectuur
• Geen terugkerende kosten meer
• Minder ontsluitingskosten (generieke infrastructuur is er al)
• STAP 1: zet je data in een triplestore met RDF (≥ 4 DATA)
61Eenduidigheid”Wat bedoel je precies?” ! projectkosten x 10
• Bestaande dataset beschikbaar stellenbusiness as usual
• Preciese betekenis achterhalen van data-elementzweet en tranen (documentatie meestal ontoereikend)
• Meerdere datasets met “vergelijkbare” gegevensserious business €€ (inzet materiedeskundigen)
Uitdaging: definieren van betekenis in context
- semantiek
- data governance
http://prezi.com/sfrwqcxat55c/workshop-semantic-web/
http://www.ordina.nl/nl-nl/diensten-en-oplossingen/business-oplossingen/performance-management-en-bi/data-governance/
62Waarom Open DataTakeaway 1
A - Het is goed voor iedereen (+ reciprociteit)
B - Het verkoopt zichzelf - de app dan
C - Het helpt andere producten te verkopen
D - Het levert kostenbesparingen
63Waarom Open DataTakeaway 2
A - Het is goed voor iedereen (+ reciprociteit)
B - Het verkoopt zichzelf - de app dan
C - Het helpt andere producten te verkopen
D - Het levert kostenbesparingen
* ... en nog méér als we het kunnen LINKEN
}*
64Waarom Open DataTakeaway 3
Let bij publicatie op omgevingsfactoren
• Ride the appification wave
• Gebruik het streven naar transparantie en bezuinigingen
• Let op regelgeving en best practice stappenplannen
• Stap op tijd in Linked Data technologieën (lagere beheerkosten)
• Houd rekening met veranderdrempels bij- data eigenaren (“van mij”)- data centers (RDB - RDF paradigma shift)- app bouwers (eigen stijl)
• Scan op eenduidigheids- en governanceissues
Vragen? Mail me gerust.joep.creusen@ordina.nl
66Met dank aan Web 2.0ook van de oudere generaties kun je nog een boel opsteken ;-)
67
www.ordina.nl