Handreiking open data
In samenwerking met verschillende overheidsorganisaties heeft team data.overheid.nl een vernieuwde handreiking geschreven over alle facetten van het openen en publiekelijk beschikbaar stellen van data
Inleiding
Eigenlijk alle organisaties verzamelen data op allerlei gebieden om hun taken te kunnen uitvoeren. De overheid is hierin erg belangrijk, omdat zij met publieke middelen een grote hoeveelheid data verzamelt. Daarnaast zou deze data, voor zover het niet valt onder de uitzonderingsgronden van de Wet openbaarheid van bestuur (Wob), open data moeten zijn. Dit betekent dat deze data geopend en beschikbaar gemaakt kan worden voor iedereen.
Waarom is open data zo waardevol? Er zijn hoge verwachtingen van wat open data zou kunnen opleveren voor de maatschappij. In opdracht van het Ministerie van Binnenlandse Zaken en Koninkrijksrelaties (BZK) heeft de TU Delft onderzoek gedaan naar de kosten en baten van het openstellen van overheidsdata. De kwantitatieve studies in dit onderzoek laten een verhouding tussen kosten en baten zien van 1:1,6 tot 1:70. Dat wil zeggen dat de baten van het openstellen van overheidsdata ruim 1,5 tot 70 keer zo groot zijn als de kosten daarvan.
Naast de hoge verwachtingen, zijn er inmiddels al vele voorbeelden van innovatieve toepassingen die met behulp van open data zijn ontwikkeld. Denk bijvoorbeeld aan Buienradar , ontwikkeld met o.a. open data van de KNMI. Of een animatie van de aardbevingen in Groningen , waar met een visuele toepassing van open data over gasmeldingen en aardbevingen het effect inzichtelijk wordt gemaakt van gasmetingen in Groningen.
Hieronder vind je nog enkele interessante publicaties over het waarom van het delen van data:
Data.overheid.nl heeft in het verleden al eens een uitgebreide handreiking ontwikkeld, die hierbij ondersteund. Met deze nieuwe handreiking 2.0 willen we je zo kort, bondig en toegankelijk mogelijk door alle stappen heen leiden, die nodig zijn om te komen tot het openen van data. Op bepaalde aspecten wordt verder verwezen naar extra informatie. Data.overheid.nl wenst je veel succes bij het doorlopen van deze stappen en nodigt je uit om bij eventuele verdere vragen contact op te nemen met data@koop.overheid.nl.
1. Wetgeving over data
Dat er inmiddels decennialang wet- en regelgeving bestaat in Nederland omtrent transparantie in de overheidssector is bekend. Echter welke wet- en regelgeving is er nu omtrent open data? We zetten de diverse wetten op een rijtje:
De Wob regelt de toegang tot overheidsinformatie. Het doel van de wet is om burgers inzicht te geven in het overheidshandelen en zo deelname aan democratie en besluitvorming mogelijk te maken. De wet regelt het actief – uit eigen beweging – openbaar maken van informatie en het openbaar maken van informatie op verzoek. De Wob gaat uit van het algemene belang van openbaarheid van informatie. Een verzoek om informatie moet daarom in beginsel worden ingewilligd, tenzij een of meerdere belangen genoemd in de artikelen 10 en 11 van de Wob zich daartegen verzetten. Denk hierbij aan het beschermen van bedrijfs- en fabricagegegevens of van de persoonlijke levenssfeer. Deze uitzonderingen gelden ook voor open data.
De Who stelt regels inzake het hergebruik van overheidsinformatie. Deze wet is een implementatie van de Europese Hergebruikrichtlijn. De Who gaat uit van de gedachte dat overheidsinformatie een belangrijke grondstof vormt voor digitale informatieproducten (lees: data). De Who ziet met name de economische kracht achter het delen van data, waar de Wob de legitimiteit en controleerbaarheid van de overheid voorop stelt. De Who regelt dat burgers en bedrijven een verzoek om hergebruik van deze overheidsinformatie kunnen indienen. Uitgangspunt hierbij is open, tenzij. Dit betekent dat dit verzoek in principe moet worden ingewilligd, tenzij een van de uitzonderingsgronden genoemd in artikel 2 van de Who zich daartegen verzet. Tevens moeten de documenten in machine leesbaar en open formaat ter beschikking worden gesteld. Voor meer informatie zie de verwijzing in voetnoot nummer 10.
Bovenstaande twee wetten zijn direct van invloed omtrent open data. We gaan verder met een aantal specifiekere wetten of een wetsvoorstel die veel raakvlakken hebben met open data.
1.3 Wetsvoorstel voor een Wet open overheid (WOO)
De WOO is een initiatiefwetsvoorstel dat nog in behandeling is bij de Eerste Kamer. Hoewel dit nog geen geldende wetgeving is, is dit wel degelijk een wetsvoorstel om rekening mee te houden. Met dit wetsvoorstel willen de initiatiefnemers op den duur de Wob vervangen. Het doel van het wetsvoorstel is om de overheid transparanter te maken en het functioneren van de democratische rechtsstaat te versterken. Het wetsvoorstel is nog niet in werking, maar kan een grote impact hebben op het databeleid van overheidsorganisaties.
De AVG is een Europese verordening die rechtstreeks doorwerkt binnen Nederland. Deze verordening ziet toe op de verwerking van persoonsgegevens door bedrijven en overheden in heel Europa. De AVG zorgt onder andere voor een versterking van de privacyrechten van burgers, meer verantwoordelijkheden voor organisaties en stevigere bevoegdheden voor de toezichthouders. Bij het openen van data is veelal de eerste vraag of er in de data persoonsgegevens zit, aangezien veel data van de overheid betrekking heeft op mensen of menselijke handelingen/gedragingen. Indien dit het geval is, dan komt de AVG om de hoek kijken.
De Wmo stelt regels voor overheden die economische activiteiten verrichten. Deze regels zijn opgesteld ter bevordering van gelijke concurrentieverhoudingen. Voor het openen van data is deze wet van belang om te kijken hoever de overheid mag gaan in het beschikbaar stellen van data.
1.6 Eigen beleid
De wet- en regelgeving geeft de kaders weer waarbinnen het beleid kan worden vorm gegeven. Binnen Nederland kennen wij inmiddels de Data Agenda Overheid waarin specifieker het databeleid is vorm gegeven. Binnen de DAO worden er kaders gesteld voor de beschikbaarstelling en kwaliteit van (open) data. Dit beleid is gericht op het principe open, tenzij. Dit betekent dat data open ter beschikking wordt gesteld, tenzij er een uitzonderingsgrond van de Who op van toepassing is. Tevens kan er binnen de eigen organisatie ook beleid zijn vorm gegeven.
2. Ik wil de data beschikbaar maken, wat moet ik doen?
Het beleid in Nederland is er dus op gericht dat data vanuit de overheid open is, tenzij er een uitzonderingsgrond van de Who/Wob van toepassing is. Dit bekent dus dat in beginsel alle data open is. De Who geeft gebruikers van data ook de mogelijkheid om data in herbruikbaar formaat te vragen, al dan niet tegen marginale kosten verstrekt. Maar als ik een aanvraag om data krijg of ik wil data beschikbaar maken, wat moet ik dan doen? Hieronder volgen tips om je door dit proces te helpen. Allereerst gaan we in op de criteria die aan open data worden toegedicht. Deze criteria worden gaandeweg in dit stuk nader toegelicht.
2.1 Wat is open data?
De beschikbaarstelling van data als open data is de huidige praktijk. Data wordt beschikbaar gesteld conform de uitgangspunten open data. (Op 22 juni 2016 stuurde de minister van Binnenlandse Zaken en Koninkrijksrelaties de uitgangspunten voor Open Data van de overheid aan de Tweede Kamer.) Daarbij gelden de acht uitgangspunten die het kader voor het proactief beschikbaar stellen van open data van de overheid definiëren.
1. Afwegingskader voor openbaarheid
Data van een overheidsorganisatie worden proactief beschikbaar gesteld als open data als er geen uitzonderings- of beperkingsgronden van de Wet openbaarheid van bestuur of bijzondere openbaarmakingsregelingen van toepassing zijn. Bij het beschikbaar stellen als open data dient een afweging plaats te vinden of de data bij hergebruik risico’s oplevert voor fundamentele waarden en privacy.
2. Open data zijn gratis
Een overheidsorganisatie brengt geen kosten in rekening voor het beschikbaar stellen van open data.
3. Open data zijn vrij van rechten van derden
Open data worden gevrijwaard van rechten van derden door vrijgave met een CC-0 verklaring. Indien de vermelding van de bron van de data van belang is voor een overheidsorganisatie, kan open data worden vrijgegeven met een CC-BY verklaring.
4. Open data zijn zonder registratie toegankelijk
Open data zijn toegankelijk zonder dat er enige vorm van registratie van gegevens van de potentiële gebruiker plaatsvindt.
5. Open data zijn computer verwerkbaar
Open data worden aangeboden op een manier die verdere verwerking met een computer mogelijk maakt. Bij voorkeur worden open data beschikbaar gesteld in een open standaard.
6. Open data zijn voorzien van metadata
Open data zijn voorzien van metadata conform de DCAT-AP standaard.
7. Open data zijn zo volledig en onbewerkt als mogelijk
Data worden in een voor hergebruik geschikte vorm door een overheidsorganisatie beschikbaar gesteld. Open data is qua kwaliteit en actualiteit zo gelijk mogelijk aan de binnen de publieke organisatie gebruikte data en wordt zoveel mogelijk ‘as-is’ beschikbaar gesteld. Data kunnen bewerkt worden om te voldoen aan het afwegingskader voor openbaarheid zolang deze bewerking niet in strijd is met de mededingingswet.
8. Open data zijn vindbaar
Overheidsorganisaties maken hun open data vindbaar door op data.overheid.nl een verwijzing naar de door hen beschikbaar gestelde open data te maken.
2.2 Open data publiceren
Door middel van publiceren wil je als overheidsorganisatie transparant zijn over de eigen data. Als je met open data aan de slag wilt, is het ook belangrijk om te onderzoeken wat de wensen zijn van een hergebruiker. Een hergebruiker van open data kan variëren van een journalist tot een ontwikkelaar en van een student tot werknemers van (eigen) overheidsorganisatie. Als bekend is waar de behoeften het meeste liggen, kan hierop de prioritering van wat allereerst opengesteld wordt, worden aangepast. Met deze vraaggerichte aanpak, wordt de hergebruiker optimaal bediend, zullen dataverzoeken/vragen over data verminderen en zal het rendement naar verwachting hoger zijn. Maar hoe achterhaal je de wensen van een hergebruiker?
Hieronder volgen een paar aanbevelingen:
Kijk naar dataverzoeken
Uit de dataverzoeken die bij de organisatie zijn binnengekomen, kan worden afgelezen welke behoeften er zoal bestaan aan data. Daarnaast zijn ook de dataverzoeken van het nationale dataportaal vrij te raadplegen.
Kijk naar toepassingen
Er ontstaan steeds meer innovatieve toepassingen die gebruik maken van open data. Door te kijken welke (open) data er veel gebruikt wordt om deze toepassingen mogelijk te maken, krijg je een indicatie van welke data waardevol kan zijn voor de hergebruiker.
Doe deskresearch
Er is enorm veel informatie te vinden op het web. Door middel van deskresearch, kunnen er ideeën worden opgedaan over behoeften naar data en voorbeelden daarvan. Daarnaast geven binnenkomende vragen bij de organisatie van allerlei aard, een goede indicatie van de onderwerpen waar bij er behoefte is aan meer informatie/data.
Maak gebruik van de high value datalijst
Het kabinet heeft de ambitie om zoveel mogelijk overheidsgegevens die zich daarvoor lenen, als open data beschikbaar te stellen. Daarbij geeft het kabinet prioriteit aan 'high value' datasets. Een 'high value' dataset is een dataset met hoge waarde voor de samenleving. Bij het openstellen van data wordt prioriteit gegeven aan de ontsluiting van deze 'high value' datasets, omdat deze data bijdraagt aan een transparante en open overheid. Voor gemeenten en provincies is deze lijst al beschikbaar. Het onderwerp high value data komt later in de handreiking nog uitgebreider aan de orde.
Zet een enquête uit
Een andere manier om te achterhalen wat de behoeften zijn van hergebruikers van data is het uitzetten van een enquête onder verschillende doelgroepen die mogelijk interesse hebben in open data. Deze doelgroepen kunnen bijvoorbeeld burgers, andere overheden, bedrijven, studenten, (lokale) journalisten en wetenschappers zijn.
2.3 Standaarden
Vervolgens moet je denken aan hoe je de data ter beschikking wilt stellen. Het gebruik van standaarden wordt hierbij nadrukkelijk aanbevolen. Een standaard is een afspraak die is vastgelegd in een specificatiedocument. Het gebruik van open standaarden biedt de mogelijkheid om met elkaar dezelfde ‘taal’ te spreken. Dit kan het hergebruik makkelijker maken en wellicht bevorderen. Open standaarden dragen bij aan interoperabiliteit en leveranciersonafhankelijkheid. Het bespaart kosten en verlicht administratieve lasten.
Standaarden ondersteunen gegevensuitwisseling tussen ICT-systemen. De openheid van deze standaarden zorgt ervoor dat iedereen de standaard kan gebruiken. Tevens vergroot dit de koppelbaarheid van je eigen data.
Wat zijn open standaarden?
Het Forum Standaardisatie interpreteert open standaarden als volgt:
‘Een standaard is een afspraak die is vastgelegd in een specificatiedocument. Om gegevens uit te wisselen moeten ICT-systemen dezelfde standaard hebben geïmplementeerd. Voorwaarde is dan wel dat het specificatiedocument vrij te verkrijgen is.’
In een standaard worden dus specifieke afspraken gemaakt m.b.t. het uitwisselen van gegevens.
Standaarden voor datasets
Voor het beschikbaar stellen van open datasets vanuit de overheid bestaan op diverse terreinen ook standaarden. Data.overheid.nl laat zoveel mogelijk zien welke standaarden er zijn met betrekking tot het beschikbaar stellen van data. Een greep uit de standaarden treft u aan in onderstaand overzicht. Het is verstandig om als overheidsorganisatie aan te sluiten op een bestaande standaard bij het beschikbaar stellen van de data.
Heeft u ook een standaard of wilt u meer weten omtrent het onderwerp. Neemt u dan gerust contact op met het team van data.overheid.nl via data@koop.overheid.nl.
3. Vindbaar maken van data
De data kan technisch nog zo goed in elkaar zitten, het gaat er ook om dat de data gemakkelijk gevonden wordt. Online gevonden worden is immers essentieel als je als organisatie met gebruikers in aanraking wilt komen rondom je open data (https://www.den.nl/themas/165). Wanneer je je collecties vindbaar maakt zorg je ervoor dat gebruikers je data makkelijk kunnen doorzoeken, bereiken en identificeren. Wij geven daarbij graag een aantal manieren waaraan je kunt denken bij het vindbaar maken van data.
3.1 Data.overheid.nl
Zorg ervoor dat je data ook wordt aangemeld en vindbaar wordt gemaakt via het Nationale dataportaal: data.overheid.nl. Data.overheid.nl is ook weer de partij die datasets doorgeeft aan het Europese dataportaal. Data.overheid.nl kent een goede positie in Google. Dit geeft een extra boost aan de vindbaarheid van je data. Het is pas open data als je het hebt aangemeld op data.overheid.nl.
3.2 Metadata: DCAT
Wat je ook doet, gebruik DCAT. DCAT is de wereldwijde en Europese standaard voor de uitwisseling van metadata. De DCAT standaard is er voor bedoeld om datasets overzichtelijk te kunnen presenteren en om de gebruiker mee te nemen in wat hij/zij kan verwachten in de dataset. Op die manier kan er ook gericht worden gezocht naar data (http://dcat-nl.info/nl/latest/). Hiermee schep je de voorwaarde voor uitwisselbaarheid van je data met andere dataportalen. Dit vergroot de kans op vindbaarheid.
3.3 Identificatie
Zorg ervoor dat jouw data ook echt uniek is. Dit kun je onder andere bereiken door gebruik te maken van persistent identifiers. Hiermee krijgt jouw data in de digitale wereld een unieke label. Deze label zal altijd naar jou te herleiden zijn. DCAT ondersteunt het gebruik van deze identifiers. Hiermee is jouw data beter vindbaar in de talrijke digitale collecties (http://www.den.nl/thema/165/).
3.4 Dataformaten
Data kan gepubliceerd worden in verschillende soorten formaten. Van CSV tot JSON en van XML tot RDF. Het belangrijkste is dat je kijkt naar welke doelgroep je wil/kunt bereiken met het beschikbaar stellen van de data. Grofweg kun je de volgende indeling maken in persona’s wie je kan bereiken:
4. Niveaus van datasets
Waar we eerder zijn ingegaan op het wettelijk kader en vooral waarom en voor wie stel ik data ter beschikking, gaan we in deze stap verder in op het niveau van de data die je publiceert. Om open data namelijk te publiceren zijn er diverse gradaties van datasets denkbaar. Je geeft d.m.v. het niveau van een dataset meer informatie mee over je dataset en de kwaliteit hiervan. Hiermee introduceren we het vier traps raket voor wat betreft het publiceren van open data. Dit luidt als volgt:
Trap 1: Open data
Trap 2: Open data en High Value data
Trap 3: Open data en Referentiedata
Trap 4: Open data, High Value data en Referentiedata
Per trap leggen we uiteen wat het begrip inhoudt en waar je aan moet voldoen betreffende het niveau van de dataset.
4.1 Trap 1: Open data
In de basis kun je als organisatie de data beschikbaar stellen als open data. Om je data ter beschikking te stellen moet je minimaal aan de volgende harde eisen hebben voldaan, tevens geven we ook een aantal wensen mee:
Metadata (harde eis)
Metadata beschrijft "data over data" en bevat onder andere informatie over de structuur van de data, de betekenis van de data en de geldigheid van de data.
De structuur van data moet goed beschreven zijn zodat een gebruiker de data op een goede manier kan interpreteren en gebruiken in een toepassing. Een goede beschrijving kan verkeerd gebruik voorkomen.
De data moet goed gevonden kunnen worden. De factoren die de vindbaarheid van de data vergroten zijn vastgelegd in een metadatamodel DCAT. DCAT is een Europese standaard voor het delen en vindbaar maken van Open Data. Deze standaard maakt het mogelijk dat de data die is opgenomen in data.overheid.nl ook gesynchroniseerd kan worden met het Europees dataportaal.
De manier waarop de data beschikbaar is of hoe de data kan worden gebruikt dient als onderdeel van de metadata te worden beschreven.
Beveiliging van gegevens (wettelijke harde eisen)
Open Data dient toegankelijk te zijn. Beveiliging is vooral van toepassing op het niet kunnen wijzigen van bron gegevens door derden. In het geval van gegevens die tot een herleiding van persoonsgegevens kunnen leiden is ook een afdoende toegangsbescherming van de data noodzakelijk.
Bij de beveiliging van gegevens is de baseline informatiebeveiliging van toepassing. Over de juridische check of iets beschikbaar mag komen als open data komen we in hoofdstuk 5 nog op terug.
Datahosting (harde eis)
Om open data goed te kunnen beheren is een directe maar wel goed beveiligde toegang tot de server waar de data op is geplaatst noodzakelijk. Het uitvoeren van updates en toevoegen van nieuwe bestanden moeten door de eigen organisatie kunnen worden uitgevoerd.
Infrastructuur met een hoge beschikbaarheid en bandbreedte. Open datasets dienen in hoge mate beschikbaar te zijn omdat deze meer gebruikt worden. Dat betekent dat er voor het downloaden van bestanden voldoende bandbreedte beschikbaar moet zijn en dient de performance van de systemen hoog genoeg te zijn om grotere aantallen bevragingen van de API’s af te kunnen handelen.
De data moet openbaar toegankelijk zijn, maar niet kunnen worden veranderd of gewist op de server. Hiertoe dient de server afdoende beveiligd te worden.
Standaarden (harde eis)
Open data wordt ontsloten met open standaarden. Open standaarden nemen belangrijke beperkingen in gebruik weg. In hoofdstuk drie wordt het onderwerp standaarden nader besproken.
Financiering (wens)
De financiering van open data moet gegarandeerd zijn. Het gaat dan specifiek om de kosten voor datavoorbereiding voor publicatie en de kosten voor publicatie. De kosten voor het verzamelen en bewerken van de data in het primaire proces zijn reeds gefinancierd vanuit het primaire proces.
Kosten ten aanzien van datavoorbereiding. De meeste open data kan worden ontsloten “as-is” dan hoeft er geen bewerking voor publicatie plaats te vinden. Toch kan in een aantal gevallen het noodzakelijk zijn om een handeling te verrichten voor publicatie. Bijvoorbeeld een anonimiseringsbewerking, of het omzetten naar een open formaat. Afhankelijk van de publicatie termijnen kunnen deze bewerkingen geautomatiseerd worden. Als de data eenmalig per jaar wordt verzameld dan kan het prima werken via een handmatige omzetting. Is er sprake van een hogere frequentie kan worden besloten de omzetting te automatiseren.
Feedback op kwaliteit van de data (wens)
De kwaliteit van open data neemt toe op basis van terugmeldingen. Bij de beschikbaarstelling van open datasets dienen emailadressen of webformulieren gepubliceerd te worden om deze feedback te kunnen geven. Vervolgens moet deze feedback verwerkt worden waarbij in ieder geval de melder geïnformeerd wordt over de vervolgstappen. Om te komen tot een goede afhandeling van de feedback dient deze procedure beschreven te zijn.
In samenhang ontsluiten (wens)
Open datasets worden in samenhang gestandaardiseerd ontsloten als er meerdere databronnen zijn.
Preview/visualisatie (wens)
Om inzicht te geven in open datasets is het zinvol om een preview van de data te geven. Op basis van deze preview wordt sneller inzichtelijk hoe de data ingezet kan worden voor andere doelen.
Data agenda (wens)
Via een ontwikkelingsagenda worden events rond de data gepubliceerd. Nieuwe versies van de dataset, verstoringen in de beschikbaarstelling van de data, eventuele nieuwe standaarden. Door wijzigingen tijdig te delen kunnen gebruikers optimaal anticiperen op deze wijzigingen.
Wanneer je als organisatie minimaal aan de harde eisen hebt voldaan is de data geschikt om mogelijk te gaan publiceren.
4.2 Trap 2: Open data en High Value data
Een stapje verder dan alleen open data is dat je je dataset als High Value dataset kan meegeven. Met het begrip High Value wordt bedoeld dat de data grote waarde heeft voor (her)gebruikers. Maar hoe wordt nou bepaald wat van grote waarde is of niet? Vanuit het portaal hanteren we onderstaande criteria om te bepalen of iets high value is of niet. Tevens gaan we in op een stappenplan om high value data te kunnen ontsluiten. Allereerst gaan we in op verschillende niveaus van High Value.
High Value data kan op lokaal, regionaal en landelijk niveau worden vastgesteld. Iets kan immers lokaal of voor een bepaalde regio ontzettend waardevol zijn, maar landelijk want minder. Vandaar dat deze drie niveaus worden gehanteerd. Dit kun je meegeven aan je dataset. Tevens kan een dataset in deze tijd high value zijn, maar wellicht over twee jaar een stuk minder. Met de invoering van een aantal criteria kan de toets of een dataset High Value is worden gedaan.
Algemeen uitgangspunt: de overheidsorganisatie die over de high value data beschikt en de maatschappij vinden beiden de waarde van de dataset hoog.
Voer een waardetoets uit (harde eis)
Ga in gesprek met communities alwaar de data gebruikt zou kunnen worden. Benader deze communities vanuit het startpunt van de maatschappelijke vraag.
Besluit op basis van deze analyse of de data als high value dataset aangemerkt zal gaan worden.
Monitor hergebruik (harde eis)
Om de valuecase van high value data doorlopend inzichtelijk te kunnen maken is een goed inzicht in het gebruik van belang. Dit kan door hergebruikers vrijwillig te vragen naar de resultaten van het gebruik en door het monitoren van downloads van de data.
Good practices (harde eis)
Laat zien hoe de high value data wordt toegepast. Inzicht in deze toepassingen rechtvaardigt de zorg en kosten die gemoeid zijn met het beheren van high value datasets en geven een inzicht in de valuecase van de high value dataset. Tevens kunnen de voorbeelden anderen inspireren om toepassingen te ontwikkelen.
Community management (wens)
High value data heeft grote waarde voor gebruikers en hergebruikers. Het is dan ook van belang voor gebruikers en hergebruikers om op een laagdrempelige manier in contact te kunnen komen met de organisatie die de data beschikbaar stelt. Een community manager kan zorg dragen voor het behartigen van de belangen van gebruikers en hergebruikers en zorgen voor een goede aansluiting van de data op wensen en verwachtingen van gebruikers en hergebruikers. Als onderdeel van deze community management kunnen nieuwsbrieven verstuurd worden met serviceberichten of kan gebruik gemaakt worden van een portaal om hergebruikers en gebruikers van de high value data met elkaar in contact te brengen.
De drie maanden toets (eis)
Bij het openen van een dataset kun je niet altijd vaststellen dat het een dataset met hoge waarde is. Wanneer je vanuit je organisatie zelf het idee hebt dat het high value is, dan kun je direct dat aan je dataset toevoegen. Echter na drie maanden volgt een toets aan de hand van bovenstaande criteria. Indien de dataset niet high value blijkt te zijn, dan gaat de dataset naar het niveau van trap één. Blijkt er dus een hoge waarde in te zitten, dan krijg de dataset het keurmerk high value.
Om je te helpen bij het identificatieproces zetten we het volgende stappenplan voor je op een rijtje:
Overzicht en stappenplan
Onderzoek bestaande high value dataset lijsten
Op een aantal niveaus zijn er al high value datasets verzameld in lijsten. Onderzoek deze lijsten.
Selecteer datasets die verzameld worden binnen de eigen organisatie
Maak op basis van de lijsten een shortlist van potentiële high value datasets
Analyseer of de dataset door stakeholders als waardevol gezien wordt
Onderzoek op basis van desk research en gesprekken met stakeholders of de data gekenmerkt wordt als high value door de stakeholders
Stel een value case op voor de dataset
Maak een analyse van de potentiële waarde die deze data heeft voor stakeholders en de eigen organisatie
Uitgangspunten gebruik Open Data
Ontsluit de data conform de uitgangspunten Open Data
Pas datamanagement toe
Stel de high value beschikbaar zo veel als mogelijk in lijn met de voorgestelde adviezen met betrekking tot datamanagement
Identificeer high value datasets op basis van vraagstukken
High value datasets hebben grote waarde, deze waarde kan maatschappelijk, economische of democratisch zijn. Het uitdrukken van deze waarde is niet altijd eenvoudig en moeilijk om absoluut te maken. Om toch keuzes te maken worden in dit stappenplan een handreiking gedaan om te komen tot een keuze.
Stappenplan
Onderzoek welke urgentie dit vraagstuk heeft in de maatschappij
High value speelt niet alleen voor de eigen organisatie, het gaat om vraagstukken die zowel voor de organisatie als de maatschappij van belang zijn. Daarom is het noodzakelijk om in een dialoog te toetsen of het vraagstuk ook in de maatschappij weerklank vindt. Nodig stakeholders op het vraagstuk uit en inventariseer de behoefte die er is.
Indien de waarde van het vraagstuk het accent heeft op economische waarde ga het gesprek aan met bedrijven die hier potentieel in geïnteresseerd zijn.
Ga het gesprek aan met de eigen organisatie en inventariseer vraagstukken
Het identificeren van high value datasets begint met het onderzoeken van een vraagstuk waar deze data een rol in speelt. Het begint dus met het identificeren van vraagstukken die urgentie hebben binnen de organisatie.
Inventariseer de data die te maken heeft met dit vraagstuk
Als het vraagstuk duidelijk is onderzoek dan de data die aan het vraagstuk gerelateerd is en beoordeel of deze data als high value data beschikbaar gesteld kan worden.
Value case/business case
Beoordeel de waarde van mogelijke oplossingen voor het vraagstuk en hoe deze waarde mogelijk wordt op basis van het beschikbaar stellen van high value data.
Uitgangspunten Open Data
Ontsluit de data conform de uitgangspunten Open Data
Pas datamanagement toe
Stel de high value data beschikbaar zo veel als mogelijk in lijn met de voorgestelde adviezen met betrekking tot datamanagement.
Wie deze criteria en stappen volgt komt uiteindelijk tot de conclusie of je data daadwerkelijk High Value is of niet. Daarnaast kun je altijd contact opnemen met het datamanagement team van data.overheid.nl via data@koop.overheid.nl.
4.3 Trap 3: Open data en Referentiedata
In trap drie komen we terecht bij je open data aanbieden als referentiedata. Overheidsorganisaties in Nederland stellen inmiddels diverse datasets beschikbaar als open data. Binnen de overheid zijn er datasets die essentieel zijn voor het bevorderen van gebruik van data van de overheid. Deze datasets vormen zogenoemde ‘ankerpunten’ voor het gebruik van data. Deze datasets worden dan ook wel referentiedatasets genoemd. Deze datasets worden vrij beschikbaar gesteld om te gebruiken. Gebleken is dat gebruikers een aantal datasets veel gebruiken als “referentie”. Met een referentie wordt vaak een verwijzing bedoeld naar een bron die meer informatie kan verschaffen over een bepaalde situatie of bewering. Referentiegegevens zijn over het algemeen uniform met doorgaans weinig mutaties en kunnen bestaan uit waarden of statussen.
De lijsten met inwonersaantallen, indexcijfers van CBS, vastgoed dashboard van het Kadaster of overheidsorganisaties vanuit KOOP zijn voorbeelden van dit soort referentiegegevens. De referentiedatasets worden prominent ontsloten op data.overheid.nl. De gebruiker kan via deze wijze beter worden ondersteund in het gebruik en toepassen van overheidsdata. Een stimulans voor gebruik wordt hiermee beoogd.
Mocht je als overheidsorganisaties een dataset hebben die vaak wordt gebruikt om aan te refereren, dan kun je het vinkje van trap drie aanzetten om deze dataset nog prominenter onder de aandacht te brengen.
4.4 Trap 4: Open data, High Value data en Referentiedata
Tot slot de laatste trap in aantal niveaus van datasets. Dit is namelijk de trap waarin trap één, twee en drie samen komen. Als je kan aantonen dat je aan de eisen van trap één, twee en drie voldoet dan is de dataset echt van uitmuntend niveau. In dat geval kun je bij alle niveaus labelen dat het high value en referentiedata is. Gebruik hiervoor de stappen uit trap één, twee en drie om dit aan te tonen.
5. Juridische Check
Voordat de data beschikbaar kan komen als open data dien je echter eerst nog een juridische check uit te voeren. Als duidelijk is welke data mogelijk gepubliceerd kan worden, moet uiteraard gecontroleerd worden of het open stellen daarvan niet in strijd is met enige rechtsregel. Hiervoor kun je een juridische check uitvoeren. Het nemen van deze stap is van groot belang omdat het vrijgeven van datasets in strijd met enige rechtsregel tot aansprakelijkheid kan leiden en daarnaast (ook) tot veel negatieve publiciteit. Met andere woorden: vergeet deze check vooral niet en doe hem grondig! Uiteraard is het raadzaam ook de afdeling juridische zaken bij deze exercitie te betrekken. Deze check bestaat uit vier stappen die we hieronder nader toelichten.
5.1 Check de openbaarheid
De hoofdregel in Nederland is dat overheidsinformatie openbaar is, tenzij een wettelijke regel anders bepaalt. Die uitzonderingen op de hoofdregel zijn opgenomen in de Wet openbaarheid van bestuur of andere bijzondere regelingen. Het is dus zaak om van te voren goed te controleren of er geen uitzondering geldt voor de geselecteerde datasets. Als data niet openbaar is, mag deze ook niet in hergebruik gegeven worden. Aan de hand van een aantal hierna weergegeven stappen kan bepaald worden of de data openbaar is.
Welke openbaarheidsregeling is van toepassing?
Om de toepasselijkheid van de openbaarheidsregeling vast te kunnen stellen, moeten we eerst bepalen:
gaat het om bestuursorganen?
gaat het om bestuurlijke informatie?
berust deze bij het bestuursorgaan?
is de gevraagde informatie neergelegd in documenten/data?
is de toepasselijkheid van de Wob uitgezonderd?
Is de informatie openbaar?
Als we vastgesteld hebben dat het gaat om informatie waarop de Wob van toepassing is, dan is de hoofdregel - in lijn met de Open Data-filosofie en de Nederlandse beleidsambities - dat de informatie openbaar is en vrijgegeven moet worden voor hergebruik. Echter, de Wob kent een aantal uitzonderingen: soorten bestuurlijke informatie die niet openbaar zijn. Uiteraard moet een overheidsorganisatie deze uitzonderingen toetsen. Is een uitzondering van toepassing dan mag de informatie niet vrijgegeven worden voor hergebruik. Bij de beoordeling of bestuurlijke informatie openbaar gemaakt mag worden moet het bestuursorgaan nagaan of de verstrekking niet indruist tegen de in de Wob expliciet genoemde belangen. Deze zijn vastgelegd in artikel 10 en 11 van de Wob en vallen uiteen in twee soorten de absolute weigeringsgronden en relatieve weigeringsgronden.
Absolute weigeringsgronden
Bij absolute weigeringsgronden blijft informatieverstrekking te allen tijde achterwege. Dit is het geval indien de verstrekking van de informatie:
een bedreiging zou kunnen vormen voor de eenheid van de Kroon
de veiligheid van de Staat zou kunnen schaden
indien het bedrijfs- en fabricagegegevens betreft die vertrouwelijk aan de overheid zijn medegedeeld
indien het bijzondere persoonsgegevens betreft
Relatieve uitzonderingsgronden
Bij relatieve weigeringsgronden heeft het bestuursorgaan een discretionaire bevoegdheid. Het moet een afweging maken tussen het algemene abstracte belang van openbaarheid en de belangen genoemd in artikel 10, tweede lid, van de Wob. Het betreft hier:
internationale betrekkingen
economische of financiële belangen van de overheid
de opsporing en vervolging van strafbare feiten
inspectie controle en toezicht door bestuursorganen
eerbiediging van de persoonlijke levenssfeer
het belang dat een geadresseerde erbij heeft als eerste kennis te kunnen nemen van informatie
het voorkomen van onevenredige bevoordeling of benadeling van de betrokkenen
Aanwezigheid van persoonsgegevens
De aanwezigheid van persoonsgegevens is een hele belangrijke als het gaat om data te publiceren als open data. Immers, overheden verzamelen bij de uitoefening van hun taken vaak massaal gegevens over personen. De hoofdregel van de Wob in samenhang met de AVG is dat deze gegevens niet voor hergebruik in aanmerking komen.
Stel jezelf altijd de volgende vragen bij de vraag of de data persoonsgegevens bevat:
Wat is het grote belang van zorgvuldige toetsing?
Wat zijn de regelingen in de Wob en de AVG?
Wat is het begrip 'persoonsgegeven'?
Wat als de privacywetgeving van toepassing is?
Hoe te handelen?
Wat als er toch wat mis is gegaan?
5.2 Check de rechten van derden
(Rechten op) data zijn over het algemeen van iemand (een overheidsorganisatie of een niet (Rechten op) data zijn over het algemeen van iemand (een overheidsorganisatie of een niet overheidsorganisatie (bijvoorbeeld een bedrijf)). Meestal nemen die de vorm van auteurs- en databankrechten, geregeld in de Auteurswet, respectievelijk de Databankenwet. Uiteraard moet je wel over de (rechten op de) data kunnen beschikken, anders geeft je iets in hergebruik dat niet van jou is en maak je inbreuk op de rechten van deze derden.
Als het gaat om mogelijke rechten van collega overheidsorganisaties, dan zijn daarvoor enkele bijzondere regels die afwijken van het bovenstaande. Kort gezegd houdt die regeling in dat als een overheidsorganisatie bij de publicatie van de informatie niet heeft aangegeven dat zij haar rechten wil voorbehouden, die informatie vrij is van rechten en dus gewoon als Open Data vrijgegeven kan worden.
Niettemin, als je data ter beschikking wil stellen voor hergebruik volgens de Open Data filosofie doe je er dus goed aan bij de aanmaak c.q. verwerving van de data zeker te stellen dat er geen rechten van derden op rusten. Mochten er derden aan te pas komen, dan kan dit door (standaard) inkoopvoorwaarden te hanteren die bepalen dat alle mogelijke rechten die ontstaan in het kader van de inkoop eigendom worden van de inkopende overheid. De huidige standaard voorwaarden van inkoop voor de centrale overheid bevatten een dergelijk beding. Als laatste slot op de deur doet men er uiteraard goed aan op het moment van vrijgeven voor hergebruik nog een controle uit te voeren op dit aspect.
5.3 Check marktverstoring
In het geval er marktpartijen zijn die zelf vergelijkbare data sets produceren en verkopen, dan moet je oppassen dat je deze marktpartijen geen oneerlijke concurrentie aandoet doordat je de data, in lijn met het Open Data gedachtegoed, gratis en voor niets ter beschikking stelt.
Volgens de Open Data filosofie moet overheidsinformatie weliswaar as is maar wel gratis en voor niets, althans tegen maximaal de verstrekkingskosten en verder ongeclausuleerd, ter beschikking worden gesteld voor hergebruik aan een ieder. Als er evenwel een markt bestaat waarop deze of gelijksoortige informatie door marktpartijen verhandeld wordt, betekent dit dat er voor afnemers op die markt een zeer goedkoop of zelfs gratis alternatief beschikbaar komt, waardoor klanten van die marktpartijen kunnen weglopen. Het is daarom denkbaar dat een overheidsorgaan aansprakelijk wordt gesteld door een marktpartij die betoogt dat het uitvoeren van het Open Data beleid onrechtmatig jegens hem is, omdat de condities waartegen de overheid de data ter beschikking stelt hem onrechtmatige concurrentie aandoen.
Recent is op gebied veel beweging geweest: er is nieuwe wetgeving gekomen en daarnaast heeft de rechter in een tweetal zeer duidelijke uitspraken gedaan (https://linkeddata.overheid.nl/front/portal/document-viewer?ext-id=ECLI:NL:GHDHA:2014:3702 en https://uitspraken.rechtspraak.nl/inziendocument?id=ECLI:NL:RBDHA:2019:3623). De geruststellende conclusie hieruit is dat een overheid die aan Open Data gaat doen zich niet snel aan concurrentievervalsing schuldig zal maken.
5.4 Adresseer de verwachtingen
De datasets die je open stelt zijn verzameld in het kader van de uitoefening van de publieke taak. Nu kan er uiteraard daarbij het een en ander misgaan waardoor de inhoud van de data sets niet correspondeert met de werkelijkheid. Op zich is dit geen reden om de datasets niet te publiceren, maar het is wel van belang de verwachtingen van de gebruikers te adresseren. Er rust immers wel een zorgplicht op de overheid om gebruikers te informeren over de data en ze te waarschuwen dat er mogelijkerwijs gebreken in de informatie zouden kunnen zitten.
Je doet er daarom goed aan op twee manieren de gebruikers voor te lichten over hetgeen ze wel en niet mogen verwachten van de data, en wel door een basislaag van meta-informatie toe te voegen en door een proclaimer op te nemen.
Een basislaag van meta-informatie
De overheid die data in hergebruik wil geven doet er allereerst goed aan een basislaag van metadata toe te voegen, hetgeen de hergebruiker in staat stelt de context van de data beter te begrijpen en eventuele gebreken gemakkelijk zelf kan constateren. Deze basislaag staat ook wel bekend als de DCAT standaard. Meer informatie over deze DCAT standaard is hier aan te treffen.
Disclaimers en proclaimers
Diverse overheden pogen mogelijke aansprakelijkheid uit te sluiten door het gebruik van disclaimers. De vraag is wel of deze zogenaamde exoneratie altijd houdt. Zeker als de overheid de enige bron is waar de informatie opgehaald kan worden en helemaal als het hebben van de informatie noodzakelijk is voor de deelname aan het rechtsverkeer, is de houdbaarheid minder waarschijnlijk. Daarbij valt bijvoorbeeld te denken aan informatie uit de basisregistraties die geacht worden de juiste gegevens te bevatten en waarvoor ook een 'gebruikverplichting' bestaat binnen de overheid.
Indachtig het Open Data gedachtegoed is er wel veel meer te zeggen voor het geldig kunnen hanteren van mededeling waarin wordt uitgelegd wat een her-gebruiker wel mag verwachten van de data. Deze zogenaamde proclaimers zijn in toenemende mate populair, ook in overheidsland, en komen uiteraard ook weer in vele soorten en maten, zie bijvoorbeeld die van de provincie Brabant, de gemeente Zwolle en het RIVM. Het onderscheid tussen de disclaimer en de proclaimer zit met name in de aard: waar de disclaimer gelijk stevig alle aansprakelijkheid afwijst, is de proclaimer veel vriendelijker van toon en beoogt het de gebruiker te informeren over de inhoud van de informatie en tegelijkertijd ook diens verwachtingen te managen.
De houdbaarheid van een proclaimer bij het openstellen van data voor hergebruik zal nog toenemen als deze specifiek gericht is op de dataset in kwestie, en dus geen algemene verklaring is. Uiteraard kan de verklaring getrapt zijn: er is een algemene proclaimer die geldt voor alle data die beschikbaar zijn voor hergebruik en per dataset is er één die verwijst naar de basislaag van metadata in de individuele datasets. In die metadata kan dan aangeven worden in welke context de data verzameld zijn, zodat de hergebruiker zijn bedachtzaamheid op gebreken daarop kan baseren.
De data wordt bij voorkeur onder een CC0 of publiek domein verklaring beschikbaar gesteld. Dit geeft voldoende waarborg voor hergebruik zonder beperkingen. Eventueel kan indien gewenst een CC-By licentie waarin de hergebruiker wordt verplicht de bronhouder van de data te vermelden. In het geval van CC-By moet worden aangegeven hoe de te gebruiken naam van de bronhouder moet worden beschreven.
Wat als er toch wat mis gaat?
Mocht een hergebruiker niettemin menen dat hem onrecht is aangedaan doordat de overheid hem (beweerdelijk onjuiste) data zijn verstrekt dan zal hij een zogenaamde onrechtmatige daadactie kunnen instellen bij de rechter. Dit is geregeld in artikel 162 van Boek 6 van het Burgerlijk Wetboek. Hij zal dan betogen dat de overheid aansprakelijk is voor gebrekkige open data.
6. Maak zelf gebruik van de data
Zodra je weet of de data definitief open ter beschikking hebt gesteld. Maak dan ook vooral zelf gebruik van de data. Gebleken is dat door ook zelf met de gepubliceerde open data te werken de kwaliteit van de data beter wordt, omdat je ondanks vele inspanningen tegen onvolkomenheden aanloopt. Door zelf met de data aan de slag te gaan, ontdek je ook dat de koppelbaarheid van de data eenvoudiger wordt als er gewerkt wordt met standaarden en bestaande classificaties of dat er aangegeven is hoe de data aansluit bij andere standaarden en classificaties.
6.1 Best practices
Uiteraard hoef je het wiel niet zelf uit te vinden. Vandaar dat we je graag een aantal best practices voorschotelen om te kijken hoe andere overheidsorganisaties het hebben gedaan.
Centraal Bureau voor de Statistiek
Een classificatie is de indeling van organismen in hoofdgroepen naar de structuur van hun lichamen, waarbij de volgende hiërarchische onderverdeling wordt aangehouden. Het CBS gebruikt in de statistieken veel internationale classificaties met als doel om classificaties zo veel als mogelijk op elkaar aan te laten sluiten. Veel gebruikte classificaties van het CBS zijn onder andere de indelingen naar bedrijfsactiviteiten via de standaard bedrijven indeling (SBI) en de gemeentelijke indelingen per jaar. De classificaties die CBS gebuikt zijn te vinden via https://www.cbs.nl/nl-nl/onzediensten/methoden/classificaties
Kadaster
Kadaster werkt met geo-informatie. Deze geo-informatie is vindbaar via het dataplatform PDOK (https://www.pdok.nl/). Veelal worden open datasets van het Kadaster aangeboden in diverse formaten om de hergebruiker optimaal te bedienen. Daarnaast beheert het Kadaster ook diverse geo standaarden en basisregistraties. Een gedeelte van deze basisregistraties wordt ook weer beschikbaar gesteld als open data. Via deze wijze worden veel datasets van het Kadaster ontsloten als open data.
G8 Open Data Charter
In de Open Data charter zijn 14 categorieën aangewezen als high value. Het gaat dan om categorieën als onderwijs, waarbij dan thema’s spelen als lijsten van scholen, prestaties van scholen en digitale vaardigheden. Of statistieken waarbij thema’s als National Statistics, Census, infrastructure, wealth en skills worden benoemd. In de G8 Open Data charter zijn geen specifieke datasets benoemd.
Wet open overheid
Het initiatiefwetsvoorstel voor een Wet open overheid bevat een lijst met categorieën van datasets die proactief openbaar gemaakt moeten worden bij ingang van deze wet. Op dit moment is de Wet open overheid nog in behandeling. De definitieve lijst van categorieën zal later bekend worden.
Wet hergebruik van overheidsinformatie
In juni 2015 is de wet hergebruik overheidsinformatie in werking getreden. Deze wet biedt het recht om openbare overheidsinformatie in herbruikbare vorm beschikbaar te krijgen. Deze wet is in 2018 herzien. Als onderdeel van deze herziening worden High value datasetsbenoemd. De te benoemen lijst met high value datasetsis gebaseerd op de categorieën benoemd in het G8 Open Data charter. De lijst met High value datasetszal worden opgesteld in 2019 in overleg met de lidstaten op basis van een implementing act (https://ec.europa.eu/info/law/law-making-process/adopting-eulaw/implementing-and-delegated-acts_en).
Gemeentelijke en Provinciale high value datasets
Op data.overheid.nl zijn high value datalijsten inzichtelijk voor zowel Gemeenten als Provincies. Het initiatief genomen om een lijst met high value datasets op te stellen voor gemeenten en provincies. Bij het benoemen van deze lijst is uitgegaan van de gegeven definitie. De keuzes zijn gemaakt door de werkgroep high value datasets. Er is voorzien dat de samenstelling van de high value datalijst voor gemeenten en provincies up-to-date zal worden gehouden om aan te sluiten op nieuwe behoeften en ontwikkelingen. De gemeentelijke en provinciale high value datalijst heeft geen verplichtend karakter en is vooral bedoeld om gemeenten en provincies te inspireren om te beginnen met het openen van deze datasets.
Op data.overheid.nl zijn al ruim 14.000 datasets gepubliceerd door meer dan 160 overheidsorganisaties.
7. Breng de huishouding verder in kaart
Zodra je eenmaal bezig bent geweest met een aantal datasets kun je verder in het proces. We geven dan ook graag een aantal tips mee waar je rekening mee moet houden:
7.1 Breng verder in kaart wat je in huis hebt
Een manier om te weten wat je in huis heb is doen van een data-inventarisatie. Een datainventarisatie is een onderzoek waarbij in kaart gebracht wordt welke datasets door of namens de organisatie worden verwerkt. Een inventarisatie kan heel eenvoudig door het invullen van een invullijst.
Tip: noteer daarbij gelijk ook metadata kenmerken als wie de contactpersoon is, waar de data te vinden is, wat de titel van de dataset is, een omschrijving en wie de bronhouder van de dataset. Dit kan je later schelen in het proces rondom het openen van data.
Waar moet ik in mijn organisatie zoeken?
Het creëren van een lijst is niet het moeilijkste van een inventarisatie. Het echte werk zit hem in het speuren naar data. Wij geven daarbij een aantal tips, zodat je binnen je organisatie op zoek kan naar data.
Tip 1:
Kijk naar de gebruikte systemen binnen je organisatie. Binnen deze systemen zit ongetwijfeld een schat aan data.
Tip 2:
Gebruik de zogenoemde ‘follow the money’ methode. Binnen deze methode kijk je waar de geldstromen binnen de organisatie naar toe gaan. Zodra je weet waar de geldstromen in je organisatie naar toe gaan weet je ook waar de uitvoering van het beleid zit. Deze uitvoeringsonderdelen hebben binnen je organisatie ongetwijfeld een schat aan data.
Tip 3:
Dat is het aloude legaliteitsbeginsel voor overheidshandelen. Een overheid kan niet handelen zonder een wettelijke grondslag. Breng in kaart op basis van welke wettelijke grondslagen je organisatie handelt. Dit kan je helpen om te bepalen op welke terreinen je organisatie actief is. Voor de betekenis van het legaliteitsbeginsel zie http://wetten.overheid.nl/BWBR0005537/2018-08-01.
Tip 4:
Je hoeft het wiel absoluut niet opnieuw uit te vinden bij een data inventarisatie. Veel organisaties zijn al begonnen met het openen van data. Kijk naar de voorbeelden om je heen.
7.2 Infrastructuur
De techniek lijkt de grootste uitdaging bij het publiceren van data, maar in de praktijk blijkt de techniek juist veel te kunnen. Technisch zijn de uitdagingen om data te openen daarom ook minder groot dan ze lijken. Het is echter wel een kwestie van de juiste keuzes maken. Maar waar kan ik dan aan denken bij het maken van de juiste keuzes?
Een organisatie draait op diverse systemen. Uit deze systemen kan er data worden getransformeerd om uiteindelijk ter beschikking te worden gesteld. De systemen bevatten vaak de ingrediënten om rapportages en bruikbare data van te maken. Een mogelijkheid om wel de juiste data en rapportages te vergaren is de inrichting van een datawarehouse. Binnen deze constructie wordt in een speciale database alle gegevens verzameld, op geslagen en up-to-date gehouden. Een datawarehouse is de mogelijkheid om data naar buiten te pushen, maar biedt ook de mogelijkheid voor interne trends en analyses (https://computerworld.nl/business-intelligence/61874-wat-is-datawarehousing). Het inrichten van een datawarehouse is een mogelijkheid om meer grip op data te krijgen. Uiteraard is het ook mogelijk om direct uit de eigen interne systemen te transformeren.
Welke methode je kiest, als je data wil publiceren moet je kiezen voor de vorm hoe data kan worden gepubliceerd. In Europa gebruikt men CKAN als open source software om een datacatalogus in te richten. CKAN is een open sourcemodel voor zowel dataopslag als distributie. Data die je ter beschikking stelt kan via dat portaal ter beschikking worden gesteld. Er zijn diverse soorten CKAN modules die je hierbij kunnen helpen. CKAN wordt in Europa en op data.overheid.nl gebruikt, maar dit betekent niet dat dit de enige software is die kan worden gebruikt.
Tot slot geven we mee, als je data ter beschikking stelt, denk dan ook na over de toedracht van de data. Data real time ter beschikking stellen (indien dit kan) geeft zeker een boost. Een dataset via een API benaderen ook.
7.3 Hoe wil ik mijn data publiceren?
Het kanaal waarin data wordt gepubliceerd hangt uiteraard nauw samen met de techniek. We geven graag een aantal tips bij het publiceren van data.
Tip 1:
Denk goed na over het kanaal waarop je je data wil publiceren. Met visualisatie en presentatie kun je als organisatie veel doen. Er zijn diverse soorten en maten van dataportalen waar je een voorbeeld aan kunt nemen. Zolang je de data maar aanmeldt op data.overheid.nl en zolang de ruwe data maar beschikbaar is voor hergebruik.
Tip 2:
Er kunnen nu eenmaal fouten zitten in de data. Zorg daarom voor een goede feedbackmechanisme waar gebruikers van data fouten kunnen melden en dat dit wordt opgepakt. Hierdoor verbetert de datakwaliteit en stel je de interactie met gebruikers voorop. Mogelijk kun je een disclaimer opstellen bij het publiceren van data.
Tip 3:
In je proces moet je ook al het archiveren van data meenemen. Data-archivering is het proces rondom het verplaatsen van gegevens die niet meer actief gebruikt worden naar een apart opslag apparaat om die data zo lang te kunnen bewaren. Data-archieven bestaan uit oudere gegevens die is nog steeds belangrijk en noodzakelijk zijn voor de toekomst, alsmede gegevens die moeten worden bewaard voor de naleving van regelgeving (https://www.marqit.nl/wat-is-data-archivering). Zorg ervoor dat je je data archief op orde hebt en ook makkelijk kan terughalen indien dit nodig is.
7.4 Hoe maak ik mijn data duurzaam?
Als het hele proces doorlopen is, is het van groot belang om de stap: ‘maak het duurzaam’ te nemen. Dit betekent dat de processen geborgd worden in allerlei opzichten. Hieronder een aantal belangrijke tips om rekening mee te houden.
Zorg voor continuïteit & updates datasets
Voor de hergebruiker is één van de belangrijkste voorwaarden dat de dataset continu beschikbaar is en de updates zoals in de metadata aangegeven, ook daadwerkelijk worden doorgevoerd. De hergebruiker moet kunnen vertrouwen op de actualiteit en beschikbaarheid van de data, zodat een eventuele toepassing die gebruik maakt van deze data niet waardeloos wordt door het gebrek hieraan.
Kwaliteit van (meta)data
Een hergebruiker van open data moet kunnen vertrouwen op de kwaliteit van de aangeboden (meta)data. Als de data niet klopt, linkjes niet werken of onderdelen gemist worden vormt dit een obstakel voor hergebruik, of kan dit verkeerde uitkomsten/conclusies opleveren. Stelregel hierbij is: kwaliteit gaat voor kwantiteit.
Houdt contact met hergebruiker
De hergebruiker van data kan het beste aangeven waar tegen aangelopen wordt en of de data ook daadwerkelijk hergebruikt kan worden. Door met hen in gesprek te gaan en te blijven, krijg je continu feedback, waardoor de dienstverlening optimaal zal zijn. Daarnaast is het ook motiverend om als data-aanbieder te zien hoe de data op een waardevolle manier wordt hergebruikt.
Biedt een dataverzoek/feedback optie aan
Door een dataverzoek- en feedbackfunctie aan te bieden, kan de hergebruiker gemakkelijk aangeven wat de datawens is, of welke problemen worden ervaren met een dataset. Dit vereenvoudigd de interactie en is een handig hulpmiddel om het datamanagement goed uit te voeren.
Maak iemand verantwoordelijk voor het datamanagement
Om open data duurzaam te maken en alle genoemde onderdelen goed te managen, is het aanstellen van een verantwoordelijke voor het uitvoeren van datamanagement belangrijk. Monitoren van de datakwaliteit en beschikbaarheid, behandelen van dataverzoeken, feedback en het contact houden met (her)gebruikers, zijn taken die vragen om structureel datamanagement.
Linked data
Het semantische web is een web van veel gegevens. Een aantal van deze gegevens lenen zich met haar eigenschappen voor omgeving waar applicaties die gegevens makkelijk kunnen opvragen en verwerken. Om dit web goed te laten functioneren is het van belang om deze gegevens (data) via een gestandaardiseerd en bereikbaar formaat ter beschikking te stellen. Op die manier kan een relatie tussen gegevens worden gelegd en is dit de basis voor Linked Data. Hiervoor moeten technologieën voor handen zijn op basis van gestandaardiseerd formaat. Een voorbeeld van Linked data techniek is door middel van miljoenen hyperlinks snel inzicht kan worden verkregen in de verbanden tussen Nationaal en Europese wetgeving (http://linkeddata.overheid.nl/front/portal/lido). Tevens wordt dit verrijkt met gerechtelijke uitspraken, parlementaire documenten en officiële bekendmakingen. Door deze techniek worden diverse relaties gelegd in het web aan gegevens.
8. Wat levert het data delen ons op?
Tot slot gaan we in deze handreiking dieper in op wat het data delen ons oplevert. Prins Constantijn van Oranje heeft een oproep gedaan aan overheidsorganisaties om het concept van open data te omarmen: “Met open data geef je anderen de kans om mee te ondernemen en hun eigen ruimte vorm te geven” (https://www.opendata-award.nl/actueel/nieuws/2017/juni-2017/29-juni-2017/constantijn-van-oranje-over-open-data). Het belang van open data wordt wel degelijk onderkend. Maar hoe delen we die data en wat levert het ons op? Op deze vraagstukken gaat data.overheid.nl in.
Al decennia lang kent Nederland wetgeving op het gebied van transparantie over zaken gaande binnen de overheid. Zo kennen we de Wet openbaarheid van bestuur (Wob) die de mogelijkheid biedt tot inzage in overheidsinformatie. Door deze wijze van transparantie kan er een actieve controle plaatsvinden op de legitimiteit van overheidshandelen. De laatste jaren is er in toenemende mate aandacht gekomen voor het openen van data binnen de overheid. Dit is onder andere afkomstig door andere wetgeving die is aangenomen: Wet Hergebruik Overheidsinformatie (WHO). Deze wet vormt een implementatie van de herziening van de Europese richtlijn rondom overheidsinformatie. De gedachte achter deze wet en richtlijn is dat de overheid een enorm belangrijke grondstof door digitale informatieproducten bezit, namelijk data. Het is goed om te zien dat sinds de invoering van deze wet meer en meer overheidsorganisaties open data initiatieven ontplooien. De organisaties stellen actief data beschikbaar voor hergebruik door derden. Het kabinet zet daarom al enkele jaren in op het actief beschikbaar stellen van data door de overheid. Een behoorlijke omslag binnen het denken en handelen van de overheid. Het beschikbaar stellen van data vordert anno 2018, maar het kan altijd beter. Zoals Eurocommissaris Neelie Smit Kroes in 2011 al aankondigde is open data een goudmijn, waarin data meer waard wordt door het delen en weggeven. Open data wordt hiermee de grondstof voor tal van nieuwe informatieproducten en - diensten (https://www.binnenlandsbestuur.nl/digitaal/nieuws/kroes-open-data-is-een-goudmijn.3097230.lynkx) .
Gelet op bovenstaande gronden zien we het aantal open datasets groeien en ook het aantal overheidsorganisaties dat data ter beschikking stelt. Tegelijkertijd kan er worden opgemerkt dat er ook nog voldoende overheidsorganisaties zijn die niet tot nauwelijks data delen. Voordat we dieper ingaan op het hoe van data delen, gaan we verder in op de drijfveren waarom we data delen.
Er zijn circa vier factoren te onderscheiden waarom we data delen (https://kennisopenbaarbestuur.nl/media/23577/de-waarde-van-open-data.pdf):
8.1 Economisch
Door data voor hergebruik beschikbaar te stellen kunnen overheidsorganisaties innovatie en nieuwe bedrijvigheid stimuleren (https://www.rijksoverheid.nl/documenten/rapporten/2017/03/20/rapport-maatschappelijke-kosten-batenanalyses-open-data). Het biedt mensen, ondernemers, bedrijven en andere geïnteresseerden in data de kans om data te gebruiken voor de organisatie. Mensen kunnen op een innovatieve manier gebruik maken van data en hierdoor kunnen nieuwe applicaties worden ontsloten. Wanneer meer data volgens (open) standaarden ontsloten worden, kunnen andere overheidspartijen deze data ook eenvoudiger hergebruiken. De interoperabiliteit van de overheid wordt hierdoor vergroot.
8.2 Legitimiteit
Door data beschikbaar te maken voor een grote publiek is de overheid ook beter te controleren op de uitvoering van haar taken. Door de openheid van de overheid te vergroten wordt ook indirect de legitimiteit van de overheid vergroot. Het monopolie wat de overheid bezit aan data kan worden gedeeld met een grotere groep. Deze groep kan dit gebruiken voor economisch belang, maar ook zeker om de overheid te controleren.
8.3 Betere dienstverlening burgers en bedrijven
Toepassingen kunnen ook door de overheid zelf worden ontwikkeld. Door het ontsluiten van open data kunnen daarmee burgers en bedrijven beter en efficiënter worden geholpen (https://nieuws.tpo.nl/2013/09/18/open-data-is-een-flinke-impuls-voor-lokale-participatie/). Voor een ieder kan dit zowel een besparing in tijd als in geld opleveren.
8.4 Verbetering eigen datakwaliteit
Doordat een overheidsorganisatie als het ware gedwongen wordt om data beschikbaar te stellen, betekent dit dat ook derden naar de data kijken en beoordelen. Met behulp van diverse feedbackmechanismen kunnen derden input geven op de kwaliteit van de data. Op die manier vindt een extra externe controle plaats en kan de kwaliteit van de data verbeteren. Verbetering van de eigen datakwaliteit kan hierdoor ook een verbetering geven aan het voeren van data-gedreven beleid.
Last updated