KU Leuven maakt onderzoeksdata publiek toegankelijk

Een stap in de richting van open science

24 februari 2022
Nieuws
Auteur(s): Sjereno Cörvers
Recentelijk lanceerde de KU Leuven een nieuw platform: RDR. Daar kunnen wetenschappers hun data openbaar maken. Dat valt binnen een bredere tendens van het democratiseren van de wetenschap.

Er is een vreemde situatie ontstaan in de wetenschap. Onderzoeken worden gedeeltelijk gefinancierd met publiek geld uit de zakken van burgers. Wil een willekeurige burger echter de resultaten van dat onderzoek inzien, dan treft hij een betaalmuur aan.

De wetenschap bedacht een oplossing: open science. We zeggen te leven in een kenniseconomie. Van groot belang voor zo'n economie is dat informatie toegankelijk is. Open science doet precies dat. 

Open science is een breed begrip. Zo is er burgerwetenschap zoals bijvoorbeeld het project Curieuze Neuzen. Of open access, dat wetenschappelijke publicaties publiek toegankelijk maakt. Open data is de derde pijler van open science. Daar valt RDR (zeg: Radar) onder. 

RDR

Open data betekent dat de data van het onderzoek gratis toegankelijk is. Roxanne Wyns, innovatiemanager aan de KU Leuven, vertelt dat die data vooralsnog geen commercieel product van wetenschappelijke tijdschriften is. 'We zijn dan ook verheugd om de data in eigen handen te hebben', klinkt het.

Zo open als mogelijk, zo gesloten als nodig

Data is breder dan je in eerste instantie zou denken: het gaat over data uit de natuurwetenschappen, maar ook uit de humane wetenschappen.

De eerste gesprekken over research data management, waar RDR ook onder valt, vonden plaats in 2014. Doordat er veel organisaties en afdelingen bij betrokken zijn duurt het lang om tot een akkoord te komen. Uiteindelijk zijn er verschillende tools, trainingen en beleid uit voortgekomen. 

Vooralsnog gaat het niet om een verplichting om data te publiceren, maar om een stimulans richting open data, en uiteindelijk open science.

Beschikbaar maar onbruikbaar 

RDR is een dataopslagplaats die voor iedereen bereikbaar is. Het adagium 'zo open als mogelijk, zo gesloten als nodig' speelt een belangrijke rol. 'De data moet binnen de wettelijke kaders zoals de privacywetgeving en intellectuele eigendomsrechten vallen en rekening houden met eventuele ethische aspecten', benadrukt Wyns. Heb je daar geen verstand van, maar wil je toch je data delen? Vrees niet, er staat een team van experten klaar om je te ondersteunen. 

Soms is er speciale software nodig om de data te kunnen inzien, of zijn er restricties verbonden aan de data

Dat data open zijn betekent niet per se dat het voor iedereen zomaar bruikbaar is. Soms is er speciale software nodig om de data te kunnen inzien, of zijn er restricties verbonden aan de data. Je kan dan bijvoorbeeld wel de data inzien, maar mag deze niet gebruiken om zelf onderzoek mee te doen. De KU Leuven raadt dan ook aan zoveel mogelijk open formaten en open licenties te gebruiken. 

Tel uit je winst 

Zo'n openbare opslagplaats biedt voordelen. De data heeft meer impact als de onderzoeker de FAIR-principes (Findable, Accesible, InteroperableReusable) in acht neemt. Elk databestand krijgt een DOI (digital object identifier), net zoals wetenschappelijke publicaties. 

Door de data openbaar te maken is onderzoek makkelijker reproduceerbaar. Dat zorgt er voor dat het onderzoek betrouwbaarder is. Als de data wordt aangepast registreert het systeem dit, dat draagt ook bij aan de betrouwbaarheid van het onderzoek.  

De wetenschapper die de data produceert is zichtbaarder als de data open is

Wyns ziet een efficiëntieslag door onderzoeksdata openbaar te delen: 'Als een onderzoeker onderzoek wil doen, dan moet die zelf data verzamelen. Dat terwijl er misschien al data beschikbaar is die de onderzoeker kan gebruiken.' Door middel van RDR kan een wetenschapper de eerder verkregen data gebruiken.

De wetenschapper die de data produceert is zichtbaarder als de data open is. Het biedt uiteraard ook de mogelijkheid om eenvoudiger kennis te delen, waardoor de algehele wetenschappelijke kennis sneller groeit.

Onderliggende technologie

De onderliggende software is ontwikkeld door Harvard en heet Dataverse. Binnen Dataverse kunnen onderzoekers gemakkelijk data uploaden, beschrijven en delen. Dat beschrijven is van cruciaal belang. Het gaat om metadata die aangeeft hoe je de data dient te interpreteren. 

Al is de data zelf niet beschikbaar wegens wetgeving, de metadata is dat wel

Wyns legt uit: 'Denk dan aan een beschrijving van hoe de data georganiseerd is, hoe het geïnterpreteerd moet worden of wat de herkomst van de data is.' Al is de data zelf niet beschikbaar wegens wetgeving, de metadata is dat wel. Die laatste is altijd terug te vinden in  Limo.

In RDR wordt elk databestand automatisch gekoppeld aan de publicatie publicatie in Lirias, de academische databank van de KU Leuven. Tenzij een onderzoeker data wil delen alvorens een publicatie gebeurd is. 'Hoe meer data op kwaliteitsvolle wijze gedeeld wordt, hoe beter', vindt Wyns.