FAIR data
Wat is FAIR data?
FAIR staat voor Findable, Accessible, Interoperable en Reusable. Met interoperable wordt bedoeld dat de onderzoeksdata uitwisselbaar zijn tussen computersystemen.
Waarom data FAIR maken?
Als er één voorbeeld is dat de waarde van FAIR data laat zien is het wel het onderzoek naar Covid 19 geweest. Ontwikkelingen en onderzoeksresultaten waren én snel beschikbaar en deelbaar én goed gedocumenteerd zodat het wereldwijde onderzoek in korte tijd tot resultaten leidde. Zie de Covid-19 pagina bij ZonMw.
Door de data FAIR te maken bevorder je een zorgvuldige publicatie van je onderzoeksdata omdat deze daarmee
- beter vindbaar en toegankelijk zijn
ook niet toegankelijke datasets (privacy gevoelige data) zijn vindbaar dankzij goede metadata - controleerbaar zijn voor andere onderzoekers
Een goede uitwisselbaarheid van data leidt sneller tot nieuw onderzoek. Andere onderzoekers kunnen onderzoeksdata makkelijk inzien en kunnen die hergebruiken voor vervolgonderzoek.
Meer voordelen van het gebruik van FAIR data zijn:
- efficiënter werken met data
- minder risico op dataverlies
- het kan leiden tot meer citaties van publicaties
- het draagt bij aan het vertrouwen in hogescholen, als onderzoekspartner, wanneer er duurzaam met data wordt omgegaan en gepubliceerd onderzoek gemakkelijk door externen kan worden ingezien en beoordeeld.
Niet voor niets stellen subsidieverstrekkers en onderzoekspartners steeds hogere eisen aan het zorgvuldig verzamelen, opslaan en toegankelijk maken van onderzoeksdata.
De FAIR principes
Findable (vindbaarheid)
Zorg dat data vindbaar zijn!
Begin al in de planfase met het vindbaar maken van data en zorg voor vindbaarheid in alle onderzoeksfasen, dit voorkomt tijdrovende aanpassingen achteraf.
Hoe?
Door het toevoegen van metadata en het gebruik van een Persistent Identifier (PID).
Ook het opnemen van de onderzoeksdata in internationaal erkende repositories (bijvoorbeeld een van de Data Stations van DANS (vroeger EASY) of 4TU.ResearchData vergroot de vindbaarheid van onderzoeksdata.
Accessible (toegankelijkheid)
Beschrijf de toegangsvoorwaarden van de data! Daarmee zorg je dat 'mens en machine' toegang heeft tot de (meta)data.
Van vrij toegankelijk of door middel van multi-factor authenticatie of autorisatie. Ook al is de data niet (meer) beschikbaar, zorg dat de metadata altijd toegankelijk blijft.
Interoperable (uitwisselbaarheid)
Hiermee regel je dat computers de dataformaten en metadata herkennen en kunnen combineren. Als de data uitwisselbaar is kan jouw gecreëerde data bruikbaar zijn voor een onderzoeker uit een andere discipline.
Dat doe je door gebruik te maken van open dataformats zoals pdf, txt, xml, csv.
Reusable (herbruikbaarheid)
Je maakt je data herbruikbaar door te zorgen dat je
- dataset duidelijke gebruiksvoorwaarden heeft;
- dataset een gedetailleerde beschrijving van de data en hun herkomst heeft;
- je zoveel mogelijk gebruik maakt van 'community standards' bij metadatering.
Het moet voor mensen en computers duidelijk zijn waar de data vandaan komen, hoe ze zijn gegenereerd, wie ze heeft verzameld, welke verwerkingsstappen zijn gemaakt, en welke apparatuur, machines, meetinstrumenten, vragenlijsten, methodes en procedures, et cetera zijn gebruikt.
Door je onderzoeksdata zo te beschrijven kunnen andere onderzoekers jouw onderzoeksgegevens en datasets gemakkelijk vinden en gebruiken voor hun eigen onderzoek.
Voor een uitgebreide beschrijving van de FAIR principes zie hoofdstuk 3 van de handleiding FAIR data