Publiceren in data-repositories
Data-repositories kun je gebruiken om naast artikelen ook onderzoeksgegevens te publiceren en te delen. Hiermee maak je je onderzoeksresultaten transparant, beter zichtbaar en herbruikbaar. In deze handleiding vind je informatie over het proces van het publiceren in een data-repository en maakt duidelijk welke repositories er zijn.
Waarvoor gebruik je een data-repository
In een data-repository kun je onderzoeksdata veilig opslaan, beheren en via open access of onder bepaalde voorwaarden beschikbaar stellen. Zo blijven je de onderzoeksgegevens duurzaam bewaard en blijven ze ook op langere termijn toegankelijk en beschikbaar.
Door metadata toe te voegen kunnen andere onderzoekers deze informatie vinden en gebruiken.
Dat doe je door unieke identifiers toe te voegen, zoals een digital object identifier (DOI). Door een Creative Commons licentie toe te kennen aan de dataset, kun je zelf bepalen welke toegang andere onderzoekers krijgen tot de gegevens. Hiermee kun je de maatschappelijke impact van je onderzoek verhogen.
Welke soorten data-repositories zijn er
Er zijn duizenden data-repositories die kunnen worden onderverdeeld in twee types:
- Generieke data-repositories
Deze kunnen verschillende soorten data uit verschillende domeinen opslaan. Ze ondersteunen een breed scala aan datatypes en -formaten. Denk daarbij aan tekstbestanden, video-opnames, json, etc. Dit type repositories hanteert geen vakinhoudelijke standaarden of metadata-eisen en bieden daardoor veel flexibiliteit.
- Domeinspecifieke data-repositories
Een domeinspecifieke repsitory is gericht op een specifiek domein of vakgebied en ontworpen om data uit een specifiek vakgebied op te slaan. Omdat de repository is gericht op een specifiek vakgebied wordt gebruik gemaakt van specifieke metadata standaarden en dataformats die passen bij de behoeften van het vakgebied. Hierdoor kan de data die in deze repositories eenvoudig worden gebruikt door andere onderzoekers binnen hetzelfde vakgebied.
Wat bepaalt welk type data-repository je kiest
Deze keuze wordt bepaald door de aard van de data, je doelgroep en de eisen voor opslag en hergebruik door subsidieverstrekkers.
- Welke data wil je plaatsen?
Wanneer je werkt met data die sterk gekoppeld is aan een specifiek vakgebied en waarbij bepaalde standaarden of formats vereist zijn (bijv. genetische of metrologische gegevens) is een domeinspecifieke repository veelal de beste keuze.
Wanneer de onderzoeksgegevens geen specifieke standaarden hebben of als je werkt met gegevens die relevant zijn voor meerdere vakgebieden (bijv. sociale wetenschappen) is een generieke repository vaak de beste keuze.
- Met welke Financiersvereisten moet je rekening houden?
Zorg ervoor dat je bij de keuze voor een repository op de hoogte bent van de eisen die door je subsidieverstrekker worden gesteld. Onderzoeksfinanciers verwachten bijvoorbeeld steeds vaker dat de repository een persistent identifier, zoals een DOI, toekent aan de publicatie. Ook stellen financiers als ZonMw vaak de eis dat de repository ‘CoreTrustSeal’-gecertificeerd is. Dit is een erkende certificering voor data-repositories.
De datastewards van je hogeschool kunnen je helpen om een keuze te maken voor een geschikte data-repository. (verwijzing naar publicatieproces invoegen ???)
Beschikbare data-repositories
Inleidende informatie opnemen??Re3data is een wereldwijd register van onderzoeksdata-repository's dat verschillende academische disciplines omvat.
Datadocumentatie en metadata
Om ervoor te zorgen dat de onderzoeksgegevens begrijpelijk, herbruikbaar, vindbaar en betrouwbaar zijn voor iedereen, zul je deze gegevens moeten voorzien van duidelijke en gedetailleerde informatie over het onderzoek.
Dit kun je doen door middel van datadocumentatie en metadata.
- Datadocumentatie
Datadocumentatie leg je vast op twee niveaus:
- Op projectniveau leg je alle informatie vast over het onderzoeksproject zelf en de dataset die wordt gepubliceerd.
- Op dataniveau leg je alle informatie vast over de verschillende bestanden in de dataset en de specifieke informatie over de data.
- README file
Dit is een bestand met belangrijke informatie over het project en de gepubliceerde dataset. Deze stelt gebruikers in staat snel te begrijpen hoe ze de onderzoeksgegevens kunnen begrijpen en (her)gebruiken.
De readme file wordt samen met de dataset gepubliceerd in de repository en het is vaak het eerste bestand dat een gebruiker leest bij het openen van de dataset.
Hier vind je een template voor een README-file.
- Metadata
Metadata biedt de noodzakelijke informatie om de datasets vindbaar, toegankelijk en herbruikbaar te maken voor andere gebruikers en kan worden gezien als ‘data’ over de data’. Denk daarbij aan gegevens zoals; wie is de auteur; wat was de startdatum; e-mailadres van de contactpersoon; ‘key-words’; gebruikersrechten; gebruikte software applicaties; etc.
Iedere repository heeft een (eigen) metadatastandaard die moet worden ingevuld wanneer de dataset wordt aangeleverd. Er zijn grofweg twee soorten te onderscheiden:
Domeinspecifieke repositories
- Deze maken gebruik van metadatastandaarden die gericht zijn op een specifiek vakgebied.
Generieke repositories
- Deze maken gebruik van meer algemene metadata standaarden (bijv. Dublin Core).
Voor een aantal generieke repositories die door Hogeschool Leiden worden aangeraden is een uitwerking beschikbaar van de gevraagde metadata.
Deze uitwerkingen kun je vinden op de volgende pagina <invoegen>.
Wil je ondersteuning of verder uitleg over datadocumentatie neem dan contact op met een datasteward.