Fair-Data

Datagedreven werken vraagt om FAIR data

maandag 13 maart 2023, 09:45

Datagedreven werken is de sleutel tot zakelijk succes. Niet voor niets zetten steeds meer organisaties data centraal in hun businessmodel. Wil je echt datagedreven werken, moet je je datahuishouding wel op orde hebben. Alleen dan kan je snel, gecontroleerd data vinden, verwerken en delen. FAIR data helpt je daarbij.

Door datagedreven te werken, kunnen organisaties hun businessbeslissingen beter onderbouwen. Deze beslissingen nemen ze voortaan op basis van complete, real-time informatie. Om datagedreven te werken, moet je wel aan een aantal voorwaarden voldoen. Zo moet je genoeg opslagcapaciteit hebben, de juiste zoektools en software gebruiken, en data science expertise in huis hebben. In de technologie zit vaak de uitdaging: veel organisaties die datagedreven willen gaan werken, slaan alle data op. Daarvoor gebruiken ze vaak verschillende databases, die los van elkaar werken met software die niet integreert. Het gevolg? Ze verliezen het overzicht en weten niet meer welke data waar wordt bewaard. Dat heeft negatieve gevolgen voor de compliancy. Bovendien kan het lang duren voordat de gewenste informatie boven water komt. En als datagedreven organisaties deze data vinden, is die vaak opgeslagen in een onbruikbaar format en is het onbekend of dit wel de laatste versie is. Dat maakt het lastig om data science op de beschikbare gegevens los te laten.

Wat is FAIR data? 
FAIR data zijn gegevens die voldoen aan vier basisprincipes. FAIR data is Findable (vindbaar), Accessible (toegankelijk), Interoperable (uitwisselbaar) en Reusable (herbruikbaar). De afspraken over FAIR data gelden overal ter wereld. Deze afspraken gaan ook over de toepassing van Linked Data-technologie, een technologie die semantische verbanden legt tussen data uit diverse bronnen. Het voordeel van Linked Data? Datagedreven organisaties kunnen FAIR data veel sneller doorzoeken en ze hoeven alleen relevante data te doorspitten. “Je kunt data zien als een wolk. Daarin zweven allerlei gegevens die op uiteenlopende manieren verband met elkaar houden. Elk data-onderdeel in die wolk heeft een naam, metadata en context”, zegt Arie Hakemulder, Principal Consultant bij AXVECO, een adviesbureau dat bedrijven helpt om duurzaam te innoveren met technologieën als blockchain en AI.

FAIR data komt direct van de bron 
Hoe kan FAIR data datagedreven organisaties helpen? FAIR data zorgt dat data terug te traceren is naar de bron. Want alle data wordt centraal opgeslagen. “Privacy by design, wordt dat ook wel genoemd”, zegt Hakemulder. Geautoriseerde personen en machines gebruiken deze data direct van de bron. “Daardoor werken datagedreven organisaties altijd met de laatste versie. Een ander voordeel voor datagedreven organisaties is dat bij FAIR data de eigenaar de controle houdt. Hij of zij bepaalt wie, wanneer toegang heeft tot welke data.”

FAIR data is sneller doorzoekbaar 
FAIR data is geschikt voor Linked Data-technologie. En dat heeft een groot voordeel. Deze technologie maakt het mogelijk om relatief snel de juiste informatie te vinden in grote hoeveelheden FAIR data. Niet alleen mensen, maar machines kunnen FAIR data sneller doorzoeken. Zo kunnen machines gebruikt worden om verbanden in de FAIR data te identificeren. “Machines werken snel. Ze kunnen de gigantische berg aan beschikbare data in no-time doorzoeken en patronen daarin ontdekken en weergeven”, zegt Hakemulder. “Deze FAIR data patronen worden dan gevisualiseerd in knowledge graphs. Uit deze overzichtelijke grafieken en diagrammen kunnen mensen gerichter informatie halen en conclusies trekken. Ook over dingen die anders – zonder het gebruik van machines – veel en veel later, of misschien wel nooit, bekend zouden worden.”

FAIR data is ideaal voor machines 
Er is een grote hoeveelheid aan data voor iedereen beschikbaar. En deze data verdubbelt elk half jaar! Hoe kunnen datagedreven organisaties deze data snel doorzoeken en verwerken? Dat vraagt om FAIR data en om de computing power van machines. Mensen kunnen dat eenvoudigweg niet snel genoeg. Bovendien is het zonde als je als datagedreven organisatie de kostbare tijd van data scientists gebruikt om datasets geschikt te maken voor machines. Zeker wanneer je bedenkt data scientists nu al vaak 80 procent van hun tijd besteden aan het opschonen van data. Hoe los je dat op? FAIR data biedt uitkomst. “FAIR data bevat ook informatie over de context en metadata . Dat kan bijvoorbeeld informatie zijn over de aanmaakdatum, auteur en uitgever van een document. Of in het geval van een afbeelding, het diafragma, de sluitertijd en de opnamelocatie”, zegt Hakemulder. “Elk stukje data heeft voor een machine dus maar één identiteit. Daardoor kunnen machines FAIR data foutloos en sneller doorspitten, bijvoorbeeld door patronen en afwijkingen in kaart te brengen.”

Met FAIR data kunnen organisaties in diverse sectoren datagedreven werken  
FAIR data is ontstaan in de wetenschap. Onderzoekers wilden hun data eenvoudig en snel kunnen vinden en delen, zonder elke database telkens opnieuw te hoeven structureren volgens specifieke regels. Dankzij FAIR data werden gegevens overal op dezelfde manier opgeslagen en herleidbaar naar de bron. Daardoor zijn alle onderzoeksresultaten vindbaar, toegankelijk, uitwisselbaar en herbruikbaar. Dat stelde wetenschappers in staat om voortaan voort te borduren op eerdere onderzoeksresultaten – een groot pluspunt voor de wetenschap zelf en voor de maatschappij. Steeds meer bedrijven en overheidsinstellingen nemen de FAIR data werkwijze van wetenschappers over. Zij zien immers ook dat de hoeveelheid data exponentieel toeneemt. Zo snel, dat de voortschrijdende technologie dit niet kan bijbenen. Daardoor gebruiken financiële instellingen nu FAIR data om hun governance, compliancy en fraudedetectie te verbeteren. Ook zorginstellingen zijn overgestapt naar FAIR data. Deze organisaties gebruiken FAIR data om medische gegevens te analyseren en delen. Bouwbedrijven werken op hun beurt datagedreven met FAIR data om (aanbestedings)kosten nauwkeuriger te kunnen voorspellen.

De overheid loopt voorop in FAIR data 
Veel overheidsinstellingen werken datagedreven op basis van FAIR data. Denk aan organisaties als ministeries, Rijkswaterstaat en gemeenten. Dankzij FAIR data kunnen zij persoonsgegevens sneller en nauwkeuriger doorzoeken, patronen in FAIR data identificeren en anomaliteiten ontdekken. Ook stelt FAIR data hen in staat om werkprocessen te automatiseren. Daardoor verlopen processen sneller, veiliger en met minder fouten. Medewerkers hoeven immers niet meer zelf data voor rapportages te zoeken of in te voeren. Op deze manier helpt FAIR data datagedreven overheidsorganisaties ook om wet- en regelgeving te handhaven en uit te voeren. Denk aan het ontdekken van belastingfraude of veilig delen van kadaster-informatie.

Waarom FAIR data? 
De hoeveelheid data neemt exponentieel toe. Door FAIR data principes toe te passen, houd je data vindbaar, toegankelijk, uitwisselbaar en herbruikbaar. Op deze manier biedt FAIR data de oplossing voor allerlei issues als gevolg van de gigantische datagroei. Denk aan langdurige opschoonwerkzaamheden voor datasets, overstromende data lakes waarin uiteenlopende data bewaard wordt in verschillende formats, compliancy-problemen door achterblijvende data governance en zoektochten naar de laatste versie. Dankzij FAIR data wordt het voor organisaties mogelijk om de volgende stap in datagedreven werken te zetten en voorbij eventuele technologische beperkingen door te groeien. Tegelijkertijd besparen datagedreven organisaties met FAIR data op storage, back-up- en stroomkosten, realiseren ze veel tijdswinst en verminderen ze het aantal menselijke fouten. Ook belangrijk: datagedreven organisaties kunnen dankzij FAIR data hun werkprocessen, onderzoeken of businessmodellen nog verder optimaliseren op basis van inzichten uit historische data. Op deze manier helpt FAIR data organisaties om nog meer en beter datagedreven te gaan werken.

Beginnen met FAIR data? 
Wil je jouw organisatie helpen om meer datagedreven te gaan werken? Dan is het raadzaam om FAIR data te gebruiken. Bij Computrain vind je twee trainingen over datagedreven werken met FAIR data:

FAIR Data Awareness – in deze training maak je kennis met FAIR data. Je leert o.a. om data FAIR te maken en ontdekt welke directe voordelen dat jouw werkgever oplevert.

FAIR Data Stewardship – je leert hoe je FAIR data in jouw organisatie op de juiste manier kunt inzetten, per team of afdeling. En hoe kan je FAIR data ketenbreed gebruiken? Ook dat ontdek je in deze training.