Blog

Data lineage

Zicht op de whereabouts van je bedrijfsdata

Data vormt de grondstof voor een brede waaier aan processen. Het is een onmisbare, waardevolle asset voor ieder bedrijf. Binnen de context van data governance verdient data lineage daarom extra aandacht. Want dankzij data lineage ben je altijd op de hoogte van de whereabouts van jouw bedrijfsdata.

Data lineage is vergelijkbaar met het principe van traceerbaarheid uit de voedingssector. Het zorgt ervoor dat je het afgelegde traject van de data kent. Eenduidige informatie over de bron en het traject van data is onder meer essentieel in het kader van compliance. Maar omdat de datavolumes snel blijven groeien, is het verzamelen en beheren van die informatie hoe langer hoe meer een ingewikkelde oefening.

Zorg voor een schema
Wanneer we met data lineage verwijzen naar het ‘in kaart brengen’ van de weg die data doorheen het bedrijf aflegt, dan mag je dat letterlijk nemen. Beschouw data lineage in z’n eenvoudigste vorm als het uittekenen van een schema. Het startpunt is de plaats waar de data ontstaat of het bedrijf binnenkomt, bijvoorbeeld het ERP-systeem, vandaar stroomt ze door naar een andere applicatie, vervolgens naar een data warehouse en zo komt ze in een rapport terecht, etc. Documenteer niet alleen het traject die de data aflegt, maar ook wat ermee gebeurt: het samenvoegen van verschillende data, veranderingen in formaat, en meer.

Zicht op afhankelijkheid
Data lineage biedt een zicht op de onderlinge afhankelijkheid tussen data. Stel: de uitkomst van een rapport steunt op een aantal berekeningen. Als iemand bij de opstelling van het rapport beslist – of vergeet – één van de datavelden in te vullen, sluipt er een fout in het rapport. Data lineage laat op zo’n moment toe naar de oorzaak van de fout terug te grijpen.

Het voorbeeld geeft goed aan hoe data lineage ervoor zorgt dat een bedrijf het traject van haar data in twee richtingen kan bekijken: van bron tot uitkomst in het kader van een impactanalyse, of van uitkomst tot bron voor een root cause-analyse. Net omdat data lineage zicht biedt op het traject dat de data aflegt, beschikt de onderneming zo ook over een aanpak die toelaat heel gericht en op de meest zinvolle plekken controlepunten in te bouwen.

Wil je als bedrijf weten vanaf welk punt in het datatraject het noodzakelijk is om de gehanteerde data te encrypteren? En wat in het onverhoopte geval dat er een datalek is ontstaan? Over welke data gaat het precies en op welke plaatsen in het datatraject is een ingreep noodzakelijk? Data lineage laat toe dat soort vraagstukken vlot op te lossen.

Begin klein
Het volledige datatraject van alle data van een onderneming gedetailleerd in kaart brengen – inclusief alle onderlinge afhankelijkheden – is niet bepaald een kleine opdracht. Wie hier grondig werk van wil maken, kan dat onmogelijk allemaal manueel documenteren. Daarvoor doe je beter een beroep op een tool die metadata capteert in de applicaties zelf.

Toch mag de keuze en implementatie van een tool geen drempel vormen om met data lineage te starten. Dat kan namelijk ook op een eenvoudige, intuïtieve manier. Met enkele eenvoudige schema’s lukt het doorgaans al om de basisstromen van data binnen de onderneming te schetsen. Dat zorgt alvast voor een eerste aanknopingspunt dat toelaat daarna stap voor stap uit te breiden en te professionaliseren.

Meer weten over data lineage? Contacteer ons!

data governance