Blog

Data catalog

De juiste informatie over je data binnen handbereik

Een data catalog biedt een centraal overzicht van alle documentatie en context die over je bedrijfsdata beschikbaar zijn. Zo vormt het een belangrijk instrument voor de data governance van een bedrijf. Maar wanneer is de implementatie ervan concreet aan de orde? En welke voordelen haal je eruit?

Een data catalog omvat een overzicht van de data die een bedrijf beheert, aangevuld met metadata. Dat is extra informatie over die data. Dikwijls gaat het om technische informatie. Denk hierbij aan aanduidingen van data formaten of de omschrijving van de locaties waar de data zich bevindt. Even goed is in de data catalog contextuele informatie beschikbaar. Wie zijn de owners van bepaalde data, wie treedt op als data steward, etc.

Verder omvat het dikwijls ook informatie over het kwaliteitsniveau van de data. Alsook over de classificatie rond confidentialiteit. Tot slot is het aangeraden de data catalog te voorzien van een business glossary. Dat stuk van de data catalog omschrijft de inhoud van de data. In de business glossary zitten typisch de definities en formules van de bedrijfsterminologie en de data die een bedrijf hanteert.

Data gedreven

Kort samengevat, het zorgt ervoor dat de vorm en de betekenis van de data eenduidig vastligt. De data catalog doet dat door informatie samen te brengen die zich anders vaak in allerlei documenten bevindt. En verspreid zit doorheen het hele bedrijf. De stap ernaartoe is aan de orde naarmate je meer data gedreven processen en analyse hanteert.

Analytische omgevingen als een data warehouse of een data lake hebben bij uitstek nood aan een data catalog. Wil je overzicht houden over de data die voor analyse en data science beschikbaar is in je bedrijf? En die je ervan verzekert dat die data steeds op de juiste manier wordt geïnterpreteerd? Dan kan je niet zonder.

Ook GDPR en andere data-gerelateerde regelgevingen een mogelijke drijfveer. De data catalog omschrijft immers precies welke data persoonsgebonden zijn en waarvoor het kader van de GDPR geldt.

Meer transparantie, minder fouten

Het gebruik zorgt voor transparantie en beperkt het risico op foute interpretatie van data. De gebruikers van de data raadplegen hierin alle contextuele informatie. Dat zorgt voor enorme tijdwinst. Ze hoeven niet langer te vragen hoe ze bepaalde data moeten lezen. Zo houdt de data catalog de drempel voor meer data gedreven innovatie laag. Tegelijk houdt het gebruik van de data minder risico in.

Daarnaast vermeldt de data catalog het niveau van confidentialiteit van de data. Hierdoor weet de gebruiker meteen welke data hij kan inzetten, zonder dat hij hiervoor bij de business inlichtingen moet opvragen. Er is geen excuus meer om – al dan niet onder de tijdsdruk van een project – te ‘vergeten’ die informatie op te vragen. Minstens even belangrijk, het zorgt voor transparantie over waar het bedrijf welke data gebruikt. Dat maakt het makkelijker om de impact te beheren wanneer er naderhand iets aan de data of de data flow verandert.

Start met kritische data

Is de implementatie ervan moeilijk? Niet noodzakelijk. Uiteindelijk gaat erom bestaande informatie op te sporen en samen te brengen. Een stapsgewijze aanpak biedt de beste kansen op succes. Start met de meest kritische data: de data die de grootste impact heeft op de werking – en de winst – van de onderneming. Van daaruit laat het gebruik van de data catalog en zijn business glossary zich stap voor stap uitbreiden, eventueel ondersteund met de tools die het best bij uw doelstellingen aansluiten.

Meer weten over wat een data catalog voor jouw organisatie kan betekenen? Contacteer ons!

data governance