Blog

Datakwaliteit

Datakwaliteit: terug van nooit weggeweest!

Door corona leek de aandacht voor de datakwaliteit wat weggedeemsterd. Maar intussen staat datakwaliteit bij heel wat bedrijven opnieuw een stuk hoger op de agenda. En maar goed ook! Toch lijkt er iets veranderd. Bedrijven trokken vroeger soms wel erg snel de conclusie dat er een probleem was met de datakwaliteit. Vandaag bekijken ze diezelfde situatie soms op een andere manier. Ze stellen vast dat de medewerkers de data niet vertrouwen – wat op een heel andere uitdaging duidt. Datakwaliteit: terug van nooit weggeweest!

Medewerkers komen meer en meer met data in aanraking. Ze moeten ermee werken, willen erop kunnen vertrouwen. Vertrouwen en kwaliteit gaan hand in hand. Maar wanneer ze aangeven dat ze geen vertrouwen hebben in de data, betekent dat niet automatisch dat de datakwaliteit ondermaats is. In de context van datakwaliteit is ook communicatie heel belangrijk, zo blijkt dan. Wie aantoont dat de data van uitstekende kwaliteit is, bijvoorbeeld via een dashboard, versterkt zo het vertrouwen in de data.

Meten is weten, dat geldt ook voor datakwaliteit. Voor je over datakwaliteit communiceert, moet je die kwaliteit eerst objectief in kaart brengen. In het geval van data gaat het daarbij om de diverse aspecten die bepalen of data betrouwbaar en up-to-date zijn, zoals de herkomst en de leeftijd van de data. Die oefening is op zich ook al niet makkelijk. Als bedrijf moet je immers beslissen welke criteria je zult hanteren: wat wil je meten en hoe?

Voor welke doelstellingen?

Veel hangt ook af van het kwaliteitsniveau dat je nastreeft. Volstaat een accuraatheid van 90%? Of moet het toch minstens 95% zijn? Zo kom je vanzelf bij het vraagstuk rond de ‘fitness for purpose’ van de data: welke data heb je nodig voor welke doeleinden? Het antwoord op die vraag bepaalt voor een groot stuk welk belang de factor datakwaliteit meekrijgt.

Stel dat je een automatiseringsproces uittekent, bijvoorbeeld in een logistieke flow. Zo’n automatisch proces kan maar succesvol zijn wanneer alle benodigde data aanwezig én correct zijn. Is dat niet het geval, dan loopt het proces vertraging op, en dat kost geld. Anders gezegd: het niveau van de datakwaliteit bepaalt hier hoe vaak er manueel moet worden tussengekomen in het proces. Zoals je direct afleidt uit het voorbeeld: hier bestaan geen vaste regels voor. Waar je als bedrijf de lat legt voor de gewenste datakwaliteit, kan bij ieder proces anders zijn.

Op zoek naar oorzaken

Eenmaal je weet welk niveau van datakwaliteit gewenst is, kun je de praktijk in kaart brengen. Wanneer de datakwaliteit niet aan het verwachte niveau blijkt te voldoen, kun je vervolgens een stappenplan uitstippelen. In de eerste plaats moet je op zoek naar de oorzaak van de lage kwaliteit. Het gaat erom uit te vissen welke elementen impact hebben op de datakwaliteit: mens, proces, technologie – of een combinatie ervan.

Mens

Is er veel verloop onder het personeel? Mogelijk zorgt de instroom van nieuwe medewerkers voor een hogere foutenlast. Mogelijk weten de medewerkers niet altijd welke impact hun omgang met data heeft voor andere collega’s, verderop in de processen. Medewerkers die instaan voor data entry, moeten heel goed begrijpen hoe belangrijk het werk is dat ze doen.

Technologie

Soms hangt datakwaliteit van de technische context af. Wanneer het voorziene invulveld te klein is, kan het niet altijd alle beschikbare informatie bevatten. Door technische controles in te bouwen, is het mogelijk om bepaalde fouten te vermijden: bijvoorbeeld door in het postcodeveld geen letters te aanvaarden.

Proces

Povere datakwaliteit kan ook het gevolg zijn van een onnauwkeurig uitgetekend proces. Wanneer dat proces de data niet op de juiste manier capteert, bijvoorbeeld, of wanneer er geen controle gebeurt op data van externe bronnen.

Vaak spelen er bij mens, technologie en proces verschillende moeilijkheden tegelijk. Wie werk wil maken van een betere datakwaliteit, moet in dat geval verschillende acties ondernemen, bij die verschillende oorzaken.

Meer weten over hoe je je datakwaliteit naar het gewenste niveau krijgt? Want datakwaliteit is terug van nooit weggeweest. Contacteer ons.

Op 22 november 2022 organiseren wij een kennismakingssessie van het Data Quality Business game. Dit kan je inzetten om je medewerkers te laten ervaren waarom datakwaliteit belangrijk is. Schrijf je hier in!

data quality