Wat betekent AI voor datakwaliteit en data governance?

Het gebruik van artificiële intelligentie (AI) en machine learning (ML) duikt straks meer en meer op in toepassingen voor datakwaliteit en data governance. Dat lijkt ons een logische stap, want die tools steunen nu al voor een groot deel op algoritmes.

Applicaties voor datakwaliteit zetten onder meer fonetische algoritmes in. Die slagen erin om woorden, zoals namen en adressen, te herkennen die met een afwijkende schrijfwijze zijn ingevoerd. Andere types algoritmes zijn gericht op de matching van bestanden of op herkenning van patronen. Ze hebben echter allemaal een kenmerk gemeen. Het zijn namelijk statische algoritmes. Bij de implementatie van een tool is een manuele configuratie nodig om de algoritmes een specifieke opdracht te laten doen.

Zelflerende oplossingen

Bedrijven die tools voor datakwaliteit ontwikkelen gaan op zoek naar zelflerende algoritmes. Die moeten op basis van een of meer bestanden zelf de best mogelijke regels voor datakwaliteit of matching van records bepalen. Maar dat is uiteraard niet evident. Leveranciers zetten al wel het gebruik van AI in de roadmap van hun tools, maar in de praktijk zijn er vandaag nog maar weinig oplossingen op de markt die AI ook al echt in een productie-omgeving gebruiken. Wat AI in realiteit bijdraagt, blijft daarbij vaak nog vrij onduidelijk.

Salesforce is een voorbeeld van een leverancier die AI inzet in zijn software, ook voor het verbeteren van de datakwaliteit. Salesforce gebruikt AI onder meer om dubbele records in CRM-applicaties op te sporen. Vaak zijn dat toepassingen die uit veel manueel gecreëerde data bestaan. Het gaat bovendien om data die bijna per definitie van heel wisselende kwaliteit is. De automatisering van manuele processen door de inzet van AI is dan zeker een zinvolle piste.

AI versnelt automatisering

Een ander mogelijk toepassingsgebied voor AI is dat van tools die data catalogeren en categoriseren. Dat is vooral interessant voor bedrijven die grote volumes data, meestal afkomstig uit operationele processen, willen inzetten voor analytische en marketing doelen. Die data komt vaak uit verschillende bronnen, is beschikbaar in uiteenlopende formaten en heeft een wisselend kwaliteitsniveau. Het is een gigantisch werk om al die data op een overzichtelijke wijze te catalogeren en de eigenschappen van elke dataset te capteren.

AI kan dat proces helpen automatiseren. Bovendien is AI bruikbaar om de data te classificeren. Dat zou ook tijdswinst opleveren bij bedrijven die in het kader van de GDPR het gebruik van persoonsgegevens in hun organisatie onder controle willen houden. Beide voorbeelden voeden dus onze overtuiging dat AI in de nabije toekomst een groeiende rol zal spelen bij verschillende aspecten van Data Governance.

Wil je meer weten over Data Governance? Check het hier.

Op zoek naar inzicht in toepassingen die voor jouw bedrijf de moeite waard zijn? Stuur ons gerust een bericht!