Chantier Data quality : les bonnes questions pour réussir
La non-qualité des données, ce sont des problèmes très concrets :
- Michelle, où as-tu mis le dernier fichier de synthèse ?
- Jeannot, tu sais si Lyon nous a transmis le dossier ?
- Isabelle, t’es sûre des chiffres là ? L’ERP me donne autre chose…
- Stéphane, pourquoi les chiffres du Market et des Sales ne concordent pas ?
Bref, un problème du quotidien. Considérez qu’en fonction de votre métier, vous perdez entre 10 et 30% de votre journée à mettre la main sur les informations dont vous avez besoin.
Chez la quasi-totalité de nos clients, j’entends parler de qualité de données en général. C’est la plupart du temps incantatoire et loin de pouvoir produire des résultats opérationnels. Pour ainsi dire, c’est un concept qui n’aura aucune réalité tant que votre organisation n’aura pas mis en place une gouvernance des données globale et capable de mesurer ladite qualité sur l’ensemble des périmètres data à monitorer.
D’ici là, nous ne parlerons donc pas de qualité de données en général mais plutôt de données en qualité suffisante pour un ou plusieurs usages. Et quand on attaque un chantier de ce type, il faut préalablement se poser des questions à court, moyen et long terme pour évaluer sans équivoque le ROI du projet.
Questions pour un ROI à court terme du chantier :
En sus du périmètre (données, applications…), votre organisation doit s’interroger sur les critères de qualité utiles et nécessaires (qualité intrinsèque et qualité d’usage). Quels sont les KPI qui doivent être atteints par usage ? Ces KPI pourront-ils être opérationnels avant la remise en qualité des données (sinon comment va-t-on démontrer le gain de qualité sans avoir mesuré la non-qualité préalablement) ?
Dès le départ, s’interroger sur la position des données à mettre en qualité dans la chaîne référentielle est également indispensable. J’ai observé trop d’organisations travailler sur la qualité des données d’un Data Lake au lieu d’investir sur les sources…
Questions pour un ROI à moyen terme du chantier :
Pour un ROI pérenne à court-moyen terme, il faut s’inquiéter des dépendances du périmètre à mettre en qualité : quels acteurs impactent la qualité, quelles applications, quels traitements ? Si d’aventure on ne peut maîtriser les dépendances de la qualité des données cible, on s’expose à un retour rapide de la non-qualité.
Va-t-on pouvoir industrialiser les règles de gestion et traitements de remédiation ? Les KPI de mesure vont-ils intégrer des tableaux de bord courants de pilotage de la qualité des données ? Si on répond positivement à ces dernières questions, on peut commencer à espérer un ROI plus tangible.
Questions pour un ROI à long terme du chantier :
Je ne compte plus le nombre de projet de remédiation de la qualité qui voient leurs résultats s’envoler au bout de 6 à 12 mois parce que l’investissement n’a pas été pensé sur le long terme.
Si une organisation pense ses données comme un patrimoine stratégique, c’est-à-dire comme un atout de différentiation concurrentielle, elle n’abordera pas un chantier de data quality sans penser long terme. En l’occurrence, chaque projet data doit être l’occasion de faire grandir la culture data de l’organisation, de faire prendre conscience à chacun de ses collaborateurs de l’importance de ce commun immatériel essentiel à l’agilité de l’organisation.
En conclusion, oui un chantier de data quality c’est de la correction de données ainsi que des RG dans les systèmes, des IHM plus ergonomiques, des collaborateurs mieux formés, une sémantique clarifiée et partagée, une collaboration entre départements que les données traversent – et finalement une culture data qui grandit – c’est une organisation qui devient de plus en plus data driven.
Où en êtes-vous dans votre organisation ? Quelles sont les bonnes recettes que vous souhaitez partager ? Quels sont les obstacles que vous rencontrez ? Contactez-nous pour échanger !