Comment réussir sa gouvernance des données ?
Dans cet article, nous explorerons comment réussir dans la gouvernance des donnéesSi vous avez travaillé avec de grandes quantités de données, vous avez probablement entendu le terme «gouvernance des donnéesEt vous vous êtes probablement demandé : qu'est-ce que c'est ? Est-ce adapté à vos besoins ? Comment le mettre en œuvre ? En termes simples, la gouvernance des données est la stratégie de gestion des données : comment elles sont stockées, consultées, vérifiées, sécurisées et utilisées. La gouvernance des données comprend l'élaboration de schémas d'accès : qui peut accéder à vos données, les utiliser et les partager.
Ces enjeux prennent une importance croissante, car les entreprises dépendent de la collecte, du stockage et de l'analyse de grandes quantités de données pour atteindre leurs objectifs commerciaux. Les données sont devenues un outil de profit, un support commercial et un secret commercial pour les entreprises. Les violations de données peuvent donner lieu à des litiges et entraîner une perte de confiance des consommateurs dans l'activité principale d'une entreprise.

Comment réussir sa gouvernance des données ?
Si vous laissez chaque service traiter les données, vous manquerez de stratégie unifiée pour leur gestion et risquez de les laisser développer leurs propres stratégies. C'est impensable, tout comme l'absence de stratégie de gestion des stocks physiques, permettant aux entités individuelles de produire, stocker et vendre des produits à leur guise. Une mauvaise utilisation des données, comme celle des stocks, peut coûter des millions de dollars aux entreprises. Des stratégies doivent donc être mises en place pour garantir la cohérence, la sécurité et la disponibilité des données. Ces politiques, appliquées au domaine des données, constituent la gouvernance des données.
Caractéristiques de la gouvernance des données
UN stratégie de gouvernance des données La gouvernance des données doit couvrir l'intégralité du cycle de vie des données, de leur collecte à leur gestion. Durant ce cycle, elle doit répondre aux enjeux suivants :
1. Où et comment obtenir les données ? C'est le point de départ du cycle de vie des données. La provenance des données détermine les fondements d'une stratégie de gouvernance des données. Par exemple, la taille de l'ensemble de données est un facteur important pour déterminer leur source. Les données sont-elles collectées auprès des marchés cibles, des clients existants et des réseaux sociaux ? Ou faites-vous appel à un prestataire externe pour collecter ou analyser les données collectées ? Quel est le flux de données entrantes ? La gouvernance des données doit répondre à ces questions, élaborer des stratégies pour gérer la collecte de données, guider les prestataires externes dans le traitement des données qu'ils collectent ou l'analyse des données collectées, et contrôler le cheminement et le cycle de vie des données.
2. La validation des données, en particulier des données multi-sources, est un casse-tête pour gestionnaires de donnéesDistinguer les données importantes des données parasites n'est que le début du problème. Si vous collectez des données auprès d'une entreprise affiliée, vous devez vous assurer de leur fiabilité. Si vous collectez des données sur les réseaux sociaux, votre stratégie doit prévoir un moyen de vérifier les données importantes. Dans tous les cas, vous devez vous assurer que les données collectées sont légitimes et n'ont pas été falsifiées. Ce problème est particulièrement préoccupant dans les environnements de calcul parallèle, où le calcul parallèle est souvent utilisé pour collecter de grandes quantités de données, souvent via des services cloud, ce qui accroît les risques de sécurité.
3. Les politiques de gouvernance des données doivent prendre en compte les problèmes de stockage, et les solutions de stockage dépendent largement de la taille des ensembles de données. Des pétaoctets de big data doivent être stockés dans des systèmes sécurisés et redondants, souvent hiérarchisés selon la fréquence d'utilisation. Ainsi, les systèmes en ligne coûteux fournissent les données fréquemment demandées, tandis que les données moins fréquemment demandées sont stockées sur des systèmes moins coûteux et moins disponibles. Malheureusement, ces systèmes moins prioritaires peuvent également être moins sécurisés, permettant l'accès à des données sensibles mais peu demandées. Par conséquent, lors de l'élaboration d'une solution de stockage de données, une bonne politique de gouvernance des données doit prendre en compte tous les aspects.
4. La gouvernance des données doit élaborer une stratégie de contrôle d'accès conciliant besoins et sécurité. Il faut rendre les données accessibles, si nécessaire, à ceux qui en ont besoin pour exercer leur métier. Pour des raisons de sécurité, ces derniers ne devraient pas pouvoir accéder aux données au-delà de leurs compétences. L'accès aux données ne devrait être possible que sur demande légitime, mais pour des raisons de sécurité, l'accès aux données sensibles devrait être rendu plus difficile et réservé aux utilisateurs disposant d'un niveau de sécurité spécifique.
Des niveaux d'accès doivent être définis pour les utilisateurs et les données elles-mêmes. Une interaction étroite avec les RH et les achats est essentielle lors de la gestion des comptes, car cela permet aux employés quittant l'entreprise et aux fournisseurs de ne plus y avoir accès rapidement. La gestion de ces informations et la garantie de la propriété et de la responsabilité des données font partie intégrante d'une stratégie complète de gouvernance des données.
5. Utilisation/Partage/Analyse. L'utilisation des données est un élément essentiel d'une stratégie de gouvernance des données. Parmi les utilisations possibles, on peut citer la gestion des comptes, l'amélioration de l'expérience client, la diffusion de publicités ciblées, la réalisation d'analyses de marché et le partage de données avec des entreprises affiliées. Les données pouvant être partagées ou utilisées à des fins marketing doivent être soigneusement définies et protégées contre les attaques et les fuites, car elles sont destinées à un usage exclusivement interne. Informez vos clients que toutes les entreprises qui collectent des données doivent se conformer aux réglementations en matière d'utilisation et de partage des données. Garantir la conformité de l'utilisation des données est un autre avantage important d'une politique de gouvernance des données.
6. La collecte, la vérification, le stockage, l'accès et l'utilisation sont autant d'éléments nécessaires à un plan de sécurité, et une stratégie globale doit être mise en place pour répondre à ces préoccupations et à d'autres. Un programme de sécurité doit fonctionner sans interdire les utilisateurs, mais les données peuvent être attaquées et compromises par inadvertance à différentes étapes de leur cycle de vie. La recherche de la sécurité doit favoriser plutôt qu'entraver leur utilisation nécessaire. Une stratégie de gouvernance des données doit développer des solutions de sécurité, incluant des protocoles d'accès, le chiffrement des données au repos et en transit, etc.
7. Intendance/Métadonnées. Le cycle de vie des données est incomplet sans intendance. Un exemple d'intendance est l'application de métadonnées à une donnée pour identifier sa récupération. Les métadonnées comprennent la source des données, la date de génération et/ou de collecte, les informations sur le niveau d'accès, la classification sémantique et d'autres attributs requis par l'entreprise. La gouvernance des données établit un vocabulaire de métadonnées qui définit la période de validité des données. N'oubliez pas que les données expirent et qu'à un moment donné, elles ne peuvent être utilisées que pour l'analyse des données historiques.
Problèmes organisationnels de la gouvernance des données
La mise en place d'une gouvernance des données se heurte souvent à la résistance de ceux qui craignent de ne plus pouvoir accéder aux données dont ils ont besoin, et de ceux qui, historiquement, sont réticents à partager leurs données pour des raisons de concurrence. Une stratégie de gouvernance des données doit répondre à ces préoccupations et être acceptable par toutes les parties. Les entreprises habituées à un environnement de silos de données peuvent avoir des difficultés à s'adapter aux nouvelles stratégies de gouvernance des données, mais la dépendance actuelle à de grands ensembles de données et les nombreux problèmes de sécurité qui en découlent rendent nécessaire la création et la mise en œuvre de politiques de données à l'échelle de l'entreprise.
Les données font de plus en plus partie de l'infrastructure d'une entreprise, et les décisions sont prises au fur et à mesure que l'entreprise traite des situations spécifiques, étape par étape. Ces décisions sont prises de manière ponctuelle, souvent en réponse à un problème particulier. Par conséquent, la façon dont une entreprise traite les données peut varier d'un service à l'autre, voire d'un service à l'autre.
Même si chaque service dispose déjà d'un plan raisonnable de traitement des données, ces plans peuvent entrer en conflit et l'entreprise devra trouver une solution. Déterminer les exigences et les besoins en matière de stockage des données peut s'avérer complexe. Si vous ne le faites pas correctement, vous ne pourrez pas exploiter tout le potentiel des données pour le marketing et la fidélisation client, et vous engagerez votre responsabilité juridique en cas de violation de données.
Un autre problème est que dans une grande entreprise, les départements se font concurrence pour ressources et rivalisent pour faire entendre leurs besoins. Les services doivent uniquement assurer leur propre viabilité, qu'il s'agisse d'une entreprise rentable ou d'un centre de support. Ils ont donc une vision étroite et se concentrent sur leurs propres besoins, ce qui rend difficile l'obtention d'un compromis sans médiation.
Le Conseil de gouvernance des données élabore des politiques de gouvernance des données en fonction des politiques existantes, des besoins non satisfaits et des problèmes de sécurité potentiels. Il standardise les politiques de collecte, de gestion, de stockage, d'accès et d'utilisation des données, tout en tenant compte des besoins spécifiques des différents services et postes. Il joue également un rôle de médiateur, en conciliant les besoins contradictoires, en conciliant les préoccupations de sécurité et les besoins d'accès, et en garantissant des politiques de gestion des données efficaces et sécurisées.
Comment réussir sa gouvernance des données ?
Comment réussir la gouvernance des données – 1. Établir une organisation de gouvernance des données.
Le Data Governance Institute recommande la création d'un comité de gouvernance des données chargé d'évaluer les contributions de chaque utilisateur et d'élaborer une stratégie de gestion des données à l'échelle de l'entreprise, répondant aux besoins des utilisateurs internes, externes et même juridiques. Ce comité doit inclure des parties prenantes de tous les secteurs de l'entreprise afin de garantir la satisfaction de tous les besoins et la représentation de tous les types de propriétaires de données. Des experts en sécurité devraient également faire partie du comité. Il est important de connaître les objectifs du comité de gouvernance des données. Réfléchissez donc aux raisons pour lesquelles votre organisation a besoin d'une stratégie de gouvernance des données et expliquez-la clairement.
Comment réussir dans la gouvernance des données – 2. Développer un cadre qui s’adapte à un large éventail d’exigences en matière de données.
Le cadre doit garantir l'intégration des différents éléments dans un ensemble répondant aux exigences de collecte, de stockage, de récupération et de sécurité. Pour ce faire, l'entreprise doit clairement définir sa stratégie de données de bout en bout afin de concevoir un cadre couvrant l'ensemble des exigences et des opérations nécessaires. Les éléments doivent être planifiés ensemble pour se soutenir mutuellement, ce qui présente de nombreux avantages, notamment la possibilité de répondre aux exigences de récupération dans un environnement hautement sécurisé.
La conformité doit également être spécifiquement intégrée au cadre réglementaire afin de permettre le suivi et le signalement des problèmes réglementaires. Ce cadre comprend également des enregistrements quotidiens et d'autres mesures de sécurité permettant d'alerter rapidement en cas d'attaque. La validation des données avant leur utilisation fait également partie du cadre. Le comité de gouvernance des données doit comprendre chaque élément du cadre, clarifier son objectif et son fonctionnement tout au long du cycle de vie des données.
Comment réussir la gouvernance des données – 3. Piloter une stratégie de données.
En règle générale, une stratégie doit être déployée à petite échelle pour découvrir les failles dans la planification, le cadre et l’infrastructure avant d’être mise en œuvre dans l’ensemble de l’entreprise.
Comment réussir la gouvernance des données – 4. Avoir une organisation de gouvernance des données à jour.
Le Conseil de gouvernance des données doit évoluer avec son temps, car les politiques de gouvernance des données devront certainement être adaptées à mesure qu'elles s'étendent à de nouveaux secteurs d'activité. De plus, l'évolution technologique doit s'accompagner de politiques de données adaptées aux situations de sécurité, aux méthodes d'analyse et aux outils de gestion des données.
Comment réussir dans la gouvernance des données – 5. Sachez ce qu’est une stratégie de données réussie.
Établissez des indicateurs de réussite pour mesurer les progrès. Définir des objectifs de gestion des données vous aidera à identifier des indicateurs de réussite importants et, par conséquent, à garantir que votre stratégie de gouvernance des données évolue dans la direction souhaitée et nécessaire.
Conclusion
Merci d'avoir lu notre article et nous espérons qu'il vous aidera à mieux comprendre comment réussir votre gouvernance des données. Pour en savoir plus sur la gouvernance des données, nous vous conseillons de consulter notre site. Gudu SQLFlow pour plus d'informations.
En tant que l'un des meilleurs outils de lignage de données Disponible sur le marché aujourd'hui, Gudu SQLFlow peut non seulement analyser les fichiers de script SQL, mais aussi obtenir lignée de données, et effectuer un affichage visuel, mais aussi permettre aux utilisateurs de fournir lignée de données au format CSV et effectuer un affichage visuel. (Publié par Ryan le 24 juillet 2022)
Si vous aimez lire ceci, alors n'hésitez pas à explorer nos autres articles ci-dessous :