{"id":5619,"date":"2022-08-27T04:04:11","date_gmt":"2022-08-27T12:04:11","guid":{"rendered":"https:\/\/www.gudusoft.com\/?p=5619"},"modified":"2022-09-17T14:02:26","modified_gmt":"2022-09-17T22:02:26","slug":"dark-secrets-of-data-management","status":"publish","type":"post","link":"https:\/\/www.gudusoft.com\/fr\/secrets-sombres-de-la-gestion-des-donnees\/","title":{"rendered":"11 sombres secrets de la gestion des donn\u00e9es | Gudu SQLFlow"},"content":{"rendered":"<div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-1 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"background-color: rgba(255,255,255,0);background-position: center center;background-repeat: no-repeat;border-width: 0px 0px 0px 0px;border-color:#e8eaf0;border-style:solid;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start\" style=\"max-width:1310.4px;margin-left: calc(-4% \/ 2 );margin-right: calc(-4% \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-0 fusion_builder_column_1_1 1_1 fusion-flex-column\"><div class=\"fusion-column-wrapper fusion-flex-justify-content-flex-start fusion-content-layout-column\" style=\"background-position:left top;background-repeat:no-repeat;-webkit-background-size:cover;-moz-background-size:cover;-o-background-size:cover;background-size:cover;padding: 0px 0px 0px 0px;\"><div class=\"fusion-text fusion-text-1\" style=\"line-height:26px;\"><h2>11 secrets obscurs de la gestion des donn\u00e9es<\/h2>\n<p>Certains qualifient les donn\u00e9es de \u00ab\u00a0nouveau p\u00e9trole\u00a0\u00bb, tandis que d&#039;autres les qualifient de \u00ab\u00a0nouvel or\u00a0\u00bb. Au-del\u00e0 de la validit\u00e9 de ces m\u00e9taphores, il ne fait aucun doute que l&#039;organisation et l&#039;analyse des donn\u00e9es sont essentielles pour toute entreprise souhaitant concr\u00e9tiser la promesse d&#039;une prise de d\u00e9cision fond\u00e9e sur les donn\u00e9es. \u00c0 cette fin, une solide expertise en donn\u00e9es est essentielle. <a href=\"https:\/\/www.gudusoft.com\/fr\/5-etapes-pour-ameliorer-la-gestion-de-vos-donnees\/\"><strong>strat\u00e9gie de gestion des donn\u00e9es<\/strong><\/a> est essentiel. Cela comprend <a href=\"https:\/\/www.gudusoft.com\/fr\/category\/data-governance-101\/\"><strong>gouvernance des donn\u00e9es<\/strong><\/a>, op\u00e9rations de donn\u00e9es, <strong><a href=\"https:\/\/www.gudusoft.com\/fr\/data-mining-and-data-warehousing\/\">entrep\u00f4t de donn\u00e9es<\/a><\/strong>, <strong><a href=\"https:\/\/www.gudusoft.com\/fr\/data-engineers\/\">ing\u00e9nierie des donn\u00e9es<\/a><\/strong>, <a href=\"https:\/\/www.dpriver.com\/blog\/2022\/08\/26\/best-data-analysis-software-tools\/\" rel=\"dofollow\"><strong>analyse de donn\u00e9es<\/strong><\/a>, science des donn\u00e9es, etc. La gestion des donn\u00e9es, bien men\u00e9e, peut offrir un avantage concurrentiel aux entreprises de tous les secteurs. Dans cet article, nous vous pr\u00e9senterons <strong>11 sombres secrets de la gestion des donn\u00e9es<\/strong>.<\/p>\n<div id=\"attachment_5630\" style=\"width: 827px\" class=\"wp-caption aligncenter\"><img aria-describedby=\"caption-attachment-5630\" decoding=\"async\" class=\"size-full wp-image-5630\" src=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Dark_Secrets_of_Data_Management.png\" alt=\"Les sombres secrets de la gestion des donn\u00e9es\" width=\"817\" height=\"502\" srcset=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Dark_Secrets_of_Data_Management-18x12.png 18w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Dark_Secrets_of_Data_Management-200x123.png 200w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Dark_Secrets_of_Data_Management-300x184.png 300w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Dark_Secrets_of_Data_Management-400x246.png 400w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Dark_Secrets_of_Data_Management-600x369.png 600w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Dark_Secrets_of_Data_Management-768x472.png 768w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Dark_Secrets_of_Data_Management-800x492.png 800w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Dark_Secrets_of_Data_Management.png 817w\" sizes=\"(max-width: 817px) 100vw, 817px\" \/><p id=\"caption-attachment-5630\" class=\"wp-caption-text\">Les sombres secrets de la gestion des donn\u00e9es<\/p><\/div>\n<h4>Les sombres secrets de la gestion des donn\u00e9es \u2013 1. Les donn\u00e9es non structur\u00e9es sont difficiles \u00e0 analyser<\/h4>\n<p>80%-90% des donn\u00e9es des entreprises sont des donn\u00e9es non structur\u00e9es. \u00c0 mesure que la transformation num\u00e9rique progresse, leur volume augmente rapidement. Ces donn\u00e9es sont dispers\u00e9es au sein de l&#039;entreprise sous forme de documents, d&#039;images, d&#039;audio et de vid\u00e9o, etc. En raison des sp\u00e9cificit\u00e9s des services, des applications, des architectures et des environnements multicloud, elles forment des \u00eelots de donn\u00e9es non structur\u00e9es, difficiles \u00e0 partager et \u00e0 exploiter, et qui d\u00e9tournent la valeur du contenu, ce qui entrave s\u00e9rieusement le processus de transformation num\u00e9rique de l&#039;entreprise.<\/p>\n<h4>Les sombres secrets de la gestion des donn\u00e9es \u2013 2. M\u00eame les donn\u00e9es structur\u00e9es sont souvent non structur\u00e9es<\/h4>\n<p>Les scientifiques et administrateurs de bases de donn\u00e9es comp\u00e9tents guident les bases de donn\u00e9es en sp\u00e9cifiant le type et la structure de chaque champ. Parfois, pour plus de structure, ils limitent la valeur d&#039;un champ donn\u00e9 \u00e0 un entier compris dans une plage sp\u00e9cifique ou \u00e0 un choix pr\u00e9d\u00e9fini. Malgr\u00e9 cela, les personnes qui remplissent des formulaires de stockage de bases de donn\u00e9es trouveront des moyens d&#039;augmenter la difficult\u00e9.<\/p>\n<p>Lorsqu&#039;ils estiment qu&#039;une question ne s&#039;applique pas, ils l&#039;indiquent parfois par un champ vide\u00a0; d&#039;autres fois, ils le signalent par la saisie d&#039;un tiret ou du \u00ab\u00a0na\u00a0\u00bb initial. Un bon d\u00e9veloppeur peut rep\u00e9rer certains de ces probl\u00e8mes gr\u00e2ce \u00e0 la validation. <a href=\"https:\/\/www.gudusoft.com\/fr\/scientifiques-des-donnees\/\"><strong>scientifiques des donn\u00e9es<\/strong><\/a> On peut \u00e9galement r\u00e9duire cette incertitude en nettoyant. Mais il est exasp\u00e9rant de constater que m\u00eame les tables les plus structur\u00e9es contiennent des entr\u00e9es suspectes qui peuvent introduire des inconnues, voire des erreurs, dans l&#039;analyse.<\/p>\n<h4><strong>Les sombres secrets de la gestion des donn\u00e9es \u2013 3. Les sch\u00e9mas de donn\u00e9es sont soit trop stricts, soit trop l\u00e2ches<\/strong><\/h4>\n<p>Malgr\u00e9 tous les efforts d\u00e9ploy\u00e9s par l&#039;\u00e9quipe charg\u00e9e des donn\u00e9es pour d\u00e9finir les contraintes de sch\u00e9ma, le sch\u00e9ma final utilis\u00e9 pour d\u00e9finir les valeurs des diff\u00e9rents champs de donn\u00e9es est soit trop strict, soit trop souple. Si l&#039;\u00e9quipe charg\u00e9e des donn\u00e9es ajoutait des contraintes strictes, les utilisateurs se plaindraient que leurs r\u00e9ponses ne figuraient pas dans la liste restreinte de valeurs acceptables. Un sch\u00e9ma de donn\u00e9es trop permissif risquerait d&#039;ajouter des valeurs \u00e9tranges et peu coh\u00e9rentes.<\/p>\n<h4>Les sombres secrets de la gestion des donn\u00e9es \u2013 4. Les lois sur les donn\u00e9es sont tr\u00e8s strictes<\/h4>\n<p>Les lois sur la confidentialit\u00e9 et la protection des donn\u00e9es sont strictes et ne cesseront de se renforcer. Avec plus d&#039;une douzaine de r\u00e9glementations, telles que le RGPD, HIPPA et bien d&#039;autres, la collecte de donn\u00e9es peut s&#039;av\u00e9rer tr\u00e8s difficile, et encore plus dangereuse en cas de piratage. Dans de nombreux cas, faire appel \u00e0 un avocat co\u00fbtera bien plus cher que de faire appel \u00e0 un programmeur ou \u00e0 un data scientist. Ces difficult\u00e9s expliquent pourquoi certaines entreprises suppriment les donn\u00e9es d\u00e8s leur traitement.<\/p>\n<h4>Les sombres secrets de la gestion des donn\u00e9es \u2013 5. Le co\u00fbt du nettoyage des donn\u00e9es est \u00e9norme<\/h4>\n<p>Le nettoyage des donn\u00e9es consiste \u00e0 corriger et \u00e0 supprimer les donn\u00e9es inexactes d&#039;une base de donn\u00e9es ou d&#039;une table. En termes g\u00e9n\u00e9raux, le nettoyage des donn\u00e9es consiste \u00e0 identifier et \u00e0 remplacer les donn\u00e9es et enregistrements incomplets, inexacts, non pertinents ou probl\u00e9matiques.<\/p>\n<p>De nombreux data scientists admettent que leur travail consiste principalement \u00e0 collecter des donn\u00e9es, \u00e0 les pr\u00e9senter de mani\u00e8re coh\u00e9rente et \u00e0 g\u00e9rer d&#039;innombrables failles ou erreurs. Ceux qui disposent des donn\u00e9es affirment toujours\u00a0: \u00ab\u00a0Tout est au format CSV (Comma Separated Values, un format de fichier courant et relativement simple) pr\u00eat \u00e0 l&#039;emploi.\u00a0\u00bb Mais ils ne mentionnent pas les champs vides ni les descriptions d&#039;erreurs. Nettoyer les donn\u00e9es pour les projets de data science peut prendre jusqu&#039;\u00e0 dix fois plus de temps que lancer des routines en R ou Python pour r\u00e9aliser des analyses statistiques.<\/p>\n<h4>Les sombres secrets de la gestion des donn\u00e9es \u2013 6. Les utilisateurs sont de plus en plus m\u00e9fiants \u00e0 l\u2019\u00e9gard de vos pratiques en mati\u00e8re de donn\u00e9es<\/h4>\n<p>Les utilisateurs finaux et les clients se m\u00e9fient de plus en plus des pratiques de gestion des donn\u00e9es des entreprises. Les algorithmes d&#039;IA et leur utilisation n&#039;ont fait qu&#039;exacerber les craintes et susciter un profond malaise chez de plus en plus de personnes, notamment \u00e0 l&#039;id\u00e9e m\u00eame de collecter leurs donn\u00e9es. Ces inqui\u00e9tudes alimentent le processus r\u00e9glementaire et plongent souvent les entreprises dans des situations de crise de communication. De plus, des individus perturbent d\u00e9lib\u00e9r\u00e9ment la collecte de donn\u00e9es en utilisant de fausses valeurs ou des r\u00e9ponses erron\u00e9es. Parfois, la moiti\u00e9 du travail consiste \u00e0 g\u00e9rer des partenaires et des clients malveillants.<\/p>\n<h4><strong>Les sombres secrets de la gestion des donn\u00e9es \u2013 7. L&#039;int\u00e9gration de donn\u00e9es externes peut \u00eatre payante, mais elle peut aussi \u00eatre d\u00e9sastreuse.<\/strong><\/h4>\n<p>C&#039;est une chose pour les entreprises de poss\u00e9der les donn\u00e9es qu&#039;elles collectent, mais c&#039;en est une autre de vouloir int\u00e9grer leurs propres informations locales aux donn\u00e9es de tiers et \u00e0 la multitude d&#039;informations personnalis\u00e9es disponibles sur Internet. Certains outils promettent ouvertement de collecter des donn\u00e9es sur chaque client afin de cr\u00e9er un profil personnalis\u00e9 \u00e0 chaque achat. En effet, ils utilisent les m\u00eames termes que les agences d&#039;espionnage qui traquent les terroristes pour surveiller vos achats dans les fast-foods et votre score de cr\u00e9dit. Pas \u00e9tonnant que les gens soient inquiets et paniqu\u00e9s\u00a0!<\/p>\n<h4>Les sombres secrets de la gestion des donn\u00e9es \u2013 8. Les r\u00e9gulateurs r\u00e9priment l&#039;utilisation des donn\u00e9es<\/h4>\n<p>Personne ne sait quand une analyse de donn\u00e9es avis\u00e9e d\u00e9passera les bornes, mais lorsque ce sera le cas, les r\u00e9gulateurs interviendront. Dans un cas r\u00e9cent au Canada, une enqu\u00eate gouvernementale a r\u00e9v\u00e9l\u00e9 que certaines boutiques de beignets suivaient les clients qui faisaient \u00e9galement leurs achats chez des concurrents.<\/p>\n<p>Selon un communiqu\u00e9 de presse r\u00e9cemment publi\u00e9, \u00ab\u00a0L&#039;enqu\u00eate a r\u00e9v\u00e9l\u00e9 que le contrat de Tim Hortons avec un fournisseur de services de localisation tiers aux \u00c9tats-Unis contenait des termes si vagues et permissifs qu&#039;ils autorisaient l&#039;entreprise \u00e0 vendre des donn\u00e9es de localisation \u00ab\u00a0anonymis\u00e9es\u00a0\u00bb \u00e0 ses propres fins.\u00a0\u00bb Pour quoi\u00a0? Vendre plus de beignets\u00a0? Quoi qu&#039;il en soit, il s&#039;av\u00e8re que les autorit\u00e9s de r\u00e9glementation accordent une attention croissante \u00e0 tout ce qui touche aux renseignements personnels.<\/p>\n<h4>Les sombres secrets de la gestion des donn\u00e9es \u2013 9. Votre forfait de donn\u00e9es n&#039;en vaut peut-\u00eatre pas la peine<\/h4>\n<p>On imagine qu&#039;un algorithme performant peut tout rendre plus efficace et rentable. Un tel algorithme est parfois r\u00e9alisable, mais son co\u00fbt peut \u00eatre trop \u00e9lev\u00e9. Par exemple, les consommateurs (et m\u00eame les entreprises) remettent de plus en plus en question l&#039;int\u00e9r\u00eat d&#039;un marketing cibl\u00e9 issu de syst\u00e8mes de gestion de donn\u00e9es bien con\u00e7us. Certains soulignent que nous voyons souvent des publicit\u00e9s pour des articles que nous avons achet\u00e9s, car les outils de suivi publicitaire n&#039;ont pas compris que nous n&#039;en avions plus besoin.<\/p>\n<p>Le m\u00eame sort s&#039;abat souvent sur d&#039;autres projets. Parfois, une analyse rigoureuse des donn\u00e9es permet d&#039;identifier les usines les moins performantes, mais cela n&#039;a aucune importance puisque l&#039;entreprise a sign\u00e9 un bail de 30 ans pour le b\u00e2timent. Les entreprises doivent se pr\u00e9parer \u00e0 l&#039;\u00e9ventualit\u00e9 que tous les g\u00e9nies de la science des donn\u00e9es produisent une r\u00e9ponse inacceptable.<\/p>\n<h4><strong>Les sombres secrets de la gestion des donn\u00e9es \u2013 10. En fin de compte, les d\u00e9cisions relatives aux donn\u00e9es ne sont souvent que des jugements subjectifs<\/strong><\/h4>\n<p>Numbers can provide enough precision, but how humans interpret them is often what matters. After all the data analysis and AI manipulation, most algorithms need to decide whether a value is above or below a threshold. Sometimes scientists want p-values \u200b\u200bbelow 0.05; other times, police issue tickets for cars that are 20 percent faster. These thresholds are usually just arbitrary values. For all the science and math that can be applied to data, there are more grey areas in many &#8220;data-driven&#8221; processes than we think, and while companies may be investing all their resources into their data management practices, decisions are more dependent on Intuition and subjective judgment.<\/p>\n<h4>Les sombres secrets de la gestion des donn\u00e9es \u2013 11. Les co\u00fbts de stockage des donn\u00e9es explosent<\/h4>\n<p>Les disques durs sont de plus en plus volumineux et le prix du t\u00e9raoctet baisse, mais les programmeurs collectent des donn\u00e9es bien plus vite que les prix ne baissent. Les appareils de l&#039;Internet des objets (IoT) t\u00e9l\u00e9chargent constamment des donn\u00e9es, et les utilisateurs s&#039;attendent \u00e0 pouvoir parcourir ind\u00e9finiment cette riche collection d&#039;octets. Parall\u00e8lement, les responsables de la conformit\u00e9 et les r\u00e9gulateurs continuent d&#039;exiger toujours plus de donn\u00e9es en pr\u00e9vision de futurs audits. Ce serait une chose si quelqu&#039;un examinait r\u00e9ellement certaines de ces donn\u00e9es, mais le temps est limit\u00e9 dans une journ\u00e9e. Le pourcentage de donn\u00e9es r\u00e9ellement consult\u00e9es diminue de plus en plus. Cependant, le prix des packs d&#039;extension de stockage augmente.<\/p>\n<h3>Conclusion<\/h3>\n<p>Merci d&#039;avoir lu notre article. Si vous l&#039;avez appr\u00e9ci\u00e9, nous en serions ravis. Pour en savoir plus sur la gestion des donn\u00e9es, nous vous conseillons de consulter notre site. <a href=\"https:\/\/sqlflow.gudusoft.com\/#\/\"><strong>Gudu SQLFlow<\/strong><\/a> pour plus d&#039;informations.<\/p>\n<p>En tant que l&#039;un des\u00a0<strong><a href=\"https:\/\/www.dpriver.com\/blog\/2022\/05\/11\/best-data-lineage-tools\/\" target=\"_blank\" rel=\"dofollow noopener\">meilleurs outils de lignage de donn\u00e9es<\/a><\/strong>\u00a0Disponible sur le march\u00e9 aujourd&#039;hui, Gudu SQLFlow peut non seulement analyser les fichiers de script SQL, mais aussi obtenir\u00a0<strong><a href=\"https:\/\/www.gudusoft.com\/fr\/quest-ce-que-la-lignee-des-donnees-pourquoi-est-elle-importante\/\">lign\u00e9e de donn\u00e9es<\/a><\/strong>, et effectuer un affichage visuel, mais aussi permettre aux utilisateurs de fournir\u00a0<strong>lign\u00e9e de donn\u00e9es<\/strong>\u00a0au format CSV et effectuer un affichage visuel.\u00a0<strong>(Publi\u00e9 par Ryan le 27 ao\u00fbt 2022)<\/strong><\/p>\n<\/div><\/div><\/div><style type=\"text\/css\">.fusion-body .fusion-builder-column-0{width:100% !important;margin-top : 0px;margin-bottom : 0px;}.fusion-builder-column-0 > .fusion-column-wrapper {padding-top : 0px !important;padding-right : 0px !important;margin-right : 1.92%;padding-bottom : 0px !important;padding-left : 0px !important;margin-left : 1.92%;}@media only screen and (max-width:1024px) {.fusion-body .fusion-builder-column-0{width:100% !important;}.fusion-builder-column-0 > .fusion-column-wrapper {margin-right : 1.92%;margin-left : 1.92%;}}@media only screen and (max-width:640px) {.fusion-body .fusion-builder-column-0{width:100% !important;}.fusion-builder-column-0 > .fusion-column-wrapper {margin-right : 1.92%;margin-left : 1.92%;}}<\/style><\/div><style type=\"text\/css\">.fusion-body .fusion-flex-container.fusion-builder-row-1{ padding-top : 0px;margin-top : 0px;padding-right : 0px;padding-bottom : 0px;margin-bottom : 0px;padding-left : 0px;}<\/style><\/div>","protected":false},"excerpt":{"rendered":"","protected":false},"author":27,"featured_media":5648,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[178],"tags":[368,371,370,137,170,369,157,75],"_links":{"self":[{"href":"https:\/\/www.gudusoft.com\/fr\/wp-json\/wp\/v2\/posts\/5619"}],"collection":[{"href":"https:\/\/www.gudusoft.com\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.gudusoft.com\/fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/fr\/wp-json\/wp\/v2\/users\/27"}],"replies":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/fr\/wp-json\/wp\/v2\/comments?post=5619"}],"version-history":[{"count":31,"href":"https:\/\/www.gudusoft.com\/fr\/wp-json\/wp\/v2\/posts\/5619\/revisions"}],"predecessor-version":[{"id":5653,"href":"https:\/\/www.gudusoft.com\/fr\/wp-json\/wp\/v2\/posts\/5619\/revisions\/5653"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/fr\/wp-json\/wp\/v2\/media\/5648"}],"wp:attachment":[{"href":"https:\/\/www.gudusoft.com\/fr\/wp-json\/wp\/v2\/media?parent=5619"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.gudusoft.com\/fr\/wp-json\/wp\/v2\/categories?post=5619"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.gudusoft.com\/fr\/wp-json\/wp\/v2\/tags?post=5619"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}