Contre la dark data, le tri sélectif de la donnée

Les organisations ont tendance à conserver des données inutiles. Ce stockage a un coût financier et environnemental, qu’il est possible de minimiser avec davantage de frugalité numérique.

“Pour une plus grande frugalité numérique, commencer par établir un data mapping.”

Selon une étude de la société Veritas, 52 % des données d’entreprises stockées sur des serveurs ne sont jamais utilisées. Ces données inertes sont les dark data. Il peut s’agir de données collectées dans le cadre d’un projet abandonné ou de données répondant à des exigences de conformité réglementaire et qui n’ont pas été supprimées dans les délais légaux. L’envoi en nombre d’e-mails et la redondance de fichiers bureautiques contribuent à ce gaspillage.

La dark data croît de manière exponentielle avec l’essor de l’intelligence artificielle et de l’Internet des objets, qui génère un flux continu d’informations (données de géolocalisation, fichiers de logs). Un rapport d’IDC prédit ainsi que la quantité de données stockées dans le monde passera de 33 zettabytes (1021) en 2018 à 175 ZB en 2025.

Cette croissance rapide du volume d’informations génère un surcoût de stockage. Ces données mobilisent des ressources énergétiques importantes, avec un lourd impact sur l’environnement. D’après Veritas la dark data sera à l’origine de 6,4 millions de tonnes de CO2 relâchées dans l’atmosphère en 2020. C’est l’équivalent de la production de 80 pays individuels.

Par négligence ou dans le secret espoir de les valoriser par la suite, les organisations et les entreprises tendent à conserver l’intégralité de leurs données et à ne pas se livrer à un “tri sélectif”. Elles ont du mal à se départir de ce mauvais réflexe qu’entretiennent, d’une part, la réduction constante des coûts de stockage et, d’autre part, la croissance des GAFAM, dont le modèle d’affaires est fondé sur le stockage massif de ces données dormantes.

Gouvernance de la donnée

Pour revenir à une plus grande frugalité numérique, une organisation doit commencer par disposer d’une vision complète des données qui circulent dans son système d’information. Cette cartographie (data mapping) ne doit pas occulter le “shadow IT”, c’est-à-dire les applications déployées sous le radar de la DSI (Direction du système d’information). Cette informatique “parallèle” génère un flot invisible de données.

À partir de cette cartographie, l’entreprise peut poser des règles de collecte et de stockage des données en fonction de leur criticité et de leur valeur dans le temps.

On distingue à cet égard des données chaudes, utilisées fréquemment, et des données froides, qui sont archivées. Plus une donnée est froide et moins son hébergement coûte cher, puisqu’il fait appel à des supports comme les bandes magnétiques ou des solutions d’archivage dans le cloud. Par ailleurs, ces données froides étant rarement appelées, leur récupération est faiblement consommatrice en énergie.

Purges automatiques

Entré en vigueur il y a deux ans, le règlement général européen sur la protection des données personnelles (RGPD) conforte la mise en place de cette gouvernance de la donnée. Le RGPD introduit en effet un droit à l’effacement.

Avec ce “droit à l’oubli”, une organisation doit garantir aux personnes qui lui en font la demande que leurs données seront bien supprimées de ses systèmes, dans un délai de 30 jours.

Techniquement, cela suppose d’industrialiser les processus de destruction des données. Ces purges automatiques concernent également les données qui ont dépassé la durée légale de conservation, comme celles des clients inactifs (ne répondant plus à aucune sollicitation) depuis trois ans.

Au-delà de ces actions collectives, le collaborateur doit être sensibilisé sur son rôle dans l’inflation de la dark data. Il convient de lui rappeler régulièrement de bonnes pratiques, comme éviter l’envoi d’e-mails en copies multiples, se désabonner des newsletters qu’il n’ouvre plus ou supprimer régulièrement les documents devenus inutiles. Une prise de conscience individuelle qui peut faire boule de neige.

A lire aussi sur Hello Future

Un bateau en mer à côté d'une bouée

Un jumeau numérique pour une meilleure gouvernance de l’océan

Découvrir
Jumeaux Numériques

Jumeaux numériques

Découvrir
Modèle de molécule

Matérialiser les données pour mieux les comprendre

Découvrir

Live Data Hub : permettre aux villes de prendre le contrôle de leurs données

Découvrir

Big Data : quand la donnée améliore l’efficacité énergétique des réseaux

Découvrir
La data au secours du climat

La data au secours du climat

Découvrir