Données massives vivantes
Les données massives découlent de la trace numérique que l’on laisse lorsque l’on utilise cartes de crédit, téléphones portables ou que l’on consulte la toile électronique. Employées judicieusement et avec précision, ces données nous donnent une perspective pour comprendre notre société et améliorer la façon dont nous vivons et travaillons.
Mais ce qui fonctionne en théorie pourrait ne pas se traduire correctement dans le monde réel, là où les interactions humaines complexes ne peuvent pas toujours être saisies, même dans les modèles les plus complexes. Les données massives nous forcent à expérimenter à très grande échelle.
CAMBRIDGE – Mon propre laboratoire, par exemple, est en train de créer un site Web qui, sur la base de cartes Google, utilise les pistes numériques de la société pour cartographier les taux de pauvreté, de mortalité infantile, de criminalité et les changements dans le PNB et autres indicateurs sociaux, quartier par quartier, et qui peut être actualisé quotidiennement. Cette nouvelle fonctionnalité permet aux utilisateurs d’observer, par exemple, les endroits où les initiatives gouvernementales donnent des résultats et ceux où elles sont inopérantes.
Évidemment, ces outils de visualisation si impressionnants peuvent grandement améliorer la transparence afin de mieux renseigner le public, mais ils sont remarquablement limités lorsqu’utilisés pour essayer de régler les problèmes de la société. L’une des raisons étant que ces sources de données incitent à faire des corrélations factices.
Même en utilisant la méthode scientifique habituelle, les résultats sont faussés, car avec tant de points de mesure et tellement plus de relations potentielles parmi tous ces liens jaugés, nos outils d’analyse statistique produisent des résultats dénués de sens. Sans avoir connaissance de toutes les possibilités, il est impossible d’élaborer un ensemble vérifiable d’hypothèses restreintes, tranchées et vérifiables. Puisque nous ne pouvons plus nous fier aux expériences en laboratoire pour une analyse de causalité, il faut donc le faire dans le monde réel, en utilisant des volumes massifs de données en temps réel. Ce qui veut dire qu’il faut aller au-delà de la procédure typique du laboratoire fondée sur le fait de poser des hypothèses et de les vérifier en vase clos. Nous devons appliquer nos concepts au sein même dans la société, plus en amont dans l’analyse à une plus grande fréquence que jamais auparavant.
Pour découvrir comment les choses fonctionnent vraiment dans la réalité, nous devons construire des laboratoires in vivo, dans des communautés disposées à essayer de nouvelles façons de faire (pour parler franc des collectivités prêtes à servir de cobaye). Un exemple d’un tel laboratoire est le projet de "données urbaines ouvertes" que j’ai lancé avec la ville de Trente en Italie, en collaboration avec Telecom Italia, Telefónica, l’université de recherche Fondazione Bruno Kessler, l’institut ID3 spécialisé dans la conception orientée par les données et des entreprises locales. Essentiellement, ce laboratoire vivant a reçu l’assentiment et le consentement éclairé de tous ceux qui y participent ; tous savent qu’ils prennent part à une expérience gigantesque dont le but est de créer un meilleur mode de vie.
Un défi majeur pour un laboratoire vivant est de protéger la confidentialité des informations des personnes sans diminuer le potentiel d’une meilleure gestion des affaires publiques. Le laboratoire de Trente, par exemple, pilotera mon projet du nouveau "contrat social sur les données" qui offre aux utilisateurs un plus grand contrôle sur leurs données personnelles par le truchement de logiciels de réseaux fondés sur la confiance tel que notre système ouvert de personnalisation des données des achats (PDS). Nous espérons que la capacité d’échanger des données en sûreté, tout en protégeant la confidentialité, encouragera les personnes, les entreprises et les instances à communiquer leurs idées afin d’augmenter la productivité et la créativité dans toute la ville.
Cependant, la plus grande difficulté d’utilisation des données massives pour la construction d’une meilleure société serait celle de développer des connaissances intuitives à échelle humaine de la physique des sociétés. Même si des données à haute densité continue et les techniques modernes de traitement informatique nous permettent de cartographier un grand nombre de détails sur notre société afin d’expliquer comment les communautés fonctionnent, ces modèles mathématiques bruts comportent un trop grand nombre de variables et de relations complexes pour que la plupart des gens puissent les comprendre.
Un dialogue est nécessaire entre l’intuition humaine et la réalité bien concrète des données volumineuses, dialogue d’ailleurs absent des systèmes actuels de gestion privés et publics. Pour que les données massives soient déployées efficacement, les gens doivent être en mesure de comprendre et d’interpréter les statistiques qui les concernent.
Ceci demande une nouvelle appréhension du comportement humain et des dynamiques sociales qui va bien au-delà des modèles économiques et politiques traditionnels. Ce n’est développant une nouvelle science et le nouveau vocabulaire de la physique des sociétés que nous serons en mesure de faire de l’univers des données massives un monde dans lequel nous voulons vivre.
Traduit de l’anglais par Pierre Castegnier
© Project Syndicate 1995–2014
à lire aussi
Article : Prévisions météorologiques pour le lundi 20 avril 2026
Voici les prévisions météorologiques pour le lundi 20 avril 2026, établies par la Direction générale de la météorologie (DGM): - Températures en hausse avec temps […]
Article : Dette hybride. Au-delà de la levée, le modèle et les contraintes d’OCP
Derrière le succès de son émission obligataire hybride d’avril 2026, le groupe OCP révèle une équation financière complexe. Entre montée de la fiscalité, politique de dividendes, investissements massifs dans la transition verte et dans des activités hors cœur de métier, le champion des phosphates doit désormais arbitrer dans un environnement compliqué.
Article : Un nouveau “dictionnaire critique” pour relire le Maroc colonial
Un ouvrage collectif dirigé par l’anthropologue marocain Hassan Rachik propose une relecture de la période coloniale à travers un format original de dictionnaire, réunissant une vingtaine de chercheurs marocains, français et espagnols.
Article : Sahara: despite Algiers’ efforts, Washington’s position remains unchanged
On the sidelines of the Antalya Diplomacy Forum in Turkey, Algeria’s foreign minister and the U.S. president’s senior advisor for Arab and African affairs discussed several regional issues, including the Sahara. Yet behind the carefully worded Algerian statement, Washington’s support for Morocco’s territorial integrity remains clear and unchanged. Since December 2020, that position has taken on the weight of state continuity, suggesting it will endure regardless of political turnover in Washington or diplomatic initiatives from Algiers.
Article : Santé animale : Biopharma et le Tchad passent à la phase opérationnelle de leur partenariat
La société pharmaceutique marocaine Biopharma a signé à N’Djamena une feuille de route de coopération avec l’Institut tchadien de recherche en élevage pour le développement (IRED), dans le cadre du renforcement de la coopération maroco-tchadienne dans le domaine de la santé animale.
Article : Casablanca : les autorités démentent auprès de Médias24 une rumeur sur une fermeture des commerces à 23 heures à Anfa
Les autorités ont démenti, auprès de Médias24, l’existence d’une décision imposant la fermeture des commerces, cafés et restaurants à 23 heures dans le ressort de la préfecture d’arrondissements de Casablanca-Anfa, après la circulation d’informations en ce sens sur certains sites et réseaux sociaux.