2 décembre 2021

Temps de lecture : 7 min

Les datas au service de l’intérêt général

« Rien n’est bon ni mauvais en soi, nous dit Hamlet, tout dépend de ce que l’on en pense. »* Alors gardons la tête froide : si la récolte et le traitement de milliards de data sont la porte ouverte à bien des abus, ils sont aussi un incroyable outil pour aider à mieux soigner, à protéger l’environnement, à lever des fonds pour de bonnes causes… 

Demandons-nous si les data peuvent servir le bien commun. Certes, la collecte et le traitement des données personnelles nous inquiètent, et pour cause nos informations privées sont constamment exploitées, vendues voire volées à notre insu. En 2018, la société britannique Cambridge Analytica a collecté mis la main en toute illégalité sur les data de plus de 90 millions d’utilisateurs de Facebook pour dans le but de créer un programme capable depour prédire et influencer les choix des électeurs américains. Deux ans plus tôt, Uber avait été la victime du piratage des informations de 57 millions de ses chauffeurs et passagers. En 2013 et 2014, les données provenant de 1,5… milliard de comptes portés par Yahoo! avaient été vendues sur le marché noir. Il y a deux ans, 1,4 million de coordonnées de clients des 200 plus grands sites français de commerce en ligne ont été mises en vente par des criminels. Rien qu’en avril 2021, ce sont les informations de 533 millions d’utilisateurs de Facebook qui ont été publiées gratuitement sur un forum de piratage. Et durant l’été, les données personnelles d’environ 1,4 million de patients de l’Assistance Publique-Hôpitaux de Paris (APHP) ont été dérobées lors d’une attaque informatique.

 

Cette avalanche de scandales ne semble pas vouloir s’arrêter. Les données sont une marchandise à forte valeur lucrative, mais elles données peuvent pourtant aussi servir des bonnes causes justes, comme le progrès des avancées médicales, et la protection de l’environnement, ou être aider un moyen pour les des associations de trouver de nouveaux donateurs. « L’or noir » du troisième millénaire n’est pas forcément polluant…

La data contre la pandémie

Les analystes le disent tous : la collecte et le traitement des data ont permis d’accélérer la lutte contre le Covid-19. Taux d’incidence et de mortalité, nombre de malades, de patients hospitalisés et de lits disponibles dans chaque hôpital, mouvements des populations, centres de soin disposant de vaccins, partage des données scientifiques pour faire avancer nourrir la recherche… Sans l’open data, le machine learning et l’intelligence artificielle, la découverte, l’homologation et la commercialisation des vaccins contre le coronavirus auraient pris beaucoup plus de temps. « Datavisualiser » des informations pour protéger notre santé ne date pas d’hiern’est pourtant pas une nouveauté ; c’est en superposant sur une carte les adresses des victimes du choléra que John Snow découvrit en 1854 que la plupart d’entre elles avaient accès au point d’eau… Les data sont en cela un incroyable outil d’information.

L’IA contre la cécité

Lancé en mars 2020 par un étudiant à Telecom Nancy, Guillaume Rozier, le site CovidTracker a été consulté par des millions de Français désireux de suivre jour après jour l’évolution de la pandémie dans l’Hexagone. L’exploitation des données de santé peut également être très efficace dans le domaine de la prévention. L’agence américaine du médicament (FDA) autorise depuis 2018 l’utilisation de l’intelligence artificielle pour lutter contre la rétinopathie diabétique, qui est une des causes principales de la cécité chez l’adulte. « Le Big Data peut changer nos vies, expliquait Guillaume Rozier à 20 Minutes. Les algorithmes sont meilleurs que l’œil humain. Ils sont plus neutres et sont capables d’apprendre sur des millions d’images afin de reconnaître un motif que l’humain ne sera pas forcément capable de voir avec ses yeux. » Une simple photo permet déjà au logiciel IDx-DR de détecter, sans l’aide d’un médecin, une fragilité des micro-vaisseaux sanguins de la rétine.

L’agence américaine du médicament (FDA) autorise depuis 2018 l’utilisation de l’intelligence artificielle pour lutter contre la rétinopathie diabétique.

L’étude des données peut également aider à comprendre pourquoi tel type de cancer répond mieux à certains traitements plutôt qu’à d’autres. En France, plusieurs cliniques utilisent depuis deux ans le logiciel d’IA de la jeune pousse TheraPanacea pour déterminer les organes à risque à ne pas irradier lors d’une radiothérapie. La start-up Medidata aide, quant à elle, les laboratoires à réduire le coût et la durée de leurs essais cliniques en trouvant les bons patients grâce à l’exploitation des données de plus de 23.000 essais cliniques. « L’algorithme santé que nous sommes en train de développer a pour objectif d’optimiser toutes les étapes du traitement, précise Nikos Paragios, le CEO de cette jeune société fondée en mars 2017. Il devrait notamment rendre possible la radiothérapie dite adaptative à la volée, qui utilise le “machine learning” pour réguler, en temps réel, la dose délivrée au patient en fonction des changements anatomiques, et à terme en fonction des mouvements des organes pendant les séances de radiothérapie. » La start-up américaine Medidata Solutions Inc. accompagne, quant à elle, les laboratoires dans la réduction des coûts et durées de leurs essais cliniques en sélectionnant les bons patients grâce à l’exploitation des données de plus de 23000 essais cliniques. La collecte et le traitement des datas peuvent également fournir une information très utile pour la sauvegarde de la biodiversité.

Des data pour l’écologie en veux-tu en voilà…

L’open data peut être un outil pour alerter les scientifiques et les citoyens sur les conséquences liées notamment au réchauffement climatique. L’Unesco a développé en 2017 un site qui rassemble des données sur l’eau. Stress liés à l’agriculture ou à l’urbanisation, eaux souterraines, aquifères transfrontaliers, pourcentage d’eaux traitées dans les grandes villes… Des dizaines de cartes sont disponibles sur le Web. Sur le portail officiel des données européennes (data.europa.eu), plus de 265000 jeux de données liées à l’environnement et au climat sont libres d’accès. Dans le cadre de son programme « AI on Earth » lancé en 2017, Microsoft développe imagine des outils, des modèles et des infrastructures afin d’accélérer le développement technologique en faveur du respect de l’environnement. Son Planetary Computer combine des pétaoctets [1 Po équivaut à 10 puissance 15 octets (1 Po = 1015 o), ndlr] de données et des outils d’analyse spatiale afin d’alimenter des applications de durabilité. Le géant américain met également à la disposition de plusieurs organisations sa technologie Cloud et ses logiciels d’IA afin de les soutenir dans leurs programmes. Imazon, une organisation brésilienne à but non lucratif qui se consacre à la conservation de la forêt amazonienne, utilise Microsoft Azure pour déterminer les risques de déforestation. Le World Mosquito Program se sert de ce même outil pour trouver localiser les meilleurs sites où lâcher des moustiques porteurs de Wolbachia, cette bactérie qui empêche ces insectes de propager des arbovirus comme la dengue et le chikungunya. Sachant que la biodiversité est aussi « cruciale pour notre santé et notre prospérité, il devrait être aussi facile pour quiconque dans le monde de rechercher l’état de la planète que de rechercher sur Internet des itinéraires ou des restaurants, soulignait dans son blog Brad Smith, le PDG de Microsoft. Nous devons utiliser l’architecture de l’ère de l’information – données, calcul, algorithmes… – pour accélérer un avenir plus respectueux de l’environnement ».

« Il devrait être aussi facile pour quiconque dans le monde de rechercher l’état de la planète que rechercher sur Internet des itinéraires ou des restaurants. »

En France, l’Agence de l’environnement et de la maîtrise de l’énergie (ADEME) a créé un portail pédagogique en open data à destination des collectivités locales, des pouvoirs publics et du grand public. L’idée ? Les aider à « progresser dans leur démarche environnementale et à démultiplier les actions en faveur de la transition écologique ». Sur ce site, 114 jeux de données et 38 visualisations permettent de découvrir notamment les points noirs de bruit, les sites pollués, les installations de stockage des déchetteries et les diagnostics de performance énergétique des logements. Les données ne donnent pas uniquement des informations globales sur l’environnement. Elles peuvent sont aussi une aide à la prise de décisions au niveau local.

« La puissante combinaison de la technologie des capteurs et de l’analyse des données va transformer la façon dont nous gérons les services de pollinisation. »

Le World Bee Project utilise ainsi le Big Data et l’IA pour protéger les abeilles. Des ruches bourrées de capteurs connectés au Cloud d’Oracle permettent de protégers ces pollinisateurs. La hausse de l’intensité des basses fréquences signifie, par exemple, qu’une colonie s’apprête à former un nouvel essaim. Informé, l’apiculteur qui peut capturer cette troupe d’abeilles et la mettre déplacer dans une nouvelle ruche. À l’inverse, l’augmentation du niveau de bruit marque  l’agitation d’une colonie quand la ruche est attaquée par un frelon. Averti par son smartphone, l’éleveur peut se précipiter vers sa ruche pour et sauver la reine mère. « La puissante combinaison de la technologie des capteurs et de l’analyse avancée des données va transformer la façon dont nous surveillons, modélisons, comprenons et gérons les services de pollinisation », se réjouit George Clouston, le conseiller scientifique du World Bee Project.

Le Big Data vous trouve désigne des donateurs

Les data sont également de plus en plus utilisées par les ONG sont par ailleurs de plus en plus intéressées par les data pour trouver des donateurs. Les plus petites associations font appel à des pure players, comme iRaiser ou Mipise, qui leur proposent des solutions de marketing automation afin d’interagir de façon automatique et personnalisée avec chaque donateur mécène, ainsi que des outils CRM qui suivent l’ensemble des interactions et des paiements des prospects et des donateurs. Les plus gros organismes font, quant à eux, appel aux mêmes prestataires que les groupes du privé. « Nous avons fait confiance à Salesforce, car leur logiciel nous permet d’avoiroffre une vision à 360° sur nos donateurs, explique Lucie Bringer, la responsable du service de collecte de fonds chez Amnesty International France. Cet outil est très réactif et il nous donne une vision en temps réel de nos campagnes papier, téléphonique et digitale. Il est aussi transversal. Quand une personne nous envoie un don, elle reçoit cinq minutes après un e-mail de remerciement, et lorsqu’elle répond à un appel, on lui envoie des nouvelles de la campagne qu’elle soutient. Ce programme représente un investissement, mais il est très efficace. » Et pour cause. « Sur chaque campagne numérique de collecte, nous récoltons en moyenne 4 euros pour chaque euro investi, révèle Vincent Crehalet, le directeur de la collecte grand public d’Action Contre la Faim. Ce rapport est de 1 à 3 pour le papier et de 1 à 1 pour la prospection. » Les data parfois ont du bon !

 

*William Shakespeare, Hamlet (1601), II, 2.

 

Pour en savoir plus sur la revue INfluencia, ou vous abonner à ce numéro 38, « Data, la nouvelle identité » c’est par ici !

 

 

 

 

 

 

 

Frédéric Thérin

À lire aussi sur le même thème

Allez plus loin avec Influencia

the good newsletter

LES FORMATIONS INFLUENCIA

les abonnements Influencia