Polémique #StopCovid sur Twitter : un débat d’experts où les politiques n’arrivent pas à convaincre

Le développement par le gouvernement de l’application StopCovid, qui vise à suivre les malades du Covid pour prévenir les personnes les ayant croisées via le Bluetooth, fait polémique, sans pour autant atteindre le niveau du professeur Raoult et de la chloroquine. Sans surprises, Twitter a été exploité comme arène de débat impliquant politiques, experts techniques, membres d’ONG et citoyens inquiets … mais pour un impact finalement très faible, comme le montre l’évolution des mentions Twitter depuis le 28 mars obtenue via la plateforme de veille Visibrain :

Nous sommes donc en présence d’un débat passionné, qu’on annonce comme capable de diviser la majorité présidentielle lors du vote prévu le 28 avril, sur un sujet qui mobilise finalement uniquement certains experts et militants … de la même façon, sommes toutes, que la voracité des GAFA et acteurs américains sur la collecte et le captage de nos données préoccupe peu le français (ou l’européen) moyen. Apple et Google préparent pourtant leur propre protocole d’application, qui sera bien évidemment mis à disposition des gouvernements, sous réserve de renoncer au contrôle sur les données collectées ! Cette association rappelle d’ailleurs que si Apple essaye de se distinguer de Google sur la collecte des données personnelles, la firme de Mountain View paye des milliards pour être le moteur de recherche par défaut sur iOS, relativisant clairement leur discours sur la protection des données des utilisateurs d’Iphone.

La plateforme de veille Visibrain a collecté toutes les mentions du Covid-19 / Coronavirus en français, via une équation très complexe incluant des centaines de termes pour obtenir toute mention en lien avec le virus, sans forcément indiquer le terme. Cela nous permet d’y ajouter un filtre spécifique à StopCovid : StopCovid OR tracking OR CNIL OR traçage OR tracage OR tracetogether OR « trace together. Cela correspond à 49 185 tweets du 10 avril au 27 avril 2020 à 12h, par 26 613 utilisateurs.

Afin d’obtenir une analyse précise des tweets, j’ai exporté via Visibrain un fichier caractérisant les échanges entre les comptes Twitter. Ce fichier, exploité avec le logiciel de datavisualisation Gephi, permet de mettre en évidence les leaders des échanges. En effet, la seule détection des principaux termes et des comptes les plus mentionnés ne permet pas de comprendre qui mène le débat. Invisibles via des données quantitatives (comptes les plus mentionnés, hashtags les plus repris, voir thématiques émergentes / trending topics), les données liées à la détection de communautés et à leurs caractéristiques sont les seules qui permettent une analyse précise et sans biais des échanges Twitter.

Des communautés éclatées qui ne parlent pas entre elles, entre débat d’expert et polémique politique

Aucune communauté ne domine les échanges. Si comme pour la majorité des analyses sur Twitter, les 8 plus grosses communautés, auxquelles Gephi attribue une couleur, représentent plus de 50 % des comptes Twitter actifs, elles sont toutes structurées autour de quelques leaders très mentionnés :

  • La CNIL est très reprise par sa communauté, mais peu en dehors ;
  • Nicolas Dupont Aignan, Julien Bayou et Olivier Faure (en dénonçant l’ajout d’un vote sur le déconfinement à celui sur StopCovid),  se sont exprimés via des tweets repris principalement dans leurs réseaux militants ;
  • Cedric O, lui aussi repris par sa propre communauté, est par ailleurs mentionné à son insu via un tweet de Rand Hindi, qui critique la technologie proposée par le gouvernement (il est par ailleurs PDG de Zama Crypto, qui propose des solutions de cryptage de données) ;
  • Une communauté d’expert en bleu clair en haut à gauche autour de l’INRIA (qui développe le protocole de StopCovid), Antonio Casilli (chercheur à l’EHESS) et Manhack (Jean Marc Manach, journaliste d’investigation à Next Impact) apparaît mais est moins mentionnée que les autres.

On peut néanmoins noter deux communautés qui semblent peser plus sur le débat, en croisant avec les données quantitatives de Visibrain :

La cartographie des communautés, en mettant en valeur les comptes Twitter les plus repris, nous donne donc des premiers éléments d’analyse, mais sans confirmer qui a dominé les échanges. Gephi permet d’utiliser un autre algorithme pour identifier les comptes repris par d’autres communautés, et donc au centre des échanges, qui va nous permettre d’en savoir plus.

Antonio Casilli, Jean-March Manach et la CNIL, plus influents que les politiques et les médias

En filtrant les comptes ayant le score de centralité dans les échanges le plus élevé, on obtient une cartographie différente, qui met en valeur la CNIL et la communauté des experts en bleu clair :

La tribune publiée le 25 avril sur Le Monde d’Antonio Casilli, Paul-Olivier Dehaye et Jean-Baptiste Soufron contre StopCovid (ce dernier en avait déjà publiée une sur Libération le 10 avril, d’où son positionnement un peu à l’écart des autres membres de sa communauté sur la carto) a obtenu un écho certain, qui leur a permis d’être repris par d’autres communautés. En complément, les alertes de la CNIL, les critiques techniques via Numerama ou des experts du secteur obtiennent une forte visibilité, qui efface finalement le poids des élus du gouvernement.

On constatera d’ailleurs qu’en dehors du parti socialiste, la quasi-totalité des politiques impliqués dans le débat en ligne ont disparu, puisqu’ils ne touchent pas ou peu de monde en dehors de leurs communautés. Il faut se méfier des forts volumes de mentions des dirigeants nationaux, liés à des stratégies d’activation de militants qui peuvent impressionner les médias mais dont on voit ici le manque de portée et d’influence.

La cartographie des comptes avec le plus d’abonnés, souvent les médias donc ou des élus très suivis, ne valorise d’ailleurs presque que des acteurs finalement peu influents sur les échanges :

La question de la souveraineté numérique, qui cache celle de notre compétitivité technologique

Le débat sur Twitter semble donc tranché, en défaveur du gouvernement : les solutions techniques proposées comme les garanties pour la protection des données personnelles ne seraient pas adaptées, il faut abandonner ce projet.

J’ai co-dirigé ces derniers mois un travail universitaire visant à appliquer l’IA au traitement de données Twitter, sans exploiter les données personnelles des utilisateurs, et je participe en parallèle à l’encadrement d’une thèse sur les objets connectés en santé. Dans le cadre de mes fonctions à l’ADIT, je m’intéresse aux enjeux concurrentiels des secteurs innovants, tous consommateurs de données, où l’on retrouve les GAFA face aux sociétés européennes, avec les BATX en embuscade … Si je souscris à l’importance de revoir le développement de StopCovid, je considère qu’il n’est pas dans notre intérêt d’y renoncer, et pas seulement pour lutter contre le coronavirus.

Il est essentiel que nous trouvions une solution à ces polémiques. C’est en effet l’occasion pour la France, voir ses partenaires européens, de développer une alternative à des outils que sont déjà en train de mettre en place les GAFA. Dans le cas contraire, nous pouvons définitivement abandonner la course à l’innovation dans les années à venir. Voir nous inquiéter un peu plus pour nos libertés personnelles, comme le montre une actualité récente d’Amazon aux USA, peu reprise en France alors qu’elle résume bien l’état d’esprit des GAFA.

L’avenir de la santé, secteur stratégique comme on le voit, d’autant plus pour notre pays qui compte des leaders mondiaux, se jouera sur la capacité à traiter les données. Des objets connectés à l’utilisation de l’IA pour améliorer le diagnostic médical, la médecine de demain se fera avec les données des patients. Commencer dès maintenant à réfléchir à des protocoles qui permettraient de nourrir la recherche en santé tout en protégeant les données, c’est la seule voie pour la France et l’Union Européenne. Déjà les GAFA et les BATX, qui se positionnent sur le secteur, exploitent toutes les données santé qu’ils peuvent, sans se préoccuper d’ailleurs de l’avis des patients.

C’est leur erreur, qui peut devenir notre atout. Ils ont de l’avance, et des moyens, c’est certain. Mais, comme Cambridge Analytica l’a montré avec Facebook, traiter les données personnelles à la légère amène de réels risques stratégiques avec des fuites de données incontrôlables. Des systèmes de traitement des données médicales conçus sur un modèle de privacy by design ne poseront pas ces soucis. Cette expertise en cohérence avec le RGPD, nous l’avons en France, avec la société Retency par exemple, citée dans les tweets sur StopCovid.

Outre le consortium d’acteurs français travaillant sur une application depuis plusieurs semaines (Orange, Capgemini, Dassault Systèmes, Sopra-Steria), l’application Coalition, développée par le français Micha Benoliel aux USA (et oui), qui avait développé en 2014 l’application Firechat, très utilisée par les opposants au gouvernement chinois à Hong-Kong, propose un système innovant et totalement anonyme :

Nous avons donc les moyens, les talents pour le faire, des start-up à valoriser : à l’Etat de renoncer à un contrôle centralisé et une technologie propriétaire, sources de risques renforcés d’échec technologique et de fuites de données. Un système décentralisé, contrôlable par tous, s’appuyant sur des technologies open source robustes sera d’autant plus fort qu’il pourra devenir une référence pour d’autres Etats, dans la longue lutte qui s’annonce contre ce virus.

MAJ du 27/05/2020

Alors que l’application est fonctionnelle et qu’elle doit être présentée l’Assemblé Nationale, l’analyse des échanges Twitter sur les deux dernières semaines via la plateforme Visibrain (du 13 au 27 mai) confirme le faible poids des politiques sur les débats. Si l’opposition est peu active et reprise sur le sujet ces dernières semaines, ce sont des collectifs citoyens (en vert en bas de la carto) qui représentent la première communauté, avec 10 % des comptes Twitter. Pour autant, ils ne sont pas repris en dehors de leurs abonnés, comme la CNIL par ailleurs. Cédric O est isolé, et peu soutenu dans les rangs de la République en Marche, en dehors de Lionel Costes.

Les experts tels que la Quadrature du Net et Antonio Caselli, même moins mentionnés, sont toujours plus les influents dans les échanges.

 

Une réflexion sur “Polémique #StopCovid sur Twitter : un débat d’experts où les politiques n’arrivent pas à convaincre

  1. Pingback: La revue de web du 4 mai 2020 – Akademys

Votre commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l’aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Google

Vous commentez à l’aide de votre compte Google. Déconnexion /  Changer )

Image Twitter

Vous commentez à l’aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l’aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s