Interview : Big Data « Des enjeux économiques et démocratiques »
Auteur : Propos recueillis par Monique Van Dieren et Guillaume Lohest
Pour THOMAS LEMAIGRE, chercheur indépendant, enseignant, co-directeur de la Revue Nouvelle, ce n’est vraiment pas une bonne idée pour la démocratie qu’on soit tous espionnables à merci. Et le formatage des offres de contenus qui s’opère grâce aux algorithmes réduit à notre insu nos goûts et notre horizon de pensée. Il ne prône pas l’abstinence numérique, mais le développement de l’esprit critique et la création d’outils numériques pour préparer la contre-attaque.
La puissance des Big Data s’est construite sur l’immense masse de données récoltées. Par quel biais ces informations sont-elles captées ?
Il n’y a pas qu’un seul fonctionnement, et c’est cela qui fait la force des Big Data. Elles se constituent par des canaux différents et complémentaires. L’histoire d’Internet se double d’une histoire de la récolte de données, qui devient de plus en plus élaborée. Prenons l’exemple des cookies. Il s’agit à l’origine d’un petit fichier texte stocké dans votre disque dur, qui est un aide mémoire pour votre navigation sur Internet. Le cookie enregistre localement des données de connexion pour qu’à votre prochain passage sur le même site, une série d’informations soient préenregistrées.
C’est un premier moyen, basique, de collecte de données. Mais cette technologie est tellement simple qu’elle a donné lieu à des tas de développements. Et cette récolte de données se déroule à faible bruit, c’est-à dire sournoisement. Même si on a vu passer le message, à présent obligatoire, qui nous demande d’accepter l’utilisation de ces cookies, savons-nous réellement ce que cela implique ? La collecte de données est énorme. Une partie de la collecte de Big Data s’opère grâce aux réseaux sociaux, comme Facebook, qui est capable de collecter énormément d’informations uniquement à partir de ses propres fonctionnalités, à partir des comportements des utilisateurs : les likes, les partages, etc. Il ne se limite pas à cela, bien sûr, car il y a souvent un échange de données avec des sites tiers.
Par exemple, on a la possibilité de se connecter à des sites internet ou des plateformes par l’interface de notre compte Facebook ou Google+. Ce faisant, il y a un échange de données. Si l’on se connecte de cette façon sur RTBF-Auvio par exemple, Facebook est en capacité de récupérer des données liées à notre utilisation d’Auvio.
Ce qui a donné le coup d’accélérateur aux Big Data, c’est l’apparition du smartphone. Les applications qu’on utilise abondamment fonctionnent comme des petits mouchards sur toute une série de comportements. La géolocalisation évidemment est l’une des sources d’information possibles. Mais le simple fait de laisser son smartphone Android allumé avec la navigateur Chrome ouvert en tâche de fond permet à Google de collecter des données vous concernant en moyenne toutes les 4 minutes 25 secondes ! Et tout ceci n’est encore rien à côté de ce que vont permettre à leurs opérateurs les objets connectés, la reconnaissance vocale ou la voiture sans pilote…
Les enjeux ne sont donc pas seulement commerciaux. Il faut prendre conscience des potentialités antidémocratiques du Big Data. On a maintenant des applications qui permettent de faire des paiements directs au moyen de QR codes, sans passer par une carte ou de la monnaie. Un tel dispositif enregistre un tas d‘informations sur nos achats, en l’occurrence. En Chine, on en est déjà à du ranking social, avec des algorithmes qui calculent votre niveau de civilité à partir de données récoltées sur les comportements. Est-ce que vous avez rendu votre voiture de location en retard ? Est-ce que vous êtes arrivé en retard à l’école de vos enfants ? Etc. Cela peut aller très loin.
Rassurez-nous, en Europe nous n’en sommes pas encore là…
Je ne sais pas précisément où on en est. Mais en Europe, on a heureusement une législation sur la protection de la vie privée et des données personnelles qui est quand même plus ou moins respectée par les firmes de droit européen. ING ou Belfius, par exemple, ne peuvent pas faire des choses aussi délirantes que cet exemple chinois, mais BNP Fortis et KBC proposent Google Pay depuis quelques mois, sans avoir les moyens de vérifier que leur sous-traitant Google respecte complètement le RGPD. Mais cela signifie aussi, et c’est une critique que certains chantres du numérique ne se privent pas de faire, que l’Europe renonce à une partie de sa compétitivité dans cette économie des données. Ce qui laisse le champ à d’autres acteurs de droit américain ou chinois… J’ai récemment lu une carte blanche qui alertait sur le retard européen en matière de synthèse vocale, à cause entre autres de nos législations plus contraignantes en matière de vie privée. Cet argument existe.
Est-ce que c’est Big Brother ? Doit-on vraiment avoir peur pour la protection de notre vie privée ?
Je pense qu’il est justifié d’avoir peur, mais pas seulement pour cette raison là. Je pointerais deux aspects. Il y a d’abord, effectivement, le fait que ce n’est pas une bonne idée, pour la démocratie et la cohésion sociale, qu’on soit tous espionnables à merci par des organismes qui n’ont de comptes à rendre qu’à eux-mêmes. Quand on va voter, il y a un rideau à l’isoloir, et ce n’est pas pour rien. Cela permet de nous soustraire à toute une série de pressions potentielles, de rapports sociaux, de dominations même symboliques. La possibilité de vivre en-dehors du regard d’autrui est quelque chose de fondateur pour les démocraties modernes. Ce n’est pas une question de pudeur ou d’intimité, cela engage la société dans son ensemble.
Et l’autre raison d’avoir peur, qu’Yves Citton ou Antoinette Rouvroy montrent très bien, c’est que les algorithmes formatent nos vies. Ils anticipent nos jugements, prédéfinissent nos comportements, conditionnent notre expérience, notre rapport à la culture, à la vie politique, etc. Cela nous détourne de notre propre autonomie en tant qu’individus, de notre libre arbitre. Ce qui est vicieux, c’est que cela se joue à l’insu de notre conscience. Et ce faisant, à travers les Big Data, nous laissons des entreprises réduire notre champ d’expériences, de découvertes, de surprises, de curiosités. Dans le domaine de la consommation culturelle, c’est assez flagrant. L’algorithme d’Amazon nous prescrit des livres sur base de ce que nous avons déjà lu, de ce que nos amis ont acheté, voire des articles qu’on a lus sur tel site d’info, et c’est très séduisant évidemment. Mais c’est un formatage de notre accès à une masse culturelle pourtant infinie.
Le problème que posent les Big Data se situerait donc davantage en matière de formatage culturel de la consommation qu’en termes de risque pour la démocratie ?
Il y a quand même eu l’affaire Snowden, qui révèle que les grands oligopoles de l’économie des données ne sont pas des pères-la-vertu. Ces oligopoles ont donné accès aux services secrets américains et anglais à des quantités infinies de données, à leurs systèmes de calculs, à leurs algorithmes, etc. Le programme américain PRISM défie l’imagination. En tant que militant associatif ou politique, a-t-on envie que ce qu’on pense, ce qu’on imagine comme projet ou comme action collective se retrouve sur la place publique, traité par des services de renseignement ? C’est quelque chose dont on a longtemps imaginé qu’il serait impossible en Europe. Dans le domaine de l’aide sociale par exemple, les assistants sociaux dans les CPAS ont la possibilité de scruter les comptes Facebook de gens qui demandent le RIS. Le fisc aussi, ou bien sûr les employeurs qui recrutent. Il y a donc des limites qui sont en train d’être franchies, qui interrogent notre conception de la démocratie.
Comment réagir à cette situation ? Faut-il se déconnecter totalement ? Ou agir collectivement ? Que recommanderiez-vous comme attitude ?
Je ne crois pas qu’il faille dire aux gens ce qu’ils doivent faire. Les gens en ont marre, de toute façon, qu’on leur dise quoi faire. Ce qui me semble important par contre, c’est de faire de la pédagogie, de montrer les conséquences de notre participation à cette économie du Big Data. Nous sommes des millions à être poussés à adopter les mêmes comportements : il me semble donc nécessaire de chercher des explications systémiques, globales pour comprendre comment ces comportements sont éventuellement suscités par des acteurs économiques qui ne sont pas neutres. Il s’agit de prendre conscience des conséquences au niveau individuel et au niveau collectif. Faut il conseiller de crypter ses mails, fermer son compte Facebook, désactiver la géolocalisation sur son smartphone ? Sincèrement, je ne sais pas. Mais par contre, je trouve qu’il est vraiment essentiel d’avoir une éducation numérique minimale pour que chacun ait des outils pour saisir cette économie des données et de l’attention dans laquelle il joue, quelles sont les règles du jeu si on gratte un peu sous la surface. C’est un peu l’idée de votre campagne, non ?
Réduire la quantité de données qu’on cède, augmenter le niveau de vigilance, ce n’est de toute façon pas une mauvaise chose…
Bien sûr. Le questionnement à avoir, c’est : est-ce que notre projet de vie est de devenir des sortes de vaches à lait de multinationales peu scrupuleuses et surtout sur lesquelles on a de moins en moins de contrôle démocratique ? Par exemple, il existe à présent une application qui permet de fusionner nos cartes de fidélité en une seule application. On souhaite alléger son portefeuille, mais on finit envahi de publicités… Typiquement, installer ce genre d’apps, c’est faire un gigantesque cadeau à Colruyt, Carrefour et d’autres, car cela les renseigne sur des tas de comportements, et cela leur permet de modifier leurs stratégies de négociation vis-à-vis de fournisseurs ou d’autres intermédiaires pour in fine maximiser toujours mieux leurs marges. Ceux qui détiennent les données et sont capables de les traiter sont en position de force par rapport aux producteurs et aux consommateurs. Est ce ce monde-là qu’on veut ?
Il faut critiquer cette économie du Big Data, mais elle a pris une telle importance qu’on ne peut pas la critiquer sans y participer. Il faut pouvoir se doter d’outils qui permettent, avec les mêmes types d’algorithmes, de préparer des contre-feux.
C’est quoi,au fond, le Big Data ?
Thomas Lemaigre: Je pense qu’il ne faut pas confondre le fait que les technologies de l’information permettent de traiter énormément de données, et les Big Data au sens où on l’entend généralement. La banque-carrefour de la Sécurité sociale par exemple, qui est une base de données publique, ce n’est pas du Big Data. Ce sont des systèmes fermés, sécurisés, contrôlés, organisés, normés par des législations. N’importe qui n’y a pas accès, on ne peut pas les utiliser pour n’importe quoi. Ce n’est pas parce que les bases de données sont gigantesques que c’est du Big Data. Les données d’une administration publique sont complètes, hyper structurées, et ce de façon homogène pour des millions de personnes, structurées en fonction des mêmes champs.
Le Big Data, c’est l’inverse. C’est ce que les statisticiens appellent de la donnée sale. C’est bordélique, ça part dans tous les sens. Ce sont des données qui viennent de sources diverses, non coordonnées, qui ne sont donc pas structurées de la même façon. Mais elles existent en une telle quantité qu’il y a, malgré tout, moyen d’en tirer quelque chose à l’aide d’algorithmes de plus en plus performants. Ils tirent, d’une immense masse de données plutôt mal foutues, des informations dont il est possible de se servir. Ces données sont la propriété des entreprises qui les captent. C’est tout le sens des conditions générales d’utilisation (CGU). Vous ne les lisez pas, évidemment ! Mais vous cochez la petite case, et avalisez du coup le fait que vous acceptez que vos données soient utilisées, qu’elles deviennent la propriété du site ou de la plateforme sur lesquels vous créez un compte. Ces données ont bien sûr une valeur économique. Il y a un marché de ces données, très florissant, avec des courtiers. Cela permet de se constituer de gigantesques bases de données, comme quand MasterCard vend des informations à Google, avec des parties plus ou moins propres, d’autres très chaotiques.
Le RGPD est-il réellement utile ou pas ? Ne manque-t-il pas sa cible, dans la mesure où les GAFA sont tout à fait capables, sans identification précise à une personne, de réaliser un profilage performant ?
Bonne question ! Les GAFA se fichent totalement de la personne réelle qui est derrière un profil. De leur point de vue, vous êtes interchangeable, vous n’avez pas de nom. Néanmoins, le RGPD demeure important parce qu’il offre tout de même certaines garanties et protections. S’il ne servait à rien, le lobbying n’aurait pas été à ce point intense pour tenter de bloquer son adoption ! Il protège en partie la vie privée des personnes. Mais en effet, ce n’est certainement pas la seule préoccupation en jeu, et ça ne règle rien par rapport au formatage des comportements.