Mois : janvier 2025

  • Prêtez Attention : quand « prêter » est « données » (épisode 1)

    A l’heure où Elon Musk fait un peu n’importe quoi au nom de la liberté d’expression, quand des grands patrons du numérique lui emboîtent le pas sans doute pour pousser leurs intérêts économiques, il devient encore plus indispensable de comprendre les mécanismes qui causent des dysfonctionnements majeurs des plateformes numériques.  Ce premier épisode d’un article de Fabien Gandon et Franck Michel nous aide à mieux comprendre.  Serge Abiteboul & Thierry Viéville.

    Image générée par les auteurs avec Bing/DALL·E 3 à partir du prompt “photo of a street with many people with their smartphones displaying different hypnotic images” ©CC-BY

    Nous sommes un dimanche après-midi. Vous avez un petit moment pour vous. Vous pourriez lire, vous balader, aller courir ou écouter de la musique mais machinalement votre main saisit votre téléphone. Le « sombre miroir » s’éclaire et vous passez de l’autre côté. Vous ouvrez l’application de votre réseau social préféré qui vient de vous notifier qu’elle a du nouveau pour vous. Et c’est vrai ! Jean a posté un message à propos de la tragicomédie « Qui a hacké Garoutzia ? » qu’il a vue au théâtre hier soir. Vous approuvez ce poste d’un pouce virtuel et déjà votre vrai pouce pousse vers le poste suivant. Entre une publicité pour un abonnement au théâtre, une photo postée d’Avignon par un ami que vous avez du mal à remettre, l’annonce pour un jeu où tester vôtre culture générale… votre pouce se lance dans un jogging numérique effréné. Imperceptiblement le flux d’information qui vous est proposé dévie, une vidéo de chats acrobates, un « clash » entre stars de la télévision, une manifestation qui tourne à l’affrontement… Et avant que vous ne le réalisiez une petite heure s’est écoulée et il est maintenant trop tard pour un vrai jogging. Vous ressentez une certaine résistance à reposer votre téléphone : après tout, il y avait peut-être encore tant de contenus intéressants, inédits, surprenants ou croustillants dans ce fil de recommandations. Mais vous devez vous rendre à l’évidence, ce fil est sans fin. Vous ne pouvez croire à quelle vitesse la dernière heure est passée. Vous avez l’impression qu’on vous l’a volée, que vous avez traversé un « tunnel temporel ». Sans même vous rappeler de ce que vous avez vu défiler, vous reposez ce téléphone un peu agacé en vous demandant… mais qui a hacké mon attention ?

    A l’attention de tous…

    Sir Tim Berner-Lee, récipiendaire du prix Turing pour avoir inventé le Web, a toujours considéré que les Web devait « être pour tout le monde », mais il a aussi partagé début 2024 un dialogue intérieur en deux articles à propos du Web : « Le dysfonctionnement des réseaux sociaux » et « Les bonnes choses ». Et oui… même le père du Web s’interroge gravement sur celui-ci et met face à face ce qu’il y a de meilleur et de pire sur le Web. Loin d’avoir réalisé l’idéal d’une communauté mondiale unie, Tim constate que des applications du Web comme les réseaux sociaux amplifient les fractures, la polarisation, la manipulation et la désinformation, menaçant démocraties et bien-être. Tout en reconnaissant les nombreuses vertus du Web (outils éducatifs, systèmes open source ou support à la souveraineté numérique), il nous propose de mettre l’accent sur la transparence, la régulation, et une conception éthique d’un Web et d’un Internet plus sûrs et responsables. Autrement dit, l’enjeu actuel est de préserver les richesses du Web tout en se protégeant de ses dérives.

    Parmi ces dérives, on trouve le problème de la captation de notre attention, un sujet sur lequel nous voulons revenir dans ce billet ainsi que le suivant. C’est l’objet d’un de nos articles publié cette année à la conférence sur l’IA, l’éthique et à la société (AIES) de l’Association pour l’Avancement de l’Intelligence Artificielle (AAAI), que nous résumons ici. Le titre pourrait se traduire par « Prêtez attention : un appel à réglementer le marché de l’attention et à prévenir la gouvernance émotionnelle algorithmique ». Nous y appelons à des actions contre ces pratiques qui rivalisent pour capter notre attention sur le Web, car nous sommes convaincus qu’il est insoutenable pour une civilisation de permettre que l’attention soit ainsi gaspillée en toute impunité à l’échelle mondiale.

    Attention à la march…andisation (de l’attention)

    Si vous lisez cette phrase, nous avons déjà gagné une grande bataille, celle d’obtenir votre attention envers et contre toutes les autres sollicitations dont nous sommes tous l’objet : les publicités qui nous entourent, les « apps » dont les notifications nous assaillent jour et nuit, et tous les autres « crieurs numériques » que l’on subit au quotidien. 

    Depuis l’avènement de la consommation de masse dans les années 50, les médias et les publicitaires n’ont eu de cesse d’inventer des méthodes toujours plus efficaces pour capter notre attention et la transformer en revenus par le biais de la publicité. Mais ce n’était qu’un début… Au cours des deux dernières décennies, en s’appuyant sur la recherche en psychologie, en sociologie, en neurosciences et d’autres domaines, et soutenues par les avancées en intelligence artificielle (IA), les grandes plateformes du Web ont porté le processus de captation de l’attention à une échelle sans précédent. Basé presque exclusivement sur les recettes publicitaires, leur modèle économique consiste à nous fournir des services gratuits qui, en retour, collectent les traces numériques de nos comportements. C’est le célèbre “si c’est gratuit, c’est nous le produit” et plus exactement, ici, le produit c’est notre attention. Ces données sont en effet utilisées pour maximiser l’impact que les publicités ont sur nous, en s’assurant que le message publicitaire correspond à nos goûts, nos inclinations et notre humeur (on parle de “publicité ciblée”), mais aussi en mettant tout en place pour que nous soyons pleinement attentifs au moment où la publicité nous est présentée.

    Recrutant des « armées » de psychologues, sociologues et neuroscientifiques, les plateformes du Web comme les médias sociaux et les jeux en ligne ont mis au point des techniques capables de piller très efficacement notre « temps de cerveau disponible ». Résultat, nous, les humains, avons créé un marché économique où notre attention est captée, transformée, échangée et monétisée comme n’importe quelle matière première sur les marchés.

    Faire, littéralement, attention

    A l’échelle individuelle, lorsque l’on capte notre attention à notre insu, on peut déjà s’inquiéter du fait que l’on nous vole effectivement du temps de vie, soit l’un de nos biens les plus précieux. Mais si l’attention est un mécanisme naturel au niveau individuel, l’attention collective, elle, est le fruit de l’action de dispositifs spécifiques. Il peut s’agir de lieux favorisant l’attention partagée (ex. un théâtre, un cinéma, un bar un soir de match, une exposition), de l’agrégation d’attention individuelle pour effectuer des mesures (ex. audimat, nombre de vues, nombre de partages, nombre de ventes, nombre d’écoutes, etc.) ou autres. Pour ce qui est de l’attention collective, nous faisons donc, littéralement, l’attention. En particulier, les plateformes créent l’attention collective et dans le même temps captent ce commun afin de le commercialiser sans aucune limite a priori.

    Parmi les techniques utilisées pour capter notre attention, nous pouvons distinguer deux grandes catégories. Tout d’abord, certaines techniques sont explicitement conçues pour utiliser nos biais cognitifs. Par exemple, les likes que nous recevons après la publication d’un contenu activent les voies dopaminergiques du cerveau (impliquées dans le système de récompense) et exploitent notre besoin d’approbation sociale ; les notifications des apps de nos smartphones alimentent notre appétit pour la nouveauté et la surprise, de sorte qu’il est difficile d’y résister ; le « pull-to-refresh », à l’instar des machines à sous, exploite le modèle de récompense aléatoire selon lequel, chaque fois que nous abaissons l’écran, nous pouvons obtenir une nouveauté, ou rien du tout ; le défilement infini (d’actualités, de posts ou de vidéos…) titille notre peur de manquer une information importante (FOMO), au point que nous pouvons difficilement interrompre le flux ; l’enchaînement automatique de vidéos remplace le choix délibéré de continuer à regarder par une action nécessaire pour arrêter de regarder, et provoque un sentiment frustrant d’incomplétude lorsqu’on l’arrête ; etc. De même, certaines techniques exploitent des « dark patterns » qui font partie de ce qu’on nomme design compulsogène ou persuasif, pour nous amener, malgré nous, à faire des actions ou des choix que nous n’aurions pas faits autrement. C’est typiquement le cas lorsque l’on accepte toutes les notifications d’une application sans vraiment s’en rendre compte, alors que la désactivation des notifications nécessiterait une série d’actions fastidieuses et moins intuitives.

    Les petites attentions font les grandes émotions… oui mais lesquelles?

    Une deuxième catégorie de techniques utilisées pour capter notre attention repose sur les progrès récents en matière d’apprentissage automatique permettant d’entraîner des algorithmes de recommandation de contenu sur des données comportementales massives que Shoshana Zuboff appelle le « surplus comportemental« . Ces algorithmes apprennent à recommander des contenus qui non seulement captent notre attention, mais également augmentent et prolongent notre « engagement » (le fait de liker, commenter ou reposter des contenus, et donc d’interagir avec d’autres utilisateurs). Ils découvrent les caractéristiques qui font qu’un contenu attirera plus notre attention qu’un autre, et finissent notamment par sélectionner des contenus liés à ce que Gérald Bronner appelle nos invariants mentaux : la conflictualité, la peur et la sexualité. En particulier, les émotions négatives (colère, indignation, ressentiment, frustration, dégoût, peur) sont parmi celles qui attirent le plus efficacement notre attention, c’est ce que l’on appelle le biais de négativité. Les algorithmes apprennent ainsi à exploiter ce biais car les contenus qui suscitent ces émotions négatives sont plus susceptibles d’être lus et partagés que ceux véhiculant d’autres émotions ou aucune émotion particulière. Une véritable machine à créer des “réseaux soucieux” en quelque sorte.

    Bulles d’attention et bulles de filtres

    En nous promettant de trouver pour nous ce qui nous intéresse sur le Web, les algorithmes de recommandation ont tendance à nous enfermer dans un espace informationnel conforme à nos goûts et nos croyances, une confortable bulle de filtre qui active notre biais de confirmation puisque nous ne sommes plus confrontés à la contradiction, au débat ou à des faits ou idées dérangeants.

    En apparence bénignes, ces bulles de filtres ont des conséquences préoccupantes. Tout d’abord, au niveau individuel, parce que, s’il est important de se ménager des bulles d’attention pour mieux se concentrer et résister à l’éparpillement, il est aussi important de ne pas laisser d’autres acteurs décider quand, comment et pourquoi se forment ces bulles. Or c’est précisément ce que font les algorithmes de recommandation et leurs bulles de filtres, en décidant pour nous à quoi nous devons penser.

    Ensuite, au niveau collectif, Dominique Cardon pointe le fait que les bulles de filtres séparent les publics et fragmentent nos sociétés. Ceux qui s’intéressent aux informations sont isolés de ceux qui ne s’y intéressent pas, ce qui renforce notamment le désintérêt pour la vie publique.

    Et en créant une vision du monde différente pour chacun d’entre nous, ces techniques nous enferment dans des réalités alternatives biaisées. Or vous et moi pouvons débattre si, alors que nous observons la même réalité, nous portons des diagnostiques et jugements différents sur les façons de résoudre les problèmes. Mais que se passe-t-il si chacun de nous perçoit une réalité différente ? Si nous ne partons pas des mêmes constats et des mêmes faits ? Le débat devient impossible et mène vite à un affrontement stérile de croyances, au sein de ce que Bruno Patino appelle une « émocratie, un régime qui fait que nos émotions deviennent performatives et envahissent l’espace public« . Dit autrement, il n’est plus possible d’avoir un libre débat contradictoire au sein de l’espace public, ce qui est pourtant essentiel au fonctionnement des démocraties.

    La tension des émotions

    Puisque les algorithmes de recommandation sélectionnent en priorité ce qui produit une réaction émotionnelle, ils invibilisent mécaniquement ce qui induit une faible réponse émotionnelle. Pour être visible, il devient donc impératif d’avoir une opinion, de préférence tranchée et clivante, de sorte que la réflexion, la nuance, le doute ou l’agnosticisme deviennent invisibles. L’équation complexe entre émotions, biais cognitifs et algorithmes de recommandation conduit à une escalade émotionnelle qui se manifeste aujourd’hui sur les médias sociaux par une culture du « clash », une hypersensibilité aux opinions divergentes interprétées comme des agressions, la polarisation des opinions voire la radicalisation de certains utilisateurs ou certaines communautés. Ce qui fait dire à Bruno Patino que « les biais cognitifs et les effets de réseau dessinent un espace conversationnel et de partage où la croyance l’emporte sur la vérité, l’émotion sur le recul, l’instinct sur la raison, la passion sur le savoir, l’outrance sur la pondération ». Recommandation après recommandation, amplifiée par la désinhibition numérique (le sentiment d’impunité induit par le pseudo-anonymat), cette escalade émotionnelle peut conduire à des déferlements de violence et de haine dont l’issue est parfois tragique, comme en témoignent les tentatives de suicide d’adolescents victimes de cyber-harcèlement. Notons que cette escalade est souvent encore aggravée par les interfaces des plateformes, qui tendent à rendre les échanges de plus en plus brefs, instinctifs et simplistes.

    Le constat que nous dressons ici peut déjà sembler assez noir, mais il y a pire… Et à ce stade, pour garder votre attention avant que vous ne zappiez, quoi de mieux que de créer un cliffhanger, une fin laissée en suspens comme dans les séries télévisées à succès, et d’utiliser l’émotion qui naît de ce suspens pour vous hameçonner dans l’attente du prochain épisode, du prochain billet à votre attention

    Fabien Gandon, Directeur de Recherche Inria, et Franck Michel, ingénieur de recherche, Université Côte d’Azur, CNRS, Inria. 
  • Biais selon la langue dans Wikipédia, Google, ChatGPT et YouTube

    Cet article est paru le 8 octobre 2024 sur le site ami de Laurent Bloch sous licence Creative Commons. Laurent  y commente l’article « A Perspective Mirror of the Elephant » de Communications of the Association for Computing Machinary, la principale revue mensuelle de la première des associations internationales dédiées à l’informatique. Serge Abiteboul. 

    Une révolution cognitive, des divergences culturelles

    Nul doute que les chercheurs qui étudieront l’histoire de la pensée au tournant du XXIe siècle accorderont un chapitre substantiel à l’apparition des moteurs de recherche et des encyclopédies en ligne, qui apportent dans les lieux les plus reculés et aux populations les plus démunies des connaissances et des informations naguère réservées aux habitants de villes universitaires dotées de bibliothèques et de librairies, et seulement au prix de temps de recherche bien plus importants. Il n’est pas excessif de parler ici de révolution cognitive.

    Il faudrait d’ailleurs parler plutôt du moteur de recherche et de l’encyclopédie en ligne, parce que le Google Search et Wikipédia sont en position de monopole (temporaire), conformément aux lois des rendements croissants et de la concurrence monopolistique [1]. Mais là n’est pas le sujet pour l’instant.

    L’utilisateur régulier de ces outils si commodes aura pu faire une remarque empirique : pour Wikipédia par exemple et si l’on s’en tient aux articles des domaines techniques, des sciences de la nature ou de l’informatique, selon la langue d’interrogation la qualité des articles peut varier, mais leur teneur informationnelle ne sera pas trop hétérogène, essentiellement parce que les termes scientifiques et techniques sont généralement dotés de définitions relativement claires et univoques, peu sujettes à controverses idéologiques. Si par contre on va sur le terrain des sciences humaines et sociales, on peut tomber sur de vraies divergences de vue. Et ne parlons pas des sujets politiques, historiques ou culturels…

    Une démarche systématique sur deux domaines bien délimités

    Queenie Luo, Michael J. Puett et Michael D. Smith, auteurs de l’article dont il est question ici [2], se sont donné pour tâche un examen systématique de ce biais selon la langue, qui est en fait un biais culturel et politique, entre plusieurs versions de Wikipédia, Google, ChatGPT et YouTube. Ils ont choisi deux sujets, le bouddhisme et le libéralisme, et douze langues, anglais, français, allemand, chinois, thaï, vietnamien, italien, espagnol, russe, coréen, népalais et japonais, avec l’aide de connaisseurs de ces langues et des cultures qui les utilisent.

    L’introduction de l’article repose sur une fable du folklore indien : six aveugles croisent un éléphant, chacun peut toucher une partie de l’animal, et chacun arrive à des conclusions complètement différentes sur la nature de ce qu’ils ont rencontré [3].

    De même, lorsque l’on soumet une question à Google, plutôt que de donner une réponse synthétique globale, le moteur de recherche se base sur la langue d’interrogation pour donner une réponse qui corresponde à l’univers culturel du questionneur, voire à ses biais ethnocentrés. Ainsi, une recherche d’images sur Google par la locution anglaise wedding clothes donnera des images de costumes de mariage de style occidental, en omettant les kimonos japonais ou les saris indiens.

    C’est pire avec ChatGPT, dont le corpus d’apprentissage (à la date de rédaction de l’article tout du moins) est presque exclusivement en anglais.

    Lors de la soumission de chaque interrogation, nos auteurs ont retenu à fin d’analyse les 50 premiers sites mentionnés par Google, les 35 premières vidéos retenues par YouTube, le texte intégral de l’article de Wikipédia, et cinq réponses de ChatGPT dans cinq fenêtres d’interrogation (de prompt comme il faut dire maintenant) distinctes. Le but des auteurs n’était pas de quantifier la disjonction entre les réponses des systèmes et le corpus global, mais d’identifier les occurrences de ces disjonctions et de commencer à identifier les types de biais qu’elles induisent.

    Les observations

    Bouddhisme

    En 2 500 ans le bouddhisme s’est répandu dans la plupart des pays d’Asie, et connaît depuis quelques décennies un grand succès en Occident, sans oublier les migrations de populations asiatiques vers ces mêmes pays occidentaux. Mais, sans surprise, chacun de ces univers culturels a sa propre acception du bouddhisme, qui est plus un courant de pensée ou une vision du monde, au demeurant peu dogmatique [4], qu’une religion au sens où l’entendent les fidèles des religions du Livre, juifs, chrétiens et musulmans.

    Les interrogations en français et en allemand donnent des liens vers des sites encyclopédiques ou historiques, en anglais on reçoit plutôt des adresses de centres de retraites spirituelles. Le chinois donne la ligne du parti sur l’organisation des monastères bouddhistes, les sites indiqués en réponse à une question en vietnamien évoquent des pratiques rituelles et de mendicité, cependant que le thaï orientera vers une explication de la différence entre le bouddhisme et le culte des fantômes, répandu sur les rives de la Chao Phraya.

    Chaque langue d’interrogation fournit des réponses qui exhibent une forte conformité aux représentations culturelles dominantes de la communauté de ses locuteurs. L’article approfondit la question en examinant les réponses à des questions plus discriminantes, voire sujettes à controverses, en comparant les réponses de Google et celles de ChatGPT, etc. À la différence de Google, ChatGPT, bien que très anglo-centrique, permet qu’on lui demande d’utiliser un corpus linguistique spécifique, par exemple en chinois, mais cela exige un peu de tâtonnement par essais-erreurs. YouTube est très orienté vers les musiques de méditation et les tutoriels, ses biais liés à la langue sont plus prononcés.

    Les articles consacrés au bouddhisme sont très consultés par les adeptes de Wikipédia, dans toutes les langues, mais avec là aussi des sensibilités différentes. L’article attribue une grande influence de Foucault, Derrida et Lacan sur le wikipédien français, cependant que son collègue allemand serait sans surprise plutôt un disciple de Schopenhauer, Heidegger et Nietzsche.

    Libéralisme

    Le libéralisme a une histoire et une géographie complexe : pour les Américains les libéraux seraient assez proches de Bernie Sanders, alors que les Français penseraient plutôt à Bruno Retailleau. Les sites signalés par Google si on l’interroge en anglais donnent une image favorable du libéralisme, au contraire des sites mentionnés en réponse à des interrogations en français, allemand, italien ou espagnol, ainsi que pratiquement tous les sites asiatiques. Dans de nombreux pays asiatiques l’insistance du libéralisme sur la liberté est perçue comme une menace envers l’ordre social, notamment le rôle de la famille et l’importance de l’unité nationale.

    YouTube interrogé en russe diffuse des vidéos qui associent libéralisme et démocratie, et les soupçonnent d’avoir contribué à la chute de l’Union soviétique.

    Bref, selon les histoires et les cultures de chaque domaine linguistique, le terme « libéralisme » a des acceptions différentes, suscite des réactions différentes, et nos outils de recherche et de documentation informatisés nous donnent les réponses que, en moyenne, nous attendons.

    Plus de clivages, ou une synthèse ?

    Nos auteurs reprennent le fil de la métaphore des aveugles et de l’éléphant : les ressortissants de chaque domaine linguistique vont-ils rester attachés à leurs visions unilatérales ? Ou bien, un observateur extérieur capable de faire la synthèse de ces visions diverses va-t-il les éclairer sur le caractère vrai mais incomplet de chacune de ces visions, et les guider vers une vue d’ensemble plus large et plus ouverte aux autres cultures ?

    L’article attire l’attention du lecteur sur le danger de voir ces plates-formes cognitives imposer à chaque population de locuteurs d’une langue donnée le conformisme de la vision majoritaire, d’où résulterait une tyrannie d’opinion. Observons quand même que ce n’est pas nouveau : s’il est facile de comparer les articles de Wikipédia en anglais et en français, il était peut-être plus difficile de comparer ceux du Grand Larousse illustré et de l’Encyclopedia Britannica [5], mais on y aurait sans doute trouvé des biais culturels et politiques similaires.

    Mais justement, l’informatisation des plates-formes cognitives et leur disponibilité planétaire devrait faciliter la présentation au lecteur de points de vue divers et même antagoniques, afin de faire progresser la démocratie et l’ouverture aux cultures autres que la sienne propre.

    Laurent Bloch

    NOTES

    [1]  https://laurentbloch.net/MySpip3/Trump-et-Xi-Jinping-les-apprentis-sorciers#Concurrence-monopolistique

    [2] https://cacm.acm.org/practice/a-perspectival-mirror-of-the-elephant/

    [3] Les spectateurs du film de Rithy Panh Rendez-vous avec Pol Pot ont pu voir une interprétation cinématographique de cette fable.
    https://fr.wikipedia.org/wiki/Rendez-vous_avec_Pol_Pot

    [4] Le lecteur curieux d’en savoir un peu plus sur le bouddhisme pourra lire le délicieux opuscule que lui ont consacré Jorge Luis Borges et Alicia Jurado sous le titre Qu’est-ce que le bouddhisme ? Il y apprendra les différences entre les bouddhismes mahāyāna, vajrayāna, son, zen ou hīnayāna.

    [5] Déjà des amis élitistes m’avaient expliqué que le niveau de l’Encyclopedia Britannica avait chuté lorsqu’elle avait été rachetée par un éditeur américain…

  • Informatique théâtrale

    Un nouvel entretien autour de l’informatique.

    Remi Ronfard a travaillé plusieurs années au centre Watson d’IBM Research à Yorktown Heights et à la direction de la recherche de l’Institut National de l’Audiovisuel (INA), avant de rejoindre Inria. Il est spécialiste de la modélisation géométrique, d’animation 3D, de vision par ordinateur, et d’informatique théâtrale. Il s’intéresse à la création et mise en scène de mondes virtuels narratifs. Il a fondé et anime les journées d’informatique théâtrale.
    Rémi Ronfard, Crédit image :  Miguel Bucana, pour le magazine Chut !

     

    Binaire : Peux-tu nous raconter ton parcours, et comment tu t’es intéressé à ce domaine à la frontière de l’informatique et des arts vivants ?

    RR : J’ai suivi des études d’ingénieur à l’École des Mines. Il n’y avait pas d’informatique dans la formation à l’époque. J’ai découvert l’informatique après mes études en réalisant une thèse en télédétection. J’ai commencé alors à me sentir informaticien même si ma thèse tenait surtout du traitement du signal. Pendant 10 ans, j’ai travaillé ensuite pour la R&D dans l’industrie par exemple au centre Watson d’IBM, et à l’INA. Je suis devenu chercheur à Inria à 40 ans. Ce n’est pas un parcours standard !

    C’est par hasard que je me suis intéressé au théâtre. En 1996, j’ai rencontré au Medialab du MIT Claudio Pinhanez (de IBM Research, Brésil) inventeur de l’expression Computer theater que je traduis comme « informatique théâtrale ». Son questionnement d’alors : peut-on faire avec l’informatique ce que l’on a fait pour la musique avec l’informatique musicale ? Il décrivait le théâtre comme essentiellement une série d’actions ; cela résonnait bien avec mon domaine de recherche à l’INA sur l’indexation audiovisuelle. Cela me conduisait à la question : comment reconnaître et représenter symboliquement des actions théâtrales ? Cette idée a commencé alors à me trotter dans la tête mais je n’ai pas imaginé en faire mon sujet de recherche principal. Quand je suis rentré à Inria des années plus tard, j’ai pu revenir sur ce sujet.

    Binaire : Pourrais-tu nous dire comment tu définis toi-même l’informatique théâtrale ?

    RR : Oh là là. Pour moi, l’informatique théâtrale doit rester très ouverte. Je ne veux pas l’enfermer dans des définitions. Regardez l’informatique musicale. Elle s’est construite au-delà des distinctions entre musique et son. Je ne veux pas que des tentatives de définition ferment la discipline. Une difficulté avec le théâtre c’est que dès on change quelque chose, ce n’est plus du théâtre : un film, ce n’est plus du théâtre, même une pièce filmée pour beaucoup ce n’est plus du théâtre. En musique, si on change les instruments, cela reste de la musique.

    Binaire : On va insister. Peux-tu quand même essayer de définir l’informatique théâtrale ?

    On peut y voir deux aspects essentiels. Du point de vue de l’artiste, c’est d’abord, des pièces de théâtre qui utilisent l’informatique dans leur création ou leur diffusion, avec l’idée que le résultat se distingue de ce qui aurait été fait sans informatique. D’un autre côté, avec un regard d’informaticien, l’informatique théâtrale regroupe tout ce qu’on peut faire au service du théâtre avec des machines, des algorithmes ou des langages qui traitent du théâtre.

    Techniquement, mon travail personnel s’inscrit dans le cadre de l’informatique graphique. En général, dans ce domaine on modélise en trois dimensions pour produire des images en deux dimensions. Avec l’informatique théâtrale, on s’intéresse à un déploiement dans les trois dimensions et dans le temps.

    Binaire : Des algorithmes au service du théâtre. C’est passionnant ! Pourrais-tu nous donner un exemple ?

    RR : Aujourd’hui, cela tourne beaucoup autour de l’automatisation de la régie théâtrale. En régie, pour accompagner un spectacle, on dispose d’une liste de repères, avec des événements comme certains endroits du texte ou un geste d’un acteur qui servent de déclencheurs à d’autres événements, par exemple lancer une lumière ou une chanson. Il faut suivre cette « liste d’événements ». On pourrait imaginer automatiser cela. Il faut bien reconnaitre que cela reste encore balbutiant ; cela se fait seulement dans des conditions expérimentales. C’est d’abord pour des raisons de fiabilité. On ne peut pas planter un spectacle devant une salle remplie de spectateurs parce qu’un programme informatique beugue.

    Binaire : Le script d’une représentation théâtrale, c’est comme une partition musicale ? Peut-on imaginer décrire formellement une mise en scène ?

    RR : C’est très proche d’une partition. Mais pour le théâtre, il n’existe pas de notation universelle : chaque metteur en scène, chaque régisseur, utilise ses propres notations.

    Développer une telle notation est un défi considérable, un sujet un peu tabou. Il y a une résistance culturelle, les créateurs considèrent qu’ils font de l’alchimie et que leur travail ne doit pas être codé. Mais il existe aussi une tradition de « transcription de la mise en scène », pour des questions de transmission. J’aimerais bien regarder cela sérieusement. Malheureusement pour ceux qui veulent faire des recherches sur ces sujets, ces documents ne sont pas faciles à trouver.

    Binaire : Est-ce qu’on pourrait imaginer une IA qui réaliserait la transcription d’une mise en scène ?

    RR : J’aimerais beaucoup construire une telle IA. Mais ce n’est pas facile, car elle devrait être d’une certaine façon assez générale : intégrer des techniques de vision, de reconnaissance vocale, de traitement de la parole, de compréhension des mouvements, de la prosodie… Il lui faudrait s’appuyer sur une notation. Quelle notation ? À vrai dire c’est une de mes ambitions à long terme. Une difficulté pour une telle IA est de savoir où on s’arrête, de distinguer ce qui est important et ce qui ne l’est pas dans une mise en scène. Si à un moment donné, un acteur lève le petit doigt, est-ce un hasard, ou est-ce que cela fait partie de la mise en scène ?

    Binaire : Est-ce qu’on pourrait entraîner une IA sur des millions d’enregistrement de mises en scènes pour apprendre cela ?

    RR : Je n’y crois pas du tout avec les IA actuelles. Cela demande une forme de compréhension globale de trop d’aspects distincts. On pourrait déjà regarder ce qu’on peut faire avec une dizaine de mises en scènes différentes d’une même pièce ; on peut trouver cela pour des auteurs très populaires comme Marivaux.

    Mais… est-ce qu’il faut viser un tel but ? Ce n’est pas évident. J’imagine plutôt que la technologie assiste le metteur en scène, l’aide à donner des indications sur sa mise en scène, à transcrire la mise en scène. De telles transcriptions seraient utile pour garder des traces patrimoniales, une forme de dépôt légal.

    Mosaïque d’images filmées avec KinoAi et utilisées dans le 3eme court métrage cité. Crédit image : KinoAi.

     

    Binaire : Ces aspects patrimoniaux nous conduisent naturellement à ton outil KinoAi ? Mais d’abord, comment ça se prononce ?

    RR : On dit Kino-Aïe. Le nom est un clin d’œil à un mouvement important de l’histoire du cinéma [1]. Nous l’avons développé dans le cadre d’une thèse en partenariat avec le théâtre des Célestins à Lyon. La directrice du théâtre voulait enrichir leur site avec des vidéos de répétitions. Mais pour cela, il fallait les filmer, ce qui demande beaucoup d’efforts et coûte cher. Comment arriver à le faire sans les moyens considérables d’une grosse équipe de télévision ?

    Notre solution part d’une captation avec une seule caméra fixe de l’ensemble de la scène. Puis, des algorithmes détectent les acteurs, déterminent leurs positions, les identifient et les recadrent. Pour cela, on utilise des techniques existantes de détection des mouvements et des poses du corps. Notre logiciel propose des cadrages. La difficulté est qu’un bon cadrage doit capturer complètement un acteur et exclure les acteurs voisins, ou bien les inclure sans les découper. Et puis les acteurs bougent et tout cela doit être réalisé dynamiquement. Enfin, le metteur en scène peut choisir parmi plusieurs cadrages intéressants pour réaliser un film.

    Le problème de filmer automatiquement un spectacle est passionnant. On a fait déjà plusieurs courts métrages sur des répétitions de spectacles [2]. Et on continue à travailler sur le sujet, y compris pour la captation du produit final lui-même, le spectacle.

    Binaire : Mais pourquoi ne trouve-t-on pas plus les vidéos de spectacles ?

    RR : Le problème est d’abord commercial. Si la pièce est visible en ligne, cela incite moins les spectateurs à payer pour aller au théâtre ? Pour le théâtre privé, l’obstacle est là. Pour le théâtre public, ceux qui pensent filmer préfèrent carrément réaliser un vrai film. La diffusion vidéo de spectacles s’est un peu développée pendant le covid. J’espère que cette question reviendra. Pour des questions de préservation de notre patrimoine, on pourrait déjà filmer plus systématiquement les spectacles au moins en caméra fixe.

    Binaire : De nos jours, des IA sont utilisées en assistant pour l’écriture, par exemple de scénarios aux USA. Pourrait-on imaginer ça dans l’écriture de pièces de théâtre ?

    RR : Cela a déjà été imaginé ; des pièces ont été écrites par des IA et jouées. C’est un peu du buzz ; ça ne m’intéresse pas trop. C’est une drôle d’idée, on se demande pourquoi faire cela. Je trouve beaucoup plus intéressant d’avoir des IA qui aident à la mise en scène de textes écrits par des auteurs humains. C’est peut-être plus difficile, mais tellement plus intéressant !

    Par exemple, on peut utiliser de l’intelligence artificielle pour prévisualiser un spectacle qu’on a imaginé. L’auteur peut avoir, avec l’IA, une impression de ce que pourrait donner son texte. Et puis, les roboticiens s’intéressent beaucoup aussi à réaliser des robots qui jouent dans des spectacles.

    Binaire : Comment se fait la mayonnaise entre informaticiens et des artistes dans les spectacles ?

    RR : J’ai peu d’exemples parce que des formes longues de théâtre utilisant l’informatique sont encore rares. Mais la question se pose déjà quand on engage des projets de recherche sur le sujet. Le dialogue n’est pas toujours facile. Il faut vaincre des résistances. En tant qu’informaticien, on se sent bête quand on parle avec auteurs parce qu’on plonge dans un monde nouveau pour nous, dont on n’a pas tous les codes. On sort de sa zone de confort. Et certains artistes ont sûrement un sentiment symétrique. Du coup, il y a parfois une certaine timidité. C’est pour ça que j’organise des rencontres annuelles de la communauté en informatique théâtrale.

    Binaire : Comment ces travaux pluridisciplinaires se valorisent-t-ils au niveau académique, surtout pour les doctorants ?

    RR : Il faut faire très attention à rester dans une recherche validée par son domaine. L’idéal serait un système de thèses en parallèle en arts du théâtre et en informatique. Chacun reste dans sa discipline mais les deux décident de travailler ensemble. La difficulté est de synchroniser les intérêts, de trouver des sujets intéressants des deux côtés. On peut avoir un sujet super original et passionnant pour le théâtre mais qui ne met en jeu que des techniques standard en informatique. Ou on peut avoir des idées de techniques informatiques super novatrices qui laissent de marbre les gens de théâtre.

    Binaire : Comment les artistes s’approprient-ils les nouvelles technologies ?

    RR : Les artistes adorent détourner la technologie, faire l’inverse ce qui était prévu. Ils adorent également en montrer les limites. Pour les informaticiens, ce n’est pas toujours facile à accepter. On s’escrime à faire marcher un truc, et l’artiste insiste sur le seul aspect qui met en évidence l’imperfection ! On voit cela comme une déconsidération du travail de recherche. Mais en même temps, les détournements qu’ils imaginent sont passionnants.

    Binaire : Tu observes de leur part une tendance à la technophobie ?

    RR : Ce n’est pas du tout de la technophobie, puisque, par nature, les technophobes ne veulent pas travailler avec nous. Les autres nous aiment bien, mais ils gardent un regard hyper critique. Ce n’est pas facile mais cela rend la collaboration intéressante. Ces questionnements sont finalement très sains.

    Binaire : Et pour parler d’un autre domaine dans lequel tu as travaillé, quels sont les liens entre le jeu vidéo et l’informatique théâtrale ?

    RR : D’un point de vue technique, c’est curieusement assez proche. Je vois quand même une grande différence. En théâtre, on peut expérimenter, alors que dans le domaine du jeu vidéo, c’est difficile et cela représente des efforts de développement énormes. Il y a peu d’industriels du jeu vidéo avec qui on peut mener des expériences. Ils peuvent commander des trucs d’animation par exemple sur des points très techniques, mais ne sont pas du tout dans l’expérience. Le théâtre offre cette possibilité d’expérimenter, de faire de la recherche, parce qu’il est moins industrialisé, plus proche de l’artisanat.

    « Le théâtre est-il une industrie » est d’ailleurs l’objet d’une journée qu’on organise dans le cadre du programme de recherche ICCARE[3].

    Binaire : Et le métavers ?

    RR : Il existe une pratique du théâtre dans le métavers. Des acteurs ont utilisé le métavers pendant la pandémie avec un public distant, avec des casques de réalité virtuelle. C’est du théâtre distribué, qui apporte aux artistes de théâtre une forme d’ubiquité qui est complètement nouvelle pour eux. Un jour, on peut enregistrer un spectacle, et y assister voire participer le lendemain n’importe où dans le monde. Pour la musique, ce phénomène est devenu courant, au théâtre non.

    Aujourd’hui le théâtre est matériel et cela nous parait faire partie de son essence. Mais est-ce absolument nécessaire ? Qu’est-ce que ça changerait, si on avait un théâtre immatériel avec une immersion parfaite en réalité virtuelle ? Des risques existent évidemment comme de voir le modèle publicitaire en vogue coloniser ce nouveau  théâtre. Mais si on arrive à maîtriser ces risques, le métavers ouvre des perspectives folles dans le domaine des arts et de la culture, bien plus intéressantes à mon avis que ses perspectives commerciales.

    Serge Abiteboul, Inria et ENS Paris, et Charlotte Truchet, Université Paris Sorbonne et Ircam.

    [1] Kino-Eye, ou Ciné-Œil, ou Kino Glaz, est à la fois un film et un manifeste du réalisateur et théoricien du cinéma Dziga Vertov, parus ensemble à Moscou en 1924 .

    [2] Répétitions en cours, La fabrique des Monstres de Jean-François Peyret.

    [3] http://pepr-iccare.fr

    https://binaire.socinfo.fr/les-entretiens-de-la-sif/

  • Où sont les femmes ? A l’école 42 !

    Un article de binaire parlait déjà de l’école 42 en 2014. On y trouvait certains aspects de la pédagogie intéressants. Cependant, nous avions été surpris par l’absence abyssale de considérations pour la fracture sociale et la question du genre. Carolina Somarriba Pérez-Desoy, qui a acquis ses galons d’informaticienne dans cette école, nous parle des changements pour les femmes. Serge Abiteboul et Chloé Mercier.

    Carolina Somarriba Pérez-Desoy

     

    L’école 42 était la nouvelle réponse (universelle) de ma mère à mes questionnements professionnels.

    Cet établissement créé par Xavier Niel en 2013, faisait souvent les gros titres en raison de sa pédagogie novatrice et de sa gratuité. Cette perspective ne m’enchantait guère : reprendre à zéro des études dans une école qui ne me fournirait pas forcément de diplôme, alors que mes six années d’études dont deux masters en urbanisme ne me suffisaient apparemment pas à trouver un travail ? Pourtant, si je n’arrivais pas à m’imaginer repartir pour des études dans un cadre strict comme celui, par exemple, de Sciences Po, je pouvais envisager de le faire en toute autonomie dans le cadre très différent d’une école singulière. L’alternative était de continuer à enchaîner des entretiens d’embauche déprimants.

    Photo d'une salle de travail à l'école 42.
    Une salle de travail, appelée « cluster » à 42.

    Une rapide recherche internet m’avait révélé l’existence d’une immersion d’une semaine (appelée « piscine Découverte ») qui devait nous apprendre les bases de la programmation web. Elle était destinée aussi bien aux étudiants de 42 qu’aux femmes âgées d’au moins 16 ans, désireuses de tester la pédagogie de l’école. Cette semaine allait déterminer si je me sentais capable de m’intégrer à des jeunes geeks problématiques sur les questions de sexisme. C’était l’image peu flatteuse que je me faisais des étudiants en tech. Certains scandales liés à cette école aidaient à confirmer ces craintes. Entre autres soucis, des listes de classement du physique des étudiantes, une discrimination assumée et des caméras de vidéosurveillance en libre-accès permettant un stalking illimité. Pour moi, l’école 42 paraissait le paradis des harceleurs.

    Je n’avais aucun bagage technique en informatique. Mais tel que le mentionnait l’école, la détermination et l’enthousiasme devaient suffire à combler mes lacunes.

    La découverte de l’école – une semaine « girl power »

    Une bande d’adolescents prépubères aux cheveux gras et aux habits (pyjamas ?) mal lavés, jetant des regards libidineux aux deux seules femmes de l’école. C’est ainsi que j’imaginais mon inconfortable entrée dans l’établissement. La réalité ? Des rangées entières de femmes venues découvrir l’école et des étudiants trop accaparés par leurs projets pour remarquer notre arrivée. Les étudiants, appelés « studs » (pour « students »), participant à cette immersion furent d’une grande assistance et nous encouragèrent toutes à tenter d’intégrer l’école. Malgré cela, la majorité des femmes externes abandonnèrent au cours des deux premiers jours, sentant leur retard se creuser d’heure en heure.

    Il faut dire que pour réussir à suivre (ne serait-ce que de loin) le rythme des studs, il fallait faire des horaires intensifs, et ne pas se laisser abattre par les échecs répétés. Pour autant, celles qui restèrent jusqu’au bout se présentèrent toutes à l’examen d’entrée.

    L’examen d’entrée – un mois de « piscine » décourageant

    L’examen d’entrée, la « piscine », consiste en un mois pendant lequel chaque candidat, appelé « piscineux » doit valider un maximum d’examens et exercices, appelés « days ». Le tout en autonomie, en étant corrigé par ses pairs ainsi que par un algorithme appelé Moulinette. La plupart des scandales liés à l’école ayant fait les grands titres avaient eu lieu pendant cette épreuve. Chose positive cependant, il semblait qu’un changement de direction dans les dernières années avait su rendre l’ambiance moins hostile et plus inclusive, notamment pour les femmes.

    Photo de la salle de pause de l'école.
    La salle de pause, reconvertie en dortoir les soirs de piscine.

    La réalité me parut plus contrastée quand je passai ma piscine en juillet 2022. S’il était bien vrai que beaucoup de progrès avaient été faits depuis le changement de direction, de nombreux comportements problématiques persistaient. Par exemple, il était courant d’entendre dire aux femmes qu’elles seraient favorisées au moment de la sélection et qu’elles pouvaient donc se permettre de maintenir leur niveau minable en programmation.

    Aussi, certaines piscineuses subissaient des pressions en tant que correctrices de la part de groupes d’hommes pour les forcer à valider leurs exercices. Et pendant qu’elles se faisaient corriger leurs travaux, les femmes étaient souvent méprisées par des correcteurs voulant montrer leur présumée supériorité technique. Étant donné l’accès difficile au « bocal », nom donné aux bureaux de l’administration, beaucoup de commentaires dévalorisants et de comportements désobligeants étaient tolérés par les piscineuses ceux-ci étant à la marge de ce qui pouvait être perçu comme suffisamment grave pour se sentir légitimes à les reporter. Cet ensemble pesait lourd sur le moral et poussait beaucoup de femmes à abandonner.

    Une grande partie de ces commentaires et comportements sexistes découlent d’une différence de niveau en informatique entre hommes et femmes. Pourtant, il est connu de tous les piscineux que le critère fondamental de sélection est le delta de progression de chacun plutôt que le niveau final atteint. Ainsi, les candidats sans connaissances préalables ne sont pas désavantagés. Malgré cela, beaucoup de femmes se sentent progresser plus lentement que le reste de leurs camarades masculins et se demandent si elles ont leur place dans l’école. En effet, ce sont quasi-exclusivement des hommes qui figurent dans le top 10 du classement de chaque piscine, qui ne prend en compte que le niveau atteint.  

    Au fil du temps, afin de limiter le nombre d’abandons féminins et de réduire les différences de niveau homme/femme, l’école avait mis en place plusieurs mesures.

    Pour commencer, l’école prit l’initiative d’instaurer un « Tea Time », une réunion hebdomadaire de trois heures animées par la directrice de l’école et d’autres membres féminins du staff. Celle-ci devait remotiver les femmes qui hésiteraient à abandonner la piscine. Beaucoup y ont trouvé des camarades avec qui travailler, plus proches de leur niveau et plus réceptives aux difficultés rencontrées. Personnellement, je n’ai assisté qu’à une seule d’entre elles, car je l’ai trouvée profondément déprimante. Trois heures de témoignages négatifs, de dénonciations de comportements inappropriés, ainsi que de nombreux craquages psychologiques en direct, c’était trop pour moi. Les retours de cette initiative ont néanmoins été positifs, beaucoup de femmes ayant trouvé le soutien émotionnel nécessaire pour se motiver à terminer la piscine. Ces séances avaient également aidé à se défaire d’éventuels syndromes de l’imposteur, et donc à se faire une place légitime dans l’école. Ces réunions ont aussi révélé des témoignages positifs sur des hommes prenant la défense de leurs collègues féminines face à des comportements déplacés.

    Ensuite, afin de favoriser l’entraide, et ainsi pallier les différences de niveau, l’école avait instauré le Voxotron, un système de votes hebdomadaire dans lequel tout piscineux pouvait voter pour les dix camarades l’ayant le plus aidé dans la semaine. Un candidat ne recevant aucun vote, même ayant atteint un niveau un élevé, ne serait pas sélectionné pour intégrer l’école. Cela devait forcer tous les candidats à aider leur prochain, et donc notamment à aider leurs camarades féminines, dont le vote était important.

    Malheureusement, d’autres initiatives dans cette même veine se retrouvaient contournées. C’était notamment le cas du système d’appariement des groupes de « rush », des projets communs ayant lieu pendant le weekend. Les meilleurs piscineux, généralement des hommes, préféraient parfois faire tout le travail seuls plutôt que de collaborer avec leurs camarades moins expérimentés, cela afin d’avancer plus vite. Cette attitude frustrait tant les hommes que les femmes en difficulté, qui auraient voulu profiter de cette opportunité pour progresser. Pour autant, cela semblait davantage affecter les femmes, plus enclines à travailler en groupe et qui semblaient plus souvent dérangées à l’idée de présenter un projet auquel elles n’avaient pas contribué. Cependant, lorsque les membres travaillaient en groupe, ces séances de rush étaient des moments de rencontre importants. Ils permettaient notamment de former des groupes de travail pour la suite ainsi que de se faire des connaissances à qui demander de l’aide. En bref, les rush étaient des moments généralement très appréciés et édifiants.

    Le cursus – deux années plus équilibrées

    Avec la baisse des inégalités de niveau à la fin de la piscine, s’étaient également réduits les comportements sexistes. De plus, j’avais été agréablement surprise de voir que les réclamations faites pendant la piscine avaient été prises très au sérieux par l’administration, qui avait refusé les candidats les plus problématiques. Même si certains comportements sexistes persistaient, ils étaient beaucoup moins importants. La piscine ayant permis aux femmes de rattraper une grande partie de leur retard technique et leur ayant permis de s’affirmer en ayant gagné en légitimité. Pendant le cursus, les femmes étaient loin d’être invisibles dans les « clusters » (salles de travail). Les amitiés et groupes de travail homme/femme étaient la norme.

    En 2024, alors que je viens de terminer mon cursus, les femmes ont obtenu un taux record de 46% de participation aux piscines de février et mars, et représentent environ 25% des étudiants. Ce nombre de femmes grandissant et avec une administration sensible et volontaire à atteindre la parité, être une femme à 42 est de plus en plus agréable au fil des années. Personnellement, j’ai mal été orientée dans mes choix d’études, car on partait du principe que je serais plus épanouie dans un milieu plus mixte et moins technique. Je me suis donc dirigée tard vers l’informatique, à mon grand regret.

    Cette école est très dure mais, si on est motivé et curieux, c’est aussi un lieu de rencontres incroyable. J’encourage tout le monde à venir essayer, en particulier les femmes, pour faire en sorte que l’informatique ne soit plus un secteur majoritairement masculin.

    Carolina Somarriba Pérez-Desoy, informaticienne