Formation

Du marché de l’art à l’apprentissage automatique, rencontre avec une nouvelle génération d’enseignants-chercheurs en intelligence artificielle

Le

En 2023, l’±«²Ô¾±±¹±ð°ù²õ¾±³Ùé PSL a recruté 8 Junior Fellow IA, de jeunes enseignants-chercheurs internationaux à la pointe de l’utilisation des techniques d’intelligence artificielle dans leurs champs respectifs. Investis dans des recherches interdisciplinaires de haut niveau au sein des laboratoires de PSL, toutes et tous dispensent également des cours dans le cadre de la mineure DATA de l’université, destinés aux étudiants ainsi qu’aux professionnels.  
 

Florian Cafiero, Junior Fellow IA à l’École nationale des Chartes - PSL, spécialiste en analyse stylistique automatique, Léa Saint Raymond, Junior Fellow IA à l’ENS-PSL spécialisée dans l'histoire de l'art et la data science et Muni Sreenivas Pydi Junior Fellow IA à l’±«²Ô¾±±¹±ð°ù²õ¾±³Ùé Paris Dauphine - PSL, expert en apprentissage automatique, reviennent sur leurs parcours et leur double mission de recherche et d’enseignement.

« Si l’intelligence artificielle est essentielle, elle ne suffit absolument pas à produire de nouveaux savoirs »

Florian Cafiero

Florian Cafiero, Junior Fellow IA à l’École des Chartes - PSL
Sujet de prédilection : l’analyse stylistique automatique

Pouvez-vous vous présenter ? 

J'ai suivi un parcours somme toute atypique. J'ai d'abord étudié à l'École normale supérieure de Paris-Saclay, et me destinait alors à des travaux en théorie des jeux. Mais j'ai lâchement abandonné mon laboratoire de l'École Polytechnique et la thèse qui m'y était promise pour fouler les planches de l'opéra, où j'ai connu une carrière de ténor soliste. La rencontre avec un camarade, alors étudiant à l'École des chartes - PSL, m'a cependant permis de continuer mes travaux universitaires pendant mes pérégrinations lyriques. J'ai découvert avec lui le champ encore jeune en France des humanités numériques et computationnelles, qui m'a passionné. Huit articles, un package logiciel et un livre en commun plus tard, nous continuons à collaborer au sein de l’±«²Ô¾±±¹±ð°ù²õ¾±³Ùé PSL, où nous enseignons désormais tous les deux. 

 

Vous avez été recruté en tant que Junior Fellow IA à l’±«²Ô¾±±¹±ð°ù²õ¾±³Ùé PSL, quelles sont vos activités de recherche ? 

Même si je développe d'autres projets et de nouvelles compétences, le plus gros de mes travaux s'est concentré sur différentes applications de ce qu'on appelle le plus souvent le « traitement automatique des langues », et notamment à l'analyse du style. Au-delà du sens qu'il véhicule, un texte recèle en lui une quantité d'informations sur son auteur, sur l'époque ou le lieu à laquelle il a été écrit. La stylométrie étudie ces différents indices, et s'attache à repérer, de manière systématique, les tournures, la syntaxe, le vocabulaire etc. pour en déduire le maximum de précisions sur le contexte de production d'un texte. Ces techniques sont particulièrement cruciales pour l'étude de textes anciens ou médiévaux, dont auteur, date et lieu d'écriture sont souvent inconnus. Elles permettent également de juger de l'authenticité d'un texte : si un texte prétend raconter de première main l'histoire d'empereurs romains, mais utilise un latin qu'on ne parlait que deux siècles après leur disparition, on peut douter de la fiabilité du texte et de la sincérité de son auteur. Elles ont aussi aidé à réfuter, si besoin était, certaines rumeurs persistantes, comme l'idée selon laquelle Molière ne serait pas l'auteur de ses pièces, mais que Corneille aurait écrit tous ses chefs-d'œuvre. En examinant les textes des pièces de théâtre de l'époque, nous avons pu montrer que le style de Pierre Corneille était particulièrement distinct de celui de Molière, et même le plus éloigné de sa langue par rapport aux autres dramaturges de l'époque.

Au sein de poste, vous enseignez également, pouvez-vous nous en dire plus sur vos cours ?

Mes enseignements au sein de PSL balayent un large spectre des applications potentielles de l'intelligence artificielle en sciences humaines et sociales. À l'École normale supérieure - PSL, j'enseignerai les applications de l'intelligence artificielle à l'étude de la littérature, un sujet qui coïncide beaucoup avec mes études sur le style, sans s'y réduire toutefois. Au sein du programme gradué de sciences sociales, j'évoquerai les applications des méthodes computationnelles à l'analyse de données textuelles issues d'Internet, un sujet que j'ai particulièrement exploré dans ma thèse au médialab de Sciences Po. Dans le Master Humanités numériques de PSL, j'enseigne la stylométrie et de manière plus générale, l'ensemble des techniques permettant de s'assurer de la meilleure connaissance possible de l'histoire d'un texte - on parle de « philologie computationnelle ». J'enseigne également l'apport des méthodes computationnelles aux sciences du patrimoines pour les archivistes paléographes et les de l'École des chartes - PSL. J'inaugure enfin un cours d'intelligence artificielle pour le droit à l'±«²Ô¾±±¹±ð°ù²õ¾±³Ùé Paris - Dauphine - PSL, un champ très exploré notamment outre-Atlantique, où j'y fus beaucoup confronté, et qui se développe de plus en plus dans l'Hexagone.

Quels sont aujourd’hui les principaux enjeux de l’IA dans votre domaine de recherche ?

Les problèmes à explorer en humanités computationnelles sont trop nombreux pour être cités ici, tant le champ est encore jeune. Les chantiers de numérisation des œuvres et archives à analyser sont loin d'être achevés, et leurs analyses systématiques sont un terrain encore largement inexploré. De nouvelles tendances peut-être plus surprenantes émergent par ailleurs. On pourrait penser qu'en travaillant régulièrement sur des périodes anciennes, des champs comme les humanités numériques soient exempts d'applications pratiques. Nombre des méthodes développées dans ce domaine ont pourtant trouvé une utilité bien réelle. Dans mon cas, les idées de transfert vers des applications contemporaines sont nées de rencontres fortuites. Le New York Times a par exemple demandé à Jean-Baptiste Camps, responsable pédagogique du Master Humanités numériques et computationnelles, et moi-même d'enquêter sur le(s) auteur(s) se cachant derrière le mystérieux Q, leader du mouvement QAnon. Quelque temps après, c'est NBC qui nous demandait d'examiner un cold case tristement célèbre, et d'expertiser les lettres présumées du tueur du Zodiaque. Autant d'applications aussi éloignées que possibles de ce que nous avions en tête.

Tout récemment, en donnant cours aux doctorants de la Conférence Universitaire de Suisse Occidentale, j'ai rencontré Juan Barrios, spécialiste de psychologie clinique, qui a eu l'idée d'appliquer les méthodes que j'enseignais aux questions de son champ. Pouvait-on distinguer, dans la manière dont des individus évoquent des souvenirs particuliers, des traits linguistiques spécifiques permettant de repérer les personnes atteintes de trouble déficitaire de l'attention (TDAH). Avec une équipe interdisciplinaire de l'université de Genève, nous avons depuis mis au point un procédé permettant de détecter correctement les textes écrits par des personnes diagnostiquées comme atteintes d'un TDAH avec 92% de précision. Il faudra bien sûr du travail technique et de réflexions médicales et éthiques pour transformer cet outil en véritable aide opérationnelle au diagnostic pour les praticiens. Mais ces premiers résultats sont d'ores et déjà plus qu'encourageants.  

Avez-vous un conseil pour les étudiantes et étudiants qui voudraient se diriger vers votre domaine de recherche ?

Les questions liées à l'intelligence artificielle demandent bien sûr une certaine maîtrise technique. Mais si elle est essentielle, elle ne suffit absolument pas à produire de nouveaux savoirs. Les vertiges de la nouveauté ou de la virtuosité mathématique font parfois passer à l'arrière-plan les questions de fond pour lesquelles nous développons ces outils. Je suis parfois stupéfait de lire des travaux rendus dans mes classes, présentant des calculs d'une grande complexité, sur des bases de données manifestement jamais ouvertes, ou sur des textes dont on n'a pas eu la curiosité de lire une page. Si sophistiqué soit le calcul, il n'évite pas certaines fautes bêtes qu'un simple coup d'Å“il à l'objet d'étude aurait éviter. Connaître réellement son objet, mettre le nez dans ces données, et rester conscient du fait que l'intelligence artificielle n'est qu'un outil de plus à ajouter à notre panoplie de méthodes, sont autant d'impératifs pour qui veut tirer le meilleur parti de ces avancées.  

 

« L’idée d’un « art » généré par l’IA fascine autant qu’elle inquiète »

Léa Saint-Raymond

Léa Saint Raymond, Junior Fellow IA à l’ENS-PSL
Sujet de prédilection : le marché de l’art

Pouvez-vous vous présenter ?

Je n’ai jamais su choisir entre les sciences et les lettres, tellement ces deux domaines me tiennent à cÅ“ur. J’ai eu la chance d’intégrer l’École normale supérieure après une hypokhâgne et khâgne BL, une filière classique avec beaucoup de mathématiques et de sciences économiques et sociales. J’ai alors suivi un double cursus en histoire de l’art et en économie, jusqu’à l’agrégation de sciences économiques et sociales (SES) et la thèse. Entre 2017 et 2019, j’ai été attachée temporaire d'enseignement et de recherche (ATER) au Collège de France, puis post-doctorante au . Cela fait maintenant deux ans et demi que je coordonne l’ de l’ENS-PSL. En parallèle, je codirige le parcours « Marché de l’art » de l’École du Louvre.  

Vous avez été recrutée en tant que Junior Fellow IA à l’±«²Ô¾±±¹±ð°ù²õ¾±³Ùé PSL, quelles sont vos activités de recherche ? 

Mon travail doctoral étudie les rouages du marché de l’art entre 1830 et 1939, à partir des ventes aux enchères publiques parisiennes. Pour étudier ces quelque 250 000 transactions, j’ai mobilisé les outils des humanités numériques et des sciences sociales computationnelles – statistiques, économétrie, analyses factorielles, cartographie, analyse de réseaux. Le numérique m’a également servi à partager les bases de données que j’avais constituées, seule ou avec des collègues. Avec Julien Cavero et Félicie de Maupeou, par exemple, nous avons fondé le projet (une cartographie des marchands de tableaux parisiens entre 1815 et 1955), et avec les étudiants de l’ENS-PSL, nous avons déployé – le catalogue en ligne de la collection de tableaux, sculptures et dessins, constituée par le chirurgien-dentiste George Viau : ce corpus sert de socle au de PSL que j’imagine avec . En parallèle, et de la même manière que les humanités numériques décentrent le regard porté sur les Å“uvres, j’explore un autre récit de l’histoire de l’art, plus global, à travers des publications et le commissariat d’une exposition, Mondes connectés, qui ouvrira en juin 2024 au Musée des Beaux-Arts de Lyon.   

Au sein de poste, vous enseignez également, pouvez-vous nous en dire plus sur vos cours ?

J’ai la chance d’enseigner l’histoire de l’art au Cycle Pluridisciplinaire d'Études Supérieures (CPES) de PSL depuis 2019, et de coordonner les enseignements artistiques de la filière Humanités depuis l’an dernier. Le CPES offre un cadre exceptionnel pour expérimenter des idées nouvelles, avec des étudiantes et des étudiants particulièrement ouverts et créatifs : la promotion 2020 a participé activement au manuscrit de mon cours, paru aux Éditions Rue d’Ulm sous le titre Fragments d’une histoire globale de l’art. C’était un grand moment d’échange. De même, les CPES 1 de l’année 2022-2023 m’ont permis de penser autrement une autre publication, sur le thème de l’ici et de l’ailleurs en histoire de l’art, qui paraîtra aux Presses universitaires de Rennes. À l’ENS-PSL, mes cours s’adressent à un niveau master-doctorat et sont tournés vers les humanités numériques computationnelles, appliquées à la recherche. Il s’agit de comprendre les enjeux – et les limites – des outils numériques, de maîtriser les logiciels et d’obtenir les bases de la programmation en Python.  

Quels sont aujourd’hui les principaux enjeux de l’IA dans votre domaine de recherche ?

 
L’IA a fait irruption dans le marché de l’art de façon tonitruante avec l’adjudication du Portrait d’Edmond Belamy, mis en vente chez Christie’s en octobre 2018, et adjugé 432 500 dollars, soit plus de 45 fois son estimation haute. Cette Å“uvre a fait couler beaucoup d’encre, car elle a été « créée » par le collectif parisien Obvious à partir d’un algorithme appelé GAN (Generative Adversarial Network), et signée, de manière ironique, par la formule mathématique qui a servi à la générer. Au-delà de ce coup médiatique, l’idée d’un « art » généré par l’IA fascine autant qu’elle inquiète. Un pan de ma recherche actuelle interroge la place de l’IA dans la création artistique et le marché de l’art, en prenant le recul de l’histoire et des sciences économiques et sociales. Cette réflexion a conduit à avec la rédaction de France Culture.  

Lire aussi : interview de Léa Saint Raymond sur France Culture

Avez-vous un conseil pour les étudiantes et étudiants qui voudraient se diriger vers votre domaine de recherche ?

Les œuvres d’art gagnent à être vues, et comprises, en se décentrant sans cesse. Avec le monde des musées, le marché de l’art est un terrain formidable pour être au plus près des objets, et avoir un contact privilégié avec eux. Franchissez les portes de l’hôtel Drouot – c’est gratuit ! – et déambulez dans les salles. Le matin, vous pourrez visiter un musée aussi éclectique qu’éphémère, car il sera mis en vente l’après-midi. L’atmosphère est unique. Si vous avez cours, vous pouvez vous rattraper en lisant la Gazette Drouot, un véritable manuel d’histoire de l’art superbement illustré et abordable, qui paraît chaque vendredi.

 

« Toutes les applications de l’IA nécessitent une attention particulière, portée sur la résistance, la confidentialité et l’équité des algorithmes utilisés » 

Muni Sreenivas Pydi

Muni Sreenivas Pydi, Junior Fellow IA à l’±«²Ô¾±±¹±ð°ù²õ¾±³Ùé Paris Dauphine - PSL
Sujet de prédilection : l’apprentissage automatique

Pouvez-vous vous présenter ? 

Je suis AI Junior Fellow à l'±«²Ô¾±±¹±ð°ù²õ¾±³Ùé PSL depuis octobre 2022. Avant cela, j'ai effectué un doctorat à l'University of Wisconsin–Madison aux États-Unis, supervisé par le professeur Varun Jog, spécialiste en génie électrique et informatique. Ma thèse portait sur les liens surprenants entre la théorie du transport optimal et l’apprentissage automatique contradictoire. J'ai également passé trois mois l'été dernier en tant qu'étudiant invité au Laboratoire de Statistique de l'±«²Ô¾±±¹±ð°ù²õ¾±³Ùé de Cambridge, au Royaume-Uni. Avant de commencer mes études supérieures, j'ai travaillé comme ingénieur logiciel chez Samsung R&D à Bangalore, en Inde. J'ai également fait mes études de premier cycle en Inde, à l'Indian Institute of Technology Madras.

 

Vous avez été recruté en tant que Junior Fellow IA à l’±«²Ô¾±±¹±ð°ù²õ¾±³Ùé PSL, quelles sont vos activités de recherche ? 

Je suis membre du à Dauphine - PSL, et je travaille en étroite collaboration avec (Machine Intelligence and Learning Systems). L’objectif de mes recherches ? Rendre l'apprentissage automatique plus fiable. J'essaie de comprendre les limites des algorithmes du point de vue de leur résistance aux corruptions, de leur capacité à respecter la confidentialité des données, et de leur « équité » envers différents sous-groupes de données. Pour m’aider dans cette analyse, j'utilise des techniques issues de la théorie du transport optimal, de la théorie de l'information et des statistiques de grande dimension.

Au sein de poste, vous enseignez également, pouvez-vous nous en dire plus sur vos cours ?

Mes missions d'enseignement sont très variées. Au sein du (AISD) je donne un cours sur la confidentialité différentielle pour l'apprentissage automatique avec , (ENS-PSL) et (Dauphine – PSL). Je suis également impliqué dans le programme DATA de l'±«²Ô¾±±¹±ð°ù²õ¾±³Ùé PSL qui propose des formations en science des données et en intelligence artificielle à tous les chercheurs, doctorants et post-doctorants de l’université, adaptées à leur discipline et à leur niveau. Au sein de ce programme, je donne des cours sur les structures de données et les algorithmes du langage de programmation Python, ainsi que sur la gestion des données avec SQL, un langage standard pour la création et la manipulation de bases de données. Je dispense également un séminaire d'apprentissage automatique destiné aux étudiants du programme CoFund AI4theSciences de l'±«²Ô¾±±¹±ð°ù²õ¾±³Ùé PSL.

Quels sont aujourd’hui les principaux enjeux de l’IA dans votre domaine de recherche ?

Nous vivons à une époque où les algorithmes d’IA sont de plus en plus utilisés dans tous les domaines. Ils sont par exemple employés dans des applications critiques pour la sécurité et la santé, comme la conduite de véhicules autonomes sur les autoroutes ou l’aide aux médecins pour établir des diagnostics médicaux.  
Ces algorithmes sont aussi utilisés pour tirer des informations de données sensibles et privées telles que des informations financières et médicales. Nous nous en servons également pour prendre des décisions ayant un impact social comme les demandes de prêt bancaire, la détermination des cotes de crédit et la présélection des candidats pour des entretiens d'embauche. Toutes ces applications, aussi variées qu'elles soient, nécessitent donc une attention particulière, portée sur la résistance, la confidentialité et l’équité des algorithmes. Même si nous louons les avancées rendues possibles par les technologies de l’IA, nous devons absolument garder à l’esprit leurs limites et les utiliser avec prudence.

Avez-vous un conseil pour les étudiantes et étudiants qui voudraient se diriger vers votre domaine de recherche ?

L’IA est un domaine de recherche en croissance si rapide qu’il est impossible de suivre le rythme de l’innovation. Je recommande aux étudiants et aux étudiantes qui souhaitent poursuivre des recherches en IA, en particulier des recherches théoriques, de passer d'abord du temps à apprendre les principes fondamentaux. Une fois que vous disposerez d’une base solide, vous pourrez ensuite poursuivre la spécialité de votre choix.

À propos du programme DATA

Le programme DATA rassemble toutes les opportunités de formation en IA et aux interfaces des autres disciplines scientifiques au sein de l’±«²Ô¾±±¹±ð°ù²õ¾±³Ùé PSL, par le biais de nombreuses actions : des semaines d'immersion, des cursus dédiés, la formation des formateurs, etc. Il s'adresse à tous les publics : étudiants en licence, master ou doctorat, professionnels, enseignants-chercheurs