Education

Du marché de l’art à l’apprentissage automatique, rencontre avec une nouvelle génération d’enseignants-chercheurs en intelligence artificielle

Le

En 2023, l’˛ÝÁńÂŰĚł a recrutĂ© 8 Junior Fellow IA, de jeunes enseignants-chercheurs internationaux Ă  la pointe de l’utilisation des techniques d’intelligence artificielle dans leurs champs respectifs. Investis dans des recherches interdisciplinaires de haut niveau au sein des laboratoires de PSL, toutes et tous dispensent Ă©galement des cours dans le cadre de la mineure DATA de l’universitĂ©, destinĂ©s aux Ă©tudiants ainsi qu’aux professionnels.  
 

Florian Cafiero, Junior Fellow IA à l’École nationale des Chartes - PSL, spécialiste en analyse stylistique automatique, Léa Saint Raymond, Junior Fellow IA à l’ENS-PSL spécialisée dans l'histoire de l'art et la data science et Muni Sreenivas Pydi Junior Fellow IA à l’Université Paris Dauphine - PSL, expert en apprentissage automatique, reviennent sur leurs parcours et leur double mission de recherche et d’enseignement.

« Si l’intelligence artificielle est essentielle, elle ne suffit absolument pas à produire de nouveaux savoirs »

Florian Cafiero

Florian Cafiero, Junior Fellow IA à l’École des Chartes - PSL
Sujet de prédilection : l’analyse stylistique automatique

Pouvez-vous vous prĂ©senter ? 

J'ai suivi un parcours somme toute atypique. J'ai d'abord Ă©tudiĂ© Ă  l'École normale supĂ©rieure de Paris-Saclay, et me destinait alors Ă  des travaux en thĂ©orie des jeux. Mais j'ai lâchement abandonnĂ© mon laboratoire de l'École Polytechnique et la thèse qui m'y Ă©tait promise pour fouler les planches de l'opĂ©ra, oĂą j'ai connu une carrière de tĂ©nor soliste. La rencontre avec un camarade, alors Ă©tudiant Ă  l'École des chartes - PSL, m'a cependant permis de continuer mes travaux universitaires pendant mes pĂ©rĂ©grinations lyriques. J'ai dĂ©couvert avec lui le champ encore jeune en France des humanitĂ©s numĂ©riques et computationnelles, qui m'a passionnĂ©. Huit articles, un package logiciel et un livre en commun plus tard, nous continuons Ă  collaborer au sein de l’˛ÝÁńÂŰĚł, oĂą nous enseignons dĂ©sormais tous les deux. 

 

Vous avez Ă©tĂ© recrutĂ© en tant que Junior Fellow IA Ă  l’˛ÝÁńÂŰĚł, quelles sont vos activitĂ©s de recherche ? 

Même si je développe d'autres projets et de nouvelles compétences, le plus gros de mes travaux s'est concentré sur différentes applications de ce qu'on appelle le plus souvent le « traitement automatique des langues », et notamment à l'analyse du style. Au-delà du sens qu'il véhicule, un texte recèle en lui une quantité d'informations sur son auteur, sur l'époque ou le lieu à laquelle il a été écrit. La stylométrie étudie ces différents indices, et s'attache à repérer, de manière systématique, les tournures, la syntaxe, le vocabulaire etc. pour en déduire le maximum de précisions sur le contexte de production d'un texte. Ces techniques sont particulièrement cruciales pour l'étude de textes anciens ou médiévaux, dont auteur, date et lieu d'écriture sont souvent inconnus. Elles permettent également de juger de l'authenticité d'un texte : si un texte prétend raconter de première main l'histoire d'empereurs romains, mais utilise un latin qu'on ne parlait que deux siècles après leur disparition, on peut douter de la fiabilité du texte et de la sincérité de son auteur. Elles ont aussi aidé à réfuter, si besoin était, certaines rumeurs persistantes, comme l'idée selon laquelle Molière ne serait pas l'auteur de ses pièces, mais que Corneille aurait écrit tous ses chefs-d'œuvre. En examinant les textes des pièces de théâtre de l'époque, nous avons pu montrer que le style de Pierre Corneille était particulièrement distinct de celui de Molière, et même le plus éloigné de sa langue par rapport aux autres dramaturges de l'époque.

Au sein de poste, vous enseignez Ă©galement, pouvez-vous nous en dire plus sur vos cours ?

Mes enseignements au sein de PSL balayent un large spectre des applications potentielles de l'intelligence artificielle en sciences humaines et sociales. À l'École normale supérieure - PSL, j'enseignerai les applications de l'intelligence artificielle à l'étude de la littérature, un sujet qui coïncide beaucoup avec mes études sur le style, sans s'y réduire toutefois. Au sein du programme gradué de sciences sociales, j'évoquerai les applications des méthodes computationnelles à l'analyse de données textuelles issues d'Internet, un sujet que j'ai particulièrement exploré dans ma thèse au médialab de Sciences Po. Dans le Master Humanités numériques de PSL, j'enseigne la stylométrie et de manière plus générale, l'ensemble des techniques permettant de s'assurer de la meilleure connaissance possible de l'histoire d'un texte - on parle de « philologie computationnelle ». J'enseigne également l'apport des méthodes computationnelles aux sciences du patrimoines pour les archivistes paléographes et les de l'École des chartes - PSL. J'inaugure enfin un cours d'intelligence artificielle pour le droit à l'Université Paris - Dauphine - PSL, un champ très exploré notamment outre-Atlantique, où j'y fus beaucoup confronté, et qui se développe de plus en plus dans l'Hexagone.

Quels sont aujourd’hui les principaux enjeux de l’IA dans votre domaine de recherche ?

Les problèmes à explorer en humanités computationnelles sont trop nombreux pour être cités ici, tant le champ est encore jeune. Les chantiers de numérisation des œuvres et archives à analyser sont loin d'être achevés, et leurs analyses systématiques sont un terrain encore largement inexploré. De nouvelles tendances peut-être plus surprenantes émergent par ailleurs. On pourrait penser qu'en travaillant régulièrement sur des périodes anciennes, des champs comme les humanités numériques soient exempts d'applications pratiques. Nombre des méthodes développées dans ce domaine ont pourtant trouvé une utilité bien réelle. Dans mon cas, les idées de transfert vers des applications contemporaines sont nées de rencontres fortuites. Le New York Times a par exemple demandé à Jean-Baptiste Camps, responsable pédagogique du Master Humanités numériques et computationnelles, et moi-même d'enquêter sur le(s) auteur(s) se cachant derrière le mystérieux Q, leader du mouvement QAnon. Quelque temps après, c'est NBC qui nous demandait d'examiner un cold case tristement célèbre, et d'expertiser les lettres présumées du tueur du Zodiaque. Autant d'applications aussi éloignées que possibles de ce que nous avions en tête.

Tout rĂ©cemment, en donnant cours aux doctorants de la ConfĂ©rence Universitaire de Suisse Occidentale, j'ai rencontrĂ© Juan Barrios, spĂ©cialiste de psychologie clinique, qui a eu l'idĂ©e d'appliquer les mĂ©thodes que j'enseignais aux questions de son champ. Pouvait-on distinguer, dans la manière dont des individus Ă©voquent des souvenirs particuliers, des traits linguistiques spĂ©cifiques permettant de repĂ©rer les personnes atteintes de trouble dĂ©ficitaire de l'attention (TDAH). Avec une Ă©quipe interdisciplinaire de l'universitĂ© de Genève, nous avons depuis mis au point un procĂ©dĂ© permettant de dĂ©tecter correctement les textes Ă©crits par des personnes diagnostiquĂ©es comme atteintes d'un TDAH avec 92% de prĂ©cision. Il faudra bien sĂ»r du travail technique et de rĂ©flexions mĂ©dicales et Ă©thiques pour transformer cet outil en vĂ©ritable aide opĂ©rationnelle au diagnostic pour les praticiens. Mais ces premiers rĂ©sultats sont d'ores et dĂ©jĂ  plus qu'encourageants.  

Avez-vous un conseil pour les Ă©tudiantes et Ă©tudiants qui voudraient se diriger vers votre domaine de recherche ?

Les questions liĂ©es Ă  l'intelligence artificielle demandent bien sĂ»r une certaine maĂ®trise technique. Mais si elle est essentielle, elle ne suffit absolument pas Ă  produire de nouveaux savoirs. Les vertiges de la nouveautĂ© ou de la virtuositĂ© mathĂ©matique font parfois passer Ă  l'arrière-plan les questions de fond pour lesquelles nous dĂ©veloppons ces outils. Je suis parfois stupĂ©fait de lire des travaux rendus dans mes classes, prĂ©sentant des calculs d'une grande complexitĂ©, sur des bases de donnĂ©es manifestement jamais ouvertes, ou sur des textes dont on n'a pas eu la curiositĂ© de lire une page. Si sophistiquĂ© soit le calcul, il n'Ă©vite pas certaines fautes bĂŞtes qu'un simple coup d'Ĺ“il Ă  l'objet d'Ă©tude aurait Ă©viter. ConnaĂ®tre rĂ©ellement son objet, mettre le nez dans ces donnĂ©es, et rester conscient du fait que l'intelligence artificielle n'est qu'un outil de plus Ă  ajouter Ă  notre panoplie de mĂ©thodes, sont autant d'impĂ©ratifs pour qui veut tirer le meilleur parti de ces avancĂ©es.  

 

« L’idée d’un « art » généré par l’IA fascine autant qu’elle inquiète »

LĂ©a Saint-Raymond

Léa Saint Raymond, Junior Fellow IA à l’ENS-PSL
Sujet de prédilection : le marché de l’art

Pouvez-vous vous présenter ?

Je n’ai jamais su choisir entre les sciences et les lettres, tellement ces deux domaines me tiennent Ă  cĹ“ur. J’ai eu la chance d’intĂ©grer l’École normale supĂ©rieure après une hypokhâgne et khâgne BL, une filière classique avec beaucoup de mathĂ©matiques et de sciences Ă©conomiques et sociales. J’ai alors suivi un double cursus en histoire de l’art et en Ă©conomie, jusqu’à l’agrĂ©gation de sciences Ă©conomiques et sociales (SES) et la thèse. Entre 2017 et 2019, j’ai Ă©tĂ© attachĂ©e temporaire d'enseignement et de recherche (ATER) au Collège de France, puis post-doctorante au . Cela fait maintenant deux ans et demi que je coordonne l’ de l’ENS-PSL. En parallèle, je codirige le parcours « MarchĂ© de l’art » de l’École du Louvre.  

Vous avez Ă©tĂ© recrutĂ©e en tant que Junior Fellow IA Ă  l’˛ÝÁńÂŰĚł, quelles sont vos activitĂ©s de recherche ? 

Mon travail doctoral Ă©tudie les rouages du marchĂ© de l’art entre 1830 et 1939, Ă  partir des ventes aux enchères publiques parisiennes. Pour Ă©tudier ces quelque 250 000 transactions, j’ai mobilisĂ© les outils des humanitĂ©s numĂ©riques et des sciences sociales computationnelles – statistiques, Ă©conomĂ©trie, analyses factorielles, cartographie, analyse de rĂ©seaux. Le numĂ©rique m’a Ă©galement servi Ă  partager les bases de donnĂ©es que j’avais constituĂ©es, seule ou avec des collègues. Avec Julien Cavero et FĂ©licie de Maupeou, par exemple, nous avons fondĂ© le projet (une cartographie des marchands de tableaux parisiens entre 1815 et 1955), et avec les Ă©tudiants de l’ENS-PSL, nous avons dĂ©ployĂ© – le catalogue en ligne de la collection de tableaux, sculptures et dessins, constituĂ©e par le chirurgien-dentiste George Viau : ce corpus sert de socle au de PSL que j’imagine avec . En parallèle, et de la mĂŞme manière que les humanitĂ©s numĂ©riques dĂ©centrent le regard portĂ© sur les Ĺ“uvres, j’explore un autre rĂ©cit de l’histoire de l’art, plus global, Ă  travers des publications et le commissariat d’une exposition, Mondes connectĂ©s, qui ouvrira en juin 2024 au MusĂ©e des Beaux-Arts de Lyon.   

Au sein de poste, vous enseignez Ă©galement, pouvez-vous nous en dire plus sur vos cours ?

J’ai la chance d’enseigner l’histoire de l’art au Cycle Pluridisciplinaire d'Études SupĂ©rieures (CPES) de PSL depuis 2019, et de coordonner les enseignements artistiques de la filière HumanitĂ©s depuis l’an dernier. Le CPES offre un cadre exceptionnel pour expĂ©rimenter des idĂ©es nouvelles, avec des Ă©tudiantes et des Ă©tudiants particulièrement ouverts et crĂ©atifs : la promotion 2020 a participĂ© activement au manuscrit de mon cours, paru aux Éditions Rue d’Ulm sous le titre Fragments d’une histoire globale de l’art. C’était un grand moment d’échange. De mĂŞme, les CPES 1 de l’annĂ©e 2022-2023 m’ont permis de penser autrement une autre publication, sur le thème de l’ici et de l’ailleurs en histoire de l’art, qui paraĂ®tra aux Presses universitaires de Rennes. Ă€ l’ENS-PSL, mes cours s’adressent Ă  un niveau master-doctorat et sont tournĂ©s vers les humanitĂ©s numĂ©riques computationnelles, appliquĂ©es Ă  la recherche. Il s’agit de comprendre les enjeux – et les limites – des outils numĂ©riques, de maĂ®triser les logiciels et d’obtenir les bases de la programmation en Python.  

Quels sont aujourd’hui les principaux enjeux de l’IA dans votre domaine de recherche ?

 
L’IA a fait irruption dans le marchĂ© de l’art de façon tonitruante avec l’adjudication du Portrait d’Edmond Belamy, mis en vente chez Christie’s en octobre 2018, et adjugĂ© 432 500 dollars, soit plus de 45 fois son estimation haute. Cette Ĺ“uvre a fait couler beaucoup d’encre, car elle a Ă©tĂ© « crĂ©Ă©e » par le collectif parisien Obvious Ă  partir d’un algorithme appelĂ© GAN (Generative Adversarial Network), et signĂ©e, de manière ironique, par la formule mathĂ©matique qui a servi Ă  la gĂ©nĂ©rer. Au-delĂ  de ce coup mĂ©diatique, l’idĂ©e d’un « art » gĂ©nĂ©rĂ© par l’IA fascine autant qu’elle inquiète. Un pan de ma recherche actuelle interroge la place de l’IA dans la crĂ©ation artistique et le marchĂ© de l’art, en prenant le recul de l’histoire et des sciences Ă©conomiques et sociales. Cette rĂ©flexion a conduit Ă  avec la rĂ©daction de France Culture.  

Lire aussi : interview de LĂ©a Saint Raymond sur France Culture

Avez-vous un conseil pour les Ă©tudiantes et Ă©tudiants qui voudraient se diriger vers votre domaine de recherche ?

Les œuvres d’art gagnent à être vues, et comprises, en se décentrant sans cesse. Avec le monde des musées, le marché de l’art est un terrain formidable pour être au plus près des objets, et avoir un contact privilégié avec eux. Franchissez les portes de l’hôtel Drouot – c’est gratuit ! – et déambulez dans les salles. Le matin, vous pourrez visiter un musée aussi éclectique qu’éphémère, car il sera mis en vente l’après-midi. L’atmosphère est unique. Si vous avez cours, vous pouvez vous rattraper en lisant la Gazette Drouot, un véritable manuel d’histoire de l’art superbement illustré et abordable, qui paraît chaque vendredi.

 

« Toutes les applications de l’IA nĂ©cessitent une attention particulière, portĂ©e sur la rĂ©sistance, la confidentialitĂ© et l’équitĂ© des algorithmes utilisĂ©s » 

Muni Sreenivas Pydi

Muni Sreenivas Pydi, Junior Fellow IA à l’Université Paris Dauphine - PSL
Sujet de prédilection : l’apprentissage automatique

Pouvez-vous vous prĂ©senter ? 

Je suis AI Junior Fellow Ă  l'˛ÝÁńÂŰĚł depuis octobre 2022. Avant cela, j'ai effectuĂ© un doctorat Ă  l'University of Wisconsin–Madison aux États-Unis, supervisĂ© par le professeur Varun Jog, spĂ©cialiste en gĂ©nie Ă©lectrique et informatique. Ma thèse portait sur les liens surprenants entre la thĂ©orie du transport optimal et l’apprentissage automatique contradictoire. J'ai Ă©galement passĂ© trois mois l'Ă©tĂ© dernier en tant qu'Ă©tudiant invitĂ© au Laboratoire de Statistique de l'UniversitĂ© de Cambridge, au Royaume-Uni. Avant de commencer mes Ă©tudes supĂ©rieures, j'ai travaillĂ© comme ingĂ©nieur logiciel chez Samsung R&D Ă  Bangalore, en Inde. J'ai Ă©galement fait mes Ă©tudes de premier cycle en Inde, Ă  l'Indian Institute of Technology Madras.

 

Vous avez Ă©tĂ© recrutĂ© en tant que Junior Fellow IA Ă  l’˛ÝÁńÂŰĚł, quelles sont vos activitĂ©s de recherche ? 

Je suis membre du à Dauphine - PSL, et je travaille en étroite collaboration avec (Machine Intelligence and Learning Systems). L’objectif de mes recherches ? Rendre l'apprentissage automatique plus fiable. J'essaie de comprendre les limites des algorithmes du point de vue de leur résistance aux corruptions, de leur capacité à respecter la confidentialité des données, et de leur « équité » envers différents sous-groupes de données. Pour m’aider dans cette analyse, j'utilise des techniques issues de la théorie du transport optimal, de la théorie de l'information et des statistiques de grande dimension.

Au sein de poste, vous enseignez Ă©galement, pouvez-vous nous en dire plus sur vos cours ?

Mes missions d'enseignement sont très variĂ©es. Au sein du (AISD) je donne un cours sur la confidentialitĂ© diffĂ©rentielle pour l'apprentissage automatique avec , (ENS-PSL) et (Dauphine – PSL). Je suis Ă©galement impliquĂ© dans le programme DATA de l'˛ÝÁńÂŰĚł qui propose des formations en science des donnĂ©es et en intelligence artificielle Ă  tous les chercheurs, doctorants et post-doctorants de l’universitĂ©, adaptĂ©es Ă  leur discipline et Ă  leur niveau. Au sein de ce programme, je donne des cours sur les structures de donnĂ©es et les algorithmes du langage de programmation Python, ainsi que sur la gestion des donnĂ©es avec SQL, un langage standard pour la crĂ©ation et la manipulation de bases de donnĂ©es. Je dispense Ă©galement un sĂ©minaire d'apprentissage automatique destinĂ© aux Ă©tudiants du programme CoFund AI4theSciences de l'˛ÝÁńÂŰĚł.

Quels sont aujourd’hui les principaux enjeux de l’IA dans votre domaine de recherche ?

Nous vivons Ă  une Ă©poque oĂą les algorithmes d’IA sont de plus en plus utilisĂ©s dans tous les domaines. Ils sont par exemple employĂ©s dans des applications critiques pour la sĂ©curitĂ© et la santĂ©, comme la conduite de vĂ©hicules autonomes sur les autoroutes ou l’aide aux mĂ©decins pour Ă©tablir des diagnostics mĂ©dicaux.  
Ces algorithmes sont aussi utilisés pour tirer des informations de données sensibles et privées telles que des informations financières et médicales. Nous nous en servons également pour prendre des décisions ayant un impact social comme les demandes de prêt bancaire, la détermination des cotes de crédit et la présélection des candidats pour des entretiens d'embauche. Toutes ces applications, aussi variées qu'elles soient, nécessitent donc une attention particulière, portée sur la résistance, la confidentialité et l’équité des algorithmes. Même si nous louons les avancées rendues possibles par les technologies de l’IA, nous devons absolument garder à l’esprit leurs limites et les utiliser avec prudence.

Avez-vous un conseil pour les Ă©tudiantes et Ă©tudiants qui voudraient se diriger vers votre domaine de recherche ?

L’IA est un domaine de recherche en croissance si rapide qu’il est impossible de suivre le rythme de l’innovation. Je recommande aux étudiants et aux étudiantes qui souhaitent poursuivre des recherches en IA, en particulier des recherches théoriques, de passer d'abord du temps à apprendre les principes fondamentaux. Une fois que vous disposerez d’une base solide, vous pourrez ensuite poursuivre la spécialité de votre choix.

Ă€ propos du programme DATA

Le programme DATA rassemble toutes les opportunitĂ©s de formation en IA et aux interfaces des autres disciplines scientifiques au sein de l’˛ÝÁńÂŰĚł, par le biais de nombreuses actions : des semaines d'immersion, des cursus dĂ©diĂ©s, la formation des formateurs, etc. Il s'adresse Ă  tous les publics : Ă©tudiants en licence, master ou doctorat, professionnels, enseignants-chercheurs