Mobiliser nos données et nos savoir-faire pour aider à la prise de décision en période de pandémie
De la recherche de traitement aux applications mobiles, en passant par l’anticipation des futurs épisodes épidémiques, la science des données est au cÅ“ur des enjeux scientifiques, économiques et sociaux. Au sein de l’±«²Ô¾±±¹±ð°ù²õ¾±³Ùé PSL laboratoires et équipes de recherche sont mobilisés pour répondre à l’urgence de la crise sanitaire. Jamal Atif, professeur à Dauphine – PSL, directeur scientifique adjoint de l’Institut PRAIRIE, et son équipe travaillent aujourd’hui sur la mise au point d’un outil d’aide à la décision pour la gestion de l’épidémie covid-19. Interview.
PSL : Pourriez-vous citer quelques projets sur lesquels les équipes de recherche de PSL en Sciences des données travaillent en ce moment pour répondre à la crise du Covid-19 ?
: Dans cette crise mondiale inédite, faut-il encore le préciser, le numérique occupe une place centrale. Télétravail, achats en ligne, applications…il se dessine un monde d’après crise où le numérique sera encore plus omniprésent. La recherche dans le numérique ne fait pas exception. Si les modèles épidémiologiques ne sont pas nouveaux, c'est, en revanche, la première fois qu’on travaille sur des données massives pour traiter une crise, au moins en Europe. Et cela est rendu possible par les méthodes et outils des sciences des données. Les projets de recherche dans ce domaine sont nombreux au sein de PSL : découverte de molécules d’intérêt par apprentissage automatique, diagnostic par imagerie, modèles prédictifs avec données de mobilité, etc. Il serait impossible de citer l’ensemble des projets, surtout que je n’ai qu’une connaissance partielle des différents travaux. Pour ma part, je suis pleinement mobilisé, avec d’autres chercheurs de PSL (Dauphine – PSL, MINES ParisTech – PSL, ENS – PSL) et ses partenaires dont le CNRS, sur un projet d’outils d’aide à la décision pour la gestion de l'épidémie Covid-19 à partir de données de mobilité. Celui-ci a bénéficié de l’existence de l’ pour accéder à des données d’un de ses partenaires mais surtout pour susciter l’intérêt des collègues et les associer au projet. Notre objectif est de fournir, dès que possible, des dispositifs afin d’aider les autorités et les citoyens à mieux appréhender la pandémie et à définir les politiques sanitaires les plus efficaces possibles.
PSL : Justement, comment ces projets de recherche rejoignent-ils aujourd’hui l’action du gouvernement pour gérer la crise sanitaire en cours ?
Jamal Atif : Il y a, avant tout, un élan de la communauté. Chacune et chacun sont prêts à aider. Des collègues sont impliqués au plus haut niveau. Je pense en particulier à Emmanuel Bacry, directeur de recherche au CNRS au , directeur scientifique du Health Data Hub (HDH) qui a été chargé par le gouvernement de coordonner avec la directrice du HDH une task force sur l’utilisation des données, notamment de santé, pour essayer de juguler la pandémie.
Concernant les modèles, nous essayons d’en quantifier l’incertitude. Mais on s’en remet à la fameuse maxime : tous les modèles sont faux, mais quelques-uns sont utiles.
Au sein de notre projet, après une phase fastidieuse de collecte et de préparation des données – pas tout à fait finalisée -, nous sommes en train de finaliser nos modèles. Les prochaines étapes consisteront à débattre nos modèles et résultats avec les spécialistes en épidémiologie, et si ceux-ci s’avèrent pertinents, nous les communiquerons au installé par le président de la République le 24 mars et présidé par Françoise Barré Sinoussi, prix Nobel de Médecine, et à son équivalent au CNRS care@CNRS.
Attention, toutefois, ces questions invitent à la prudence. En tant que scientifiques, nos actions ne sont pas prescriptives. Nous travaillons sur des modèles dont nous connaissons avant tout les limites et pour lesquels nous tâchons d’évaluer le potentiel. Il serait prétentieux, imprudent et contraire à nos méthodes scientifiques de revendiquer des certitudes ! J’insiste sur ce point. Si en sciences une connaissance n’est jamais figée, en l’occurrence sur ce sujet, plus on creuse plus on rencontre des zones d’ombres. Nos jeux de données sont hétérogènes, parfois incomplets, entachés souvent de biais et de bruit, et notre principal défi réside dans la constitution, avec l’aide des instances et autres partenaires, de jeux de données exploitables, ce qui n’est pas une tâche aisée. Concernant les modèles, nous essayons d’en quantifier l’incertitude. Mais on s’en remet à la fameuse maxime : tous les modèles sont faux, mais quelques uns sont utiles.
PSL : Les grandes entreprises du numérique telles que Facebook, Google ou Orange ouvrent leurs données et leurs infrastructures aux scientifiques et ingénieurs internationaux pour permettre de développer des outils de sortie de crise. S’agit-il selon vous d’une opportunité pour les scientifiques de PSL ?
Il s’agit d’inquiétudes légitimes et d’un point sur lequel nous sommes très exigeants. Nous utilisons des données agrégées à des échelles spatiales qui ne compromettent pas la vie privée des utilisateurs.
Jamal Atif : Il s’agit d’informations intéressantes mises à disposition de l’ensemble des acteurs de la recherche et qui peuvent être associées à d’autres jeux de données. PSL a eu, par exemple, très vite accès aux données du programme Data For Good de Facebook. Elles vont nous servir, pour le projet qui m’occupe, à étudier l’impact de la mobilité sur la prédiction des futures pandémies. Le contexte actuel fait que, dès que l’on associe dans une phrase GAFA et données, chacun craint pour ses données personnelles. Il s’agit d’inquiétudes légitimes et d’un point sur lequel nous sommes très exigeants. Nous utilisons des données agrégées à des échelles spatiales qui ne compromettent pas la vie privée des utilisateurs. En d’autres termes, notre intérêt n’est pas de savoir si telle ou telle personne se déplace, mais d’utiliser les données de mobilité de pré-confinement et les données de santé actualisées afin de réaliser des prévisions localisées de l’évolution possible de la pandémie en France selon différents scénarios de déconfinement. Nous espérons également utiliser ces informations pour comprendre si les covariables de mobilités et de densité ont un réel pouvoir prédictif sur l'évolution de l'épidémie et éventuellement assister le public une fois un déconfinement en place.