S’inscrivant dans la Stratégie d’Accélération du Numérique en Santé (SASN) et dans le Grand Défi “Améliorer les dispositifs médicaux à l’aide de l’intelligence artificielle”, les Data Challenges en santé ont été initiés en 2020 par la Délégation ministérielle au Numérique en Santé, le Secrétariat général pour l’investissement (SGPI) et le Health Data Hub (HDH).
Lors de ces compétitions internationales, des centaines de participants aux profils variés (data scientists, étudiants, chercheurs, industriels…) s’affrontent pour concevoir l’algorithme le plus performant pour répondre à une problématique médicale en un temps imparti. Les Data Challenges contribuent ainsi à valoriser les données de santé à l’aide de l’IA (apprentissage supervisé), tout en favorisant la collaboration entre les acteurs de l’écosystème de santé.
Comment ça marche, quels sont les sujets traités et les résultats obtenus ? On fait le point sur les Data Challenges en santé.
Comment ça marche ?
Les Data Challenges en santé prennent la forme d’appels à projets opérés par Bpifrance, en partenariat avec le Health Data Hub. Ces appels à projet s’adressent aux sociétés savantes, aux établissements de santé et aux groupements de coopération sanitaire souhaitant organiser un challenge autour d’une problématique relevant de la médecine personnalisée.
Les Data Challenges en santé constituent un levier innovant pour transmettre la culture de l’Open Science.
Les lauréats des appels à projet bénéficient d’un soutien financier pouvant aller jusqu’à 300 000 euros et d’un accompagnement opérationnel par le Health Data Hub (qui fournit un accès sécurisé à des données de santé de haute qualité). L’intelligence collective est au cœur des challenges, puisque les données et algorithmes qui en sont issus doivent être partagés en open data et en open source, faisant de ces compétitions “un levier innovant pour transmettre la culture de l’Open Science”.
L’organisation d’un Data Challenge est un processus s’étalant sur 18 mois et impliquant de nombreuses parties prenantes : équipe projet, comité d’organisation, conseil scientifique, fournisseurs de données… Le processus se déroule de la manière suivante :
- Cadrage scientifique, réglementaire, opérationnel et financier
- Collecte des données
- Préparation des données (annotation et labellisation)
- Data Challenge (1 à 4 mois)
- Communication et valorisation des résultats
Le Data Challenge en lui-même est ouvert à tous : aucun prérequis n’est nécessaire, l’inscription et la participation sont gratuites. La compétition se déroule en ligne sur une plateforme dédiée, qui permet aux participants de :
- comprendre la problématique et les règles du challenge,
- accéder aux jeux de données mis à disposition et à un espace de calcul,
- se mesurer aux autres participants via un classement,
- échanger avec les autres participants grâce à des espaces collaboratifs.
Le Data Challenge en lui-même est ouvert à tous : aucun prérequis n’est nécessaire, l’inscription et la participation sont gratuites
Les Data Challenges terminés et en cours
Le premier Data Challenge a été organisé en 2020 par la Société Française de Pathologie (SFP) et avait pour thématique le diagnostic du cancer du col de l’utérus. Ce premier challenge, baptisé “TissueNet”, a rassemblé 36 équipes (pour un total de 574 participants) entre septembre et octobre 2020, tous poursuivant le même objectif : développer le meilleur algorithme de détection de lésion sur des biopsies du col de l’utérus. Ce Data Challenge a été un succès, avec des scores de détection allant jusqu’à 94 %.
En 2021, 6 projets ont été sélectionnés par Bpifrance et le Health Data Hub :
- VisioMel : ce challenge avait pour objectif de développer un algorithme d’IA permettant de prédire la récidive à 5 ans de patients atteints de mélanome.
- Allergen Chip : l’objectif de ce projet était de développer un algorithme d’intelligence artificielle (IA) permettant de faciliter le diagnostic des allergies.
- D-IA-GNO-DENT : ce challenge visait à faciliter la détection précoce des maladies rares à composante dentaire, orale et faciale.
- Dat-HUB (Data challenge non ouvert)
- C-Plu-NET (Data challenge non ouvert)
- DigiLUT : ce data challenge a débuté le 31 mai 2024, avec l’objectif de “faire émerger une solution d’aide à l’analyse des biopsies transbronchiques de greffons pulmonaires chez les patients greffés”.
En 2022, 3 nouveaux projets ont été sélectionnés :
- CardI-HACK (Data challenge non ouvert)
- Annit-IA (Data challenge non ouvert)
- Cytologia (Data challenge non ouvert)
Un nouvel appel à projets est ouvert depuis juillet 2023, et ce jusqu’en juin 2025, attestant de la vitalité de ce dispositif. L’IA et l’analyse de données n’ont pas fini de transformer les pratiques cliniques et de recherche avec des solutions toujours plus innovantes et efficaces.