Dans le prolongement du plan Innovation santé 2030 et de la stratégie d’accélération “Santé numérique”, le gouvernement a lancé une mission visant à poser les bases d’une feuille de route en matière de réutilisation des données de santé. Confiée à Jérôme Marchand-Arvier, cette mission a donné lieu à la publication du rapport “Fédérer les acteurs de l’écosystème pour libérer l’utilisation secondaire des données de santé” en décembre 2023.
Le potentiel important de réutilisation du riche patrimoine de données de santé français est encore sous-exploité
Mais pour commencer, que signifie l’utilisation secondaire des données de santé ? Il s’agit simplement de l’exploitation de ces données à d’autres fins que celles pour lesquelles elles ont été collectées, à savoir la prise en charge des patients. Or, “le potentiel important de réutilisation du riche patrimoine de données de santé français est encore sous-exploité”, alors même qu’on assiste à une forte accélération sur ce plan à l’échelle mondiale, et que le développement de l’intelligence artificielle offre des “perspectives nouvelles et prometteuses”. Alors, comment libérer le potentiel des données de santé ?
De quelles “données de santé” parle-t-on ?
Dans les pas du RGPD, la mission retient une définition très large des données de santé et distingue trois catégories :
- Données médico-administratives
Le rapport fait référence aux données rassemblées dans la base principale du système national des données de santé (SNDS), qui regroupe notamment les données de l’assurance maladie et les données de facturation des établissements de santé.
Plus précisément, on y trouve les dépenses et remboursements (prestations, prescriptions, dispositifs médicaux, soins et séjours hospitaliers, indemnités journalières et invalidité), des informations génériques et pseudonymisées sur les patients ou encore des informations sur les professionnels de santé.
Les chercheurs peuvent accéder à ces données exhaustives et fiables depuis 2016, mais le rapport souligne la nécessité de pouvoir croiser ces données, par exemple avec des données socio-fiscales ou environnementales.
- Données médicales
Cette catégorie regroupe les données cliniques, les résultats d’examens, les données de suivi des patients ou encore les données de pharmacologie. À ce titre, le rapport met l’accent sur le progrès que représente l’essor récent de nombreux entrepôts de données de santé (EDS), notamment grâce au plan d’investissement France 2030.
Souvent rattachés à des établissements de santé, les EDS sont des rouages essentiels de l’utilisation secondaire des données de santé.
- Données de recherche en santé
Il s’agit des données issues d’essais cliniques, d’études épidémiologiques, de recherches biomédicales, etc. Le rapport mentionne les cohortes et registres, nombreux en France et contenant des données très utiles pour la recherche scientifique et qu’il serait pertinent de croiser avec d’autres bases de données. Souvent isolées, particulièrement hétérogènes et insuffisamment structurées, ces bases de données sont sous-exploitées.
Les freins à l’utilisation secondaire des données de santé
Le premier frein à l’utilisation secondaire des données de santé réside dans l’éparpillement des bases de données, leur contenu hétérogène et leur documentation insuffisante. Les auteurs du rapport font le constat d’un “paysage foisonnant et peu interopérable”, qui fait obstacle au croisement de données entre les différentes sources. Toutefois, la création de 63 entrepôts de santé entre 2017 et 2023, principalement par les établissements de santé, donne des perspectives de structuration des données de santé en France.
La complexité et la longueur des démarches réglementaires représentent un autre frein important, et ce malgré la création de la plateforme Health Data Hub (HDH). Les délais de mise à disposition des données (10 à 12 mois en moyenne) peuvent décourager les acteurs du secteur. La longueur de l’étape de contractualisation avec les producteurs de données ainsi que le manque de coopération dans l’environnement institutionnel -notamment entre le HDH et les établissements de santé- amplifient cette problématique.
Des recommandations pour “décloisonner les données de santé et fédérer l’écosystème”
Pour les auteurs du rapport, il est indispensable d’instaurer davantage de confiance entre les acteurs des données de santé en France. Cet “impératif de confiance” passe d’abord par un arbitrage sur la question de l’hébergement de la copie de la base principale du SNDS par le HDH. Actuellement hébergée sur Azure, la plateforme du HDH devrait migrer d’ici 2025 vers un cloud souverain (SecNumCloud). Cette migration constitue une garantie forte pour les producteurs de données, incités à s’engager pleinement dans une logique de partage des données.
Il est indispensable d’instaurer davantage de confiance entre les acteurs des données de santé en France.
Au-delà du positionnement et du pilotage du HDH, plusieurs recommandations visent à “accélérer les délais de mise à disposition des données de santé et alléger les processus réglementaires”. Pour y parvenir, la mission invite le gouvernement à généraliser les procédures simplifiées d’accès aux données de santé -notamment la base principale du SNDS- et à simplifier le processus d’évaluation scientifique et éthique des recherches.
Enfin, les auteurs du rapport recommandent de renforcer l’impulsion politique au sujet de la réutilisation des données de santé, à travers une véritable gouvernance interministérielle, l’adoption de standards pour garantir l’interopérabilité des bases de données, ainsi qu’une clarification du modèle économique et des règles autour de la valorisation des données de santé.