10 juin 2025
Les données artificielles : un levier pour la santé et la recherche clinique - Dr Jean-Luis Fraysse
Les données artificielles : un levier pour la santé et la recherche clinique
Spécialiste de l'intelligence artificielle en santé, le Dr Jean-Louis Fraysse partage à l'Amphi sa vision de l'apport des données artificielles dans le domaine de la santé.
L’intelligence artificielle occupe une place centrale dans les domaines des soins, de la recherche, de la formation, de l’optimisation des parcours et des processus médicaux.
Parmi les avancées récentes, l’IA générative (GenAI) – lorsqu’elle est rigoureusement contrôlée et maîtrisée – ouvre des perspectives inédites comme la génération de données de santé artificielles pour la recherche clinique par exemple.
Pour rappel, on distingue plusieurs catégories de données : les données réelles (issues directement des patients dans le cadre des soins), les données de vie réelle ou Real World Evidence (RWE) – agrégées à partir de sources variées comme les dossiers médicaux électroniques ou les registres – et les données virtuelles, qui regroupent :
Les données synthétiques : générées à partir de l’agrégation de données réelles collectées antérieurement
Les données artificielles : produites par des algorithmes via des processus mécanistiques, statistiques ou des modèles de GenAI
Les données artificielles contribuent spécifiquement à :
L’anonymisation des bases de données en supprimant le lien direct avec les patients ce qui facilite la circulation et la réutilisation des données hors RGPD
L’imputation de données manquantes grâce à des modèles prédictifs robustes
La génération de patients artificiels à partir de données réelles, pour optimiser l’entraînement d’algorithmes médicaux
La complémentation des essais cliniques notamment en phase III, lorsqu’il est difficile de recruter certaines populations (enfants, femmes enceintes, personnes âgées, maladies rares), lorsque des considérations éthiques empêchent l’inclusion de patients dans des bras contrôles (ex. cancers) ou encore pour amplifier des populations de patients sous-représentées.
Bien que les essais randomisés avec bras réel demeurent la référence, les autorités réglementaires portent un intérêt croissant aux données artificielles tout comme aux données en vie réelle (RWE) dans certains contextes de recherche clinique. À ce titre, l’association SILICA est reconnue comme un interlocuteur privilégié des régulateurs internationaux dans ce domaine.
Afin de démontrer la fiabilité et la pertinence des données artificielles, des comités de supervision humaine composés de professionnels de santé, de statisticiens et de mathématiciens doivent valider :
La représentativité des bases de données réelles utilisées comme fondement
L’absence de biais introduits lors de la génération des données artificielles
La vraisemblance des données artificielles obtenues
Des publications scientifiques attestent de la fiabilité de ces méthodes.
De nombreux cas d’usage sont déjà déployés par des industriels et établissements de santé. La prise en compte des données artificielles par les autorités réglementaires est un enjeu majeur de compétitivité et de souveraineté. Il est donc impératif que la France poursuive ses efforts pour structurer, encadrer et valoriser ces innovations. En s’appuyant sur des standards rigoureux et une gouvernance forte, elle pourra non seulement consolider sa position de leader mondial dans ce domaine, mais aussi garantir une innovation éthique, sécurisée et au service des patients.
Dr Jean-Louis Fraysse
Co-Fondateur de Botdesign
Co-Président de SILICA