En résumé
Les articles précédents ont posé les bases : le recueil manuel et ses limites, la définition des variables, le fonctionnement des entrepôts de données de santé, la qualité des données, leur organisation, et les terminologies médicales. Il est temps de voir concrètement comment monter un projet de recherche sur un entrepôt de données de santé (EDS), du premier contact avec l’équipe de l’EDS jusqu’à l’analyse des résultats.
Le parcours en 6 étapes
Chaque hôpital a son organisation propre, mais le parcours suit généralement les mêmes grandes étapes. Voici une vue d’ensemble.
Premier contact avec l'équipe de l'EDS
L'équipe qui gère l'entrepôt de données de santé est le point d'entrée pour tout projet de recherche. C'est elle qui accompagne les chercheurs, réalise les extractions et assure la qualité des données.
Rédaction du protocole
Le protocole décrit la question de recherche, les objectifs, les critères d'inclusion et d'exclusion, les variables à recueillir, et le plan d'analyse. C'est le document de référence du projet. Plus il est précis, plus l'étude de faisabilité sera rapide et fiable.
Étude de faisabilité
L'équipe de l'EDS évalue si le projet est réalisable : les données nécessaires sont-elles disponibles ? Le nombre de patients répondant aux critères est-il suffisant ?
Démarches réglementaires
Si l'étude est faisable, les autorisations nécessaires doivent être obtenues avant de pouvoir accéder aux données. L'équipe de l'EDS peut accompagner cette démarche.
Mise à disposition des données
Une fois les autorisations obtenues, les données sont extraites et mises à disposition dans un environnement sécurisé.
Analyse et résultats
Le clinicien peut explorer, visualiser et analyser ses données — idéalement avec des outils adaptés à son profil.
Détaillons chacune de ces étapes.
1. Premier contact avec l’équipe de l’EDS
L’équipe de l’EDS est l’interlocuteur principal. C’est l’équipe qui :
- Gère et maintient l’entrepôt de données de santé
- Accompagne les chercheurs dans la conception de leur projet
- Réalise les études de faisabilité et les extractions de données
- Assure la qualité et la sécurité des données
Par où commencer ?
Renseignez-vous sur qui gère l’EDS dans votre établissement et comment les contacter. Le plus simple est souvent de demander à un collègue qui a déjà mené un projet sur EDS.
Ce premier contact permet d’évaluer la faisabilité générale du projet avant même de rédiger un protocole complet. L’équipe de l’EDS peut indiquer rapidement si les données envisagées sont disponibles et orienter le chercheur dans ses démarches.
2. Rédiger le protocole
Le protocole est la colonne vertébrale du projet. Il formalise :
- La question de recherche et les objectifs (primaire, secondaires)
- Les critères d’inclusion et d’exclusion des patients
- Les variables à recueillir, avec leur définition précise (concept, ancrage temporel, fenêtre, fonction d’agrégation)
- Le plan d’analyse statistique
Plus le protocole est précis et structuré, plus le projet avancera vite.
Le Study Designer : un outil pour structurer le protocole
Le Study Designer est un outil open source, accessible depuis ce site, qui guide pas à pas la conception d’un protocole de recherche sur EDS. Il permet de définir les objectifs, les critères, les variables — et de générer automatiquement un document Word, Excel ou Markdown prêt à être partagé avec l’équipe de l’EDS.
C’est du temps gagné pour le chercheur et pour l’équipe de l’EDS : le protocole arrive structuré, avec les bonnes informations, dans un format exploitable. Et c’est un protocole de meilleure qualité, car l’outil guide vers les bonnes pratiques (définition rigoureuse des variables, critères explicites, etc.).
3. Étude de faisabilité
L’étude de faisabilité est une étape essentielle. L’équipe de l’EDS vérifie deux choses :
Les données sont-elles disponibles ?
Toutes les données ne sont pas nécessairement présentes dans l’EDS à un instant donné. Comme expliqué dans l’article sur les entrepôts de données de santé, l’intégration d’un nouveau flux de données (un logiciel de biologie, un outil de prescription, un dispositif de monitoring…) représente un travail important : développement technique, contrôle qualité, maintenance dans le temps. Ce travail consomme des ressources et prend du temps.
L’étude de faisabilité permet d’identifier précisément quelles variables sont déjà disponibles et lesquelles ne le sont pas encore.
Le nombre de patients est-il suffisant ?
Même si les données sont disponibles, encore faut-il qu’un nombre suffisant de patients réponde aux critères d’inclusion. L’équipe de l’EDS peut requêter l’entrepôt pour estimer ce nombre et le comparer au nombre de sujets nécessaires calculé dans le protocole.
Même partiellement faisable, c'est utile
Si certaines données ne sont pas dans l’EDS, le projet n’est pas forcément impossible. Une partie des variables peut être extraite de façon automatisée, et le reste recueilli manuellement. C’est une approche mixte qui reste bien plus efficace qu’un recueil entièrement manuel : chaque variable automatisée, c’est du temps gagné sur l’ensemble des patients.
4. Démarches réglementaires
Si l’étude est faisable, les autorisations nécessaires doivent être obtenues avant de pouvoir accéder aux données. Selon le type d’étude et la réglementation locale, les exigences varient : approbation éthique, déclarations de conformité, autorisations institutionnelles… L’équipe de l’EDS peut généralement accompagner ces démarches.
5. Mise à disposition des données
Une fois les autorisations obtenues, les données sont extraites de l’EDS et mises à disposition du chercheur dans un environnement sécurisé. Selon les outils disponibles, plusieurs modalités sont possibles :
- Un environnement de programmation : RStudio, Jupyter Notebook, Python… pour les profils à l’aise avec le code
- Une interface graphique qui permet au clinicien de requêter ses données sans écrire de code : reconstruire un dossier patient pour visualiser les dossiers un à un, créer des graphiques sur des cohortes, réaliser des statistiques descriptives ou analytiques
6. Analyse et résultats
Le clinicien peut alors explorer, visualiser et analyser ses données. Selon son profil, il peut utiliser un environnement de programmation ou une interface graphique adaptée.
Linkr : l'interface pour le clinicien
C’est exactement le rôle de Linkr : offrir un environnement où le clinicien peut explorer, visualiser et analyser ses données sans compétence en programmation.
Le clinicien est impliqué dans l’analyse dès le début : il peut vérifier les données, repérer des incohérences, tester des hypothèses. La communication avec le data scientist est facilitée — ils travaillent sur la même interface. Et pour les profils plus techniques, Linkr donne aussi accès à un environnement de programmation complet (R, Python).
Et si le projet devient multicentrique ?
Un projet qui fonctionne sur un site peut naturellement s’étendre à plusieurs centres pour augmenter la puissance statistique. Mais le multicentrique ajoute de la complexité :
- Il faut un budget : temps de coordination, harmonisation des données entre sites, infrastructure technique. Des appels à projets existent pour financer ce type de recherche.
- Il faut que les données soient interopérables entre les centres — c’est tout l’enjeu des terminologies standardisées et du modèle OMOP.
L'avantage des standards
Linkr s’appuie sur le modèle OMOP et sur des dictionnaires de données standardisés comme INDICATE. Cela signifie que les scripts d’analyse développés localement sont directement partageables avec d’autres centres utilisant les mêmes standards — la transposition d’une étude monocentrique à une étude multicentrique est considérablement facilitée.
Un investissement qui se capitalise
Un projet de recherche sur EDS mobilise des compétences humaines importantes : temps de data scientist, expertise clinique, contrôle qualité. En contrepartie, chaque étude contribue à améliorer la qualité et la couverture de l’EDS. Comme évoqué dans l’article sur la qualité des données, les variables nettoyées, les flux intégrés, les alignements de concepts — tout cela se capitalise.
Au fil des projets, il devient de plus en plus facile et rapide de mener des études.
Un effort continu
Même si les études deviennent progressivement plus simples à mener, un effort reste nécessaire pour maintenir l’EDS et ses données en qualité dans le temps.
Le rôle clé des cliniciens formés
Tout au long de ce parcours, l’expertise du clinicien est indispensable :
- Pour définir les variables avec précision — le clinicien sait quelles mesures sont pertinentes et dans quel contexte elles ont été collectées
- Pour certifier la qualité des données — ce sont les cliniciens qui connaissent le mieux les données, car ce sont eux qui utilisent au quotidien les logiciels qui les produisent
- Pour interpréter les résultats — une anomalie statistique n’a de sens que si un expert du domaine peut l’expliquer
Avoir dans un service un ou plusieurs cliniciens formés à la science des données fluidifie considérablement tout le parcours. Ils deviennent des interlocuteurs privilégiés de l’équipe de l’EDS, capables de concevoir des protocoles rigoureux, de participer activement à l’analyse, et de former leurs collègues.
Se former
Des formations universitaires existent pour les professionnels de santé : Diplômes Universitaires (DU/DIU) accessibles en parallèle de l’activité clinique, ou Master 2 réalisables par exemple durant l’internat. Consultez notre article Formations en science des données en santé pour un panorama des options disponibles.
Ce qu’il faut retenir
- Les ressources de ce site donnent les clés de compréhension pour aborder un projet de recherche sur EDS : données, variables, qualité, organisation, terminologies.
- Le Study Designer accompagne la conception du protocole : critères, variables, plan d'analyse — et génère un document prêt à partager avec l'équipe de l'EDS.
- Linkr permet au clinicien de visualiser, analyser et explorer ses données dans une interface adaptée, de collaborer avec le data scientist, et de travailler de façon reproductible.
- Chaque étude est un investissement cumulatif : les données sont mises en qualité projet après projet, rendant les études suivantes plus rapides et moins coûteuses.