Ressources
3/4
15 min Boris Delange · 12/03/2026

Variables, jeux de concepts et ancrages

Créer des jeux de concepts, définir des ancrages temporels et configurer les variables avec leurs fenêtres de recueil.

En résumé

Après avoir défini la population d’étude, il faut préciser quelles données collecter et à quel moment. Cet article couvre trois sections du Study Designer : les jeux de concepts (regrouper les codes médicaux), les ancrages temporels (définir les dates de référence) et les variables (configurer chaque donnée à extraire avec sa fenêtre temporelle et sa fonction d’agrégation).

Jeux de concepts

La section Jeux de concepts permet de créer des ensembles réutilisables de codes médicaux. Un jeu de concepts regroupe des codes issus de terminologies standardisées (CIM-10, SNOMED CT, LOINC, ATC…) qui décrivent un même concept clinique — par exemple, tous les codes correspondant au diagnostic de “sepsis”, ou tous les codes de prescriptions d’antibiotiques. Ces terminologies ont été présentées dans l’article sur les terminologies.

Ces jeux sont utilisés ensuite dans les critères de sélection (article précédent) et dans la définition des variables (ci-dessous).

Interopérabilité et extension multicentrique

Définir vos variables et critères à l’aide de terminologies standardisées dès la conception de l’étude garantit l’interopérabilité de votre protocole. Si vous envisagez une extension multicentrique ultérieure, ce travail préparatoire vous fera gagner un temps considérable : chaque centre pourra exploiter les mêmes jeux de concepts sans avoir à recréer les définitions.

Créer un jeu de concepts

Trois méthodes sont disponibles pour créer un jeu de concepts :

Le dictionnaire INDICATE

Le catalogue inclut actuellement le INDICATE Data Dictionary, un dictionnaire de jeux de concepts standardisés développé dans le cadre du projet européen INDICATE. Ce dictionnaire offre un niveau d’abstraction au-dessus des terminologies brutes : plutôt que de manipuler des centaines de codes LOINC ou SNOMED CT individuels sur ATHENA ou ATLAS, vous travaillez directement avec des variables cliniques telles que “Fréquence cardiaque”, “Créatinine” ou “Diabète de type 2”, chacune associée à un jeu de concepts pré-sélectionnés par des experts. C’est ce niveau d’abstraction — la variable clinique, pas le code individuel — qui est utilisé dans les protocoles de recherche pour définir les données à collecter. D’autres dictionnaires pourraient être intégrés par la suite, créés par des sociétés savantes ou des groupes de travail spécialisés (oncologie, génétique, cardiologie…).

Gérer les concepts

Une fois un jeu de concepts créé, cliquez dessus pour l’ouvrir. Vous pouvez alors :

Chaque jeu de concepts permet aussi de définir :

À quoi servent les jeux de concepts ?

Un même jeu de concepts peut être réutilisé à plusieurs endroits : dans un critère de sélection (par exemple, “patients ayant un diagnostic de sepsis”) et dans une variable (par exemple, “valeur de créatinine la plus élevée”). Centraliser les codes dans un jeu de concepts évite les doublons et facilite la maintenance.

Ancrages temporels

Les ancrages temporels sont les dates de référence autour desquelles les variables sont collectées. Par exemple, si vous souhaitez mesurer la créatinine “dans les 24 heures suivant l’admission”, la date d’admission est l’ancrage temporel.

Les ancrages sont définis dans l’onglet Ancrages de la section Variables.

Types d’ancrages

Plusieurs types d’ancrages sont disponibles :

Chaque ancrage a un nom (par exemple : “Admission en réanimation”, “Diagnostic de sepsis”) et des précisions facultatives.

Pourquoi définir des ancrages ?

Dans une étude sur données de santé, le moment où une mesure est collectée est aussi important que la mesure elle-même. Les ancrages temporels permettent de formaliser cette information et de la reporter de manière cohérente dans tout le protocole, mais aussi pour générer automatiquement les scripts de l’étude.

Variables

L’onglet Variables de la même section permet de définir chaque donnée à extraire. Une variable correspond à une mesure, un résultat ou une caractéristique que vous souhaitez obtenir pour chaque individu de votre cohorte. Les notions de concept, d’ancrage temporel, de fenêtre de recueil et de fonction d’agrégation ont été présentées en détail dans l’article sur la définition des variables.

Créer une variable

Cliquez sur Ajouter une variable pour ouvrir le formulaire de création. Vous renseignez :

Source de la variable

Deux types de variables sont disponibles :

Ancrage temporel et fenêtre de recueil

Chaque variable est rattachée à un ancrage temporel. C’est la date de référence à partir de laquelle la fenêtre de recueil est calculée.

La fenêtre de recueil précise l’intervalle autour de l’ancrage pendant lequel les données sont recherchées :

Par exemple, pour “la créatinine la plus élevée dans les 24 heures suivant l’admission” :

Fonction d’agrégation

Lorsque plusieurs valeurs existent dans la fenêtre de recueil, vous choisissez comment les résumer :

Exemple concret

Pour une étude sur le sepsis, vous pourriez définir les variables suivantes :

  • Lactate maximal à H24 — jeu de concepts “Lactate”, ancrage “Admission en réanimation”, fenêtre 0–24 heures, agrégation “Maximum”
  • Créatinine à l’admission — jeu de concepts “Créatinine”, ancrage “Admission”, fenêtre −6 à +6 heures, agrégation “Première”
  • Antécédent de diabète de type 2 — jeu de concepts “Diabète de type 2”, ancrage “Admission”, fenêtre null–0 (depuis toujours jusqu’à l’admission), agrégation “Présence”
  • Âge — variable calculée “Âge”

Tableau et chronologie

Les variables définies sont affichées dans un tableau récapitulatif qui résume pour chaque variable : le nom, l’unité, l’ancrage temporel, la fenêtre de recueil et la fonction d’agrégation. Vous pouvez modifier ou supprimer chaque variable depuis ce tableau.

Une vue chronologique (timeline) est également disponible. Elle représente visuellement les ancrages temporels et les fenêtres de recueil de chaque variable sous forme de barres horizontales. C’est un bon moyen de vérifier d’un coup d’œil que toutes les fenêtres sont cohérentes.

Ce qu’il faut retenir

  • Les jeux de concepts regroupent les codes médicaux (CIM-10, LOINC, ATC…) en ensembles réutilisables pour les critères et les variables, avec une unité (UCUM) et des valeurs min/max pour exclure les données aberrantes.
  • Les ancrages temporels définissent les dates de référence (admission, sortie, événement clinique…) autour desquelles les variables sont collectées.
  • Chaque variable est associée à un ancrage, une fenêtre de recueil et une fonction d'agrégation qui précisent quand et comment extraire la donnée.
  • La vue chronologique permet de visualiser d'un coup d'œil les fenêtres de recueil de toutes les variables.