Version imprimable multipages. Cliquer ici pour imprimer.

Bases de données

Des ressources sur les principaux modèles de données et sur des bases de données accessibles en ligne

1: Qu'est-ce qu'une base de données ?
2: Tutoriel OMOP
3: Schéma OMOP v5.4
4: MIMIC

1 - Qu'est-ce qu'une base de données ?

Par Boris Delange | 15.10.2024

Dans cet article, nous allons :

Définir ce qu'est une base de données en partant d'une analogie avec Excel
Evoquer les principes de conception qui permettent de créer une base de données
Aborder les notions de tables, de jointures et de schémas
Aborder le SQL, ce langage de programmation qui permet de requêter les bases de données

Principes de conception

Une base de données (BDD) est comme un grand tableur Excel, où chaque feuille représente une table.

Tout l’enjeu d’une base de données est :

d’éviter les redondances des données, pour prendre moins d’espace
de contenir le moins de cases vides possibles, toujours pour occuper moins d’espace
d’être le plus flexible possible, pour pouvoir ajouter de nouvelles données que l’on n’avait pas prévues initialement

Structurer les données en tables

Comment feriez-vous pour stocker dans un tableur Excel les données de biologie et les données démographiques de 5 patients ?

Mettons que l’on ait besoin de stocker le taux d’hémoglobine, les plaquettes et les leucocytes.

Le premier réflexe qui vient à l’esprit est de créer une colonne par paramètre de biologie.

Nous ajoutons une colonne date_biologie pour connaître la date de réalisation du prélèvement biologique.

patient_id	age	sexe	date_admission	date_sortie	date_biologie	hémoglobine	plaquettes	leucocytes
1	45	M	2024-10-01	2024-10-10	2024-10-03	13.5	/	/
1	45	M	2024-10-01	2024-10-10	2024-10-04	/	150,000	7,200
2	60	F	2024-09-25	2024-10-05	2024-09-26	12.8	180,000	8,000
3	38	F	2024-10-05	2024-10-12	2024-10-07	14.0	220,000	/
3	38	F	2024-10-05	2024-10-12	2024-10-08	/	/	6,500
4	52	M	2024-09-20	2024-09-30	2024-09-21	11.5	140,000	9,500
5	29	F	2024-10-08	2024-10-15	2024-10-09	13.2	170,000	7,800
5	29	F	2024-10-16	2024-10-20	2024-10-16	14.2	/	/

Comment lire ce tableau ?

Le patient 1 a un seul séjour (une seule date_admission) et deux dosages biologiques à deux dates différentes durant ce même séjour (deux valeurs pour date_biologie).

Le patient 5 a deux séjours (deux valeurs pour date_admission), avec une biologie prélevée par séjour (deux valeurs différentes de date_biologie).

Nous pouvons remarquer deux choses :

Il existe une redondance des données démographiques (âge, sexe, dates d'admission et de sortie)
Nous avons dû créer une ligne par date de prélèvement biologique, ce qui fait que nous avons des cases vides aux dates où certaines biologies n'ont pas été réalisées

Si l’on revient à nos trois principes de conception (éviter les redondances, moins de cases vides et flexibilité), il semblerait que l’on puisse faire mieux.

Pourquoi ne pas créer une table (ou une feuille Excel pour continuer avec l’analogie) pour les patients ?

patient_id	age	sexe
1	45	M
2	60	F
3	38	F
4	52	M
5	29	F

On gagne ainsi de la place avec 3 lignes en moins.

Pourquoi ne pas avoir intégré les séjours dans cette table ?

Si on avait intégré les séjours dans cette table (avec les colonnes date_admission et date_sortie), nous aurions certes eu une seule ligne pour les patients 1 à 4, mais deux lignes pour le patient 5, qui a deux séjours différents.

Toujours dans une logique de diminuer le nombre de lignes, on préférera créer une table pour les séjours.

patient_id	admission_id	date_admission	date_sortie
1	1	2024-10-01	2024-10-10
2	2	2024-09-25	2024-10-05
3	3	2024-10-05	2024-10-12
4	4	2024-09-20	2024-09-30
5	5	2024-10-08	2024-10-15
5	6	2024-10-16	2024-10-20

Pour finir, nous allons créer une table pour stocker les données de biologie.

patient_id	admission_id	date_biologie	hémoglobine	plaquettes	leucocytes
1	1	2024-10-03	13.5	/	/
1	1	2024-10-04	/	150,000	7,200
2	2	2024-09-26	12.8	180,000	8,000
3	3	2024-10-07	14.0	220,000	/
3	3	2024-10-07	/	/	6,500
4	4	2024-09-21	11.5	140,000	9,500
5	5	2024-10-09	13.2	170,000	7,800
5	6	2024-10-16	14.2	/	/

OK, mais ici nous avons encore des cases vides, nous pourrions optimiser.

La solution est de créer une colonne pour le nom du paramètre biologique, et une colonne pour sa valeur. Ainsi, plus de case vide !

patient_id	admission_id	date_biologie	paramètre	valeur
1	1	2024-10-03	hémoglobine	13.5
1	1	2024-10-04	plaquettes	150,000
1	1	2024-10-04	leucocytes	7,200
2	2	2024-09-26	hémoglobine	12.8
2	2	2024-09-26	plaquettes	180,000
2	2	2024-09-26	leucocytes	8,000
3	3	2024-10-07	hémoglobine	14.0
3	3	2024-10-07	plaquettes	220,000
3	3	2024-10-07	leucocytes	6,500
4	4	2024-09-21	hémoglobine	11.5
4	4	2024-09-21	plaquettes	140,000
4	4	2024-09-21	leucocytes	9,500
5	5	2024-10-09	hémoglobine	13.2
5	5	2024-10-09	plaquettes	170,000
5	5	2024-10-09	leucocytes	7,800
5	6	2024-10-16	hémoglobine	14.2

Nous venons de créer une base de données !

Alors certes, cela peut paraître moins lisible au premier abord, mais quand on a des millions de données, il est nécessaire d’optimiser leur stockage.

Et vous le verrez si vous faites un peu de programmation, cette manière d’organiser les données est finalement bien plus lisible qu’un fichier Excel à 50, 100 colonnes…

Jointures

Les données sont maintenant éparpillées sur plusieurs tables.

Comment les fusionner de nouveau ?

Si l’on veut fusionner plusieurs tables, on fera ce que l’on appelle une jointure.

Par exemple, si on fait une jointure entre les tables patients et séjours, en faisant une correspondance sur la colonne patient_id, nous obtiendrons cette table :

patient_id	age	sexe	admission_id	date_admission	date_sortie
1	45	M	1	2024-10-01	2024-10-10
2	60	F	2	2024-09-25	2024-10-05
3	38	F	3	2024-10-05	2024-10-12
4	52	M	4	2024-09-20	2024-09-30
5	29	F	5	2024-10-08	2024-10-15
5	29	F	6	2024-10-16	2024-10-20

On pourra joindre les données de la table biologie de la même façon, et obtenir le tableau du début de l’article.

Requêter une base de données

Il existe un langage de programmation qui permet spécifiquement de requêter les bases de données.

Ce langage se nomme SQL, pour Structured Query Language.

C’est un langage assez simple et facile d’accès.

Il se compose de quelques mots clefs qui permettent d’obtenir les données que l’on veut, dont (non exhaustif) :

SELECT : vous choisissez les colonnes que vous voulez garder
FROM : de quelle table seront extraites les données ?
WHERE : quels filtres appliquer sur les données ?

Par exemple :

SELECT patient_id, age, sexe
FROM patients
WHERE age > 45

On sélectionne les colonnes patient_id, age, sexe de la table patients où la valeur de la colonne age est supérieur à la valeur 45.

On a le résultat suivant :

patient_id	age	sexe
2	60	F
4	52	M

Schémas de BDD

Ce que l’on appelle un schéma de base de données est la structure des tables qui composent une base de données.

Il spécifie :

le nom des tables
le nom des colonnes de chaque table
le type de données de chaque colonne (si la colonne doit comprendre des données de type texte ou numérique par exemple)

Par exemple, OMOP est un schéma de BDD spécialisée dans les données de santé.

Le schéma de données du modèle OMOP

Cette base est assez complexe, ce qui est nécessaire pour englober toutes les données de santé.

De même que nous l’avons fait plus haut, vous pouvez retrouver la table person qui correspond aux patients et la table visit_detail qui correspond aux séjours.

Conclusion

Les points à retenir :

Une base de données est un ensemble de tables avec un schéma particulier (noms des colonnes et type des données)
Les schémas des bases sont contruits selon des principes : éviter les redondances, optimiser l'espace et permettre la flexibilité
Les tables peuvent être liées entre-elles à l'aide de jointures
Le SQL est un langage de programmation permettant de requêter les bases de données

Pour aller plus loin :

Cours d'OpenClassrooms sur le SQL

2 - Tutoriel OMOP

Exécutez du SQL directement dans votre navigateur grâce à DuckDB-Wasm. Données : MIMIC-IV OMOP Demo (licence).

Facile

Bases du modèle

Intermédiaire

Données cliniques

Expert

Requêtes avancées

0 / 3 niveaux

Chargement de DuckDB et des données...

Niveau Facile : Les bases du modèle OMOP

Le modèle OMOP CDM organise les données de santé autour de tables standardisées. Pour explorer la structure complète, consultez le schéma OMOP v5.4.

Ctrl/Cmd + Entrée : Exécuter
Ctrl/Cmd + Shift + Entrée : Exécuter et valider

1 PERSON

2 VISIT_OCCURRENCE

3 VISIT_DETAIL

4 DEATH

5 OBSERVATION_PERIOD

6 CONCEPT

7 SYNTHÈSE

Année 2135. Vous êtes data scientist spécialisé en données massives de santé, et référent OMOP de votre hôpital. Toutes les données des patients sont désormais informatisées et stockées dans des bases fédérées au format OMOP CDM, le standard international qui a unifié les systèmes de santé du monde entier.

Ce matin, une demande urgente arrive sur votre terminal : retrouver le dossier d'un patient. Seule information disponible : le patient est né en 2054.

À vous de jouer.

La table PERSON contient les informations démographiques de chaque patient. C’est le point de départ pour retrouver notre patient né en 2054.

1Exercice 1.1 : Explorer la table PERSON

Commencez par explorer la structure de la table person. Affichez les 5 premières lignes pour découvrir les colonnes disponibles.

Exercice 1.1

Utilisez SELECT * FROM ... LIMIT 5

2Exercice 1.2 : Compter les patients

Combien de patients sont enregistrés dans la base de votre hôpital ? Cela vous donnera une idée de l’ampleur de la recherche.

Exercice 1.2

Utilisez COUNT(*)

3Exercice 1.3 : Trouver le patient

Vous savez que le patient recherché est né en 2054. Trouvez son person_id en filtrant sur l’année de naissance (year_of_birth).

Exercice 1.3

Filtrez avec WHERE sur l'année de naissance

Patient identifié : 8789342.

Pour comprendre son parcours médical, vous devez maintenant explorer son historique d'hospitalisations.

Quand a-t-il été hospitalisé ? Combien de fois ? Et quelle a été la durée de chaque séjour ?

La table VISIT_OCCURRENCE enregistre chaque hospitalisation d’un patient. Une hospitalisation peut contenir plusieurs séjours hospitaliers (dans la table visit_detail).

1Exercice 2.1 : Explorer les hospitalisations

Affichez les 5 premières hospitalisations de la table visit_occurrence.

Exercice 2.1

Utilisez SELECT * FROM ... LIMIT 5

2Exercice 2.2 : Compter les hospitalisations

Combien y a-t-il d’hospitalisations au total dans la base ?

Exercice 2.2

Utilisez COUNT(*)

3Exercice 2.3 : Hospitalisations par patient

Combien d’hospitalisations a effectué notre patient (person_id = 8789342) ?

Exercice 2.3

Filtrez avec WHERE sur person_id

4Exercice 2.4 : Durée des hospitalisations

Calculez la durée en jours de chaque hospitalisation de notre patient, triées par date de début. Affichez l’identifiant de l’hospitalisation, les dates de début et fin, et créez une colonne duree_hospit pour la durée calculée.

Exercice 2.4

Calculez la différence entre date de fin et date de début, et nommez la colonne avec AS (ex: date_fin - date_debut AS duree_hospit)

Hospitalisation identifiée : 6687131 (25 jours).

Cette hospitalisation a duré 25 jours. Que s'est-il passé pendant ce séjour ? Dans quels services le patient est-il passé ?

La table VISIT_DETAIL contient les détails granulaires d’une hospitalisation : passages aux urgences, transferts entre unités, séjours dans différentes unités hospitalières…

1Exercice 3.1 : Explorer les détails

Affichez les 5 premières lignes de la table visit_detail pour découvrir sa structure.

Exercice 3.1

Utilisez SELECT * FROM ... LIMIT 5

2Exercice 3.2 : Détails de l'hospitalisation

Combien de séjours hospitaliers (lignes dans visit_detail) sont liés à l’hospitalisation visit_occurrence_id = 6687131 ?

Exercice 3.2

Utilisez COUNT(*) et filtrez sur visit_occurrence_id

3Exercice 3.3 : Parcours du patient

Affichez tous les séjours de cette hospitalisation, triés par date de début. Sélectionnez visit_detail_id, visit_detail_start_date, visit_detail_end_date et care_site_id.

Exercice 3.3

Filtrez sur l'hospitalisation et triez par date de début de séjour

4Exercice 3.4 : Durée des séjours

Calculez la durée de chaque séjour pour cette hospitalisation. Ajoutez une colonne duree_sejour (en jours) à la requête précédente.

Exercice 3.4

Calculez la différence entre date de fin et date de début du séjour

5Exercice 3.5 : Nom des unités

En repartant de la requête précédente, récupérez le nom des unités (care_site_name) en joignant visit_detail avec la table care_site.

Exercice 3.5

Faites une jointure avec care_site pour obtenir le nom de l'unité

Intéressons-nous maintenant aux décès.

La table DEATH enregistre les décès des patients. Elle contient une ligne par patient décédé, avec la date et éventuellement la cause du décès. Explorons cette table pour comprendre la mortalité dans notre cohorte, et regardons si le patient que l'on suit est décédé.

1Exercice 4.1 : Explorer la structure de DEATH

Affichez toutes les colonnes de la table death pour découvrir sa structure.

Exercice 4.1

Utilisez SELECT * FROM ...

2Exercice 4.2 : Compter les décès

Combien de patients sont décédés dans cette base ?

Exercice 4.2

Utilisez COUNT(*)

3Exercice 4.3 : Notre patient est-il décédé ?

Vérifiez si notre patient 8789342 est décédé en faisant une jointure LEFT JOIN entre person et death. Affichez le person_id et la death_date (qui sera NULL si le patient est vivant).

Exercice 4.3

Faites une jointure entre person et death sur person_id

Notre patient 8789342 est vivant.

La table OBSERVATION_PERIOD définit la période pendant laquelle un patient est suivi dans le système de santé. Elle est calculée à partir des dates min et max des hospitalisations du patient. Cette information est essentielle pour les études longitudinales.

1Exercice 5.1 : Explorer les périodes d'observation

Affichez les 5 premières lignes de la table observation_period.

Exercice 5.1

Utilisez SELECT * FROM ... LIMIT 5

2Exercice 5.2 : Durée de suivi de notre patient

Calculez la durée de suivi en jours pour notre patient 8789342. Affichez le person_id, les dates de début et fin, et créez une colonne duree_suivi.

Exercice 5.2

Filtrez sur person_id et calculez la différence entre les dates

Bien joué, vous avez exploré toutes les informations concernant le patient et ses séjours !

Maintenant voyons en détail la table CONCEPT, centrale dans le modèle OMOP. Cette table contient toutes les terminologies standardisées (SNOMED, LOINC, RxNorm...). C'est la clé pour comprendre les codes utilisés dans les autres tables.

1Exercice 6.1 : Explorer les concepts

Affichez les 5 premiers concepts de la table concept.

Exercice 6.1

Utilisez SELECT * FROM ... LIMIT 5

2Exercice 6.2 : Trouver un concept

Recherchez le concept dont le concept_id est 8532.

Exercice 6.2

Filtrez avec WHERE sur concept_id

3Exercice 6.3 : Jointure patient-concept

Affichez le nom du genre (concept_name) pour notre patient 8789342. Joignez person et concept sur gender_concept_id.

Exercice 6.3

Joignez person avec concept sur gender_concept_id = concept_id

Félicitations ! Vous avez exploré les tables fondamentales du modèle OMOP.

Il est temps de mettre en pratique toutes vos connaissances en combinant plusieurs tables dans une seule requête. C'est le vrai travail d'un data scientist en santé : croiser les informations pour obtenir une vue complète des données patient.

1Exercice 7.1 : Synthèse - Vue complète des séjours

Créez une vue complète des séjours de l’hospitalisation 6687131 en combinant visit_detail, person, concept, care_site et death.

Affichez :

person_id
visit_occurrence_id
visit_detail_id
visit_detail_start_datetime
visit_detail_end_datetime
care_site_name : le nom du service
birth_datetime
gender_concept_name : le nom du genre
age : l'âge au moment du séjour
death_datetime : la date de décès (si applicable)

Exercice 7.1

Combinez visit_detail avec person, concept, care_site et death par des jointures

Niveau Intermédiaire : Données cliniques

Vous maîtrisez les bases du modèle OMOP. Ce niveau explore les tables cliniques : diagnostics, mesures, observations, procédures et dispositifs médicaux.

Ctrl/Cmd + Entrée : Exécuter
Ctrl/Cmd + Shift + Entrée : Exécuter et valider

1 CONDITION

2 MEASUREMENT

3 OBSERVATION

4 PROCEDURE

5 DEVICE

6 SYNTHÈSE

Bienvenue dans le niveau intermédiaire ! Nous allons explorer les tables cliniques du modèle OMOP.
Commençons par la table CONDITION_OCCURRENCE, qui contient les diagnostics posés. Dans OMOP, chaque diagnostic est encodé via un condition_concept_id standardisé.

La table CONDITION_OCCURRENCE stocke les diagnostics. Chaque ligne = un diagnostic posé pour un patient à une date donnée.

1Exercice 1.1 : Explorer la table CONDITION_OCCURRENCE

Découvrez la structure de la table condition_occurrence en affichant les 5 premières lignes.

Exercice 1.1

Utilisez SELECT * FROM ... LIMIT 5

2Exercice 1.2 : Compter les diagnostics du patient

Combien de diagnostics ont été posés pour notre patient 8789342 ?

Exercice 1.2

Utilisez COUNT(*) et filtrez sur person_id

3Exercice 1.3 : Lister les diagnostics avec leur nom

Affichez les diagnostics du patient avec leur nom lisible. Joignez la table concept pour traduire les condition_concept_id.

Exercice 1.3

Joignez avec concept sur condition_concept_id = concept_id

4Exercice 1.4 : Diagnostics uniques du patient

Un même diagnostic peut apparaître plusieurs fois (à chaque hospitalisation). Listez les diagnostics uniques du patient avec leur nombre d’occurrences.

Exercice 1.4

Utilisez GROUP BY et COUNT(*), triez par ordre décroissant

Nous avons maintenant une connaissance plus précise du patient, après avoir vu ses antécédents médicaux.
Explorons maintenant la table MEASUREMENT, qui contient les résultats quantitatifs : paramètres vitaux, examens biologiques, scores cliniques. C'est souvent la table la plus volumineuse d'une base OMOP.

La table MEASUREMENT stocke les mesures avec leur valeur numérique, leur unité et leurs bornes de référence.

1Exercice 2.1 : Explorer la table MEASUREMENT

Découvrez la structure de la table measurement en affichant les 5 premières lignes.

Exercice 2.1

Utilisez SELECT * FROM ... LIMIT 5

2Exercice 2.2 : Compter les mesures du patient

Combien de mesures ont été enregistrées pour notre patient 8789342 ?

Exercice 2.2

Utilisez COUNT(*) et filtrez sur person_id

3Exercice 2.3 : Types de mesures les plus fréquents

Quels types de mesures sont les plus fréquents pour ce patient ? Affichez le nom de chaque type de mesure et son nombre d’occurrences.

Exercice 2.3

Joignez avec concept, groupez et triez par count décroissant. Nommez la colonne du comptage nb_mesures (ex: COUNT(*) AS nb_mesures)

4Exercice 2.4 : Évolution de la fréquence cardiaque

Analysez l’évolution de la fréquence cardiaque (Heart rate, concept_id = 3027018) du patient. Affichez la date, la valeur et l’unité.

Exercice 2.4

Filtrez sur le concept_id de la fréquence cardiaque, triez par datetime

5Exercice 2.5 : Statistiques sur la fréquence cardiaque

Calculez les statistiques de la fréquence cardiaque : valeur minimale, maximale et moyenne.

Exercice 2.5

Utilisez MIN(), MAX(), AVG() sur value_as_number

Explorons maintenant les observations cliniques. La table OBSERVATION capture les observations médicales : échelles de douleur, résultats d'examen clinique...

La table OBSERVATION contient des informations diverses : antécédents, habitudes, évaluations qualitatives.

1Exercice 3.1 : Explorer la table OBSERVATION

Découvrez la structure de la table observation en affichant les 5 premières lignes.

Exercice 3.1

Utilisez SELECT * FROM ... LIMIT 5

2Exercice 3.2 : Types d'observations

Quels types d’observations sont enregistrés pour ce patient ? Affichez le nom et le nombre d’occurrences de chaque type.

Exercice 3.2

Joignez avec concept, groupez et triez par count

3Exercice 3.3 : Mode d'oxygénation

Le patient a reçu différents modes d’oxygénation (concept_id = 4036936). Affichez la date et le mode d’administration stocké dans value_as_string.

Note : ce concept n’apparaît pas dans l’exercice précédent car il n’est pas disponible dans notre table concept réduite (licence SNOMED). Les données existent néanmoins dans observation.

Exercice 3.3

Filtrez sur observation_concept_id et affichez value_as_string

Voyons maintenant les actes médicaux réalisés. La table PROCEDURE_OCCURRENCE contient les procédures : interventions chirurgicales, examens d'imagerie, gestes techniques...

La table PROCEDURE_OCCURRENCE enregistre tous les actes médicaux réalisés sur le patient.

1Exercice 4.1 : Explorer la table PROCEDURE_OCCURRENCE

Découvrez la structure de la table procedure_occurrence en affichant les 5 premières lignes.

Exercice 4.1

Utilisez SELECT * FROM ... LIMIT 5

2Exercice 4.2 : Procédures du patient

Listez les procédures réalisées pour notre patient avec leur nom et leur nombre d’occurrences.

Exercice 4.2

Joignez avec concept et groupez par concept_name

3Exercice 4.3 : Chronologie des procédures

Affichez la chronologie des procédures du patient : date, nom de la procédure, triées par date. Utilisez DISTINCT pour éviter les doublons.

Exercice 4.3

Utilisez DISTINCT, joignez avec concept, triez par datetime

Terminons avec les dispositifs médicaux. La table DEVICE_EXPOSURE enregistre les dispositifs utilisés : sondes, cathéters, prothèses, pompes...

La table DEVICE_EXPOSURE contient les dispositifs médicaux utilisés pour le patient.

1Exercice 5.1 : Explorer la table DEVICE_EXPOSURE

Découvrez la structure de la table device_exposure en affichant les 5 premières lignes.

Exercice 5.1

Utilisez SELECT * FROM ... LIMIT 5

2Exercice 5.2 : Dispositifs utilisés

Quels dispositifs ont été utilisés pour ce patient ? Affichez le nom du dispositif et le nombre d’utilisations.

Exercice 5.2

Joignez avec concept et groupez par dispositif

Synthèse finale : Combinez vos connaissances pour créer une vue complète du patient. Vous allez croiser les données de plusieurs tables cliniques pour obtenir un résumé médical complet.

1Exercice 6.1 : Du format long au format large

Repartez de la requête de synthèse du niveau Facile (fournie ci-dessous) et enrichissez-la en ajoutant pour chaque séjour :

hr_min : la fréquence cardiaque minimale (measurement_concept_id = 3027018)
septic_shock : 1 si le patient a eu un choc septique durant le séjour (condition_concept_id = 10420211), 0 sinon

Code de départ (synthèse niveau Facile)

SELECT
    vd.person_id,
    vd.visit_occurrence_id,
    vd.visit_detail_id,
    vd.visit_detail_start_datetime,
    vd.visit_detail_end_datetime,
    cs.care_site_name,
    p.birth_datetime,
    c.concept_name AS gender_concept_name,
    DATE_PART('year', vd.visit_detail_start_datetime::TIMESTAMP) - p.year_of_birth AS age,
    d.death_datetime
FROM visit_detail vd
LEFT JOIN person p ON vd.person_id = p.person_id
LEFT JOIN concept c ON p.gender_concept_id = c.concept_id
LEFT JOIN care_site cs ON vd.care_site_id = cs.care_site_id
LEFT JOIN death d ON vd.person_id = d.person_id
WHERE vd.visit_occurrence_id = 6687131
ORDER BY vd.visit_detail_start_datetime;

Exercice 6.1

Utilisez WITH pour créer des CTEs qui pré-agrègent les données, puis joignez-les avec LEFT JOIN

Niveau Expert : Requêtes avancées

Ce niveau couvre les requêtes complexes, les jointures multiples, et les tables avancées comme DRUG_EXPOSURE.

En construction

Ce niveau est en cours de création et sera disponible prochainement.

3 - Schéma OMOP v5.4

Source : OHDSI Common Data Model v5.4

Cliquez sur une table pour voir sa documentation complète.

Standardized Clinical Data

PERSON

OBSERVATION_PERIOD DEATH VISIT_OCCURRENCE

VISIT_DETAIL

CONDITION_OCCURRENCE DRUG_EXPOSURE PROCEDURE_OCCURRENCE DEVICE_EXPOSURE MEASUREMENT OBSERVATION NOTE

NOTE_NLP

EPISODE

EPISODE_EVENT

SPECIMEN FACT_RELATIONSHIP

Standardized Health System

LOCATION CARE_SITE PROVIDER

Standardized Vocabularies

CONCEPT VOCABULARY DOMAIN CONCEPT_CLASS CONCEPT_SYNONYM CONCEPT_RELATIONSHIP RELATIONSHIP CONCEPT_ANCESTOR SOURCE_TO_CONCEPT_MAP DRUG_STRENGTH

Standardized Health Economics

COST PAYER_PLAN_PERIOD

Standardized Derived Elements

CONDITION_ERA DRUG_ERA DOSE_ERA

Results Schema

COHORT COHORT_DEFINITION

Standardized Metadata

CDM_SOURCE METADATA

Champ CDM	Guide utilisateur	Conventions ETL	Type	Requis	PK	FK	Table FK	Domaine FK
`person_id`	On suppose que chaque personne avec un identifiant unique différent est en fait une personne différente et que les données de deux personnes différentes ne doivent pas être combinées.	Toute liaison de personnes nécessaire pour identifier de manière unique les Personnes doit être effectuée avant l'écriture de cette table. Cet identifiant peut être l'id original des données source s'il s'agit d'un entier, sinon il peut être un numéro auto-généré.	integer	Oui	PK	-	-	-
`gender_concept_id`	Ce champ est destiné à capturer le sexe biologique à la naissance de la Personne. Ce champ ne doit pas être utilisé pour étudier les questions d'identité de genre.	Utilisez la valeur de genre présente dans les données en supposant qu'il s'agit du sexe biologique à la naissance. Si les données source capturent l'identité de genre, elle doit être stockée dans la table OBSERVATION.	integer	Oui	-	FK	CONCEPT	Gender
`year_of_birth`	Calculez l'âge en utilisant year_of_birth.	Pour les sources de données avec date de naissance, l'année doit être extraite. Si aucune année de naissance n'est disponible, supprimez les données de la personne de l'instance CDM.	integer	Oui	-	-	-	-
`month_of_birth`	-	Pour les sources de données qui fournissent la date de naissance précise, le mois doit être extrait et stocké dans ce champ.	integer	Non	-	-	-	-
`day_of_birth`	-	Pour les sources de données qui fournissent la date de naissance précise, le jour doit être extrait et stocké dans ce champ.	integer	Non	-	-	-	-
`birth_datetime`	Ce champ n'est pas requis mais fortement recommandé.	Pour les sources de données qui fournissent la date et l'heure précises de naissance, cette valeur doit être stockée dans ce champ.	datetime	Non	-	-	-	-
`race_concept_id`	Ce champ capture l'origine ethnique de la personne.	N'utilisez ce champ que si vous avez des informations sur l'origine ethnique disponibles dans les données source. Les origines mixtes ne sont actuellement pas supportées. Si une personne a plus d'une origine enregistrée, mettez Concept_Id 0.	integer	Oui	-	FK	CONCEPT	Race
`ethnicity_concept_id`	Ce champ capture l'Ethnicité telle que définie par l'OMB : "Hispanic" ou "Not Hispanic".	Ce champ ne doit être utilisé que pour les sources de données basées aux États-Unis. Ne pas déduire l'ethnicité de la race.	integer	Oui	-	FK	CONCEPT	Ethnicity
`location_id`	Ce champ représente la dernière localisation connue de la personne.	Mettez le location_id de la table LOCATION représentant l'information de localisation la plus précise pour la personne.	integer	Non	-	FK	LOCATION	-
`provider_id`	Ce champ représente le dernier médecin traitant connu (médecin généraliste).	Mettez le provider_id de la table PROVIDER du dernier médecin traitant connu.	integer	Non	-	FK	PROVIDER	-
`care_site_id`	Ce champ représente l'établissement de soins où le prestataire fournit habituellement des soins.	-	integer	Non	-	FK	CARE_SITE	-
`person_source_value`	Utilisez ce champ pour faire le lien avec les personnes dans les données source.	Ce champ permet de stocker la valeur de la personne telle qu'elle apparaît dans la source. Non requis mais fortement recommandé.	varchar(50)	Non	-	-	-	-
`gender_source_value`	Ce champ est utilisé pour stocker le sexe biologique de la personne à partir des données source.	Mettez le sexe biologique tel qu'il apparaît dans les données source.	varchar(50)	Non	-	-	-	-
`gender_source_concept_id`	En raison du petit nombre d'options, ce champ tend à être zéro.	Si les données source codent le sexe biologique dans un vocabulaire supporté par OMOP, stockez le concept_id ici.	integer	Non	-	FK	CONCEPT	-
`race_source_value`	Ce champ est utilisé pour stocker l'origine ethnique de la personne à partir des données source.	Mettez l'origine ethnique telle qu'elle apparaît dans les données source.	varchar(50)	Non	-	-	-	-
`race_source_concept_id`	En raison du petit nombre d'options, ce champ tend à être zéro.	Si les données source codent l'origine ethnique dans un vocabulaire supporté par OMOP, stockez le concept_id ici.	integer	Non	-	FK	CONCEPT	-
`ethnicity_source_value`	Ce champ est utilisé pour stocker l'ethnicité de la personne à partir des données source.	Mettez l'ethnicité telle qu'elle apparaît dans les données source.	varchar(50)	Non	-	-	-	-
`ethnicity_source_concept_id`	En raison du petit nombre d'options, ce champ tend à être zéro.	Si les données source codent l'ethnicité dans un vocabulaire supporté par OMOP, stockez le concept_id ici.	integer	Non	-	FK	CONCEPT	-

Champ CDM	Guide utilisateur	Conventions ETL	Type	Requis	PK	FK	Table FK	Domaine FK
`observation_period_id`	Identifie chaque période d'observation distincte par personne.	Attribuez un ID unique à chaque période discrète par personne.	integer	Oui	PK	-	-	-
`person_id`	Lien vers la personne concernée par la période d'observation.	Doit correspondre à une entrée valide dans la table PERSON.	integer	Oui	-	FK	PERSON	-
`observation_period_start_date`	Détermine le début de la période.	Souvent déduit comme la date de l'événement le plus ancien ; dans les données d'assurance, représente le début de l'affiliation.	date	Oui	-	-	-	-
`observation_period_end_date`	Détermine la fin de la période quand tous les événements sont capturés.	Souvent déduit comme la date de l'événement le plus récent ; dans les données d'assurance, représente la fin de l'affiliation.	date	Oui	-	-	-	-
`period_type_concept_id`	Indique la source de provenance (affiliation, DPI, autre).	Sélectionnez le concept représentant la méthode de détermination ; domaine Type Concept standard.	integer	Oui	-	FK	CONCEPT	Type Concept

Champ CDM	Guide utilisateur	Conventions ETL	Type	Requis	PK	FK	Table FK	Domaine FK
`person_id`	Identifiant unique liant à la personne décédée.	Lien vers la table PERSON.	integer	Oui	PK	FK	PERSON	-
`death_date`	Date de décès de la personne.	Si la date précise n'est pas connue, estimez la date.	date	Oui	-	-	-	-
`death_datetime`	Date et heure de décès de la personne.	Si aucune heure n'est donnée, définir à minuit (00:00:00).	datetime	Non	-	-	-	-
`death_type_concept_id`	Provenance de l'enregistrement de décès.	Utilisez ce champ pour identifier la provenance de l'enregistrement de décès (par ex. DPI, certificat de décès, données d'assurance).	integer	Oui	-	FK	CONCEPT	Type Concept
`cause_concept_id`	Concept standard représentant la cause du décès.	Mappez la cause du décès vers un Concept Standard dans le domaine Condition si disponible.	integer	Non	-	FK	CONCEPT	Condition
`cause_source_value`	Code source pour la cause du décès.	Stockez la valeur source originale.	varchar(50)	Non	-	-	-	-
`cause_source_concept_id`	Concept représentant la cause source du décès.	Si les données source codent la cause du décès dans un vocabulaire supporté par OMOP, stockez le concept_id ici.	integer	Non	-	FK	CONCEPT	-

Champ CDM	Guide utilisateur	Conventions ETL	Type	Requis	PK	FK	Table FK	Domaine FK
`visit_occurrence_id`	Identifiant unique pour chaque interaction.	Créé en attribuant un ID distinct à chaque rencontre patient-système de santé.	integer	Oui	PK	-	-	-
`person_id`	Identifie le patient.	Lien vers la table PERSON.	integer	Oui	-	FK	PERSON	-
`visit_concept_id`	Concept standard du domaine Visit représentant le type de rencontre.	Remplissez ce champ en fonction du type de visite effectuée.	integer	Oui	-	FK	CONCEPT	Visit
`visit_start_date`	Date d'admission pour les hospitalisations ; date d'interaction patient-prestataire pour les autres.	Si cette information n'est pas disponible, l'enregistrement doit être supprimé.	date	Oui	-	-	-	-
`visit_start_datetime`	Heure de début de la visite.	Si aucune heure n'est donnée pour la date de début d'une visite, définir à minuit (00:00:00).	datetime	Non	-	-	-	-
`visit_end_date`	Date de sortie pour les hospitalisations ; identique à la date de début pour les visites du même jour.	Les dates de fin de visite sont obligatoires.	date	Oui	-	-	-	-
`visit_end_datetime`	Heure de fin de la visite.	Défaut à minuit si non disponible.	datetime	Non	-	-	-	-
`visit_type_concept_id`	Indique la provenance (DPI vs. données d'assurance).	Remplissez ce champ en fonction de la provenance de l'enregistrement de visite.	integer	Oui	-	FK	CONCEPT	Type Concept
`provider_id`	Prestataire unique associé.	S'il y a plusieurs prestataires associés à une visite, vous devrez choisir lequel mettre ici.	integer	Non	-	FK	PROVIDER	-
`care_site_id`	Localisation de l'établissement de santé.	Lien vers la table CARE_SITE.	integer	Non	-	FK	CARE_SITE	-
`visit_source_value`	Valeur source verbatim indiquant le type de visite.	Stockez le code source original.	varchar(50)	Non	-	-	-	-
`visit_source_concept_id`	Concept de codage du système source si supporté par OMOP.	Mappez vers le concept si la source utilise un vocabulaire OMOP.	integer	Non	-	FK	CONCEPT	-
`admitted_from_concept_id`	Concept standard du domaine Visit indiquant l'origine de l'admission.	Si une personne a été admise depuis son domicile ou s'est auto-référée, définir à 0.	integer	Non	-	FK	CONCEPT	Visit
`admitted_from_source_value`	Valeur source verbatim pour l'origine de l'admission.	Stockez la valeur source originale.	varchar(50)	Non	-	-	-	-
`discharged_to_concept_id`	Concept de destination de sortie.	On suppose qu'une personne sort vers son domicile donc il n'y a pas de concept_id standard pour 'domicile'. Utilisez concept_id = 0.	integer	Non	-	FK	CONCEPT	Visit
`discharged_to_source_value`	Valeur source verbatim pour la destination de sortie.	Stockez la valeur source originale.	varchar(50)	Non	-	-	-	-
`preceding_visit_occurrence_id`	Lien vers la visite immédiatement précédente pour la même personne.	Utilisez pour chaîner les visites chronologiquement.	integer	Non	-	FK	VISIT_OCCURRENCE	-

Champ CDM	Guide utilisateur	Conventions ETL	Type	Requis	PK	FK	Table FK	Domaine FK
`visit_detail_id`	Identifiant unique pour chaque enregistrement de détail de visite.	Généré lors de l'ETL.	integer	Oui	PK	-	-	-
`person_id`	Identifie le patient.	Lien vers la table PERSON.	integer	Oui	-	FK	PERSON	-
`visit_detail_concept_id`	Concept standard pour le type de détail de visite.	Doit être un descendant du VISIT_CONCEPT_ID de la visite parente.	integer	Oui	-	FK	CONCEPT	Visit
`visit_detail_start_date`	Date de début du détail de visite.	Champ obligatoire.	date	Oui	-	-	-	-
`visit_detail_start_datetime`	Date et heure de début du détail de visite.	Définir à minuit si l'heure n'est pas disponible.	datetime	Non	-	-	-	-
`visit_detail_end_date`	Date de fin du détail de visite.	Champ obligatoire.	date	Oui	-	-	-	-
`visit_detail_end_datetime`	Date et heure de fin du détail de visite.	Définir à minuit si l'heure n'est pas disponible.	datetime	Non	-	-	-	-
`visit_detail_type_concept_id`	Provenance de l'enregistrement de détail de visite.	Indique d'où proviennent les données.	integer	Oui	-	FK	CONCEPT	Type Concept
`provider_id`	Professionnel de santé associé au détail de visite.	Lien vers la table PROVIDER.	integer	Non	-	FK	PROVIDER	-
`care_site_id`	Établissement de soins où le détail de visite a eu lieu.	Lien vers la table CARE_SITE.	integer	Non	-	FK	CARE_SITE	-
`visit_detail_source_value`	Valeur source pour le type de détail de visite.	Stocker la valeur source d'origine.	varchar(50)	Non	-	-	-	-
`visit_detail_source_concept_id`	Concept source pour le type de détail de visite.	Mapper vers un concept si la source utilise le vocabulaire OMOP.	integer	Non	-	FK	CONCEPT	-
`admitted_from_concept_id`	Concept indiquant l'origine de l'admission.	Utiliser 0 pour le domicile ou l'auto-référence.	integer	Non	-	FK	CONCEPT	Visit
`admitted_from_source_value`	Valeur source pour l'origine de l'admission.	Stocker la valeur source d'origine.	varchar(50)	Non	-	-	-	-
`discharged_to_concept_id`	Concept de destination de sortie.	Utiliser 0 pour un retour à domicile.	integer	Non	-	FK	CONCEPT	Visit
`discharged_to_source_value`	Valeur source pour la destination de sortie.	Stocker la valeur source d'origine.	varchar(50)	Non	-	-	-	-
`preceding_visit_detail_id`	Lien vers le détail de visite immédiatement précédent.	Utiliser pour chaîner les détails de visite chronologiquement.	integer	Non	-	FK	VISIT_DETAIL	-
`parent_visit_detail_id`	Lien vers un détail de visite parent pour les hiérarchies imbriquées.	Utiliser pour les hiérarchies de visites à plusieurs niveaux.	integer	Non	-	FK	VISIT_DETAIL	-
`visit_occurrence_id`	Lien vers la visite parente.	Lien obligatoire vers la table VISIT_OCCURRENCE.	integer	Oui	-	FK	VISIT_OCCURRENCE	-

Champ CDM	Guide utilisateur	Conventions ETL	Type	Requis	PK	FK	Table FK	Domaine FK
`condition_occurrence_id`	Identifiant unique pour chaque occurrence de condition.	Généré lors de l'ETL.	integer	Oui	PK	-	-	-
`person_id`	Identifie le patient.	Lien vers la table PERSON.	integer	Oui	-	FK	PERSON	-
`condition_concept_id`	Concept standard représentant la condition.	Mapper le code source vers un Concept Standard du domaine Condition.	integer	Oui	-	FK	CONCEPT	Condition
`condition_start_date`	Date à laquelle la condition a été diagnostiquée ou a commencé.	Champ obligatoire.	date	Oui	-	-	-	-
`condition_start_datetime`	Date et heure auxquelles la condition a été diagnostiquée ou a commencé.	Définir à minuit si l'heure n'est pas disponible.	datetime	Non	-	-	-	-
`condition_end_date`	Date à laquelle la condition s'est résolue.	Souvent indisponible ; utiliser CONDITION_ERA pour les périodes dérivées.	date	Non	-	-	-	-
`condition_end_datetime`	Date et heure auxquelles la condition s'est résolue.	Définir à minuit si l'heure n'est pas disponible.	datetime	Non	-	-	-	-
`condition_type_concept_id`	Provenance de l'enregistrement de condition.	Indique d'où proviennent les données (DME, remboursements, etc.).	integer	Oui	-	FK	CONCEPT	Type Concept
`condition_status_concept_id`	Statut de la condition (préliminaire, final, etc.).	Utiliser les concepts du domaine Condition Status.	integer	Non	-	FK	CONCEPT	Condition Status
`stop_reason`	Raison pour laquelle la condition n'est plus enregistrée.	Souvent indisponible.	varchar(20)	Non	-	-	-	-
`provider_id`	Professionnel de santé ayant diagnostiqué la condition.	Lien vers la table PROVIDER.	integer	Non	-	FK	PROVIDER	-
`visit_occurrence_id`	Visite au cours de laquelle la condition a été diagnostiquée.	Lien vers la table VISIT_OCCURRENCE.	integer	Non	-	FK	VISIT_OCCURRENCE	-
`visit_detail_id`	Détail de visite au cours duquel la condition a été diagnostiquée.	Lien vers la table VISIT_DETAIL.	integer	Non	-	FK	VISIT_DETAIL	-
`condition_source_value`	Code source pour la condition.	Stocker la valeur source d'origine.	varchar(50)	Non	-	-	-	-
`condition_source_concept_id`	Concept source pour la condition.	Mapper vers un concept si la source utilise le vocabulaire OMOP.	integer	Non	-	FK	CONCEPT	-
`condition_status_source_value`	Valeur source pour le statut de la condition.	Stocker la valeur source d'origine.	varchar(50)	Non	-	-	-	-

Champ CDM	Guide utilisateur	Conventions ETL	Type	Requis	PK	FK	Table FK	Domaine FK
`drug_exposure_id`	Identifiant unique pour chaque enregistrement d'exposition médicamenteuse.	Généré lors de l'ETL.	integer	Oui	PK	-	-	-
`person_id`	Personne recevant le médicament.	Lien vers la table PERSON.	integer	Oui	-	FK	PERSON	-
`drug_concept_id`	Concept standard du médicament (mappé depuis la source).	Doit mapper vers le domaine Drug.	integer	Oui	-	FK	CONCEPT	Drug
`drug_exposure_start_date`	Date de début de prescription, de délivrance ou d'administration.	Champ obligatoire.	date	Oui	-	-	-	-
`drug_exposure_start_datetime`	Date et heure de début de l'exposition médicamenteuse.	Définir à minuit si l'heure n'est pas disponible.	datetime	Non	-	-	-	-
`drug_exposure_end_date`	Date de fin de l'exposition médicamenteuse.	Déduite de la date de début et de la durée si non disponible.	date	Oui	-	-	-	-
`drug_exposure_end_datetime`	Date et heure de fin de l'exposition médicamenteuse.	Définir à minuit si l'heure n'est pas disponible.	datetime	Non	-	-	-	-
`verbatim_end_date`	Date de fin telle qu'elle apparaît dans les données sources.	Stocker la date de fin d'origine si disponible.	date	Non	-	-	-	-
`drug_type_concept_id`	Provenance (prescrit, dispensé, administré).	Domaine Type Concept.	integer	Oui	-	FK	CONCEPT	Type Concept
`stop_reason`	Raison de l'arrêt du médicament.	Souvent indisponible.	varchar(20)	Non	-	-	-	-
`refills`	Renouvellements prévus au moment de la prescription.	Stocker comme entier.	integer	Non	-	-	-	-
`quantity`	Quantité totale dispensée.	Conversion d'unité vers la table DRUG_STRENGTH requise.	float	Non	-	-	-	-
`days_supply`	Jours d'approvisionnement tels qu'enregistrés.	Exclure les valeurs négatives ou erronément élevées.	integer	Non	-	-	-	-
`sig`	Instructions verbatim du prescripteur pour le médicament.	Stocker comme texte.	text	Non	-	-	-	-
`route_concept_id`	Voie d'administration.	Domaine Route.	integer	Non	-	FK	CONCEPT	Route
`lot_number`	Identifiant du lot de fabrication.	Stocker si disponible.	varchar(50)	Non	-	-	-	-
`provider_id`	Prescripteur ou professionnel administrant.	Lien vers la table PROVIDER.	integer	Non	-	FK	PROVIDER	-
`visit_occurrence_id`	Visite associée.	Lien vers la table VISIT_OCCURRENCE.	integer	Non	-	FK	VISIT_OCCURRENCE	-
`visit_detail_id`	Détail de visite associé (ex. séjour en réanimation).	Lien vers la table VISIT_DETAIL.	integer	Non	-	FK	VISIT_DETAIL	-
`drug_source_value`	Code source (NDC, Gemscript).	Stocker la valeur source d'origine.	varchar(50)	Non	-	-	-	-
`drug_source_concept_id`	Concept source (non standard).	Mapper vers un concept si la source utilise le vocabulaire OMOP.	integer	Non	-	FK	CONCEPT	-
`route_source_value`	Voie verbatim des données sources.	Stocker la valeur source d'origine.	varchar(50)	Non	-	-	-	-
`dose_unit_source_value`	Unité de dose verbatim.	Champ déprécié.	varchar(50)	Non	-	-	-	-

Champ CDM	Guide utilisateur	Conventions ETL	Type	Requis	PK	FK	Table FK	Domaine FK
`procedure_occurrence_id`	Identifiant unique pour chaque occurrence de procédure.	Généré lors de l'ETL.	integer	Oui	PK	-	-	-
`person_id`	Identifie le patient.	Lien vers la table PERSON.	integer	Oui	-	FK	PERSON	-
`procedure_concept_id`	Concept standard représentant la procédure.	Mapper le code source vers un Concept Standard du domaine Procedure.	integer	Oui	-	FK	CONCEPT	Procedure
`procedure_date`	Date à laquelle la procédure a été réalisée.	Champ obligatoire.	date	Oui	-	-	-	-
`procedure_datetime`	Date et heure de la procédure.	Définir à minuit si l'heure n'est pas disponible.	datetime	Non	-	-	-	-
`procedure_end_date`	Date de fin de la procédure.	Optionnel ; pour les procédures sur plusieurs jours.	date	Non	-	-	-	-
`procedure_end_datetime`	Date et heure de fin de la procédure.	Définir à minuit si l'heure n'est pas disponible.	datetime	Non	-	-	-	-
`procedure_type_concept_id`	Provenance de l'enregistrement de procédure.	Domaine Type Concept.	integer	Oui	-	FK	CONCEPT	Type Concept
`modifier_concept_id`	Modificateur de procédure (ex. bilatéral, latéralité).	Stocker si disponible.	integer	Non	-	FK	CONCEPT	-
`quantity`	Nombre de fois que la procédure a été réalisée.	Stocker comme entier.	integer	Non	-	-	-	-
`provider_id`	Professionnel de santé ayant réalisé la procédure.	Lien vers la table PROVIDER.	integer	Non	-	FK	PROVIDER	-
`visit_occurrence_id`	Visite au cours de laquelle la procédure a été réalisée.	Lien vers la table VISIT_OCCURRENCE.	integer	Non	-	FK	VISIT_OCCURRENCE	-
`visit_detail_id`	Détail de visite au cours duquel la procédure a été réalisée.	Lien vers la table VISIT_DETAIL.	integer	Non	-	FK	VISIT_DETAIL	-
`procedure_source_value`	Code source pour la procédure.	Stocker la valeur source d'origine.	varchar(50)	Non	-	-	-	-
`procedure_source_concept_id`	Concept source pour la procédure.	Mapper vers un concept si la source utilise le vocabulaire OMOP.	integer	Non	-	FK	CONCEPT	-
`modifier_source_value`	Valeur source pour le modificateur.	Stocker la valeur source d'origine.	varchar(50)	Non	-	-	-	-

Champ CDM	Guide utilisateur	Conventions ETL	Type	Requis	PK	FK	Table FK	Domaine FK
`device_exposure_id`	Identifiant unique pour chaque enregistrement d'exposition à un dispositif.	Généré lors de l'ETL.	integer	Oui	PK	-	-	-
`person_id`	Identifie le patient.	Lien vers la table PERSON.	integer	Oui	-	FK	PERSON	-
`device_concept_id`	Concept standard représentant le dispositif.	Mapper vers le domaine Device.	integer	Oui	-	FK	CONCEPT	Device
`device_exposure_start_date`	Date de début de l'exposition au dispositif.	Champ obligatoire.	date	Oui	-	-	-	-
`device_exposure_start_datetime`	Date et heure de début de l'exposition au dispositif.	Définir à minuit si l'heure n'est pas disponible.	datetime	Non	-	-	-	-
`device_exposure_end_date`	Date de fin de l'exposition au dispositif.	Optionnel.	date	Non	-	-	-	-
`device_exposure_end_datetime`	Date et heure de fin de l'exposition au dispositif.	Définir à minuit si l'heure n'est pas disponible.	datetime	Non	-	-	-	-
`device_type_concept_id`	Provenance de l'enregistrement du dispositif.	Domaine Type Concept.	integer	Oui	-	FK	CONCEPT	Type Concept
`unique_device_id`	Identifiant unique du dispositif (UDI).	Stocker si disponible.	varchar(255)	Non	-	-	-	-
`production_id`	Identifiant de production du fabricant.	Stocker si disponible.	varchar(255)	Non	-	-	-	-
`quantity`	Nombre de dispositifs utilisés.	Stocker comme entier.	integer	Non	-	-	-	-
`provider_id`	Professionnel de santé ayant posé ou utilisé le dispositif.	Lien vers la table PROVIDER.	integer	Non	-	FK	PROVIDER	-
`visit_occurrence_id`	Visite au cours de laquelle le dispositif a été utilisé.	Lien vers la table VISIT_OCCURRENCE.	integer	Non	-	FK	VISIT_OCCURRENCE	-
`visit_detail_id`	Détail de visite au cours duquel le dispositif a été utilisé.	Lien vers la table VISIT_DETAIL.	integer	Non	-	FK	VISIT_DETAIL	-
`device_source_value`	Code source pour le dispositif.	Stocker la valeur source d'origine.	varchar(50)	Non	-	-	-	-
`device_source_concept_id`	Concept source pour le dispositif.	Mapper vers un concept si la source utilise le vocabulaire OMOP.	integer	Non	-	FK	CONCEPT	-
`unit_concept_id`	Unité de mesure pour le dispositif.	Domaine Unit.	integer	Non	-	FK	CONCEPT	Unit
`unit_source_value`	Valeur source pour l'unité.	Stocker la valeur source d'origine.	varchar(50)	Non	-	-	-	-
`unit_source_concept_id`	Concept source pour l'unité.	Mapper vers un concept si la source utilise le vocabulaire OMOP.	integer	Non	-	FK	CONCEPT	-

Champ CDM	Guide utilisateur	Conventions ETL	Type	Requis	PK	FK	Table FK	Domaine FK
`measurement_id`	Identifiant unique pour chaque enregistrement de mesure.	Généré lors de l'ETL.	integer	Oui	PK	-	-	-
`person_id`	Identifie le patient.	Lien vers la table PERSON.	integer	Oui	-	FK	PERSON	-
`measurement_concept_id`	Concept standard représentant la mesure.	Mapper vers le domaine Measurement.	integer	Oui	-	FK	CONCEPT	Measurement
`measurement_date`	Date de la mesure.	Champ obligatoire.	date	Oui	-	-	-	-
`measurement_datetime`	Date et heure de la mesure.	Définir à minuit si l'heure n'est pas disponible.	datetime	Non	-	-	-	-
`measurement_time`	Heure de la mesure (déprécié).	Utiliser measurement_datetime à la place.	varchar(10)	Non	-	-	-	-
`measurement_type_concept_id`	Provenance de l'enregistrement de mesure.	Domaine Type Concept.	integer	Oui	-	FK	CONCEPT	Type Concept
`operator_concept_id`	Opérateur pour la valeur (=, <, >, etc.).	Domaine Meas Value Operator.	integer	Non	-	FK	CONCEPT	Meas Value Operator
`value_as_number`	Résultat numérique de la mesure.	Stocker la valeur numérique.	float	Non	-	-	-	-
`value_as_concept_id`	Résultat catégoriel de la mesure.	Domaine Meas Value.	integer	Non	-	FK	CONCEPT	Meas Value
`unit_concept_id`	Unité de la mesure.	Domaine Unit.	integer	Non	-	FK	CONCEPT	Unit
`range_low`	Borne inférieure de la plage normale.	Stocker si disponible.	float	Non	-	-	-	-
`range_high`	Borne supérieure de la plage normale.	Stocker si disponible.	float	Non	-	-	-	-
`provider_id`	Professionnel de santé ayant prescrit ou réalisé la mesure.	Lien vers la table PROVIDER.	integer	Non	-	FK	PROVIDER	-
`visit_occurrence_id`	Visite au cours de laquelle la mesure a été effectuée.	Lien vers la table VISIT_OCCURRENCE.	integer	Non	-	FK	VISIT_OCCURRENCE	-
`visit_detail_id`	Détail de visite au cours duquel la mesure a été effectuée.	Lien vers la table VISIT_DETAIL.	integer	Non	-	FK	VISIT_DETAIL	-
`measurement_source_value`	Code source pour la mesure.	Stocker la valeur source d'origine.	varchar(50)	Non	-	-	-	-
`measurement_source_concept_id`	Concept source pour la mesure.	Mapper vers un concept si la source utilise le vocabulaire OMOP.	integer	Non	-	FK	CONCEPT	-
`unit_source_value`	Valeur source pour l'unité.	Stocker la valeur source d'origine.	varchar(50)	Non	-	-	-	-
`unit_source_concept_id`	Concept source pour l'unité.	Mapper vers un concept si la source utilise le vocabulaire OMOP.	integer	Non	-	FK	CONCEPT	-
`value_source_value`	Valeur source pour le résultat.	Stocker la valeur source d'origine.	varchar(50)	Non	-	-	-	-
`measurement_event_id`	Lien vers un autre événement clinique.	Stocker si disponible.	integer	Non	-	-	-	-
`meas_event_field_concept_id`	Concept identifiant le type d'événement lié.	Mapper vers un concept.	integer	Non	-	FK	CONCEPT	-

Champ CDM	Guide utilisateur	Conventions ETL	Type	Requis	PK	FK	Table FK	Domaine FK
`observation_id`	Identifiant unique pour chaque enregistrement d'observation.	Généré lors de l'ETL.	integer	Oui	PK	-	-	-
`person_id`	Identifie le patient.	Lien vers la table PERSON.	integer	Oui	-	FK	PERSON	-
`observation_concept_id`	Concept standard représentant l'observation.	Mapper vers le domaine Observation.	integer	Oui	-	FK	CONCEPT	-
`observation_date`	Date de l'observation.	Champ obligatoire.	date	Oui	-	-	-	-
`observation_datetime`	Date et heure de l'observation.	Définir à minuit si l'heure n'est pas disponible.	datetime	Non	-	-	-	-
`observation_type_concept_id`	Provenance de l'enregistrement d'observation.	Domaine Type Concept.	integer	Oui	-	FK	CONCEPT	Type Concept
`value_as_number`	Valeur numérique de l'observation.	Stocker si applicable.	float	Non	-	-	-	-
`value_as_string`	Valeur textuelle de l'observation.	Stocker si applicable.	varchar(60)	Non	-	-	-	-
`value_as_concept_id`	Valeur catégorielle de l'observation.	Mapper vers un concept.	integer	Non	-	FK	CONCEPT	-
`qualifier_concept_id`	Qualificateur pour l'observation.	Stocker si applicable.	integer	Non	-	FK	CONCEPT	-
`unit_concept_id`	Unité de l'observation.	Domaine Unit.	integer	Non	-	FK	CONCEPT	Unit
`provider_id`	Professionnel de santé ayant effectué l'observation.	Lien vers la table PROVIDER.	integer	Non	-	FK	PROVIDER	-
`visit_occurrence_id`	Visite au cours de laquelle l'observation a été effectuée.	Lien vers la table VISIT_OCCURRENCE.	integer	Non	-	FK	VISIT_OCCURRENCE	-
`visit_detail_id`	Détail de visite au cours duquel l'observation a été effectuée.	Lien vers la table VISIT_DETAIL.	integer	Non	-	FK	VISIT_DETAIL	-
`observation_source_value`	Code source pour l'observation.	Stocker la valeur source d'origine.	varchar(50)	Non	-	-	-	-
`observation_source_concept_id`	Concept source pour l'observation.	Mapper vers un concept si la source utilise le vocabulaire OMOP.	integer	Non	-	FK	CONCEPT	-
`unit_source_value`	Valeur source pour l'unité.	Stocker la valeur source d'origine.	varchar(50)	Non	-	-	-	-
`qualifier_source_value`	Valeur source pour le qualificateur.	Stocker la valeur source d'origine.	varchar(50)	Non	-	-	-	-
`value_source_value`	Valeur source pour le résultat.	Stocker la valeur source d'origine.	varchar(50)	Non	-	-	-	-
`observation_event_id`	Lien vers un autre événement clinique.	Stocker si disponible.	integer	Non	-	-	-	-
`obs_event_field_concept_id`	Concept identifiant le type d'événement lié.	Mapper vers un concept.	integer	Non	-	FK	CONCEPT	-

Champ CDM	Guide Utilisateur	Conventions ETL	Type	Requis	PK	FK	Table FK	Domaine FK
`note_id`	Identifiant unique de la note.	Clé primaire générée automatiquement.	INTEGER	Oui	PK
`person_id`	Référence au patient associé à la note.	Lien vers PERSON.person_id.	INTEGER	Oui		FK	PERSON
`note_date`	Date à laquelle la note a été écrite.	Date de création de la note.	DATE	Oui
`note_datetime`	Date et heure de la note.	Si non disponible, dérivé de note_date.	DATETIME	Non
`note_type_concept_id`	Type de note (provenance des données).	Concept du vocabulaire Note Type.	INTEGER	Oui		FK	CONCEPT	Type Concept
`note_class_concept_id`	Catégorie de la note (ex: note de sortie, compte-rendu opératoire).	Concepts du domaine Note Class.	INTEGER	Oui		FK	CONCEPT
`note_title`	Titre optionnel de la note.	Texte libre pour le titre.	VARCHAR(250)	Non
`note_text`	Contenu texte de la note.	Texte libre avec le contenu complet de la note.	TEXT	Oui
`encoding_concept_id`	Encodage du texte (ex: UTF-8).	Concept représentant l'encodage caractère.	INTEGER	Oui		FK	CONCEPT
`language_concept_id`	Langue de la note.	Concept du vocabulaire Language.	INTEGER	Oui		FK	CONCEPT
`provider_id`	Professionnel ayant rédigé la note.	Lien vers PROVIDER.provider_id.	INTEGER	Non		FK	PROVIDER
`visit_occurrence_id`	Visite associée à la note.	Lien vers VISIT_OCCURRENCE.visit_occurrence_id.	INTEGER	Non		FK	VISIT_OCCURRENCE
`visit_detail_id`	Détail de visite associé à la note.	Lien vers VISIT_DETAIL.visit_detail_id.	INTEGER	Non		FK	VISIT_DETAIL
`note_source_value`	Valeur source pour le type de note.	Code ou texte original du système source.	VARCHAR(50)	Non
`note_event_id`	ID de l'événement clinique lié à la note.	Référence polymorphe vers un événement clinique.	BIGINT	Non
`note_event_field_concept_id`	Concept identifiant la table de l'événement.	Permet d'identifier la table source de note_event_id.	INTEGER	Non		FK	CONCEPT

Champ CDM	Guide Utilisateur	Conventions ETL	Type	Requis	PK	FK	Table FK
`note_nlp_id`	Identifiant unique de l'extraction NLP.	Clé primaire générée automatiquement.	INTEGER	Oui	PK
`note_id`	Référence à la note source analysée.	Lien vers NOTE.note_id.	INTEGER	Oui		FK	NOTE
`section_concept_id`	Section de la note où le terme a été trouvé.	Concept identifiant la section (ex: antécédents, traitement).	INTEGER	Non		FK	CONCEPT
`snippet`	Fragment de texte contenant le terme extrait.	Contexte textuel autour du terme identifié.	VARCHAR(250)	Non
`offset`	Position du début du terme dans la note.	Index de caractère du début de l'extraction.	VARCHAR(50)	Non
`lexical_variant`	Forme exacte du terme trouvé dans le texte.	Texte tel qu'il apparaît dans la note source.	VARCHAR(250)	Oui
`note_nlp_concept_id`	Concept standard mappé au terme extrait.	Concept OMOP correspondant au terme NLP.	INTEGER	Non		FK	CONCEPT
`note_nlp_source_concept_id`	Concept source du terme avant mapping.	Concept non-standard du vocabulaire source NLP.	INTEGER	Non		FK	CONCEPT
`nlp_system`	Nom du système NLP utilisé.	Identifiant de l'outil NLP (ex: cTAKES, MetaMap).	VARCHAR(250)	Non
`nlp_date`	Date d'exécution de l'analyse NLP.	Date à laquelle le NLP a été appliqué.	DATE	Oui
`nlp_datetime`	Date et heure de l'analyse NLP.	Horodatage complet de l'extraction.	DATETIME	Non
`term_exists`	Indicateur si le terme est présent ou absent.	Y pour présent, N pour absence explicite.	VARCHAR(1)	Non
`term_temporal`	Contexte temporel du terme (passé, présent, futur).	Indique si le terme réfère à un état actuel ou historique.	VARCHAR(50)	Non
`term_modifiers`	Modificateurs contextuels du terme.	Informations sur la négation, l'incertitude, etc.	VARCHAR(2000)	Non

Champ CDM	Guide Utilisateur	Conventions ETL	Type	Requis	PK	FK	Table FK	Domaine FK
`episode_id`	Identifiant unique de l'épisode.	Clé primaire générée automatiquement.	BIGINT	Oui	PK
`person_id`	Référence au patient concerné.	Lien vers PERSON.person_id.	BIGINT	Oui		FK	PERSON
`episode_concept_id`	Concept définissant le type d'épisode.	Concept du domaine Episode (ex: Treatment Episode, Disease Episode).	INTEGER	Oui		FK	CONCEPT	Episode
`episode_start_date`	Date de début de l'épisode.	Premier événement de l'épisode.	DATE	Oui
`episode_start_datetime`	Date et heure de début.	Si non disponible, dérivé de episode_start_date.	DATETIME	Non
`episode_end_date`	Date de fin de l'épisode.	Dernier événement ou résolution de l'épisode.	DATE	Non
`episode_end_datetime`	Date et heure de fin.	Si non disponible, dérivé de episode_end_date.	DATETIME	Non
`episode_parent_id`	Référence à un épisode parent.	Permet de créer des hiérarchies d'épisodes.	BIGINT	Non		FK	EPISODE
`episode_number`	Numéro séquentiel de l'épisode.	Pour numéroter les épisodes récurrents (ex: 2ème ligne de chimiothérapie).	INTEGER	Non
`episode_object_concept_id`	Concept décrivant l'objet de l'épisode.	Le diagnostic ou traitement concerné (ex: cancer du sein).	INTEGER	Oui		FK	CONCEPT
`episode_type_concept_id`	Type de provenance des données.	Concept indiquant la source de l'épisode.	INTEGER	Oui		FK	CONCEPT	Type Concept
`episode_source_value`	Valeur source de l'épisode.	Code ou identifiant du système source.	VARCHAR(50)	Non
`episode_source_concept_id`	Concept source de l'épisode.	Concept non-standard avant mapping.	INTEGER	Non		FK	CONCEPT

Champ CDM	Guide Utilisateur	Conventions ETL	Type	Requis	FK	Table FK
`episode_id`	Référence à l'épisode.	Lien vers EPISODE.episode_id.	BIGINT	Oui	FK	EPISODE
`event_id`	ID de l'événement clinique associé.	Référence polymorphe vers l'événement (condition, drug_exposure, etc.).	BIGINT	Oui
`episode_event_field_concept_id`	Concept identifiant la table source de l'événement.	Permet de savoir quelle table contient l'événement référencé.	INTEGER	Oui	FK	CONCEPT

Champ CDM	Guide Utilisateur	Conventions ETL	Type	Requis	PK	FK	Table FK	Domaine FK
`specimen_id`	Identifiant unique du prélèvement.	Clé primaire générée automatiquement.	INTEGER	Oui	PK
`person_id`	Référence au patient prélevé.	Lien vers PERSON.person_id.	INTEGER	Oui		FK	PERSON
`specimen_concept_id`	Type de prélèvement (sang, urine, biopsie, etc.).	Concept du domaine Specimen.	INTEGER	Oui		FK	CONCEPT	Specimen
`specimen_type_concept_id`	Provenance des données du spécimen.	Concept indiquant la source de l'information.	INTEGER	Oui		FK	CONCEPT	Type Concept
`specimen_date`	Date du prélèvement.	Date à laquelle l'échantillon a été collecté.	DATE	Oui
`specimen_datetime`	Date et heure du prélèvement.	Si non disponible, dérivé de specimen_date.	DATETIME	Non
`quantity`	Quantité de spécimen prélevé.	Volume ou masse selon l'unité.	FLOAT	Non
`unit_concept_id`	Unité de mesure de la quantité.	Concept d'unité (mL, g, etc.).	INTEGER	Non		FK	CONCEPT	Unit
`anatomic_site_concept_id`	Site anatomique du prélèvement.	Localisation du prélèvement sur le corps.	INTEGER	Non		FK	CONCEPT	Spec Anatomic Site
`disease_status_concept_id`	Statut pathologique du spécimen.	État du tissu (normal, tumoral, etc.).	INTEGER	Non		FK	CONCEPT
`specimen_source_id`	Identifiant source du spécimen.	Numéro de tube ou d'échantillon du laboratoire.	VARCHAR(50)	Non
`specimen_source_value`	Valeur source du type de spécimen.	Code ou texte original du système source.	VARCHAR(50)	Non
`unit_source_value`	Valeur source de l'unité.	Texte de l'unité dans le système source.	VARCHAR(50)	Non
`anatomic_site_source_value`	Valeur source du site anatomique.	Texte de localisation du système source.	VARCHAR(50)	Non
`disease_status_source_value`	Valeur source du statut pathologique.	Texte original du statut dans le système source.	VARCHAR(50)	Non

Champ CDM	Guide Utilisateur	Conventions ETL	Type	Requis	FK	Table FK	Domaine FK
`domain_concept_id_1`	Domaine du premier fait.	Concept identifiant le domaine (Condition, Drug, etc.).	INTEGER	Oui	FK	CONCEPT	Metadata
`fact_id_1`	ID du premier fait dans sa table d'origine.	Référence vers l'enregistrement de domain_concept_id_1.	INTEGER	Oui
`domain_concept_id_2`	Domaine du second fait.	Concept identifiant le domaine du second fait.	INTEGER	Oui	FK	CONCEPT	Metadata
`fact_id_2`	ID du second fait dans sa table d'origine.	Référence vers l'enregistrement de domain_concept_id_2.	INTEGER	Oui
`relationship_concept_id`	Type de relation entre les deux faits.	Concept décrivant la nature de la relation.	INTEGER	Oui	FK	CONCEPT	Relationship

Champ CDM	Guide Utilisateur	Conventions ETL	Type	Requis	PK	FK	Table FK	Domaine FK
`location_id`	Identifiant unique de la localisation.	Clé primaire générée automatiquement.	INTEGER	Oui	PK
`address_1`	Première ligne d'adresse.	Numéro et nom de rue.	VARCHAR(50)	Non
`address_2`	Deuxième ligne d'adresse.	Complément d'adresse (appartement, bâtiment, etc.).	VARCHAR(50)	Non
`city`	Ville.	Nom de la ville.	VARCHAR(50)	Non
`state`	État, région ou département.	Code ou nom de la subdivision administrative.	VARCHAR(2)	Non
`zip`	Code postal.	Code postal de l'adresse.	VARCHAR(9)	Non
`county`	Comté ou canton.	Subdivision administrative locale.	VARCHAR(20)	Non
`location_source_value`	Valeur source de la localisation.	Représentation originale dans le système source.	VARCHAR(50)	Non
`country_concept_id`	Concept du pays.	Concept géographique pour le pays.	INTEGER	Non		FK	CONCEPT	Geography
`country_source_value`	Valeur source du pays.	Nom ou code du pays dans le système source.	VARCHAR(80)	Non
`latitude`	Latitude géographique.	Coordonnée latitude (décimal).	FLOAT	Non
`longitude`	Longitude géographique.	Coordonnée longitude (décimal).	FLOAT	Non

Champ CDM	Guide Utilisateur	Conventions ETL	Type	Requis	PK	FK	Table FK	Domaine FK
`care_site_id`	Identifiant unique du site de soins.	Clé primaire générée automatiquement.	INTEGER	Oui	PK
`care_site_name`	Nom du site de soins.	Nom de l'établissement ou du service.	VARCHAR(255)	Non
`place_of_service_concept_id`	Type d'établissement.	Concept décrivant le type de lieu (hôpital, clinique, etc.).	INTEGER	Non		FK	CONCEPT	Place of Service
`location_id`	Référence à l'adresse du site.	Lien vers LOCATION.location_id.	INTEGER	Non		FK	LOCATION
`care_site_source_value`	Valeur source du site de soins.	Identifiant ou code dans le système source.	VARCHAR(50)	Non
`place_of_service_source_value`	Valeur source du type d'établissement.	Code original du type de lieu dans le système source.	VARCHAR(50)	Non

Champ CDM	Guide Utilisateur	Conventions ETL	Type	Requis	PK	FK	Table FK	Domaine FK
`provider_id`	Identifiant unique du prestataire.	Clé primaire générée automatiquement.	INTEGER	Oui	PK
`provider_name`	Nom du prestataire.	Nom complet ou pseudonyme.	VARCHAR(255)	Non
`npi`	National Provider Identifier (USA).	Identifiant national du professionnel.	VARCHAR(20)	Non
`dea`	Drug Enforcement Administration ID (USA).	Identifiant pour la prescription de substances contrôlées.	VARCHAR(20)	Non
`specialty_concept_id`	Spécialité médicale.	Concept décrivant la spécialité (cardiologie, chirurgie, etc.).	INTEGER	Non		FK	CONCEPT	Provider
`care_site_id`	Site de soins principal du prestataire.	Lien vers CARE_SITE.care_site_id.	INTEGER	Non		FK	CARE_SITE
`year_of_birth`	Année de naissance du prestataire.	Utilisé pour l'analyse démographique des praticiens.	INTEGER	Non
`gender_concept_id`	Genre du prestataire.	Concept de genre (masculin, féminin, etc.).	INTEGER	Non		FK	CONCEPT	Gender
`provider_source_value`	Valeur source du prestataire.	Identifiant dans le système source.	VARCHAR(50)	Non
`specialty_source_value`	Valeur source de la spécialité.	Code ou texte de spécialité du système source.	VARCHAR(50)	Non
`specialty_source_concept_id`	Concept source de la spécialité.	Concept non-standard de la spécialité.	INTEGER	Non		FK	CONCEPT
`gender_source_value`	Valeur source du genre.	Code de genre du système source.	VARCHAR(50)	Non
`gender_source_concept_id`	Concept source du genre.	Concept non-standard du genre.	INTEGER	Non		FK	CONCEPT

Champ CDM	Guide Utilisateur	Conventions ETL	Type	Requis	PK	FK	Table FK	Domaine FK
`cost_id`	Identifiant unique du coût.	Clé primaire générée automatiquement.	INTEGER	Oui	PK
`cost_event_id`	ID de l'événement associé au coût.	Référence polymorphe vers l'événement (drug_exposure_id, procedure_id, etc.).	INTEGER	Oui
`cost_domain_id`	Domaine de l'événement associé.	Nom du domaine (Drug, Procedure, Visit, etc.).	VARCHAR(20)	Oui
`cost_type_concept_id`	Type de coût.	Concept indiquant la nature du coût (facturé, remboursé, etc.).	INTEGER	Oui		FK	CONCEPT	Type Concept
`currency_concept_id`	Devise du coût.	Concept de devise (EUR, USD, etc.).	INTEGER	Non		FK	CONCEPT	Currency
`total_charge`	Montant total facturé.	Coût brut avant remboursement.	FLOAT	Non
`total_cost`	Coût total réel.	Coût effectif pour l'établissement.	FLOAT	Non
`total_paid`	Montant total payé.	Somme des paiements (assurance + patient).	FLOAT	Non
`paid_by_payer`	Montant payé par l'assurance.	Part remboursée par l'organisme payeur.	FLOAT	Non
`paid_by_patient`	Montant payé par le patient.	Reste à charge pour le patient.	FLOAT	Non
`paid_patient_copay`	Copaiement du patient.	Ticket modérateur ou forfait.	FLOAT	Non
`paid_patient_coinsurance`	Co-assurance du patient.	Pourcentage à la charge du patient.	FLOAT	Non
`paid_patient_deductible`	Franchise du patient.	Montant de la franchise appliquée.	FLOAT	Non
`paid_by_primary`	Payé par l'assurance primaire.	Remboursement de l'assurance principale.	FLOAT	Non
`paid_ingredient_cost`	Coût des ingrédients.	Pour les médicaments, coût des principes actifs.	FLOAT	Non
`paid_dispensing_fee`	Frais de dispensation.	Honoraires de dispensation pharmaceutique.	FLOAT	Non
`payer_plan_period_id`	Période de couverture associée.	Lien vers PAYER_PLAN_PERIOD.payer_plan_period_id.	INTEGER	Non		FK	PAYER_PLAN_PERIOD
`amount_allowed`	Montant autorisé.	Montant maximum accepté par l'assurance.	FLOAT	Non
`revenue_code_concept_id`	Code de recette.	Concept du code de facturation.	INTEGER	Non		FK	CONCEPT	Revenue Code
`revenue_code_source_value`	Code de recette source.	Code original du système de facturation.	VARCHAR(50)	Non
`drg_concept_id`	DRG (Diagnosis Related Group).	Concept du groupe homogène de malades.	INTEGER	Non		FK	CONCEPT	DRG
`drg_source_value`	DRG source.	Code GHM/GHS original (France) ou DRG (USA).	VARCHAR(3)	Non

Champ CDM	Guide Utilisateur	Conventions ETL	Type	Requis	PK	FK	Table FK	Domaine FK
`payer_plan_period_id`	Identifiant unique de la période.	Clé primaire générée automatiquement.	INTEGER	Oui	PK
`person_id`	Référence au patient.	Lien vers PERSON.person_id.	INTEGER	Oui		FK	PERSON
`payer_plan_period_start_date`	Date de début de la couverture.	Premier jour de la période de couverture.	DATE	Oui
`payer_plan_period_end_date`	Date de fin de la couverture.	Dernier jour de la période de couverture.	DATE	Oui
`payer_concept_id`	Concept de l'organisme payeur.	Concept identifiant le type d'assureur.	INTEGER	Non		FK	CONCEPT	Payer
`payer_source_value`	Valeur source de l'organisme payeur.	Code ou nom de l'assureur dans le système source.	VARCHAR(50)	Non
`payer_source_concept_id`	Concept source du payeur.	Concept non-standard de l'assureur.	INTEGER	Non		FK	CONCEPT
`plan_concept_id`	Concept du type de plan.	Concept identifiant le type de couverture.	INTEGER	Non		FK	CONCEPT	Plan
`plan_source_value`	Valeur source du plan.	Code ou nom du plan dans le système source.	VARCHAR(50)	Non
`plan_source_concept_id`	Concept source du plan.	Concept non-standard du plan.	INTEGER	Non		FK	CONCEPT
`sponsor_concept_id`	Concept du sponsor.	Employeur ou organisme finançant la couverture.	INTEGER	Non		FK	CONCEPT	Sponsor
`sponsor_source_value`	Valeur source du sponsor.	Nom ou code du sponsor dans le système source.	VARCHAR(50)	Non
`sponsor_source_concept_id`	Concept source du sponsor.	Concept non-standard du sponsor.	INTEGER	Non		FK	CONCEPT
`family_source_value`	Identifiant familial.	Numéro de contrat familial ou groupe.	VARCHAR(50)	Non
`stop_reason_concept_id`	Raison de fin de couverture.	Concept expliquant pourquoi la couverture a pris fin.	INTEGER	Non		FK	CONCEPT
`stop_reason_source_value`	Valeur source de la raison de fin.	Code ou texte de fin dans le système source.	VARCHAR(50)	Non
`stop_reason_source_concept_id`	Concept source de la raison de fin.	Concept non-standard de la raison de fin.	INTEGER	Non		FK	CONCEPT

Champ CDM	Guide Utilisateur	Conventions ETL	Type	Requis	PK	FK	Table FK
`concept_id`	Identifiant unique du concept.	Clé primaire, attribuée par OHDSI.	INTEGER	Oui	PK
`concept_name`	Nom descriptif du concept.	Libellé lisible du concept.	VARCHAR(255)	Oui
`domain_id`	Domaine du concept.	Domaine auquel appartient le concept (Condition, Drug, etc.).	VARCHAR(20)	Oui		FK	DOMAIN
`vocabulary_id`	Vocabulaire source du concept.	Identifiant du vocabulaire (SNOMED, RxNorm, LOINC, etc.).	VARCHAR(20)	Oui		FK	VOCABULARY
`concept_class_id`	Classe du concept.	Classification au sein du vocabulaire (Clinical Finding, Ingredient, etc.).	VARCHAR(20)	Oui		FK	CONCEPT_CLASS
`standard_concept`	Indicateur de concept standard.	S = Standard, C = Classification, NULL = Non-standard.	VARCHAR(1)	Non
`concept_code`	Code original du concept.	Code dans le vocabulaire source (ex: code CIM-10, code SNOMED).	VARCHAR(50)	Oui
`valid_start_date`	Date de début de validité.	Date à partir de laquelle le concept est utilisable.	DATE	Oui
`valid_end_date`	Date de fin de validité.	Date jusqu'à laquelle le concept est valide.	DATE	Oui
`invalid_reason`	Raison d'invalidation.	U = Upgraded, D = Deleted, NULL = Valide.	VARCHAR(1)	Non

Champ CDM	Guide Utilisateur	Conventions ETL	Type	Requis	PK	FK	Table FK
`vocabulary_id`	Identifiant unique du vocabulaire.	Code court du vocabulaire (ex: SNOMED, ICD10CM).	VARCHAR(20)	Oui	PK
`vocabulary_name`	Nom complet du vocabulaire.	Nom descriptif de la terminologie.	VARCHAR(255)	Oui
`vocabulary_reference`	Référence externe.	URL ou citation de la source officielle.	VARCHAR(255)	Non
`vocabulary_version`	Version du vocabulaire.	Numéro ou date de version utilisée.	VARCHAR(255)	Non
`vocabulary_concept_id`	Concept représentant le vocabulaire.	Lien vers CONCEPT.concept_id pour ce vocabulaire.	INTEGER	Oui		FK	CONCEPT

Champ CDM	Guide Utilisateur	Conventions ETL	Type	Requis	PK	FK	Table FK
`domain_id`	Identifiant unique du domaine.	Code du domaine (ex: Condition, Drug, Measurement).	VARCHAR(20)	Oui	PK
`domain_name`	Nom du domaine.	Nom descriptif du domaine.	VARCHAR(255)	Oui
`domain_concept_id`	Concept représentant le domaine.	Lien vers CONCEPT.concept_id.	INTEGER	Oui		FK	CONCEPT

Champ CDM	Guide Utilisateur	Conventions ETL	Type	Requis	PK	FK	Table FK
`concept_class_id`	Identifiant de la classe.	Code de la classe (ex: Clinical Finding, Ingredient).	VARCHAR(20)	Oui	PK
`concept_class_name`	Nom de la classe.	Nom descriptif de la classe de concept.	VARCHAR(255)	Oui
`concept_class_concept_id`	Concept représentant la classe.	Lien vers CONCEPT.concept_id.	INTEGER	Oui		FK	CONCEPT

Champ CDM	Guide Utilisateur	Conventions ETL	Type	Requis	FK	Table FK	Domaine FK
`concept_id`	Concept concerné.	Lien vers CONCEPT.concept_id.	INTEGER	Oui	FK	CONCEPT
`concept_synonym_name`	Synonyme du concept.	Nom alternatif ou traduction du concept.	VARCHAR(1000)	Oui
`language_concept_id`	Langue du synonyme.	Concept identifiant la langue du synonyme.	INTEGER	Oui	FK	CONCEPT	Language

Champ CDM	Guide Utilisateur	Conventions ETL	Type	Requis	FK	Table FK
`concept_id_1`	Premier concept de la relation.	Concept source de la relation.	INTEGER	Oui	FK	CONCEPT
`concept_id_2`	Second concept de la relation.	Concept cible de la relation.	INTEGER	Oui	FK	CONCEPT
`relationship_id`	Type de relation.	Identifiant de la relation (Maps to, Is a, etc.).	VARCHAR(20)	Oui	FK	RELATIONSHIP
`valid_start_date`	Date de début de validité.	Date à partir de laquelle la relation est valide.	DATE	Oui
`valid_end_date`	Date de fin de validité.	Date jusqu'à laquelle la relation est valide.	DATE	Oui
`invalid_reason`	Raison d'invalidation.	NULL si valide, D = Deleted, U = Updated.	VARCHAR(1)	Non

Champ CDM	Guide Utilisateur	Conventions ETL	Type	Requis	PK	FK	Table FK
`relationship_id`	Identifiant de la relation.	Code de la relation (ex: Maps to, Is a).	VARCHAR(20)	Oui	PK
`relationship_name`	Nom de la relation.	Description lisible de la relation.	VARCHAR(255)	Oui
`is_hierarchical`	Relation hiérarchique.	1 si relation parent-enfant, 0 sinon.	VARCHAR(1)	Oui
`defines_ancestry`	Définit l'ascendance.	1 si utilisée pour calculer CONCEPT_ANCESTOR.	VARCHAR(1)	Oui
`reverse_relationship_id`	Relation inverse.	ID de la relation inverse (ex: Mapped from).	VARCHAR(20)	Oui		FK	RELATIONSHIP
`relationship_concept_id`	Concept représentant la relation.	Lien vers CONCEPT.concept_id.	INTEGER	Oui		FK	CONCEPT

Champ CDM	Guide Utilisateur	Conventions ETL	Type	Requis	FK	Table FK
`ancestor_concept_id`	Concept ancêtre (parent).	Concept plus général dans la hiérarchie.	INTEGER	Oui	FK	CONCEPT
`descendant_concept_id`	Concept descendant (enfant).	Concept plus spécifique dans la hiérarchie.	INTEGER	Oui	FK	CONCEPT
`min_levels_of_separation`	Distance minimale.	Nombre minimum de niveaux entre ancêtre et descendant.	INTEGER	Oui
`max_levels_of_separation`	Distance maximale.	Nombre maximum de niveaux entre ancêtre et descendant.	INTEGER	Oui

Champ CDM	Guide Utilisateur	Conventions ETL	Type	Requis	FK	Table FK
`source_code`	Code source local.	Valeur du code dans le système source.	VARCHAR(50)	Oui
`source_concept_id`	Concept source (si existant).	Concept OMOP non-standard correspondant au code source.	INTEGER	Oui	FK	CONCEPT
`source_vocabulary_id`	Vocabulaire source.	Identifiant du vocabulaire local ou standard source.	VARCHAR(20)	Oui	FK	VOCABULARY
`source_code_description`	Description du code source.	Libellé explicatif du code source.	VARCHAR(255)	Non
`target_concept_id`	Concept cible standard.	Concept OMOP standard vers lequel mapper.	INTEGER	Oui	FK	CONCEPT
`target_vocabulary_id`	Vocabulaire cible.	Vocabulaire du concept cible (ex: SNOMED, RxNorm).	VARCHAR(20)	Oui	FK	VOCABULARY
`valid_start_date`	Date de début de validité.	Date à partir de laquelle le mapping est valide.	DATE	Oui
`valid_end_date`	Date de fin de validité.	Date jusqu'à laquelle le mapping est valide.	DATE	Oui
`invalid_reason`	Raison d'invalidation.	NULL si valide, sinon raison de l'invalidation.	VARCHAR(1)	Non

Champ CDM	Guide Utilisateur	Conventions ETL	Type	Requis	FK	Table FK	Domaine FK
`drug_concept_id`	Concept du médicament.	Lien vers CONCEPT.concept_id (domaine Drug).	INTEGER	Oui	FK	CONCEPT	Drug
`ingredient_concept_id`	Concept de l'ingrédient actif.	Principe actif du médicament.	INTEGER	Oui	FK	CONCEPT	Drug
`amount_value`	Quantité d'ingrédient.	Quantité par unité (ex: 500 pour 500mg/comprimé).	FLOAT	Non
`amount_unit_concept_id`	Unité de la quantité.	Concept d'unité (mg, g, UI, etc.).	INTEGER	Non	FK	CONCEPT	Unit
`numerator_value`	Numérateur de concentration.	Pour les solutions : quantité dans le numérateur.	FLOAT	Non
`numerator_unit_concept_id`	Unité du numérateur.	Unité de mesure du numérateur.	INTEGER	Non	FK	CONCEPT	Unit
`denominator_value`	Dénominateur de concentration.	Pour les solutions : volume ou quantité du dénominateur.	FLOAT	Non
`denominator_unit_concept_id`	Unité du dénominateur.	Unité de mesure du dénominateur (mL, L, etc.).	INTEGER	Non	FK	CONCEPT	Unit
`box_size`	Taille du conditionnement.	Nombre d'unités dans la boîte.	INTEGER	Non
`valid_start_date`	Date de début de validité.	Date de début de commercialisation.	DATE	Oui
`valid_end_date`	Date de fin de validité.	Date de fin (31-Dec-2099 si toujours valide).	DATE	Oui
`invalid_reason`	Raison d'invalidation.	NULL si valide, D ou U sinon.	VARCHAR(1)	Non

Champ CDM	Guide Utilisateur	Conventions ETL	Type	Requis	PK	FK	Table FK	Domaine FK
`condition_era_id`	Identifiant unique de l'ère de condition.	Clé primaire générée automatiquement.	INTEGER	Oui	PK
`person_id`	Référence au patient.	Lien vers PERSON.person_id.	INTEGER	Oui		FK	PERSON
`condition_concept_id`	Concept de la condition.	Concept standard de la condition (niveau ingrédient pour les maladies).	INTEGER	Oui		FK	CONCEPT	Condition
`condition_era_start_date`	Date de début de l'ère.	Premier jour de la période de condition.	DATE	Oui
`condition_era_end_date`	Date de fin de l'ère.	Dernier jour de la période de condition.	DATE	Oui
`condition_occurrence_count`	Nombre d'occurrences agrégées.	Nombre de CONDITION_OCCURRENCE dans cette ère.	INTEGER	Non

Champ CDM	Guide Utilisateur	Conventions ETL	Type	Requis	PK	FK	Table FK	Domaine FK
`drug_era_id`	Identifiant unique de l'ère médicamenteuse.	Clé primaire générée automatiquement.	INTEGER	Oui	PK
`person_id`	Référence au patient.	Lien vers PERSON.person_id.	INTEGER	Oui		FK	PERSON
`drug_concept_id`	Concept du principe actif.	Concept de l'ingrédient (pas du médicament commercial).	INTEGER	Oui		FK	CONCEPT	Drug
`drug_era_start_date`	Date de début de l'ère.	Premier jour d'exposition au médicament.	DATE	Oui
`drug_era_end_date`	Date de fin de l'ère.	Dernier jour d'exposition (incluant la durée de la dernière prescription).	DATE	Oui
`drug_exposure_count`	Nombre d'expositions agrégées.	Nombre de DRUG_EXPOSURE dans cette ère.	INTEGER	Non
`gap_days`	Jours de gap cumulés.	Total des jours sans traitement au sein de l'ère.	INTEGER	Non

Champ CDM	Guide Utilisateur	Conventions ETL	Type	Requis	PK	FK	Table FK	Domaine FK
`dose_era_id`	Identifiant unique de l'ère de dose.	Clé primaire générée automatiquement.	INTEGER	Oui	PK
`person_id`	Référence au patient.	Lien vers PERSON.person_id.	INTEGER	Oui		FK	PERSON
`drug_concept_id`	Concept du principe actif.	Concept de l'ingrédient.	INTEGER	Oui		FK	CONCEPT	Drug
`unit_concept_id`	Unité de la dose.	Concept d'unité (mg, g, UI, etc.).	INTEGER	Oui		FK	CONCEPT	Unit
`dose_value`	Valeur de la dose quotidienne.	Dose journalière pendant cette période.	FLOAT	Oui
`dose_era_start_date`	Date de début de l'ère de dose.	Premier jour à cette dose.	DATE	Oui
`dose_era_end_date`	Date de fin de l'ère de dose.	Dernier jour à cette dose.	DATE	Oui

Champ CDM	Guide Utilisateur	Conventions ETL	Type	Requis	FK	Table FK
`cohort_definition_id`	Référence à la définition de cohorte.	Lien vers COHORT_DEFINITION.cohort_definition_id.	INTEGER	Oui	FK	COHORT_DEFINITION
`subject_id`	Identifiant du sujet (patient).	Généralement person_id du patient.	INTEGER	Oui
`cohort_start_date`	Date d'entrée dans la cohorte.	Premier jour où le patient remplit les critères.	DATE	Oui
`cohort_end_date`	Date de sortie de la cohorte.	Dernier jour où le patient remplit les critères.	DATE	Oui

Champ CDM	Guide Utilisateur	Conventions ETL	Type	Requis	PK	FK	Table FK
`cohort_definition_id`	Identifiant unique de la définition.	Clé primaire de la définition de cohorte.	INTEGER	Oui	PK
`cohort_definition_name`	Nom de la cohorte.	Nom descriptif de la population étudiée.	VARCHAR(255)	Oui
`cohort_definition_description`	Description de la cohorte.	Explication détaillée des critères d'inclusion/exclusion.	TEXT	Non
`definition_type_concept_id`	Type de définition.	Concept indiquant le type de définition.	INTEGER	Oui		FK	CONCEPT
`cohort_definition_syntax`	Syntaxe de la définition.	Code ou requête définissant la cohorte (JSON ATLAS ou SQL).	TEXT	Non
`subject_concept_id`	Type de sujet.	Concept indiquant ce que représente le sujet (généralement Person).	INTEGER	Oui		FK	CONCEPT
`cohort_initiation_date`	Date de création de la cohorte.	Date à laquelle la cohorte a été définie.	DATE	Non

Champ CDM	Guide Utilisateur	Conventions ETL	Type	Requis	FK	Table FK
`cdm_source_name`	Nom de la source CDM.	Nom identifiant cette instance de données.	VARCHAR(255)	Oui
`cdm_source_abbreviation`	Abréviation de la source.	Code court pour la source (ex: APHP, CHRU).	VARCHAR(25)	Oui
`cdm_holder`	Organisation responsable.	Nom de l'organisation gérant les données.	VARCHAR(255)	Oui
`source_description`	Description de la source.	Description détaillée de l'origine des données.	TEXT	Non
`source_documentation_reference`	Référence documentation.	URL ou citation vers la documentation source.	VARCHAR(255)	Non
`cdm_etl_reference`	Référence ETL.	Documentation du processus ETL utilisé.	VARCHAR(255)	Non
`source_release_date`	Date de publication des données source.	Date de l'extraction des données source.	DATE	Oui
`cdm_release_date`	Date de création du CDM.	Date à laquelle cette version du CDM a été créée.	DATE	Oui
`cdm_version`	Version du CDM.	Version OMOP CDM utilisée (ex: v5.4).	VARCHAR(10)	Non
`cdm_version_concept_id`	Concept de la version CDM.	Concept représentant la version du CDM.	INTEGER	Oui	FK	CONCEPT
`vocabulary_version`	Version des vocabulaires.	Version des vocabulaires OHDSI utilisée.	VARCHAR(20)	Oui

Champ CDM	Guide Utilisateur	Conventions ETL	Type	Requis	PK	FK	Table FK
`metadata_id`	Identifiant unique de la métadonnée.	Clé primaire générée automatiquement.	INTEGER	Oui	PK
`metadata_concept_id`	Concept de la métadonnée.	Concept identifiant le type de métadonnée.	INTEGER	Oui		FK	CONCEPT
`metadata_type_concept_id`	Type de métadonnée.	Concept indiquant la nature de la métadonnée.	INTEGER	Oui		FK	CONCEPT
`name`	Nom de la métadonnée.	Clé identifiant la métadonnée.	VARCHAR(250)	Oui
`value_as_string`	Valeur textuelle.	Valeur de la métadonnée en texte.	VARCHAR(250)	Non
`value_as_concept_id`	Valeur comme concept.	Valeur de la métadonnée comme concept OMOP.	INTEGER	Non		FK	CONCEPT
`value_as_number`	Valeur numérique.	Valeur de la métadonnée en nombre.	FLOAT	Non
`metadata_date`	Date de la métadonnée.	Date associée à cette métadonnée.	DATE	Non
`metadata_datetime`	Date et heure de la métadonnée.	Horodatage de la métadonnée.	DATETIME	Non

4 - MIMIC

Description de la base

La base de données MIMIC, pour Medical Information Mart for Intensive Care, est une base de données nord-américaine contenant des données de plus de 50 000 patients admis en réanimation. Il s’agit de l’une des bases de données de réanimation les plus utilisées, du fait de son accès gratuit.

Malgré des données d’une qualité imparfaite, elle constitue un bon socle pour apprendre à manipuler les données issues d’entrepôts de données de santé (EDS).

Elle existe en plusieurs versions, dont la plus récente est la MIMIC-IV.

Données test (publiques)

La base de données MIMIC comporte pour les versions III et IV des bases tests, qui contiennent les données anonymisées de 100 patients et qui sont accessibles publiquement.

Vous pouvez télécharger les données ici :

MIMIC-III test : données avec le schéma de données MIMIC
MIMIC-IV OMOP test : données avec le schéma de données OMOP

Données complètes

Pour accéder aux bases de données complètes, il est nécessaire de valider quelques étapes.

Rendez-vous sur la page de la base MIMIC-III.

Vous verrez cet encadré tout en bas de la page :

This is a restricted-access resource. To access the files, you must fulfill all of the following requirements:

be a credentialed user
complete required training:

CITI Data or Specimens Only Research

here

sign the data use agreement for the project

Vous devez donc commencer par vous inscrire sur le site physionet.org.

Vous devrez faire une demande d’accès à Physionet, en renseignant quelques informations et en donnant les coordonnées d’un superviseur ou d’un collègue, à qui un mail sera envoyé.

Vous devrez ensuite compléter le CITI Course, il s’agit d’une formation nécessaire afin d’accéder aux données hébergées sur le site Physionet. Les différentes étapes sont détaillées ici.

Vous pourrez ensuite télécharger le certificat une fois le CITI Course terminé, vous pourrez le le déposer ici pour validation par l’équipe de Physionet.

Il ne vous restera plus qu’à signer le data use agreement.

Bases de données

1 - Qu'est-ce qu'une base de données ?

Principes de conception

Structurer les données en tables

Jointures

Requêter une base de données

Schémas de BDD

Conclusion

2 - Tutoriel OMOP

Niveau Facile : Les bases du modèle OMOP

Niveau Intermédiaire : Données cliniques

Niveau Expert : Requêtes avancées

3 - Schéma OMOP v5.4

PERSON

Description de la table

Guide utilisateur

Conventions ETL

OBSERVATION_PERIOD

Description de la table

Guide utilisateur

Conventions ETL

DEATH

Description de la table

Guide utilisateur

Conventions ETL

VISIT_OCCURRENCE

Description de la table

Guide utilisateur

Conventions ETL

VISIT_DETAIL

Description de la table

Guide utilisateur

Conventions ETL

CONDITION_OCCURRENCE

Description de la table

Guide utilisateur

Conventions ETL

DRUG_EXPOSURE

Description de la table

Guide utilisateur

Conventions ETL

PROCEDURE_OCCURRENCE

Description de la table

Guide utilisateur

Conventions ETL

DEVICE_EXPOSURE

Description de la table

Guide utilisateur

Conventions ETL

MEASUREMENT

Description de la table

Guide utilisateur

Conventions ETL

OBSERVATION

Description de la table

Guide utilisateur

Conventions ETL

NOTE

Description de la table

Guide Utilisateur

Conventions ETL

NOTE_NLP

Description de la table

Guide Utilisateur

Conventions ETL

EPISODE

Description de la table

Guide Utilisateur

Conventions ETL

EPISODE_EVENT

Description de la table

Guide Utilisateur

Conventions ETL

SPECIMEN

Description de la table

Guide Utilisateur

Conventions ETL

FACT_RELATIONSHIP

Description de la table

Guide Utilisateur