En résumé
Ce guide vous fait parcourir Linkr de bout en bout : workspace, projet, import d’une base OMOP, construction d’une cohorte, création d’un dataset analytique puis d’un dashboard. Comptez 15 à 20 minutes avec un jeu de données de démonstration.
Client-only
Tout ce parcours fonctionne dans le navigateur seul.Avant de commencer
Vérifiez que vous avez une instance Linkr accessible, soit en ligne soit en local. Voir le démarrage rapide ou l’installation locale.
Pour ce parcours, nous utiliserons le jeu de données MIMIC-IV demo OMOP (100 patients, format OMOP CDM v5.4) qui est chargé automatiquement au premier démarrage de l’application — vous n’avez rien à importer.
Et pour se connecter à un vrai entrepôt hospitalier ?
Le mode client-only travaille sur des fichiers locaux (extractions, jeux de démonstration). Pour interroger directement un entrepôt en base relationnelle (PostgreSQL, SQL Server, Oracle…), il faut le mode full-stack, en cours de développement. Voir Modes de déploiement.
Format long vs format large
Une base OMOP est au format long : une ligne par événement clinique (une mesure, un diagnostic, une prescription…). C’est l’inverse d’un tableur Excel, qui est au format large (une ligne par patient). Linkr permet justement de passer du long au large sans écrire de SQL. Pour aller plus loin sur cette distinction, voir Organisation des données — format long vs format large.
Parcours guidé
Les deux premières étapes (création d’un workspace et d’un projet) sont décrites dans le démarrage rapide. Ce guide reprend le fil à partir de l’exploration des données.
Ouvrir la base de démonstration
Au premier démarrage, Linkr charge automatiquement le jeu MIMIC-IV demo OMOP (100 patients) en arrière-plan. Vous le retrouvez dans Entrepôt de données → Bases de données, marqué comme actif (utilisé par défaut sur toutes les pages du warehouse du projet).
MIMIC-IV Demo (OMOP)
DuckDB / OMOP CDM 5.4
31 fichiers Parquet
Explorer les concepts OMOP
Dans Entrepôt de données → Concepts, parcourez les concepts présents dans la base, triés par domaine (Condition, Drug, Measurement…). Cliquez sur un concept pour voir ses statistiques (nombre de patients, distribution…). C'est utile pour repérer les codes qu'on va utiliser dans la cohorte.
| Concept ID | Concept Name | Concept Code | Standard Concept | Enregistrements | Patients |
|---|---|---|---|---|---|
| 3013682 | Lactate [Moles/volume] in Blood | 32693-4 | Oui | 1,842 | 78 |
| 3016723 | Creatinine [Mass/volume] in Serum or Plasma | 2160-0 | Oui | 2,184 | 96 |
| 3000963 | Hemoglobin [Mass/volume] in Blood | 718-7 | Oui | 1,576 | 92 |
| 132797 | Sepsis | 91302008 | Oui | 312 | 41 |
| 201826 | Type 2 diabetes mellitus | 44054006 | Oui | 268 | 34 |
| 1321341 | Norepinephrine | 7512 | Oui | 487 | 52 |
Construire une cohorte
Dans Entrepôt de données → Cohortes, créez une nouvelle cohorte en empilant des critères (âge, sexe, concepts, période, durée de séjour…) dans une arborescence logique (ET, OU, SAUF). Linkr génère automatiquement le SQL correspondant, que vous pouvez inspecter et copier. Exemple : patients adultes (âge ≥ 18) avec un diagnostic de sepsis hospitalisés entre 2015 et 2020.
Explorer un jeu de données
Dans Laboratoire → Jeux de données, vous pouvez analyser des données au format large (une ligne par patient, une colonne par variable) — le format auquel les cliniciens et statisticiens sont habitués.
| patient_id | age | sex | sofa_score | length_of_stay | mortality |
|---|---|---|---|---|---|
| P-0001 | 67 | M | 8 | 4.2 | Vivant |
| P-0002 | 54 | F | 12 | 9.7 | Décédé |
| P-0003 | 71 | M | 5 | 2.1 | Vivant |
| P-0004 | 49 | F | 7 | 6.4 | Vivant |
| P-0005 | 82 | M | 11 | 14.3 | Décédé |
| P-0006 | 35 | F | 3 | 1.8 | Vivant |
Visualisez la distribution de chaque colonne, repérez les valeurs manquantes et explorez vos jeux de données en quelques clics.
Du format long au format large : où Linkr crée le lien
Aujourd’hui, le passage du format long (entrepôt OMOP) au format large (un patient par ligne) ne se fait pas encore via l’interface graphique : il faut écrire le code de transformation dans l’IDE intégré (Python ou R, sur le jeu de données chargé). C’est précisément là que Linkr crée le lien : la même application réunit, côte à côte, les outils low-code des cliniciens et l’environnement de programmation des data scientists. Chacun travaille à son niveau d’abstraction, sur le même projet, avec les mêmes données — et combine les forces des deux mondes au service des données de santé.
Lancer une analyse, construire un tableau de bord
Sur votre jeu de données, déclenchez des analyses built-in (Table 1, Key Indicator, Plot Builder) sans écrire de code, puis composez un tableau de bord à partir des widgets obtenus. Le tableau de bord est sauvegardé automatiquement dans le projet.
Table 1 — caractéristiques de la cohorte
| Variable | Total (n=400) | Survivants (n=312) | Décédés (n=88) | p |
|---|---|---|---|---|
| Âge (années) | 63.4 ± 16.8 | 61.2 ± 16.1 | 71.5 ± 15.4 | <0.001 |
| Sexe — Hommes (%) | 54.5 | 53.8 | 57.0 | 0.62 |
| Score SOFA | 6.8 ± 3.2 | 5.9 ± 2.7 | 10.1 ± 3.5 | <0.001 |
| Durée de séjour (j) | 5.3 (2.1–9.7) | 4.6 (1.9–8.4) | 8.1 (3.2–14.6) | <0.001 |
Décrivez votre cohorte avec une Table 1, sans écrire une ligne de code.
Sauvegarder le projet
Dans Versioning → Export, téléchargez le projet sous forme d'archive ZIP. Le ZIP suit une structure canonique (scripts/, cohorts/, datasets/, etc.) et reste réimportable dans une autre instance Linkr. Le versioning Git distant sera disponible en mode full-stack, dans une future version.
Export
Télécharger votre projet sous forme d'archive ZIP avec une arborescence compatible git.
Les fichiers de données sont exclus par défaut par sécurité. Activez cette option uniquement si vous devez partager le contenu des jeux de données.
Récapitulatif
En six étapes, vous avez :
- Ouvert la base de démonstration MIMIC-IV chargée automatiquement.
- Exploré les concepts de la base.
- Construit une cohorte visuelle avec SQL généré.
- Exploré un jeu de données au format large.
- Lancé une analyse et assemblé un tableau de bord.
- Sauvegardé le tout via l’export ZIP.
Vous n’avez écrit aucune ligne de code. Si vous êtes à l’aise avec Python ou R, vous pouvez aller plus loin dans l’IDE intégré (page IDE du projet) pour écrire des analyses sur-mesure directement sur le jeu de données.
Pour aller plus loin
- Comprendre l’organisation Data Warehouse → Pipeline → Lab — voir la section « Concepts » (à venir).
- Parcourir la section Projects (à venir) pour un tour détaillé de chaque page.
- Revenir sur les modes de déploiement si vous envisagez une instance partagée.