Votre premier projet

De la création d'un workspace à un premier dataset analysable : un parcours de bout en bout.

En résumé

Ce guide vous fait parcourir Linkr de bout en bout : workspace, projet, import d’une base OMOP, construction d’une cohorte, création d’un dataset analytique puis d’un dashboard. Comptez 15 à 20 minutes avec un jeu de données de démonstration.

Client Backend

Avant de commencer

Vérifiez que vous avez une instance Linkr accessible, soit en ligne soit en local. Voir le démarrage rapide ou l’installation locale.

Pour ce parcours, nous utiliserons le jeu de données MIMIC-IV demo OMOP (100 patients, format OMOP CDM v5.4) qui est chargé automatiquement au premier démarrage de l’application — vous n’avez rien à importer.

Et pour se connecter à un vrai entrepôt hospitalier ?

Le mode client-only travaille sur des fichiers locaux (extractions, jeux de démonstration). Pour interroger directement un entrepôt en base relationnelle (PostgreSQL, SQL Server, Oracle…), il faut le mode full-stack, en cours de développement. Voir Modes de déploiement.

Format long vs format large

Une base OMOP est au format long : une ligne par événement clinique (une mesure, un diagnostic, une prescription…). C’est l’inverse d’un tableur Excel, qui est au format large (une ligne par patient). Linkr permet justement de passer du long au large sans écrire de SQL. Pour aller plus loin sur cette distinction, voir Organisation des données — format long vs format large.

Parcours guidé

Les deux premières étapes (création d’un workspace et d’un projet) sont décrites dans le démarrage rapide. Ce guide reprend le fil à partir de l’exploration des données.

Ouvrir la base de démonstration

Au premier démarrage, Linkr charge automatiquement le jeu MIMIC-IV demo OMOP (100 patients) en arrière-plan. Vous le retrouvez dans Entrepôt de données → Bases de données, marqué comme actif (utilisé par défaut sur toutes les pages du warehouse du projet).

linkr-v2-b1800b.frama.io

Bases de données

MIMIC-IV Demo (OMOP)

DuckDB / OMOP CDM 5.4

Connectée

31 fichiers Parquet

100 patients852 séjours31 tables

Active

La base MIMIC-IV demo apparaît directement comme base active.

Explorer les concepts OMOP

Dans Entrepôt de données → Concepts, parcourez les concepts présents dans la base, triés par domaine (Condition, Drug, Measurement…). Cliquez sur un concept pour voir ses statistiques (nombre de patients, distribution…). C'est utile pour repérer les codes qu'on va utiliser dans la cohorte.

linkr-v2-b1800b.frama.io

Concepts

Rechercher un concept…

Concept ID	Concept Name	Concept Code	Standard Concept	Enregistrements	Patients
3013682	Lactate [Moles/volume] in Blood	32693-4	Oui	1,842	78
3016723	Creatinine [Mass/volume] in Serum or Plasma	2160-0	Oui	2,184	96
3000963	Hemoglobin [Mass/volume] in Blood	718-7	Oui	1,576	92
132797	Sepsis	91302008	Oui	312	41
201826	Type 2 diabetes mellitus	44054006	Oui	268	34
1321341	Norepinephrine	7512	Oui	487	52

Sélectionnez un concept pour voir ses statistiques dans le panneau de droite.

Construire une cohorte

Dans Entrepôt de données → Cohortes, créez une nouvelle cohorte en empilant des critères (âge, sexe, concepts, période, durée de séjour…) dans une arborescence logique (ET, OU, SAUF). Linkr génère automatiquement le SQL correspondant, que vous pouvez inspecter et copier. Exemple : patients adultes (âge ≥ 18) avec un diagnostic de sepsis hospitalisés entre 2015 et 2020.

linkr-v2-b1800b.frama.io

Cohortes

Cohorte sepsis — adultes

Âgeà l'admission entre 18 et 90 ans

SexeHommes, Femmes

PériodeAdmissions entre 2015 et 2020

ConceptDiagnostic : Sepsis (SNOMED 91302008)

Empilez les critères dans une arborescence logique. Linkr génère le SQL en temps réel.

Explorer un jeu de données

Dans Laboratoire → Jeux de données, vous pouvez analyser des données au format large (une ligne par patient, une colonne par variable) — le format auquel les cliniciens et statisticiens sont habitués.

patient_id	age	sex	sofa_score	length_of_stay	mortality
P-0001	67	M	8	4.2	Vivant
P-0002	54	F	12	9.7	Décédé
P-0003	71	M	5	2.1	Vivant
P-0004	49	F	7	6.4	Vivant
P-0005	82	M	11	14.3	Décédé
P-0006	35	F	3	1.8	Vivant

Visualisez la distribution de chaque colonne, repérez les valeurs manquantes et explorez vos jeux de données en quelques clics.

Du format long au format large : où Linkr crée le lien

Aujourd’hui, le passage du format long (entrepôt OMOP) au format large (un patient par ligne) ne se fait pas encore via l’interface graphique : il faut écrire le code de transformation dans l’IDE intégré (Python ou R, sur le jeu de données chargé). C’est précisément là que Linkr crée le lien : la même application réunit, côte à côte, les outils low-code des cliniciens et l’environnement de programmation des data scientists. Chacun travaille à son niveau d’abstraction, sur le même projet, avec les mêmes données — et combine les forces des deux mondes au service des données de santé.

Lancer une analyse, construire un tableau de bord

Sur votre jeu de données, déclenchez des analyses built-in (Table 1, Key Indicator, Plot Builder) sans écrire de code, puis composez un tableau de bord à partir des widgets obtenus. Le tableau de bord est sauvegardé automatiquement dans le projet.

Table 1 — caractéristiques de la cohorte

Variable	Total (n=400)	Survivants (n=312)	Décédés (n=88)	p
Âge (années)	63.4 ± 16.8	61.2 ± 16.1	71.5 ± 15.4	<0.001
Sexe — Hommes (%)	54.5	53.8	57.0	0.62
Score SOFA	6.8 ± 3.2	5.9 ± 2.7	10.1 ± 3.5	<0.001
Durée de séjour (j)	5.3 (2.1–9.7)	4.6 (1.9–8.4)	8.1 (3.2–14.6)	<0.001

Décrivez votre cohorte avec une Table 1, sans écrire une ligne de code.

Sauvegarder le projet

Dans Versioning → Export, téléchargez le projet sous forme d'archive ZIP. Le ZIP suit une structure canonique (scripts/, cohorts/, datasets/, etc.) et reste réimportable dans une autre instance Linkr. Le versioning Git distant sera disponible en mode full-stack, dans une future version.

linkr-v2-b1800b.frama.io

Export

Télécharger votre projet sous forme d'archive ZIP avec une arborescence compatible git.

Inclure les fichiers de données (datasets CSV)

Les fichiers de données sont exclus par défaut par sécurité. Activez cette option uniquement si vous devez partager le contenu des jeux de données.

Cliquez sur « Télécharger ZIP » pour récupérer une archive complète du projet.

Récapitulatif

En six étapes, vous avez :

Ouvert la base de démonstration MIMIC-IV chargée automatiquement.
Exploré les concepts de la base.
Construit une cohorte visuelle avec SQL généré.
Exploré un jeu de données au format large.
Lancé une analyse et assemblé un tableau de bord.
Sauvegardé le tout via l’export ZIP.

Vous n’avez écrit aucune ligne de code. Si vous êtes à l’aise avec Python ou R, vous pouvez aller plus loin dans l’IDE intégré (page IDE du projet) pour écrire des analyses sur-mesure directement sur le jeu de données.

Pour aller plus loin

Comprendre l’organisation Data Warehouse → Pipeline → Lab — voir la section « Concepts » (à venir).
Parcourir la section Projects (à venir) pour un tour détaillé de chaque page.
Revenir sur les modes de déploiement si vous envisagez une instance partagée.