En résumé
Un projet d’alignement regroupe une source (base de données ou fichier importé) et l’ensemble des alignements faits depuis cette source. Cette page explique comment créer, organiser et naviguer entre vos projets.
Liste des projets
Chaque projet apparaît dans la liste sous forme de carte regroupant les informations clés :
- Nom — libellé court du projet (ici
Données de labo MIMIC-IV). - Source — base de données connectée ou fichier importé (icône feuille de calcul + nom de fichier).
- Badges — étiquettes colorées libres pour regrouper les projets (par hôpital, par équipe, par étude…). Un projet peut en porter plusieurs.
- Statut — pastille colorée :
En cours(bleu),En pause(ambre) ouTerminé(vert). - Progression — barre indiquant concepts alignés / total, avec le nombre approuvé en vert au-dessus.
Créer un projet
Cliquez sur Nouveau projet d’alignement en haut de la liste. Une boîte de dialogue s’ouvre :
Nouveau projet d'alignement
Créer un nouveau projet d'alignement à partir d'une base de données ou d'un fichier importé.
Utilisés dans d'autres projets
Glissez-déposez un fichier ou cliquez pour parcourir
CSV, TSV, Excel (.xlsx, .xls), Parquet
Vous y renseignez :
- Nom (obligatoire) et identifiant technique (
utilisé dans l’URL et les exports, pré-rempli automatiquement à partir du nom).slug - Description courte du périmètre.
- Statut initial — trois choix possibles, généralement En cours à la création :
- En cours — travail actif. La majorité des projets sont dans cet état.
- En pause — mis en attente (besoin de validation, de données, etc.).
- Terminé — alignement bouclé et exporté. À conserver pour la traçabilité.
- Badges — étiquettes colorées libres pour regrouper les projets (par hôpital, par équipe, par étude…). Choisissez une couleur, tapez un libellé, validez. Plusieurs badges possibles. Si d’autres projets du workspace utilisent déjà des badges, ils sont proposés en suggestion pour réutilisation.
- Type de source — bouton à deux options :
- Base de données source : sélectionnez une base déjà connectée à votre workspace (typiquement une table contenant les concepts à aligner).
- Import de fichier : déposez un fichier
.csv,.tsv,.txt,.xlsx,.xlsou.parquet. Une seconde page de paramètres apparaît automatiquement (voir ci-dessous).
Paramètres d’import (fichier uniquement)
Pour les sources fichier, une seconde page de la boîte de dialogue apparaît :
Paramètres d'import
Configurez le parsing du fichier et associez les colonnes aux champs de concepts.
Associez les colonnes du fichier aux champs concept. Au minimum le nom ou le code du concept est requis.
| # | itemid | label | fluid | category |
|---|---|---|---|---|
| 1 | 50808 | Free Calcium | Blood | Blood Gas |
| 2 | 50826 | Tidal Volume | Blood | Blood Gas |
| 3 | 50813 | Lactate | Blood | Blood Gas |
| 4 | 52029 | % Ionized Calcium | Blood | Blood Gas |
| 5 | 50801 | Alveolar-arterial Gradient | Blood | Blood Gas |
| 6 | 50810 | Hematocrit, Calculated | Blood | Blood Gas |
| 7 | 50820 | pH | Blood | Blood Gas |
| 8 | 50912 | Creatinine | Blood | Chemistry |
| 9 | 51221 | Hematocrit | Blood | Hematology |
| 10 | 51301 | White Blood Cells | Blood | Hematology |
Deux blocs à renseigner (un troisième, l’Aperçu, est calculé automatiquement par Linkr et permet de vérifier que le parsing est correct) :
Options de parsing
Linkr propose des valeurs par défaut adaptées à la majorité des fichiers ; ajustez si nécessaire :
- Séparateur — détection automatique par défaut. Forçable en virgule, point-virgule, tabulation ou pipe.
- Encodage — UTF-8 par défaut. ISO-8859-1 ou Windows-1252 disponibles pour les fichiers Excel/Windows anciens.
- Lignes à sauter — utile si le fichier contient des en-têtes décoratifs avant la vraie première ligne.
- Ligne d’en-tête — Oui si la première ligne contient les noms de colonnes (cas standard).
Correspondance des colonnes
Pour chaque colonne de votre fichier, indiquez à quoi elle correspond :
- Vocabulaire — nom de la terminologie source, généralement locale (par ex.
ICCApour les codes du logiciel de réanimation ICCA,Labspour le système de laboratoire…). Sert à filtrer ensuite par vocabulaire. - Catégorie — regroupement présent dans le système source (par ex. famille de paramètres biologiques, type de prescription, spécialité…) qui aide à mieux identifier les concepts et à découper le travail.
- Code concept * — code source du concept, par ex.
itemiddans MIMIC. - Source concept ID — identifiant numérique correspondant au
source_concept_idutilisé dans l’ETL OMOP (tablesource_to_concept_map). Renseignez-le si votre fichier en contient déjà un ; sinon Linkr peut en générer un automatiquement dans la plage OMOP custom (voir Vue d’ensemble). - Nom du concept * — libellé du concept, par ex.
labeldans MIMIC. - Nombre d’enregistrements / Nombre de patients — fréquences observées dans la base source. Très utile pour prioriser les concepts les plus fréquents.
- Info (JSON) — colonne contenant des métadonnées JSON (distributions, statistiques) qui s’afficheront dans le panneau de détail. La structure attendue est détaillée sur la page Éditeur d’alignements.
- Colonnes supplémentaires — toutes les autres colonnes que vous voulez conserver comme métadonnées libres.
* obligatoires.
Détection automatique
Linkr essaie de pré-remplir les champs en se basant sur les noms d’en-tête (par ex. concept_name, code, vocabulary_id…). Vérifiez et corrigez avant de valider.
Import / export ZIP
Deux actions, à deux emplacements différents :
- Importer — bouton au-dessus de la liste, pour charger un fichier ZIP Linkr (typiquement un projet exporté depuis une autre instance ou partagé par un collègue).
- Exporter — au niveau de chaque carte projet, via l’icône
…en haut à droite.
Le format ZIP est détaillé dans la page Export — il contient le JSON du projet, tous les alignements, les fichiers SSSOM/STCM/Usagi pré-générés, et le fichier source d’origine. Il est ré-importable tel quel.
Conflits à l'import
Si le projet importé a le même identifiant qu’un projet existant, Linkr propose deux options : écraser ou dupliquer (générer un nouvel identifiant interne et garder les deux).