Datathon InterHop 2024 - Prédiction de la mortalité

Introduction

A l’heure actuelle, la majorité des études comparent la mortalité de groupes de patient à l’aide de scores de gravité tels que l’IGS-2 (très ancien) et le SOFA (plus récent).

L’apport du machine learning permet d’avoir des modèles de prédiction de mortalité avec de meilleures performances, ce qui a déjà été démontré dans de nombreuses études.

Ce sujet n’a donc rien de nouveau. Cependant, il n’y a pas à l’heure actuel de code OMOP partagé permettant d’appliquer ce modèle sur des données locales.

De plus, la validité externe des modèles peut poser problème : peut-être qu’entraîner les modèles localement, pour être appliqués localement, est une solution pour limiter ce problème de validité externe.

L’idée est donc ici de recréer cette étude de façon totalement interopérable, à la fois en utilisant le modèle de données OMOP et en créant ce projet sur la plateforme LinkR, qui facilite le partage des projets.

Ainsi, il sera plus facile d’entraîner ces algorithmes sur des données locales, en ayant un code interopérable.

Matériel et méthodes

Le set de données utilisé sera la base de données MIMIC OMOP.

L’outcome est la mortalité des patients admis en réanimation.

Les paramètres utilisés pour les modèles de prédiction seront les variables utilisées dans les scores SOFA et IGS-2, récupérés durant les 24 premières heures suivant l’admission en réanimation.

Les algorithmes utilisés seront :

  • Régression logistique
  • Random forest
  • XGB
  • Support vector machine
  • Réseaux de neurones

Les résultats seront comparés aux prédictions données par les scores SOFA et IGS-2.

Conclusion

Développer des modèles de prédiction de la mortalité avec un code interopérable permettrait d’entraîner ces algorithmes localement dans différents centres plus facilement.

Dernière modification 14.10.2024: Update README #5 (40becc8)