Détails du projet
Analyser le profil et les passages dans les établissements de santé des patients atteints d'un cancer pulmonaire afin d'en déduire les éléments qui caractérisent un décès précoce.
Lire notre article publié- Client
- Aire thérapeutique
- Expertise
- Client : CHI Créteil
- Aire thérapeutique : Oncologie
- Expertise : Analyse data
- CHI Créteil
- Oncologie
- Analyse Data
Contexte
Le cancer du poumon est le cancer le plus meurtrier en France. Le taux de survie à 5 ans après la pose du diagnostic avoisine seulement les 20%.
Dans le cadre d'un master de recherche en médecine, les pneumologues du CHIC ont sollicité Kaduceo pour détecter les facteurs aggravants de la maladie et prédire les patients ayant de fortes probabilité de décès précoces.
Caractéristiques des données
50000Patients inclus dans l'étudeJeu de données issu du SNDS pour les patients français diagnostiqués pour la première fois d'un cancer pulmonaire entre 2016 et 2019 exclus. Ce jeu de données a été enrichir de données environnementales.
Solution Kaduceo
En phase de démarrage du projet, Kaduceo a déterminé la pertinence des données à collecter, puis les a préparées (nettoyer, corriger). Les données ont également été enrichies afin de construire un jeu de données exploitable et pertinent.
Nous avons réalisé une première analyse descriptive des variables du dataset afin de déceler les facteurs aggravants. Une deuxième étude a permis de comparer le parcours des patients ayant reçu une chirurgie de ceux ayant été soignés par une chimiothérapie.
Puis, a succédé à ces analyses un travail de modélisation statistique pour prédire les patients avec un fort risque de décès précoce selon les informations collectées durant ses séjours hospitaliers.
Phase démarrage
- Accès aux données SNDS via le Centre de Recherche Clinique du CHI Créteil
- Sélection et collecte des données jugées pertinentes par l'expert data Kaduceo
- Nettoyage et préparation des datasets
Phase analyse
- Analyse standard des données
- Comparaison de parcours (chirurgie ou chimiothérapie)
- Modélisation statistique pour la prédiction
Méthode de travail
Application de notre méthode agile favorisant les échanges réguliers avev le Dr Goussault pour assurer le suivi du projet et résoudre rapidement d'éventuels points de blocage
Chiffres clefs
- 3 mois de collaboration
- + 1M de dossiers étudiés
- 1 intervention au Congrès SPLF 2021
- 1 article publié
Résultats & Limites de l'étude
Les études sur le cancer du poumon ne ciblent généralement qu'un seul établissement de santé et cette étude a permis de trouver des disparités entre les départements. Certaines variables telles qu'une première venue du patient par les urgences ou une extension du cancer dans les 3 mois ainsi que le type d'établissement au sein duquel est soigné le patient ont des effets sur le taux de survie à 3 mois.
Cependant les données des variables telles que la consommation de tabac, d'alcool ou des actes de chimiothérapie sont sous-représentés vis-à-vis de la réalité. La modélisation n'est donc pas assez précise pour être utilisée de manière fiable.