Kaduceo logo

Détails du projet

Analyser le profil et les passages dans les établissements de santé des patients atteints d'un cancer pulmonaire afin d'en déduire les éléments qui caractérisent un décès précoce.

Lire notre article publié
  • Client
  • Aire thérapeutique
  • Expertise
  • Client : CHI Créteil
  • Aire thérapeutique : Oncologie
  • Expertise : Analyse data
  • CHI Créteil
  • Oncologie
  • Analyse Data

Contexte

Le cancer du poumon est le cancer le plus meurtrier en France. Le taux de survie à 5 ans après la pose du diagnostic avoisine seulement les 20%.

Dans le cadre d'un master de recherche en médecine, les pneumologues du CHIC ont sollicité Kaduceo pour détecter les facteurs aggravants de la maladie et prédire les patients ayant de fortes probabilité de décès précoces.

Caractéristiques des données

50000Patients inclus dans l'étude

Jeu de données issu du SNDS pour les patients français diagnostiqués pour la première fois d'un cancer pulmonaire entre 2016 et 2019 exclus. Ce jeu de données a été enrichir de données environnementales.

Solution Kaduceo

En phase de démarrage du projet, Kaduceo a déterminé la pertinence des données à collecter, puis les a préparées (nettoyer, corriger). Les données ont également été enrichies afin de construire un jeu de données exploitable et pertinent.

Nous avons réalisé une première analyse descriptive des variables du dataset afin de déceler les facteurs aggravants. Une deuxième étude a permis de comparer le parcours des patients ayant reçu une chirurgie de ceux ayant été soignés par une chimiothérapie.

Puis, a succédé à ces analyses un travail de modélisation statistique pour prédire les patients avec un fort risque de décès précoce selon les informations collectées durant ses séjours hospitaliers.

Phase démarrage

  • Accès aux données SNDS via le Centre de Recherche Clinique du CHI Créteil
  • Sélection et collecte des données jugées pertinentes par l'expert data Kaduceo
  • Nettoyage et préparation des datasets

Phase analyse

  • Analyse standard des données
  • Comparaison de parcours (chirurgie ou chimiothérapie)
  • Modélisation statistique pour la prédiction
J'ai eu la chance de pouvoir travailler avec l'équipe de Kaduceo pour mon mémoire de master 2. Ils m'ont apporté une aide précieuse pour l'extraction, la mise en forme et l'analyse de mes données. Ils m'ont guidée pour exploiter au mieux les données disponibles. Malgré les conditions de travail liée à la pandémie, leur disponibilité n'a pas été impactée avec des réunions hebdomadaires et des échanges très réguliers par courrier électronique pour répondre à mes questions et affiner la méthodologie statistique. Je n'hésiterai pas à renouveler cette collaboration pour mes futurs travaux. Dr Hélène Goussault Pneumologue - CHI Créteil

Méthode de travail

Application de notre méthode agile favorisant les échanges réguliers avev le Dr Goussault pour assurer le suivi du projet et résoudre rapidement d'éventuels points de blocage

Chiffres clefs

Résultats & Limites de l'étude

Les études sur le cancer du poumon ne ciblent généralement qu'un seul établissement de santé et cette étude a permis de trouver des disparités entre les départements. Certaines variables telles qu'une première venue du patient par les urgences ou une extension du cancer dans les 3 mois ainsi que le type d'établissement au sein duquel est soigné le patient ont des effets sur le taux de survie à 3 mois.

Cependant les données des variables telles que la consommation de tabac, d'alcool ou des actes de chimiothérapie sont sous-représentés vis-à-vis de la réalité. La modélisation n'est donc pas assez précise pour être utilisée de manière fiable.