Voir le résumé
Titre : Comment choisir un algorithme d’identification de cas de cancers incidents dans le Programme de Médicalisation des Systèmes d’Information (PMSI) ? Une analyse formelle des concepts sur les données du PMSI et du registre du cancer du sein de l’Isère.Résumé : L’utilisation du PMSI pour l’estimation de l’incidence des cancers se heurte à l’imperfection des critères de sélection (algorithmes) des cas, construits de façon empirique parmi les milliers de codes de diagnostics ou d’actes disponibles. Les méthodes d’extraction de connaissances à partir de données (ECD), qui réalisent une exploitation automatique ou semi-automatique de bases de données volumineuses, peuvent permettre de comparer tous les algorithmes se présentant sous la forme d’une conjonction d’attributs.Objectif : Découvrir le ou les algorithme(s) ayant les meilleures qualités (sensibilité, spécificité et valeurs prédictives) pour identifier les cas de cancer du sein incidents parmi les séjours du PMSI.Méthode : Les courts séjours du PMSI de 2001 comprenant un diagnostic de cancer du sein ont été croisés avec les données du registre du cancer de l’Isère qui constituait le gold standard pour identifier les cas de cancer du sein incidents. Une analyse formelle des concepts a permis de calculer la sensibilité, la spécificité et les valeurs prédictives de tous les algorithmes possibles, construits avec les codes de diagnostics et d’actes, l’âge, les établissements et les dates de sortie des séjours.Résultats : Le registre a identifié 825 patientes avec un cancer du sein incident. Le PMSI a identifié 1693 patientes ayant au moins un séjour avec cancer du sein, dont 645 étaient dans le registre. Les algorithmes les plus sensibles recherchaient un diagnostic principal de cancer du sein ou un acte d’anesthésie. Les algorithmes ayant les meilleures valeurs prédictives positives (VPP) associaient mastectomie, curage ganglionnaire, anesthésie générale, passage en salle de réveil et diagnostic principal de cancer du sein. Les diagnostics de tumeurs secondaires correspondaient aux plus basses VPP.Conclusion : Les méthodes d’ECD ont permis de traiter automatiquement tous les algorithmes possibles. Ces résultats permettent de proposer des algorithmes ciblés en fonction de l’objectif recherché (sensibilité, spécifique ou valeur prédictive).Intervenant : GOETZ Christophe (Laboratoire SPI-EAO, Faculté de médecine de Nancy, Vandoeuvre-les-Nancy, France).Conférence enregistrée lors des journées EMOIS 2011 à Nancy. Session : PMSI et épidémiologie II. Modérateurs Eliane ALBUISSON (CHU de Nancy) et Gilles CHATELIER (Association Robert Debré – Paris).Réalisation, production : Canalu U/3S, CERIMES
Mot(s) clés libre(s) : algorithmes, cancer du sein, ECD, EMOIS Nancy 2011, fouille de données, PMSI, valeurs prédictives positives, VPP