Voir le résumé
Titre : Codage automatisé : proposition d’une méthode utilisant une ontologie médicale construite par fouille de textes.Résumé : Le codage automatisé est devenu un enjeu médico-économique majeur.Deux étapes clés peuvent être individualisées parmi les méthodes proposées dans la littérature : une première consiste à fabriquer une terminologie médicale, une seconde à construire une ontologie agrégeant ces termes en concepts par la formalisation de liens logiques. Chacune de ces étapes peut être réalisée à dire d’expert et/ou par fouille de textes. Nous proposons une méthode entièrement automatisée pour réaliser ces deux étapes, l’ontologie finalement obtenue devant permettre de formaliser une relation simple entre des expressions et le codage selon la 10è Classification Internationale des Maladies (CIM-10).Méthodes : Nous utilisons des courriers hospitaliers en français (texte libre) issus de 8610 séjours pour lesquels nous disposons également du codage des diagnostics selon la CIM-10. Nous retenons 201 codes différents (codes présents plus de 30 fois). Tout d’abord, nous construisons une terminologie médicale par la recherche de motifs séquentiels au sein des courriers puis un filtre est appliqué. Ensuite nous réalisons, pour chaque code, une étape de sélection des expressions clés par fouille statistique de données. Nous fixons deux seuils de significativité permettant d’identifier d’une part les synonymes du libellé du code décrit et d’autre part les expressions appartenant à la symptomatologie de la pathologie ainsi codée.Résultats : Nous obtenons une terminologie comprenant plus de 60 000 expressions médicales. L’étape de fouille statistique de données associe à chaque code 14 synonymes et 45 symptômes (valeurs médianes). Nous disposons notamment des variants orthographiques couramment utilisés dans les courriers hospitaliers.Discussion/Conclusion : L’ontologie ainsi obtenue et son intérêt dans la construction de règles de prédiction du codage sont évaluées. La généralisation à davantage de diagnostics requiert l’utilisation d’un nombre plus élevé de séjours hospitaliers. Notre méthode n’est dépendante ni de la langue ni de la classification utilisées.Intervenant : FICHEUR Grégoire (CHRU de Lille, service d’information et des archives médicales, EA2694, Lille, France).Conférence enregistrée lors des journées EMOIS 2011 à Nancy. Session : systèmes d’informations. Modérateurs : Régis BEUSCART (CHRU de Lille, service d’information et des archives médicales, EA2694, Lille, France) , Sandra GOMEZ (ATIH - Lyon).Réalisation, production : Canalu U/3S, CERIMES.SCD Médecine.
Mot(s) clés libre(s) : codage automatisé, EMOIS Nancy 2011, fouille de données, ontologie médicale, terminologie médicale