|
|<
<< Page précédente
1
2
3
4
Page suivante >>
>|
|
documents par page
|
Tri :
Date
Editeur
Auteur
Titre
|
|
08c - Vers un modèle de détection des affects, appréciations et jugements dans le cadre d’interactions humain-agent (Article RECITAL) (taln2015)
/ Canal-u.fr
Voir le résumé
Voir le résumé
Sessions orales TALN 2015 – Mardi 23 juin 2015Session Opinions et sentimentsVers un modèle de détection des affects, appréciations et jugements dans le cadre d’interactions humain-agent (Article RECITAL)
Caroline LangletRésumé : Cet
article aborde la question de la détection des expressions d’attitude —
affect, d’appréciation et de jugement (Martin and White, 2005)– dans le
contenu verbal de l’utilisateur au cours d’interactions en face-à-face
avec un agent conversationnel animé. Il propose un positionnement en
terme de modèles et de méthodes pour le développement d’un système de
détection adapté aux buts communicationnels de l’agent et à une parole
conversationnelle. Après une description du modèle théorique de
référence choisi, l’article propose un modèle d’annotation des attitudes
dédié l’exploration de ce phénomène dans un corpus d’interaction
humain-agent. Il présente ensuite une première version de notre système.
Cette première version se concentre sur la détection des expressions
d’attitudes pouvant référer à ce qu’aime ou n’aime pas l’utilisateur. Le
système est conçu selon une approche symbolique fondée sur un ensemble
de règles sémantiques et de représentations logico-sémantiques des
énoncés. Mot(s) clés libre(s) : traitement automatique du langage naturel, taln2015
|
Accéder à la ressource
|
|
08b - Une méthodologie de sémantique de corpus appliquée à des tâches de fouille d’opinion et d’analyse des sentiments : étude sur l’impact de marqueurs dialogiques et dialectiques dans l’expression de la subjectivité (taln2015)
/ Canal-u.fr
Voir le résumé
Voir le résumé
Sessions orales TALN 2015 – Mardi 23 juin 2015Session Opinions et sentimentsUne méthodologie de sémantique de corpus appliquée à des
tâches de fouille d’opinion et d’analyse des sentiments : étude sur
l’impact de marqueurs dialogiques et dialectiques dans l’expression de
la subjectivité
9h30-10h00 | Cacher le résumé
Résumé : Cet
article entend dresser, dans un premier temps, un panorama critique des
relations entre TAL et linguistique. Puis, il esquisse une discussion
sur l’apport possible d’une sémantique de corpus dans un contexte
applicatif en s’appuyant sur plusieurs études en fouille de textes
subjectifs (analyse de sentiments et fouille d’opinions). Ces études se
démarquent des approches traditionnelles fondées sur la recherche de
marqueurs axiologiques explicites par l’utilisation de critères relevant
des représentations des acteurs (composante dialogique) et des
structures argumentatives et narratives des textes (composante
dialectique). Nous souhaitons de cette façon mettre en lumière le
bénéfice d’un dialogue méthodologique entre une théorie (la sémantique
textuelle), des méthodes de linguistique de corpus orientées vers
l’analyse du sens (la textométrie) et les usages actuels du TAL en
termes d’algorithmiques (apprentissage automatique) mais aussi de
méthodologie d’évaluation des résultats. Mot(s) clés libre(s) : traitement automatique du langage naturel, taln2015
|
Accéder à la ressource
|
|
08a - Méthode faiblement supervisée pour l’extraction d’opinion ciblée dans un domaine spécifique (taln2015)
/ Canal-u.fr
Voir le résumé
Voir le résumé
Sessions orales TALN 2015 – Mardi 23 juin 2015Session Opinions et sentimentsMéthode faiblement supervisée pour l’extraction d’opinion ciblée dans un domaine spécifique
Romaric Besançon
Résumé : La
détection d’opinion ciblée a pour but d’attribuer une opinion à une
caractéristique particulière d’un produit donné. La plupart des méthodes
existantes envisagent pour cela une approche non supervisée. Or, les
utilisateurs ont souvent une idée a priori des caractéristiques sur
lesquelles ils veulent découvrir l’opinion des gens. Nous proposons dans
cet article une méthode pour une extraction d’opinion ciblée, qui
exploite cette information minimale sur les caractéristiques d’intérêt.
Ce modèle s’appuie sur une segmentation automatique des textes, un
enrichissement des données disponibles par similarité sémantique, et une
annotation de l’opinion par classification supervisée. Nous montrons
l’intérêt de l’approche sur un cas d’étude dans le domaine des jeux
vidéos. Mot(s) clés libre(s) : traitement automatique du langage naturel, taln2015
|
Accéder à la ressource
|
|
07c - Analyse d’expressions temporelles dans les dossiers électroniques patients (taln2015)
/ Canal-u.fr
Voir le résumé
Voir le résumé
Sessions orales TALN 2015 – Mardi 23 juin 2015Session Compréhension et paraphraseAnalyse d’expressions temporelles dans les dossiers électroniques patients
Mike Donald Tapi Nzali, Aurélie Névéol et Xavier Tannier
Résumé : Les
références à des phénomènes du monde réel et à leur caractérisation
temporelle se retrouvent dans beaucoup de types de discours en langue
naturelle. Ainsi, l’analyse temporelle apparaît comme un élément
important en traitement automatique de la langue. Cet article présente
une analyse de textes en domaine de spécialité du point de vue temporel.
En s’appuyant sur un corpus de documents issus de plusieurs dossiers
électroniques patient désidentifiés, nous décrivons la construction
d’une ressource annotée en expressions temporelles selon la norme
TimeML. Par suite, nous utilisons cette ressource pour évaluer plusieurs
méthodes d’extraction automatique d’expressions temporelles adaptées au
domaine médical. Notre meilleur système statistique offre une
performance de 0,91 de F-mesure, surpassant pour l’identification le
système état de l’art HeidelTime. La comparaison de notre corpus de
travail avec le corpus journalistique FR-Timebank permet également de
caractériser les différences d’utilisation des expressions temporelles
dans deux domaines de spécialité. Mot(s) clés libre(s) : traitement automatique du langage naturel, taln2015
|
Accéder à la ressource
|
|
07a - Compréhension automatique de la parole sans données de référence (taln2015)
/ Canal-u.fr
Voir le résumé
Voir le résumé
Sessions orales TALN 2015 – Mardi 23 juin 2015Session Compréhension et paraphrase
Compréhension automatique de la parole sans données de référence
Emmanuel Ferreira, Bassam Jabaian et Fabrice Lefèvre
Résumé : La
majorité des méthodes état de l’art en compréhension automatique de la
parole ont en commun de devoir être apprises sur une grande quantité de
données annotées. Cette dépendance aux données constitue un réel
obstacle lors du développement d’un système pour une nouvelle
tâche/langue. Aussi, dans cette étude, nous présentons une méthode
visant à limiter ce besoin par un mécanisme d’apprentissage sans données
de référence (zero-shot learning). Cette méthode combine une
description ontologique minimale de la tâche visée avec l’utilisation
d’un espace sémantique continu appris par des approches à base de
réseaux de neurones à partir de données génériques non-annotées. Nous
montrons que le modèle simple et peu coûteux obtenu peut atteindre dès
le démarrage des performances comparables à celles des systèmes état de
l’art reposant sur des règles expertes ou sur des approches
probabilistes sur des tâches de compréhension de la parole de référence
(tests des Dialog State Tracking Challenges, DSTC2 et DSTC3). Nous
proposons ensuite une stratégie d’adaptation en ligne permettant
d’améliorer encore les performances de notre approche à l’aide d’une
supervision faible et ajustable de l’utilisateur. Mot(s) clés libre(s) : traitement automatique du langage naturel, taln2015
|
Accéder à la ressource
|
|
06c - Mesurer la similarité entre phrases grâce à Wikipédia en utilisant une indexation aléatoire (taln2015)
/ Canal-u.fr
Voir le résumé
Voir le résumé
Sessions orales TALN 2015 – Mardi 23 juin 2015Session Classification et AlignementMesurer la similarité entre phrases grâce à Wikipédia en utilisant une indexation aléatoire
Hai Hieu Vu, Jeanne Villaneau, Farida Saïd et Pierre-François Marteau
Résumé : Ce
papier présente une méthode pour mesurer la similarité sémantique entre
phrases qui utilise Wikipédia comme unique ressource linguistique et
qui est, de ce fait, utilisable pour un grand nombre de langues. Basée
sur une représentation vectorielle, elle utilise une indexation
aléatoire pour réduire la dimension des espaces manipulés. En outre,
elle inclut une technique de calcul des vecteurs de termes qui corrige les défauts engendrés par l’utilisation d’un corpus aussi
général que Wikipédia. Le système a été évalué sur les données de
SemEval 2014 en anglais avec des résultats très encourageants, au-dessus
du niveau moyen des systèmes en compétition. Il a également été testé
sur un ensemble de paires de phrases en français, à partir de ressources
que nous avons construites et qui seront mises à la libre disposition
de la communauté scientifique. Mot(s) clés libre(s) : traitement automatique du langage naturel, taln2015
|
Accéder à la ressource
|
|
06b - Attribution d’Auteur : approche multilingue fondée sur les répétitions maximales (taln2015)
/ Canal-u.fr
Voir le résumé
Voir le résumé
Sessions orales TALN 2015 – Mardi 23 juin 2015Session Classification et AlignementAttribution d’Auteur : approche multilingue fondée sur les répétitions maximales
Romain Brixtel, Charlotte Lecluze et Gaël Lejeune
Résumé : Cet article s’attaque à la tâche d’Attribution d’Auteur en contexte multilingue.
Nous proposons une alternative aux méthodes supervisées fondées sur les
n-grammes de caractères de longueurs variables : les répétitions
maximales.
Pour un texte donné, la liste de ses n-grammes de caractères contient des informations redondantes.
A contrario, les répétitions maximales représentent l’ensemble des répétitions de ce texte de manière condensée.
Nos expériences montrent que la redondance des n-grammes contribue à
l’efficacité des techniques d’Attribution d’Auteur exploitant des
sous-chaînes de caractères.
Ce constat posé, nous proposons une fonction de pondération sur les
traits donnés en entrée aux classifieurs, en introduisant les
répétitions maximales du n-ème ordre (c-à-d des répétitions maximales
détectées dans un ensemble de répétitions maximales).
Les résultats expérimentaux montrent de meilleures performances avec des
répétitions maximales, avec moins de données que pour les approches
fondées sur les n-grammes.Cet article s’attaque à la tâche d’Attribution
d’Auteur en contexte multilingue.
Nous proposons une alternative aux méthodes supervisées fondées sur les
n-grammes de caractères de longueurs variables : les répétitions
maximales. Mot(s) clés libre(s) : traitement automatique du langage naturel, taln2015
|
Accéder à la ressource
|
|
06a - Typologie des langues automatique à partir de treebanks (taln2015)
/ Canal-u.fr
Voir le résumé
Voir le résumé
Sessions orales TALN 2015 – Mardi 23 juin 2015Session Classification et Alignement
Typologie des langues automatique à partir de treebanks
Philippe Blache, Grégroie de Montcheuil et Stéphane Rauzy
Résumé : La
typologie des langues consiste à identifier certaines propriétés
syntaxiques et de les comparer au travers de plusieurs langues. Nous
proposons dans cet article d’extraire automatiquement ces propriétés à
partir de treebanks et de les analyser en vue de dresser une typologie.
Nous décrivons cette méthode ainsi que les outils développés pour la
mettre en œuvre. Nous appliquons la méthode à l’analyse de 10 langues
décrites dans le Universal Dependencies Treebank. Nous validons ces
résultats en montrant comment une technique de classification permet,
sur la base des informations extraites, de reconstituer des familles de
langue. Mot(s) clés libre(s) : traitement automatique du langage naturel, taln2015
|
Accéder à la ressource
|
|
05d - Identification de facteurs de risque pour des patients diabétiques à partir de comptes-rendus cliniques par des approches hybrides (taln2015)
/ Canal-u.fr
Voir le résumé
Voir le résumé
Sessions orales TALN 2015 – Mardi 23 juin 2015Session Extraction d’informationIdentification de facteurs de risque pour des patients
diabétiques à partir de comptes-rendus cliniques par des approches
hybrides
Cyril Grouin, Véronique Moriceau, Sophie Rosset et Pierre Zweigenbaum
Résumé : Dans
cet article, nous présentons les méthodes que nous avons développées
pour analyser des comptes-rendus hospitaliers rédigés en anglais.
L’objectif de cette étude consiste à identifier les facteurs de risque
de décès pour des patients diabétiques et à positionner les événements
médicaux décrits par rapport à la date de création de chaque document.
Notre approche repose sur (i) HeidelTime pour identifier les expressions
temporelles, (ii) des CRF complétés par des règles de post-traitement
pour identifier les traitements, les maladies et facteurs de risque, et
(iii) des règles pour positionner temporellement chaque événement
médical. Sur un corpus de 514 documents, nous obtenons une F-mesure
globale de 0,8451. Nous observons que l’identification des informations
directement mentionnées dans les documents se révèle plus performante
que l’inférence d’informations à partir de résultats de laboratoire. Mot(s) clés libre(s) : traitement automatique du langage naturel, taln2015
|
Accéder à la ressource
|
|
05c - Stratégies de sélection des exemples pour l’apprentissage actif avec des CRF (taln2015)
/ Canal-u.fr
Voir le résumé
Voir le résumé
Sessions orales TALN 2015 – Mardi 23 juin 2015Session Extraction d’informationStratégies de sélection des exemples pour l’apprentissage actif avec des CRF
Vincent Claveau et Ewa Kijak
Résumé : Beaucoup
de problèmes de TAL sont désormais modélisés comme des tâches
d’apprentissage supervisé. De ce fait, le coût des annotations des
exemples par l’expert représente un problème important. L’apprentissage
actif (active learning) apporte un cadre à ce problème, permettant de
contrôler le coût d’annotation tout en maximisant, on l’espère, la
performance à la tâche visée, mais repose sur le choix difficile des
exemples à soumettre à l’expert.
Dans cet article, nous examinons et proposons des stratégies de
sélection des exemples pour le cas spécifique des CRF, outil largement
utilisé en TAL.
Nous proposons d’une part une méthode simple corrigeant un biais de
certaines méthodes de l’état de l’art. D’autre part, nous détaillons une
méthode originale de sélection s’appuyant sur un critère de respect des
proportion dans les jeux de données manipulés.
Le bien-fondé de ces propositions est vérifié au travers de plusieurs tâches et jeux de données,
incluant reconnaissance d’entités nommées, chunking, phonétisation, désambiguïsation de sens. Mot(s) clés libre(s) : traitement automatique du langage naturel, taln2015
|
Accéder à la ressource
|
|
|<
<< Page précédente
1
2
3
4
Page suivante >>
>|
|
documents par page
|