Tri :
Date
Editeur
Auteur
Titre
|
|
04d - Extraction automatique de paraphrases grand public pour les termes médicaux (taln2015)
/ Canal-u.fr
Voir le résumé
Voir le résumé
Sessions orales TALN 2015 – Mardi 23 juin 2015Session Syntaxe et paraphraseExtraction automatique de paraphrases grand public pour les termes médicaux
Natalia Grabar et Thierry HamonPrésenté par Isabelle Tellier
Résumé : Nous
sommes tous concernés par notre état de santé et restons sensibles aux
informations de santé disponibles dans la société moderne à travers par
exemple les résultats des recherches scientifiques, les médias sociaux
de santé, les documents cliniques, les émissions de télé et de radio ou
les nouvelles. Cependant, il est commun de rencontrer dans le domaine
médical des termes très spécifiques (eg, blépharospasme, alexitymie,
appendicectomie), qui restent difficiles à comprendre par les non
spécialistes. Nous proposons une méthode automatique qui vise
l’acquisition de paraphrases pour les termes médicaux, qui soient plus
faciles à comprendre que les termes originaux. La méthode est basée sur
l’analyse morphologique des termes, l’analyse syntaxique et la fouille
de textes non spécialisés. L’analyse et l’évaluation des résultats
indiquent que de telles paraphrases peuvent être trouvées dans les
documents non spécialisés et présentent une compréhension plus facile.
En fonction des paramètres de la méthode, la précision varie entre 86 et
55 %. Ce type de ressources est utile pour plusieurs applications de
TAL (eg, recherche d’information grand public, lisibilité et
simplification de textes, systèmes de question-réponses). Mot(s) clés libre(s) : traitement automatique du langage naturel, taln2015
|
Accéder à la ressource
|
|
04c - Noyaux de réécriture de phrases munis de types lexico-sémantiques (taln2015)
/ Canal-u.fr
Voir le résumé
Voir le résumé
Sessions orales TALN 2015 – Mardi 23 juin 2015Session Syntaxe et paraphraseNoyaux de réécriture de phrases munis de types lexico-sémantiques
Martin Gleize et Brigitte Grau
Résumé : De
nombreux problèmes en traitement automatique des langues requièrent de
déterminer si deux phrases sont des réécritures l’une de l’autre. Une
solution efficace consiste à apprendre les réécritures en se fondant sur
des méthodes à noyau qui mesurent la similarité entre deux réécritures
de paires de phrases. Toutefois, ces méthodes ne permettent généralement
pas de prendre en compte des variations sémantiques entre mots, qui
permettraient de capturer un plus grand nombre de règles de réécriture.
Dans cet article, nous proposons la définition et l’implémentation d’une
nouvelle classe de fonction noyau, fondée sur la réécriture de phrases
enrichie par un typage pour combler ce manque. Nous l’évaluons sur deux
tâches, la reconnaissance de paraphrases et d’implications textuelles. Mot(s) clés libre(s) : traitement automatique du langage naturel, taln2015
|
Accéder à la ressource
|
|
04b - Analyse syntaxique de l’ancien français : quelles propriétés de la langue influent le plus sur la qualité de l’apprentissage ? (taln2015)
/ Canal-u.fr
Voir le résumé
Voir le résumé
Sessions orales TALN 2015 – Mardi 23 juin 2015Session Syntaxe et paraphraseAnalyse syntaxique de l’ancien français : quelles propriétés de la langue influent le plus sur la qualité de l’apprentissage ?
Gaël Guibon, Isabelle Tellier, Sophie Prévost, Matthieu Constant et Kim Gerdes
Résumé : L’article
présente des résultats d’expériences d’apprentissage automatique pour
l’étiquetage morpho-syntaxique et l’analyse syntaxique en dépendance de
l’ancien français. Le corpus arboré SRCMF sert de données de référence.
La nature peu standardisée de la langue qui y est utilisée implique des
données d’entraînement par nature hétérogènes et aussi quantitativement
limitées. Nous explorons donc diverses stratégies, fondées sur
différents critères (variabilité du lexique, forme Vers/Prose des
textes, époque de rédaction), pour constiter des corpus d’entrainement
menant aux meilleurs résultats possibles. Mot(s) clés libre(s) : traitement automatique du langage naturel, taln2015, Désambiguïsation
|
Accéder à la ressource
|
|
04a - Grammaires phrastiques et discursives fondées sur TAG : une approche de D-STAG avec les ACG (taln2015)
/ Canal-u.fr
Voir le résumé
Voir le résumé
Sessions orales TALN 2015 – Mardi 23 juin 2015Session Syntaxe et paraphraseGrammaires phrastiques et discursives fondées sur TAG : une approche de D-STAG avec les ACG
Laurence Danlos, Aleksandre Maskharashvili et Sylvain Pogodalla
Résumé : Nous
présentons une méthode pour articuler grammaire de phrase et grammaire
de discours. Cette méthode permet à la fois l’intégration des deux
grammaires sans recourir à une étape de traitement intermédiaire et de
construire des structures discursives qui ne soient pas des arbres mais
des graphes orientés acycliques (DAG). Notre analyse s’appuie sur une
approche de l’analyse discursive utilisant les Grammaires d’Arbres
Adjoint (TAG), Discourse Synchronous TAG (D-STAG). Nous utilisons pour
ce faire un encodage des TAG dans les Grammaires Catégorielles
Abstraites (ACG). Cela permet d’une part d’utiliser l’ordre supérieur
pour l’interprétation sémantique afin de construire des structures qui
soient des DAG et non des arbres, et d’autre part d’utiliser les
propriétés de composition d’ACG afin d’articuler naturellement grammaire
phrastique et grammaire discursive. Tous les exemples peuvent être
exécutés avec le logiciel approprié. Mot(s) clés libre(s) : traitement automatique du langage naturel, taln2015
|
Accéder à la ressource
|
|
04 - Langage et représentation spatiale chez des locuteurs avec et sans agrammatisme : analyse des mouvements oculaires et comparaisons interlangues (Crisco)
/ Canal-u.fr
Voir le résumé
Voir le résumé
Journée d’étude : "Cerveau et
Langage", présentée par Jacques FRANCOIS (Université de Caen)et
Jean-Luc NESPOULOUS (Toulouse 2 & I.U.F.)
Date : le jeudi 11 décembre 2014, de 9 h à 18 heures,
Journée scientifique du CRISCO (E.A. 4255)
Campus 1 - Bâtiment B - Amphi HUET
Université de Caen Basse-NormandieEva
SoroliS.T.L,
UMR 8163 (CNRS & Université Lille 3/Lille 1)LANGAGE ET
REPRÉSENTATION SPATIALE CHEZ DES
LOCUTEURS AVEC ET SANS AGRAMMATISME : Analyse des
mouvements oculaires et comparaisons interlangues(résumé en attente) Mot(s) clés libre(s) : cerveau, neuropsychologie, langage, neuropsycholinguistique, neurosciences, crisco, agrammatisme
|
Accéder à la ressource
|
|
03c - Désambiguïsation lexicale à base de connaissances par sélection distributionnelle et traits sémantiques (Article RECITAL) (taln2015)
/ Canal-u.fr
Voir le résumé
Voir le résumé
Sessions orales TALN 2015 – Mardi 23 juin 2015Session Désambiguïsation
Désambiguïsation lexicale à base de connaissances par sélection distributionnelle et traits sémantiques (Article RECITAL)
Mokhtar Boumedyen BillamiRésumé : La désambiguïsation lexicale permet d’améliorer de nombreuses
applications en traitement automatique des langues (TAL) comme la
recherche d’information, l’extraction d’information, la traduction
automatique, ou la simplification lexicale de textes. Schématiquement,
il s’agit de choisir quel est le sens le plus approprié pour chaque mot
d’un texte. Une des approches classiques consiste à estimer la
similarité sémantique qui existe entre les sens de deux mots puis de
l’étendre à l’ensemble des mots du texte. La méthode la plus directe
donne un score de similarité à toutes les paires de sens de mots puis
choisit la chaîne de sens qui retourne le meilleur score (on imagine la
complexité exponentielle liée à cette approche exhaustive). Dans cet
article, nous proposons d’utiliser une méta-heuristique d’optimisation
combinatoire qui consiste à choisir une fenêtre contenant les voisins
les plus proches par sélection distributionnelle autour du mot à
désambiguïser. Le test et l’évaluation de notre méthode portent sur un
corpus écrit en langue française en se servant du réseau sémantique
BabelNet. Le taux d’exactitude obtenu est de 78% sur l’ensemble des noms
et des verbes choisis pour l’évaluation. Mot(s) clés libre(s) : traitement automatique du langage naturel, taln2015, Désambiguïsation
|
Accéder à la ressource
|
|
03b - Création rapide et efficace d’un système de désambiguïsation lexicale pour une langue peu dotée (taln2015)
/ Canal-u.fr
Voir le résumé
Voir le résumé
Sessions orales TALN 2015 – Mardi 23 juin 2015Session Désambiguïsation
Création rapide et efficace d’un système de désambiguïsation lexicale pour une langue peu dotée Mohammad Nasiruddin, Andon Tchechmedjiev, Hervé Blanchon et Didier SchwabRésumé : Cet article présente un modèle génératif pour l’induction non supervisée
d’événements. Les précédentes méthodes de la littérature utilisent
uniquement les têtes des syntagmes pour représenter les entités.
Pourtant, le groupe complet (par exemple, « un homme armé ») apporte une
information plus discriminante (que « homme »). Notre modèle tient
compte de cette information et la représente dans la distribution des
schémas d’événements. Nous montrons que ces relations jouent un rôle
important dans l’estimation des paramètres, et qu’elles conduisent à des
distributions plus cohérentes et plus discriminantes. Les résultats
expérimentaux sur le corpus de MUC-4 confirment ces progrès. Mot(s) clés libre(s) : traitement automatique du langage naturel, taln2015, Désambiguïsation
|
Accéder à la ressource
|
|
03a - Désambiguïsation d’entités pour l’induction non supervisée de schémas événementiels (taln2015)
/ Canal-u.fr
Voir le résumé
Voir le résumé
Sessions orales TALN 2015 – Mardi 23 juin 2015Session Désambiguïsation
Désambiguïsation d’entités pour l’induction non supervisée de schémas événementiels
Kiem-Hieu Nguyen, Xavier Tannier, Olivier Ferret et Romaric BesançonRésumé : Cet article présente un modèle génératif pour l’induction non supervisée
d’événements. Les précédentes méthodes de la littérature utilisent
uniquement les têtes des syntagmes pour représenter les entités.
Pourtant, le groupe complet (par exemple, « un homme armé ») apporte une
information plus discriminante (que « homme »). Notre modèle tient
compte de cette information et la représente dans la distribution des
schémas d’événements. Nous montrons que ces relations jouent un rôle
important dans l’estimation des paramètres, et qu’elles conduisent à des
distributions plus cohérentes et plus discriminantes. Les résultats
expérimentaux sur le corpus de MUC-4 confirment ces progrès. Mot(s) clés libre(s) : traitement automatique du langage naturel, taln2015, Désambiguïsation
|
Accéder à la ressource
|
|
03 - L’émergence et l’évolution du langage humain du point de vue des neurosciences (Crisco)
/ Canal-u.fr
Voir le résumé
Voir le résumé
Journée d’étude : "Cerveau et
Langage", présentée par Jacques FRANCOIS (Université de Caen)et
Jean-Luc NESPOULOUS (Toulouse 2 & I.U.F.)
Date : le jeudi 11 décembre 2014, de 9 h à 18 heures,
Journée scientifique du CRISCO (E.A. 4255)
Campus 1 - Bâtiment B - Amphi HUET
Université de Caen Basse-NormandieJacques
FrançoisUniversité de Caen &
LATTICE, UMR 8094 (Paris 3 – ENS)L’ÉMERGENCE
ET L’ÉVOLUTION DU LANGAGE HUMAIN DU POINT DE VUE DES NEUROSCIENCESL’exposé
de J. François s’appuiera sur un article de même intitulé qui paraît au même
moment dans la revue électronique CoReLa (http://corela.revues.org/). Il se
composera de trois sections :
la première est consacrée à la démonstration à partir de 200
ans d’histoire de la linguistique depuis le début du 19° siècle, que l’origine
des langues, celle de la grammaire et celle du langage humain constituent trois questionnements disjoints.
La seconde mettra en valeur le caractère pluridisciplinaire de
l’étude de l’évolution du langage humain et les aller-retour qui ont existé, en
particulier au 19° siècle, entre linguistes et naturalistes.
La troisième section, la plus développée, est consacrée à
l’apport des neurosciences évolutionnaires à l’étude de l’origine du langage
sous la forme d’une documentation classée, commençant par cinq théories sur le
cerveau humain et le langage centrées respectivement sur la localisation des
aires du langage, la parole, l’imitation et la cognition linguistique, et
poursuivant par l’examen de la coopération des archéologues et neurobiologistes
autour des relations entre le cerveau humain, le langage et la culture
matérielle, de la « co-évolution » du cerveau humain et du langage, des
avancées de l’ingénierie neuromimétique sur l’évolution de la parole, et des
mutations génétiques susceptibles d’avoir facilité l’émergence du langage chez
les primates humains.
En conclusion les deux grandes questions pendantes sont
rappelées : origine gestuelle ou vocale du langage articulé, par adaptation
(sans intervention de mutations génétiques) ou par exaptation (avec mutations). Mot(s) clés libre(s) : cerveau, neuropsychologie, langage, neuropsycholinguistique, neurosciences, crisco, ingénierie neuromimétique, co-évolution, origine du langage
|
Accéder à la ressource
|
|
02c - Apprentissage discriminant des modèles continus de traduction (taln2015)
/ Canal-u.fr
Voir le résumé
Voir le résumé
Sessions orales TALN 2015 – Mardi 23 juin 2015Session TraductionApprentissage discriminant des modèles continus de traduction
Quoc-Khanh Do, Alexandre Allauzen et François YvonRésumé : Alors que les réseaux neuronaux occupent une place de plus en plus importante dans le traitement automatique des langues, les méthodes d’apprentissage actuelles utilisent pour la plupart des critères qui sont décorrélés de l’application. Cet article propose un nouveau cadre d’apprentissage discriminant pour l’estimation des modèles continus de traduction. Ce cadre s’appuie sur la définition d’un critère d’optimisation permettant de prendre en compte d’une part la
métrique utilisée pour l’évaluation de la traduction et d’autre part l’intégration de ces modèles au sein des systèmes de traduction automatique. De plus cette méthode d’apprentissage est comparée aux critères existants d’estimation que sont le maximum de vraisemblance et l’estimation contrastive bruitée. Les expériences menées sur la tâches de traduction des séminaires TED Talks de l’anglais vers le français montrent la pertinence d’un cadre discriminant d’apprentissage mais dont les performances sont liées au choix d’une stratégie d’initialisation adéquate. Nous montrons qu’avec une initialisation judicieuse des gains significatifs en terme de scorebleu peuvent être obtenus. Mot(s) clés libre(s) : traduction, traitement automatique du langage naturel, taln2015
|
Accéder à la ressource
|
|