|
|<
<< Page précédente
1
Page suivante >>
>|
|
documents par page
|
Tri :
Date
Editeur
Auteur
Titre
|
|
04b - Analyse syntaxique de l’ancien français : quelles propriétés de la langue influent le plus sur la qualité de l’apprentissage ? (taln2015)
/ Canal-u.fr
Voir le résumé
Voir le résumé
Sessions orales TALN 2015 – Mardi 23 juin 2015Session Syntaxe et paraphraseAnalyse syntaxique de l’ancien français : quelles propriétés de la langue influent le plus sur la qualité de l’apprentissage ?
Gaël Guibon, Isabelle Tellier, Sophie Prévost, Matthieu Constant et Kim Gerdes
Résumé : L’article
présente des résultats d’expériences d’apprentissage automatique pour
l’étiquetage morpho-syntaxique et l’analyse syntaxique en dépendance de
l’ancien français. Le corpus arboré SRCMF sert de données de référence.
La nature peu standardisée de la langue qui y est utilisée implique des
données d’entraînement par nature hétérogènes et aussi quantitativement
limitées. Nous explorons donc diverses stratégies, fondées sur
différents critères (variabilité du lexique, forme Vers/Prose des
textes, époque de rédaction), pour constiter des corpus d’entrainement
menant aux meilleurs résultats possibles. Mot(s) clés libre(s) : traitement automatique du langage naturel, taln2015, Désambiguïsation
|
Accéder à la ressource
|
|
03c - Désambiguïsation lexicale à base de connaissances par sélection distributionnelle et traits sémantiques (Article RECITAL) (taln2015)
/ Canal-u.fr
Voir le résumé
Voir le résumé
Sessions orales TALN 2015 – Mardi 23 juin 2015Session Désambiguïsation
Désambiguïsation lexicale à base de connaissances par sélection distributionnelle et traits sémantiques (Article RECITAL)
Mokhtar Boumedyen BillamiRésumé : La désambiguïsation lexicale permet d’améliorer de nombreuses
applications en traitement automatique des langues (TAL) comme la
recherche d’information, l’extraction d’information, la traduction
automatique, ou la simplification lexicale de textes. Schématiquement,
il s’agit de choisir quel est le sens le plus approprié pour chaque mot
d’un texte. Une des approches classiques consiste à estimer la
similarité sémantique qui existe entre les sens de deux mots puis de
l’étendre à l’ensemble des mots du texte. La méthode la plus directe
donne un score de similarité à toutes les paires de sens de mots puis
choisit la chaîne de sens qui retourne le meilleur score (on imagine la
complexité exponentielle liée à cette approche exhaustive). Dans cet
article, nous proposons d’utiliser une méta-heuristique d’optimisation
combinatoire qui consiste à choisir une fenêtre contenant les voisins
les plus proches par sélection distributionnelle autour du mot à
désambiguïser. Le test et l’évaluation de notre méthode portent sur un
corpus écrit en langue française en se servant du réseau sémantique
BabelNet. Le taux d’exactitude obtenu est de 78% sur l’ensemble des noms
et des verbes choisis pour l’évaluation. Mot(s) clés libre(s) : traitement automatique du langage naturel, taln2015, Désambiguïsation
|
Accéder à la ressource
|
|
03b - Création rapide et efficace d’un système de désambiguïsation lexicale pour une langue peu dotée (taln2015)
/ Canal-u.fr
Voir le résumé
Voir le résumé
Sessions orales TALN 2015 – Mardi 23 juin 2015Session Désambiguïsation
Création rapide et efficace d’un système de désambiguïsation lexicale pour une langue peu dotée Mohammad Nasiruddin, Andon Tchechmedjiev, Hervé Blanchon et Didier SchwabRésumé : Cet article présente un modèle génératif pour l’induction non supervisée
d’événements. Les précédentes méthodes de la littérature utilisent
uniquement les têtes des syntagmes pour représenter les entités.
Pourtant, le groupe complet (par exemple, « un homme armé ») apporte une
information plus discriminante (que « homme »). Notre modèle tient
compte de cette information et la représente dans la distribution des
schémas d’événements. Nous montrons que ces relations jouent un rôle
important dans l’estimation des paramètres, et qu’elles conduisent à des
distributions plus cohérentes et plus discriminantes. Les résultats
expérimentaux sur le corpus de MUC-4 confirment ces progrès. Mot(s) clés libre(s) : traitement automatique du langage naturel, taln2015, Désambiguïsation
|
Accéder à la ressource
|
|
03a - Désambiguïsation d’entités pour l’induction non supervisée de schémas événementiels (taln2015)
/ Canal-u.fr
Voir le résumé
Voir le résumé
Sessions orales TALN 2015 – Mardi 23 juin 2015Session Désambiguïsation
Désambiguïsation d’entités pour l’induction non supervisée de schémas événementiels
Kiem-Hieu Nguyen, Xavier Tannier, Olivier Ferret et Romaric BesançonRésumé : Cet article présente un modèle génératif pour l’induction non supervisée
d’événements. Les précédentes méthodes de la littérature utilisent
uniquement les têtes des syntagmes pour représenter les entités.
Pourtant, le groupe complet (par exemple, « un homme armé ») apporte une
information plus discriminante (que « homme »). Notre modèle tient
compte de cette information et la représente dans la distribution des
schémas d’événements. Nous montrons que ces relations jouent un rôle
important dans l’estimation des paramètres, et qu’elles conduisent à des
distributions plus cohérentes et plus discriminantes. Les résultats
expérimentaux sur le corpus de MUC-4 confirment ces progrès. Mot(s) clés libre(s) : traitement automatique du langage naturel, taln2015, Désambiguïsation
|
Accéder à la ressource
|
|
|<
<< Page précédente
1
Page suivante >>
>|
|
documents par page
|
|