Tri :
Date
Editeur
Auteur
Titre
|
|
01 - Multilinguality at Your Fingertips: BabelNet, Babelfy and Beyond ! (taln2015)
/ Canal-u.fr
Voir le résumé
Voir le résumé
Sessions orales TALN 2015 – Mardi 23 juin 2015
Conférence invitée
Multilinguality at Your Fingertips: BabelNet, Babelfy and Beyond!
Roberto Navigli
Résumé : Multilinguality
is a key feature of today’s Web, and it is this feature that we
leverage and exploit in our research work at the Sapienza University of
Rome’s Linguistic Computing Laboratory, which I am going to overview and
showcase in this talk.
I will start by presenting BabelNet 3.0, available at http://babelnet.org,
a very large multilingual encyclopedic dictionary and semantic network,
which covers 271 languages and provides both lexicographic and
encyclopedic knowledge for all the open-class parts of speech, thanks to
the seamless integration of WordNet, Wikipedia, Wiktionary, OmegaWiki,
Wikidata and the Open Multilingual WordNet.
Next, I will present Babelfy, available at http://babelfy.org,
a unified approach that leverages BabelNet to jointly perform word
sense disambiguation and entity linking in arbitrary languages, with
performance on both tasks on a par with, or surpassing, those of
task-specific state-of-the-art supervised systems.
Finally I will describe the Wikipedia Bitaxonomy, available at http://wibitaxonomy.org,
a new approach to the construction of a Wikipedia bitaxonomy, that is,
the largest and most accurate currently available taxonomy of Wikipedia
pages and taxonomy of categories, aligned to each other. I will also
give an outline of future work on multilingual resources and processing,
including state-of-the-art semantic similarity with sense embeddings. Mot(s) clés libre(s) : traitement automatique du langage naturel, BabelNet, Babelfy, Bitaxonomy, taln2015
|
Accéder à la ressource
|
|
01 - Ouverture de la journée d'étude : "Cerveau et Langage" (Crisco)
/ Canal-u.fr
Voir le résumé
Voir le résumé
Journée d’étude : "Cerveau et
Langage", présentée par Jacques FRANCOIS (Université de Caen)et
Jean-Luc NESPOULOUS (Toulouse 2 & I.U.F.)
Date : le jeudi 11 décembre 2014, de 9 h à 18 heures,
Journée scientifique du CRISCO (E.A. 4255)
Campus 1 - Bâtiment B - Amphi HUET
Université de Caen Basse-NormandiePrésentation de la journée par Estelle MolineFranz Joseph Gall (1758-1828) est classiquement considéré comme le précurseur de la neuropsychologie moderne pour avoir proposé (i) de « fractionner » ce que l’on appelle aujourd’hui les capacités cognitives du cerveau/Esprit humain (langage, mémoire, musique…) et (ii) de localiser celles-ci en différents zones cérébrales.Paul Broca (1824-1880), de son côté, apparaît comme le fondateur de cette discipline avec la publication, dans les années 1860, de quelques cas de patients présentant des troubles du langage (= aphasiques) à la suite d’une lésion située dans la partie postérieure de la troisième circonvolution frontale gauche.L’objectif de la présente journée est de présenter à un auditoire essentiellement constitué de non-spécialistes l’évolution de cette discipline depuis sa fondation, en soulignant, en particulier, la nécessité pour celles-ci d’oeuvrer dans un contexte pluridisciplinaire, voire, mieux, interdisciplinaire, au sein duquel la linguistique et la psychologie trouvent leur place.Alterneront exposés de portée générale et présentations de travaux illustratifs ayant trait à divers thèmes d’actualité. Mot(s) clés libre(s) : cerveau, neuropsychologie, langage, crisco
|
Accéder à la ressource
|
|
02 - La neuropsycholinguistique 150 ans après Paul Broca (Crisco)
/ Canal-u.fr
Voir le résumé
Voir le résumé
Journée d’étude : "Cerveau et
Langage", présentée par Jacques FRANCOIS (Université de Caen)et
Jean-Luc NESPOULOUS (Toulouse 2 & I.U.F.)
Date : le jeudi 11 décembre 2014, de 9 h à 18 heures,
Journée scientifique du CRISCO (E.A. 4255)
Campus 1 - Bâtiment B - Amphi HUET
Université de Caen Basse-NormandieJean-Luc NespoulousPaul Broca, Carl Wernicke et leurs successeurs ont mis
en place, de la fin du 19ème jusqu’au milieu du 20ème
siècle, un ‘dogme’, aux fondements anatomo-cliniques, qui a connu d’emblée un
franc succès suivi de bon nombre de vicissitudes. Le réductionnisme initial de
la version ‘standard’ de la zone du langage dans le cerveau humain et le
simplisme des conceptions en matière de langage émanant des seuls
neurologues/pionniers n’ont pas
tardé à devoir affronter de nombreuses
‘exceptions’ qu’il convient d’examiner encore aujourd’hui, environ 150 ans après la mort de Paul Broca.L’examen de ces nombreux ‘bémols’ au dogme initial,
plus que jamais d’actualité, constituera l’épine dorsale de l'exposé introductif
de la journée du 11 décembre. Mot(s) clés libre(s) : cerveau, neuropsychologie, langage, neuropsycholinguistique, crisco, Paul Broca
|
Accéder à la ressource
|
|
02a - Utilisation de mesures de confiance pour améliorer le décodage en traduction de parole (taln2015)
/ Canal-u.fr
Voir le résumé
Voir le résumé
Sessions orales TALN 2015 – Mardi 23 juin 2015Session Traduction
Utilisation de mesures de confiance pour améliorer le décodage en traduction de parole
Laurent Besacier, Benjamin Lecouteux et Luong Ngoc QuangRésumé : Les mesures de confiance au niveau mot (Word
Confidence Estimation – WCE) pour la traduction auto- matique (TA) ou
pour la reconnaissance automatique de la parole (RAP) attribuent un
score de confiance à chaque mot dans une hypothèse de transcription ou
de traduction. Dans le passé, l’estimation de ces mesures a le plus
souvent été traitée séparément dans des contextes RAP ou TA. Nous
proposons ici une estimation conjointe de la confiance associée à un mot
dans une hypothèse de traduction automatique de la parole (TAP). Cette
estimation fait appel à des paramètres issus aussi bien des systèmes de
transcription de la parole (RAP) que des systèmes de traduction
automatique (TA). En plus de la construction de ces estimateurs de
confiance robustes pour la TAP, nous utilisons les informations de
confiance pour re-décoder nos graphes d’hypothèses de traduction. Les
expérimentations réalisées montrent que l’utilisation de ces mesures de
confiance au cours d’une seconde passe de décodage permettent d’obtenir
une amélioration significative des performances de traduction (évaluées
avec la métrique BLEU – gains de deux points par rapport à notre système
de traduc- tion de parole de référence). Ces expériences sont faites
pour une tâche de TAP (français-anglais) pour laquelle un corpus a été
spécialement conçu (ce corpus, mis à la disposition de la communauté
TALN, est aussi décrit en détail dans l’article). Mot(s) clés libre(s) : traduction, traitement automatique du langage naturel, taln2015
|
Accéder à la ressource
|
|
02b - Multi-alignement vs bi-alignement : à plusieurs, c’est mieux ! (taln2015)
/ Canal-u.fr
Voir le résumé
Voir le résumé
Sessions orales TALN 2015 – Mardi 23 juin 2015Session TraductionMulti-alignement vs bi-alignement : à plusieurs, c’est mieux !
Olivier KraifRésumé : Dans cet article, nous proposons une méthode originale destinée à
effectuer l’alignement d’un corpus multi-parallèle, i.e. comportant plus
de deux langues, en prenant en compte toutes les langues simultanément
(et non en composant une série de bi-alignements indépendants). Pour ce
faire, nous nous appuyons sur les réseaux de correspondances lexicales
constitués par les transfuges (chaînes identiques) et cognats (mots
apparentés), et nous montrons comment divers tuilages des couples de
langues permettent d’exploiter au mieux les ressemblances superficielles
liées aux relations génétiques interlinguistiques. Nous évaluons notre
méthode par rapport à une méthode de bi-alignement classique, et
montrons en quoi le multi-alignement permet d’obtenir des résultats à la
fois plus précis et plus robustes. Mot(s) clés libre(s) : traduction, traitement automatique du langage naturel, taln2015
|
Accéder à la ressource
|
|
02c - Apprentissage discriminant des modèles continus de traduction (taln2015)
/ Canal-u.fr
Voir le résumé
Voir le résumé
Sessions orales TALN 2015 – Mardi 23 juin 2015Session TraductionApprentissage discriminant des modèles continus de traduction
Quoc-Khanh Do, Alexandre Allauzen et François YvonRésumé : Alors que les réseaux neuronaux occupent une place de plus en plus importante dans le traitement automatique des langues, les méthodes d’apprentissage actuelles utilisent pour la plupart des critères qui sont décorrélés de l’application. Cet article propose un nouveau cadre d’apprentissage discriminant pour l’estimation des modèles continus de traduction. Ce cadre s’appuie sur la définition d’un critère d’optimisation permettant de prendre en compte d’une part la
métrique utilisée pour l’évaluation de la traduction et d’autre part l’intégration de ces modèles au sein des systèmes de traduction automatique. De plus cette méthode d’apprentissage est comparée aux critères existants d’estimation que sont le maximum de vraisemblance et l’estimation contrastive bruitée. Les expériences menées sur la tâches de traduction des séminaires TED Talks de l’anglais vers le français montrent la pertinence d’un cadre discriminant d’apprentissage mais dont les performances sont liées au choix d’une stratégie d’initialisation adéquate. Nous montrons qu’avec une initialisation judicieuse des gains significatifs en terme de scorebleu peuvent être obtenus. Mot(s) clés libre(s) : traduction, traitement automatique du langage naturel, taln2015
|
Accéder à la ressource
|
|
03 - L’émergence et l’évolution du langage humain du point de vue des neurosciences (Crisco)
/ Canal-u.fr
Voir le résumé
Voir le résumé
Journée d’étude : "Cerveau et
Langage", présentée par Jacques FRANCOIS (Université de Caen)et
Jean-Luc NESPOULOUS (Toulouse 2 & I.U.F.)
Date : le jeudi 11 décembre 2014, de 9 h à 18 heures,
Journée scientifique du CRISCO (E.A. 4255)
Campus 1 - Bâtiment B - Amphi HUET
Université de Caen Basse-NormandieJacques
FrançoisUniversité de Caen &
LATTICE, UMR 8094 (Paris 3 – ENS)L’ÉMERGENCE
ET L’ÉVOLUTION DU LANGAGE HUMAIN DU POINT DE VUE DES NEUROSCIENCESL’exposé
de J. François s’appuiera sur un article de même intitulé qui paraît au même
moment dans la revue électronique CoReLa (http://corela.revues.org/). Il se
composera de trois sections :
la première est consacrée à la démonstration à partir de 200
ans d’histoire de la linguistique depuis le début du 19° siècle, que l’origine
des langues, celle de la grammaire et celle du langage humain constituent trois questionnements disjoints.
La seconde mettra en valeur le caractère pluridisciplinaire de
l’étude de l’évolution du langage humain et les aller-retour qui ont existé, en
particulier au 19° siècle, entre linguistes et naturalistes.
La troisième section, la plus développée, est consacrée à
l’apport des neurosciences évolutionnaires à l’étude de l’origine du langage
sous la forme d’une documentation classée, commençant par cinq théories sur le
cerveau humain et le langage centrées respectivement sur la localisation des
aires du langage, la parole, l’imitation et la cognition linguistique, et
poursuivant par l’examen de la coopération des archéologues et neurobiologistes
autour des relations entre le cerveau humain, le langage et la culture
matérielle, de la « co-évolution » du cerveau humain et du langage, des
avancées de l’ingénierie neuromimétique sur l’évolution de la parole, et des
mutations génétiques susceptibles d’avoir facilité l’émergence du langage chez
les primates humains.
En conclusion les deux grandes questions pendantes sont
rappelées : origine gestuelle ou vocale du langage articulé, par adaptation
(sans intervention de mutations génétiques) ou par exaptation (avec mutations). Mot(s) clés libre(s) : cerveau, neuropsychologie, langage, neuropsycholinguistique, neurosciences, crisco, ingénierie neuromimétique, co-évolution, origine du langage
|
Accéder à la ressource
|
|
03a - Désambiguïsation d’entités pour l’induction non supervisée de schémas événementiels (taln2015)
/ Canal-u.fr
Voir le résumé
Voir le résumé
Sessions orales TALN 2015 – Mardi 23 juin 2015Session Désambiguïsation
Désambiguïsation d’entités pour l’induction non supervisée de schémas événementiels
Kiem-Hieu Nguyen, Xavier Tannier, Olivier Ferret et Romaric BesançonRésumé : Cet article présente un modèle génératif pour l’induction non supervisée
d’événements. Les précédentes méthodes de la littérature utilisent
uniquement les têtes des syntagmes pour représenter les entités.
Pourtant, le groupe complet (par exemple, « un homme armé ») apporte une
information plus discriminante (que « homme »). Notre modèle tient
compte de cette information et la représente dans la distribution des
schémas d’événements. Nous montrons que ces relations jouent un rôle
important dans l’estimation des paramètres, et qu’elles conduisent à des
distributions plus cohérentes et plus discriminantes. Les résultats
expérimentaux sur le corpus de MUC-4 confirment ces progrès. Mot(s) clés libre(s) : traitement automatique du langage naturel, taln2015, Désambiguïsation
|
Accéder à la ressource
|
|
03b - Création rapide et efficace d’un système de désambiguïsation lexicale pour une langue peu dotée (taln2015)
/ Canal-u.fr
Voir le résumé
Voir le résumé
Sessions orales TALN 2015 – Mardi 23 juin 2015Session Désambiguïsation
Création rapide et efficace d’un système de désambiguïsation lexicale pour une langue peu dotée Mohammad Nasiruddin, Andon Tchechmedjiev, Hervé Blanchon et Didier SchwabRésumé : Cet article présente un modèle génératif pour l’induction non supervisée
d’événements. Les précédentes méthodes de la littérature utilisent
uniquement les têtes des syntagmes pour représenter les entités.
Pourtant, le groupe complet (par exemple, « un homme armé ») apporte une
information plus discriminante (que « homme »). Notre modèle tient
compte de cette information et la représente dans la distribution des
schémas d’événements. Nous montrons que ces relations jouent un rôle
important dans l’estimation des paramètres, et qu’elles conduisent à des
distributions plus cohérentes et plus discriminantes. Les résultats
expérimentaux sur le corpus de MUC-4 confirment ces progrès. Mot(s) clés libre(s) : traitement automatique du langage naturel, taln2015, Désambiguïsation
|
Accéder à la ressource
|
|
03c - Désambiguïsation lexicale à base de connaissances par sélection distributionnelle et traits sémantiques (Article RECITAL) (taln2015)
/ Canal-u.fr
Voir le résumé
Voir le résumé
Sessions orales TALN 2015 – Mardi 23 juin 2015Session Désambiguïsation
Désambiguïsation lexicale à base de connaissances par sélection distributionnelle et traits sémantiques (Article RECITAL)
Mokhtar Boumedyen BillamiRésumé : La désambiguïsation lexicale permet d’améliorer de nombreuses
applications en traitement automatique des langues (TAL) comme la
recherche d’information, l’extraction d’information, la traduction
automatique, ou la simplification lexicale de textes. Schématiquement,
il s’agit de choisir quel est le sens le plus approprié pour chaque mot
d’un texte. Une des approches classiques consiste à estimer la
similarité sémantique qui existe entre les sens de deux mots puis de
l’étendre à l’ensemble des mots du texte. La méthode la plus directe
donne un score de similarité à toutes les paires de sens de mots puis
choisit la chaîne de sens qui retourne le meilleur score (on imagine la
complexité exponentielle liée à cette approche exhaustive). Dans cet
article, nous proposons d’utiliser une méta-heuristique d’optimisation
combinatoire qui consiste à choisir une fenêtre contenant les voisins
les plus proches par sélection distributionnelle autour du mot à
désambiguïser. Le test et l’évaluation de notre méthode portent sur un
corpus écrit en langue française en se servant du réseau sémantique
BabelNet. Le taux d’exactitude obtenu est de 78% sur l’ensemble des noms
et des verbes choisis pour l’évaluation. Mot(s) clés libre(s) : traitement automatique du langage naturel, taln2015, Désambiguïsation
|
Accéder à la ressource
|
|