Tri :
Date
Editeur
Auteur
Titre
|
|
01 - Multilinguality at Your Fingertips: BabelNet, Babelfy and Beyond ! (taln2015)
/ Canal-u.fr
Voir le résumé
Voir le résumé
Sessions orales TALN 2015 – Mardi 23 juin 2015
Conférence invitée
Multilinguality at Your Fingertips: BabelNet, Babelfy and Beyond!
Roberto Navigli
Résumé : Multilinguality
is a key feature of today’s Web, and it is this feature that we
leverage and exploit in our research work at the Sapienza University of
Rome’s Linguistic Computing Laboratory, which I am going to overview and
showcase in this talk.
I will start by presenting BabelNet 3.0, available at http://babelnet.org,
a very large multilingual encyclopedic dictionary and semantic network,
which covers 271 languages and provides both lexicographic and
encyclopedic knowledge for all the open-class parts of speech, thanks to
the seamless integration of WordNet, Wikipedia, Wiktionary, OmegaWiki,
Wikidata and the Open Multilingual WordNet.
Next, I will present Babelfy, available at http://babelfy.org,
a unified approach that leverages BabelNet to jointly perform word
sense disambiguation and entity linking in arbitrary languages, with
performance on both tasks on a par with, or surpassing, those of
task-specific state-of-the-art supervised systems.
Finally I will describe the Wikipedia Bitaxonomy, available at http://wibitaxonomy.org,
a new approach to the construction of a Wikipedia bitaxonomy, that is,
the largest and most accurate currently available taxonomy of Wikipedia
pages and taxonomy of categories, aligned to each other. I will also
give an outline of future work on multilingual resources and processing,
including state-of-the-art semantic similarity with sense embeddings. Mot(s) clés libre(s) : traitement automatique du langage naturel, BabelNet, Babelfy, Bitaxonomy, taln2015
|
Accéder à la ressource
|
|
018 - Noirs en Algérie, XIXème- XXème siècles
/ ENS-LSH/SCAM
/ 20-06-2006
/ Canal-U - OAI Archive
ENS-LSH/SCAM
Voir le résumé
Voir le résumé
par Raëd Bader (Maison méditerranéenne des Sciences de l’homme)Sociétés : scènes et acteurs : session thématique (prés. Jean-Pierre Frey)Colloque pour une histoire critique et citoyenne - le cas de l'histoire franco-algérienne Le recensement des populations noires en Algérie, libres ou esclaves, pour les deux derniers siècles, varie beaucoup d’une source à l’autre : 8 000 esclaves noirs sur l’ensemble du territoire algérien, selon un rapport officiel en 1845 ; 18 329 renchérit, dès 1848, un nouveau rapport à l’occasion de l’abolition de l’esclavage. Le même document estime que plus de 3 000 individus sont acheminés annuellement en Algérie. Or, l’abolition ne met pas fin à la traite dans la principale colonie française. Vers 1880, l’administration militaire recense encore 2 000 esclaves africains qui transitent chaque année au Mzab.L’Algérie reste le pays d’Afrique du Nord qui a accueilli le plus petit nombre d’esclaves noirs, si l’on se réfère aux estimations de la traite transsaharienne : 65 000 entrées en Algérie de 1700 à 1880 contre 100 000 en Tunisie, 400 000 en Libye, 515 000 au Maroc et 800 000 en Égypte. Aujourd’hui, la population d’Algérie compterait environ 5 % de Noirs - un million selon l’estimation de Tingé Coulibaly en 1979 -, soit la plus faible proportion des pays du Maghreb. La plupart vivent au Sahara, et leur nombre diminue progressivement en direction du nord. Mais le nombre des esclaves et de leurs descendants en Algérie importe moins que ce qu’ils révèlent du fonctionnement de l’État et de la société en situation coloniale et postcoloniale. Les autorités françaises - impériales et républicaines - ont plus que toléré la continuité de la traite arabe après 1848. L’importation de main-d’œuvre africaine en Algérie est même débattue à la Chambre des Pairs en 1856. Le projet consistait à faire travailler 100 000 Noirs dans les colonies agricoles. Il est finalement rejeté mais les caravanes continuent à faire entrer clandestinement des esclaves depuis le sud jusqu’aux villes littorales. Ils sont surtout domestiques chez les notables algériens mais certains travaillent aussi dans les fermes des colons.Il s’agit donc de dévoiler l’existence ou pas d’une communauté noire en Algérie. Que signifie être « Noir » dans l’Algérie des XIXe et XXe siècles ? Quelle place occupent-ils dans la société occupante et occupée, ou à l’écart de celles-ci ? Sont-ils parvenus à former un nouveau groupe malgré leurs origines diverses en Afrique subsaharienne ? Equipe technique Directeur de la production: Christophe Porlier, Responsable des moyens techniques: Francis Ouedraogo, Réalisation: Pascal Grzywacz, Image: Sébastien Boudin, Son: Xavier comméat, Encodage-Diffusion Web: Jean-Claude Troncard Mot(s) clés libre(s) : algérie (1830-1962), colonies (administration), colonisation, esclavage, noirs (algérie), traite des esclaves
|
Accéder à la ressource
|
|
02a - Utilisation de mesures de confiance pour améliorer le décodage en traduction de parole (taln2015)
/ Canal-u.fr
Voir le résumé
Voir le résumé
Sessions orales TALN 2015 – Mardi 23 juin 2015Session Traduction
Utilisation de mesures de confiance pour améliorer le décodage en traduction de parole
Laurent Besacier, Benjamin Lecouteux et Luong Ngoc QuangRésumé : Les mesures de confiance au niveau mot (Word
Confidence Estimation – WCE) pour la traduction auto- matique (TA) ou
pour la reconnaissance automatique de la parole (RAP) attribuent un
score de confiance à chaque mot dans une hypothèse de transcription ou
de traduction. Dans le passé, l’estimation de ces mesures a le plus
souvent été traitée séparément dans des contextes RAP ou TA. Nous
proposons ici une estimation conjointe de la confiance associée à un mot
dans une hypothèse de traduction automatique de la parole (TAP). Cette
estimation fait appel à des paramètres issus aussi bien des systèmes de
transcription de la parole (RAP) que des systèmes de traduction
automatique (TA). En plus de la construction de ces estimateurs de
confiance robustes pour la TAP, nous utilisons les informations de
confiance pour re-décoder nos graphes d’hypothèses de traduction. Les
expérimentations réalisées montrent que l’utilisation de ces mesures de
confiance au cours d’une seconde passe de décodage permettent d’obtenir
une amélioration significative des performances de traduction (évaluées
avec la métrique BLEU – gains de deux points par rapport à notre système
de traduc- tion de parole de référence). Ces expériences sont faites
pour une tâche de TAP (français-anglais) pour laquelle un corpus a été
spécialement conçu (ce corpus, mis à la disposition de la communauté
TALN, est aussi décrit en détail dans l’article). Mot(s) clés libre(s) : traduction, traitement automatique du langage naturel, taln2015
|
Accéder à la ressource
|
|
02b - Multi-alignement vs bi-alignement : à plusieurs, c’est mieux ! (taln2015)
/ Canal-u.fr
Voir le résumé
Voir le résumé
Sessions orales TALN 2015 – Mardi 23 juin 2015Session TraductionMulti-alignement vs bi-alignement : à plusieurs, c’est mieux !
Olivier KraifRésumé : Dans cet article, nous proposons une méthode originale destinée à
effectuer l’alignement d’un corpus multi-parallèle, i.e. comportant plus
de deux langues, en prenant en compte toutes les langues simultanément
(et non en composant une série de bi-alignements indépendants). Pour ce
faire, nous nous appuyons sur les réseaux de correspondances lexicales
constitués par les transfuges (chaînes identiques) et cognats (mots
apparentés), et nous montrons comment divers tuilages des couples de
langues permettent d’exploiter au mieux les ressemblances superficielles
liées aux relations génétiques interlinguistiques. Nous évaluons notre
méthode par rapport à une méthode de bi-alignement classique, et
montrons en quoi le multi-alignement permet d’obtenir des résultats à la
fois plus précis et plus robustes. Mot(s) clés libre(s) : traduction, traitement automatique du langage naturel, taln2015
|
Accéder à la ressource
|
|
02c - Apprentissage discriminant des modèles continus de traduction (taln2015)
/ Canal-u.fr
Voir le résumé
Voir le résumé
Sessions orales TALN 2015 – Mardi 23 juin 2015Session TraductionApprentissage discriminant des modèles continus de traduction
Quoc-Khanh Do, Alexandre Allauzen et François YvonRésumé : Alors que les réseaux neuronaux occupent une place de plus en plus importante dans le traitement automatique des langues, les méthodes d’apprentissage actuelles utilisent pour la plupart des critères qui sont décorrélés de l’application. Cet article propose un nouveau cadre d’apprentissage discriminant pour l’estimation des modèles continus de traduction. Ce cadre s’appuie sur la définition d’un critère d’optimisation permettant de prendre en compte d’une part la
métrique utilisée pour l’évaluation de la traduction et d’autre part l’intégration de ces modèles au sein des systèmes de traduction automatique. De plus cette méthode d’apprentissage est comparée aux critères existants d’estimation que sont le maximum de vraisemblance et l’estimation contrastive bruitée. Les expériences menées sur la tâches de traduction des séminaires TED Talks de l’anglais vers le français montrent la pertinence d’un cadre discriminant d’apprentissage mais dont les performances sont liées au choix d’une stratégie d’initialisation adéquate. Nous montrons qu’avec une initialisation judicieuse des gains significatifs en terme de scorebleu peuvent être obtenus. Mot(s) clés libre(s) : traduction, traitement automatique du langage naturel, taln2015
|
Accéder à la ressource
|
|
03a - Désambiguïsation d’entités pour l’induction non supervisée de schémas événementiels (taln2015)
/ Canal-u.fr
Voir le résumé
Voir le résumé
Sessions orales TALN 2015 – Mardi 23 juin 2015Session Désambiguïsation
Désambiguïsation d’entités pour l’induction non supervisée de schémas événementiels
Kiem-Hieu Nguyen, Xavier Tannier, Olivier Ferret et Romaric BesançonRésumé : Cet article présente un modèle génératif pour l’induction non supervisée
d’événements. Les précédentes méthodes de la littérature utilisent
uniquement les têtes des syntagmes pour représenter les entités.
Pourtant, le groupe complet (par exemple, « un homme armé ») apporte une
information plus discriminante (que « homme »). Notre modèle tient
compte de cette information et la représente dans la distribution des
schémas d’événements. Nous montrons que ces relations jouent un rôle
important dans l’estimation des paramètres, et qu’elles conduisent à des
distributions plus cohérentes et plus discriminantes. Les résultats
expérimentaux sur le corpus de MUC-4 confirment ces progrès. Mot(s) clés libre(s) : traitement automatique du langage naturel, taln2015, Désambiguïsation
|
Accéder à la ressource
|
|
03b - Création rapide et efficace d’un système de désambiguïsation lexicale pour une langue peu dotée (taln2015)
/ Canal-u.fr
Voir le résumé
Voir le résumé
Sessions orales TALN 2015 – Mardi 23 juin 2015Session Désambiguïsation
Création rapide et efficace d’un système de désambiguïsation lexicale pour une langue peu dotée Mohammad Nasiruddin, Andon Tchechmedjiev, Hervé Blanchon et Didier SchwabRésumé : Cet article présente un modèle génératif pour l’induction non supervisée
d’événements. Les précédentes méthodes de la littérature utilisent
uniquement les têtes des syntagmes pour représenter les entités.
Pourtant, le groupe complet (par exemple, « un homme armé ») apporte une
information plus discriminante (que « homme »). Notre modèle tient
compte de cette information et la représente dans la distribution des
schémas d’événements. Nous montrons que ces relations jouent un rôle
important dans l’estimation des paramètres, et qu’elles conduisent à des
distributions plus cohérentes et plus discriminantes. Les résultats
expérimentaux sur le corpus de MUC-4 confirment ces progrès. Mot(s) clés libre(s) : traitement automatique du langage naturel, taln2015, Désambiguïsation
|
Accéder à la ressource
|
|
03c - Désambiguïsation lexicale à base de connaissances par sélection distributionnelle et traits sémantiques (Article RECITAL) (taln2015)
/ Canal-u.fr
Voir le résumé
Voir le résumé
Sessions orales TALN 2015 – Mardi 23 juin 2015Session Désambiguïsation
Désambiguïsation lexicale à base de connaissances par sélection distributionnelle et traits sémantiques (Article RECITAL)
Mokhtar Boumedyen BillamiRésumé : La désambiguïsation lexicale permet d’améliorer de nombreuses
applications en traitement automatique des langues (TAL) comme la
recherche d’information, l’extraction d’information, la traduction
automatique, ou la simplification lexicale de textes. Schématiquement,
il s’agit de choisir quel est le sens le plus approprié pour chaque mot
d’un texte. Une des approches classiques consiste à estimer la
similarité sémantique qui existe entre les sens de deux mots puis de
l’étendre à l’ensemble des mots du texte. La méthode la plus directe
donne un score de similarité à toutes les paires de sens de mots puis
choisit la chaîne de sens qui retourne le meilleur score (on imagine la
complexité exponentielle liée à cette approche exhaustive). Dans cet
article, nous proposons d’utiliser une méta-heuristique d’optimisation
combinatoire qui consiste à choisir une fenêtre contenant les voisins
les plus proches par sélection distributionnelle autour du mot à
désambiguïser. Le test et l’évaluation de notre méthode portent sur un
corpus écrit en langue française en se servant du réseau sémantique
BabelNet. Le taux d’exactitude obtenu est de 78% sur l’ensemble des noms
et des verbes choisis pour l’évaluation. Mot(s) clés libre(s) : traitement automatique du langage naturel, taln2015, Désambiguïsation
|
Accéder à la ressource
|
|
045 - Les rapports franco-allemands à l’épreuve de la question algérienne (1955-1963)
/ ENS-LSH/SCAM
/ 21-06-2006
/ Canal-U - OAI Archive
ENS-LSH/SCAM
Voir le résumé
Voir le résumé
par Nassima Bougherara (Université de Grenoble 3)De la construction d’une identité nationale à la guerre d’indépendance algérienne (1)France, guerre d'algérie et enjeux internationaux : session thématique (prés. Raphaëlle Branche)Colloque pour une histoire critique et citoyenne - le cas de l'histoire franco-algérienne Cette recherche spécifique s’élabore au croisement de plusieurs perspectives historiques et couvre la période des accords de Paris (1955) au traité de l’Élysée (1963). La politique de soutien pratiquée en Allemagne fédérale à l’égard de la Fédération de France du Front de libération nationale, de 1956 à 1962, et les implications qu’elle provoque sur l’évolution des rapports franco-allemands sont donc étudiées dans le contexte de la guerre froide, de la décolonisation et de la construction de l’Europe.L’énoncé des sujets abordés dans cette étude contingente la réflexion sur le terrain de l’histoire politique qui privilégie la démarche discursive et narrative et s’efforce de révéler la trame complexe qui sous-tend les rapports de pouvoir et les conflits d’intérêts qui opposent des stratégies institutionnelles à des logiques de groupes de pressions. Soucieuse d’éviter de faire double emploi avec les études déjà effectuées, animée par le souci d’appréhender - au-delà du miroir - d’autres questions plus complexes dont certains documents étaient porteurs d’indices, j’ai délibérément privilégié l’exploitation des archives diplomatiques réservées. Incomplets et encombrants, ces documents trahissent par leur présence d’autres vides à combler et posent la question de leur emploi et de leur réajustement pour rendre possible une narration du réel. L’enregistrement et l’édition des documents imprimés offrent, par ailleurs, une version sélective et « diplomatiquement correcte » de ce qui fut. La documentation officielle renseigne alors sur le mode de fonctionnement des administrations concernées ainsi que sur leur fabrication de l’histoire. Celle « autorisée » - obtenue sous dérogation - me pose question : quelle histoire me permet-on, dans une certaine mesure, de fabriquer à mon tour et pourquoi ?En 1955, les autorités fédérales ont rétabli les relations diplomatiques avec l’URSS, elles appliquent la doctrine « Hallstein » et ne souhaitent pas prendre officiellement position en faveur d’une Algérie française car elles craignent de voir les pays non-alignés, les États africains et arabes rejoindre l’URSS et reconnaître la RDA. L’aspiration à la réunification allemande et l’inquiétude de voir les forces alliées britanniques et américaines se désengager de l’Europe occidentale, accrue par celle d’une hégémonie soviétique sur le flanc sud de l’Europe, induisent les dirigeants allemands à développer des stratégies de consolidation de la construction européenne et d’élargissement de leurs sphères d’influence dans le monde. Ils optent pour une neutralité pragmatique à l’égard des autorités françaises et de « laisser-faire » face aux actions du FLN installé sur leur territoire, au cours de l’année 1957.Les efforts de propagande et l’intense activité diplomatique du Quai d’Orsay que révèlent de nombreux documents, confirment un intérêt croissant pour la question algérienne. Ils traduisent le mécontentement grandissant et le désarroi de Paris face à l’internationalisation du conflit. Mais, le refus larvé de l’administration allemande de répondre aux injonctions françaises et la question difficile de la coopération franco-allemande en matière de défense nucléaire aggravent peu à peu le contentieux entre les deux États. Les témoignages et les documents le confirment, c’est sous couvert diplomatique et discrètement que les interventions allemandes ont lieu et que les actions sont contrôlées : c’est donc dans ce cadre que l’on s’interroge aussi sur l’enjeu que pouvait représenter une Algérie indépendante pour la RFA, sur les motivations et les perspectives des hommes politiques allemands, au tournant des années 1960, face aux réactions et aux interventions de l’État français. Quelle signification avait alors la politique allemande officielle dont la caractéristique principale semblait être celle de la réserve ? Quelles en étaient les implications ?La politique franco-algérienne, « domaine réservé » du général de Gaulle et de son entourage très proche, prend un cours décisif à partir de 1958. Ce cours est déterminé par des enjeux qui semblent échapper aux indépendantistes eux-mêmes. Ils échappent aussi aux dirigeants allemands et déterminent les rapports franco-allemands dans les secteurs de la coopération économique, mais plus particulièrement dans les domaines de la Défense et de la recherche atomique. À partir de 1959, en France, le pouvoir raisonne selon deux perspectives : celle de la menace d’une confrontation nucléaire entre deux systèmes politiques et économiques antagonistes, d’une part, et celle du processus de décolonisation et d’indépendance généralisé, d’autre part. De nouvelles orientations se dessinent en politique étrangère qui se fixent pour objectif majeur de lever les obstacles anachroniques qui font barrage au recouvrement de la puissance française : il s’agit de régler la question du conflit algérien et de mettre fin à l’hostilité séculaire franco-allemande.Equipe technique Directeur de la production: Christophe Porlier, Responsable des moyens techniques: Francis Ouedraogo, Réalisation : Service commun audiovisuel et multimédia : Mathias Chassagneux, Julien Lopez, Son: Xavier comméat, Encodage-Diffusion Web : Jean-Claude Troncard Mot(s) clés libre(s) : algérie (1954-1962 - guerre d'algérie), relations extérieures (allemagne), relations extérieures (france), traité franco-allemand de l'élysée (1963)
|
Accéder à la ressource
|
|
04a - Grammaires phrastiques et discursives fondées sur TAG : une approche de D-STAG avec les ACG (taln2015)
/ Canal-u.fr
Voir le résumé
Voir le résumé
Sessions orales TALN 2015 – Mardi 23 juin 2015Session Syntaxe et paraphraseGrammaires phrastiques et discursives fondées sur TAG : une approche de D-STAG avec les ACG
Laurence Danlos, Aleksandre Maskharashvili et Sylvain Pogodalla
Résumé : Nous
présentons une méthode pour articuler grammaire de phrase et grammaire
de discours. Cette méthode permet à la fois l’intégration des deux
grammaires sans recourir à une étape de traitement intermédiaire et de
construire des structures discursives qui ne soient pas des arbres mais
des graphes orientés acycliques (DAG). Notre analyse s’appuie sur une
approche de l’analyse discursive utilisant les Grammaires d’Arbres
Adjoint (TAG), Discourse Synchronous TAG (D-STAG). Nous utilisons pour
ce faire un encodage des TAG dans les Grammaires Catégorielles
Abstraites (ACG). Cela permet d’une part d’utiliser l’ordre supérieur
pour l’interprétation sémantique afin de construire des structures qui
soient des DAG et non des arbres, et d’autre part d’utiliser les
propriétés de composition d’ACG afin d’articuler naturellement grammaire
phrastique et grammaire discursive. Tous les exemples peuvent être
exécutés avec le logiciel approprié. Mot(s) clés libre(s) : traitement automatique du langage naturel, taln2015
|
Accéder à la ressource
|
|