Version imprimable

Ressource documentaire

09c - Déclasser les voisins non sémantiques pour améliorer les thésaurus distributionnels (taln2015) (en Français)


URL d'accès : http://www.canal-u.tv/?redirectVideo=18703...

Droits : Droits réservés à l'éditeur et aux auteurs

23-06-2015

Description : Sessions orales TALN 2015 – Mardi 23 juin 2015Session SémantiqueDéclasser les voisins non sémantiques pour améliorer les thésaurus distributionnels Olivier Ferret Résumé : La plupart des méthodes d’amélioration des thésaurus distributionnels se focalisent sur les moyens – représentations ou mesures de similarité – de mieux détecter la similarité sémantique entre les mots. Dans cet article, nous proposons un point de vue inverse : nous cherchons à détecter les voisins sémantiques associés à une entrée les moins susceptibles d’être liés sémantiquement à elle et nous utilisons cette information pour réordonner ces voisins. Pour détecter les faux voisins sémantiques d’une entrée, nous adoptons une approche s’inspirant de la désambiguïsation sémantique en construisant un classifieur permettant de différencier en contexte cette entrée des autres mots. Ce classifieur est ensuite appliqué à un échantillon des occurrences des voisins de l’entrée pour repérer ceux les plus éloignés de l’entrée. Nous évaluons cette méthode pour des thésaurus construits à partir de cooccurrents syntaxiques et nous montrons l’intérêt de la combiner avec les méthodes décrites dans (Ferret, 2013) selon une stratégie de type vote.
Mots-clés libres : traitement automatique du langage naturel,taln2015
TECHNIQUE

Type : image en mouvement
Format : video/x-flv


Source(s) : 
rtmpt://fms2.cerimes.fr:80/vod/centre_d_enseignement_multimedia_universitaire_c_e_m_u_universit/09c.d.classer.les.voisins.non.s.mantiques.pour.am.liorer.les.th.saurus.distributionnels.taln2015._18703/09c_ferret_sd.mp4


Entrepôt d'origine : Canal-u.fr
Identifiant : oai:canal-u.fr:18703
Type de ressource : Ressource documentaire
Exporter au format XML

Ressource pédagogique

09c - Déclasser les voisins non sémantiques pour améliorer les thésaurus distributionnels (taln2015) (en Français)


URL d'accès : http://www.canal-u.tv/video/centre_d_enseignement_...
rtmpt://fms2.cerimes.fr:80/vod/centre_d_enseigneme...
http://www.canal-u.tv/video/centre_d_enseignement_...

Identifiant de la fiche : 18703
Schéma de la métadonnée : LOMv1.0, LOMFRv1.0

Droits : libre de droits, gratuit
Droits réservés à l'éditeur et aux auteurs

Description : Sessions orales TALN 2015 – Mardi 23 juin 2015Session SémantiqueDéclasser les voisins non sémantiques pour améliorer les thésaurus distributionnels Olivier Ferret Résumé : La plupart des méthodes d’amélioration des thésaurus distributionnels se focalisent sur les moyens – représentations ou mesures de similarité – de mieux détecter la similarité sémantique entre les mots. Dans cet article, nous proposons un point de vue inverse : nous cherchons à détecter les voisins sémantiques associés à une entrée les moins susceptibles d’être liés sémantiquement à elle et nous utilisons cette information pour réordonner ces voisins. Pour détecter les faux voisins sémantiques d’une entrée, nous adoptons une approche s’inspirant de la désambiguïsation sémantique en construisant un classifieur permettant de différencier en contexte cette entrée des autres mots. Ce classifieur est ensuite appliqué à un échantillon des occurrences des voisins de l’entrée pour repérer ceux les plus éloignés de l’entrée. Nous évaluons cette méthode pour des thésaurus construits à partir de cooccurrents syntaxiques et nous montrons l’intérêt de la combiner avec les méthodes décrites dans (Ferret, 2013) selon une stratégie de type vote.
Mots-clés libres : traitement automatique du langage naturel, taln2015

Classification UNIT : Sciences humaines et sociales pour l'ingénieur > Langues
Classification : Langues > Linguistique
Indice(s) Dewey: Traduction automatique (418.02)
Informatique appliquée à la linguistique (410.285)


PEDAGOGIQUE

Type pédagogique : cours / présentation

Niveau : enseignement supérieur



TECHNIQUE


Type de contenu : image en mouvement
Format : video/x-flv
Taille : 147.46 Mo
Durée d'exécution : 30 minutes 43 secondes



RELATIONS


Cette ressource fait partie de :
  • Session sémantique (taln 2015)



Entrepôt d'origine : Canal-u.fr
Identifiant : oai:canal-u.fr:18703
Type de ressource : Ressource pédagogique
Exporter au format XML