Version imprimable

Ressource documentaire

09b - Extraction automatique de relations sémantiques dans les définitions : approche hybride, construction d’un corpus de relations sémantiques pour le français (taln2015) (en Français)


URL d'accès : http://www.canal-u.tv/?redirectVideo=18702...

Droits : Droits réservés à l'éditeur et aux auteurs

23-06-2015

Description : Sessions orales TALN 2015 – Mardi 23 juin 2015Session SémantiqueExtraction automatique de relations sémantiques dans les définitions : approche hybride, construction d’un corpus de relations sémantiques pour le français Emmanuel Cartier Résumé : Cet article présente une expérimentation visant à construire une ressource sémantique pour le français contemporain à partir d’un corpus d’environ un million de définitions tirées de deux ressources lexicographiques (Trésor de la Langue Française, Wiktionary) et d’une ressource encyclopédique (Wikipedia). L’objectif est d’extraire automatiquement dans les définitions différentes relations sémantiques : hyperonymie, synonymie, méronymie, autres relations sémantiques. La méthode suivie combine la précision des patrons lexico-syntaxiques et le rappel des méthodes statistiques, ainsi qu’un traitement inédit de canonisation et de décomposition des énoncés. Après avoir présenté les différentes approches et réalisations existantes, nous détaillons l’architecture du système et présentons les résultats : environ 900 000 relations d’hyperonymie et près de 100 000 relations de synonymie, avec un taux de précision supérieur à 90% sur un échantillon aléatoire de 500 relations. Plus de 2 millions de prédications définitoires ont également été extraites.
Mots-clés libres : traitement automatique du langage naturel,taln2015
TECHNIQUE

Type : image en mouvement
Format : video/x-flv


Source(s) : 
rtmpt://fms2.cerimes.fr:80/vod/centre_d_enseignement_multimedia_universitaire_c_e_m_u_universit/09b.extraction.automatique.de.relations.s.mantiques.dans.les.d.finitions.approche.hybride.construction.da.un.corpus.de.relations.s.mantiques.pour.le.fran.ais.taln2015._18702/09b_cartier_sd.mp4


Entrepôt d'origine : Canal-u.fr
Identifiant : oai:canal-u.fr:18702
Type de ressource : Ressource documentaire
Exporter au format XML

Ressource pédagogique

09b - Extraction automatique de relations sémantiques dans les définitions : approche hybride, construction d’un corpus de relations sémantiques pour le français (taln2015) (en Français)


URL d'accès : http://www.canal-u.tv/video/centre_d_enseignement_...
rtmpt://fms2.cerimes.fr:80/vod/centre_d_enseigneme...
http://www.canal-u.tv/video/centre_d_enseignement_...

Identifiant de la fiche : 18702
Schéma de la métadonnée : LOMv1.0, LOMFRv1.0

Droits : libre de droits, gratuit
Droits réservés à l'éditeur et aux auteurs

Description : Sessions orales TALN 2015 – Mardi 23 juin 2015Session SémantiqueExtraction automatique de relations sémantiques dans les définitions : approche hybride, construction d’un corpus de relations sémantiques pour le français Emmanuel Cartier Résumé : Cet article présente une expérimentation visant à construire une ressource sémantique pour le français contemporain à partir d’un corpus d’environ un million de définitions tirées de deux ressources lexicographiques (Trésor de la Langue Française, Wiktionary) et d’une ressource encyclopédique (Wikipedia). L’objectif est d’extraire automatiquement dans les définitions différentes relations sémantiques : hyperonymie, synonymie, méronymie, autres relations sémantiques. La méthode suivie combine la précision des patrons lexico-syntaxiques et le rappel des méthodes statistiques, ainsi qu’un traitement inédit de canonisation et de décomposition des énoncés. Après avoir présenté les différentes approches et réalisations existantes, nous détaillons l’architecture du système et présentons les résultats : environ 900 000 relations d’hyperonymie et près de 100 000 relations de synonymie, avec un taux de précision supérieur à 90% sur un échantillon aléatoire de 500 relations. Plus de 2 millions de prédications définitoires ont également été extraites.
Mots-clés libres : traitement automatique du langage naturel, taln2015

Classification UNIT : Sciences humaines et sociales pour l'ingénieur > Langues
Classification : Langues > Linguistique
Indice(s) Dewey: Traduction automatique (418.02)
Informatique appliquée à la linguistique (410.285)


PEDAGOGIQUE

Type pédagogique : cours / présentation

Niveau : enseignement supérieur



TECHNIQUE


Type de contenu : image en mouvement
Format : video/x-flv
Taille : 138.02 Mo
Durée d'exécution : 28 minutes 45 secondes



RELATIONS


Cette ressource fait partie de :
  • Session sémantique (taln 2015)



Entrepôt d'origine : Canal-u.fr
Identifiant : oai:canal-u.fr:18702
Type de ressource : Ressource pédagogique
Exporter au format XML