CoMeRe.org : corpuscomere

Accueil » 2013 » novembre

Monthly Archives: novembre 2013

Interface CoMeRe – TXM

A l’occasion de la session de formation Corpus-écrits en décembre 2013, sur l’exploration / annotation de corpus (dont des extraits des corpus CoMeRe) s’engage un dialogue avec les développeurs de TXM (Serge Heiden) destiné à définir sous quelles conditions les futurs corpus CoMeRe pourront être aisément chargés dans TXM pour traitement lexical.

Dans une étape ultérieure une connexion MElt (segmentation + annotation de type POS) vers TXM pourrait se faire. Nous aurions ainsi une chaîne complète de traitement de surface avec outils lexicaux.

Aux fins de réflexion, vous trouverez sur cette page quelques cahiers des charge décrivant comment l’import de différents formats de corpus de CAHIER pourrait se faire dans TXM (brouillons encore).

Les personnes du groupe Nouvelles formes de communication et/ ou du projet CoMeRe assistant à cette formation pourront profiter de l’occasion pour discuter du type de cahier des charges CoMeRE-TXM qui pourrait être élaboré

Publicités

Formation exploration de corpus avec des extraits de corpus CoMeRe

Les groupes de travail de l’IR Corpus-Ecrit, GT 5 (Corpus multilingues), 7 (Corpus d’écrits modernes et prise en compte de nouveaux modes de communication) et 10 (Exploration de corpus) organisent les 9 et 10 décembre 2013, à Paris, une formation aux outils d’exploration de corpus. Serge Heiden et Benoit Sagot utiliseront leurs outils (TXM, analyseur) sur des corpus CoMeRe