CoMeRe.org : corpuscomere

Accueil » Traitements

Traitements

Animateurs : Georges Antoniadis, Benoît Sagot

Membres : Georges ANTONIADIS (LIDILEM, Grenoble), Achille FALAISE (LIG, Grenoble), Eleni KOGKITSIDOU (LIDILEM, Grenoble), Gudrun LEDEGEN (PREFics, Rennes), Fiammetta NAMER (ATILF, Nancy), Benoît SAGOT (ALPAGE, Paris)

Page du groupe de travail traitements

L’objectif de ce groupe est de définir les types et le niveau des traitements à appliquer aux corpus du projet, et proposer la/les chaîne(s) de logiciels susceptibles de les réaliser. Le but visé est l’enrichissement le contenu des corpus bruts du projet et la facilitation de leurs exploitations ultérieures.

De CoMeRe vers TXM

30 novembre 2013 : à l’occasion de la session de formation Corpus-écrits en décembre 2013, sur l’exploration / annotation de corpus (dont des extraits des corpus CoMeRe) s’engage un dialogue avec les développeurs de TXM (Serge Heiden) destiné à définir sous quelles conditions les futurs corpus CoMeRe pourront être aisément chargés dans TXM pour traitement lexical. Dans une étape ultérieure une connexion MElt (segmentation + annotation de type POS) vers TXM pourrait se faire. Nous aurions ainsi une chaîne complète de traitement de surface avec outils lexicaux. Aux fins de réflexion, voici quelques cahiers des charge décrivant comment l’import de différents formats de corpus TEI pourrait se faire dans TXM (brouillons encore).

Publicités

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

%d blogueurs aiment cette page :