CoMeRe.org : corpuscomere

Accueil » 2014

Yearly Archives: 2014

Parution article sur le projet CoMeRe

L’article présentant le projet CoMeRe vient de paraître dans la revue JLCL (Journal of Language Technology and
Computational Linguistics):

Chanier,T., Poudat,C., Sagot, B., Antoniadis, G., Wigham,C. R. , Hriba, L.,Longhi, J. & Seddah, D. (2014) « The CoMeRe corpus for French: structuring and annotating heterogeneous CMC genres ». Special issue on « Building And Annotating Corpora Of Computer-Mediated Discourse: Issues and Challenges at the Interface of Corpus and Computational Linguistics ». JLCL (Journal of Language Technology and Computational Linguistics). pp1-31. http://www.jlcl.org/2014_Heft2/Heft2-2014.pdf

Publicités

Présentation avancées projet CoMeRe : assemblée générale consortium Corpus-écrits

Le 21 novembre 2014 s’est tenue l’assemblée générale du Consortium Corpus-écrits. A cette occasion , le projet CoMeRe a présenté ses avancées en insistant particulièrement sur la coopération Corpus-écrits-Ortolang et la celle avec le groupe européen TEI-CMC.

Le diaporama est ici :

Ateliers formation corpus-écrits

les 19 et 20 novembre 2014 à Paris
Les groupes de travail « Corpus multilingues » (GT 5), « Corpus d’écrits modernes et prise en compte de nouveaux modes de communication » (GT 7), « Annotation du plus haut niveau : syntaxe, sémantique, référence » (GT 8) et « Exploration de corpus » (GT 10) du consortium corpus écrits organisent une session d’ateliers de formation les 19 et 20 novembre 2014 à Paris. Ces ateliers sont ouverts aux membres des groupes de travail ou à toute personne intéressée. Nous accueillerons 40 personnes maximum.

  • Unitex Unitex et CasSys
  • Alignement de corpus parallèleset comparables (méthodes,formats, outils)
  • DTMVic avancé
  • TXM avancé
  • ScienQuest
  • Hyperbase web

Le consortium financera les frais de mission des membres des groupes de travail, une demande de prise en charge pourra être examinée pour les autres.

Pour en savoir plus : http://corpusecrits.huma-num.fr/2014/10/28/ateliers-de-formation-19-20-novembre-2014/

Assemblée générale de Corpus-écrits

L’assemblée générale annuelle de Corpus-écrits se tiendra à Paris le

vendredi 21 novembre 2014 à la halle aux Farines, Université Paris 7 – Paris Diderot – 75013.

Formation sur la chaîne de traitements sur les corpus au même endroit les 19 et 20 novembre. A noter dans vos agendas !

Tous les membres du GT7 de Corpus-écrits sont concernés. Pour une prise ne charge éventuelle des déplacements, contactez Thierry Chanier.

Programme provisoire (en date du 21 octobre)

Voir le programme définitif ici : http://corpusecrits.huma-num.fr/2014/06/26/assemblee-generale-consortium-corpus-ecrits/

  • Présentation rapide  du C.C.E. et de l’année 2015
  • Corpus en ligne et c collaboration avec ORTOLANG, ex :COMERE
    –    Thierry Chanier
  • Présentation de la formation « Chaînes d’annotations» des  19 et 20 novembre :
    –    Céline Poudat
  • Table ronde sur l ‘évaluation des corpus :
    –    Franck Neveu + invitations : Olivier Baude, Dominique Boutet
  • Présentation DARIAH
    –    Invitation Sophie David
  • Les aspects juridiques
    –    Présentation Bernard Colombat (si disponible)
  • Travail du GT 8 : finalisation d’un corpus financé par le C.C.E.
    –    Amalia Todirascu et Agnès Tutin
  • Présentation de la table des usages
    –    Céline Poudat

Après atelier TEI-CMC aux journées DARIAH à Rome

Du 17 au 19 septembre 2014 se sont tenus les journées DARIAH-VCC à Rome.
Le groupe s’est réuni à cette occasion.

Banque de corpus CoMeRE : son adresse – permalien

ORTOLANG vient de nous donner l’adresse de la banque de corpus CoMeRe :

http://hdl.handle.net/11403/comere

(l’identifiant 11403 correspondant à ORTOLANG)

A l’occasion de l’atelier TEI-CMC des journées DARIAH en septembre, l’équipe CoMeRe ouvre une première version de sa banque de corpus. Bien sûr l’intégralité des corpus sont à la fois organisés suivant des standards (ici TEI) et en accès libre (OpenData), avec des licences permettant de les réutiliser dans d’autres travaux de recherche (sinon à qui bon parler d’accès libre, lorsque le lecteur ne peut que consulter sans pouvoir réutiliser !).

Le site se met en place. Il faut donc le considérer comme étant dans une version provisoire : l’interface est susceptible de changer, les données seront transférées sur d’autres serveurs ORTOLANG. Mais l’intérêt du permalien (pour la banque de corpus, comme pour les autres permaliens de chacun des corpus développés par les membres du projet) est que ceux-ci ne changeront pas.

Donc les lecteurs peuvent venir voir, tout en étant indulgent pour cette version encore expérimentale. Les créateurs des corpus CoMeRe peuvent d’ores et déjà venir sur le site pour récupérer la référence de leurs oeuvres. Nous ferons plus tard une annonce officielle de l’ouverture de la banque de corpus CoMeRe. Avant la fin de l’année, d’autres corpus viendront s’y ajouter, dont des corpus de discussions Wikipedia et des corpus multimodaux.

Articles : Presentation CoMeRe et traitements sur Tweets

Voici deux articles, écrits par des membres de CoMeRe, accessibles dans les archives ouvertes (HAL) en version préprint :

  • Chanier, T., Poudat, C., Sagot, B., Antoniadis, B., Wigham, C.R., Hriba L., Longhi,J. & Seddah, D. (to appear, 2014). « The CoMeRe corpus for French: structuring and annotating heterogeneous CMC genres ». Journal of Language Technology and Computational Linguistics (JLCL). Special Issue : « Building And Annotating Corpora Of Computer-Mediated Discourse: Issues and Challenges at the Interface of Corpus and Computa-tional Linguistics » (ed. by Michael Beißwenger, Nelleke Oostdijk, Angelika Storrer & Henk van den Heuvel). [http://halshs.archives-ouvertes.fr/halshs-00953507]
  • Djemili S., Longhi J., Marinica C., Kotzinos D., Sarfati G.-E. (to appear, 2014). What does Twitter have to say about ideology? « NLP 4 CMC: Natural Language Processing for Computer-Mediated Communication / Social Media » – Pre-conference workshop at Konvens2014 , Germany (2014)
    http://halshs.archives-ouvertes.fr/halshs-01058867