CoMeRe.org : corpuscomere

Accueil » Coordination

Category Archives: Coordination

CORLI : groupe MULTICOM

Le groupe de travail  » Nouvelles formes de communication » (GT7) du consortium Corpus-écrits clôt ses activités avec la fin du consortium Corpus-écrits.

Nous vous invitons maintenant à participer au nouveau groupe de travail MULTICOM (Multimodalité et nouvelles formes de communication) du consortium CORLI (Corpus, Langues et Interactions) de Huma-Num.

Quelques infos :

Publicités

Contribution de Kun Jin au projet CoMeRe

photo - Kun JIN Kun Jin termine son travail dans le projet CoMeRe en cette fin du mois de janvier 2015. Kun a été embauché comme ingénieur sur ce projet depuis le 1 septembre 2013. Ces 17 mois de travail ont été financés (par ordre de montants financiers décroissants) par ORTOLANG, le consortium Corpus-écrits et l’unité de recherche LRL de l’université Blaise Pascal. L’essentiel de ses contrats dépendait de ORTOLANG (CNRS région Est)
Kun a été recruté après avoir obtenu un master en sciences du langage, spécialité Ingénierie Linguistique, de l’université Paris 3.
Sa contribution a été essentielle au déroulement du projet CoMeRe. Il a notamment :

  • assuré la conversion de toutes les données fournies par les différents chercheurs de CoMeRe dans des formats divers (Tableurs, XML maison, XML-Mulce-struct) pour les transformer en corpus formatés suivant le modèle TEI-CMC
  • extrait toutes les données brutes provenant du site Wikipédia se rapportant à une sélection d’articles et de discussions ayant fait l’objet de controverses scientifiques. Ces données et les différentes versions archivées ont du être réorganisées en un tout cohérent, puis transformées dans le format TEI-CMC. Des calculs spécifiques sur la contribution des auteurs ont été accomplis.
  •  contribué au développement du modèle TEI-CMC, en partenariat avec les membres de CoMeRe et les collègues allemands et italiens du groupe de travail TEI-CMC. Il est en particulier l’auteur de la première version ODD décrivant ce modèle, tout comme l’auteur du schéma RNG validant tous les corpus CoMeRe.
  • assuré avec Paul Lotin (LRL), le transfert de la première vague de corpus CoMeRe vers le serveur ORTOLANG, travail qui inclut le développement du site http://www.ortolang.fr/11403/comere/ et des permaliens associés.
  •  participé aux différentes réunions du projet CoMeRe, ainsi qu’à des réunions en Allemagne et en Italie pour des « workshop » ou journées DARIAH où le groupe TEI-CMC présentait ses avancées.

Kun Jin a travaillé en collaboration permanente avec :

  •  les membres européens du groupe TEI-CMC,
  •  les responsables de dépôts de chacun des corpus CoMeRe, eux-mêmes membres d’une dizaine d’unités de recherche différentes en France,
  •  les collègues responsables du grand équipement ORTOLANG,
  •  les coordinateur et ingénieur réseau participant à CoMeRe au LRL (Thierry Chanier et Paul Lotin).

Kun Jin est notamment l’auteur ou co-auteur de :

  • Poudat,C.,  Grabar , N. Kun, J., &  Paloque-Berges, C. (2015). Corpus Wikiconflits extraits de Wikipedia. In Chanier T. (ed) Banque de corpus CoMeRe. Ortolang.fr : Nancy. [http://hdl.handle.net/11403/comere/cmr-wikiconflits] (corpus non encore accessible à la date de publication de ce message)
  • Kun, J. (2014). Schéma RNG des corpus CoMeRe suivant le modèle TEI-CMC. CoMeRe.org : http://lrl-diffusion.univ-bpclermont.fr/11403/comere/tei_cmr.rng
  • Kun, J. & Chanier, T. (2015). Schéma ODD du modèle TEI-CMC, version 1. http://wiki.tei-c.org/index.php/File:Tei-cmc-odd.zip
  •  Poudat, C, Jin, K., & Chanier, T. (2014). Manuel du corpus wikiconflits (cmr-wikiconflits-tei-v1-manuel.pdf) .In XX., Corpus Wikiconflits extraits de Wikipedia. Dans banque de corpus CoMeRe.org . Ortolang.fr : Nancy. [http://www.ortolang.fr/11403/comere/ , cmr-wikiconflits-tei-v1]
  • Jin, K. & Chanier, T. (2014). Adaptation des conventions de transcription de Mulce vers la TEI chapitre 8 « transcriptions of speech ». Projet CoMeRe (Communication Médiée par les Réseaux), IR Corpus-écrits. [ http://comere.org/ , cmr-mulcetotei-oral ]

Les membres du projet CoMeRe remercient chaleureusement Kun Jin pour sa contribution essentielle au projet CoMeRe et à son extension TEI-CMC.

Parution article sur le projet CoMeRe

L’article présentant le projet CoMeRe vient de paraître dans la revue JLCL (Journal of Language Technology and
Computational Linguistics):

Chanier,T., Poudat,C., Sagot, B., Antoniadis, G., Wigham,C. R. , Hriba, L.,Longhi, J. & Seddah, D. (2014) « The CoMeRe corpus for French: structuring and annotating heterogeneous CMC genres ». Special issue on « Building And Annotating Corpora Of Computer-Mediated Discourse: Issues and Challenges at the Interface of Corpus and Computational Linguistics ». JLCL (Journal of Language Technology and Computational Linguistics). pp1-31. http://www.jlcl.org/2014_Heft2/Heft2-2014.pdf

Présentation avancées projet CoMeRe : assemblée générale consortium Corpus-écrits

Le 21 novembre 2014 s’est tenue l’assemblée générale du Consortium Corpus-écrits. A cette occasion , le projet CoMeRe a présenté ses avancées en insistant particulièrement sur la coopération Corpus-écrits-Ortolang et la celle avec le groupe européen TEI-CMC.

Le diaporama est ici :

Ateliers formation corpus-écrits

les 19 et 20 novembre 2014 à Paris
Les groupes de travail « Corpus multilingues » (GT 5), « Corpus d’écrits modernes et prise en compte de nouveaux modes de communication » (GT 7), « Annotation du plus haut niveau : syntaxe, sémantique, référence » (GT 8) et « Exploration de corpus » (GT 10) du consortium corpus écrits organisent une session d’ateliers de formation les 19 et 20 novembre 2014 à Paris. Ces ateliers sont ouverts aux membres des groupes de travail ou à toute personne intéressée. Nous accueillerons 40 personnes maximum.

  • Unitex Unitex et CasSys
  • Alignement de corpus parallèleset comparables (méthodes,formats, outils)
  • DTMVic avancé
  • TXM avancé
  • ScienQuest
  • Hyperbase web

Le consortium financera les frais de mission des membres des groupes de travail, une demande de prise en charge pourra être examinée pour les autres.

Pour en savoir plus : http://corpusecrits.huma-num.fr/2014/10/28/ateliers-de-formation-19-20-novembre-2014/

Assemblée générale de Corpus-écrits

L’assemblée générale annuelle de Corpus-écrits se tiendra à Paris le

vendredi 21 novembre 2014 à la halle aux Farines, Université Paris 7 – Paris Diderot – 75013.

Formation sur la chaîne de traitements sur les corpus au même endroit les 19 et 20 novembre. A noter dans vos agendas !

Tous les membres du GT7 de Corpus-écrits sont concernés. Pour une prise ne charge éventuelle des déplacements, contactez Thierry Chanier.

Programme provisoire (en date du 21 octobre)

Voir le programme définitif ici : http://corpusecrits.huma-num.fr/2014/06/26/assemblee-generale-consortium-corpus-ecrits/

  • Présentation rapide  du C.C.E. et de l’année 2015
  • Corpus en ligne et c collaboration avec ORTOLANG, ex :COMERE
    –    Thierry Chanier
  • Présentation de la formation « Chaînes d’annotations» des  19 et 20 novembre :
    –    Céline Poudat
  • Table ronde sur l ‘évaluation des corpus :
    –    Franck Neveu + invitations : Olivier Baude, Dominique Boutet
  • Présentation DARIAH
    –    Invitation Sophie David
  • Les aspects juridiques
    –    Présentation Bernard Colombat (si disponible)
  • Travail du GT 8 : finalisation d’un corpus financé par le C.C.E.
    –    Amalia Todirascu et Agnès Tutin
  • Présentation de la table des usages
    –    Céline Poudat

Après atelier TEI-CMC aux journées DARIAH à Rome

Du 17 au 19 septembre 2014 se sont tenus les journées DARIAH-VCC à Rome.
Le groupe s’est réuni à cette occasion.