CoMeRe.org : corpuscomere

Accueil » 2015 » janvier

Archives Mensuelles: janvier 2015

Contribution de Kun Jin au projet CoMeRe

photo - Kun JIN Kun Jin termine son travail dans le projet CoMeRe en cette fin du mois de janvier 2015. Kun a été embauché comme ingénieur sur ce projet depuis le 1 septembre 2013. Ces 17 mois de travail ont été financés (par ordre de montants financiers décroissants) par ORTOLANG, le consortium Corpus-écrits et l’unité de recherche LRL de l’université Blaise Pascal. L’essentiel de ses contrats dépendait de ORTOLANG (CNRS région Est)
Kun a été recruté après avoir obtenu un master en sciences du langage, spécialité Ingénierie Linguistique, de l’université Paris 3.
Sa contribution a été essentielle au déroulement du projet CoMeRe. Il a notamment :

  • assuré la conversion de toutes les données fournies par les différents chercheurs de CoMeRe dans des formats divers (Tableurs, XML maison, XML-Mulce-struct) pour les transformer en corpus formatés suivant le modèle TEI-CMC
  • extrait toutes les données brutes provenant du site Wikipédia se rapportant à une sélection d’articles et de discussions ayant fait l’objet de controverses scientifiques. Ces données et les différentes versions archivées ont du être réorganisées en un tout cohérent, puis transformées dans le format TEI-CMC. Des calculs spécifiques sur la contribution des auteurs ont été accomplis.
  •  contribué au développement du modèle TEI-CMC, en partenariat avec les membres de CoMeRe et les collègues allemands et italiens du groupe de travail TEI-CMC. Il est en particulier l’auteur de la première version ODD décrivant ce modèle, tout comme l’auteur du schéma RNG validant tous les corpus CoMeRe.
  • assuré avec Paul Lotin (LRL), le transfert de la première vague de corpus CoMeRe vers le serveur ORTOLANG, travail qui inclut le développement du site http://www.ortolang.fr/11403/comere/ et des permaliens associés.
  •  participé aux différentes réunions du projet CoMeRe, ainsi qu’à des réunions en Allemagne et en Italie pour des « workshop » ou journées DARIAH où le groupe TEI-CMC présentait ses avancées.

Kun Jin a travaillé en collaboration permanente avec :

  •  les membres européens du groupe TEI-CMC,
  •  les responsables de dépôts de chacun des corpus CoMeRe, eux-mêmes membres d’une dizaine d’unités de recherche différentes en France,
  •  les collègues responsables du grand équipement ORTOLANG,
  •  les coordinateur et ingénieur réseau participant à CoMeRe au LRL (Thierry Chanier et Paul Lotin).

Kun Jin est notamment l’auteur ou co-auteur de :

  • Poudat,C.,  Grabar , N. Kun, J., &  Paloque-Berges, C. (2015). Corpus Wikiconflits extraits de Wikipedia. In Chanier T. (ed) Banque de corpus CoMeRe. Ortolang.fr : Nancy. [http://hdl.handle.net/11403/comere/cmr-wikiconflits] (corpus non encore accessible à la date de publication de ce message)
  • Kun, J. (2014). Schéma RNG des corpus CoMeRe suivant le modèle TEI-CMC. CoMeRe.org : http://lrl-diffusion.univ-bpclermont.fr/11403/comere/tei_cmr.rng
  • Kun, J. & Chanier, T. (2015). Schéma ODD du modèle TEI-CMC, version 1. http://wiki.tei-c.org/index.php/File:Tei-cmc-odd.zip
  •  Poudat, C, Jin, K., & Chanier, T. (2014). Manuel du corpus wikiconflits (cmr-wikiconflits-tei-v1-manuel.pdf) .In XX., Corpus Wikiconflits extraits de Wikipedia. Dans banque de corpus CoMeRe.org . Ortolang.fr : Nancy. [http://www.ortolang.fr/11403/comere/ , cmr-wikiconflits-tei-v1]
  • Jin, K. & Chanier, T. (2014). Adaptation des conventions de transcription de Mulce vers la TEI chapitre 8 « transcriptions of speech ». Projet CoMeRe (Communication Médiée par les Réseaux), IR Corpus-écrits. [ http://comere.org/ , cmr-mulcetotei-oral ]

Les membres du projet CoMeRe remercient chaleureusement Kun Jin pour sa contribution essentielle au projet CoMeRe et à son extension TEI-CMC.