CoMeRe.org : corpuscomere

Accueil » Posts tagged 'TEI'

Tag Archives: TEI

Article : The CoMeRe corpus for French: structuring and annotating heterogeneous CMC genres.

Une partie des membres du projet CoMeRe a soumis un article dont voici les références

Chanier, T, Poudat, C, Sagot, B, Antoniadis, G, Wigham, C, Hriba, L, Longhi, J & Seddah, D (soumis). The CoMeRe corpus for French: structuring and annotating heterogeneous CMC genres.

article soumis à : Special Issue of JLCL (Journal of Language Technology and Computational Linguistics (JLCL, http://jlcl.org/): BUILDING AND ANNOTATING CORPORA OF COMPUTER-MEDIATED DISCOURSE: Issues and Challenges at the Interface of Corpus and Computational Linguistics (ed. by Michael Beißwenger, Nelleke Oostdijk, Angelika Storrer & Henk van den Heuvel)

Cet article est sur notre site dans la partie interne. Il sera bien sûr diffusé en accès libre s’il est accepté et dans sa version finale.

Publicités

Groupe TEI-CMC : liste de discussion et wiki

Le groupe TEI-CMC  a tenu sa première réunion le 5octobre , lors de la conférence TEI à Rome.

Le projet CoMeRe recrute un ingénieur pour 6 mois

Recrutement terminé. Kun JIN travaille avec nous du 1er septembre 2013 à fin février 2014

Ingénieur pour la structuration de corpus de communications en ligne

Contrat CDD niveau ingénieur d’étude de 6 à 7 mois à temps plein (début du travail de préférence en juillet 2013, mais négociable jusque début septembre ; durée dépend niveau de rémunération liée au diplôme acquis, voir fiche ci-dessous pour plus de détails) . Prolongation du contrat en 2014 à discuter

CoMeRe est un projet national (https://corpuscomere.wordpress.com) du groupe de travail sur les nouvelles formes de communication du consortium corpus-écrits (http://corpusecrits.corpus-ir.fr/ ). Il a pour but de collecter et mettre en ligne des corpus de Communication Médiée par les Réseaux (CoMeRe – CMC en anglais) suivant les standards internationaux, à horizon 2014 sur le site Ortolang. Ce noyau de corpus sera alors intégré au futur Corpus de Référence du français.
Le projet rassemble des chercheurs appartenant à une dizaine d’unités nationales différentes. Il est coordonné au sein de l’unité LRL. CoMeRe a reçu le soutien de Corpus-écrits et de l’équipement d’excellence Ortolang (http://www.ortolang.fr ).
La personne recrutée travaillera en contact permanent avec les chercheurs de CoMeRe qui déposeront leurs corpus sur les serveurs du LRL. Elle aura pour tâche principale de les structurer suivant les standards adoptés par le projet en partenariat avec nos partenaires européens au sein du consortium TEI. Elle participera à la collecte de nouveaux corpus en ligne et aux réunions du projet

Tâches
• Structuration de corpus existants sur des communications médiées par les réseaux en TEI
• Contribution au choix des structures de TEI adaptées aux types de corpus
• Traitements d’anonymisation simples sur les corpus bruts
• Aide à la collecte automatique de nouveaux corpus en ligne.

Compétences
• Compétences pour le travail en groupe au sein d’un projet national
• Expérience en XML et schémas associés
• Expérience dans les langages de transformation de corpus (XSLT…)
• Connaissance des schémas de structuration de corpus du type TEI
• Expérience appréciée dans des langages de programmation de traitement de chaînes type Perl, Python
• Maîtrise appréciée de l’anglais niveau B2 minimum

voir la fiche complète ici

Proposition de session TEI-CMC acceptée à la prochaine conférence du consortium

Le comité scientifique de la conférence du consortium TEI (http://www.tei-c.org/) vient d’accepter la proposition de session sur la CMC (CoMéRé) . Cette conférence se tiendra en octobre 2013 à Rome : http://digilab2.let.uniroma1.it/teiconf2013/.

Notre proposition (conjointe avec les collègues européens comportent 3 parties :

  • Modeling computer-mediated communication in TEI:requirements and perspectives
  • Expanding the TEI encoding framework to genres of computer-mediated communication: considerations and suggestions
  • Metadata for cmc documents

Vous pouvez la lire ici : TEIcmcpanel_2013-03-30

Seminaire « Building a reference corpus of CMC »

deriklogo2Du 25 au 27 juin, nous accueillerons Michael Beißwenger, TU Dortmund University, au LRL à Clermont-Ferrand. Plusieurs personnes de CoMeRe viendront à cette occasion travailler sur la TEI et CoMeRe
Michael donnera le mercredi 26 juin, salle 220 de la MSH une conférence sur le thème
« Building a Reference Corpus of Computer-Mediated Communication : Issues at the Interface of Linguistics, Text Technology and Natural Language Processing ».
En savoir plus