CoMeRe.org : corpuscomere

Accueil » Uncategorized

Archives de Catégorie: Uncategorized

Publicités

Journée d’études

Traitements et standardisation des corpus multimodaux et web 2.0.

Une journée hommage à Thierry Chanier

Date: 25 mai 2018

Lieu: Site Olympe de Gouges, Université Paris Diderot – Paris 7

 Coordination: Céline Poudat, Loïc Liégeois, Ciara Wigham.

Etant donné le travail important que Thierry Chanier a accompli pour la communauté, et spécifiquement pour le consortium Corpus écrits, aujourd’hui CORLI (Corpus, Langues, Interactions), nous souhaitons lui rendre un hommage en organisant une journée particulière qui se tiendra à l’université Paris Diderot. Cette journée d’études sera organisée autour des corpus complexes dans les champs de l’Apprentissage des Langues Médiée par les Technologies (ALMT) et de la Communication Médiée par les Réseaux, qu’il a privilégiés dans ses travaux.

La publication d’un numéro de la revue Corpus est envisagée à la suite de la journée, qui aura pour thématique la question du traitement, de la standardisation et de l’exploration des corpus complexes. Les présentations sur les thématiques ALMT et CMC seront privilégiées. Toute personne ayant participé à la journée, présentateur et participant, sera donc invitée à soumettre un article dans ce numéro. Un appel sera envoyé par la suite.

Site web : https://je-corpus-corli.sciencesconf.org/

Programme :

 9h30-10h  Accueil des participants
 10h-10h30  Introduction
 10h30-11h30  Christophe Reffay: De Simuligne à MULCE : avancées et obstacles pour le partage
 11h30-12h30  Françoise Blin: Vers une approche écologique et éthique de la création et du partage d’un corpus d’interactions pédagogiques multimodales: l’exemple du projet ISMAEL
 12h30-13h  Eva Lacroix: Corpus complexes et Apprentissage des Langues Médié par les Technologies (ALMT) – quoi, pourquoi, comment ?
 13h-14h30  Session poster + Déjeuner
 14h30-15h30  Michael Beisswenger: Building corpora of computer-mediated communication: a rewarding task?
 15h30-16h  Julien Longhi: Explorer des corpus de tweets: du traitement informatique à l’analyse discursive complexe
 16h-16h30  Pause
 16h30-17h  Céline Poudat & Ciara R. Wigham: Retour sur le projet CoMeRe: réalisations, impact et retombées
 17h-17h30  Christophe Parisse: Données ouvertes pour publication (Titre provisoire)
18h  Apéritif

 

Publicités

Parution

Un ouvrage collectif « Investigating Computer-Mediated Communication: Corpus-based approaches to language in the digital world » édité par Darja Fišer et Michael Beißwenger, suite au colloque cmc-corpora16, vient d’être publié.

Une version en libre accès est disponible à ce lien.

Fišer, Darja: Beißwenger, Michael (Eds., 2017). Investigating Computer-Mediated Communication: Corpus-Based Approaches to Language in the Digital World. Ljubljana: Scientific Publishing House of the Faculty of Arts, University of Ljubljana.

 

 

CMCCorpora17

DLN840hWAAAdIdN

Quelques membres du projet CoMeRe étaient présents à la 5ième CMCCorpora conférence à Bozen/Bolzano en Italie, organisé par EuRAC Research.

Les actes sont ici.

En savoir plus : https://cmc-corpora2017.eurac.edu/

Les dates pour CMCCorpora18 sont annoncées : 17-18 septembre 2018 à l’Université d’Anvers en Belgique.

Plateforme #Idéo2017 en ligne

La plateforme #Idéo2017 est en ligne: http://ideo2017.ensea.fr/plateforme/ Cette plateforme est le fruit d’un long travail collectif, dont on retrouve les participants sur le site http://ideo2017.ensea.fr

moteurderecherche

La plateforme capitalise en particulier sur le projet Projet Polititweets lié au Projet CoMeRe (IR corpus), et justifie déjà d’une Production scientifique associée conséquente. Un premier Outil d’analyse de tweets avait été mis en ligne fin 2016 (voir également ce billet), en lien avec les 2 corpus de tweets hébergés sur elle site Ortolang, et la plateforme #Idéo2017 vient concrétiser ce travail, avec une mise à jour du corpus de tweets au fil de la campagne électorale.  De nombreuses analyses ont été publiées dans plusieurs journaux et médias, français et étranges, donnant ainsi à voir les avancées et résultats.

Merci aussi aux soutiens: Fondation UCP, UCP, IUT UCP, AGORA et ETIS

Parution

Capture.JPG

Notre ouvrage collectif, suite au colloque cmc-corpora de Rennes, vient d’être publié dans la collection Humanitiés numériques de l’Harmattan. Plus d’informations ici.

Chapitres :

Wigham, C.R. & Ledegen, G. : Introduction.

Poudat, C., Grabar, N., Paloque-Berges, C., Chanier, T. & Jin, K. : Wikiconflits: un corpus de disussions éditoriales conflictuelles du Wikipédia francophone.

Longhi, J. : Le corpus Polititweets : enjeux institutionnels, juridiques, techniques et philologiques.

Simon, J., Toullec, B. et collègues : Identifier et analyser les discours d’escorte sur Twitter.

Ghliss, Y. & André, F. Après la collecte, l’anonymisation : enjeux éthiques et juridiques dans la constitution du corpus 88milsms.

Vaillant, P. : Annotation de corpus plurilingues : l’expérience du projet CLAPOTY.

Ho Dac, L-M. & Laippala, V. : Le corpus WikiDisc : ressource pour la caractérisation des discussions en ligne.

Fišer, D., Erjavec, T. & Ljubesic, N. : The compilation, processing and analysis of the Janes corpus of Slovene user-generated content.

Jackiewicz, A. : Outiller l’analyse des controverses. Pourquoi s’intéresser aux discours numériques ?

Petersen, J.M. : Multilinguismes et enjeux des pratiques langagières sur un Réseau Social d’Entreprise. Analyse sociolinguistique.

Blanchard, J-F. : Pratiques langagières en langue bretonne sur les réseaux socionumériques : méthode d’une étude de cas.

Mayne, L. : The Affordances and Challenges of WordReference Forums as a Space for Intercultural Exchange.

Chanier, T. : Saisir la parole du citoyen / usager / apprenant en interaction sur les réseaux.

Call for papers: CMC and Social Media Cor­pora for the Human­it­ies 2017

First Call for Papers: Computer-Mediated Communication and Social Media Corpora for the Humanities 2017

3-4 October 2017

Bolzano/Bozen, Italy
Full details:

https://cmc-corpora2017.eurac.edu/

—————————————————————————————————–

Call for papers

The 5th conference CMC and Social Media Corpora for the Humanities will be held in Bolzano/Bozen, Italy on 3-4 October 2017 and will focus on the collection, analysis and processing of mono and multimodal, synchronous and asynchronous communications. The focus will encompass different CMC genres. These include, but are not limited to, discussion forums, blogs, newsgroups, emails, SMS and WhatsApp, text chats, wiki discussions, social network exchanges (such as Facebook, Twitter, Linkedin), discussions in multimodal and/or 3D environments (virtual worlds, gaming worlds).

The conference will bring together researchers who are interested in the collection, organization, processing, analysis and sharing of CMC data for research purposes. We invite submissions on corpus analysis of various types of CMC data for linguistic or applied linguistic purposes and Natural Language Processing.

The conference is hosted by Eurac Research and will be followed by the 4th Learner Corpus Research Conference, which will be held at the same venue from 5-7 October.

Topics of interest

1. Development of CMC corpora

  • Building CMC corpora: from data collection to publication
  • Open data for research on CMC: questions of ethics and rights
  • Annotation of CMC genres: representation of CMC genres, annotation of linguistic phenomena, metadata
  • Multimodal corpora

2. Analysis of CMC corpora

  • Sociolinguistic studies of CMC
  • Discourse analysis of CMC
  • Linguistic characteristics of CMC
  • Multimodal aspects of CMC
  • Language in contact and code-switching in CMC
  • CMC in language learning & teaching

3. Natural Language Processing of CMC

  • Normalization
  • PoS Tagging
  • Lemmatization
  • Syntactic parsing
  • Named-entity recognition

Submission procedure

We invite submissions for papers, posters and software/corpus demonstrations on any topic relevant to the above list of themes. For this conference, we are requesting extended abstracts (2-4 pages) in English. All abstracts will be peer-reviewed by the scientific committee. All submissions should follow the template which you can download here: MSWord and LaTeX. Please submit your paper via the online conference system.

Paper presentations will consist of a 20 minute talk followed by 10 minutes for questions and discussion.

The poster presentation and software/corpus demonstration session will be opened with each presenter/demonstrator giving a one-minute ‘teaser talk.’

Accepted papers will be published in online proceedings before the conference. After the conference, authors of best-reviewed papers will be invited to submit extended versions of their papers to be published in an edited monograph to appear in 2018.

Important dates

  • 1st June: submission deadline
  • 25 July: notification of acceptance
  • 25 August: submission of camera-ready version
  • 3rd & 4th October: conference

Further inquiries

Scientific Committee

Chair

Co-chairs

Members

Organizing Committee