Discourse on climate and energy justice: a comparative study of Do It Yourself and Bootstrapped corpora
العنوان: | Discourse on climate and energy justice: a comparative study of Do It Yourself and Bootstrapped corpora |
---|---|
المؤلفون: | Camille Biros, Caroline Rossi, Inesa Sahakyan |
المساهمون: | Institut des Langues et Cultures d'Europe, Amérique, Afrique, Asie et Australie (ILCEA4 ), Université Grenoble Alpes [2016-2019] (UGA [2016-2019]), Biros, Camille |
المصدر: | Corpus Corpus, Bases, Corpus, Langage-UMR 7320, 2018 HAL |
بيانات النشر: | HAL CCSD, 2018. |
سنة النشر: | 2018 |
مصطلحات موضوعية: | [SDE] Environmental Sciences, Computer science, Download, 020209 energy, media_common.quotation_subject, 02 engineering and technology, Energy Justice, Lexical item, Terminology, [SHS]Humanities and Social Sciences, Small DIY Corpora, BootCat, 0202 electrical engineering, electronic engineering, information engineering, Climate Justice, Justice (ethics), [SHS.LANGUE]Humanities and Social Sciences/Linguistics, Petits corpus maison, General Environmental Science, media_common, 060201 languages & linguistics, Point (typography), Constitution, Corpus building, 06 humanities and the arts, Discourse community, Discourse Communities, justice climatique, discours spécialisés, [SHS.LANGUE] Humanities and Social Sciences/Linguistics, Data science, [SDE.ES]Environmental Sciences/Environmental and Society, Variation (linguistics), Specialised Discourse, 0602 languages and literature, [SDE]Environmental Sciences, General Earth and Planetary Sciences, [SDE.ES] Environmental Sciences/Environmental and Society, [SHS] Humanities and Social Sciences, communautés de discours, justice énergétique, Constitution de corpus |
الوصف: | This article offers a descriptive and analytic view of the different stages leading to the constitution of a corpus that is representative of the issues of climate and energy justice. Overall, the corpus contains over five million words and gathers reports, newsletters and web-pages dealing with the most equitable ways of moving to a low-carbon future in the aim of limiting climate change. It can be divided into six sub-corpora, according to types of discourse communities, and methods of constitution. We begin by presenting the small Do It Yourself (DIY) corpora which were used as a starting point. Three discourse communities were selected to observe possible variation in their treatment of the issue: Non-Governmental Organisations (NGOs), United-Nation institutions, and the Renewable Energy Sector (RES). The sources are selected according to author, date, keywords in title. Using the concordance Antconc and WMatrix software we test the reliability of the corpora for their thematic content, terminology and lexical unit classification. Our first results enable us to confirm variation between the discourse communities. The discrepancy in sizes and the time-consuming nature of the initial DIY corpus constitution lead us to use BootCat to extend them, using keywords from the corpora as seeds to retrieve and download webpages. We thus contrast a more traditional approach to corpus building to web-as-corpus data gathering methods. We compare the results found in the BootCat corpora to test if they are as specific as those in the DIY corpora. This enables us to draw conclusions on the possible uses and advantages of relatively small corpora for the study of specialised discourse. Cet article décrit et analyse les différentes étapes de constitution d’un corpus représentatif des questions de justice climatique et énergétique. Le corpus contient cinq millions de mots en tout et rassemble des rapports, des lettres d’information et pages web traitant des solutions équitables à faible empreinte carbone pour limiter le changement climatique. Il est divisé en six sous-corpus selon les types de communautés de discours et de méthodes de constitution. Nous commençons par la présentation du petit corpus fait maison que nous utilisons comme point de départ. Trois communautés de discours ont été sélectionnées afin d’observer d’éventuelles variations dans leur traitement de ces questions : Organisations Non Gouvernementales, institutions onusiennes et organisations du secteur de l’énergie renouvelable. Les sources ont été sélectionnées en fonction des auteurs, dates et mots clés présents dans les titres. Grâce aux logiciels de concordance AntConc et WMatrix, nous avons testé la comparabilité de ces corpus du point de vue de leur contenu thématique, de leur terminologie et de la classification de leurs unités lexicales. Nos premiers résultats nous permettent de confirmer l’existence de variations entre communautés de discours. Le caractère chronophage de notre démarche de constitution d’un corpus « maison », ainsi que le déséquilibre entre le nombre de mots obtenus pour chaque sous-corpus nous conduisent à utiliser BootCat afin de constituer un corpus plus fourni. L’outil utilise des mots clés comme « semences » pour la récupération et le téléchargement automatiques de pages web. Nous pouvons ainsi comparer une méthodologie traditionnelle de constitution de corpus à une méthodologie qui utilise le web en tant que corpus. Nos résultats BootCat sont confrontés à ceux du corpus maison pour voir s’ils révèlent aussi bien les spécificités des sous-corpus. Cette démarche aboutit à des conclusions sur les possibles utilisations de corpus relativement petits, et d’en souligner la pertinence pour l’étude de discours spécialisés. |
وصف الملف: | application/pdf |
اللغة: | English |
تدمد: | 1638-9808 1765-3126 |
URL الوصول: | https://explore.openaire.eu/search/publication?articleId=doi_dedup___::be20b81f61e135b34ace1ef7bd85b7f7 https://halshs.archives-ouvertes.fr/halshs-01894686 |
Rights: | OPEN |
رقم الانضمام: | edsair.doi.dedup.....be20b81f61e135b34ace1ef7bd85b7f7 |
قاعدة البيانات: | OpenAIRE |
تدمد: | 16389808 17653126 |
---|