Academic Journal
Principes et outils pour l’annotation des corpus
العنوان: | Principes et outils pour l’annotation des corpus |
---|---|
المؤلفون: | Amoyal, Mary, Bertrand, Roxane, Bigi, Brigitte, Boudin, Auriane, Meunier, Christine, Pallaud, Berthille, Priego-Valverde, Béatrice, Rauzy, Stéphane, Tellier, Marion |
بيانات النشر: | Laboratoire Parole et Langage TIPA. Travaux interdisciplinaires sur la parole et le langage |
سنة النشر: | 2023 |
المجموعة: | OpenEdition |
مصطلحات موضوعية: | corpus oral, interactions conversationnelles, schéma d’annotation, phonétique, lexique, morpho-syntaxe, disfluences, discours, mimogestualité, outils automatiques, oral corpus, conversational interactions, annotation schema, phonetics, lexicon, morpho-syntactics, mimogestuality, automatic tools |
الوصف: | La linguistique de corpus, c’est à dire les recherches sur le langage portant sur un matériel linguistique écrit ou oral recueilli et conservé, s’est considérablement développée au cours des dernières décennies. Ce développement s’est fait à l’aide de corpus constitués de plus en plus nombreux et de plus en plus importants. L’augmentation de la taille des corpus a nécessité, pour leur analyse, le développement d’outils automatiques, mais aussi une vraie réflexion sur la nature et les objectifs de l’annotation des corpus. L’enrichissement de corpus par un jeu d’annotations spécifiques est alors apparu, la plupart du temps, comme un préalable à toutes analyses linguistiques.Annoter un corpus consiste à ajouter des informations pertinentes pour son exploitation. L’intérêt de disposer de corpus annotés, c’est-à-dire enrichis à différents niveaux linguistiques, est de pouvoir étudier chacun de ces derniers ainsi que les liens mutuels entre les uns et les autres. Les travaux menés au LPL sur ces questions d’enrichissement des corpus ont été effectués initialement pour rendre possible l’étude de la multimodalité, à savoir la prise en compte des niveaux de granularité les plus fins (phonèmes) jusqu’aux niveaux mimo-gestuels, en passant par les niveaux syntaxique, discursif, prosodique, et interactionnel. Il s’est donc avéré nécessaire de penser l’annotation en amont, au niveau même de la représentation des informations. Un schéma d’annotation global permet en effet de considérer tous ces niveaux dans une seule et même approche formelle qui favorise leur interrogation ultérieure.Quel que soit le niveau d’annotation, plusieurs questions se sont posées : d’une part, celle des étiquettes utilisées (décomposition, typologie, fonction, nature graduelle/catégorielle, etc.) ; d’autre part, celle de l’ancrage temporel de ces étiquettes (localisation et frontières). Pour certains niveaux d’annotation il sera question de décrire les niveaux de dépendance entre les différentes étiquettes. Ces questions doivent être pensées en ... |
نوع الوثيقة: | article in journal/newspaper |
اللغة: | French |
Relation: | info:eu-repo/semantics/reference/issn/2264-7082; http://journals.openedition.org/tipa/5424 |
الاتاحة: | http://journals.openedition.org/tipa/5424 |
Rights: | https://creativecommons.org/licenses/by-nc-nd/4.0/ ; info:eu-repo/semantics/openAccess |
رقم الانضمام: | edsbas.37A7CAE0 |
قاعدة البيانات: | BASE |
الوصف غير متاح. |