Dissertation/ Thesis

Analyse en corpus de chaînes de coréférence : la coréférence non-stricte à l'épreuve de la linguistique outillée ; Corpus analysis of coreference chains

التفاصيل البيبلوغرافية
العنوان: Analyse en corpus de chaînes de coréférence : la coréférence non-stricte à l'épreuve de la linguistique outillée ; Corpus analysis of coreference chains
المؤلفون: Delaborde, Marine
المساهمون: Paris 3, Landragin, Frédéric
سنة النشر: 2020
المجموعة: theses.fr
مصطلحات موضوعية: Référence, Coréférence, Chaînes de coréférence, Annotation, Corpus, Schema d'annotation, Flou, Reference, Coreference, Coreference chains, Annotation scheme, Fuzzyness
الوصف: Une chaîne de coréférence désigne l'ensemble des expressions linguistiques qui réfèrent à la même entité. La relation de coréférence entre les « maillons » d'une chaîne implique que le référent doit être strictement le même pour chaque expression qui la compose. Cependant, il arrive que le référent d'une expression soit difficile à identifier et que la relation de coréférence entre plusieurs expressions ne soit pas stricte de manière certaine. Pour un lecteur, ce manque de précision ne pose pas nécessairement de difficultés. En revanche, lors de l'annotation d'un corpus en coréférences, il est question d'indiquer clairement le référent de chaque expression. Les phénomènes de coréférence non stricte peuvent donc causer des difficultés d'annotation. Cette thèse a débuté au sein du projet ANR Democrat, avec une tâche d'annotation qui a permis de faire émerger des difficultés d'annotation théoriques et techniques liées à la coréférence non stricte. Nous proposons donc de passer en revue les phénomènes linguistiques impliqués dans la coréférence non stricte, notamment le flou (co)référentiel ainsi que les cas typiques relevés en corpus. Dans un second temps, nous proposons une étude de l'annotation de ces phénomènes dans un sous-corpus de Democrat. Cette étude révèle une grande variabilité d'annotation de ces phénomènes dont nous tirons une classification. Pour éviter les difficultés d'annotation liées à ces phénomènes, nous proposons un cadre plus précis pour l'annotation de la coréférence floue. Cela implique des précisions à ajouter au manuel d'annotation ainsi qu'un schéma d'annotation adapté, prenant en compte la coréférence floue. ; A coreference chain designates the set of linguistic expressions that refer to the same entity. The coreference relation between a chain's elements implies that the referent must be strictly the same for each expression that composes it. However, the referent of an expression is sometimes difficult to identify and the coreference relation between several expressions cannot therefore ...
نوع الوثيقة: thesis
اللغة: French
Relation: http://www.theses.fr/2020PA030073/document
الاتاحة: http://www.theses.fr/2020PA030073/document
Rights: Open Access ; http://purl.org/eprint/accessRights/OpenAccess
رقم الانضمام: edsbas.8A78FEA0
قاعدة البيانات: BASE