Automatic identification of coreference chains: Towards a linguistic analysis of errors in order to improve machine learning features. ; Identification automatique de chaînes de coréférences : vers une analyse des erreurs pour mieux cibler l'apprentissage

التفاصيل البيبلوغرافية
العنوان: Automatic identification of coreference chains: Towards a linguistic analysis of errors in order to improve machine learning features. ; Identification automatique de chaînes de coréférences : vers une analyse des erreurs pour mieux cibler l'apprentissage
المؤلفون: Landragin, Frédéric, Oberle, Bruno
المساهمون: Lattice - Langues, Textes, Traitements informatiques, Cognition - UMR 8094 (Lattice), Université Sorbonne Nouvelle - Paris 3-Université Sorbonne Paris Cité (USPC)-Centre National de la Recherche Scientifique (CNRS)-Université Paris Sciences et Lettres (PSL)-Département Littératures et langage - ENS-PSL (LILA), École normale supérieure - Paris (ENS-PSL), Université Paris Sciences et Lettres (PSL)-Université Paris Sciences et Lettres (PSL)-École normale supérieure - Paris (ENS-PSL), Université Paris Sciences et Lettres (PSL), Linguistique, Langues et Parole (LILPA), Université de Strasbourg (UNISTRA), ANR-15-CE38-0008,DEMOCRAT,DEscription et MOdélisation des Chaînes de Référence : outils pour l'Annotation de corpus (en diachronie et en langues comparées) et le Traitement automatique(2015)
المصدر: Journée commune AFIA - ATALA - vendredi 6 juillet 2018 ; Journée commune AFIA-ATALA sur le Traitement Automatique des Langues et l’Intelligence Artificielle pendant la onzième édition de la plate-forme Intelligence Artificielle (PFIA 2018) ; https://hal.science/hal-01819602 ; Journée commune AFIA-ATALA sur le Traitement Automatique des Langues et l’Intelligence Artificielle pendant la onzième édition de la plate-forme Intelligence Artificielle (PFIA 2018), Jul 2018, Nancy, France ; http://pfia2018.loria.fr/journee-tal/
بيانات النشر: CCSD
سنة النشر: 2018
المجموعة: Université Sorbonne Nouvelle - Paris 3: HAL
مصطلحات موضوعية: Referring expressions, machine learning, machine learning features, linguistic analysis of errors, diagnosis of NLP systems, Expressions référentielles, coréférences, apprentissage artificiel, traits d'apprentissage, SVM, analyse linguistique des erreurs, diagnostic de systèmes de TAL, [SHS.LANGUE]Humanities and Social Sciences/Linguistics, [SCCO.LING]Cognitive science/Linguistics, [SCCO.COMP]Cognitive science/Computer science
جغرافية الموضوع: Nancy, France
الوصف: National audience ; Automatic identification of coreference chains: Towards a linguistic analysis of errors in order to improve machine learning features. We present a preliminary qualitative study dealing with the linguistic analysis of the errors made by NLP systems dedicated to the automatic detection of coreference chains. We describe several cases of noise and silence, characterized with different degrees of importance, as well as coreference-specific types of errors, for instance the construction of "catch-all" chains that group non-used referring expressions. In order to further define a generalizable methodology, we propose a first typology of errors, and some guidelines for their consideration within the machine learning process. This research implies considerations on the possible types of hybrid systems. ; Nous présentons une étude qualitative préliminaire concernant l'analyse linguistique des erreurs commises par des systèmes de détection automatique de chaînes de coréférences. Nous soulignons plusieurs cas de bruit et de silence, caractérisés par des gravités différentes, ainsi que des types d'erreurs spécifiques, notamment la construction de chaînes « fourre-tout » regroupant des expressions référentielles inexploitées par ailleurs. Dans le but de définir une méthodologie généralisable, nous proposons une première typologie d'erreurs et quelques pistes de réflexion pour leur prise en compte à terme dans les processus d'apprentissage, ce qui passe par des considérations sur les types d'hybridation à envisager pour ces processus.
نوع الوثيقة: conference object
اللغة: French
الاتاحة: https://hal.science/hal-01819602
https://hal.science/hal-01819602v1/document
https://hal.science/hal-01819602v1/file/18_ATALA.pdf
Rights: info:eu-repo/semantics/OpenAccess
رقم الانضمام: edsbas.DBB2EFBF
قاعدة البيانات: BASE