Dissertation/ Thesis

Metode d'explicabilitat per Aprenentatge Per Reforç Multiagent en presència de comunicació

التفاصيل البيبلوغرافية
العنوان: Metode d'explicabilitat per Aprenentatge Per Reforç Multiagent en presència de comunicació
المؤلفون: García Belmonte, Adrián
المساهمون: Universitat Politècnica de Catalunya. Departament de Ciències de la Computació, Vázquez Salceda, Javier, Álvarez Napagao, Sergio
بيانات النشر: Universitat Politècnica de Catalunya
سنة النشر: 2024
المجموعة: Universitat Politècnica de Catalunya, BarcelonaTech: UPCommons - Global access to UPC knowledge
مصطلحات موضوعية: Àrees temàtiques de la UPC::Informàtica::Intel·ligència artificial::Aprenentatge automàtic, Reinforcement learning, Multiagent systems, aprenentatge per reforç, explicabilitat, multiagent, comunicació, explainability, communication, Sistemes multiagent
الوصف: Les tècniques d'aprenentatge per reforç creen models de caixa negra impredictibles, afectant a la seguretat/confiança en els agents. Es proposa buscar i/o dissenyar un entorn per a aprenentatge per reforç que forci als agents a cooperar i comunicar-se (o negociar) per a analitzar si és possible, aplicar mètodes de explicabilitat per a interpretar els agents entrenats per a aquest entorn sobre la base de totes les accions disponibles, incloent i especialment la comunicació entre agents. ; Reinforcement learning techniques create unpredictable black box models, affecting security/confidence in agents. It is proposed to look for and/or design an environment for reinforcement learning that forces agents to cooperate and communicate (or negotiate) to analyze whether it is possible, to apply methods of explainability to interpret trained agents for this environment based on all available actions, including and especially communication between agents.
نوع الوثيقة: bachelor thesis
وصف الملف: application/pdf
اللغة: Catalan; Valencian
Relation: http://hdl.handle.net/2117/415541; 188924
الاتاحة: http://hdl.handle.net/2117/415541
Rights: Open Access
رقم الانضمام: edsbas.D6CD2F0D
قاعدة البيانات: BASE