التفاصيل البيبلوغرافية
العنوان: |
Metode d'explicabilitat per Aprenentatge Per Reforç Multiagent en presència de comunicació |
المؤلفون: |
García Belmonte, Adrián |
المساهمون: |
Universitat Politècnica de Catalunya. Departament de Ciències de la Computació, Vázquez Salceda, Javier, Álvarez Napagao, Sergio |
بيانات النشر: |
Universitat Politècnica de Catalunya |
سنة النشر: |
2024 |
المجموعة: |
Universitat Politècnica de Catalunya, BarcelonaTech: UPCommons - Global access to UPC knowledge |
مصطلحات موضوعية: |
Àrees temàtiques de la UPC::Informàtica::Intel·ligència artificial::Aprenentatge automàtic, Reinforcement learning, Multiagent systems, aprenentatge per reforç, explicabilitat, multiagent, comunicació, explainability, communication, Sistemes multiagent |
الوصف: |
Les tècniques d'aprenentatge per reforç creen models de caixa negra impredictibles, afectant a la seguretat/confiança en els agents. Es proposa buscar i/o dissenyar un entorn per a aprenentatge per reforç que forci als agents a cooperar i comunicar-se (o negociar) per a analitzar si és possible, aplicar mètodes de explicabilitat per a interpretar els agents entrenats per a aquest entorn sobre la base de totes les accions disponibles, incloent i especialment la comunicació entre agents. ; Reinforcement learning techniques create unpredictable black box models, affecting security/confidence in agents. It is proposed to look for and/or design an environment for reinforcement learning that forces agents to cooperate and communicate (or negotiate) to analyze whether it is possible, to apply methods of explainability to interpret trained agents for this environment based on all available actions, including and especially communication between agents. |
نوع الوثيقة: |
bachelor thesis |
وصف الملف: |
application/pdf |
اللغة: |
Catalan; Valencian |
Relation: |
http://hdl.handle.net/2117/415541; 188924 |
الاتاحة: |
http://hdl.handle.net/2117/415541 |
Rights: |
Open Access |
رقم الانضمام: |
edsbas.D6CD2F0D |
قاعدة البيانات: |
BASE |