Electronic Resource

Playing Atari Breakout Using Deep Reinforcement Learning

التفاصيل البيبلوغرافية
العنوان: Playing Atari Breakout Using Deep Reinforcement Learning
المؤلفون: Nils Martin Lidman, Jonas, Jonsson, Simon
بيانات النشر: KTH, Skolan för elektroteknik och datavetenskap (EECS) 2022
نوع الوثيقة: Electronic Resource
مستخلص: This report investigates the implementation of a Deep Reinforcement Learning (DRL) algorithm for complex tasks. The complex task chosen was the classic game Breakout, first introduced on the Atari 2600 console.The selected DRL algorithm was Deep Q-Network(DQN) since it is one of the first and most fundamental DRL algorithms. To test the DQN algorithm, it was first applied to CartPole which is a common control theory problem, using values describing the system as input.The implementation was then slightly modified to process images when employed for Breakout, in which it was successful. The application received a higher score than a professional human game tester. However, work remains to be done to achieve performance similar to state-of-theartimplementations of the DQN algorithm.
Denna rapport undersöker tillämpningen av en Deep Reinforcement Learning (DRL) algoritm för komplexa uppgifter. Den komplexa uppgift som valdes var Breakout från konsolen Atari 2600. DRL-algoritmen som användes var Deep Q-Network (DQN), eftersom det var en av de första och mest grundläggande DRL-algoritmer. För att kontrollera DQN-algoritmen tillämpades den först på CartPole, vilket är ett vanligt problem från reglerteknik, med tal som beskriver systemet som indata. Implementationen var sedan aningen modifierad för att kunna hantera bilder när den användes till Breakout, i vilken den presterade väl. Applikationen fick fler poäng än en proffesionell speltestare. Det finns dock andra implemeteringar som har fått högre poäng, och mer arbete behövs för att uppnå likvärdiga resultat.
Kandidatexjobb i elektroteknik 2022, KTH, Stockholm
مصطلحات الفهرس: Reinforcement learning, CartPole, Breakout, DQN, Electrical Engineering, Electronic Engineering, Information Engineering, Elektroteknik och elektronik, Student thesis, info:eu-repo/semantics/bachelorThesis, text
URL: http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-322718
TRITA-EECS-EX ; 2022:129
الاتاحة: Open access content. Open access content
info:eu-repo/semantics/openAccess
ملاحظة: application/pdf
English
Other Numbers: UPE oai:DiVA.org:kth-322718
1387571690
المصدر المساهم: UPPSALA UNIV LIBR
From OAIster®, provided by the OCLC Cooperative.
رقم الانضمام: edsoai.on1387571690
قاعدة البيانات: OAIster