Electronic Resource
Playing Atari Breakout Using Deep Reinforcement Learning
العنوان: | Playing Atari Breakout Using Deep Reinforcement Learning |
---|---|
المؤلفون: | Nils Martin Lidman, Jonas, Jonsson, Simon |
بيانات النشر: | KTH, Skolan för elektroteknik och datavetenskap (EECS) 2022 |
نوع الوثيقة: | Electronic Resource |
مستخلص: | This report investigates the implementation of a Deep Reinforcement Learning (DRL) algorithm for complex tasks. The complex task chosen was the classic game Breakout, first introduced on the Atari 2600 console.The selected DRL algorithm was Deep Q-Network(DQN) since it is one of the first and most fundamental DRL algorithms. To test the DQN algorithm, it was first applied to CartPole which is a common control theory problem, using values describing the system as input.The implementation was then slightly modified to process images when employed for Breakout, in which it was successful. The application received a higher score than a professional human game tester. However, work remains to be done to achieve performance similar to state-of-theartimplementations of the DQN algorithm. Denna rapport undersöker tillämpningen av en Deep Reinforcement Learning (DRL) algoritm för komplexa uppgifter. Den komplexa uppgift som valdes var Breakout från konsolen Atari 2600. DRL-algoritmen som användes var Deep Q-Network (DQN), eftersom det var en av de första och mest grundläggande DRL-algoritmer. För att kontrollera DQN-algoritmen tillämpades den först på CartPole, vilket är ett vanligt problem från reglerteknik, med tal som beskriver systemet som indata. Implementationen var sedan aningen modifierad för att kunna hantera bilder när den användes till Breakout, i vilken den presterade väl. Applikationen fick fler poäng än en proffesionell speltestare. Det finns dock andra implemeteringar som har fått högre poäng, och mer arbete behövs för att uppnå likvärdiga resultat. Kandidatexjobb i elektroteknik 2022, KTH, Stockholm |
مصطلحات الفهرس: | Reinforcement learning, CartPole, Breakout, DQN, Electrical Engineering, Electronic Engineering, Information Engineering, Elektroteknik och elektronik, Student thesis, info:eu-repo/semantics/bachelorThesis, text |
URL: | TRITA-EECS-EX ; 2022:129 |
الاتاحة: | Open access content. Open access content info:eu-repo/semantics/openAccess |
ملاحظة: | application/pdf English |
Other Numbers: | UPE oai:DiVA.org:kth-322718 1387571690 |
المصدر المساهم: | UPPSALA UNIV LIBR From OAIster®, provided by the OCLC Cooperative. |
رقم الانضمام: | edsoai.on1387571690 |
قاعدة البيانات: | OAIster |
الوصف غير متاح. |