Deep Q-learning v praxi – Krakora's net

Zkousel jsem naprogramovat hrajiciho agenta hry SpaceInvaders metodou Deep Q-learning (keon.io/deep-q-learning/)

Teoreticky zaklad a zajimave clanky o deep Q learning jsou na

Vychazel jsem z kodu a videa ‘Deep Q Learning for Video Games – The Math of Intelligence #9’

Za pomoci knihoven

se mi podarilo uhrat skore 455 bodu. Nejlepsi uhrane score je sice cca 5800 (gym.openai.com/envs/SpaceInvaders-v0/), tento algoritmus pouziva ale algorimtus “Asynchronous Actor-Critic Agents (A3C)”:medium.com/emergent-future/simple-reinforcement-learning-with-tensorflow-part-8-asynchronous-actor-critic-agents-a3c-c88f72a5e9f2 , jen co notebook nebude funet jako blazen, zkusim :).

Me zdrojove kody jsou na disku

Jine zajimave

Videa

Zavislosti k installaci