'Reinforcement Learning' 카테고리의 설명

outline

#1

Deep Reinforcement Learning 과 관련된 페이퍼를 리뷰합니다.

Reinforcement Learning

Asynchronous Methods for Deep Reinforcement Learning

  • 2016.6
  • #deepmind #google
  • Known as A3C Algorithm
  • arxiv : https://arxiv.org/abs/1602.01783
  • 여러 Agent를 동시에 각각 다른 Environment에서 행동하여 경험을 쌓되, 결과를 학습시키는 네트워크는 공유하는 형태입니다. 기존에는 1개의 Agent가 시간 순서대로 경험한 결과를 메모리에 쌓아서 과거 데이터로 학습을 시켰고, 이를 replay memory 라고 불렀습니다. 이 논문에서 제안한 agent는 동일한 policy, value network를 공유하되 여러 환경에서 학습하며, replay memory 개념을 사용하지 않습니다.

Starcraft Challenge

StarCraft II: A New Challenge for Reinforcement Learning

  • 2017.8
  • #deepmind #google
  • 스타크래프트를 pysc2라는 python environment로 공개하고, RL Agent의 Baseline을 제시함.

Deep Learning Outline