強化学習について古典的なものからDeepNNを使ったものまでまとめていきたいと思っている。 元ネタとして以下のサイト、書籍を参考にしている。

記事一覧

作成予定

  • pathwise derivative method (SVG, DPG)
  • 逆強化学習
  • A3Cの実装
  • PPOの実装