ベルマン方程式

アルゴリズム数学

ベルマン方程式は、動的計画法（動的な最適化問題）の最適性の必要条件を表す方程式らしい。必要条件は、再帰を使って部分を解くことで全体が解ける状態にあることと、メモ化を使うことです。最適化問題とは、集合内のすべての数値を、ある関数にいれたとき…

2017-01-27

強化学習の勉強に良さそうなサイト一覧

強化学習機械学習

OpenAI Gym Pythonではじめる強化学習深層強化学習：ピクセルから『ポン』 – 前編深層強化学習：ピクセルから『ポン』 – 後編超シンプルにTensorFlowでDQN (Deep Q Network) を実装してみる〜解説編② 学習の流れを理解する〜 PyBrainを用いて強化学習を…