edo1z blog

プログラミングなどに関するブログです

2017-01-27から1日間の記事一覧

ベルマン方程式

ベルマン方程式は、動的計画法(動的な最適化問題)の最適性の必要条件を表す方程式らしい。必要条件は、再帰を使って部分を解くことで全体が解ける状態にあることと、メモ化を使うことです。最適化問題とは、集合内のすべての数値を、ある関数にいれたとき…

強化学習の勉強に良さそうなサイト一覧

OpenAI Gym Pythonではじめる強化学習 深層強化学習:ピクセルから『ポン』 – 前編 深層強化学習:ピクセルから『ポン』 – 後編 超シンプルにTensorFlowでDQN (Deep Q Network) を実装してみる 〜解説編② 学習の流れを理解する〜 PyBrainを用いて強化学習を…

Python3 - 動的計画法(フィボナッチ数列)

動的計画法は、分割統治法とメモ化を合わせた方法のことらしい。分割統治法は、問題を細分化して、細かい部分を順に解いていくことで全体を解明するようなことの総称らしい。 分割統治法は、コード的には下記のようになり、再帰することになる。 function co…