syuntoku14の進捗

進捗を書きなぐります

進捗(4/27) Q-Learningの実装

進捗(4/27) Q-Learningの実装

強化学習たのちい
Kaggleのコンペティションと違ってデータの前処理で苦行を行わなくて良いので好き

  • Q-Learningの実装
    ほとんどここを写経しただけ。Q-Learningの理解が深まった。全然難しいことしてなかった。次回はDQNを実装しようと思います。

学習したあとの動き:

https://s19.aconvert.com/convert/p3r68-cdx67/d7prp-alflj.gif

ソースコード

報酬の推移:
f:id:syuntoku14:20180428005638p:plain

エピソードが1000付近になると山登りが成功し始めてるっぽい。

とにかく楽しい(一番大切な気持ち)。

  • 機械学習交流会
    ミニバッチ学習に局所解に陥らないためっていう目的がひとつあったのは初めて知った。   Actor Criticの話、とてもおもしろそうなので論文を読む。その前にDQNの論文を読もうと思う。