# Reinforcement Learning: day 5 DQN ## DQN Structure  ## Input Image 青い点が都市。白い点が現在いる都市  移動すると線を引く。非常に見えにくいが、水色が直前までいた都市  1 episode の最終形  ## 結果 Rewardを色々ためしたが、うまくいかず  ## 考察だけしてみるが・・・  CNN画像を時系列化してLSTMに突っ込めば、画像の時間発展を考慮した学習が可能。 ただ、これは面倒なのと(そろそろ飽きてきた)ので、方策勾配法に進む予定
×
Sign in
Email
Password
Forgot password
or
By clicking below, you agree to our
terms of service
.
Sign in via Facebook
Sign in via Twitter
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
New to HackMD?
Sign up