商品情報にスキップ
1 1

ボルツマン選択を用いたDeep Q Network

ボルツマン選択を用いたDeep Q Network

通常価格 ¥440 JPY
通常価格 セール価格 ¥440 JPY
セール 売り切れ
税込

カテゴリ: 部門大会

論文No: GS9-2

グループ名: 【C】平成28年電気学会電子・情報・システム部門大会講演論文集

発行日: 2016/08/31

タイトル(英語): A Deep Q Network with Boltzmann Selection

著者名: 北 悠人(千葉工業大学),山口 智(千葉工業大学)

著者名(英語): Yuto Kita|Satoshi Yamaguchi

キーワード: 強化学習|深層学習|ディープQネットワークディープQネットワーク|Reinforcement Learning|Deep Learning|Deep Q Network

要約(日本語): Deep Reinforcement Learning(DRL)とは、高次元タスクの学習を行うために強化学習と多層ニューラルネットワークを組み合わせた手法である。近年、このDRLの精度向上を図ったDeep Q Network(DQN)が提案されている。DQNではエージェントの行動選択にεグリーディ法を用いており、学習の進行とともにεの値を減少させることでエージェントの行動を制御している。これにより学習初期はランダムに探索を行い、学習終盤では最適な行動を選択することが出来る。しかし、DQNではεの値を減少させる量が少なく、学習初期はランダム探索を行っていると考えられる。本研究ではエージェントの行動選択にボルツマン選択を適応することを提案する。エージェントの行動選択をボルツマン選択によって行うことで学習初期においても報酬を考慮した行動を選択することが出来ると考えられる。

PDFファイルサイズ: 140 Kバイト

販売タイプ
書籍サイズ
ページ数
詳細を表示する