ボルツマン選択を用いたDeep Q Network

¥440 JPY

セール売り切れ

税込

カテゴリ: 部門大会

論文No: GS9-2

グループ名: 【C】平成28年電気学会電子・情報・システム部門大会講演論文集

発行日: 2016/08/31

タイトル(英語): A Deep Q Network with Boltzmann Selection

著者名: 北悠人(千葉工業大学),山口智(千葉工業大学)

著者名(英語): Yuto Kita|Satoshi Yamaguchi

要約(日本語): Deep Reinforcement Learning(DRL)とは、高次元タスクの学習を行うために強化学習と多層ニューラルネットワークを組み合わせた手法である。近年、このDRLの精度向上を図ったDeep Q Network(DQN)が提案されている。DQNではエージェントの行動選択にεグリーディ法を用いており、学習の進行とともにεの値を減少させることでエージェントの行動を制御している。これにより学習初期はランダムに探索を行い、学習終盤では最適な行動を選択することが出来る。しかし、DQNではεの値を減少させる量が少なく、学習初期はランダム探索を行っていると考えられる。本研究ではエージェントの行動選択にボルツマン選択を適応することを提案する。エージェントの行動選択をボルツマン選択によって行うことで学習初期においても報酬を考慮した行動を選択することが出来ると考えられる。

PDFファイルサイズ: 140 Kバイト

販売タイプ PDFダウンロード（一般価格440円/会員価格220円）

書籍サイズ A4

ページ数 3

数量

詳細を表示する

国/地域

ボルツマン選択を用いたDeep Q Network

ボルツマン選択を用いたDeep Q Network