ベイズ最適化による深層強化学習のハイパーパラメータと報酬関数の最適化の試み
ベイズ最適化による深層強化学習のハイパーパラメータと報酬関数の最適化の試み
カテゴリ: 研究会(論文単位)
論文No: ST23042,CT23105
グループ名: 【C】電子・情報・システム部門 システム/【C】電子・情報・システム部門 制御合同研究会
発行日: 2023/11/29
タイトル(英語): A Study on Optimization of Hyper-Parameters and Reward Function in Deep Reinforcement Learning by Bayesian Optimization
著者名: 曽田 涼介(松江工業高等専門学校),西村 拓人(松江工業高等専門学校),堀内 匡(松江工業高等専門学校)
著者名(英語): /Ryosuke Sota(National Institute of Technology, Matsue College),Takuto Nishimura(National Institute of Technology, Matsue College),Tadashi Horiuchi(National Institute of Technology, Matsue College)
キーワード: 深層強化学習|ベイズ最適化|移動ロボット|行動獲得|Deep Reinforcement Learning|Bayesian Optimization|Mobile Robot|Behavior Acquisition
要約(日本語): 我々はこれまでに深層強化学習を用いて移動ロボットが壁や障害物を避けながらゴールに到達する行動を獲得することを実現している.本研究では,ベイズ最適化を用いて深層強化学習のハイパーパラメータと報酬関数の設定の最適化を試みる.ベイズ最適化により得られたハイパーパラメータの値や報酬設定は,経験的手法よりも学習性能が高いことを確認する.
要約(英語): We have applied deep reinforcement learning to the robot navigation problem. In this study, we attempt to optimize the values of hyper-parameters and reward function of deep reinforcement learning by using Bayesian optimization. We confirmed that the values of hyper-parameters and reward setting obtained by Bayesian optimization have higher learning performance than those by empirical method.
本誌: 2023年12月2日-2023年12月3日システム/制御合同研究会
本誌掲載ページ: 67-72 p
原稿種別: 日本語
PDFファイルサイズ: 1,696 Kバイト
受取状況を読み込めませんでした
