商品情報にスキップ
1 1

群ロボット環境における深層強化学習のハイパーパラメータと報酬関数のベイズ最適化

群ロボット環境における深層強化学習のハイパーパラメータと報酬関数のベイズ最適化

通常価格 ¥440 JPY
通常価格 セール価格 ¥440 JPY
セール 売り切れ
税込

カテゴリ: 部門大会

論文No: PS8-2

グループ名: 【C】2024年電気学会電子・情報・システム部門大会

発行日: 2024/08/28

タイトル(英語): Bayesian Optimization of Hyper-Parameters and Reward Function of Deep Reinforcement Learning in Multi-Robot Environment

著者名: 西村 拓人(松江工業高等専門学校),曽田 涼介(奈良先端科学技術大学院大学),堀内 匡(松江工業高等専門学校)

著者名(英語): Takuto Nishimura (National Institute of Technology, Matsue College),Ryosuke Sota (Nara Institute of Science and Technology),Tadashi Horiuchi (National Institute of Technology, Matsue College)

キーワード: 深層強化学習|ベイズ最適化|群ロボット|協調行動|移動ロボット|Deep Reinforcement Learning|Bayesian Optimization|Multi-Robot|Cooperative Behaviors|Mobile Robot

要約(日本語): 深層強化学習には、ニューラルネットワークのハイパーパラメータや報酬関数のように学習前に設定しておくハイパーパラメータが存在する。これらのハイパーパラメータは、予備実験を通して経験的に設定されるが、設定された値が最適とは限らない。そこで、機械的に効率良くハイパーパラメータを探索することができるベイズ最適化に注目した。本研究では、群ロボットの追従行動と追い抜き行動の獲得を実現するために、深層強化学習にベイズ最適化を適用することで、学習前に設定しておくハイパーパラメータの自動的なチューニングを試みる。また、そこで最適化されたハイパーパラメータによる学習を分析することで、ベイズ最適化の有効性を示す。

販売タイプ
書籍サイズ
ページ数
詳細を表示する