障害物とエージェントの相対角を用いた効率的な強化学習法の基礎検討
障害物とエージェントの相対角を用いた効率的な強化学習法の基礎検討
カテゴリ: 研究会(論文単位)
論文No: ST15008
グループ名: 【C】電子・情報・システム部門 システム研究会
発行日: 2015/03/11
タイトル(英語): A Study of efficient reinforcement learning using the relative angle of an obstacle and the agent
著者名: 大西 杜諒(筑波大学),澁谷 長史(筑波大学)
著者名(英語): Moriaki Onishi(University of Tsukuba),Takeshi Shibuya(University of Tsukuba)
キーワード: 強化学習|行動価値関数|極座標|Reinforcement learning|Action-value function|Polar coordinates
要約(日本語): 知覚機能が衰えた高齢者は人間同士の接触事故が多いので,支援機を用いて事故を回避させることが重要である。本研究では強化学習を用いた支援機の行動則獲得を目指す。しかし,従来の強化学習では障害物の方向ごとに独立して学習を行うため学習に時間がかかるという問題があった。そこで学習を効率的に行うため相対角を用いた行動価値関数でQ値を更新できる強化学習法を提案する。シミュレーション実験により本手法の有効性を確認した。
要約(英語): Support machine is used to support the elderly.This study develops method of behavior acquisition by reinforcement learning.However conventional reinforcement learning algorithms require huge time because behavior to avoid obstacles for each direction must be learned.This paper proposes a new reinforcement learning algorithm which can effectively update action-value function focusing relative angle.
原稿種別: 日本語
PDFファイルサイズ: 476 Kバイト
受取状況を読み込めませんでした
