追跡問題におけるゴールデンクロスを利用した切り換えQ学習
追跡問題におけるゴールデンクロスを利用した切り換えQ学習
カテゴリ: 論文誌(論文単位)
グループ名: 【C】電子・情報・システム部門
発行日: 2014/09/01
タイトル(英語): Switching Q-Learning Using Golden Cross on Hunter Games
著者名: 伊木美 太輔(大阪府立大学大学院工学研究科知能情報工学分野),松本 啓之亮(大阪府立大学大学院工学研究科知能情報工学分野),森 直樹(大阪府立大学大学院工学研究科知能情報工学分野)
著者名(英語): Taisuke Ikimi (Dept. of Computer Science and Intelligent Systems, Graduate School of Engineering, Osaka Prefecture University), Keinosuke Matsumoto (Dept. of Computer Science and Intelligent Systems, Graduate School of Engineering, Osaka Prefecture University), Naoki Mori (Dept. of Computer Science and Intelligent Systems, Graduate School of Engineering, Osaka Prefecture University)
キーワード: 機械学習,Q学習,切り換えアルゴリズム,ゴールデンクロス,エージェント,追跡問題 machine learning,Q-Learning,switching algorithms,golden cross,agents,hunter game
要約(英語): Recently, applications of multiagent systems are expected from the view point of the parallel and distributed processing of systems. Reinforcement learning attracts attention as an implementing method of multiagent systems. However, there is a problem that the more the number of agents to deal with increases, the slower the speed of learning becomes. To solve this problem, we propose a new reinforcement learning method that can learn quickly and reduce amount of memory. It tries to increase efficiency of the learning on a hunter game by paying attention to partial states of two agents among a large number of agents. In addition, the proposed method employs a switching algorithm and detects automatically a switching time by using a special index called golden cross.
本誌: 電気学会論文誌C(電子・情報・システム部門誌) Vol.134 No.9 (2014) 特集Ⅰ:制御系設計における適応・学習・同定・モデリングの新展開 特集Ⅱ:インテリジェント・システム
本誌掲載ページ: 1318-1324 p
原稿種別: 論文/日本語
電子版へのリンク: https://www.jstage.jst.go.jp/article/ieejeiss/134/9/134_1318/_article/-char/ja/
受取状況を読み込めませんでした
