強化学習による羊群のハーディングに関する基礎的検討
強化学習による羊群のハーディングに関する基礎的検討
カテゴリ: 全国大会
論文No: 3-083
グループ名: 【全国大会】令和2年電気学会全国大会論文集
発行日: 2020/03/01
タイトル(英語): A Basic Investigation on Herding a Flock of Sheep by Reinforcement Learning
著者名: 鈴木俊亮(熊本県立大学),飯村伊智郎(熊本県立大学),中山茂(鹿児島大学)
著者名(英語): Shunsuke Suzuki (Prefectural University of Kumamoto),Ichiro Iimura (Prefectural University of Kumamoto),Shigeru Nakayama (Kagoshima University)
キーワード: 強化学習|深層強化学習|羊|群れ|ハーディング|ハーディング・アルゴリズム|キョウカガクシュウ|シンソウキョウカガクシュウ|ヒツジ|ムレ|ハーディング|ハーディング・アルゴリズム
要約(日本語): Strombomらは、牧羊犬が羊の群れを巧みに操り目的地へ誘導するアルゴリズムを解明した。これはHerding Algorithmと呼ばれ、牧羊犬の行動を、羊の群れを目的地へと誘導するdrivingと、羊を1つの群れにまとめるcollectingの2つでモデル化している。Goらは、このモデルにおいて、強化学習(RL)により生成した推論モデルでエージェント(牧羊犬)が羊の群れをハーディングできることを示しているが、離散化された状態(環境の状態)と行動空間で、drivingとcollectingを行う位置への移動行動のみをRLで学習している。本研究では、連続的な状態と行動空間を想定し、エージェントのハーディング行動そのものを学習対象としてRLにより生成した推論モデルでハーディング可能であることを確認した。
本誌掲載ページ: 119-120 p
原稿種別: 日本語
受取状況を読み込めませんでした
