探索と利用のトレードオフを考慮したアクティブセンシングの基礎検討
探索と利用のトレードオフを考慮したアクティブセンシングの基礎検討
カテゴリ: 研究会(論文単位)
論文No: ST15028
グループ名: 【C】電子・情報・システム部門 システム研究会
発行日: 2015/12/06
タイトル(英語): A fundamental study on active sensing method considered Exploration-Exploitation Trade-off
著者名: 福田 将貴(筑波大学),澁谷 長史(筑波大学)
著者名(英語): Masaki Fukuda(University of Tsukuba),Takeshi Shibuya(University of Tsukuba)
キーワード: アクティブセンシング|観測|センシング戦略|探索と利用のトレードオフ|多腕バンディット|行動選択|active sensing|observation|sensing strategy|Exploration-Exploitation Trade-off|Multi-armed bandit|action selection
要約(日本語): アクティブセンシングは,センサの向きを変更して情報を収集するセンシングである。これは,いつどこを観測すれば有用な情報を得られるかを考慮したセンシング戦略が必要である。多腕バンディットは,どこを観測すれば有用な情報を得られるかというトレードオフ問題に有効である。しかし,従来手法では学習に「いつ」を考慮していない。よって,本研究では,「いつ」を考慮した行動選択が可能な強化学習法を提案する。
要約(英語): An active sensing collects information by changing the direction of the sensor. This sensing needs the sensing strategy which considered “when and where to observe”. Multi-armed bandit can consider “where to observe”. However, the conventional method cannot consider “when”. Therefore, this paper proposes reinforcement learning method possible to select action considered “when”.
原稿種別: 日本語
PDFファイルサイズ: 989 Kバイト
受取状況を読み込めませんでした
