ガウス過程を用いた対話型多目的強化学習手法の開発
ガウス過程を用いた対話型多目的強化学習手法の開発
カテゴリ: 研究会(論文単位)
論文No: ST20053,CT20119
グループ名: 【C】電子・情報・システム部門 システム/【C】電子・情報・システム部門 制御合同研究会
発行日: 2020/12/13
タイトル(英語): Interactive multi-objective reinforcement learning using gaussian processes
著者名: 保木本 祐介(広島大学),林田 智弘(広島大学),西崎 一郎(広島大学),関崎 真也(広島大学)
著者名(英語): Yusuke Hokimoto(Hiroshima University),Tomohiro Hayashida(Hiroshima University),ichiro Nishizaki(Hirohsima University),Shinya Sekizaki(Hiroshima University)
キーワード: 強化学習|多目的意思決定|ガウス過程|reinforcement learning|multi-objective decision making|gaussian process
要約(日本語): 多目的最適化問題において,各状態や行動は複数の要素からなる評価ベクトルにより評価されるため,状態や行動を単一の基準で比較することが難しく,多目的のパレート解集合から選択することが合理的である.本研究では,パレート解集合からの選択基準として,ガウス過程における,各評価値の分散に基づいて行動を選択することで,学習過程を効率化した対話型多目的強化学習手法を開発する.
要約(英語): This study proposed interactive multi-objective reinforcement learning(MORL) using gaussian processes. Gaussian process(GP) measures determine the uncertainty of predictions by variance of the evaluations. Using this property of GP, it is possible to conduct effective training process by selecting actions with high variance.
原稿種別: 日本語
PDFファイルサイズ: 1,084 Kバイト
受取状況を読み込めませんでした
