ガウス過程を用いた対話型多目的強化学習手法の開発

¥330 JPY

セール売り切れ

税込

カテゴリ: 研究会(論文単位)

論文No: ST20053,CT20119

グループ名: 【C】電子・情報・システム部門システム/【C】電子・情報・システム部門制御合同研究会

発行日: 2020/12/13

タイトル(英語): Interactive multi-objective reinforcement learning using gaussian processes

著者名: 保木本祐介(広島大学),林田智弘(広島大学),西崎一郎(広島大学),関崎真也(広島大学)

著者名(英語): Yusuke Hokimoto(Hiroshima University),Tomohiro Hayashida(Hiroshima University),ichiro Nishizaki(Hirohsima University),Shinya Sekizaki(Hiroshima University)

要約(日本語): 多目的最適化問題において，各状態や行動は複数の要素からなる評価ベクトルにより評価されるため，状態や行動を単一の基準で比較することが難しく，多目的のパレート解集合から選択することが合理的である．本研究では，パレート解集合からの選択基準として，ガウス過程における，各評価値の分散に基づいて行動を選択することで，学習過程を効率化した対話型多目的強化学習手法を開発する．

要約(英語): This study proposed interactive multi-objective reinforcement learning(MORL) using gaussian processes. Gaussian process(GP) measures determine the uncertainty of predictions by variance of the evaluations. Using this property of GP, it is possible to conduct effective training process by selecting actions with high variance.

原稿種別: 日本語

PDFファイルサイズ: 1,084 Kバイト

販売タイプ PDFダウンロード（一般価格330円/会員価格220円）

書籍サイズ A4

ページ数 4

数量

詳細を表示する

国/地域

ガウス過程を用いた対話型多目的強化学習手法の開発

ガウス過程を用いた対話型多目的強化学習手法の開発