{"product_id":"ieej-st20053ct20119","title":"ガウス過程を用いた対話型多目的強化学習手法の開発","description":"\u003cp\u003e\u003cstrong\u003eカテゴリ: \u003c\/strong\u003e研究会(論文単位)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e論文No: \u003c\/strong\u003eST20053,CT20119\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eグループ名: \u003c\/strong\u003e【C】電子・情報・システム部門 システム\/【C】電子・情報・システム部門 制御合同研究会\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e発行日: \u003c\/strong\u003e2020\/12\/13\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eタイトル(英語): \u003c\/strong\u003eInteractive multi-objective reinforcement learning using gaussian processes\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e著者名: \u003c\/strong\u003e保木本 祐介(広島大学),林田 智弘(広島大学),西崎 一郎(広島大学),関崎 真也(広島大学)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e著者名(英語): \u003c\/strong\u003eYusuke Hokimoto(Hiroshima University),Tomohiro Hayashida(Hiroshima University),ichiro Nishizaki(Hirohsima University),Shinya Sekizaki(Hiroshima University)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eキーワード: \u003c\/strong\u003e強化学習|多目的意思決定|ガウス過程|reinforcement learning|multi-objective decision making|gaussian process\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e要約(日本語): \u003c\/strong\u003e多目的最適化問題において，各状態や行動は複数の要素からなる評価ベクトルにより評価されるため，状態や行動を単一の基準で比較することが難しく，多目的のパレート解集合から選択することが合理的である．本研究では，パレート解集合からの選択基準として，ガウス過程における，各評価値の分散に基づいて行動を選択することで，学習過程を効率化した対話型多目的強化学習手法を開発する．\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e要約(英語): \u003c\/strong\u003eThis study proposed interactive multi-objective reinforcement learning(MORL) using gaussian processes.  Gaussian process(GP) measures determine the uncertainty of predictions by variance of the evaluations. Using this property of GP, it is possible to conduct effective training process by selecting actions with high variance.\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e原稿種別: \u003c\/strong\u003e日本語\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003ePDFファイルサイズ: \u003c\/strong\u003e1,084 Kバイト\u003c\/p\u003e","brand":"IEEJ-PDF","offers":[{"title":"PDFダウンロード（一般価格330円\/会員価格220円） \/ A4 \/ 4","offer_id":46393292226799,"sku":"IEEJ-ST20053CT20119-PDF","price":330.0,"currency_code":"JPY","in_stock":true}],"thumbnail_url":"\/\/cdn.shopify.com\/s\/files\/1\/0718\/9512\/2159\/files\/IEEJ-PDF_2242254b-b7d0-463f-a94f-13473f81b3ea.png?v=1744687127","url":"https:\/\/ieej.bookpark.ne.jp\/products\/ieej-st20053ct20119","provider":"電気学会 電子図書館","version":"1.0","type":"link"}