商品情報にスキップ
1 1

アンサンブル逆強化学習による不完全知覚状態の回避

アンサンブル逆強化学習による不完全知覚状態の回避

通常価格 ¥440 JPY
通常価格 セール価格 ¥440 JPY
セール 売り切れ
税込

カテゴリ: 部門大会

論文No: TC6-3

グループ名: 【C】平成28年電気学会電子・情報・システム部門大会講演論文集

発行日: 2016/08/31

タイトル(英語): Avoidance of the perceptual aliasing by ensemble inverse reinforcement learning

著者名: 濱上 知樹(横浜国立大学)

著者名(英語): Tomoki Hamagami()

キーワード: 逆強化学習|アンサンブル学習|不完全知覚不完全知覚|inverse reinforcement learning|ensemble learning|perceptual aliasing

要約(日本語): 逆強化学習において,最適な行動をとるエキスパートが存在せず,理想的な報酬関数を獲得できない場合に,複数の準エキスパートから推定される報酬関数をアンサンブルさせる逆強化学習の有効性を示した。エキスパートが存在しない環境として,不完全知覚の存在するグリッドワールドを想定し,不十分な性能の準エキスパートからの見習い学習結果を用いた.適応ブースティングの手法を用いて報酬関数を統合することにより,不完全知覚を避ける報酬関数の生成と,振る舞いの獲得が可能になった。今後の課題として,準エキスパートの獲得方法,必要な準エキスパートの個体数の最適化方法があげられる。

PDFファイルサイズ: 742 Kバイト

販売タイプ
書籍サイズ
ページ数
詳細を表示する