アンサンブル逆強化学習による不完全知覚状態の回避

¥440 JPY

セール売り切れ

税込

カテゴリ: 部門大会

論文No: TC6-3

グループ名: 【C】平成28年電気学会電子・情報・システム部門大会講演論文集

発行日: 2016/08/31

タイトル(英語): Avoidance of the perceptual aliasing by ensemble inverse reinforcement learning

著者名: 濱上知樹(横浜国立大学)

著者名(英語): Tomoki Hamagami()

要約(日本語): 逆強化学習において，最適な行動をとるエキスパートが存在せず，理想的な報酬関数を獲得できない場合に，複数の準エキスパートから推定される報酬関数をアンサンブルさせる逆強化学習の有効性を示した。エキスパートが存在しない環境として，不完全知覚の存在するグリッドワールドを想定し，不十分な性能の準エキスパートからの見習い学習結果を用いた．適応ブースティングの手法を用いて報酬関数を統合することにより，不完全知覚を避ける報酬関数の生成と，振る舞いの獲得が可能になった。今後の課題として，準エキスパートの獲得方法，必要な準エキスパートの個体数の最適化方法があげられる。

PDFファイルサイズ: 742 Kバイト

販売タイプ PDFダウンロード（一般価格440円/会員価格220円）

書籍サイズ A4

ページ数 6

数量

詳細を表示する

国/地域

アンサンブル逆強化学習による不完全知覚状態の回避

アンサンブル逆強化学習による不完全知覚状態の回避