報酬を与えられる領域が変化する環境における強化学習

¥440 JPY

セール売り切れ

税込

カテゴリ: 部門大会

論文No: TC15-1

グループ名: 【C】平成24年電気学会電子・情報・システム部門大会講演論文集

発行日: 2012/09/05

タイトル(英語): Reinforcement learning for environment with dynamic reward domain.

著者名: 澁谷長史(筑波大学)

著者名(英語): Takeshi Shibuya(University of Tsukuba)

キーワード: 強化学習|reinforcement learning

要約(日本語): 本稿では、報酬が与えられる領域が変化する環境における強化学習の手法を提案する。自ら行動し経験を重ねることで振る舞いを獲得する枠組みとして強化学習が知られている。強化学習の枠組みにおいて学習者であるエージェントは、報酬とよばれる信号によって、望ましいふるまい獲得する。しかし、報酬を得られる領域が小さければ、エージェントは報酬を得られる状態を発見するまでに時間がかかる。逆に、報酬を得られる領域が大きければ、エージェントは特定の状態にたどり着くような振る舞いを獲得することはできない。そこで、徐々にこの領域を狭めていくことで、このトレードオフを解決するために、筆者らの提案している、非定常に報酬が変化する環境における強化学習の手法を適用する。シミュレーション実験を行い、提案手法の有効性を評価する。

PDFファイルサイズ: 1,963 Kバイト

販売タイプ PDFダウンロード（一般価格440円/会員価格220円）

書籍サイズ A4

ページ数 3

数量

詳細を表示する

国/地域

報酬を与えられる領域が変化する環境における強化学習

報酬を与えられる領域が変化する環境における強化学習