1
/
の
1
周期的に報酬が変化する環境における強化学習のための価値関数のフェザー表示に関する基礎的検討
周期的に報酬が変化する環境における強化学習のための価値関数のフェザー表示に関する基礎的検討
通常価格
¥440 JPY
通常価格
セール価格
¥440 JPY
単価
/
あたり
税込
カテゴリ: 部門大会
論文No: TC4-2
グループ名: 【C】平成22年電気学会電子・情報・システム部門大会講演論文集
発行日: 2010/09/02
タイトル(英語): A fundamental study on phasor representation of value function for reinforcement learning in environments with cyclic changes of rewards
著者名: 澁谷 長史(筑波大学)
著者名(英語): Takeshi Shibuya(University of Tsukuba)
キーワード: 強化学習|周期的に報酬が変化する環境|フェザー表示フェザー表示|reinforcement learning|environment with cyclic changes of rewards|phasor representation
要約(日本語): 自ら行動し経験を重ねることで振る舞いを獲得する枠組みとして強化学習がある。
しかし,これまでの強化学習アルゴリズムの多くは,
「変化のない」という意味での定常的な環境を前提としていた。
実応用の観点からは,より広い意味での「定常」を取り扱うクラスの
環境における学習が要求されている。
そこで本稿では,報酬の与えられ方が周期的に変化するような環境における強化学習のために,
交流回路理論におけるフェザー表示を用いる手法を提案し,その有効性を確認する。
PDFファイルサイズ: 4,496 Kバイト
受取状況を読み込めませんでした
