周期的に報酬が変化する環境における強化学習のための価値関数のフェザー表示に関する基礎的検討

¥440 JPY

セール売り切れ

税込

カテゴリ: 部門大会

論文No: TC4-2

グループ名: 【C】平成22年電気学会電子・情報・システム部門大会講演論文集

発行日: 2010/09/02

タイトル(英語): A fundamental study on phasor representation of value function for reinforcement learning in environments with cyclic changes of rewards

著者名: 澁谷長史(筑波大学)

著者名(英語): Takeshi Shibuya(University of Tsukuba)

要約(日本語): 自ら行動し経験を重ねることで振る舞いを獲得する枠組みとして強化学習がある。
しかし,これまでの強化学習アルゴリズムの多くは,
「変化のない」という意味での定常的な環境を前提としていた。
実応用の観点からは,より広い意味での「定常」を取り扱うクラスの
環境における学習が要求されている。
そこで本稿では,報酬の与えられ方が周期的に変化するような環境における強化学習のために,
交流回路理論におけるフェザー表示を用いる手法を提案し,その有効性を確認する。

PDFファイルサイズ: 4,496 Kバイト

販売タイプ PDFダウンロード（一般価格440円/会員価格220円）

書籍サイズ A4

ページ数 6

数量

詳細を表示する

国/地域

周期的に報酬が変化する環境における強化学習のための価値関数のフェザー表示に関する基礎的検討

周期的に報酬が変化する環境における強化学習のための価値関数のフェザー表示に関する基礎的検討