1
/
の
1
EDA-RLの多目的強化学習問題へ展開-多様な戦略の獲得-
EDA-RLの多目的強化学習問題へ展開-多様な戦略の獲得-
通常価格
¥440 JPY
通常価格
セール価格
¥440 JPY
単価
/
あたり
税込
カテゴリ: 部門大会
論文No: OS3-4
グループ名: 【C】平成21年電気学会電子・情報・システム部門大会講演論文集
発行日: 2009/09/03
タイトル(英語): Multi-Objective Reinforcement Learning by EDA-RL - Acquisition of Various Strategies -
著者名: 半田 久志(岡山大学)
著者名(英語): hisashi Handa(Okayama University)
キーワード: 多目的強化学習問題|分布推定アルゴリズム|進化的学習進化的学習|multi-objective reinforcement learning problems|estimation of distribution algorithms|evolutionary learning
要約(日本語): 本発表では,これまでに提案をおこなってきた強化学習問題のための分布推定アルゴリズム(EDA-RL)を多目的強化学習問題へ拡張する.EDA-RLはこれまでの分布推定アルゴリズムとは異なり,確率モデルが解を表現している.一方,個体は環境との相互作用の結果,すなわちエピソードとなっている.本発表では,エピソードの評価結果を用いてパレートフロントを形成し,パレートフロント上で確率モデルを構成しつつ探索を行う手法について検討する.
PDFファイルサイズ: 2,897 Kバイト
受取状況を読み込めませんでした
