報酬設計自動化を考慮した強化学習法のプラント制御への適用
報酬設計自動化を考慮した強化学習法のプラント制御への適用
カテゴリ: 部門大会
論文No: GS10-1
グループ名: 【C】平成20年電気学会電子・情報・システム部門大会講演論文集
発行日: 2008/08/20
タイトル(英語): Application of Reinforcement Learning Method with Automatic Reward Design to Plant Control
著者名: 江口徹(日立製作所),関合孝朗(日立製作所),山田昭彦(日立製作所),清水悟(日立製作所),深井雅之(日立製作所)
著者名(英語): Toru Eguchi(Power & Industrial Systems R&D Laboratory,Hitachi Ltd.),Takaaki Sekiai(Power & Industrial Systems R&D Laboratory,Hitachi Ltd.),Akihiro Yamada(Power & Industrial Systems R&D Laboratory,Hitachi Ltd.),Satoru Shimizu(Information & Control Divis)
キーワード: 強化学習|報酬|自動調整|プラント制御|Reinforcement Learning|Reward|Automatic Adjustment|Plant Control
要約(日本語): 強化学習を用いて火力発電プラントから排出される環境負荷物質を抑制する制御技術を開発した。本技術はプラント特性を模擬するモデルと、モデルを用いて制御方法を学習する学習エージェントで構成される。強化学習では報酬の設計が重要となるため、エージェントに与える報酬の設計が適切でない場合、それが学習時間増加や学習失敗の原因となる。また、プラントには運転状態の変化やプラント特性の経年変化が存在するため、これらに柔軟に対応する必要がある。そこで、モデル情報を基に報酬式を自律的に調整する方式を提案し、シミュレーションで異なるプラント特性に対して報酬を自動調整し、所望の制御方法を学習可能であることを確認した。
PDFファイルサイズ: 5,822 Kバイト
受取状況を読み込めませんでした
