報酬設計自動化を考慮した強化学習法のプラント制御への適用

¥440 JPY

セール売り切れ

税込

カテゴリ: 部門大会

論文No: GS10-1

グループ名: 【C】平成20年電気学会電子・情報・システム部門大会講演論文集

発行日: 2008/08/20

タイトル(英語): Application of Reinforcement Learning Method with Automatic Reward Design to Plant Control

著者名: 江口徹(日立製作所),関合孝朗(日立製作所),山田昭彦(日立製作所),清水悟(日立製作所),深井雅之(日立製作所)

著者名(英語): Toru Eguchi(Power & Industrial Systems R&D Laboratory,Hitachi Ltd.),Takaaki Sekiai(Power & Industrial Systems R&D Laboratory,Hitachi Ltd.),Akihiro Yamada(Power & Industrial Systems R&D Laboratory,Hitachi Ltd.),Satoru Shimizu(Information & Control Divis)

要約(日本語): 強化学習を用いて火力発電プラントから排出される環境負荷物質を抑制する制御技術を開発した。本技術はプラント特性を模擬するモデルと、モデルを用いて制御方法を学習する学習エージェントで構成される。強化学習では報酬の設計が重要となるため、エージェントに与える報酬の設計が適切でない場合、それが学習時間増加や学習失敗の原因となる。また、プラントには運転状態の変化やプラント特性の経年変化が存在するため、これらに柔軟に対応する必要がある。そこで、モデル情報を基に報酬式を自律的に調整する方式を提案し、シミュレーションで異なるプラント特性に対して報酬を自動調整し、所望の制御方法を学習可能であることを確認した。

PDFファイルサイズ: 5,822 Kバイト

販売タイプ PDFダウンロード（一般価格440円/会員価格220円）

書籍サイズ A4

ページ数 6

数量

詳細を表示する

国/地域

報酬設計自動化を考慮した強化学習法のプラント制御への適用

報酬設計自動化を考慮した強化学習法のプラント制御への適用