状態・決定対を入力とする人工神経回路網に関するmountain-car問題の最適方策を用いた調査
状態・決定対を入力とする人工神経回路網に関するmountain-car問題の最適方策を用いた調査
カテゴリ: 部門大会
論文No: TC5-4
グループ名: 【C】平成29年電気学会電子・情報・システム部門大会講演論文集
発行日: 2017/09/06
タイトル(英語): Study on ANNs taking State-Decision Tuples as Inputs by Using Optimal Policy of Mountain-car Problem
著者名: 稲元 勉(愛媛大学),樋上 喜信(愛媛大学)
著者名(英語): Tsutomu Inamoto|Yoshinobu Higami
キーワード: ルール・ベース|最適方策|特徴関数|人工神経回路網|深層学習|rule-base|optimal policy|characteristic function|artificial neural network|deep learning
要約(日本語): 本稿は,状態と決定を入力とする人工神経回路網 (ANN) の学習可能性に関する,mountain-car問題の最適方策を用いた調査結果の報告を目的とする.著者らは,制御/計画対象システムへ,その状態に応じて最適決定を与える最適方策が所与であると前提して,最適方策をプラグマティックルールと呼んでいるルールからなるルール・ベースとして符号化する取り組みを進めている.適切なプラグマティックルールを作成するためには,ある状態をとっているシステムに対してある決定を下すことが,そのシステムに与える影響を表す感覚関数が必要である.著者らは,近年発展の著しい深層学習を用いることで,感覚関数を ANN として構築できると予想する.この予想のもと,本稿では,状態,決定を入力,出力とするのではなく,状態および決定を入力とする ANN の教師あり学習を試みた結果を報告する.
PDFファイルサイズ: 325 Kバイト
受取状況を読み込めませんでした
