最適決定価値関数を表現する人工神経回路網を用いたmountain-car問題のためのプラグマティックルール・ベースの構築
最適決定価値関数を表現する人工神経回路網を用いたmountain-car問題のためのプラグマティックルール・ベースの構築
カテゴリ: 部門大会
論文No: TC16-3
グループ名: 【C】平成30年電気学会電子・情報・システム部門大会プログラム
発行日: 2018/09/05
タイトル(英語): Constructing Pragmatic Rule-Bases for Mountain-car Problem by Artificial Neural Networks which Represent Optimal State-Decision Value Function
著者名: 稲元 勉(愛媛大学),樋上 喜信(愛媛大学)
著者名(英語): Tsutomu Inamoto|Yoshinobu Higami
キーワード: 最適方策|感覚関数|人工神経回路網|深層学習|mountain-car問題|optimal policy|sensation function|artificial neural network|deep learning|mountain-car problem
要約(日本語): 本稿は,最適方策をコンパクトに符号化することを目指して著者らが提案しているプラグマティックルール・ベースを構築する試みの報告を目的とする。プラグマティックルールは,ある状態をとっているシステムに対してある決定を下した場合にシステムが被る影響度合いに基づき,所定の影響を与える任意の決定を符号化する。著者らは,その影響度合いを与える関数を感覚関数と呼び,感覚関数を人工神経回路網 (ANN) として表現できると予想し,最適方策が既知であるベンチマーク問題としてmountain-car問題を取り上げた研究を進めている。既存研究では,ある状態においてある決定を選択することが最適か否かというデータを出力として学習した ANN を用いた。本稿では,ANN の出力として最適決定価値関数を用いた結果を報告する。
PDFファイルサイズ: 128 Kバイト
受取状況を読み込めませんでした
