商品情報にスキップ
1 1

状態遷移予測型強化学習法の提案

状態遷移予測型強化学習法の提案

通常価格 ¥440 JPY
通常価格 セール価格 ¥440 JPY
セール 売り切れ
税込

カテゴリ: 部門大会

論文No: TC11-6

グループ名: 【C】2021年電気学会電子・情報・システム部門大会

発行日: 2021/09/08

タイトル(英語): A Proposal of Reinforcement Learning Method with State Transition Prediction

著者名: 小玉 直樹(明治大学),宮崎 和光(大学改革支援・学位授与機構),原田 拓(東京理科大学)

著者名(英語): Naoki Kodama (Meiji University),Kazuteru Miyazaki (National Institution for Academic Degrees and Quality Enhancement of Higher Education),Taku Harada (Tokyo University of Science)

キーワード: 強化学習|Q学習|機械学習|深層学習|Reinforcement Learning|Q-learning|Machine Learning|Deep Learning

要約(日本語): 近年、深層強化学習はゲーム問題や信号機の協調制御問題などの応用タスクで有効性が示されている.しかし,深層強化学習ではエージェントの判断理由がブラックボックス化されているという問題がある.この問題を解決する方法として、現在状態からエージェントの状態遷移の予測を提示する方法が考えられる.しかし、現状の強化学習法では状態遷移の予測を行わないため、そのような情報を人間に提示することはできない。そこで本研究では、状態遷移先の予測を行うと共に、その予測状態を利用した学習を行う状態遷移予測型強化学習法の提案を行う。提案手法は迷路問題によって説明可能性と学習性能に関して有効性の検証を行う。

PDFファイルサイズ: 747 Kバイト

販売タイプ
書籍サイズ
ページ数
詳細を表示する