強化学習における環境の特徴抽出と効率化方式の提案
強化学習における環境の特徴抽出と効率化方式の提案
カテゴリ: 部門大会
論文No: GS9-5
グループ名: 【C】2019年電気学会電子・情報・システム部門大会プログラム
発行日: 2019/08/28
タイトル(英語): Feature extraction of environment and efficiency method in reinforcement learning
著者名: 匂坂 航(神奈川大学),瀬古沢 照治(神奈川大学)
著者名(英語): Wataru Sagisaka|Teruji Sekozawa
キーワード: 機械学習|強化学習|特徴抽出|行動選択|迷路探索|Machine learning|Reinforcement learning|Feature extraction|Action select|Maze search
要約(日本語): 機械学習は人工知能を実現させる技術の1つである。機械学習の分野における強化学習は学習エージェントと環境の間の相互作用を通して学習を行う手法である。しかし,強化学習は試行錯誤的な探索を行うために,学習が遅いという問題がある。本研究は,強化学習の代表的なアルゴリズムであるQ学習に着目し,環境の特徴を活用することで学習の効率化を目指す。あらかじめ様々な環境に対して環境の特徴を抽出することで,環境一般に対するメタ的な知識の獲得し,知識を獲得するために知識を活用するエージェントを構築する。環境の特徴抽出には,エージェントの状態行動組に対して環境から与えられる報酬についてフィルター走査を活用する。エージェントが初めて訪れる状態において試行錯誤的な探索をするのではなく,そこまで遷移してきた状態行動組とあらかじめ与えられた環境の特徴を照らし合わせることで行動を決めることによりQ学習の効率化を目指す。
PDFファイルサイズ: 590 Kバイト
受取状況を読み込めませんでした
