光リザーバコンピューティングの実装と強化学習への応用
光リザーバコンピューティングの実装と強化学習への応用
カテゴリ: 研究会(論文単位)
論文No: OQD21035
グループ名: 【C】電子・情報・システム部門 光・量子デバイス研究会
発行日: 2021/07/17
タイトル(英語): Experimental demonstration of photonic reservoir computing and its application to reinforcement learning
著者名: 菅野 円隆(埼玉大学),内田 淳史(埼玉大学)
著者名(英語): Kazutaka Kanno(Saitama University),Atsushi Uchida(Saitama University)
キーワード: 機械学習|強化学習|リザーバコンピューティング|レーザ|時間遅延システム|machine learning|reinforcement learning|reservoir computing|laser|delayed dynamical system
要約(日本語): 強化学習は自動運転など様々な制御問題で注目を集めている.一方で教師有り学習であるリザーバコンピューティングの物理実装が盛んに研究されている.本研究では2つを融合したレーザーのリザーバコンピューティングを用いた強化学習を提案する.数値シミュレーションと実験により本手法を実装し,強化学習問題の1つである倒立振り子問題を行った.その結果,提案手法により倒立振り子問題の学習を正しく行えることが分かった.
要約(英語): Reinforcement learning has been attracting attention for various control problems. In addition, the photoinc implementation of reservoir computing, which is one of the supervised learning schemes, has also been actively studied. In this study, we propose a combination of these two machine learning schemes; reinforcement learning based on photonic reservoir computing. The proposed method is suitable for high-speed processing on the edge side. We numerically and experimentally demonstrate the CartPole-v0 task and the MountainCar-v0 task, and we found that the proposed scheme can successfully perform these benchmark tasks.
本誌掲載ページ: 7-12 p
原稿種別: 日本語
PDFファイルサイズ: 697 Kバイト
受取状況を読み込めませんでした
