{"product_id":"ieej-20250104c01202-004","title":"リザバーネットワークを用いた部分観測制御タスクの強化学習","description":"\u003cp\u003e\u003cstrong\u003eカテゴリ: \u003c\/strong\u003e研究会(論文単位)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e論文No: \u003c\/strong\u003eCT25027\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eグループ名: \u003c\/strong\u003e【C】電子・情報・システム部門 制御研究会\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e発行日: \u003c\/strong\u003e2025\/01\/04\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eタイトル(英語): \u003c\/strong\u003eReinforcement learning for partially observable control tasks with reservoir network\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e著者名: \u003c\/strong\u003e松木 俊貴(防衛大学校),原田 理識(防衛大学校)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e著者名(英語): \u003c\/strong\u003eToshitaka Matsuki(National Defense Academy of Japan),Risato Harada(National Defense Academy of Japan)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eキーワード: \u003c\/strong\u003e深層強化学習|ＴＤ３|リザバーネットワーク|エコーステートネットワーク|Deep reinforcement learning|TD3|Reservoir network|Echo state network\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e要約(日本語): \u003c\/strong\u003e実世界での制御タスクなどでは、ノイズ等によりセンサ情報が部分観測的であることが一般的である．そのような環境での強化学習を実現するために、LSTMを用いる手法が広く研究されているが、計算資源が限られたエージェントでの利用には課題がある．そこで本研究では、計算負荷の小さい時系列処理モデルであるReservoir NetworkをTD3に組み込む手法を採用することで学習にかかる計算コストを削減できることを示す．\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e要約(英語): \u003c\/strong\u003eIn real-world control tasks, sensor information is often partially observable due to noise and other factors. While using LSTM with reinforcement learning is widely researched to address this, their application in resource-constrained agents presents challenges. This study demonstrates that incorporating a Reservoir Network into TD3 can reduce the computational cost of learning.\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e本誌: \u003c\/strong\u003e\u003ca href=\"\/products\/ieej-20250104c01202\"\u003e2025年1月7日-2025年1月8日制御研究会-2\u003c\/a\u003e\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e本誌掲載ページ: \u003c\/strong\u003e19-24 p\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e原稿種別: \u003c\/strong\u003e日本語\u003c\/p\u003e","brand":"IEEJ-P10","offers":[{"title":"冊子印刷（一般価格660円\/会員価格440円） \/ A4 \/ 6","offer_id":46408118501615,"sku":"IEEJ-20250104C01202-004-PRT","price":660.0,"currency_code":"JPY","in_stock":true},{"title":"PDFダウンロード（一般価格330円\/会員価格220円） \/ A4 \/ 6","offer_id":46408536490223,"sku":"IEEJ-20250104C01202-004-PDF","price":330.0,"currency_code":"JPY","in_stock":true}],"thumbnail_url":"\/\/cdn.shopify.com\/s\/files\/1\/0718\/9512\/2159\/files\/IEEJ-KENKYUKAI_03ad802d-9e09-46fc-a0de-de766549531e.png?v=1745232364","url":"https:\/\/ieej.bookpark.ne.jp\/products\/ieej-20250104c01202-004","provider":"電気学会 電子図書館","version":"1.0","type":"link"}