{"product_id":"ieej-st14032","title":"エージェントの行動履歴の活用による Q-learningの学習効率向上","description":"\u003cp\u003e\u003cstrong\u003eカテゴリ: \u003c\/strong\u003e研究会(論文単位)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e論文No: \u003c\/strong\u003eST14032\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eグループ名: \u003c\/strong\u003e【C】電子・情報・システム部門 システム研究会\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e発行日: \u003c\/strong\u003e2014\/12\/07\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eタイトル(英語): \u003c\/strong\u003eImproving effciency of Q-learning by using the agent's action history\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e著者名: \u003c\/strong\u003e齋藤 雅矩(神奈川大学),増田 和明(神奈川大学),瀬古沢 照治(神奈川大学)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e著者名(英語): \u003c\/strong\u003eMasanori Saito(Kanagawa University),Kazuaki Masuda(Kanagawa University),Teruji Sekozawa(Kanagawa University)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eキーワード: \u003c\/strong\u003e機械学習|強化学習|Ｑ－ｌｅａｒｎｉｎｇ|行動履歴|machine learning|reinforcement learning|Q-learning|action history\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e要約(日本語): \u003c\/strong\u003eQ学習は試行錯誤探索によって期待報酬を最大化するために、状態行動価値関数（Q値）を更新することにより、最適な方策を学習する手法である。我々は行動選択で行動履歴を用いたQ学習法を提案する。この方法は、エージェントの行動選択において行動の履歴から失敗した行動を回避することによってQ学習の効率を向上させる。\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e要約(英語): \u003c\/strong\u003eQ-learning is learning the optimal policy by updating in action-state value function(Q-value) to maximize a expectation reward by a trial and error search. we propose a improved Q-learning method by using action history in action selection. this method be able to improving efficiency of Q-learning by avoiding failed stats which agent’s action selection is using recorded action’s history.\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e原稿種別: \u003c\/strong\u003e日本語\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003ePDFファイルサイズ: \u003c\/strong\u003e1,305 Kバイト\u003c\/p\u003e","brand":"IEEJ-PDF","offers":[{"title":"PDFダウンロード（一般価格330円\/会員価格220円） \/ A4 \/ 6","offer_id":46387544883439,"sku":"IEEJ-ST14032-PDF","price":330.0,"currency_code":"JPY","in_stock":true}],"thumbnail_url":"\/\/cdn.shopify.com\/s\/files\/1\/0718\/9512\/2159\/files\/IEEJ-PDF_7e74b847-dd30-4293-90b9-8b288d547fbb.png?v=1744422320","url":"https:\/\/ieej.bookpark.ne.jp\/products\/ieej-st14032","provider":"電気学会 電子図書館","version":"1.0","type":"link"}