2報酬PS強化学習法の提案とその有効性の検証

¥330 JPY

セール売り切れ

税込

カテゴリ: 研究会(論文単位)

論文No: ST16029

グループ名: 【C】電子・情報・システム部門システム研究会

発行日: 2016/07/09

タイトル(英語): Proposal of 2 reward PS reinforcement learning method and verification of the efficiency

著者名: 小玉直樹(明治大学),宮崎和光(独立行政法人大学改革支援・学位授与機構),小林博明(明治大学)

著者名(英語): Naoki Kodama(Meiji University),Kazuteru Miyazaki(National Institution for Academic Degrees and Quality Enhancement of Higher Education),Hiroaki Kobayashi(Meiji University)

要約(日本語): 本論文では、PS法の効率向上のために2報酬PS強化学習を提案した。2報酬PS強化学習法では、従来のPS法から、安全度という要素を追加しその安全度に応じて正の場合は正の報酬を、負の場合は負の報酬を追加で与える。その後、検証に用いるkeepawayタスクについて述べ、それを用いて，従来のPS法とそれに罰を導入したPSwithEFP，それらに2報酬PS強化学習法を導入した方法で比較を行い、PS法の効率を向上させる事が出来るかどうか検証する。

要約(英語): In this paper, a two-reward PS reinforcement learning method is proposed to improve the efficiency of PS method. A degree of safety is introduced for each rule and depending on the values, additional negative or positive rewards are given to corresponding rules. The efficiency is shown through a keepaway task.

原稿種別: 日本語

PDFファイルサイズ: 1,550 Kバイト

販売タイプ PDFダウンロード（一般価格330円/会員価格220円）

書籍サイズ A4

ページ数 6

数量

詳細を表示する

国/地域

2報酬PS強化学習法の提案とその有効性の検証

2報酬PS強化学習法の提案とその有効性の検証