強化学習を用いたディープビリーフネット及びその応用
強化学習を用いたディープビリーフネット及びその応用
カテゴリ: 研究会(論文単位)
論文No: ST16051
グループ名: 【C】電子・情報・システム部門 システム研究会
発行日: 2016/12/02
タイトル(英語): Training deep belief nets with reinforcement learning algorithm
著者名: 呉本 尭(山口大学),平田 貴臣(山口大学),大林 正直(山口大学),間普 真吾(山口大学),小林 邦和(愛知県立大学)
著者名(英語): Takashi Kuremoto(Yamaguchi University),Takaomi Hirata(Yamaguchi University),Masanao Obayashi(Yamaguchi University),Shingo Mabu(Yamaguchi University),Kunikazu Kobayashi(Aichi Prefectural University)
キーワード: ディープビリーフネット|制限付きボルツマンマシン|多層パーセプトロン|強化学習|確率的傾斜法|時系列予測|deep belief net|restricted Boltzmann machine|multi-layer perceptron|reinforcement learning|stochastic gradient ascent|time series forecasting
要約(日本語): 複数の制限付きボルツマンマシン(RBM)及び多層パーセプトロン(MLP)を用いたディープビリーフネット(DBN)の学習は一般的に、ネットワークエネルギ収束を目指した勾配法学習及び誤差逆伝搬法による教師あり学習を用いる。本研究では、木村らの確率的傾斜法(SGA)をDBNのファイチューニングに用いることを提案する。時系列予測実験より、提案法の有効性を示す。
要約(英語): Instead of the fine-tuning by error back-propagation to deep belief nets (DBNs) with multiple restricted Boltzmann machines (RBM) and multi-layer perceptron (MLP), a reinforcement learning algorithm named "stochastic gradient ascent (SGA)" is used in this study. Time series forecasting experiment results showed the effectiveness of the proposed method.
原稿種別: 日本語
PDFファイルサイズ: 1,089 Kバイト
受取状況を読み込めませんでした
