{"product_id":"ieej-20231202x13101-001","title":"PILCOにおけるカーネル関数の変更による予測精度の向上","description":"\u003cp\u003e\u003cstrong\u003eカテゴリ: \u003c\/strong\u003e研究会(論文単位)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e論文No: \u003c\/strong\u003eST23030,CT23093\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eグループ名: \u003c\/strong\u003e【C】電子・情報・システム部門 システム\/【C】電子・情報・システム部門 制御合同研究会\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e発行日: \u003c\/strong\u003e2023\/11\/29\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eタイトル(英語): \u003c\/strong\u003eImproving Prediction Accuracy by Modifying Kernel Functions in PILCO\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e著者名: \u003c\/strong\u003e加藤 鳳人(愛知県立大学),小林 邦和(愛知県立大学)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e著者名(英語): \u003c\/strong\u003eKato Takato(Aichi Prefectural University),Kobayashi Kunikazu(Aichi Prefectural University)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eキーワード: \u003c\/strong\u003eモデルベース強化学習|ＰＩＬＣＯ|状態遷移モデル|カーネル関数|マルコフ連鎖モンテカルロ法|Ｍｏｕｎｔａｉｎ　Ｃａｒ　Ｃｏｎｔｉｎｕｏｕｓ|Model-based reinforcement learning|PILCO|State transition model|Kernel function|Markov chain Monte Carlo method|Mountain Car Continuous\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e要約(日本語): \u003c\/strong\u003eモデルベース強化学習は，深層強化学習と異なり，訓練のために膨大なデータを必要としない．しかし，状態遷移モデルの訓練には，ある程度のデータが必要となるので，ガウス過程を用いてさらに少ないデータで状態遷移モデルを近似するPILCOが提案されている. しかし, PILCO はガウス過程回帰の出力の期待値を求める必要があり, カーネル関数を変更するたびに期待値を解析的に求めなければならず，カーネル関数の変更が容易ではない. 本研究では，この問題を解決し, PILCOのカーネル関数の変更を容易にすることで予測精度を向上させることを目的とする. \u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e要約(英語): \u003c\/strong\u003eModel-based reinforcement learning, in contrast to deep reinforcement learning, does not require large amount of data for training._x000D_\nHowever, training state-transition models requires a certain amount of data, so PILCO has been proposed to approximate state-transition models with even less data by using Gaussian processes. However, PILCO needs to obtain the expected value of the output of the Gaussian process regression. Then, the expectation must be obtained analytically each time the kernel function is changed, which makes changing the kernel function not easy. The present research aims to solve this issue and improve the predictive accuracy by facilitating the modification of the kernel-function of PILCO.\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e本誌: \u003c\/strong\u003e\u003ca href=\"\/products\/ieej-20231202x13101\"\u003e2023年12月2日-2023年12月3日システム\/制御合同研究会\u003c\/a\u003e\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e本誌掲載ページ: \u003c\/strong\u003e1-6 p\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e原稿種別: \u003c\/strong\u003e日本語\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003ePDFファイルサイズ: \u003c\/strong\u003e1,110 Kバイト\u003c\/p\u003e","brand":"IEEJ-P10","offers":[{"title":"冊子印刷（一般価格660円\/会員価格440円） \/ A4 \/ 6","offer_id":46352508223727,"sku":"IEEJ-20231202X13101-001-PRT","price":660.0,"currency_code":"JPY","in_stock":true},{"title":"PDFダウンロード（一般価格330円\/会員価格220円） \/ A4 \/ 6","offer_id":46355562299631,"sku":"IEEJ-20231202X13101-001-PDF","price":330.0,"currency_code":"JPY","in_stock":true}],"thumbnail_url":"\/\/cdn.shopify.com\/s\/files\/1\/0718\/9512\/2159\/files\/IEEJ-KENKYUKAI_65a44182-3c59-4bcc-957a-57f91e4fca6d.png?v=1743234506","url":"https:\/\/ieej.bookpark.ne.jp\/products\/ieej-20231202x13101-001","provider":"電気学会 電子図書館","version":"1.0","type":"link"}