{"product_id":"ieej-ct10tc04002","title":"周期的に報酬が変化する環境における強化学習のための価値関数のフェザー表示に関する基礎的検討","description":"\u003cp\u003e\u003cstrong\u003eカテゴリ: \u003c\/strong\u003e部門大会\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e論文No: \u003c\/strong\u003eTC4-2\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eグループ名: \u003c\/strong\u003e【C】平成22年電気学会電子・情報・システム部門大会講演論文集\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e発行日: \u003c\/strong\u003e2010\/09\/02\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eタイトル(英語): \u003c\/strong\u003eA fundamental study on phasor representation of value function for reinforcement learning in environments with cyclic changes of rewards\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e著者名: \u003c\/strong\u003e澁谷 長史(筑波大学)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e著者名(英語): \u003c\/strong\u003eTakeshi Shibuya(University of Tsukuba)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eキーワード: \u003c\/strong\u003e強化学習|周期的に報酬が変化する環境|フェザー表示フェザー表示|reinforcement learning|environment with cyclic changes of rewards|phasor representation\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e要約(日本語): \u003c\/strong\u003e自ら行動し経験を重ねることで振る舞いを獲得する枠組みとして強化学習がある。\u003cbr\u003eしかし,これまでの強化学習アルゴリズムの多くは,\u003cbr\u003e「変化のない」という意味での定常的な環境を前提としていた。\u003cbr\u003e実応用の観点からは,より広い意味での「定常」を取り扱うクラスの\u003cbr\u003e環境における学習が要求されている。\u003cbr\u003eそこで本稿では,報酬の与えられ方が周期的に変化するような環境における強化学習のために,\u003cbr\u003e交流回路理論におけるフェザー表示を用いる手法を提案し,その有効性を確認する。\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003ePDFファイルサイズ: \u003c\/strong\u003e4,496 Kバイト\u003c\/p\u003e","brand":"IEEJ-PDF","offers":[{"title":"PDFダウンロード（一般価格440円\/会員価格220円） \/ A4 \/ 6","offer_id":46406430359791,"sku":"IEEJ-CT10TC04002-PDF","price":440.0,"currency_code":"JPY","in_stock":true}],"thumbnail_url":"\/\/cdn.shopify.com\/s\/files\/1\/0718\/9512\/2159\/files\/IEEJ-PDF_8ba0af62-f234-4b7e-9eb6-a1a6d136acd9.png?v=1745138230","url":"https:\/\/ieej.bookpark.ne.jp\/products\/ieej-ct10tc04002","provider":"電気学会 電子図書館","version":"1.0","type":"link"}