{"product_id":"ieej-st13014","title":"状態空間の位相類似性を利用したQ学習の高速化手法","description":"\u003cp\u003e\u003cstrong\u003eカテゴリ: \u003c\/strong\u003e研究会(論文単位)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e論文No: \u003c\/strong\u003eST13014\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eグループ名: \u003c\/strong\u003e【C】電子・情報・システム部門 システム研究会\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e発行日: \u003c\/strong\u003e2013\/05\/31\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eタイトル(英語): \u003c\/strong\u003eAn accelerated learning method  for Q-learning on phase structure similarities in state space\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e著者名: \u003c\/strong\u003e神 由希子(横浜国立大学),武石 真登(横浜国立大学),濱上 知樹(横浜国立大学)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e著者名(英語): \u003c\/strong\u003eJin Yukiko(Yokohama National University),Takeishi Masato(Yokohama National University),Hamagami Tomoki(Yokohama National University)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eキーワード: \u003c\/strong\u003e強化学習|Ｑ学習|位相構造|reinforcement learning|Q-learning|phase structure\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e要約(日本語): \u003c\/strong\u003e状態空間中の遷移系列に現れる位相構造に注目したQ学習の高速化手法を提案する。類似の位相構造を有する部分系列に価値関数を伝搬することにより，学習とともに状態空間が拡大する環境において，学習の高速化が期待できる。大車輪を行うロボットのタスクを例に，本手法が学習高速化に有効であることを示す。\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e原稿種別: \u003c\/strong\u003e日本語\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003ePDFファイルサイズ: \u003c\/strong\u003e2,286 Kバイト\u003c\/p\u003e","brand":"IEEJ-PDF","offers":[{"title":"PDFダウンロード（一般価格330円\/会員価格220円） \/ A4 \/ 5","offer_id":46385017258223,"sku":"IEEJ-ST13014-PDF","price":330.0,"currency_code":"JPY","in_stock":true}],"thumbnail_url":"\/\/cdn.shopify.com\/s\/files\/1\/0718\/9512\/2159\/files\/IEEJ-PDF_a4d8f073-4317-42ed-83d0-90f4603f5253.png?v=1744332341","url":"https:\/\/ieej.bookpark.ne.jp\/products\/ieej-st13014","provider":"電気学会 電子図書館","version":"1.0","type":"link"}