{"product_id":"ieej-ct11ps04006","title":"部分観測マルコフ決定過程を考慮した階層型強化学習を用いた二足歩行ロボットの行動制御","description":"\u003cp\u003e\u003cstrong\u003eカテゴリ: \u003c\/strong\u003e部門大会\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e論文No: \u003c\/strong\u003ePS4-6\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eグループ名: \u003c\/strong\u003e【C】平成23年電気学会電子・情報・システム部門大会講演論文集\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e発行日: \u003c\/strong\u003e2011\/09\/07\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eタイトル(英語): \u003c\/strong\u003eAction Control for Biped Walking Robot using Reinforcement Learning that Considers Partially Observable Markov Decision Process\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e著者名: \u003c\/strong\u003e相原 翔太(関東学院大学),福本 大祐(関東学院大学),山崎 洋一(関東学院大学),元木 誠(関東学院大学)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e著者名(英語): \u003c\/strong\u003esyouta Aihara(Kanto Gakuin University),Daisuke Fukumoto(Kanto Gakuin University),Youichi Yamazaki(Kanto Gakuin University),Makoto Motoki(Kanto Gakuin University)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eキーワード: \u003c\/strong\u003e部分観測マルコフ決定過程|強化学習|二足歩行ロボット|自律行動|Partially Observable Markov Decision Process|Reinforcement Learning|Biped Walking Robot|Autonomous Motion\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e要約(日本語): \u003c\/strong\u003e本研究では，部分観測マルコフ決定過程（POMDP）下における二足歩行ロボットの自律行動アルゴリズムを，単純な行動を組み合わせることで複雑な振る舞いを実現することが可能な階層型強化学習を用いて構築することを目的とする。POMDP問題を含む一つのタスクを非マルコフ性を解消するような複数の単純なサブタスクに分解することで，学習空間をマルコフ環境へと近似し，段階的に学習を行い自律行動アルゴリズムの構築を目指す。\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003ePDFファイルサイズ: \u003c\/strong\u003e1,628 Kバイト\u003c\/p\u003e","brand":"IEEJ-PDF","offers":[{"title":"PDFダウンロード（一般価格440円\/会員価格220円） \/ A4 \/ 2","offer_id":46406484885743,"sku":"IEEJ-CT11PS04006-PDF","price":440.0,"currency_code":"JPY","in_stock":true}],"thumbnail_url":"\/\/cdn.shopify.com\/s\/files\/1\/0718\/9512\/2159\/files\/IEEJ-PDF_f36ca8f4-8f90-4204-89c9-892ea861f2e0.png?v=1745140148","url":"https:\/\/ieej.bookpark.ne.jp\/products\/ieej-ct11ps04006","provider":"電気学会 電子図書館","version":"1.0","type":"link"}