商品情報にスキップ
1 1

ノイズ耐性を考慮したQ-learningの提案<p>  - 単位行動への時間関数の導入 -

ノイズ耐性を考慮したQ-learningの提案<p>  - 単位行動への時間関数の導入 -

通常価格 ¥440 JPY
通常価格 セール価格 ¥440 JPY
セール 売り切れ
税込

カテゴリ: 部門大会

論文No: OS6-7

グループ名: 【C】平成14年電気学会電子・情報・システム部門大会講演論文集

発行日: 2002/09/02

タイトル(英語): Noise Resistance for Q-learning - Induction of Time Function to Action Unit

著者名: 高木誠 (慶応大学),中澤和夫 (慶應義塾大学)

キーワード: 強化学習|Q-learning|reinforcement learning|Q-learning|noise resistance

要約(日本語): 強化学習は機械学習の一手法で、環境に適応するロボットシステムの構築に有効な手法である。強化学習の代表的手法としてQ-learningがあるが、学習の収束時間が長いことや、与えるデータ上のノイズに過敏に反応するなどの問題がある。本研究ではQ-learningを改良したContext Output Q-learning(COQL)を提案する。COQLはステップ毎の出力が時間関数になっているのが特徴で、Q値の更新方法にも改良を加えている。車輪型自律移動ロボットの直進行動の学習シミュレーションにて、学習の収束時間およびノイズ耐性で、COQLの従来型Q-learningに対する優位性が確認された。

PDFファイルサイズ: 2,207 Kバイト

販売タイプ
書籍サイズ
ページ数
詳細を表示する