1
/
の
1
ノイズ耐性を考慮したQ-learningの提案<p> - 単位行動への時間関数の導入 -
ノイズ耐性を考慮したQ-learningの提案<p> - 単位行動への時間関数の導入 -
通常価格
¥440 JPY
通常価格
セール価格
¥440 JPY
単価
/
あたり
税込
カテゴリ: 部門大会
論文No: OS6-7
グループ名: 【C】平成14年電気学会電子・情報・システム部門大会講演論文集
発行日: 2002/09/02
タイトル(英語): Noise Resistance for Q-learning - Induction of Time Function to Action Unit
著者名: 高木誠 (慶応大学),中澤和夫 (慶應義塾大学)
キーワード: 強化学習|Q-learning|reinforcement learning|Q-learning|noise resistance
要約(日本語): 強化学習は機械学習の一手法で、環境に適応するロボットシステムの構築に有効な手法である。強化学習の代表的手法としてQ-learningがあるが、学習の収束時間が長いことや、与えるデータ上のノイズに過敏に反応するなどの問題がある。本研究ではQ-learningを改良したContext Output Q-learning(COQL)を提案する。COQLはステップ毎の出力が時間関数になっているのが特徴で、Q値の更新方法にも改良を加えている。車輪型自律移動ロボットの直進行動の学習シミュレーションにて、学習の収束時間およびノイズ耐性で、COQLの従来型Q-learningに対する優位性が確認された。
PDFファイルサイズ: 2,207 Kバイト
受取状況を読み込めませんでした
