音声ラベルを用いた3DCNNにおける効率性と頑健性の検証
音声ラベルを用いた3DCNNにおける効率性と頑健性の検証
カテゴリ: 全国大会
論文No: 3-080
グループ名: 【全国大会】令和6年電気学会全国大会論文集
発行日: 2024/03/01
タイトル(英語): A Study of Efficiency and Robustness Validation in 3DCNN using Speech Labels
著者名: 王雨桐(日本大学),関弘翔(日本大学),細野裕行(日本大学)
著者名(英語): Yutong Wang (Nihon University),Hiroto Seki (Nihon University),Hiroyuki Hosono (Nihon University)
キーワード: 3DCNN|動画分類|音声ラベル|3DCNN|Video Classification|Speech Labels
要約(日本語): 人物動作認識で使用されるディープニューラルネットワーク(DNN)には,画像認識で使われる二次元の畳み込みニューラルネットワーク(2DCNN)を時間軸方向に拡張した三次元の畳み込みニューラルネットワーク(3DCNN)を使用するモデルなどがある。また画像分類においては,学習データ量が少ない場合,教師あり学習における教師信号として音声ラベルを使用することでより識別性の高い特徴の学習を促すという報告がある。そこで本研究では,通常のカテゴリラベルでなく,音声ラベルを用いて動画分類器を構築し,頑健性と効率性の観点でその有用性を評価した。カテゴリラベルのモデルと比較し,データ量が限られた範囲内では,音声ラベルの利用がデータの効率性とモデルの頑健性を向上させる結果になった。
本誌掲載ページ: 119-120 p
原稿種別: 日本語
PDFファイルサイズ: 282 Kバイト
受取状況を読み込めませんでした
