商品情報にスキップ
1 2

励起特徴と声道特徴を用いた音声感情認識の精度向上に関する研究

励起特徴と声道特徴を用いた音声感情認識の精度向上に関する研究

通常価格 ¥660 JPY
通常価格 セール価格 ¥660 JPY
セール 売り切れ
税込

カテゴリ: 研究会(論文単位)

論文No: CT23109

グループ名: 【C】電子・情報・システム部門 制御研究会

発行日: 2023/12/19

タイトル(英語): Improvement of Accuracy in Speech Emotion Recognition Using Excitation and Voice tract Features

著者名: 西谷 洋哉(長岡技術科学大学),杉田 泰則(長岡技術科学大学)

著者名(英語): Hiroya Nishitani(Nagaoka University of Technology),Yasunori Sugita(Nagaoka University of Technology)

キーワード: 励起特徴量|声道特徴量|瞬間基本周波数|励起の強さ|励起のエネルギー|メル周波数ケプストラム係数|Excitation Features|Voice tract Features|Instantaneous Fundamental Frequency|Strong of Excitation|Energy of Excitation|Mel-Frequency Cepstrum Coefficient

要約(日本語): 本論文では、音声信号における感情分類のために、励振特徴量と声道特徴量を組み合わせた新しい手法を提案する。提案手法は、声道特徴量としてメル周波数セプストラル係数(MFCC)を、励振特徴量として瞬時基本周波数(F0)、励振強さ(SoE)、励振エネルギー(EoE)を利用し、Kullback-Leibler(KL)情報を用いて音声感情を分類する。 ドイツ語の感情音声コーパス(EMO-DB)を用いた実験の結果、提案手法は、特に中立と悲しみの感情の区別において、分類精度が向上することが明らかになった。

要約(英語): This paper proposes a novel method for emotion classification in speech signals, combining excitation and voice tract features. The proposed method utilizes Mel-Frequency Cepstral Coefficients (MFCC) as the voice tract feature, and Instantaneous Fundamental Frequency (F0), Strong of Excitation (SoE), and Energy of Excitation (EoE) as excitation features, Kullback-Leibler (KL) information is used to classify a speech emotion. Experimental results on a German emotional speech corpus (EMO-DB) revealed that the proposed method has improved classification accuracy, particularly in distinguishing between neutral and sad emotions.

本誌: 2023年12月22日制御研究会

本誌掲載ページ: 1-4 p

原稿種別: 日本語

PDFファイルサイズ: 985 Kバイト

販売タイプ
書籍サイズ
ページ数
詳細を表示する