合成音声における抑揚の変化が主観的評価に与える影響の検討
合成音声における抑揚の変化が主観的評価に与える影響の検討
カテゴリ:部門大会
論文No:PS9-8
グループ名:【C】2025年電気学会電子・情報・システム部門大会
発行日:2025/8/20
タイトル(英語):Effects of Prosodic Variation on Subjective Evaluation in Synthetic Speech
著者名:平野 達也(東海大学),中谷 裕教(東海大学)
著者名(英語): Tatsuya Hirano (Tokai University),Hironori Nakatani (Tokai University)
キーワード:音声合成,抑揚,聞き取りやすさ聞き取りやすさ,Speech Synthesis,Intonation,Intelligibility
要約(日本語):合成音声は近年、音声アシスタントや駅構内のアナウンスなど、私たちの生活に広く浸透している。一方で、合成音声は肉声に比べて聞き取りにくい、感情が伝わりにくい。特に日本語では、高低アクセントを中心とした抑揚の役割が大きく、意味理解や印象形成において重要な要素と考える。
そこで本研究では、合成音声の「抑揚」に着目し、その変化が聞き取りやすさや自然性、好感度といった主観的評価に与える影響を調査した。音声合成ソフトを用いて、4種類(0.5倍/1.0倍/1.5倍/2.0倍)の抑揚条件を用意し、被験者10名による七件法評価を実施した。
重回帰分析の結果、抑揚が1.5倍および2.0倍の条件では「好悪」のスコアが「聞き取りやすさ」に対して有意な正の影響を与えることが確認された。一方、抑揚0.5倍では多くの評価項目が低下しており、平坦な発話が聞き取りや自然さを損なう可能性が示唆された。
本誌掲載ページ:1706-1708p
原稿種別:日本語
PDFファイルサイズ:296Kバイト
受取状況を読み込めませんでした
