商品情報にスキップ
1 1

合成音声における抑揚の変化が主観的評価に与える影響の検討

合成音声における抑揚の変化が主観的評価に与える影響の検討

通常価格 ¥440 JPY
通常価格 セール価格 ¥440 JPY
セール 売り切れ
税込

カテゴリ:部門大会

論文No:PS9-8

グループ名:【C】2025年電気学会電子・情報・システム部門大会

発行日:2025/8/20

タイトル(英語):Effects of Prosodic Variation on Subjective Evaluation in Synthetic Speech

著者名:平野 達也(東海大学),中谷 裕教(東海大学)

著者名(英語): Tatsuya Hirano (Tokai University),Hironori Nakatani (Tokai University)

キーワード:音声合成,抑揚,聞き取りやすさ聞き取りやすさ,Speech Synthesis,Intonation,Intelligibility

要約(日本語):合成音声は近年、音声アシスタントや駅構内のアナウンスなど、私たちの生活に広く浸透している。一方で、合成音声は肉声に比べて聞き取りにくい、感情が伝わりにくい。特に日本語では、高低アクセントを中心とした抑揚の役割が大きく、意味理解や印象形成において重要な要素と考える。
 そこで本研究では、合成音声の「抑揚」に着目し、その変化が聞き取りやすさや自然性、好感度といった主観的評価に与える影響を調査した。音声合成ソフトを用いて、4種類(0.5倍/1.0倍/1.5倍/2.0倍)の抑揚条件を用意し、被験者10名による七件法評価を実施した。
 重回帰分析の結果、抑揚が1.5倍および2.0倍の条件では「好悪」のスコアが「聞き取りやすさ」に対して有意な正の影響を与えることが確認された。一方、抑揚0.5倍では多くの評価項目が低下しており、平坦な発話が聞き取りや自然さを損なう可能性が示唆された。

本誌掲載ページ:1706-1708p

原稿種別:日本語

PDFファイルサイズ:296Kバイト

販売タイプ
書籍サイズ
ページ数
詳細を表示する