非母語話者に対する音声認識を用いた英語発音自動評価の検討
非母語話者に対する音声認識を用いた英語発音自動評価の検討
カテゴリ: 研究会(論文単位)
論文No: IS22028
グループ名: 【C】電子・情報・システム部門 情報システム研究会
発行日: 2022/10/10
タイトル(英語): A Study on Automatic Pronunciation Evaluation for English L2 Speakers using ASR
著者名: 高 子豪(神奈川大学),秋吉 政徳(神奈川大学)
著者名(英語): Zihao GAO(Kanagawa University),Masanori AKIYOSHI (Kanagawa University)
キーワード: 外国語発音支援|音声認識|自動発音評価|グッドネス・オフ・プロナンシエイション|Foreign language pronunciation support|Automatic speech recognition|Automatic pronunciation evaluation|Goodness of Pronunciation
要約(日本語): 発音誤り検出はコンピューター支援型語学教育の中重要な一環となっている。本研究では、英語学習者を対象とした自動的発音評価手法を提案する。_x000D_ Goodness of Pronunciation (GoP)アルゴリズムが用いられ、UME-ERJコーパスを実験データとして、発音良否を音素毎母国話者音声で決められる閾値で評価する。_x000D_ 評価実験はKaldi音声認識エンジンに基づいた隠れマルコフ音声モデルで行われた。話者適応を加えて、システムの評価精度の改善が観測された。_x000D_ 結果として、74.18\%の適合率、95.42\%の再現率と83.47\%のF値が出された。_x000D_
要約(英語): Mispronunciation detection is an important part in Computer-Aided Language Learning (CALL) system. We propose a e-learning system for English learners that automatically evaluate their pronunciations with feedback on missed phonemes based on Goodness of Pronunciation (GoP) algorithm. GoP is an algorithm to evaluate the pronunciation phoneme-wise using posterior probability in the Automatic Speech Recognition (ASR) process. _x000D_ The experiment uses the UME-ERJ corpus. The threshold of phoneme-wise correctness is determined based on native English speech.The evaluation process is based on Kaldi ASR engine using Hidden Markov Model (HMM) and An improvement on performance with application of speaker adaptation is observed. The experiment finally yields results with 74.18% as precision rate, 95.42% as recall rate and 83.47% as F-score.
本誌: 2022年10月13日-2022年10月14日情報システム研究会
本誌掲載ページ: 19-22 p
原稿種別: 日本語
PDFファイルサイズ: 845 Kバイト
受取状況を読み込めませんでした
