商品情報にスキップ
1 2

機械学習を用いた音声の区間欠落の復元に関する研究

機械学習を用いた音声の区間欠落の復元に関する研究

通常価格 ¥660 JPY
通常価格 セール価格 ¥660 JPY
セール 売り切れ
税込

カテゴリ: 研究会(論文単位)

論文No: CT21036

グループ名: 【C】電子・情報・システム部門 制御研究会

発行日: 2021/01/25

タイトル(英語): A study on restoration of missing speech data using machine learning

著者名: 守谷 歩(長岡技術科学大学),杉田 泰則(長岡技術科学大学)

著者名(英語): Ayumu Moriya(Nagaoka University of Technology),Yasunori Sugita(Nagaoka University of Technology)

キーワード: 機械学習|音声復元|話者認識モデル|話者合成モデル|異常検知|Machine learning|Speech restoration|Speaker recognition model|Speech synthesis model|anomaly detection

要約(日本語): 近年,インターネットを使用した音声通話アプリケーションの需要が増加している.しかしそのようなアプリケーションでは,パケットロスやジッタの影響により,音声データの欠落や遅延を生じることがある.本稿では,欠落区間の検知と復元の2つの機械学習モデルで構成される音声データの復元法を提案する。欠落区間の検出には話者認識モデルであるX-vectorを,欠落区間の復元には音声合成モデルであるParallel Wavenetを用いる。

要約(英語): In voice call applications, voice data is lost or delayed because of packet loss and jitter. In this paper, we propose a restoration method for missing section speech data, which consists of a missing section detection model and a restoration model. In the proposed method, X-vector, which is one of the speaker recognition models, is used to detect the missing section, and Parallel Wavenet, which is one of the speech synthesis models, is used to restore the missing section.

本誌: 2021年1月28日制御研究会

本誌掲載ページ: 1-6 p

原稿種別: 日本語

PDFファイルサイズ: 1,111 Kバイト

販売タイプ
書籍サイズ
ページ数
詳細を表示する