Speech Enhancement Based on Masked GAN
Speech Enhancement Based on Masked GAN
カテゴリ: 研究会(論文単位)
論文No: ST20005
グループ名: 【C】電子・情報・システム部門 システム研究会
発行日: 2020/01/28
タイトル(英語): Speech Enhancement Based on Masked GAN
著者名: 杉浦 陽介(埼玉大学),島村 徹也(埼玉大学)
著者名(英語): Yosuke Sugiura(Saitama University),Tetsuya Shimamura(Saitama University)
キーワード: 音声強調|敵対的学習|Wave-U-Net|Speech Enhancement|Adversarial Training|Wave-U-Net
要約(日本語): 音声強調は音声認識や音声通話のフロントエンドとして必須の技術である.この論文では,Wave-U-Netを用いた音声強調のための新たな敵対的学習機構を提案する.提案する識別器は,識別器に対する条件情報を生成するマスク生成器と,入力の真偽を判定する浅いネットワークの2つのネットワークで構成される.実験を通じて,提案する学習機構の有効性を明らかにする.
要約(英語): Speech enhancement is an essential technique, witch is used in the front end of speech recognition or speech communication. In this paper, we propose a novel adversarial training architecture for speech enhancement using the Wave-U-Net. The proposed discriminator consists of two networks, which are the mask generator which produces the conditional information for the discriminator and the shallow network which judges the authenticity of the input. Through the experiment, we verify the effectiveness of the proposed training architecture.
原稿種別: 英語
PDFファイルサイズ: 14,171 Kバイト
受取状況を読み込めませんでした
