敵対的生成ネットワークによる非パラレル声質変換
敵対的生成ネットワークによる非パラレル声質変換
カテゴリ: 研究会(論文単位)
論文No: ST18104
グループ名: 【C】電子・情報・システム部門 システム研究会
発行日: 2018/09/27
タイトル(英語): Non-parallel Voice Conversion with Generative Adversarial Networks
著者名: 蓮沼 勇太(横浜国立大学),平山 千明(横浜国立大学),長尾 智晴(横浜国立大学)
著者名(英語): Yuta Hasunuma(Yokohama National University),Chiaki Hirayama(Yokohama National University),Tomoharu Nagao(Yokohama National University)
キーワード: 非パラレル声質変換|敵対的生成ネットワーク|深層学習|non-parallel voice conversion|generative adversarial networks|deep neural network
要約(日本語): 声質変換の学習に使用する音声データはデータ取得の容易性から, 異なる文章を読んだ二者の音声データでも実現可能であることが望ましい.本稿では, 敵対的生成ネットワークを用いた教師なし学習によってこれを実現した.さらに, 変換音声の生成方法としてスペクトル包絡とメルケプストラムの変換・統合を行うことで, 変換音声の自然性を向上させた.主観評価実験で, 変換音声の質が従来手法と比較して向上したことを確認した.
要約(英語): Voice conversion systems which can train with non-parallel corpora is desirable in terms of ease of data collection. Our method, which uses generative adversarial networks, can train with non-parallel corpora. Moreover, by converting and integrating spectral envelopes and mel-cepstrums, the naturalness of converted voices was improved comparing to previous approaches.
原稿種別: 日本語
PDFファイルサイズ: 2,364 Kバイト
受取状況を読み込めませんでした
