敵対的生成ネットワークによる非パラレル声質変換

¥330 JPY

セール売り切れ

税込

カテゴリ: 研究会(論文単位)

論文No: ST18104

グループ名: 【C】電子・情報・システム部門システム研究会

発行日: 2018/09/27

タイトル(英語): Non-parallel Voice Conversion with Generative Adversarial Networks

著者名: 蓮沼勇太(横浜国立大学),平山千明(横浜国立大学),長尾智晴(横浜国立大学)

著者名(英語): Yuta Hasunuma(Yokohama National University),Chiaki Hirayama(Yokohama National University),Tomoharu Nagao(Yokohama National University)

要約(日本語): 声質変換の学習に使用する音声データはデータ取得の容易性から, 異なる文章を読んだ二者の音声データでも実現可能であることが望ましい．本稿では, 敵対的生成ネットワークを用いた教師なし学習によってこれを実現した．さらに, 変換音声の生成方法としてスペクトル包絡とメルケプストラムの変換・統合を行うことで, 変換音声の自然性を向上させた．主観評価実験で, 変換音声の質が従来手法と比較して向上したことを確認した.

要約(英語): Voice conversion systems which can train with non-parallel corpora is desirable in terms of ease of data collection. Our method, which uses generative adversarial networks, can train with non-parallel corpora. Moreover, by converting and integrating spectral envelopes and mel-cepstrums, the naturalness of converted voices was improved comparing to previous approaches.

原稿種別: 日本語

PDFファイルサイズ: 2,364 Kバイト

販売タイプ PDFダウンロード（一般価格330円/会員価格220円）

書籍サイズ A4

ページ数 6

数量

詳細を表示する

国/地域

敵対的生成ネットワークによる非パラレル声質変換

敵対的生成ネットワークによる非パラレル声質変換