商品情報にスキップ
1 2

アテンション機構による音声強調ネットワークの性能改善

アテンション機構による音声強調ネットワークの性能改善

通常価格 ¥660 JPY
通常価格 セール価格 ¥660 JPY
セール 売り切れ
税込

カテゴリ: 研究会(論文単位)

論文No: ST21001

グループ名: 【C】電子・情報・システム部門 システム研究会

発行日: 2021/04/20

タイトル(英語): Performance improvement of speech enhancement network using attention-mechanism

著者名: 杉浦 陽介(埼玉大学)

著者名(英語): Yosuke Sugiura(Saitama University)

キーワード: 音声強調|雑音除去|深層ニューラルネットワーク|アテンション機構|Speech Enhancement|Noise Reduction|Deep Neural Network|Attention-mechanism

要約(日本語): 本稿では,End-to-end音声強調ネットワークの基礎的な原理と性能改善に向けたテクニックを説明する.深層学習が画像処理分野で成功してから,音声強調においても深層学習技術が積極的に導入されている.今日の音声強調ネットワークの多くは自己回帰モデルや全畳込みAutoencoderをベースとしていて,より汎化性と学習効率を向上させるためにモデル改善および学習法の工夫が行われている.ここでは,特にアテンション機構を用いたテクニックについて取り上げ,理論的な背景から今後の音声強調ネットワークにおける展望について説明する.

要約(英語): In this paper, we explain the basic principles and the improvement technique of the end-to-end speech enhancement network. In the research field of speech enhancement, the techniques of deep learning have been introduced actively since deep learning achieves success in the field of image processing. The most of the resent speech enhancement networks are based of a recurrent model and full-connectional autoencoder, _x000D_ and both their model and training architecture have been developed to simultaneously increase the model's generalization capability and training efficiency. In this paper, especially bringing up the technique using the attention-mechanism, _x000D_ we explain its theoretical background and the prospect of the speech enhancement network.

本誌: 2021年4月23日システム研究会

本誌掲載ページ: 1-4 p

原稿種別: 日本語

PDFファイルサイズ: 1,873 Kバイト

販売タイプ
書籍サイズ
ページ数
詳細を表示する