音声と画像によるマルチモーダル同時発話者特定・音声認識システムの開発

¥660 JPY

セール売り切れ

税込

カテゴリ: 研究会(論文単位)

論文No: IIC21030

グループ名: 【D】産業応用部門産業計測制御研究会

発行日: 2021/11/27

タイトル(英語): Simultaneous Speaker Specification and Voice Recognition System based on Multi-modal Deep Learning

著者名: 山賀大樹(芝浦工業大学),清水創太(芝浦工業大学)

著者名(英語): Hiroki Yamaga(Shibaura Institute of Technology),Sota Shimizu(Shibaura Institute of Technology)

要約(日本語): 本研究では，音声と映像から抽出された特徴に基づいて発話者の特定と精度の向上した音声認識を実現するマルチモーダル音声認識器の開発について述べる．

要約(英語): This paper develops a multi modal voice recognizer to achieve both identification of speaker and more accurate voice recognition using sound and image signals.

本誌: 2021年11月30日産業計測制御研究会

本誌掲載ページ: 17-18 p

原稿種別: 日本語

PDFファイルサイズ: 557 Kバイト

販売タイプ冊子印刷（一般価格660円/会員価格440円） PDFダウンロード（一般価格330円/会員価格220円）

書籍サイズ A4

ページ数 2

数量

詳細を表示する

国/地域

音声と画像によるマルチモーダル同時発話者特定・音声認識システムの開発

音声と画像によるマルチモーダル同時発話者特定・音声認識システムの開発