1
/
の
2
音声と画像によるマルチモーダル同時発話者特定・音声認識システムの開発
音声と画像によるマルチモーダル同時発話者特定・音声認識システムの開発
通常価格
¥660 JPY
通常価格
セール価格
¥660 JPY
単価
/
あたり
税込
カテゴリ: 研究会(論文単位)
論文No: IIC21030
グループ名: 【D】産業応用部門 産業計測制御研究会
発行日: 2021/11/27
タイトル(英語): Simultaneous Speaker Specification and Voice Recognition System based on Multi-modal Deep Learning
著者名: 山賀 大樹(芝浦工業大学),清水 創太(芝浦工業大学)
著者名(英語): Hiroki Yamaga(Shibaura Institute of Technology),Sota Shimizu(Shibaura Institute of Technology)
要約(日本語): 本研究では,音声と映像から抽出された特徴に基づいて発話者の特定と精度の向上した音声認識を実現するマルチモーダル音声認識器の開発について述べる.
要約(英語): This paper develops a multi modal voice recognizer to achieve both identification of speaker and more accurate voice recognition using sound and image signals.
本誌掲載ページ: 17-18 p
原稿種別: 日本語
PDFファイルサイズ: 557 Kバイト
受取状況を読み込めませんでした

