商品情報にスキップ
1 2

音声と画像によるマルチモーダル同時発話者特定・音声認識システムの開発

音声と画像によるマルチモーダル同時発話者特定・音声認識システムの開発

通常価格 ¥660 JPY
通常価格 セール価格 ¥660 JPY
セール 売り切れ
税込

カテゴリ: 研究会(論文単位)

論文No: IIC21030

グループ名: 【D】産業応用部門 産業計測制御研究会

発行日: 2021/11/27

タイトル(英語): Simultaneous Speaker Specification and Voice Recognition System based on Multi-modal Deep Learning

著者名: 山賀 大樹(芝浦工業大学),清水 創太(芝浦工業大学)

著者名(英語): Hiroki Yamaga(Shibaura Institute of Technology),Sota Shimizu(Shibaura Institute of Technology)

要約(日本語): 本研究では,音声と映像から抽出された特徴に基づいて発話者の特定と精度の向上した音声認識を実現するマルチモーダル音声認識器の開発について述べる.

要約(英語): This paper develops a multi modal voice recognizer to achieve both identification of speaker and more accurate voice recognition using sound and image signals.

本誌: 2021年11月30日産業計測制御研究会

本誌掲載ページ: 17-18 p

原稿種別: 日本語

PDFファイルサイズ: 557 Kバイト

販売タイプ
書籍サイズ
ページ数
詳細を表示する