映像からの特徴量を反映させた音声の合成

¥660 JPY

セール売り切れ

税込

カテゴリ: 研究会(論文単位)

論文No: IIC22034

グループ名: 【D】産業応用部門産業計測制御研究会

発行日: 2022/11/28

タイトル(英語): Voice Synthesis based on Image Feature

著者名: 松浦篤史(芝浦工業大学),清水創太(芝浦工業大学)

著者名(英語): Atsushi Matsuura(Shibaura Institute of Technology),Sota Shimizu(Shibaura Institute of Technology)

要約(日本語): 本稿では話者の口角領域の映像特徴量を反映させた音声合成を行う手法について提案を行う．

要約(英語): This paper proposes a method by which voice is synthesized based on image feature from a speaker's mouse. In our proposed method, multi-modal information of text and lip images are applied for generating voice sounds. The authors aim at synthesizing voices synchronized with mouse motions like a dubbed movie.

本誌: 2022年12月1日-2022年12月2日産業計測制御研究会-1

本誌掲載ページ: 69-70 p

原稿種別: 日本語

PDFファイルサイズ: 597 Kバイト

販売タイプ冊子印刷（一般価格660円/会員価格440円） PDFダウンロード（一般価格330円/会員価格220円）

書籍サイズ A4

ページ数 2

数量

詳細を表示する

国/地域

映像からの特徴量を反映させた音声の合成

映像からの特徴量を反映させた音声の合成