商品情報にスキップ
1 2

映像からの特徴量を反映させた音声の合成

映像からの特徴量を反映させた音声の合成

通常価格 ¥660 JPY
通常価格 セール価格 ¥660 JPY
セール 売り切れ
税込

カテゴリ: 研究会(論文単位)

論文No: IIC22034

グループ名: 【D】産業応用部門 産業計測制御研究会

発行日: 2022/11/28

タイトル(英語): Voice Synthesis based on Image Feature

著者名: 松浦 篤史(芝浦工業大学),清水 創太(芝浦工業大学)

著者名(英語): Atsushi Matsuura(Shibaura Institute of Technology),Sota Shimizu(Shibaura Institute of Technology)

要約(日本語): 本稿では話者の口角領域の映像特徴量を反映させた音声合成を行う手法について提案を行う.

要約(英語): This paper proposes a method by which voice is synthesized based on image feature from a speaker's mouse. In our proposed method, multi-modal information of text and lip images are applied for generating voice sounds. The authors aim at synthesizing voices synchronized with mouse motions like a dubbed movie.

本誌: 2022年12月1日-2022年12月2日産業計測制御研究会-1

本誌掲載ページ: 69-70 p

原稿種別: 日本語

PDFファイルサイズ: 597 Kバイト

販売タイプ
書籍サイズ
ページ数
詳細を表示する