1
/
の
2
映像からの特徴量を反映させた音声の合成
映像からの特徴量を反映させた音声の合成
通常価格
¥660 JPY
通常価格
セール価格
¥660 JPY
単価
/
あたり
税込
カテゴリ: 研究会(論文単位)
論文No: IIC22034
グループ名: 【D】産業応用部門 産業計測制御研究会
発行日: 2022/11/28
タイトル(英語): Voice Synthesis based on Image Feature
著者名: 松浦 篤史(芝浦工業大学),清水 創太(芝浦工業大学)
著者名(英語): Atsushi Matsuura(Shibaura Institute of Technology),Sota Shimizu(Shibaura Institute of Technology)
要約(日本語): 本稿では話者の口角領域の映像特徴量を反映させた音声合成を行う手法について提案を行う.
要約(英語): This paper proposes a method by which voice is synthesized based on image feature from a speaker's mouse. In our proposed method, multi-modal information of text and lip images are applied for generating voice sounds. The authors aim at synthesizing voices synchronized with mouse motions like a dubbed movie.
本誌: 2022年12月1日-2022年12月2日産業計測制御研究会-1
本誌掲載ページ: 69-70 p
原稿種別: 日本語
PDFファイルサイズ: 597 Kバイト
受取状況を読み込めませんでした
