複数人対話における話し手および発話の受け手の推定―発話内容を利用した映像スイッチングの自動化―
複数人対話における話し手および発話の受け手の推定―発話内容を利用した映像スイッチングの自動化―
カテゴリ: 研究会(論文単位)
論文No: CT23012
グループ名: 【C】電子・情報・システム部門 制御研究会
発行日: 2023/02/01
タイトル(英語): Estimation Current Speaker and Recipients of Utterance in Multi-Party Meetings: Automatization of Switching with Utterance Content
著者名: 内匠 桂唯(東京電機大学),斎藤 博人(東京電機大学)
著者名(英語): Kei Takumi(Tokyo Denki University),Hiroto Saito(Tokyo Denki University)
キーワード: 信号処理|複数人対話|映像スイッチング|signal processing|multi-party meeting|video switching
要約(日本語): 複数人対話では,発話をする者が時々刻々入れ替わりながら対話が進行していく.対話を映像収録する際,映像は話し手だけでなく,発話の受け手に切り替える場合もある.これには話し手と発話の受け手を正確に判断することが必要であり人手によって行われていた.本研究では,話し手は音源の方向推定で,受け手は名前を音声認識で抽出することにより,映像スイッチングを自動化するシステムを提案する.
要約(英語): In multi-party meetings, interaction will proceed while the speaker changes. When such a meeting is recorded, it is necessary to judge who is a current speaker or recipient to switch video. In this study, a system will be suggested with a goal of automatization of switching. A current speaker and recipient are determined by sound direction of arrival estimation and speech recognition of the person's name, respectively.
本誌: 2023年2月4日-2023年2月5日制御研究会-1
本誌掲載ページ: 43-48 p
原稿種別: 日本語
PDFファイルサイズ: 981 Kバイト
受取状況を読み込めませんでした
