複数人対話における話し手および発話の受け手の推定―発話内容を利用した映像スイッチングの自動化―

¥660 JPY

セール売り切れ

税込

カテゴリ: 研究会(論文単位)

論文No: CT23012

グループ名: 【C】電子・情報・システム部門制御研究会

発行日: 2023/02/01

タイトル(英語): Estimation Current Speaker and Recipients of Utterance in Multi-Party Meetings: Automatization of Switching with Utterance Content

著者名: 内匠桂唯(東京電機大学),斎藤博人(東京電機大学)

著者名(英語): Kei Takumi(Tokyo Denki University),Hiroto Saito(Tokyo Denki University)

要約(日本語): 複数人対話では，発話をする者が時々刻々入れ替わりながら対話が進行していく．対話を映像収録する際，映像は話し手だけでなく，発話の受け手に切り替える場合もある．これには話し手と発話の受け手を正確に判断することが必要であり人手によって行われていた．本研究では，話し手は音源の方向推定で，受け手は名前を音声認識で抽出することにより，映像スイッチングを自動化するシステムを提案する．

要約(英語): In multi-party meetings, interaction will proceed while the speaker changes. When such a meeting is recorded, it is necessary to judge who is a current speaker or recipient to switch video. In this study, a system will be suggested with a goal of automatization of switching. A current speaker and recipient are determined by sound direction of arrival estimation and speech recognition of the person's name, respectively.

本誌: 2023年2月4日-2023年2月5日制御研究会-1

本誌掲載ページ: 43-48 p

原稿種別: 日本語

PDFファイルサイズ: 981 Kバイト

販売タイプ冊子印刷（一般価格660円/会員価格440円） PDFダウンロード（一般価格330円/会員価格220円）

書籍サイズ A4

ページ数 6

数量

詳細を表示する

国/地域

複数人対話における話し手および発話の受け手の推定―発話内容を利用した映像スイッチングの自動化―

複数人対話における話し手および発話の受け手の推定―発話内容を利用した映像スイッチングの自動化―