Cross Attentionを用いたViViTによる行動認識精度の向上

¥660 JPY

セール売り切れ

税込

カテゴリ: 研究会(論文単位)

論文No: CT25062

グループ名: 【C】電子・情報・システム部門制御研究会

発行日: 2025/05/07

タイトル(英語): Improving Action Recognition Accuracy with ViViT Using Cross Attention

著者名: 東昂巳(立命館大学),孟林(立命館大学)

著者名(英語): Takashi Higashi(Graduate School of Ritsumeikan University),Lin Meng(Ritsumeikan University)

要約(日本語): 本研究では、行動認識の精度向上を目的として、ViViTモデルにCross Attention機構を導入し、RGB、深度、骨格情報を統合する深層学習手法を提案する。RGBをQuery、深度および骨格情報をKeyおよびValueとして用いることで、立位、座位、転倒、暴力行為などを含む複雑な行動を認識する。本手法は、異なる視点からの情報を統合的に学習可能にし、行動認識技術のさらなる発展に寄与する。

要約(英語): This study presents a method to enhance human action recognition accuracy by integrating a Cross Attention mechanism into the ViViT model. By fusing RGB, depth, and skeletal data, the model captures various aspects of human motion, allowing it to learn from multiple perspectives and improve action recognition performance.

本誌: 2025年5月10日-2025年5月11日制御研究会

本誌掲載ページ: 87-92 p

原稿種別: 日本語

PDFファイルサイズ: 1,502 Kバイト

販売タイプ冊子印刷（一般価格660円/会員価格440円） PDFダウンロード（一般価格330円/会員価格220円）

書籍サイズ A4

ページ数 6

数量

詳細を表示する

国/地域

Cross Attentionを用いたViViTによる行動認識精度の向上

Cross Attentionを用いたViViTによる行動認識精度の向上