Cross Attentionを用いたViViTによる行動認識精度の向上
Cross Attentionを用いたViViTによる行動認識精度の向上
カテゴリ: 研究会(論文単位)
論文No: CT25062
グループ名: 【C】電子・情報・システム部門 制御研究会
発行日: 2025/05/07
タイトル(英語): Improving Action Recognition Accuracy with ViViT Using Cross Attention
著者名: 東 昂巳(立命館大学),孟 林(立命館大学)
著者名(英語): Takashi Higashi(Graduate School of Ritsumeikan University),Lin Meng(Ritsumeikan University)
キーワード: 人工知能|Vision Transformer|行動認識|クロスアテンション|AI|Vision Transformer|Action Recognition|Cross Attention
要約(日本語): 本研究では、行動認識の精度向上を目的として、ViViTモデルにCross Attention機構を導入し、RGB、深度、骨格情報を統合する深層学習手法を提案する。RGBをQuery、深度および骨格情報をKeyおよびValueとして用いることで、立位、座位、転倒、暴力行為などを含む複雑な行動を認識する。本手法は、異なる視点からの情報を統合的に学習可能にし、行動認識技術のさらなる発展に寄与する。
要約(英語): This study presents a method to enhance human action recognition accuracy by integrating a Cross Attention mechanism into the ViViT model. By fusing RGB, depth, and skeletal data, the model captures various aspects of human motion, allowing it to learn from multiple perspectives and improve action recognition performance.
本誌: 2025年5月10日-2025年5月11日制御研究会
本誌掲載ページ: 87-92 p
原稿種別: 日本語
PDFファイルサイズ: 1,502 Kバイト
受取状況を読み込めませんでした
