YOLOv11とResNet50を用いた古琴譜画像の認識と分類
YOLOv11とResNet50を用いた古琴譜画像の認識と分類
カテゴリ:研究会(論文単位)
論文No:ST25055,CT25090
グループ名:【C】電子・情報・システム部門 システム/【C】電子・情報・システム部門 制御合同研究会
発行日:2025/11/26
タイトル(英語):Recognition of Guqin Notation Images via YOLOv11 and ResNet50
著者名:伊藤 敦(日本工業大学),天野 和真(日本工業大学),石井 敬太郎(日本工業大学),呉本 舜(山口大学),小柴 満美子(人間総合科学大学),間普 真吾(山口大学),呉本 尭(日本工業大学)
著者名(英語): Atsushi Ito(Nippon Institute of Technology),Kazuma Amano(Nippon Institute of Technology),Keitaro Ishii(Nippon Institute of Technology),Shun Kuremoto(Yamaguchi University),Mamiko Koshiba(University of Human Arts and Sciences),Shingo Mabu(Yamaguchi University),Takashi Kuremoto(Nippon Institute of Technology)
キーワード:古琴,減字譜,深層学習,YOLOv11,ResNet50,K-means,Guqin,Jianzipu,deep learning,YOLOv11,ResNet50,K-means
要約(日本語):本研究は,解読困難な古琴の減字譜を深層学習で自動認識・現代譜へ変換する「自動打譜」の実現を目指す。「仙翁操」と「春曉吟」の減字譜画像に対して,YOLOv11で減字譜部分を抽出し,ResNet50とK-meansで203クラスのデータセットを構築した。そのデータセットを画像処理によって40,600枚に拡張し,ResNet50による識別精度は99.09%に達した。
要約(英語):This study aims to automate the transcription of Guqin Jianzipu notation into modern scores using deep learning methods. YOLOv11 was applied to extract notation from images of 2 Guqin music, 仙翁操(Sen-O-So, or Xian Weng Cao) and 春暁吟(Shun-Gyo-Gin, or Chun Xiao Yin). A 203-class dataset, expanded to 40,600 images via augmentation from 1,560 images extracted by YOLOv11, was clustered by ResNet50 and K-means. The fine-tuned ResNet50 achieved 99.09% recognition accuracy.
本誌:2025年11月29日-2025年11月30日システム/制御合同研究会
本誌掲載ページ:25-30p
原稿種別:日本語
PDFファイルサイズ:2,048Kバイト
受取状況を読み込めませんでした
