機械学習を用いた音源分離における学習データの選定

¥440 JPY

セール売り切れ

税込

カテゴリ：部門大会

論文No：PS7-6

グループ名：【C】2025年電気学会電子・情報・システム部門大会

発行日：2025/8/20

タイトル(英語)：Selection of training data in audio source separation using machine learning

著者名：小平海斗（日本工業大学）,木許雅則（日本工業大学）

著者名(英語)： kaito kodaira (Graduate school , Nippon Institute of Technology),masanori kimoto (Graduate school , Nippon Institute of Technology)

キーワード：音源分離,機械学習,U-NetU-Net,Machine Learning,sound source separation,U-Net

要約(日本語)：近年，様々な機械学習による音源分離が提案されており，本来困難であった相関関係の高い音源同士の分離が容易になってきている。しかし，学習データの選定が適切に行われないと，誤認識や過学習のリスクが高まる。本研究では，楽曲の分離を対象とした音源間の類似度に基づく評価値を設定し，楽曲種別毎の評価値の特徴及び，評価値に対する学習精度の傾向について検討を行う。本報告では，楽曲をinstrumentalとvocalに分離する音源分離モデルにおいて評価手法を用いて学習データの分類を行う。音量の類似度を計る音量アクティベーション類似度，周波数スペクトルの類似度を計る周波数スペクトル類似度の2種の評価値により，学習データの選定を行う。評価値により学習データの分類を行い，個々に学習を行った結果，評価値が特定の範囲内のデータでは安定した高い学習精度が得られ，範囲外のデータでは損失値の分散が大きく分離精度が低い傾向が確認できた。

本誌掲載ページ：1662-1664p

原稿種別：日本語

PDFファイルサイズ：1,990Kバイト

販売タイプ PDFダウンロード（一般価格440円/会員価格220円）

書籍サイズ A4

ページ数 2

数量

詳細を表示する

国/地域

機械学習を用いた音源分離における学習データの選定

機械学習を用いた音源分離における学習データの選定