板倉斎藤距離を用いた深層オートエンコーダによるマススペクトルの特徴抽出
板倉斎藤距離を用いた深層オートエンコーダによるマススペクトルの特徴抽出
カテゴリ: 研究会(論文単位)
論文No: BMS17058
グループ名: 【E】センサ・マイクロマシン部門 バイオ・マイクロシステム研究会
発行日: 2017/11/28
タイトル(英語): Dimensionality reduction of mass spectra by Itakura-Saito distance based deep autoencoder
著者名: 野崎 裕二(東京工業大学),中本 高道(東京工業大学)
著者名(英語): Yuji Nozaki(Tokyo Institute of Technology),Takamichi Nakamoto(Tokyo Institute of Technology)
キーワード: 次元圧縮|マススペクトル|オートエンコーダ|深層学習|dimensionality reduction|mass spectrum|autoencoder|deep learning
要約(日本語): マススペクトルは一般に広いダイナミックレンジのデータであり、低m/z領域のピークと高m/z領域のピークでは大きさが数十?数百倍も異なる。本研究ではマススペクトルの次元圧縮に用いるオートエンコーダの誤差関数として板倉斎藤距離を提案する。板倉斎藤距離は、近年ではNMF法と組み合わせて音響パワースペクトルからの雑音除去や音源分離などの研究や、画像データの目鼻などのパーツ分離による顔認証や顔画像合成に用いられている。文字認識などの機械学習アプリケーションにおいて、値の小さなピクセルは文字の掠れなどのサンプルの重要ではない特徴やノイズを示すが、本研究で取り扱う質量分析器のデータにおいてはノイズは殆ど現れず、こうした小さなピークもサンプルの重要な性質を示すものである。特にマススペクトルの高m/z領域のピークは人の嗅覚閾値が低く、低m/z領域のピークに比べて匂い印象への寄与が大きい。提案する板倉斎藤距離をベースとしたオートエンコーダは従来用いられてきた二乗和誤差や交差エントローピーに比べ、こうした小さなピークの近似精度が有為に向上した。
要約(英語): Autoencoders are widely used nonlinear dimensionality reduction technique which learn a compressed representation of a target dataset.We present an autoencoder with Itakura-Saito distance as cost function aiming to achieve a high approximation capability to small values in a dataset with experimental results of dimensionality reduction.
原稿種別: 日本語
PDFファイルサイズ: 1,615 Kバイト
受取状況を読み込めませんでした
