Concept Drift検知によるストリームデータのクラスタリング補正
Concept Drift検知によるストリームデータのクラスタリング補正
カテゴリ: 研究会(論文単位)
論文No: IS20062
グループ名: 【C】電子・情報・システム部門 情報システム研究会
発行日: 2020/10/12
タイトル(英語): Concept Drift Detection for Revising Data Stream Clustering
著者名: 宮田 康志(日立製作所),石川 博(東京都立大学)
著者名(英語): Yasushi Miyata(Hitachi),Hiroshi Ishikawa(Tokyo Metropolitan University)
キーワード: ストリームデータ解析|クラスタリング|Concept Drift|ロバスト性|純度|電力系統|Data Stream Mining|Clustering|Concept Drift|Robustness|Purity|Power Grid
要約(日本語): 機器の状態改善に有益な類似事例を収集するためにセンサデータをストリームクラスタリングする場合,データ傾向変化の前後で真に類似な事例の割合(純度)を高く維持する必要がある。そこで,データ分布からハイパーパラメータの変化を検出し,クラスタを逐次補正する。電力系統運用の代表的な4種類の傾向変化に対して逐次補正による純度維持を確認した。これにより,データ傾向変化後も真に類似な事例を収集できる見込みを得た。
要約(英語): Data stream clustering of IoT data can help operators immediately collection of similar cases. The challenge, however, is how to keep the clusters high-purity (i.e., keep data of the same concept in the right cluster). We propose continuously revising the clusters in accordance with the concept drift types, which correspond to data trend changes. Evaluations showed no purity deterioration for 4 types of concept drifting. This result demonstrates that our approach can help operators improve their decision making.
原稿種別: 日本語
PDFファイルサイズ: 1,247 Kバイト
受取状況を読み込めませんでした
