NMFを用いたコンセンサスソフトクラスタリングによる最適トピック数の検討
NMFを用いたコンセンサスソフトクラスタリングによる最適トピック数の検討
カテゴリ: 論文誌(論文単位)
グループ名: 【C】電子・情報・システム部門
発行日: 2012/01/01
タイトル(英語): Estimation of an Optimized Number of Topics by Consensus Soft Clustering using NMF
著者名: 横井 健(東京都立産業技術高等専門学校 ものづくり工学科 電子情報工学コース)
著者名(英語): Takeru Yokoi (Monozukuri Department Electronics and Information Engineering Course, Tokyo Metropolitan College of Industrial Technology)
キーワード: コンセンサスクラスタリング,ソフトクラスタリング,トピック抽出,トピック数推定 Consensus Clustering,Soft Clustering,Topic Extraction,Topic Number Estimation
要約(英語): We propose here a novel approach to explore an optimized number of topics in a document set using consensus clustering based on Non-negative Matrix Factorization (NMF). It is useful to automatically decide the number of topics from a document set since various approaches to extract topics heuristically decide it. Consensus clustering merges multiple results of clustering so that it achieves a robust clustering. In this paper, assuming that a robust clustering is achieved by the optimized number of clusters, we have proposed a novel consensus soft clustering algorithm based on NMF and estimated an optimized number of topics with exploring a robust classification of documents into the topics.
本誌: 電気学会論文誌C(電子・情報・システム部門誌) Vol.132 No.1 (2012) 特集:確率的最適化と機械学習の統計的設計と応用
本誌掲載ページ: 53-60 p
原稿種別: 論文/日本語
電子版へのリンク: https://www.jstage.jst.go.jp/article/ieejeiss/132/1/132_1_53/_article/-char/ja/
受取状況を読み込めませんでした
