商品情報にスキップ
1 1

索引語の相関性を考慮した類似度計算による文書分類

索引語の相関性を考慮した類似度計算による文書分類

通常価格 ¥440 JPY
通常価格 セール価格 ¥440 JPY
セール 売り切れ
税込

カテゴリ: 全国大会

論文No: 3-033

グループ名: 【全国大会】平成20年電気学会全国大会論文集

発行日: 2008/03/19

タイトル(英語): Text Classification Using Similarity According to Correlation between Index Words

著者名: 柳本 豪一(大阪府立大学),大松 繁(大阪府立大学)

著者名(英語): Hidekazu Yanagimoto(Osaka Prefecture University),Sigeru Omatu(Osaka Prefecture University)

キーワード: 文書分類|Earth Mover's Distance

要約(日本語): 従来のベクトル空間法におけるコサイン類似度では、直交空間を仮定していた。しかし、実際の索引語は無相関ではないでため、上記の仮定が成立しているとは言い難い。したがって、この仮定を必要としない類似度計算を用いることで文書の類似度判定の精度を向上させることを目的とする。本論文では、Earth Mover’s Distanceを文書類似度として用いることで、上記の目的を実現する。実験ではReuter-21578を用いた文書分類を行い、分類の正解率により性能を評価する。実験より提案手法は従来手法に比べ分類性能が向上することが分かり、索引語を選別することで精度が向上することが明らかになった。

原稿種別: 日本語

PDFファイルサイズ: 1,443 Kバイト

販売タイプ
書籍サイズ
ページ数
詳細を表示する