商品情報にスキップ
1 1

テキストマイニングにおける単語の表記のゆれの統制について

テキストマイニングにおける単語の表記のゆれの統制について

通常価格 ¥440 JPY
通常価格 セール価格 ¥440 JPY
セール 売り切れ
税込

カテゴリ: 部門大会

論文No: GS13-4

グループ名: 【C】平成17年電気学会電子・情報・システム部門大会講演論文集

発行日: 2005/09/06

タイトル(英語): About control of a various notation of the word in text mining

著者名: 長谷山 聡(東京電力)

著者名(英語): Satoshi Haseyama()

キーワード: テキストマイニング|text mining

要約(日本語): テキストマイニングにおいて、そのデータとなる単語は、同様の事象を指す単語でも、さまざまな表記がなされており、現実には多種多様な表現がなされている。
また、表記ミスされて記述されている単語も有りえる。
上記のような単語について、単語をデータしてクレンジングする必要がある。

これらの単語データのクレンジングについて、効率的に処理するルールについて述べる。

PDFファイルサイズ: 1,560 Kバイト

販売タイプ
書籍サイズ
ページ数
詳細を表示する