学習データが少量の場合の文書分類方法
学習データが少量の場合の文書分類方法
カテゴリ: 全国大会
論文No: 3-044
グループ名: 【全国大会】平成21年電気学会全国大会論文集
発行日: 2009/03/15
タイトル(英語): Document Classification Method with Small Learning Data
著者名: 前田 康成(北見工業大学),吉田 秀樹(北見工業大学),藤原 祥隆(北見工業大学),松嶋 敏泰(早稲田大学)
著者名(英語): Yasunari Maeda(Kitami Institute of Technology),Hideki Yoshida(Kitami Institute of Technology),Yoshitaka Fujiwara(Kitami Institute of Technology),Toshiyasu Matsushima(Waseda University)
キーワード: 文書分類|学習データ|事前分布
要約(日本語): 近年,自然言語処理の文書分類の分野では文書の生起に確率モデルを仮定した検討が行われている.著者らは以前にクラスやキーワードが真のパラメータが未知の多項分布に従って生起する場合の文書分類問題を検討し,統計的決定理論に基づいてベイズ基準のもとで間違ったクラスに分類してしまう確率である誤り率を最小にする文書分類方法を導出した.しかし,以前に導出した方法では学習データとして利用できる既存文書が大量に存在する場合には新規文書の分類精度は高くなるが,既存文書が少量の場合には分類精度は低くなってしまう.そこで,本研究では学習データとして使用できる既存文書が少量しかない場合でも新規文書の分類精度を高くする検討を行う.
原稿種別: 日本語
PDFファイルサイズ: 1,554 Kバイト
受取状況を読み込めませんでした
