Web文書における「ますらを」と「たおやめ」の識別の試み
Web文書における「ますらを」と「たおやめ」の識別の試み
カテゴリ: 研究会(論文単位)
論文No: IS15052
グループ名: 【C】電子・情報・システム部門 情報システム研究会
発行日: 2015/11/24
タイトル(英語): Discrimination of "MASURAWO" and "TAOYAME" in Web Documents
著者名: 相場 亮(芝浦工業大学),廣川 佐千男(九州大学)
著者名(英語): Akira Aiba(Shibaura Institute of Technology),Sachio Hirokawa(Kyushu University)
キーワード: ますらを|たおやめ|Webページ|SVM|属性選択|特徴語|MASURAWO|TAOYAME|Web pages|SVM|Feature Selection|Characteristics Words
要約(日本語): 万葉集や古今集の特徴である「ますらを」や「たおやめ」という日本的観点が、現代のWeb文書にどのように現れているかを分析した。具体的には、「ますらを」あるいは「たおやめ」を含むWeb文書群について SVM (Support Vectore Machine)と属性撰択を適用し、それらを特徴付ける単語集合を求めた。
要約(英語): "MASURAWO" and "TAOYAME" are typical Japanese concepts used to describe classic literatures, e.g, Mannyo-shu and Kokin-shu. The present paper applied SVM and feature selection to characterize those concepts.
原稿種別: 日本語
PDFファイルサイズ: 1,177 Kバイト
受取状況を読み込めませんでした
