商品情報にスキップ
1 1

テキストの特徴とHTML構造を利用したWeb文書の読みやすさ評価方法

テキストの特徴とHTML構造を利用したWeb文書の読みやすさ評価方法

通常価格 ¥770 JPY
通常価格 セール価格 ¥770 JPY
セール 売り切れ
税込

カテゴリ: 論文誌(論文単位)

グループ名: 【C】電子・情報・システム部門

発行日: 2012/09/01

タイトル(英語): A Method of Readability Assessment for Web Documents Using Text Features and HTML Structures

著者名: 山崎 高弘(大阪産業大学 工学部 電子情報通信工学科),常盤 欣一朗(大阪産業大学 工学部 電子情報通信工学科)

著者名(英語): Takahiro Yamasaki (Department of Electronics, Information and Communication Engineering, Faculty of Engineering, Osaka Sangyo University), Kin-ichiroh Tokiwa (Department of Electronics, Information and Communication Engineering, Faculty of Engineering, Osaka Sangyo University)

キーワード: 読みやすさ評価,Web文書,文書分類,特徴抽出  Readability Assessment,Web Documents,Document Classification,Feature Extraction

要約(英語): This paper describes a method of readability assessment for web documents. Readability is the ease in which text can be read and understood. We hypothesize that the readability is determined whether a reader can easily grasp text structures. The impression and the complexity of text are significant factors. We extract the features about impression and complexity from a plain text and additional data such as HTML tags.In order to compare effect of extracting features, we are assessing readability rank by machine learning. We conduct 5-fold cross validation for each domain, and calculate the root mean squared error between the actual rank and the estimated rank. The cross validation experiments confirm that the performance of our method is high measured. It shows effectiveness of extracting features about the impression and the complexity for readability assessment.

本誌: 電気学会論文誌C(電子・情報・システム部門誌) Vol.132 No.9 (2012) 特集:有機半導体-材料・デバイス・評価技術

本誌掲載ページ: 1524-1532 p

原稿種別: 論文/日本語

電子版へのリンク: https://www.jstage.jst.go.jp/article/ieejeiss/132/9/132_1524/_article/-char/ja/

販売タイプ
書籍サイズ
ページ数
詳細を表示する