ユーザ例示の項目名と類似表現の単語間距離を用いた異種構造Webサイトからの情報抽出方式
ユーザ例示の項目名と類似表現の単語間距離を用いた異種構造Webサイトからの情報抽出方式
カテゴリ: 研究会(論文単位)
論文No: IS11064
グループ名: 【C】電子・情報・システム部門 情報システム研究会
発行日: 2011/09/15
タイトル(英語): An Information Extraction Method from Different Structural Web Sites by Word Distances Between a User Instantiated Label and Similar Entity
著者名: 中島 大輔(大阪大学),三井 祐希(大阪大学),鮫島 正樹(大阪大学),秋吉 政徳(大阪大学)
著者名(英語): Nakajima Daisuke(Osaka University),Mitsui Yuki(Osaka University),Samejima Masaki(Osaka University),Akiyoshi Masanori(Osaka University)
キーワード: Webサイト|情報抽出|ユーザ例示|単語間距離|リンク選択|異種構造|Web Sites|Information Extraction|User Instantiated Label|Word Distances|Link Selection|Different Structure
要約(日本語): 商品やサービスの比較のため、ユーザは複数の企業が提供するWebサイトを閲覧し、比較のための情報を収集する。しかし、Web サイトごとに比較のための情報を記述する構造が異なり、複数Web サイトから情報を抽出する作業には多大な労力が必要となる。そこで本稿では、ユーザ例示の項目名と類似表現の単語間距離を用いた異種構造Webサイトからの情報抽出方式を提案する。
原稿種別: 日本語
PDFファイルサイズ: 1,098 Kバイト
受取状況を読み込めませんでした
