商品情報にスキップ
1 1

PDF文書からの手順記述抽出に関する一検討

PDF文書からの手順記述抽出に関する一検討

通常価格 ¥440 JPY
通常価格 セール価格 ¥440 JPY
セール 売り切れ
税込

カテゴリ: 部門大会

論文No: MC9-4

グループ名: 【C】平成19年電気学会電子・情報・システム部門大会講演論文集

発行日: 2007/09/04

タイトル(英語): Investigation of a System for Extracting Procedures from PDF Documents

著者名: 谷本 真吾(大阪府立大学),黄瀬浩一 (大阪府立大学)

著者名(英語): Shingo Tanimoto(Osaka Prefecture University),Koichi Kise(Osaka Prefecture University)

キーワード: 手順記述|How型|情報抽出|PDF文書

要約(日本語): 本稿では,How型質問に対する回答をWebから自動で抽出するシステムの実現を目的として,手続き知識を手順の適用対象を表す語群とその具体的手順を表す箇条書き,および関連する図表の組として定義し,これを抽出対象としてWeb上の電子文書から抽出するアルゴリズムを提案する.抽出元となる電子文書としてPDF文書を採用し,言語的特徴と行間・行頭の空隙やフォント情報などの基礎的なレイアウト特徴の2つを手がかりとして,ドメインを限定しない手続き知識の抽出について検討する.そして,提案手法を用いた試作システムについて述べ,提案手法の妥当性について検証する.

PDFファイルサイズ: 3,572 Kバイト

販売タイプ
書籍サイズ
ページ数
詳細を表示する