メタデータ抽出用パラメータの自動生成による導入容易な業務文書管理活用支援システム
メタデータ抽出用パラメータの自動生成による導入容易な業務文書管理活用支援システム
カテゴリ: 部門大会
論文No: TC15-3
グループ名: 【C】平成22年電気学会電子・情報・システム部門大会講演論文集
発行日: 2010/09/02
タイトル(英語): Business Documents Management and Utilization System with Generation of Parameters for Metadata Extraction
著者名: 松本 俊子(日立ソフトウェアエンジニアリング),大峡 光晴(日立ソフトウェアエンジニアリング),小野山 隆(日立ソフトウェアエンジニアリング),薦田憲久 (大阪大学)
著者名(英語): toshiko matsumoto(Hitachi Software Engineering Co.,Ltd.),mitsuharu oba(Hitachi Software Engineering Co.,Ltd.),takashi onoyama(Hitachi Software Engineering Co.,Ltd.),norihisa komoda(Osaka University)
キーワード: メタデータ抽出|パラメータ生成|業務文書|文書管理|metadata extraction|parameter generation|business documents|document management
要約(日本語): Toward secure preservation and prompt retrieval of flexible-formatted business documents, we propose a metadata-based document management system. It has two features. First, it can automatically extract metadata. Second, it reads sample documents and their manually specified metadata as training data and generates metadata-extraction parameters. The generation algorithm enumerates candidates of information from metadata occurrence in the training data, and then examines the candidates to avoid side effects and to maximize effectiveness. With these two features, introducing the system can be eased, operational cost of registering document can be reduced, and documents can be efficiently retrieved. We also describe two example cases of the application of our system to business documents.
PDFファイルサイズ: 5,458 Kバイト
受取状況を読み込めませんでした
