RDBの仕様詳細理解に向けたカラム単位特徴分析技術の提案
RDBの仕様詳細理解に向けたカラム単位特徴分析技術の提案
カテゴリ: 部門大会
論文No: TC3-4
グループ名: 【C】平成25年電気学会電子・情報・システム部門大会講演論文集
発行日: 2013/09/04
タイトル(英語): A Proposal of a Method to Analyze RDB by Columns to Understand Details of the Specification
著者名: 橋本 康範(日立製作所),大島敬志 (日立製作所),団野博文 (日立製作所),三部良太 (日立製作所),山口 潔(日立製作所)
著者名(英語): Yasunori Hashimoto(Hitachi,Ltd),Keishi Oshima(Hitachi,Ltd),Hirofumi Danno(Hitachi,Ltd),Ryota Mibe(Hitachi,Ltd),Kiyoshi Yamaguchi(Hitachi,Ltd)
キーワード: データベース|database
要約(日本語): 情報システムの開発においては,その中で扱われるデータについて理解することが重要である.データの理解のためにはRDBのスキーマ情報も有益であるが,実用上,必ずしも十分ではない.例えば,あるカラムが保持するデータはデータ型によって限定できるが,同一のデータ型でも全く異なる内容のデータ(例として、電話番号と社会保障番号)を持つ可能性がある.こうした詳細な特徴を把握するためには,RDBのデータそのものを分析する必要がある.そこで本報告では,RDBのカラム毎の詳細な特徴を取得するための,カラム単位データ分析機能の実現を課題とした.これに対し,データの類似性計算とパターンマッチングをベースとした分析方式を設計した.また,プロトタイプの開発をおこない,社内の過去事例を題材とした評価実験を実施した.結果として,データ種数が少ないカラムなどの例外を除き,83%の精度実績と,95%までの精度向上見込みを得た.
PDFファイルサイズ: 4,950 Kバイト
受取状況を読み込めませんでした
