対話テキストにおける間接識別情報の匿名化
対話テキストにおける間接識別情報の匿名化
カテゴリ: 全国大会
論文No: 3-027
グループ名: 【全国大会】令和6年電気学会全国大会論文集
発行日: 2024/03/01
タイトル(英語): Anonymization of indirect personal information in dialog text
著者名: 石川将丈(香川高等専門学校),篠山学(香川高等専門学校),松本和幸(徳島大学)
著者名(英語): Masatake Ishikawa (National Institute of Technology, Kagawa College),Manabu Sasayama (National Institute of Technology, Kagawa College),Kazuyuki Matsumoto (Tokushima University)
キーワード: 個人情報|匿名化|BERT|personal information|anonymization|BERT
要約(日本語): 近年様々な分野で,テキストデータの活用が進められており,個人情報の匿名化に対する需要が高まっている。テキストデータの1つに1対1の対話テキストがあるが,単に個人情報を削除するだけでは情報量の減少が大きい。また,k-匿名化などの既存の匿名化方法は少人数のデータには有効でない。そこで本研究では,対話テキストに対する情報量の減少を抑えた新たな匿名化方法を提案する。対話テキストから個人情報を抽出するモデルの作成のために,データセットの作成と事前学習済みBERTのファインチューニングを行った。結果として,既存の日本語言語処理ライブラリの精度を上回るモデルが作成できた。
本誌掲載ページ: 40-41 p
原稿種別: 日本語
PDFファイルサイズ: 494 Kバイト
受取状況を読み込めませんでした
