機械学習を用いた文体分類モデルの構築
機械学習を用いた文体分類モデルの構築
カテゴリ: 研究会(論文単位)
論文No: IIS24065
グループ名: 【D】産業応用部門 次世代産業システム研究会
発行日: 2024/09/09
タイトル(英語): Construction of a Stylistic Classification Model
著者名: 嘉手川 修衣(沖縄工業高等専門学校),山田 親稔(沖縄工業高等専門学校)
著者名(英語): Syui Kadakawa(National Institute of Technology, Okinawa College),Chikatoshi Yamada(National Institute of Technology, Okinawa College)
キーワード: 主成分分析|著者分類|文体分類|機械学習|テキストマイニング|品詞構成率|Principal component analysis|Author Classification|Stylistic Classification|Machine Learning|Text mining|Component Ratio
要約(日本語): 近年では,ディープラーニング技術の発展により,BERTやGPTなどトランスフォーマーベースのモデルが登場し,テキスト分類の精度が向上している.しかし,本研究では文体分析の輪郭を明確にするため,まずは古典的な主成分分析(PCA)という手法を用いることにする。このアプローチにより,文体の特徴を可視化し,より理解しやすくすることを目的としている.
要約(英語): In this study, we analyzed texts by dividing three novels from different authors into three parts each. Additionally, we analyzed five texts with a summary style, five with a descriptive style, and five with a loquacious style. Principal Component Analysis (PCA) was performed using the part-of-speech composition ratio as a feature. As a result, while it was possible to classify the texts of the same work, we were unable to classify different works with similar writing styles based on their styles alone.
本誌: 2024年9月12日-2024年9月13日次世代産業システム研究会-2
本誌掲載ページ: 21-23 p
原稿種別: 日本語
PDFファイルサイズ: 1,329 Kバイト
受取状況を読み込めませんでした
