オブジェクトストレージを活用したRAG参照データの効率的な配置方法の検討
オブジェクトストレージを活用したRAG参照データの効率的な配置方法の検討
カテゴリ: 研究会(論文単位)
論文No: IS25018
グループ名: 【C】電子・情報・システム部門 情報システム研究会
発行日: 2025/02/22
タイトル(英語): Investigation of an Efficient Placement Method for RAG Reference Data Using Object Storage
著者名: 山根 直(東北大学),中村 隆喜(東北大学),菅沼 拓夫(東北大学)
著者名(英語): Naoshi Yamane(Tohoku University),Takaki Nakamura(Tohoku University),Takuo Suganuma(Tohoku University)
キーワード: オブジェクトストレージ|分散ストレージ|検索拡張生成|機械学習|Object Storage|Distributed Storage|Retrieval Augmented Generation|Machine Learning
要約(日本語): 近年,生成AIの検索拡張生成 (RAG) に注目が集まる中,参照データへのストレージアクセスが性能の主要なボトルネックとなっている.本研究では,オブジェクトストレージを活用し,アクセス頻度に応じて参照データを効率的に分散配置する手法を提案する.この手法により,参照データへのアクセスが各ノードに分散され,ストレージ負荷を軽減するとともに,RAGシステムの応答性能が向上する見通しを得た.
要約(英語): In the retrieval augmented generation (RAG), storage access to reference data is a performance bottleneck. In this study, we propose a method of efficiently distibuting reference data based on access frequency. We got the prospect of improving the response performance of the RAG system by distributing access to each node.
本誌: 2025年2月25日-2025年2月26日情報システム研究会
本誌掲載ページ: 103-108 p
原稿種別: 日本語
PDFファイルサイズ: 1,266 Kバイト
受取状況を読み込めませんでした
