近代文語体から現代語口語体へのニューラル機械翻訳における事前学習の有効性
近代文語体から現代語口語体へのニューラル機械翻訳における事前学習の有効性
カテゴリ: 研究会(論文単位)
論文No: IIS21016
グループ名: 【D】産業応用部門 次世代産業システム研究会
発行日: 2021/02/27
タイトル(英語): Effectiveness of pre-learning for neural machine translation from Early-Modern Japanese literary style to modern colloquial Japanese
著者名: 竹内 康仁(大阪工業大学),小林 裕之(大阪工業大学)
著者名(英語): Yasuhito Takeuchi(Osaka Institute of Technology),Hiroyuki Kobayashi(Osaka Institute of Technology)
キーワード: 機械翻訳|自然言語処理|文学|ニューラルネットワーク|事前学習|Transformer|Machine translation|Natural language processing|Literature|Neural network|Pre-training|Transformer
要約(日本語): 近代文語体は容易に読むことは難しい。また。近代文語体が現代語訳されている文章はかなり少なく、大規模言語対を作成することは困難である。先行研究では、多言語同時翻訳を応用し、公文書データと森鴎外の文章を同時に学習する手法が提案されている。本論文では、近代文語体から現代口語体のニューラル機械翻訳における、旧字旧仮名、新字新仮名対およびWikipedia japaneseにおける事前学習の有効性を示す。
要約(英語): Early-Modern Japanese literary style is difficult to read easily. In addition, there are quite a few sentences in which Early-Modern Japanese literary styles are translated into modern colloquial Japanese, and it is difficult to create large-scale language pairs. Previous research has proposed a method of simultaneously learning official document data and Ogai Mori's sentences by applying multilingual simultaneous translation. In this paper, we show the effectiveness of pre-learning in old character old kana, new character new kana pair and Wikipedia Japanese in neural machine translation from Early-Modern Japanese literary to modern colloquial Japanese.
本誌掲載ページ: 15-18 p
原稿種別: 日本語
PDFファイルサイズ: 569 Kバイト
受取状況を読み込めませんでした

