《電子技術應用》
您所在的位置:首頁 > 人工智能 > 設計應用 > 融合圖文預訓練的漢越多模態神經機器翻譯
融合圖文預訓練的漢越多模態神經機器翻譯
電子技術應用
韋浩翔1,2,高盛祥1,2,余正濤1,2,王曉聰1,2
1.昆明理工大學 信息工程與自動化學院;2.云南省人工智能重點實驗室
摘要: 由于漢語和越南語之間存在顯著的語法差異及語料稀缺,漢越神經機器翻譯任務面臨名詞翻譯不準確的挑戰。提出了一種新穎的多模態神經機器翻譯方法,該方法融合了文本預訓練模型和視覺語言聯合預訓練模型。通過文本預訓練模型,能夠捕獲深層的語言結構和語義;而視覺語言聯合訓練模型則提供了與文本相關聯的視覺上下文,這有助于模型更準確地理解和翻譯名詞。兩種模型通過一個簡潔高效的映射網絡結合,并通過Gumbel門控模塊動態地整合多模態信息,以優化翻譯輸出。在漢越及越漢翻譯任務中,該方法相比傳統Transformer模型分別提升了7.13和4.27的BLEU值。
中圖分類號:TP391 文獻標志碼:A DOI: 10.16157/j.issn.0258-7998.245391
中文引用格式: 韋浩翔,高盛祥,余正濤,等. 融合圖文預訓練的漢越多模態神經機器翻譯[J]. 電子技術應用,2024,50(12):48-54.
英文引用格式: Wei Haoxiang,Gao Shengxiang,Yu Zhengtao,et al. Chinese-Vietnamese multimodal neural machine translation with integrated image-text pre-training[J]. Application of Electronic Technique,2024,50(12):48-54.
Chinese-Vietnamese multimodal neural machine translation with integrated image-text pre-training
Wei Haoxiang1,2,Gao Shengxiang1,2,Yu Zhengtao1,2,Wang Xiaocong1,2
1.Faculty of Information Engineering and Automation, Kunming University of Science and Technology;2.Yunnan Key Laboratory of Artificial Intelligence
Abstract: Due to significant grammatical differences and a scarcity of linguistic resources between Chinese and Vietnamese, the task of Chinese-Vietnamese neural machine translation faces challenges in the accurate translation of nouns. This paper proposes a novel multimodal neural machine translation method that integrates a text-based pre-trained model with a visual-linguistic joint pre-training model. The text-based model captures deep linguistic structures and semantics, while the visual-linguistic joint training model provides visual context related to the text, which helps the model understand and translate nouns more accurately. The two models are combined through a streamlined and efficient mapping network and dynamically integrate multimodal information via a Gumbel gating module to optimize translation outputs. In both Chinese-Vietnamese and Vietnamese-Chinese translation tasks, this method has achieved improvements of 7.13 and 4.27 BLEU points, respectively, compared to the traditional Transformer model.
Key words : Chinese-Vietnamese neural machine translation;vision-language joint pre-training;multimodal;attention

引言

機器翻譯是利用計算機程序將一種自然語言的文本自動轉換成另一種自然語言。隨著中國的“一帶一路”倡議的不斷推進,中越兩國在經濟和文化領域的交流與合作日益增強,高效且準確的翻譯服務變得尤為關鍵。尤其是神經機器翻譯技術的應用,極大提升了翻譯的速度和質量,有效地促進了兩國之間的信息交流與理解,為雙邊關系的深化提供了堅實的語言支持。

由于漢語-越南語語言對屬于低資源語言對,語料資源稀缺,且漢語和越南語語法差異巨大,名詞翻譯錯誤一直是漢越神經機器翻譯的一個難點,這個問題的存在導致了漢越神經機器翻譯模型的翻譯不準確。

為了解決漢越神經機器翻譯中名詞翻譯不準確和在少量語料下翻譯模型性能不佳的問題,本文提出融合圖文預訓練的漢越多模態神經機器翻譯方法。通過Gumbel門控機制,將視覺-文本聯合預訓練模型M-CLIP和多語言翻譯預訓練模型mBART進行有效結合。借助視覺信息,解決名詞翻譯錯誤問題;引入mBART預訓練模型,提升稀缺語料下的翻譯性能;通過Gumbel門控機制,融合多模態信息,排除無關視覺信息對翻譯模型的干擾。


本文詳細內容請下載:

http://www.rjjo.cn/resource/share/2000006247


作者信息:

韋浩翔1,2,高盛祥1,2,余正濤1,2,王曉聰1,2

(1.昆明理工大學 信息工程與自動化學院,云南 昆明 650500;

2.云南省人工智能重點實驗室,云南 昆明 650500)


Magazine.Subscription.jpg

此內容為AET網站原創,未經授權禁止轉載。
主站蜘蛛池模板: 日本乱人伦片中文字幕三区 | 无毛片| 欧美精品久久一区二区三区 | 国产伦精品一区二区三区免费 | 日本a级毛片视频播放 | 99精品视频免费在线观看 | 国产美女拍拍拍在线观看 | 成人区精品一区二区不卡亚洲 | 亚洲精品一区专区 | 免费一级特黄特色黄大任片 | 日本特黄a级高清免费酷网 日本特黄特色 | 久久99亚洲精品久久久久 | 成人国产在线视频在线观看 | 国产亚洲精品一区久久 | 日韩视频免费一区二区三区 | 鸥美性生交xxxxx久久久 | 夜色毛片永久免费 | 亚洲一区在线观看视频 | 天天爱天天做天天爽天天躁 | 男人一进一出桶女人视频 | 亚洲成人国产精品 | 亚洲网址在线 | 视频二区精品中文字幕 | 91精品91久久久久久 | 欧美成人影院 在线播放 | 日本a一级片 | 亚洲黄色性视频 | 清纯唯美综合网 | 国产初高中生粉嫩无套第一次 | 久久思思爱 | 色色视频免费网 | 国产精品久久久久影院色 | 亚洲欧美一区在线 | 欧美一级做一a做片性视频 欧美一级做一级爱a做片性 | 一区在线免费 | 成人久久18免费网站游戏 | 精品一区二区三区视频在线观看 | 精品国产无限资源免费观看 | 成人合集大片bd高清在线观看 | 国产精品黄页网站在线播放免费 | 亚洲精品久久久中文字 |