阿里AI再突破,新研究成果斬獲國際頂會杰出論文

2022-05-24 19:12:38來源:威易網作者:

 5月24日消息,國際AI頂級會議ACL 2022論文收錄及獲獎信息近日揭曉,阿里巴巴25篇論文被接受。

 524日消息,國際AI頂級會議ACL 2022論文收錄及獲獎信息近日揭曉,阿里巴巴25篇論文被接受,其中達摩院的機器翻譯工作《Learning to generalize to More: Continuous  Semantic Augmentation for Neural Machine Translation》從全球3000多篇投稿論文中脫穎而出,獲得杰出論文獎,阿里成為今年國內唯一以第一作者身份獲得該獎項的中國企業(yè)。

 \

神經機器翻譯是目前的主流AI翻譯技術,需要從大量雙語數(shù)據中學習翻譯能力。然而雙語數(shù)據有限且獲取成本很高,翻譯質量的提升遇到諸多困難,數(shù)據稀缺的場景問題更加凸顯。針對這一問題,該論文突破了傳統(tǒng)離散語義空間數(shù)據增強方法,以有限的訓練樣本為錨點,學習連續(xù)語義分布以建模全局的句子空間,并據此構建神經機器翻譯引擎,有效提升數(shù)據的利用效率,顯著改善模型的泛化能力和魯棒性
 
實驗結果顯示,該技術在多個公開數(shù)據集上均取得了最佳效果。在使用同等雙語數(shù)據的前提下,相比傳統(tǒng)方法,連續(xù)語義增強能夠顯著提升翻譯質量。即便只使用少量的雙語數(shù)據也能充分學習,達到與傳統(tǒng)方法使用全部雙語數(shù)據同等的效果。該技術已應用于AliExpress國際化電商翻譯場景,為全球商家提供精準的多語種翻譯服務,并顯著提升商品轉化效率。
 
 \
 
阿里達摩院機器翻譯工作斬獲ACL 2022杰出論文獎
 
該論文第一作者、達摩院算法專家魏相鵬表示,“我們提出的技術打破了現(xiàn)階段AI翻譯的學習模式,有效提升訓練數(shù)據利用效率,能促使 AI翻譯更好的理解人類語言,進一步提升機器翻譯的質量。我們相信通過持續(xù)不斷的技術突破,能推動全世界各語言的無障礙溝通。我們將面向全球開發(fā)者開源我們的工作。”
 
達摩院機器翻譯技術團隊已在AI頂級會議/期刊發(fā)表機器翻譯相關學術論文50余篇,在國際頂級機器翻譯大賽WMT 2018、WMT2021的多個評測任務取得第一;曾獲得浙江省科技進步二等獎,入選工信部新一代人工智能產業(yè)創(chuàng)新重點任務揭榜優(yōu)勝單位。
 
ACL是自然語言處理與計算語言學領域最高級別的學術會議,目前已擁有60年歷史,本屆大會于522-27日在愛爾蘭都柏林舉辦。
關鍵詞:阿里