Google神经机器翻译系统

Google神经机器翻译系统(英语:Google Neural Machine Translation,简写:GNMT),是Google开发的神经机器翻译(NMT)系统,于2016年11月推出,它使用人工神经网络来提高Google翻译的流畅度和准确性。[1][2][3]Google神经机器翻译系统通过应用基于实例的英语Example-based machine translation(EBMT)机器翻译方法来改进翻译质量,系统会从数百万个示例中学习。[2]翻译系统提出的系统学习架构首先通过Google翻译支持的一百多种语言进行了测试。[2]随着大型端到端框架的发展,系统会随着时间的推移学习,做出更好,更自然的翻译。[1]GNMT能够一次翻译整句句子,而不是逐字翻译。[2][4]

历史

谷歌大脑项目于2011年由Google研究员杰夫·迪恩格雷戈·科拉多斯坦福大学计算机科学教授吴恩达Google X秘密实验室成立。[5][6][7]吴恩达的工作令Google和斯坦福大学获取了突破。[8]

2016年9月,Google研究团队宣布开发Google神经机器翻译系统,同年11月,Google翻译停止使用其自2007年10月以来一直使用的专有统计机器翻译(SMT)技术,开始使用神经机器翻译(NMT)。[1][9][10][11][12][13]

Google翻译的NMT系统使用了一种能够深度学习的大型人造神经网络。[1][2][3]GNMT使用通过使用数百万更广泛的来源来推断出最相关的翻译,提高翻译的质量。然后将结果重新排列并组成基于人类语言的语法翻译。GNMT提出的系统学习架构通过Google翻译支持的语言进行了测试。GNMT没有创建自己的普遍语言,而是针对许多语言之间发现的共同点,因此心理学家语言学家计算机科学家对此更感兴趣。[14]2016年,Google翻译的其中八种语言开始尝试使用此系统,包括英语法语德语西班牙语葡萄牙语中文日语韩语土耳其语[15]2017年3月,增加了俄语印地语越南语[16]同月,因谷歌翻译社群的帮助下,添加了对希伯来语阿拉伯语的支持。[17]2017年4月底,增加了9种印度语言的支持,包括印度语孟加拉语马拉地语古吉拉特语旁遮普语泰米尔语泰卢固语马拉雅拉姆语康纳达语[18]

零点(Zero-shot)翻译

GNMT系统改进了以前的Google翻译系统,GNMT系统可以处理“零点翻译”,即直接将一种语言翻译成另一种语言(例如中文日文)。以前Google翻译会先将源语言英语Source language翻译成英文,然后将英文翻译成目标语言英语target language,而不是直接从一种语言翻译成另一种语言。[4]

参考文献

  1. ^ 1.0 1.1 1.2 1.3 Barak Turovsky, Found in translation: More accurate, fluent sentences in Google Translate, Google Blog, 2016-11-15 [2017-01-11], (原始内容存档于2017-04-07) 
  2. ^ 2.0 2.1 2.2 2.3 2.4 Mike Schuster, Melvin Johnson, and Nikhil Thorat, Zero-Shot Translation with Google’s Multilingual Neural Machine Translation System, Google Research Blog, 2016-11-22 [2017-01-11], (原始内容存档于2017-07-10) 
  3. ^ 3.0 3.1 Gil Fewster, The mind-blowing AI announcement from Google that you probably missed, freeCodeCamp, 2017-01-05 [2017-01-11], (原始内容存档于2017-05-31) 
  4. ^ 4.0 4.1 Boitet, Christian; Blanchon, Hervé; Seligman, Mark; Bellynck, Valérie. MT on and for the Web (PDF). 2010 [2016-12-01]. (原始内容 (PDF)存档于2017-03-29). 
  5. ^ Jeff Dean and Andrew Ng. Using large-scale brain simulations for machine learning and A.I.. 2012-06-26 [2015-01-26]. (原始内容存档于2015-02-06). 
  6. ^ Google's Large Scale Deep Neural Networks Project. [2015-10-25]. (原始内容存档于2019-02-16). 
  7. ^ Markoff, John. How Many Computers to Identify a Cat? 16,000. New York Times. 2012-06-25 [2014-02-11]. (原始内容存档于2017-05-09). 
  8. ^ Robert D. Hof. A Chinese Internet Giant Starts to Dream: Baidu is a fixture of online life in China, but it wants to become a global power. Can one of the world’s leading artificial intelligence researchers help it challenge Silicon Valley’s biggest companies?. Technology Review. 2014-08-14 [2017-01-11]. (原始内容存档于2020-01-08). 
  9. ^ Katyanna Quach, Google's neural network learns to translate languages it hasn't been trained on: First time machine translation has used true transfer learning, 2016-11-17 [2017-01-11], (原始内容存档于2017-05-06) 
  10. ^ Lewis-Kraus, Gideon. The Great A.I. Awakening. The New York Times. 2016-12-14 [2017-01-11]. (原始内容存档于2017-05-05). 
  11. ^ Le, Quoc. A Neural Network for Machine Translation, at Production Scale. Google Research Blog. Google. 2016-09-27 [2016-12-01]. (原始内容存档于2017-05-11). 
  12. ^ Google Switches to its Own Translation System页面存档备份,存于互联网档案馆), October 22, 2007
  13. ^ Barry Schwartz. Google Translate Drops SYSTRAN for Home-Brewed Translation. Search Engine Land. 2007-10-23 [2017-07-06]. (原始内容存档于2017-05-21). 
  14. ^ Chris McDonald, Commenting on Gil Fewster's January 5th article in the Atlantic, 2017-01-07 [2017-01-11], (原始内容存档于2017-06-22) 
  15. ^ Turovsky, Barak. Found in translation: More accurate, fluent sentences in Google Translate. The Keyword Google Blog. Google. 2016-11-15 [2016-12-01]. (原始内容存档于2017-04-07). 
  16. ^ Turovsky, Barak. Higher quality neural translations for a bunch more languages. Google. [2017-03-06]. (原始内容存档于2017-03-07). 
  17. ^ Novet, Jordan. Google now provides AI-powered translations for Arabic and Hebrew. 2017-03-30 [2017-07-06]. (原始内容存档于2020-01-01). 
  18. ^ Turovsky, Barak. Making the internet more inclusive in India. 2017-04-25 [2017-07-06]. (原始内容存档于2020-11-11). 

外部链接