世界知识产权组织开发先进的专利文件翻译工具
06-11月-2016
日内瓦—世界知识产权组织(WIPO)在一次新闻发布会中宣布,现在已经开发出一种具有突破性的基于“人工智能”技术的新专利文件翻译工具,能够为世界各地的创新者提供最高质量的服务还可用于获得关于这项新技术的信息。
目前,世界知识产权组织翻译融合先进的神经机器翻译技术,目的是将技术专业性强的专利文件翻译成另一种语言,使其在风格和语法上更接近于该语言的常见用法,远远超过通过先前技术设计的其他翻译工具。
世界知识产权组织已初步“训练”这项新技术将用汉语,日语和韩语写成的专利文件译成英语。以上述语言提交的专利申请达20141份,约占全球专利申请总数的55%。用户早已可以在公共测试平台使用这种汉英翻译工具。
“专利制度的目的之一是使人人能够使用技术。语言却成了实现这个全民性目标的障碍。世界知识产权组织翻译取得的这项突破,意味着:创新者很快就会更容易地访问搜索大量甚至是更多的专利文件,并且从这些记录中获得创作灵感或技术诀窍,“世界知识产权组织总干事弗朗西斯小寨表示,“作为全球化趋势的组成部分之一,越来越多的专利申请是以东亚语言的形式提交的,尤其是汉语,世界知识产权组织翻译将有助于确保用这些语言创造的先进知识能够迅速并且广泛地得以传播。”
高度准确
汉英翻译的高度准确性是神经机器翻译工具”训练”的结果,该工具比较了6000万个源自世界知识产权组织的PATENTSCOPE数据库中提供的汉语专利文件。这些文件及其翻译由中华人民共和国在向美国专利和商标事务所提出申请时一同存档。
世界知识产权组织计划将神经机器翻译扩展到法语专利申请和随后其他的各种语言专利申请。PATENTSCOPE数据库融合其他互联网上免费的翻译引擎,并继续使用现有的基于数据库技术的语言翻译,效果良好。世界知识产权组织与其他国际组织共享其翻译软件,包括联合国会议管理服务、食品和农业组织,国际电信联盟、国际海事组织、世界贸易组织和全球抗艾滋病、结核病和疟疾基金。“在联合国,我们对世界知识产权组织在神经机器翻译取得的新发展很感兴趣,我们在这个创新领域的合作伙伴,”联合国文献部主任塞西莉亚.艾利佳尔德表示,“我们的翻译系统与世界知识产权组织翻译的数据版本一脉相承,译者会发现它十分有帮助。我们期待升级在接下来的几个月中将它升级到神经版本。
新兴技术
神经机器翻译是一项基于庞大神经网络模型新兴的技术,能够从以前翻译的句子“学习”。神经机器翻译 (相比以前的“基于短语”的统计方法)的明确性在于它产生更自然的词序,特别是在改进所谓的差别很大的语言,比如日语和英语或汉语和英语。
在最近的一次测试中,世界知识产权组织翻译基于神经机器远距离语言对的翻译服务远远优于以往基于数据建立的模型提供的翻译服务,以及其他非世界知识产权组织翻译服务。因为世界知识产权组织的这个工具是经过训练,专门用于专利文件。相反地,它不是给出更多不同的数组的文本,而是提供高质量的译文。