中国领先的工业平台

返回贤集网 返回微头条
贤集网技术微头条APP获取

Meta开发出能翻译200种语言的神经机器翻译模型

 智者先行

下载贤集网APP入驻自媒体

《自然》5日发表的一篇论文报道了一个Meta人工智能(AI)模型的底层技术。该模型能翻译200种不同语言,增加了机器翻译的语言数量。

此次,Meta的法国研究团队和“不落下任何语言”(NLLB)团队开发了一种跨语言技术,能让神经机器翻译模型学习如何利用翻译高资源语言的预存能力,实现对低资源语言的翻译。研究团队开发了一个在线多语言翻译工具,名为“NLLB-200”。该工具能容纳200种语言,其低资源语言数量是高资源语言数量的3倍,翻译表现则比当今已有系统高44%。

最新回复
发布回复
回复智者先行:由于团队在许多低资源语言上只能获取1000—2000例样本,为了扩大“NLLB-200”的训练数据量,他们用一个语言识别系统发现了这些特定语言的更多实例。团队还从互联网存档中挖掘双语文本数据,帮助提升其翻译质量。
回复智者先行:200种是怎么收集到的?很多少数民族的语言都只有音,没有文字或者看不懂了。
回复智者先行:利用分布式训练和混合精度训练,显著加快了模型的训练速度,并有效降低了计算资源的消耗。

为您推荐

热门交流