下载贤集网APP入驻自媒体
遇到看不懂的英文句子,我们可以随手找个翻译软件翻译或者直接在搜索引擎里翻译,而如果你碰到了一句看不懂的文言文,有没有能翻译的软件呢? 还真有,这就是最新的人工智能,而且是微软亚洲研究院推出的。 可能我们很多人都不知道。平常我们在线中英文翻译,多数往往看到用到的是Chinese中文简体中文繁体,英文这些,其下选项则是阿尔巴尼亚语,阿拉伯语诸如此类。很多朋友以为往下一大串都是外国语。不过在最低部还藏着一个Chinese,那就是Chinese(Literary)看名字不就是中文吗,有啥区别呢?这个,就是文言文。 目前人工智能训练数据,往往需要大得吓人的数据(还是一点点处理好的高质量数据)和贵得吓人的硬件显卡。而这个先天特性,又恰恰是文言文的不足。毕竟不管是文言文本身的体量,还是我们对文言文的了解,相对AI的“欲求不满”而言都显得很少。 而且还有时代发展导致的语言新问题,比如近几十年我们国内高速发展带来的新名词,计算机技术发展诞生的新概念,都对现代汉语/文言文的翻译带来了困难(更遑论微博论坛里一些非正规的文体)。所以研究人员做了很多工作。 最终完成了这个现代汉语/文言文的互译,也就是简体中文/古汉语的互相翻译。机智客试了几个,嗯哼,有点意思吖。即便如此强大完善了,基于当前的翻译系统,微软依然还将在丰富数据集、改进模型训练方法上不断精进,使方法变得更加鲁棒、通用,未来或许不只是在文言文翻译中能够使用,还可以扩展到更多应用场景中。