重大突破!百度推出AI“同传高手”:能预测低延时可即时互译

作者: 分类: 奇闻 发布时间: 2018-10-25 07:57

1

百度已经开发了一个能够同时新得利国际官方网址翻译两种语言的人工智能系统。这个人工智能同传系统被称为STACL(同声翻译与预测及可控延迟,Simultaneous Translation and Anticipation and Controllable Latency),该公司表示,它代表着自然语言处理领域的“重大突破”。

1

与大多数人工智能翻译系统不同,STACL能够在发言者讲话几秒钟内就开始翻译,并在句子结束后几秒钟内完成翻译。这与人类口译相反,译者要等到说话人停下来才开始翻译。

百度表示,它通过模仿人类的翻译进行建模该系统来应对这一挑战。与同传译员不同的是,我们的模型预测的不是演讲者的源语言,而是直接预测翻译的目标语言。STACL直接预测翻译中的目标语单词,并将翻译和预期融合到一个单一的模型中——“等待-k”——在说话人讲话K个单词后开始翻译,以便上下文进行预测。(该系统被训练使用源句子的可用前缀来决定翻译中的下一个单词。)

以下是百度对AI同传系统的解释:

“在以下该例子中:

源句子:布什总统在莫斯科与俄罗斯总统普京会晤。

在这个句子中K=2个中文字,我们的系统准确地预测下一个翻译单词必须是“meet”,因为布什很可能在莫斯科“遇见”某人(例如,普京),英文中的动词比汉语动词出现早得多。”

1

STACL的另一个关键优势是延迟的灵活性。根据两种语言的相近程度,可以将其设置得更低或更高——例如,法语和西班牙语互译的延迟较低,然而,对于差异很大(如汉语和英语)以及语序不同的语言(如英语和德语),则需要更长的延迟来应对语序差异。

百度写到:“翻译质量很容易受到短延迟的影响,但是与传统的整句(即非同步)翻译相比,我们系统的翻译质量没有收到很大影响。对于达到短延迟的要求,我们将继续提高翻译质量。”

那么STACL和人类翻译相比怎么样?据百度称,它比传统的全句翻译少3.4个BLEU(BLEU是“BLEU”的缩写,是评价机器翻译文本的标准度量,做法是一句机器翻译的话与其相对应的几个参考翻译作比较,算出一个综合分数。这个分数越高说明机器翻译得越好)。在中翻英同声传译中,人工智能系统比中文语言落后约3秒,其翻译质量比全句(非同声传译)低3.4个BLEU。

百度写道:“即使有了最新的进展,我们也充分意识到同步机器翻译系统的诸多局限性。”STACL的推出并不是为了取代人类口译员--在未来的很多年里,人类口译员的专业服务将继续受到依赖,而是为了让同声翻译更容易理解。”

百度发布AI同传的几个月前,百度刚刚宣布其对话人工智能助手DuerOS的安装基础从6个月前的5000万部增加到1亿部。

“我们过去是一家搜索公司,但在人工智能时代,我们希望成为一家人工智能平台公司,”百度的高管Kun Jing在去年接受VentureBeat采访时表示。

STACL推进了公司早期在语音识别方面的工作,更广泛的来说是推进了在人工智能领域的进展。在2016年和2017年,百度分别推出了SwiftScribe——一个基于深度语音平台的网络应用程序和一个基于口述记录的Android键盘。最近,在7月,它发布了一种定制设计的AI芯片——昆仑AI——用于边缘和云计算,以及百度大脑 3.0,一个包含110个AI服务的套件,从自然语言处理到计算机视觉。

百度并不是唯一一家在人工智能翻译和转录领域掀起波澜的公司。今年3月,微软展示了一款在将新闻从中文翻译成英文方面与人类水平相当的系统。Facebook已经开始利用无人监管的机器学习将内容从一种语言翻译成另一种语言。___大学的研究人员开发了一种离线语音识别模型,准确率高达97%。

上个月,科大讯飞被曝同传造假事件,与翻译同传圈怼上。9月20日,一位名为为Bell Wang的用户在知乎发文爆料,批评科大讯飞的AI同传造假,指出科大讯飞在现场和直播展示的AI同传其实用的是人类同传翻译结果。把人类译员的翻译直接转成机器人的声音,事先没有经过沟通,这合适吗?

不过,百度AI同传实际效果如何,该技术到底好与不好,究竟是否称得上重大突破,到时候我们一看便知。因为,最快百度将于下周的年度技术大会上,对该技术进行公开展示。