由模式识别国家重点实验室和高创中心共同开发的CASIA汉英口语自动翻译系统在今年国际口语翻译系统评测中再次取得了人工评测第一名的优异成绩,并在首次参加英汉翻译系统评测中取得了人工评测第二的好成绩。
国际口语翻译系统评测活动由国际语音翻译先进研究联盟(C-STAR)组织,每年举办一次,所有参评系统在相同的时间段和相同的测试集上运行,并采用相同的评判标准和指标对系统运行结果进行打分和排名。之后,各参评单位提交系统研究报告和技术论文,通过召开学术研讨会(International Workshop on Spoken Language Translation, IWSLT)的方式,大家相互交流,取长补短,以达到彼此促进、共同进步的目的。因此,一年一度的IWSLT系统评测是对该领域过去一年内技术进展状况的一次检阅,是公平、公开的技术竞争,具有很高的权威性。
今年的评测活动对汉英、英汉、阿拉伯语到英语、汉语到西班牙语、汉语-英语-西班牙语的口语翻译系统进行了评测,并首次同时对文本翻译结果、语音识别翻译结果以及自发口语翻译结果进行对比,与往年相比,今年的评测任务具有更大的挑战性。
此次测评活动吸引了众多国际著名的研究机构和大学参加,其中包括美国CMU、MIT、德国RWTH(Aachen University)、意大利ITC、东芝和日本NICT-ATR、NTT等14家单位。在今年的评测任务中,我们共参加了三个评测任务,即文本语音的汉英自动翻译、自发语音的汉英自动翻译和英汉自动翻译,所谓“文本语音的汉英自动翻译”是指人对着文本朗读出来经语音识别后再进行翻译的输出结果,而“自发语音的自动翻译”是指没有任何文本作为参考,人自发说出的句子经语音识别后再进行翻译的输出结果。我们研究的汉英自动翻译系统在文本语音和自发语音两种情况下,均取得了人工评测第一名的优异成绩,CASIA英汉翻译系统首次参加了自发语音英汉翻译评测,取得了人工评测第二名的好成绩。这是继2007年CASIA口语翻译系统在IWSLT评测中获得人工评测第一名之后的又一佳绩,标志着实验室的口语自动翻译系统有较好的稳定性,并在近几年来始终处于国际先进水平。 |