字节跳动获得计算语言学顶级会议 ACL 最高奖项
北京时间 8 月 5 日,国际顶级学术会议 ACL 2021 正式颁发 “最佳论文”奖项,字节跳动 AI Lab 的机器翻译技术论文在 3350 篇论文投稿中脱颖而出,当选今年度 “最佳论文”。这是 ACL 成立 59 年以来,华人科学家团队第二次赢得最高奖项,此前由中科院计算所主导的研究项目曾被评为 ACL 2019“最佳长论文”。
ACL 大会由国际计算语言学协会主办,是自然语言处理与计算语言学领域最高级别的学术会议。自然语言处理被誉为 “人工智能皇冠上的明珠”,在机器翻译、搜索、信息流、输入法等领域有着广泛的应用。
近年来 ACL 大会接收的投稿量持续上升,华人团队在该领域研究取得了举世瞩目的成绩,过去数年间曾获得 “最佳长论文”、“最佳学生论文”和 “杰出论文”奖项。今年除了字节跳动赢得最高荣誉,大会还评出了六篇 “杰出论文”,香港中文大学与腾讯 AI Lab 的合作论文成功入选。
图:ACL 2021 公布 “最佳论文”评选结果
字节跳动的获奖论文提出一种新的词表学习方案 VOLT。词表是所有自然语言处理任务都会使用的基础组件,其作用就像人类查字典的索引。研究人员创新地把经济学和数学的知识运用到词表中:首先用 “边际收益”定义了词表质量的评价指标,然后以 “最优运输”的数学方法解决最优词表的生成问题,从而在多种翻译任务上取得出色的效果。VOLT 研究项目现已向全球开发者开源。
ACL 官方评审认为,“字节跳动的 VOLT 方案对机器翻译中一个重要问题提出了有效且新颖的解决方案,能显著减少词表的学习和搜索时间,相信其不仅会在研究界产生重要影响,在工业应用方面也有着巨大潜力”。
据悉,最佳论文研究成果将在字节跳动的火山翻译业务中逐步落地,为飞书、今日头条等产品和火山引擎的企业级客户提供机器翻译支持。2021 年以来,火山翻译实现多项重要技术突破,研发出支持 150 个语种互译的大规模翻译模型 mRASP2,并对外开源了当前业界最快的推理和训练引擎 LightSeq2.0,以及端到端语音翻译工具包 NeurST,获得开源社区的广泛好评。
在此前由 ACL 举办的机器翻译大赛 WMT2021 上,火山翻译以独创的 “并行翻译”系统参赛,夺得德语到英语方向比赛自动评估第一名。“并行翻译”在国际赛事中首次亮相,就击败了从左向右逐词翻译的传统技术,打破后者在机器翻译领域的绝对统治地位,这项技术的论文也得到 ACL 2021 大会收录。
免责声明:安家啦家居网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。