讲习班

中国中文信息学会《前沿技术讲习班》第二十五期(CIPS ATT25)将在CCMT 2021举行。

何中军

题目:机器同声传译

何中军 @10x

个人简介: 何中军,百度人工智能技术委员会主席,CCF高级会员。从事机器翻译研究与开发近二十年,研发了全球首个互联网神经网络翻译系统及语义单元驱动的机器同传系统。曾获国家科技进步二等奖、中国电子学会科技进步一等奖、中国专利银奖等多项奖励。

摘要: 同声传译是指在不打断讲话者的条件下,将讲话内容实时地翻译给听众的一种翻译方式,广泛应用于国际会议、商务会谈、新闻发布会等场景。利用机器进行自动同传,具有巨大的应用需求和重要的科学价值。机器同传涉及语音处理、机器翻译等多项技术,近年来成为人工智能领域的前沿方向。随着技术持续进步,机器同传系统得到广泛应用。本报告首先介绍机器同传面临的挑战,然后介绍主流模型(级联模型和端到端模型)和当前进展,接下来介绍开放数据集和评价方法,最后介绍产品形式和应用。

李良友

题目:端到端语音翻译研究进展

李良友 @10x

个人简介: 李良友,博士毕业于都柏林城市大学,现为华为诺亚方舟实验室机器翻译方向的研究员和团队负责人,主要研究课题包括句法翻译、篇章翻译、低资源翻译、语音翻译等,在相关领域期刊和会议上发表论文十余篇,曾担任ACL、EMNLP等国际顶级会议程序委员会委员。

摘要: 传统语音翻译采用级联方式,首先利用ASR识别出输入语音对应的文本,然后使用机器翻译模型将文本翻译到另一种语言。级联方式存在错误传递和高延迟等缺点。因此,端到端语音翻译在学术界和工业界都取得了很多关注和进展。但是,端到端语音翻译也存在数据稀缺等困难。本报告首先对语音翻译背景进行简要介绍,然后重点对端到端语音翻译近年来的研究进展进行总结。