特邀报告
特邀报告1:杨宝嵩

Title: Qwen多语言,从基础模型到翻译应用之路
Abstract: 多语言与跨语言能力不仅是大语言模型的核心竞争力,更是推动人工智能迈向通用人工智能(AGI)与实现“AI平权”的关键路径。在本次报告中,我们将以Qwen系列大模型为实践载体,深入剖析多语言大模型研究和优化中的若干前沿与关键议题:包括跨语言知识迁移的机制、可解释性、多语言“长思考”能力的构建、以及跨模态语义对齐等挑战性方向。同时,我们将聚焦翻译这一核心应用场景,探讨如何通过持续预训练和强化学习提升翻译质量,以及音视频多模态翻译的扩展等前沿课题。
Bio: 杨宝嵩,博士,阿里巴巴通义实验室科学家。作为多语言方向算法负责人研发了Qwen、Qwen-Omni等具有国际领先水平的基础大语言模型,同时带领团队构建了面向实际场景的Qwen-MT、Qwen-LiveTrans等关键应用,推动多语言AI技术在工业界的大规模落地与产品化。其主要研究方向聚焦于多语言AI技术,涵盖多语言大模型、跨语言知识迁移、多语言多模态理解与生成、机器翻译、低资源语言建模等。在NeurIPS、ICLR、ACL等国际顶会顶刊上发表论文60余篇,引用超5000次,并多次担任审稿人、技术委员会成员和领域主席。
特邀报告2:王历伟

Title: 构建多模态视频语言理解的动态评测框架
Abstract: 视频是一种丰富的多模态数据形式,涵盖了视觉、语言等多种信息维度。视频理解因此需要跨模态信息的综合理解。本报告将介绍香港中文大学语言与视觉实验室(LaVi Lab)在视频语言理解方面的最新研究进展:我们探索了一种动态的视频语言理解评测框架:从视频输入到问答对的高效自动构建,实现了对视频内容理解的自动评测;与此同时,在语言理解方面,我们基于CLEVA中文大语言模型评测平台进行了拓展,提出了CLEVA-Cantonese,一个面向粤语理解的评测基准。
Bio: 王历伟教授现任香港中文大学计算机科学与工程学系助理教授及博士生导师。王历伟教授博士毕业于美国伊利诺伊大学香槟分校(UIUC)计算机系。他带领的LaVi Lab长期专注于人工智能多模态方向的研究。他多次担任人工智能领域国际顶级会议(如 CVPR、ACL、ICML、NeurIPS 等)的区域主席,同时现任人工智能顶级期刊 IJCV(CCF-A 类核心期刊)编委。在自然语言处理和计算机视觉领域的国际顶级会议发表论文五十余篇,谷歌学术引用总数已超过一万一千次。