人工智能领域再次迎来突破性进展。9月30日,通义千问正式发布基于大语言模型的多语言实时音视频翻译系统Qwen3-LiveTranslate-Flash,这一创新产品将同传延迟降至最低3秒,大幅刷新行业纪录,为全球跨语言交流带来革命性体验。
多语言全覆盖,支持18种语言与多种方言
Qwen3-LiveTranslate-Flash系统在语言支持方面表现出色,全面覆盖18种语言的离线和实时翻译功能。这一广泛的语言支持不仅包括中文、英语、法语、德语、俄语、西班牙语等全球主流语言,还特别支持普通话、粤语、北京话、吴语等多种中国方言,为不同地区、不同文化背景的用户提供全方位的语言解决方案。
这种广泛的语言覆盖能力使得该系统在国际会议、商务谈判、学术交流、跨国旅游等多种场景中都能发挥重要作用,真正实现"无障碍沟通"的愿景。
视觉上下文增强技术,破解翻译难题
该系统的核心创新点在于其独特的视觉上下文增强技术。传统的语音翻译系统主要依赖音频信息进行语言处理,而Qwen3-LiveTranslate-Flash则突破了这一局限,不仅能"听懂