在当前大语言模型(LLM)的文本能力逐渐触顶、行业普遍寻求新突破口的背景下,多模态被视为人工智能的下一个重要方向。然而,如何有效融合文本、图像、视频等不同模态的数据,一直是业界面临的难题。10月30日,智源研究院正式发布了"悟界EMU3.5"多模态世界大模型,这一突破性成果标志着人工智能从"语言学习
在当前大语言模型(LLM)的文本能力逐渐触顶、行业普遍寻求新突破口的背景下,多模态被视为人工智能的下一个重要方向。然而,如何有效融合文本、图像、视频等不同模态的数据,一直是业界面临的难题。10月30日,智源研究院正式发布了"悟界EMU3.5"多模态世界大模型,这一突破性成果标志着人工智能从"语言学习
最新文章