昆仑万维天工4.0重磅发布:推理能力与实时语音双突破,开启AI新体验 - Skywork o1/4o

36

昆仑万维天工4.0重磅发布:推理能力与实时语音双突破,开启AI新体验

2025年初,昆仑万维正式发布了其最新一代大模型——天工4.0,其中包含两个引人注目的模型:Skywork o1和Skywork 4o。这两个模型分别在推理能力和实时语音交互方面取得了显著突破,标志着昆仑万维在人工智能领域迈出了坚实的一步。此次发布不仅展示了昆仑万维强大的技术实力,也预示着大模型竞争即将进入新的阶段。

大模型发展新趋势:从Scaling Law到推理能力

OpenAI首席科学家Ilya Sutskever

前OpenAI首席科学家Ilya Sutskever曾指出,Scaling Law正在放缓,未来的研究方向将更加注重推理能力的提升。这一观点引发了业界对大模型发展路线的深刻思考。昆仑万维董事长兼CEO方汉也观察到,训练的Scaling Law有所放缓,但基于慢思考的推理Scaling Law正在涌现。

与此同时,多模态融合也成为大模型发展的重要趋势。随着大模型应用范围的扩大,单一模态的局限性日益凸显,只有实现多模态融合,用户才能获得更丰富的体验。在这一背景下,昆仑万维选择两条腿走路,同时提升模型的推理能力和多模态交互能力,体现了其在AI领域的战略眼光。

天工4.0:推理能力与实时语音的双重突破

昆仑万维此次发布的Skywork o1和Skywork 4o,分别代表了推理能力和实时语音交互的重大突破:

  • Skywork o1:推理能力大幅提升 Skywork o1的核心优势在于其强大的推理能力,尤其在数学、代码、中文逻辑推理等问题中表现突出。与以往的“快思考”模型不同,Skywork o1在面对复杂问题时,会进行逐步推导,展现出更强的“慢思考”能力,更适合解决现实世界的复杂问题。
  • Skywork 4o:实时语音交互体验 Skywork 4o具备拟人的语音对话能力,其特点是低延迟、可打断、音色逼真、情感丰富。基于Skywork 4o,昆仑万维打造了实时语音对话AI助手Skyo,为用户提供更为自然、流畅的交互体验。

Skywork o1:强大的推理能力

Skywork o1在各项基准测试中表现出色

Skywork o1在各项基准测试中表现出色:

  • 数学能力: 在AMC-23、AIME-24和OlympiadBench等数学基准测试中,Skywork o1都取得了优异成绩,展现了其强大的数学推理能力。
  • 代码能力: 在HumanEval和MBPP测试中,Skywork o1也取得了高分,证明其在代码生成和理解方面的能力。
  • 逻辑推理: 通过机器之心进行的测试,Skywork o1在海龟汤、过河问题、真话者与说谎者、类比推理等逻辑推理问题中均表现出色,展现出其强大的逻辑推理能力。

Skywork o1的推理能力得益于昆仑万维自研的三阶段训练方案:

Skywork o1的推理能力

  1. 推理反思能力训练: 通过自研的多智能体体系,构造高质量的分步思考、反思和验证数据,并进行预训练和监督微调。
  2. 推理能力强化学习: 研发适配分步推理强化的Skywork o1 Process Reward Model (PRM),有效捕捉复杂推理任务中间步骤的影响,加强模型推理和思考能力。
  3. 推理规划: 基于天工自研的Q*线上推理算法,配合模型在线思考,寻找最佳推理路径。

Skywork 4o:逼真的实时语音交互体验

Skywork 4o的亮点在于其拟人化的实时语音交互能力。通过百万小时的语音数据进行预训练,Skywork 4o学习到了真实世界各种场景、不同风格的说话表达方式,在回复时的语速、语调、情感方面更加自然。

基于Skywork 4o的Skyo,采用端到端建模方式,具备极低的延迟和实时打断能力,实现了自然、流畅的互动体验。Skyo的语音对话框架主要包括以下步骤:

  1. 语音输入与语音编码: 将用户的语音信号转换为语义表示。
  2. 适配转换: 将语音的语义表示调整为大语言模型(LLM)能够理解的格式。
  3. 大语言模型(LLM): 通过多模态的处理能力理解语音意图,并生成相应的解决方案或回答。
  4. 语音输出: 通过扩散模型将语音token还原为真实语音,实现从语音输入到语音输出的端到端交互。

昆仑万维:全面布局,迎接AI新时代

昆仑万维在AI领域的技术积累和全面布局,使其在竞争激烈的AI市场中脱颖而出。除了天工4.0大模型,昆仑万维还推出了天工AI搜索、AI音乐创作平台Mureka、AI短剧平台SkyReels、AI社交产品Linky等应用,展现了其在AI领域的全面实力。

昆仑万维创始人周亚辉表示,昆仑万维的AI战略具有差异化,找到了自己“小而大美”的空间。昆仑万维的长期目标是实现通用人工智能(AGI),并认为AGI时代的标志是机器人真正进入人类社会。为了实现这一目标,昆仑万维正在积极解决空间智能大模型的构建、运动控制技术的改进、机器人的保值增值能源能耗等难题。

结语

昆仑万维天工4.0的发布,标志着国内大模型技术取得了新的突破。Skywork o1和Skywork 4o分别在推理能力和实时语音交互方面的卓越表现,为用户带来了全新的AI体验。昆仑万维在AI领域的持续投入和全面布局,使其有望在未来的AI竞争中占据领先地位。我们期待昆仑万维在AI领域继续取得更大的突破,为人类带来更多惊喜。