阶跃星辰发布321B参数Step3大模型:推理时代的最佳应用模型

1

在2025年世界人工智能大会(WAIC2025)前夕,阶跃星辰在上海正式发布了其全新一代的基础大模型——Step3。这款备受瞩目的模型以其卓越的智能性和高效的推理能力,旨在为广大企业和开发者提供顶级的应用解决方案,推动人工智能技术的创新发展和广泛应用。

Step3计划于7月31日全面开源,这标志着阶跃星辰将为全球开源社区贡献一款功能强大、极具价值的多模态推理模型,为人工智能领域的开放合作和技术共享注入新的活力。

image.png

为了进一步推动大模型的应用落地,阶跃星辰积极联合多家国内领先的芯片和平台厂商,共同成立了“模芯生态创新联盟”。该联盟致力于通过模型与芯片产业链的深度创新合作,加速大模型在各个行业的广泛应用,构建一个协同发展的人工智能生态系统。与此同时,阶跃星辰还与上海国有资本投资有限公司达成了战略合作,旨在加强资本与生态业务之间的紧密协作,共同推动人工智能技术的创新与发展。

阶跃星辰创始人兼CEO姜大昕先生表示,从Step1到Step2的快速迭代,使得团队在深入思考最适合应用的模型时,更加注重客户的真实需求和实际应用场景。全新一代的Step3模型被精准定位为推理时代的最佳应用模型,它拥有强智能、低成本、可开源和多模态等关键特征,这四个维度相辅相成、缺一不可,共同构成了Step3的核心竞争力。

Step3是阶跃星辰首个全尺寸的原生多模态推理模型,其参数量高达321B,其中激活参数量为38B。它在视觉感知和复杂推理方面表现卓越,能够轻松处理跨领域的知识理解和视觉信息分析。例如,Step3能够准确无误地读取反光菜单上的内容,甚至可以在微信聊天记录中自动计算消费分摊的费用,极大地提升了用户的使用体验和工作效率。在多个权威榜单上,Step3均取得了开源多模态推理模型的SOTA(State of The Art)最佳成绩,充分证明了其在技术上的领先地位。

image.png

为了显著提升模型的推理效率,阶跃星辰在架构设计上进行了大胆创新,使得Step3在不同的硬件平台上均能展现出卓越的推理性能。根据相关测试结果显示,Step3在国产芯片上的推理效率最高可达DeepSeek-R1的300%,这一惊人的数据充分体现了Step3在国产芯片上的强大优化能力。此外,在与NVIDIA Hopper架构芯片的分布式推理中,Step3的吞吐量提升也超过了70%,进一步证明了其在高性能计算方面的巨大潜力。

阶跃星辰构建了一个强大的“1+N”模型矩阵,其中“1”指的是Step3,它是整个模型矩阵的核心和基础;而“N”则代表多个多模态模型,覆盖了语音、视觉理解和图像生成等多个领域,充分满足了不同应用场景的需求。通过与近10家芯片及基础设施厂商的紧密合作,阶跃星辰致力于全面提升大模型的适配性和算力效率,从而为应用的落地提供坚实的基础。

Step3的技术特性详解

Step3作为阶跃星辰最新发布的基础大模型,其技术特性是实现卓越性能和广泛应用的关键。以下将从模型架构、多模态能力、推理效率和生态合作四个方面,对Step3的技术特性进行深入分析。

1. 模型架构

Step3采用了先进的混合专家模型(MoE)架构,这种架构可以在保证模型容量的同时,有效降低计算成本。具体来说,Step3的参数量高达321B,但激活参数量仅为38B,这意味着在进行推理时,只有一部分参数会被激活,从而大大提高了计算效率。MoE架构允许多个专家网络并行工作,每个专家网络负责处理特定类型的输入。这种架构使得模型能够更好地处理多模态数据,并在不同任务之间实现知识共享。

2. 多模态能力

Step3是阶跃星辰首个全尺寸的原生多模态推理模型,具备强大的多模态能力。它可以同时处理文本、图像、语音等多种类型的数据,实现跨模态的知识融合和推理。例如,Step3可以根据图像中的内容生成相应的文本描述,也可以根据文本描述生成相应的图像。这种多模态能力使得Step3在诸如智能客服、智能助手、内容创作等领域具有广泛的应用前景。

具体来说,Step3在视觉感知方面表现出色,可以准确识别图像中的物体、场景和人物。在复杂推理方面,Step3可以进行跨领域的知识理解和视觉信息分析。例如,它可以准确读取反光菜单的内容,甚至在微信聊天记录中自动计算消费分摊的费用。这些功能使得Step3在实际应用中具有很高的实用价值。

3. 推理效率

为了提升模型的推理效率,阶跃星辰在架构设计上进行了创新,使得Step3在不同硬件平台上的推理表现出色。根据测试,Step3在国产芯片上的推理效率最高可达DeepSeek-R1的300%,且在与NVIDIA Hopper架构芯片的分布式推理中,吞吐量提升超过70%。

这些数据表明,Step3在推理效率方面具有显著优势。这主要归功于以下几个方面的优化:

  • 模型压缩:通过模型剪枝、量化等技术,减少模型的参数量和计算复杂度。
  • 硬件适配:针对不同的硬件平台进行优化,充分利用硬件的计算资源。
  • 并行计算:采用分布式推理技术,将计算任务分配到多个设备上并行执行。

4. 生态合作

为了推动大模型的应用落地,阶跃星辰积极联合多家国内领先的芯片和平台厂商,成立了“模芯生态创新联盟”。该联盟的目标是通过模型与芯片产业链的创新合作,加速大模型在各个行业的应用。

此外,阶跃星辰还与上海国有资本投资有限公司达成战略合作,旨在加强资本和生态业务的协作。通过这些合作,阶跃星辰可以更好地整合资源,推动大模型的研发和应用。

阶跃星辰还建立了“1+N”的模型矩阵,其中“1”指的是Step3,而“N”则是多个多模态模型,覆盖语音、视觉理解和图像生成等领域。通过与近10家芯片及基础设施厂商的合作,阶跃星辰致力于提升大模型的适配性和算力效率,从而推动应用的落地。

Step3的应用场景展望

Step3作为一款强大的多模态推理模型,具有广泛的应用前景。以下将从智能客服、智能助手、内容创作和行业应用四个方面,对Step3的应用场景进行展望。

1. 智能客服

在智能客服领域,Step3可以实现更自然、更智能的对话交互。它可以理解用户的意图,回答用户的问题,解决用户的问题。与传统的智能客服相比,Step3可以更好地处理复杂的问题,提供更个性化的服务。

具体来说,Step3可以通过多模态能力,理解用户通过文本、语音、图像等方式提出的问题。例如,用户可以通过拍照的方式向客服提供商品信息,Step3可以识别图像中的商品,并提供相应的服务。此外,Step3还可以根据用户的历史记录和偏好,提供更个性化的推荐和服务。

2. 智能助手

在智能助手领域,Step3可以成为用户的得力助手。它可以帮助用户完成各种任务,例如日程管理、信息查询、文件处理等。与传统的智能助手相比,Step3可以更好地理解用户的需求,提供更智能的服务。

具体来说,Step3可以通过语音识别技术,理解用户的语音指令。例如,用户可以通过语音指令让Step3设置闹钟、查询天气、发送邮件等。此外,Step3还可以通过自然语言处理技术,理解用户的文本指令。例如,用户可以通过文本指令让Step3查找文件、整理文档、生成报告等。

3. 内容创作

在内容创作领域,Step3可以成为内容创作者的强大工具。它可以帮助内容创作者生成各种类型的内容,例如文章、新闻、故事、诗歌等。与传统的内容创作工具相比,Step3可以生成更优质、更个性化的内容。

具体来说,Step3可以通过自然语言生成技术,根据用户提供的关键词、主题和风格,自动生成文章、新闻、故事、诗歌等。此外,Step3还可以通过图像生成技术,根据用户提供的描述,自动生成图像。这些功能可以大大提高内容创作者的创作效率和创作质量。

4. 行业应用

除了以上几个方面,Step3还可以在许多其他行业得到广泛应用。例如,在医疗领域,Step3可以辅助医生进行疾病诊断和治疗方案制定;在教育领域,Step3可以为学生提供个性化的学习辅导;在金融领域,Step3可以辅助金融机构进行风险评估和投资决策。

总而言之,阶跃星辰发布的Step3基础大模型,凭借其卓越的智能性、高效的推理能力以及广泛的应用前景,必将为人工智能领域的发展注入新的动力,并为各行各业带来更多的创新机遇。我们期待Step3在未来的发展中,能够不断突破技术瓶颈,为人类创造更加美好的未来。