智谱AI开源32B GLM模型:速度媲美DeepSeek,AI领域迎来新突破?

5

在人工智能领域,开源的力量正在日益凸显。智谱AI公司最近宣布开源其新一代GLM大语言模型,无疑为这一趋势注入了新的活力。此次开源不仅涵盖了32B和9B两种参数规模的模型,更包括基础模型、推理模型以及代表未来探索方向的沉思模型。所有这些模型均采用了宽松的MIT许可证,为开发者提供了极大的自由度和商业应用的可能性。

智谱AI的这一举措,旨在通过技术普惠加速人工智能的创新。开源意味着开发者可以更轻松地获取和使用先进的大语言模型技术,无需过多顾虑授权问题,从而显著降低了人工智能应用的门槛,并有望加速各行各业的智能化转型。

开源战略的深远意义

智谱AI选择开源GLM模型,体现了其拥抱开放生态、促进技术共享的战略决心。这种开放模式有助于汇聚全球开发者的智慧,共同推动大语言模型技术的进步。同时,开源也有助于提升模型的透明度和可信度,促进更广泛的应用和采纳。

QQ_1744685328694.png

性能跃升:小参数,大能量

本次发布的核心亮点之一是32B参数推理模型GLM-Z1-32B-0414的卓越性能。官方数据显示,该模型在某些任务中的表现可与拥有671B参数的DeepSeek-R1等顶级模型相媲美。更令人印象深刻的是,其推理速度高达200 Tokens/秒,堪称国内最快的商业模型之一。此外,其价格仅为DeepSeek-R1的1/30,性价比优势显著。

GLM-Z1-32B-0414的卓越性能,得益于智谱AI在模型架构、训练数据和优化算法等方面的持续投入和创新。该模型采用了先进的注意力机制和Transformer结构,能够更好地捕捉文本中的语义信息。同时,智谱AI还采用了高质量的训练数据和高效的训练方法,进一步提升了模型的性能。

基础模型的坚实底座

GLM-4-32B-0414基础模型拥有320亿参数,其性能同样可以媲美国内外主流的大参数模型。该模型使用15T高质量数据进行预训练,并融入了大量的基于推理的合成数据,为后续的强化学习奠定了坚实的基础。在后训练阶段,该模型还采用了人类偏好对齐、拒绝采样和强化学习等技术,显著提升了其在指令跟随、工程代码生成和Agent任务的功能调用等方面的关键能力。

在实际应用中,GLM-4-32B-0414在工程代码、工件生成、功能调用、搜索问答和报告撰写等方面表现出色,部分基准指标甚至接近或超过GPT-4o和DeepSeek-V3-0324 (671B)等更大的模型。值得一提的是,Z.ai平台的对话模式包含预览功能,支持可视化生成的HTML和SVG,方便用户评估和迭代优化。

推理模型的深度优化

推理模型GLM-Z1-32B-0414构建于GLM-4-32B-0414之上,采用了冷启动和扩展的强化学习策略,并针对数学、代码和逻辑等关键任务进行了深度优化训练。因此,其数学能力和复杂问题解决能力得到了显著提升。在AIME24/25、LiveCodeBench和GPQA等基准测试中的评估结果表明,GLM-Z1-32B-0414具有强大的数学推理能力,能够处理更广泛的复杂任务。

QQ_1744685346654.png

9B推理模型的轻量级选择

令人惊喜的是,智谱AI还推出了9B参数推理模型GLM-Z1-9B-0414。尽管参数量较小,但由于采用了相同的技术和训练方法,该模型在数学推理和通用任务方面仍然表现出色,跻身同等规模开源模型的前列。这为需要在资源受限场景中进行轻量级部署的用户提供了强大的选择。

GLM-Z1-9B-0414的推出,体现了智谱AI对不同应用场景的深刻理解和对技术普惠的承诺。该模型可以广泛应用于移动设备、嵌入式系统等资源受限的场景,为这些场景带来强大的AI能力。

沉思模型:引领未来的探索

本次发布的另一个亮点是沉思模型GLM-Z1-Rumination-32B-0414。智谱AI将其定位为探索AGI未来形态的下一步。与典型的推理模型不同,沉思模型通过更深入、多步骤的思考来解决高度开放和复杂的问题。

其关键创新在于能够整合搜索工具来处理深度思考过程中的复杂任务,并利用各种基于规则的奖励机制来指导和扩展端到端强化学习训练。该模型支持“自主提出问题—搜索信息—构建分析—完成任务”的完整研究闭环,显著提升了其在研究写作和复杂检索任务中的能力。用户现在可以通过Z.ai平台体验其强大的深度研究能力。

沉思模型的推出,标志着智谱AI在AGI探索方面迈出了重要一步。该模型不仅具备强大的问题解决能力,还能够自主学习和进化,为未来的AGI发展提供了新的思路和方向。

新平台与API服务:便捷易用

为了方便用户体验和利用这些新模型,智谱AI推出了新域名Z.ai。该平台集成了32B基础、推理和沉思GLM模型,作为智谱最新模型的交互体验门户。

QQ_1744685369487.png

除了免费体验平台,智谱MaaS开放平台(bigmodel.cn)也同步推出了基础模型和推理模型的API服务,为企业和开发者提供支持。推出的基础模型提供GLM-4-Air-250414 (免费) 和GLM-4-Flash-250414。推理模型提供GLM-Z1-AirX (高速版,200 tokens/秒)、GLM-Z1-Air (经济版,价格仅为DeepSeek-R1的1/30) 和GLM-Z1-Flash (免费版),以满足不同场景的需求。

智谱AI的战略布局

智谱AI此次开源GLM模型,并推出新平台和API服务,是其在人工智能领域的重要战略布局。通过开源,智谱AI可以吸引更多的开发者参与到GLM模型的开发和应用中,共同推动技术的进步。同时,新平台和API服务也为用户提供了便捷的访问和使用GLM模型的途径,进一步扩大了其影响力。

人工智能的未来:开放与合作

智谱AI的开源行动,再次证明了开放与合作是推动人工智能发展的关键。通过共享技术和资源,我们可以加速人工智能的创新,并将其应用到更广泛的领域,为人类创造更美好的未来。智谱AI的这一举措,无疑将为中国乃至全球的人工智能发展注入新的动力。