在2025年7月30日,火山引擎在厦门举办的FORCE Link AI创新巡展上,正式发布了豆包系列的新模型,以及AI云原生服务升级的最新成果。此次发布不仅包括了豆包·图像编辑模型3.0和同声传译模型2.0,还推出了全新升级的豆包大模型1.6系列。同时,火山引擎还开源了扣子的核心能力,并推出了企业自有模型托管方案等一系列工具,旨在为企业和开发者提供更全面的支持,助力他们构建更强大的Agent,并加速AI应用的落地。
火山引擎总裁谭待在活动中亲自发布了这些最新的豆包模型,标志着火山引擎在AI领域的持续投入和创新。
豆包系列新模型的技术突破与应用前景
针对当前AI图像编辑领域存在的诸多痛点,如指令理解不准确、内容修改偏差以及生成效果不佳等问题,火山引擎重磅推出了豆包·图像编辑模型3.0(SeedEdit3.0)。这款模型通过显著强化指令的遵循能力、图像的保持能力以及整体的生成质量,使得用户仅凭自然语言就能够轻松完成各种复杂的图像编辑任务,包括消除图像中的冗余元素、精细调整光影效果、以及替换图像中的特定元素等。不仅如此,该模型还能够实现风格转换、材质变换以及姿势调整等创新性的修图场景,为用户提供更广阔的创作空间。豆包·图像编辑模型3.0在影像创作和广告营销等领域具有广泛的应用前景。企业用户可以通过火山方舟调用其API,而个人用户则可以通过即梦或豆包app进行体验,充分感受其强大的功能。
在跨语言沟通方面,火山引擎最新发布的豆包·同声传译模型2.0(Seed-LiveInterpret2.0)实现了技术上的重大突破。该模型突破了传统“级联模型”的局限,采用了全双工框架,从而将语音延迟从原先的8-10秒大幅降低至2-3秒,真正实现了文本与语音的同步生成。更令人惊艳的是,该模型还支持0样本声音复刻技术,无需提前录制即可实时生成与说话者音色高度一致的外语语音,甚至能够匹配不同的方言口音,从而显著提升了跨语言沟通的沉浸感和真实感。
豆包大模型1.6系列也在本次活动中迎来了全面升级。其中,极速版Doubao-Seed-1.6-flash模型在保持强大的视觉理解能力的同时,还显著强化了代码能力、推理能力以及数学能力,使其能够更好地适配智能巡检、手机助手等大规模商业化场景。该模型的TPOT(首Token输出时间)低至10ms,处于行业领先水平。在成本方面,对于企业最常用的0-32k输入文本长度区间,每百万tokens的输入成本仅为0.15元,输出成本为1.5元。客户的使用案例表明,该模型已成功实现了延迟下降60%、成本降低70%的显著效果。
此外,全模态向量化模型Seed1.6-Embedding首次实现了“文本+图像+视频”混合模态融合检索,为企业构建更强大的多模态知识库提供了有力支持。在权威测评中,该模型包揽了多模态全面任务以及中文文本的最优成绩,充分证明了其卓越的性能。
AI云原生服务的优化与Agent开发的加速
为了更好地助力Agent的端到端开发与落地,火山引擎持续优化其AI云原生全栈服务。在7月26日,AI Agent开发平台扣子的核心能力正式宣布开源,涵盖了一站式可视化开发工具“扣子开发平台(Coze Studio)”和全链路管理工具“扣子罗盘(Coze Loop)”。这两款工具均采用了Apache2.0许可证,用户可以在GitHub上自由下载。开源仅三天,Coze Studio的星标数就突破了万,Coze Loop的星标数也超过了3000,充分显示了其受欢迎程度。火山引擎为扣子提供了全面的支持,企业AI平台HiAgent可以轻松调用其能力,云基础产品也支持一键部署。
针对有模型定制需求的企业,火山引擎依托火山方舟模型单元推出了自有模型托管方案。企业无需再投入大量资源来运维底层的GPU资源以及进行复杂的配置,即可实现自研模型的全托管,并享受弹性的算力。企业可以自主选择部署方式和机型,精准控制时延,且无需为业务低谷期付费,从而大大降低了成本。目前,该方案已开放邀测。
同时,火山方舟还升级了API体系,推出了Responses API。该API具备原生上下文管理能力,支持多轮对话的链式管理以及文本、图像等多模态数据的衔接,结合缓存能力可以降低高达80%的成本。此外,该API还支持单次请求联动多个工具与模型组合响应,从而将智能助手Agent的开发工作从原先的460行代码、1-2天的时间,缩减至60行代码、1小时,大幅提升了开发效率。
此次系列发布进一步完善了火山引擎在AI领域的生态布局,为企业和开发者提供了从基础模型到开发工具的全链条支持,有助于加速AI在各行各业的落地应用。通过不断的技术创新和服务优化,火山引擎正在成为推动AI技术发展和应用的重要力量。
火山引擎此次发布的豆包系列新模型及AI云原生服务升级,无疑为人工智能领域注入了新的活力。这些创新成果不仅解决了AI图像编辑和跨语言沟通等方面的痛点,还通过优化AI云原生服务,极大地加速了Agent的开发和落地。开源的扣子核心能力和企业自有模型托管方案,更是降低了AI技术的使用门槛,让更多的企业和开发者能够参与到AI的创新浪潮中来。Responses API的推出,更是将智能助手Agent的开发效率提升到了一个新的高度,为AI在各行业的应用带来了更多的可能性。火山引擎正以其强大的技术实力和全面的服务体系,推动着人工智能技术的普及和发展,助力各行各业实现智能化转型。
展望未来,随着人工智能技术的不断进步和应用场景的日益丰富,火山引擎有望在AI领域发挥更大的作用,为构建更加智能、高效的社会贡献力量。其在基础模型、开发工具和云原生服务等方面的持续投入和创新,将为企业和开发者提供更强大的支持,共同推动人工智能技术的繁荣发展。同时,我们也期待火山引擎能够继续秉持开放合作的理念,与更多的合作伙伴携手共进,共同开创人工智能的新时代。