AI前沿:豆包3.0发布,Qwen3开源,Imagen 4升级,AI模型迎来新纪元

1

在人工智能领域,每天都有新的技术突破和产品发布。今天,我们为您带来最新的AI行业动态,深入剖析这些技术革新对开发者和整个行业的影响。

火山引擎发布豆包3.0:加速Agent开发落地

火山引擎在厦门站活动中发布了豆包系列新模型及AI云原生服务升级成果,包括图像编辑模型3.0、同声传译模型2.0以及大模型1.6系列。同时推出扣子核心能力开源和企业自有模型托管方案,旨在助力开发者构建Agent并落地AI应用。这一系列更新,无疑将极大地推动AI在各个领域的应用。

image.png

豆包·图像编辑模型3.0,通过提升自然语言指令处理能力,为影像创作与广告营销领域带来了新的可能性。用户可以通过简单的自然语言指令,实现复杂的图像编辑操作,极大地提高了工作效率。豆包·同声传译模型2.0,实现了低延迟语音同步生成,并支持方言口音匹配,这对于跨国会议和国际交流来说,无疑是一个巨大的福音。大模型1.6系列则在代码、推理与数学能力上进行了优化,降低了延迟与成本,使得AI应用的开发和部署更加高效。

通义千问开源Qwen3-30B-A3B-Instruct-2507非思考模式模型

通义千问开源了Qwen3-30B-A3B-Instruct-2507新版本,该版本在非思考模式下表现出色,性能媲美顶级闭源模型,并在多个领域实现了显著提升。同时,它还支持多语言和长文本处理,为开发者和研究人员提供了一个便利的开源平台。这一举措无疑将加速AI技术的普及和发展。

image.png

Qwen3-30B-A3B-Instruct-2507在非思考模式下仅激活3B参数,但其性能却可以媲美Gemini2.5-Flash(non-thinking)、GPT-4o等顶尖闭源模型,这充分展示了其强大的技术实力。该模型在指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等多个方面都有显著提升,通用能力得到了极大的增强。此外,其长文本理解能力达到了256K,多语言长尾知识覆盖更广,使其非常适合全球化应用场景。

OpenAI 推出全新学习助手 ChatGPT Study

OpenAI发布了全新的ChatGPT Study学习模式,旨在为学生和教育工作者提供更加个性化和互动的学习体验。该功能集成了交互式提示、支架式回应、个性化教育和知识点检查,适用于多种学科,并对所有用户开放。这一举措标志着OpenAI在教育技术上的进一步推进。

image.png

ChatGPT Study提供个性化和互动的学习体验,集成了交互式提示、支架式回应、个性化教育和知识点检查等四种主要功能,可以根据学生的学习进度和需求,提供定制化的学习内容和辅导。这一功能对所有免费版、Plus、Pro 以及 Team 用户开放,让更多的用户可以体验到AI带来的学习便利。

我国发布HYPIR图像复原大模型 老照片1.7秒变8K高清图

HYPIR图像复原大模型的发布,展示了中国在人工智能领域的创新能力,并为文化传承、影视修复及科研医疗等多个领域带来了革命性改变。该模型能够在1.7秒内将老照片修复至8K超高清画质,并且在保真文字方面表现出色,能高保真还原文字内容,标志着图像复原技术进入了一个全新的时代。

image.png

HYPIR图像复原大模型的发布,不仅是对图像处理技术的一次重大突破,也是对文化传承的一次有力支持。通过该模型,我们可以将那些模糊不清的老照片,快速恢复成清晰、生动的影像,让历史得以更好地保存和传承。同时,该模型在影视修复和科研医疗等领域也有着广泛的应用前景。

谷歌 NotebookLM 推出视频概览功能,提升学习体验

谷歌推出了NotebookLM的视频概览功能,通过将复杂信息转化为带旁白的幻灯片,为用户提供更直观的学习体验。该功能能够从用户上传的资料中提取信息,并自动生成带旁白的幻灯片,从而帮助用户更好地理解和掌握视频内容。未来,该功能还将支持多语言,并不断丰富和扩展表现形式。

这一新功能的上线,无疑将为学习者带来更高效、更便捷的学习体验。通过视频概览功能,用户可以快速了解视频的核心内容,节省大量的时间和精力。同时,该功能的多语言支持,也将使其在全球范围内得到广泛应用。

谷歌悄然升级Imagen 4!AI图像生成王者归来?

谷歌对其文本转图像生成模型Imagen4进行了重大升级,升级后的Imagen4Ultra在权威的Artificial Analysis图像竞技场排行榜中跃升至第三位,与OpenAI的GPT-4o和Seedream3.0并肩,成为全球顶尖的图像生成模型之一。其在图像质量、处理复杂提示词、价格优势及生成速度等方面表现突出。

Google has quietly upgraded Imagen 4! Imagen 4 Ult.jpg

Imagen4Ultra在图像细节、真实感和风格一致性方面表现出色,性能得到了显著提升。与此同时,Imagen4标准版和Ultra版的价格远低于GPT-4o,性价比更高。更重要的是,Imagen4Ultra生成一张图像的平均时间仅为9.5秒,效率领先于多数竞品,这使得用户可以在更短的时间内获得高质量的图像。

昆仑万维开源多模态统一预训练模型 Skywork UniPic

昆仑万维推出了Skywork UniPic多模态统一预训练模型,融合了图像理解、文本到图像生成和图像编辑能力,基于大规模数据端到端预训练,展现了优异的通用性和可迁移性。该模型在性能上表现突出,尤其在消费级显卡上即可流畅运行,显著降低了技术应用门槛。

image.png

Skywork UniPic通过MAR编码器与SigLIP2主干网络实现跨任务深度协同,支持图像理解、生成及风格转绘等复杂操作。其1.5B参数规模接近大型统一模型效能,使得用户可以在消费级显卡上流畅运行,极大地降低了使用门槛。这一模型的开源,无疑将推动多模态AI技术的发展。

理想i8发布,首搭智能司机大模型,售价 32.18 万元起!

理想汽车推出全新六座纯电SUV——理想i8,提供三个版本,售价分别为32.18万元、34.98万元和36.98万元。该车在技术配置上诚意满满,全系标配双电机四驱系统、自研5C电池以及激光雷达,并全球首搭VLA司机大模型,提升了车辆的安全性和智能化水平。

理想i8配备双电机四驱系统,最大功率高达400kW,扭矩达660Nm,动力强劲。自研5C电池提供两种容量,续航里程分别为670公里和720公里,满足用户的长途出行需求。更重要的是,理想i8全球首搭VLA司机大模型,支持自然语言交互,提升智能操作体验,使得驾驶更加安全、便捷。

谷歌在在英国推出 AI 搜索模式,提升复杂问题解答体验

谷歌在英国推出全新的AI搜索模式,能够帮助用户提出更复杂的问题并获得精准的AI驱动回复。该模式基于Gemini2.5模型,利用查询扩展技术深入挖掘网络内容,并支持多种交互方式,如文字、语音或图像提问。

image.png

这一AI搜索模式基于谷歌最新Gemini2.5模型,支持复杂多部分问题处理。其查询扩展技术可以将用户问题分解为多个子主题,深入挖掘网络内容,从而提供更全面、更精准的答案。同时,该模式还支持语音和图像提问,提升了交互体验和便利性,使得用户可以更加方便地获取所需信息。

OWL团队开源一款多智能体Manus类工具Eigent

Eigent是CAMEL-AI团队开发的多智能体协作工具,基于OWL框架构建,旨在提升复杂任务处理效率。其核心在于任务拆解与并行执行,支持多种大语言模型和多模态数据处理,展现了开源AI在性能与可访问性上的优势。

image.png

Eigent通过多智能体协作实现高效任务处理,显著提升了复杂任务的执行效率。该工具支持多种大语言模型和多模态数据处理,生成内容更加专业且全面。其开源特性允许开发者自由检查代码、贡献功能或定制化使用,推动社区发展,为AI技术的创新和应用提供了更大的空间。

2025年用户增速最快亿级APP榜单发布,DeepSeek位居第一

文章分析了2025年6月活跃用户规模超过1亿且同比增长率最高的前20款应用程序,其中DeepSeek在AIGC领域表现突出,豆包和红果免费短剧也展现出强劲的增长势头。

image.png

DeepSeek以1.63亿月活跃用户位居AIGC行业第一,展现了其在人工智能内容生成领域的强大实力。豆包实现410.69%的同比增长,月活跃用户达1.41亿,显示了其在市场上的快速扩张。红果免费短剧吸引2.12亿用户,迎合了碎片化娱乐需求,成为了用户增长的新引擎。

以上就是今天的AI日报,希望能为您带来有价值的信息。在AI技术日新月异的今天,让我们一起关注行业动态,把握技术趋势,共同迎接人工智能带来的美好未来。