人工智能领域再次迎来重大突破,Google正式发布了其旗舰AI模型Gemini 3的升级版本,同时推出了专为AI代理设计的集成开发环境Antigravity。这两项创新不仅展示了Google在AI技术上的领先地位,也为人工智能向通用智能(AGI)的发展迈出了坚实一步。
Gemini 3:迈向AGI的关键一步
Google表示,Gemini 3的发布是朝着人工通用 intelligence(AGI)迈进的又一重要里程碑。作为Google旗舰AI模型的最新版本,Gemini 3在模拟推理能力方面有了显著扩展,对文本、图像和视频的理解也得到全面提升。目前,这一模型已经在LMArena排行榜上以1,501的ELO分数位居榜首,比前代Gemini 2.5 Pro高出50分。

事实准确性的重大突破
事实准确性一直是生成式AI模型面临的共同挑战,但Google声称Gemini 3在这一问题上取得了显著进展。在包含1,000个问题的SimpleQA Verified测试中,Gemini 3创下了72.1%的记录。虽然这意味着最先进的语言模型在回答一般知识问题时仍有近30%的错误率,但Google认为这已经代表了实质性进步。
在更具挑战性的Humanity's Last Exam测试中,该考试检验博士级别的知识和推理能力,Gemini 3在不使用工具的情况下取得了37.5%的分数,再次刷新了记录。
数学与编程能力的全面提升
数学和编程是Gemini 3的重点发展方向。该模型在MathArena Apex测试中达到了23.4%的新纪录,在WebDev Arena测试中获得了1487 ELO的分数。在测试模型生成代码能力的SWE-bench Verified测试中,Gemini 3取得了令人印象深刻的76.2%成绩。
更自然、更实用的交互体验
Google表示,Gemini 3已经减少了过度奉承(sycophancy)这一常见问题,这是所有过于礼貌的语言模型普遍存在的现象。据报告,Gemini 3 Pro的输出更加简洁,减少了用户想听到的内容,增加了用户实际需要的信息。
Gemini 3 Pro还能生成明显更丰富的输出。Google声称Gemini扩展的推理能力使其能够更有效地保持任务焦点,代表用户采取行动。例如,Gemini 3可以对邮件进行分类和操作,创建待办事项列表、摘要、推荐回复以及触发建议操作的便捷按钮。这与当前仅创建基于文本的待办事项列表的Gemini模型形成鲜明对比。
创新的生成式界面
Gemini 3引入了Google所称的"生成式界面",包括两种实验性输出模式:视觉布局和动态视图。视觉布局是一种杂志风格的界面,在可滚动用户界面中包含大量图像。动态视图则利用Gemini的编码能力创建自定义界面,例如探索文森特·梵高生活和工作的网页应用程序。
Google还计划推出Gemini 3的"深度思考"模式,但目前尚未完全成熟。Google表示该模式正在小范围内测试,未来将有重大突破。深度思考模式在不使用工具的情况下,在Humanity's Last Exam中获得了41%的分数,这是一个令人印象深刻的成绩。
Antigravity:AI优先的编程革命
Google通过Gemini模型提供了多种生成和修改代码的方式,而Gemini 3的发布增加了一种全新方式:Google Antigravity。这是Google新的代理开发平台,本质上是一个围绕AI代理设计的集成开发环境(IDE),目前已提供预览版本。
智能代理驱动的开发体验
通过Antigravity,Google承诺开发者可以通过让智能代理完成繁琐工作来提高效率。Google建议将Antigravity视为创建和监控多个开发代理的"任务控制中心"。Antigravity中的AI可以在编辑器、终端和浏览器之间自主操作,创建和修改项目,但所有操作都会以"Artifacts"的形式传达给用户。这些子任务设计得易于验证,使用户能够全面了解代理的进展。

多模型支持与灵活集成
Gemini将是Antigravity体验的核心,但并非唯一选择。Antigravity还支持Claude Sonnet 4.5和GPT-OSS代理,为开发者提供更多选择。
当然,开发者仍然可以通过Gemini API进行编码任务。随着Gemini 3,Google添加了一个客户端bash工具,允许AI在工作流程中生成shell命令。该模型可以访问文件系统并自动化操作,而服务器端bash工具将帮助生成多种语言的代码。此功能目前已处于早期访问阶段。
面向非程序员的AI编程
AI Studio旨在成为使用Gemini 3构建项目的更快方式。Google表示,Gemini 3 Pro强大的指令遵循能力使其成为迄今为止最佳的"氛围编程"模型,允许非程序员创建更复杂的项目。
实验性发布与未来展望
Google最终将推出一整套Gemini 3模型家族,但目前仅有一个版本可用。Gemini 3 Pro已开始在Gemini应用、AI Studio、Vertex AI和API中以实验形式推出。如果您想在Google的Antigravity IDE中试用新模型,目前也可在Windows、Mac和Linux平台上进行测试。
搜索体验的AI增强
Gemini 3也将第一天就在Google搜索体验中推出。用户可以在AI模式下启用Gemini 3 Pro,Google表示这将提供有关查询的更有用信息。Gemini应用中的生成式界面功能也将在此处可用,使Gemini能够在适当时创建工具和模拟来回答用户问题。Google表示,在其用户测试中,这些生成式界面强烈受到偏好。此功能目前已推出,但仅限AI Pro和Ultra订阅用户。
由于Pro模型是预览版中唯一的Gemini 3变体,AI概览不会立即升级。这一功能将来会推出,但目前概览只会对特别困难的搜索查询调用Gemini 3 Pro——基本上是Google认为用户最初就应该使用AI模式处理的问题类型。
未来发展路径
Google尚未发布更多Gemini 3模型或将Pro变体推广到正式发布的时间表。然而,考虑到实验性版本的广泛推出,这一过程可能不会太久。
行业影响与意义
Gemini 3和Antigravity的发布不仅代表了Google在AI技术上的领先地位,也对整个行业产生了深远影响。Gemini 3在多项基准测试中的卓越表现,特别是在事实准确性和复杂推理方面的进步,为AI模型的发展设定了新标准。而Antigravity作为专为AI代理设计的开发环境,则预示着软件开发工作流程的根本性变革。
这两项创新共同展示了AI从被动响应向主动代理、从单一功能向多模态理解、从辅助工具向协作伙伴的进化方向。随着Deep Think等功能的不断完善,我们有理由相信,AI系统将在不久的将来在更广泛的领域展现接近甚至超越人类专家的能力。
Google的这些突破不仅推动了技术边界,也为用户和开发者提供了更强大、更直观的工具,加速了人工智能在实际应用中的普及和深化。在这个AI快速发展的时代,Gemini 3和Antigravity无疑将成为引领行业前进的重要力量。









