AI日报：夸克发布深度搜索，OpenAI启动星际之门计划

在人工智能领域，每天都有新的技术突破和产品发布。今天的AI日报就带你快速浏览一下最新的行业动态，让我们一起看看AI领域又有哪些新进展吧。

夸克发布“深度搜索”新品：AI先思考后检索

夸克搜索最近推出了“深度搜索”功能，这是一个利用AI技术提升搜索体验的创新尝试。传统的搜索方式往往是用户输入关键词，搜索引擎直接返回相关结果。而夸克的“深度搜索”则不同，它会先通过阿里自研的推理大模型对用户的问题进行深度分析，理解用户的真实意图，然后再进行检索。这种“先思考后检索”的模式，可以更准确地找到用户需要的答案，尤其是在面对复杂问题时，优势更加明显。

阿里巴巴、AI、新夸克

“深度搜索”的核心能力包括：

多层次分析：通过多层次分析用户问题，理解真实意图，提升搜索精准度。
整合全网信息：系统整合全网优质信息，提炼核心内容，生成系统化答案，实现跨领域知识融合。
结构化解决方案：在旅游、医疗、教育等领域生成结构化解决方案，降低决策成本，提升效率。

例如，当用户搜索“去云南旅游应该注意什么”时，“深度搜索”不仅会返回一些旅游攻略，还会根据用户的提问，整合天气、交通、住宿、景点等信息，生成一份结构化的旅游指南，让用户可以更方便地获取所需信息。

Anthropic推出Claude网络搜索API

Anthropic最近也推出了Claude网络搜索API，让开发者可以更方便地将Claude的AI能力集成到自己的应用中。通过这个API，Claude可以访问最新的网络信息，进行多次渐进式搜索，整合不同来源的信息，从而提供更全面的答案。

值得注意的是，在AI搜索不断发展的背景下，传统搜索引擎的市场份额正在受到挑战。Safari搜索量首次下降，这可能意味着用户对AI搜索的偏好正在增加。AI助手能够整合信息，提供更个性化的搜索结果，这使得它们在某些方面比传统搜索引擎更具优势。

Gemini2.0Flash图像生成升级

Google对其Gemini2.0Flash图像生成功能进行了升级，推出了全新的模型gemini-2.0-flash-preview-image-generation。此次更新主要集中在以下几个方面：

视觉质量提升：生成的图像更加自然，细节更加丰富。
文字渲染更精准：解决了以往文字扭曲和不清晰的问题。
内容安全机制优化：提升了生成效率和可用性。

这意味着，用户可以利用Gemini2.0Flash生成更高质量的图像，并且可以更放心地使用这项功能，不必担心生成不当内容。

DeepSeek致谢腾讯技术团队

DeepSeek近日公开感谢腾讯技术团队对其开源通信框架DeepEP的优化。据称，腾讯技术团队的贡献为DeepEP带来了“huge speedup”。

具体来说，优化后的DeepEP在RoCE网络环境下性能提升高达100%，在InfiniBand网络环境下提升约30%。这意味着，企业可以利用DeepEP更高效地部署大规模AI训练任务。

DeepSeek对腾讯技术团队的致谢，也体现了开源社区合作的重要性。通过合作，不同的团队可以共同推动技术进步，为整个行业带来更多价值。

苹果考虑在Safari中引入AI搜索功能

苹果公司的高级副总裁埃迪・库伊在反垄断诉讼中透露，Safari浏览器将进行重大改造，计划集成AI驱动的搜索引擎。随着用户搜索需求的变化，Safari的搜索量首次下降，库伊指出，AI搜索工具如OpenAI和Perplexity可能会取代传统搜索引擎。苹果已与这些新兴服务进行讨论，并计划在未来的Safari中整合。

这意味着，未来的Safari可能会提供更多的搜索选项，用户可以选择使用传统的搜索引擎，也可以选择使用AI驱动的搜索引擎。这无疑将提升Safari的竞争力，吸引更多用户。

HeyGen发布“有灵魂”的数字人Avatar IV

HeyGen推出Avatar IV数字人模型，用户可通过简单的照片和语音输入生成高度逼真的数字人视频。新技术通过分析语音情感与意图，提升数字人的表情与动作同步，广泛适用于营销、教育和社交媒体内容创作。Avatar IV的便捷操作和多语言支持为内容创作者提供了强大的工具，助力他们在数字内容创作领域取得突破。

Avatar IV的亮点包括：

高度逼真：只需上传一张照片和30秒语音，即可生成逼真的数字人视频，表情与动作高度同步。
唱歌同步：Avatar IV支持唱歌同步功能，能根据音乐节奏生成精准的唇部动作，适合音乐推广视频。
广泛应用：该模型广泛应用于营销、教育和社交媒体，帮助品牌和创作者快速生成个性化内容。

微软采用谷歌的A2A标准

微软宣布支持Google推出的Agent2Agent（A2A）标准，旨在促进人工智能代理之间的相互通信。通过在Azure AI Foundry和Copilot Studio中引入A2A支持，微软积极参与协议制定和工具开发，推动AI代理的协作性和互操作性。

随着企业对AI代理需求的增长，市场规模预计将快速扩大，微软的这一举措将为下一代软件的发展奠定基础。

OpenAI启动 “星际之门” 计划

OpenAI最近宣布了一项名为“OpenAI for Countries”的全球计划，旨在建设AI基础设施，推动各国在人工智能领域的发展。该计划将启动十个AI基础设施项目，资金主要来自OpenAI和各国政府的合作。此举反映出全球对AI技术的强烈需求，并希望通过与各国政府的合作，帮助各国更好地利用AI技术，推动经济增长和社会发展。

OpenAI的全球战略，将有助于巩固其在人工智能领域的领导地位。

Figma重磅升级

Figma在#Config2025年度盛会上发布了一系列新功能，旨在提升设计师的创作效率。新推出的Figma Draw允许用户在平台内自由绘图，极大简化了设计流程。Figma Sites功能则支持一键生成可访问的网站，增强了Figma的竞争力。

此外，AI智能增强功能提供智能布局建议，开发交接的优化减少了设计与开发之间的沟通成本。

苹果高管预测AI可能取代iPhone

苹果服务主管Eddy Cue在反垄断案中指出，未来十年内，人工智能的发展可能使iPhone变得过时。他强调，随着AI技术的进步，结合直观功能的可穿戴设备可能会取代传统智能手机。

尽管目前iPhone仍是苹果的主要收入来源，但苹果尚未找到替代产品，正在探索增强现实眼镜等新兴设备的市场。

腾讯ARC实验室发布FlexiAct

腾讯ARC实验室推出的FlexiAct模型是一项创新的动作传输技术，已在Hugging Face平台开源。该技术能够将视频中的动作无缝迁移至任意目标图像，支持灵活的布局和视点变换，展现出在计算机视觉、内容创作和交互式应用领域的巨大潜力。

FlexiAct的应用场景包括：

虚拟现实和增强现实：在虚拟现实和增强现实中可用于生成逼真的角色动画，增强用户体验。
影视制作：在影视制作中，创作者能够通过单张图像生成复杂镜头，降低生产成本。

SmartPDFs：PDF文档快速总结AI工具

SmartPDFs是一款颠覆传统PDF处理方式的AI驱动工具，利用先进的AI技术自动总结和结构化PDF文档内容，大幅提升信息提取效率。其开源特性使得用户能够自由使用和修改，适合学术研究、职场和日常使用。

SmartPDFs的优势在于：

高效的信息提取：AI驱动的文档总结与结构化功能显著提升信息获取效率，适合快速消化长篇文档的用户。
免费开源：免费开源特性使SmartPDFs成为学术界和初创企业的理想选择，降低了使用门槛。

OpenAI 任命新应用CEO

OpenAI宣布前Instacart CEO Fidji Simo将担任新任应用业务CEO，标志着公司商业化转型的加速。此举不仅显示了OpenAI对技术与业务双线推进的重视，也体现了Sam Altman将更多精力投入到研究和安全等关键领域的决心。

Simo在电商与广告领域的丰富经验，将为OpenAI实现未来250亿美元的营收目标提供重要支持。

以上就是今天的AI日报，我们每天都会为你带来最新的AI资讯，敬请关注。