AI日报:夸克发布深度搜索,OpenAI启动星际之门计划

1

在人工智能领域,每天都有新的技术突破和产品发布。今天的AI日报就带你快速浏览一下最新的行业动态,让我们一起看看AI领域又有哪些新进展吧。

夸克发布“深度搜索”新品:AI先思考后检索

夸克搜索最近推出了“深度搜索”功能,这是一个利用AI技术提升搜索体验的创新尝试。传统的搜索方式往往是用户输入关键词,搜索引擎直接返回相关结果。而夸克的“深度搜索”则不同,它会先通过阿里自研的推理大模型对用户的问题进行深度分析,理解用户的真实意图,然后再进行检索。这种“先思考后检索”的模式,可以更准确地找到用户需要的答案,尤其是在面对复杂问题时,优势更加明显。

阿里巴巴、AI、新夸克

“深度搜索”的核心能力包括:

  • 多层次分析:通过多层次分析用户问题,理解真实意图,提升搜索精准度。
  • 整合全网信息:系统整合全网优质信息,提炼核心内容,生成系统化答案,实现跨领域知识融合。
  • 结构化解决方案:在旅游、医疗、教育等领域生成结构化解决方案,降低决策成本,提升效率。

例如,当用户搜索“去云南旅游应该注意什么”时,“深度搜索”不仅会返回一些旅游攻略,还会根据用户的提问,整合天气、交通、住宿、景点等信息,生成一份结构化的旅游指南,让用户可以更方便地获取所需信息。

Anthropic推出Claude网络搜索API

Anthropic最近也推出了Claude网络搜索API,让开发者可以更方便地将Claude的AI能力集成到自己的应用中。通过这个API,Claude可以访问最新的网络信息,进行多次渐进式搜索,整合不同来源的信息,从而提供更全面的答案。

值得注意的是,在AI搜索不断发展的背景下,传统搜索引擎的市场份额正在受到挑战。Safari搜索量首次下降,这可能意味着用户对AI搜索的偏好正在增加。AI助手能够整合信息,提供更个性化的搜索结果,这使得它们在某些方面比传统搜索引擎更具优势。

Gemini2.0Flash图像生成升级

Google对其Gemini2.0Flash图像生成功能进行了升级,推出了全新的模型gemini-2.0-flash-preview-image-generation。此次更新主要集中在以下几个方面:

  • 视觉质量提升:生成的图像更加自然,细节更加丰富。
  • 文字渲染更精准:解决了以往文字扭曲和不清晰的问题。
  • 内容安全机制优化:提升了生成效率和可用性。

这意味着,用户可以利用Gemini2.0Flash生成更高质量的图像,并且可以更放心地使用这项功能,不必担心生成不当内容。

DeepSeek致谢腾讯技术团队

DeepSeek近日公开感谢腾讯技术团队对其开源通信框架DeepEP的优化。据称,腾讯技术团队的贡献为DeepEP带来了“huge speedup”。

具体来说,优化后的DeepEP在RoCE网络环境下性能提升高达100%,在InfiniBand网络环境下提升约30%。这意味着,企业可以利用DeepEP更高效地部署大规模AI训练任务。

DeepSeek对腾讯技术团队的致谢,也体现了开源社区合作的重要性。通过合作,不同的团队可以共同推动技术进步,为整个行业带来更多价值。

苹果考虑在Safari中引入AI搜索功能

苹果公司的高级副总裁埃迪・库伊在反垄断诉讼中透露,Safari浏览器将进行重大改造,计划集成AI驱动的搜索引擎。随着用户搜索需求的变化,Safari的搜索量首次下降,库伊指出,AI搜索工具如OpenAI和Perplexity可能会取代传统搜索引擎。苹果已与这些新兴服务进行讨论,并计划在未来的Safari中整合。

这意味着,未来的Safari可能会提供更多的搜索选项,用户可以选择使用传统的搜索引擎,也可以选择使用AI驱动的搜索引擎。这无疑将提升Safari的竞争力,吸引更多用户。

HeyGen发布“有灵魂”的数字人Avatar IV

HeyGen推出Avatar IV数字人模型,用户可通过简单的照片和语音输入生成高度逼真的数字人视频。新技术通过分析语音情感与意图,提升数字人的表情与动作同步,广泛适用于营销、教育和社交媒体内容创作。Avatar IV的便捷操作和多语言支持为内容创作者提供了强大的工具,助力他们在数字内容创作领域取得突破。

Avatar IV的亮点包括:

  • 高度逼真:只需上传一张照片和30秒语音,即可生成逼真的数字人视频,表情与动作高度同步。
  • 唱歌同步:Avatar IV支持唱歌同步功能,能根据音乐节奏生成精准的唇部动作,适合音乐推广视频。
  • 广泛应用:该模型广泛应用于营销、教育和社交媒体,帮助品牌和创作者快速生成个性化内容。

微软采用谷歌的A2A标准

微软宣布支持Google推出的Agent2Agent(A2A)标准,旨在促进人工智能代理之间的相互通信。通过在Azure AI Foundry和Copilot Studio中引入A2A支持,微软积极参与协议制定和工具开发,推动AI代理的协作性和互操作性。

随着企业对AI代理需求的增长,市场规模预计将快速扩大,微软的这一举措将为下一代软件的发展奠定基础。

OpenAI启动 “星际之门” 计划

OpenAI最近宣布了一项名为“OpenAI for Countries”的全球计划,旨在建设AI基础设施,推动各国在人工智能领域的发展。该计划将启动十个AI基础设施项目,资金主要来自OpenAI和各国政府的合作。此举反映出全球对AI技术的强烈需求,并希望通过与各国政府的合作,帮助各国更好地利用AI技术,推动经济增长和社会发展。

OpenAI的全球战略,将有助于巩固其在人工智能领域的领导地位。

Figma重磅升级

Figma在#Config2025年度盛会上发布了一系列新功能,旨在提升设计师的创作效率。新推出的Figma Draw允许用户在平台内自由绘图,极大简化了设计流程。Figma Sites功能则支持一键生成可访问的网站,增强了Figma的竞争力。

此外,AI智能增强功能提供智能布局建议,开发交接的优化减少了设计与开发之间的沟通成本。

苹果高管预测AI可能取代iPhone

苹果服务主管Eddy Cue在反垄断案中指出,未来十年内,人工智能的发展可能使iPhone变得过时。他强调,随着AI技术的进步,结合直观功能的可穿戴设备可能会取代传统智能手机。

尽管目前iPhone仍是苹果的主要收入来源,但苹果尚未找到替代产品,正在探索增强现实眼镜等新兴设备的市场。

腾讯ARC实验室发布FlexiAct

腾讯ARC实验室推出的FlexiAct模型是一项创新的动作传输技术,已在Hugging Face平台开源。该技术能够将视频中的动作无缝迁移至任意目标图像,支持灵活的布局和视点变换,展现出在计算机视觉、内容创作和交互式应用领域的巨大潜力。

image.png

FlexiAct的应用场景包括:

  • 虚拟现实和增强现实:在虚拟现实和增强现实中可用于生成逼真的角色动画,增强用户体验。
  • 影视制作:在影视制作中,创作者能够通过单张图像生成复杂镜头,降低生产成本。

SmartPDFs:PDF文档快速总结AI工具

SmartPDFs是一款颠覆传统PDF处理方式的AI驱动工具,利用先进的AI技术自动总结和结构化PDF文档内容,大幅提升信息提取效率。其开源特性使得用户能够自由使用和修改,适合学术研究、职场和日常使用。

SmartPDFs的优势在于:

  • 高效的信息提取:AI驱动的文档总结与结构化功能显著提升信息获取效率,适合快速消化长篇文档的用户。
  • 免费开源:免费开源特性使SmartPDFs成为学术界和初创企业的理想选择,降低了使用门槛。

OpenAI 任命新应用CEO

OpenAI宣布前Instacart CEO Fidji Simo将担任新任应用业务CEO,标志着公司商业化转型的加速。此举不仅显示了OpenAI对技术与业务双线推进的重视,也体现了Sam Altman将更多精力投入到研究和安全等关键领域的决心。

Simo在电商与广告领域的丰富经验,将为OpenAI实现未来250亿美元的营收目标提供重要支持。

以上就是今天的AI日报,我们每天都会为你带来最新的AI资讯,敬请关注。