AI Daily:百度Ernie 4.5 Turbo将发布,Google发布A2A协议

4

在快速发展的AI领域,每天都有令人兴奋的新闻涌现。2025年4月10日,AI领域迎来了一系列重大进展,涵盖了从大型语言模型发布到行业监管的各个方面。以下将详细介绍这些关键动态,为开发者和对AI感兴趣的读者提供深入的了解。

百度Ernie 4.5 Turbo即将发布

备受瞩目的百度Ernie 4.5 Turbo大型语言模型计划于4月25日在Create大会上正式发布。尽管具体细节尚未公布,但行业内对其发布充满期待。此前,百度已经发布了Ernie 4.5和Ernie X1,并免费向用户开放,展示了其在AI领域的深厚实力。Ernie 4.5在多模态理解方面表现出色,其API调用定价极具竞争力,引起了众多开发者和企业的关注。

Ernie 4.5 Turbo的发布预计将进一步提升百度在大型语言模型领域的竞争力。凭借其卓越的性能和具有吸引力的定价策略,有望吸引更多开发者和企业采用,从而推动AI技术的广泛应用。值得关注的是,百度创始人李彦宏表示,Ernie 4.5将是百度历史上最好的模型。

image.png

Google推出开源A2A协议

Google Cloud推出了一项名为Agent2Agent(A2A)的全新开源协议,旨在促进不同AI代理之间的协作和信息交换。该协议通过采用标准化通信方法打破信息孤岛,解决了信息隔离的问题。A2A协议的设计原则包括支持长期任务、默认安全性和模态独立性,确保其在复杂AI应用中的适用性。

A2A协议的推出有望促进AI代理之间的互操作性,使它们能够更有效地协同工作。这对于构建复杂的AI系统至关重要,因为这些系统通常需要多个代理共同完成任务。该协议的开源性质也鼓励了社区的参与和创新,从而加速AI技术的发展。

image.png

微信加强对AI直播的监管

微信视频创作安全中心最近宣布了一项特别行动,旨在打击在直播中不当使用AI工具的主播。这些行为不仅误导观众,还侵犯了他人的肖像权,违反了运营指南。平台将根据违规行为的严重程度处以处罚,以确保健康安全的直播环境。微信鼓励合理使用AI技术来提高效率,但坚决反对不正当的牟利行为。

此举反映了监管机构对AI技术在内容创作领域应用的日益关注。在鼓励技术创新的同时,也需要确保其使用符合法律法规和道德规范。微信的行动旨在维护平台内容的真实性和用户的权益,促进行业的健康发展。

image.png

ByteDance开源多语言代码修复基准

ByteDance Doubao大型模型团队最近开源了Multi-SWE-bench,这是首个多语言代码修复基准数据集。它旨在提高对大型模型自动错误修复能力的评估。与之前的SWE-bench相比,Multi-SWE-bench不仅涵盖Python,还增加了Java和TypeScript等其他六种语言,创建了1632个真实世界的任务,并引入了难度评级机制。

Multi-SWE-bench的发布为评估和改进大型模型的代码修复能力提供了一个有价值的资源。该数据集的多语言特性使其能够更全面地评估模型在不同编程语言中的表现。此外,难度评级机制有助于识别模型在不同难度级别任务中的优势和劣势。

image.png

京东零售推出TimeHF模型

京东零售技术团队成功推出了TimeHF,这是一个自主研发的十亿级销售预测时间序列大型模型。该模型利用人类反馈的强化学习,显著提高了销售预测的准确性,提高了10%以上。TimeHF在京东的自动补货场景中表现出色,并在多个公共数据集上优于行业标准,为时间序列预测设定了新的基准。

TimeHF模型的推出标志着京东在供应链管理和需求预测方面取得了重要进展。通过利用人类反馈的强化学习,该模型能够更准确地预测销售趋势,从而优化库存管理和提高运营效率。该模型的成功应用有望为京东带来显著的经济效益。

image.png

Google Firebase Studio亮相

Google新推出的Firebase Studio是一个基于云的开发平台,集成了各种开发工具,旨在通过AI技术简化开发过程。它提供了一站式开发体验,支持从构思到部署的解决方案,尤其擅长移动开发。虽然目前处于预览阶段,但其强大的功能和免费试用政策使开发人员可以更轻松地开发项目,预示着未来编程生态系统的转变。

Firebase Studio的推出为开发者提供了一个便捷高效的开发平台。通过集成各种开发工具和利用AI技术,该平台能够显著提高开发效率和降低开发成本。尤其是在移动开发领域,Firebase Studio的优势更加明显,有望成为移动开发者的首选工具。

image.png

OmniSVG模型发布

OmniSVG的发布标志着SVG生成技术取得了重大突破。它结合了先进的视觉语言模型和创新的SVG分词器,大大提高了生成效率和质量。该模型不仅支持从文本和图像生成SVG,还可以生成复杂的动漫角色,展示了高度的灵活性和质量。OmniSVG为图形设计和Web开发开辟了新的可能性,促进了AIGC社区的发展。

OmniSVG模型的发布为图形设计和Web开发领域带来了新的机遇。通过利用AI技术,该模型能够自动生成高质量的SVG图像,从而节省设计师的时间和精力。此外,OmniSVG还具有高度的灵活性和可定制性,可以满足不同用户的需求。

image.png

Google开源Agent Development Kit

Google于2025年4月9日发布的Agent Development Kit(ADK)标志着AI代理开发取得了重大进展。作为一个开源框架,ADK旨在简化多代理系统的构建和管理,支持灵活的开发和部署。其模块化设计和多模态交互功能使开发人员能够以更自然的方式创建代理,而与Google Cloud服务的深度集成提高了企业应用程序的效率。

ADK的发布为AI代理开发人员提供了一个强大的工具。通过简化多代理系统的构建和管理,该框架能够加速AI代理的开发和部署。此外,ADK的多模态交互功能使AI代理能够以更自然的方式与用户进行交互,从而提高用户体验。

image.png

Veo 2登陆Gemini API

Google的Veo2视频生成模型现已通过Gemini API提供给开发人员,标志着AI视频生成技术进入了一个新阶段。Veo2以其高保真视频生成和对复杂指令的准确响应而闻名,它支持文本到视频和图像到视频的生成。开发人员可以灵活地集成此API,以探索广泛的商业和创意可能性。然而,围绕内容真实性和版权所有权的讨论也随之出现,Google在生成的视频中嵌入水印以减轻滥用。

Veo2登陆Gemini API为AI视频生成领域带来了新的机遇。通过利用Veo2的高保真视频生成能力,开发人员可以创建各种各样的视频内容,从而满足不同用户的需求。然而,在推广AI视频生成技术的同时,也需要关注内容真实性和版权保护等问题。

image.png

Anthropic推出Claude Max订阅服务

Anthropic最近推出了Claude Max订阅计划,以满足用户对AI服务的高端需求。该计划提供两种定价选项,每月100美元和200美元,并显着提高了使用限制,吸引了更多用户。虽然目前没有无限使用选项,但该公司正在积极探索其他收入来源,包括针对教育行业的“Claude for Education”计划。

Claude Max订阅计划的推出为用户提供了更多选择,以满足他们不同的AI服务需求。通过提供更高使用限制的订阅计划,Anthropic能够吸引更多高端用户。此外,该公司积极探索其他收入来源,表明其对AI服务市场的长期信心。

image.png

OminiControl Art发布

OminiControl Art技术于2025年4月9日发布,标志着AI艺术创作领域取得了重大突破。该技术通过OminiControl框架,将OpenAI的GPT-4o的艺术风格与FLUX.1模型相结合,为用户提供了一种高效而优雅的工具,用于生成高质量的艺术图像。其设计理念强调简单性和实用性,使普通用户可以轻松使用,进一步促进了AI与艺术的融合。

OminiControl Art的发布为AI艺术创作领域带来了新的机遇。通过结合GPT-4o的艺术风格和FLUX.1模型,该技术能够生成具有高度艺术价值的图像。此外,OminiControl Art的设计理念强调简单性和实用性,使普通用户也可以轻松上手,从而推动AI艺术的普及。

image.png

Google Gemini加入MCP阵营

继OpenAI采用Anthropic的Model Context Protocol(MCP)之后,Google宣布将在其Gemini模型和软件开发工具包(SDK)中增加对MCP的支持。MCP作为一种开放标准,允许AI模型从多个数据源提取信息,从而促进开发人员和AI应用程序之间的双向连接。此举标志着AI代理互操作性的加速,吸引了多家公司集成MCP,表明了行业对开放协议的重视和协作的潜力。

Google Gemini加入MCP阵营是AI领域的一个重要里程碑。通过支持MCP协议,Gemini模型能够与其他AI模型和应用程序进行互操作,从而促进AI技术的广泛应用。此外,MCP作为一种开放标准,鼓励了社区的参与和创新,从而加速AI技术的发展。

image.png

Gradio 5.24重大更新

Gradio 5.24的发布为开源AI界面框架带来了重大更新,特别是新的ImageEditor组件,该组件带来了专业级的图像编辑功能。缩放、平移、透明度控制和自定义图层的添加大大提高了开发人员在图像处理方面的灵活性和效率。

Gradio 5.24的更新为AI应用开发人员提供了更强大的工具。通过集成专业级的图像编辑功能,该框架能够简化图像处理流程,提高开发效率。此外,Gradio的开源特性也鼓励了社区的参与和创新,从而加速AI技术的发展。

image.png

总的来说,2025年4月10日对于人工智能领域来说是充满活力和创新的一天。从百度Ernie 4.5 Turbo的即将发布,到Google开源A2A协议和Agent Development Kit,再到微信加强对AI直播的监管,以及ByteDance开源多语言代码修复基准,这些事件共同推动了AI技术的发展和应用。同时,京东零售推出TimeHF模型,Google Firebase Studio亮相,OmniSVG模型发布,Veo 2登陆Gemini API,Anthropic推出Claude Max订阅服务,OminiControl Art发布,Google Gemini加入MCP阵营,Gradio 5.24重大更新,这些进展都为AI领域的未来发展奠定了坚实的基础。