AI日报：多模态程序员上岗，大模型人才争夺白热化

在人工智能技术日新月异的今天，AI已经渗透到我们生活的方方面面。2025年4月28日，AI领域再次迎来了一系列令人瞩目的进展。本文将对当日的AI热点新闻进行深度解读，带您洞悉技术趋势，了解创新应用。

1. 国内首个多模态AI程序员正式上岗

在软件开发领域，AI正扮演着越来越重要的角色。百度推出的文心快码Comate Zulu智能体，标志着国内首个多模态AI程序员正式上岗。这款智能体能够通过高效的多模态交互，自动生成代码，并支持多种开发环境，极大地提升了开发效率。据统计，超过80%的开发者认为AI代码生成工具能够有效提升开发效率，预示着编程领域正在步入“智能驾驶”时代。

文心快码Comate Zulu智能体的核心优势在于其多模态交互能力。传统的代码生成工具往往依赖于单一的输入方式，例如文本或图形界面。而Zulu智能体能够理解多种输入模态，例如自然语言、语音、甚至是手势。这意味着开发者可以通过更加自然和直观的方式与AI进行交互，从而提高开发效率。此外，Zulu智能体还能够自动分析工程需求，快速生成代码。对于资深工程师而言，使用Zulu智能体可以将代码重构的时间缩短至1分钟，极大地节省了时间和精力。

2. 字节跳动启动 “Top Seed” 计划招募AI人才

人才是推动AI技术发展的关键。字节跳动启动2026届“Top Seed”大模型顶尖人才校招计划，旨在招募约30位优秀博士生，专注于前沿的人工智能领域。与以往不同的是，本届计划强调不限专业背景，更关注应聘者的研究潜力与热情。

字节跳动“Top Seed”计划的独特之处在于其对人才的选拔标准。传统的招聘往往侧重于应聘者的学历和工作经验，而“Top Seed”计划更关注应聘者的研究潜力和热情。这意味着字节跳动希望找到那些真正热爱AI、具有创新精神和解决问题能力的年轻人。此外，该计划还强调不限专业背景，鼓励跨学科人才的加入。这反映了字节跳动对AI人才多元化的重视，以及对不同学科背景人才的创新能力的期待。

3. DeepSeek R1T Chimera 正式上线 OpenRouter 平台

开源是推动AI技术普及的重要力量。DeepSeek R1T Chimera 模型的上线，标志着开源AI技术在推理能力与效率之间实现了新的平衡。该模型结合了 DeepSeek R1的强大推理能力和 V3-0324的高效性能，成为一款具有685B参数的开源模型。通过 OpenRouter 平台，开发者可以轻松接入这一模型，享受免费 API 访问，推动开源 AI 的普及与应用。

DeepSeek R1T Chimera 模型的优势在于其在推理能力和效率之间的平衡。传统的AI模型往往需要在推理能力和效率之间做出权衡，即提高推理能力通常会导致效率下降，反之亦然。而DeepSeek R1T Chimera模型通过结合DeepSeek R1的强大推理能力和 V3-0324的高效性能，实现了在推理能力和效率之间的最佳平衡。这意味着开发者可以使用该模型构建更加强大和高效的AI应用。此外，OpenRouter平台提供的免费API访问也降低了开发者使用该模型的门槛，进一步推动了开源AI的普及。

4. 阿里 AI 工程师余亮荣获 “全国劳动模范” 称号

在“庆祝中华全国总工会成立100周年暨全国劳动模范和先进工作者表彰大会”上，阿里巴巴的余亮被授予“全国劳动模范”称号，成为首位获此殊荣的阿里 AI 工程师。他在大数据和智慧城市领域的贡献得到了广泛认可，尤其是在城市大脑项目中，通过创新的交通算法显著提升了城市交通管理的效率。

余亮能够获得“全国劳动模范”称号，充分体现了国家对AI技术在经济社会发展中作用的认可。他专注于大数据和智慧城市领域，通过城市大脑项目提升交通管理效率，为改善民生做出了重要贡献。他的事迹表明，AI技术不仅可以应用于商业领域，也可以应用于公共服务领域，为社会带来福祉。此外，余亮参与多个行业的 AI 大模型研发，推动了专业知识与技术的结合，为AI技术的创新应用提供了新的思路。

5. 开源界核弹!Step1X-Edit 登陆 Hugging Face

图像编辑是AI技术的重要应用领域。Step1X-Edit的发布标志着开源图像编辑领域的一次重大突破。它结合了多模态大语言模型与扩散变换器，用户可通过自然语言指令实现高精度图像编辑，极大提升了创作效率。该框架遵循Apache2.0许可证，完全开放源代码，鼓励社区协作与技术透明化。

Step1X-Edit的核心优势在于其自然语言交互能力。传统的图像编辑工具往往需要用户具备专业的图像处理知识和技能，而Step1X-Edit通过结合多模态大语言模型，用户可以使用自然语言指令进行图像编辑，降低了使用门槛。此外，该框架还结合了扩散变换器，实现了高精度图像编辑，保证了编辑效果。Step1X-Edit的开源特性也为开发者提供了更大的灵活性和创新空间，鼓励社区协作与技术透明化，将推动开源图像编辑技术的快速发展。

6. 谷歌被曝每月巨资贿赂三星

商业竞争是推动技术创新的重要动力。近日，谷歌因与三星的合作协议引发了反垄断审判的新波澜。谷歌每月向三星支付巨额资金，以促使其在 Galaxy S25系列智能手机中预装 Gemini 人工智能应用。这一行为在谷歌被指控违反反垄断法后引发了广泛关注。美国司法部对此表示强烈反对，并要求禁止此类默认协议，甚至提议对谷歌进行更严厉的处罚。

谷歌与三星的合作协议反映了AI市场竞争的激烈程度。为了争夺市场份额，谷歌采取了高额补贴的策略，以促使三星在其智能手机中预装Gemini人工智能应用。然而，这种行为也引发了反垄断的质疑。美国司法部认为，谷歌与设备制造商之间的默认协议将加剧谷歌的市场主导地位，不利于市场竞争。如果谷歌未能妥善应对此次反垄断审判，可能会对其未来的发展构成严重威胁。

7. ChatDLM:全球首个扩散语言模型即将开源

技术创新是推动AI发展的核心动力。ChatDLM即将开源，为全球开发者和研究者提供全新的AI工具，推动生成式AI技术的发展。其高效的推理速度和超长的上下文处理能力，使其在复杂文本生成和分析任务中具有显著优势。结合块扩散与专家混合架构，ChatDLM的创新设计可能成为通用人工智能的关键技术路径，广泛应用于法律、学术研究等领域。

ChatDLM的独特之处在于其结合了块扩散与专家混合架构。块扩散技术可以提高模型的推理速度，使其在A100GPU上的推理速度高达2，800tokens/秒，成为全球最快的语言模型之一。专家混合架构可以提高模型的上下文处理能力，使其支持高达131，072tokens的上下文处理，适合长文档处理和对话历史追踪。ChatDLM的开源将降低使用门槛，加速基于扩散语言模型的应用创新。

8. 字节跳动推出 QuaDMix

数据质量是影响AI模型性能的关键因素。字节跳动最近推出的QuaDMix框架，旨在提升大型语言模型的预训练效率与泛化能力。传统的数据筛选方法往往忽视了数据质量与多样性之间的复杂关系，而QuaDMix通过特征提取、质量聚合和质量-多样性感知采样的三阶段流程，成功实现了这两者的联合优化。实验结果显示，该框架在多个基准测试中表现优异，平均得分达到39.5%。

QuaDMix的核心在于其对数据质量和多样性的联合优化。传统的数据筛选方法往往只关注数据质量，而忽略了数据的多样性。QuaDMix通过特征提取、质量聚合和质量-多样性感知采样的三阶段流程，实现了数据质量和多样性的最佳平衡。这意味着使用QuaDMix框架可以训练出更加高效和泛化的AI模型。实验结果也证明了QuaDMix框架的有效性，其在多个基准测试中表现优异，平均得分达到了39.5%，超越了多种传统方法。

9. Adobe 重磅升级 Firefly AI 平台

AI正在改变内容创作的方式。Adobe 最近对其 Firefly AI 平台进行了重大升级，将其从独立的图像生成器转变为一个综合性的数字内容创作系统。新版本支持生成图像、视频、音频和矢量图形，推出了 Firefly Image Model4和 Firefly Video Model，提供更高的创作灵活性和质量。

Firefly AI 平台升级的核心在于其对多种数字内容创作的支持。新版本不仅可以生成图像，还可以生成视频、音频和矢量图形。这意味着用户可以使用Firefly AI 平台完成多种类型的数字内容创作，例如图像编辑、视频剪辑、音频合成等。新增的视频生成模型，最长支持五秒的视频剪辑，提升了视觉效果和细节。此外，Adobe还即将推出移动应用程序，实现随时随地的创作与项目同步，进一步提高了创作的便利性。

10. Kimi与财新传媒达成了内容合作协议

信息质量是AI应用的关键。Kimi与财新传媒的合作标志着在财经信息领域的重要进展。此举将为用户提供更专业和可信的财经内容，提升信息获取的效率和准确性。用户在Kimi上询问财经问题时，将整合财新传媒的专业报道，确保答案的高质量和准确性。此外，Kimi还推出了蓝V徽章功能，帮助用户识别高质量的信息来源，进一步增强了信息获取的便利性和可靠性。

Kimi与财新传媒的合作体现了对信息质量的重视。在信息爆炸的时代，用户面临着信息过载和信息质量参差不齐的问题。Kimi通过与财新传媒合作，整合其专业报道，为用户提供更专业和可信的财经信息。此外，Kimi还推出了蓝V徽章功能，帮助用户识别高质量的信息来源，进一步提高了信息获取的效率和可靠性。

11. 巨人网络《太空杀》引入腾讯AI技术

AI正在为游戏行业带来新的可能性。巨人网络旗下的《太空杀》游戏近期接入了腾讯的混元大模型，极大丰富了玩家的游戏体验。自4月28日推出以来，已生成超过700万个AI玩家，提升了游戏的趣味性和挑战性。游戏还将引入腾讯云的语音合成技术，进一步增强创作者的表达方式。

巨人网络《太空杀》引入腾讯AI技术的核心在于其对游戏体验的提升。通过接入腾讯的混元大模型，游戏可以生成超过700万个AI玩家，提高了游戏的智能化水平，也使得每次游戏都有不同的体验。这不仅增强了游戏的可玩性，也为未来AI技术在游戏行业的应用开辟了新的可能性。腾讯云的TTS语音合成技术，增强UGC剧本工具的创造力，提升短视频内容质量，可以为用户提供更加丰富的游戏体验。