AI日报:多模态程序员上岗,大模型人才争夺白热化

9

在人工智能技术日新月异的今天,AI已经渗透到我们生活的方方面面。2025年4月28日,AI领域再次迎来了一系列令人瞩目的进展。本文将对当日的AI热点新闻进行深度解读,带您洞悉技术趋势,了解创新应用。

1. 国内首个多模态AI程序员正式上岗

在软件开发领域,AI正扮演着越来越重要的角色。百度推出的文心快码Comate Zulu智能体,标志着国内首个多模态AI程序员正式上岗。这款智能体能够通过高效的多模态交互,自动生成代码,并支持多种开发环境,极大地提升了开发效率。据统计,超过80%的开发者认为AI代码生成工具能够有效提升开发效率,预示着编程领域正在步入“智能驾驶”时代。

image.png

文心快码Comate Zulu智能体的核心优势在于其多模态交互能力。传统的代码生成工具往往依赖于单一的输入方式,例如文本或图形界面。而Zulu智能体能够理解多种输入模态,例如自然语言、语音、甚至是手势。这意味着开发者可以通过更加自然和直观的方式与AI进行交互,从而提高开发效率。此外,Zulu智能体还能够自动分析工程需求,快速生成代码。对于资深工程师而言,使用Zulu智能体可以将代码重构的时间缩短至1分钟,极大地节省了时间和精力。

2. 字节跳动启动 “Top Seed” 计划招募AI人才

人才是推动AI技术发展的关键。字节跳动启动2026届“Top Seed”大模型顶尖人才校招计划,旨在招募约30位优秀博士生,专注于前沿的人工智能领域。与以往不同的是,本届计划强调不限专业背景,更关注应聘者的研究潜力与热情。

image.png

字节跳动“Top Seed”计划的独特之处在于其对人才的选拔标准。传统的招聘往往侧重于应聘者的学历和工作经验,而“Top Seed”计划更关注应聘者的研究潜力和热情。这意味着字节跳动希望找到那些真正热爱AI、具有创新精神和解决问题能力的年轻人。此外,该计划还强调不限专业背景,鼓励跨学科人才的加入。这反映了字节跳动对AI人才多元化的重视,以及对不同学科背景人才的创新能力的期待。

3. DeepSeek R1T Chimera 正式上线 OpenRouter 平台

开源是推动AI技术普及的重要力量。DeepSeek R1T Chimera 模型的上线,标志着开源AI技术在推理能力与效率之间实现了新的平衡。该模型结合了 DeepSeek R1的强大推理能力和 V3-0324的高效性能,成为一款具有685B参数的开源模型。通过 OpenRouter 平台,开发者可以轻松接入这一模型,享受免费 API 访问,推动开源 AI 的普及与应用。

DeepSeek R1T Chimera 模型的优势在于其在推理能力和效率之间的平衡。传统的AI模型往往需要在推理能力和效率之间做出权衡,即提高推理能力通常会导致效率下降,反之亦然。而DeepSeek R1T Chimera模型通过结合DeepSeek R1的强大推理能力和 V3-0324的高效性能,实现了在推理能力和效率之间的最佳平衡。这意味着开发者可以使用该模型构建更加强大和高效的AI应用。此外,OpenRouter平台提供的免费API访问也降低了开发者使用该模型的门槛,进一步推动了开源AI的普及。

4. 阿里 AI 工程师余亮荣获 “全国劳动模范” 称号

在“庆祝中华全国总工会成立100周年暨全国劳动模范和先进工作者表彰大会”上,阿里巴巴的余亮被授予“全国劳动模范”称号,成为首位获此殊荣的阿里 AI 工程师。他在大数据和智慧城市领域的贡献得到了广泛认可,尤其是在城市大脑项目中,通过创新的交通算法显著提升了城市交通管理的效率。

余亮能够获得“全国劳动模范”称号,充分体现了国家对AI技术在经济社会发展中作用的认可。他专注于大数据和智慧城市领域,通过城市大脑项目提升交通管理效率,为改善民生做出了重要贡献。他的事迹表明,AI技术不仅可以应用于商业领域,也可以应用于公共服务领域,为社会带来福祉。此外,余亮参与多个行业的 AI 大模型研发,推动了专业知识与技术的结合,为AI技术的创新应用提供了新的思路。

5. 开源界核弹!Step1X-Edit 登陆 Hugging Face

图像编辑是AI技术的重要应用领域。Step1X-Edit的发布标志着开源图像编辑领域的一次重大突破。它结合了多模态大语言模型与扩散变换器,用户可通过自然语言指令实现高精度图像编辑,极大提升了创作效率。该框架遵循Apache2.0许可证,完全开放源代码,鼓励社区协作与技术透明化。

image.png

Step1X-Edit的核心优势在于其自然语言交互能力。传统的图像编辑工具往往需要用户具备专业的图像处理知识和技能,而Step1X-Edit通过结合多模态大语言模型,用户可以使用自然语言指令进行图像编辑,降低了使用门槛。此外,该框架还结合了扩散变换器,实现了高精度图像编辑,保证了编辑效果。Step1X-Edit的开源特性也为开发者提供了更大的灵活性和创新空间,鼓励社区协作与技术透明化,将推动开源图像编辑技术的快速发展。

6. 谷歌被曝每月巨资贿赂三星

商业竞争是推动技术创新的重要动力。近日,谷歌因与三星的合作协议引发了反垄断审判的新波澜。谷歌每月向三星支付巨额资金,以促使其在 Galaxy S25系列智能手机中预装 Gemini 人工智能应用。这一行为在谷歌被指控违反反垄断法后引发了广泛关注。美国司法部对此表示强烈反对,并要求禁止此类默认协议,甚至提议对谷歌进行更严厉的处罚。

谷歌与三星的合作协议反映了AI市场竞争的激烈程度。为了争夺市场份额,谷歌采取了高额补贴的策略,以促使三星在其智能手机中预装Gemini人工智能应用。然而,这种行为也引发了反垄断的质疑。美国司法部认为,谷歌与设备制造商之间的默认协议将加剧谷歌的市场主导地位,不利于市场竞争。如果谷歌未能妥善应对此次反垄断审判,可能会对其未来的发展构成严重威胁。

7. ChatDLM:全球首个扩散语言模型即将开源

技术创新是推动AI发展的核心动力。ChatDLM即将开源,为全球开发者和研究者提供全新的AI工具,推动生成式AI技术的发展。其高效的推理速度和超长的上下文处理能力,使其在复杂文本生成和分析任务中具有显著优势。结合块扩散与专家混合架构,ChatDLM的创新设计可能成为通用人工智能的关键技术路径,广泛应用于法律、学术研究等领域。

ChatDLM的独特之处在于其结合了块扩散与专家混合架构。块扩散技术可以提高模型的推理速度,使其在A100GPU上的推理速度高达2,800tokens/秒,成为全球最快的语言模型之一。专家混合架构可以提高模型的上下文处理能力,使其支持高达131,072tokens的上下文处理,适合长文档处理和对话历史追踪。ChatDLM的开源将降低使用门槛,加速基于扩散语言模型的应用创新。

8. 字节跳动推出 QuaDMix

数据质量是影响AI模型性能的关键因素。字节跳动最近推出的QuaDMix框架,旨在提升大型语言模型的预训练效率与泛化能力。传统的数据筛选方法往往忽视了数据质量与多样性之间的复杂关系,而QuaDMix通过特征提取、质量聚合和质量-多样性感知采样的三阶段流程,成功实现了这两者的联合优化。实验结果显示,该框架在多个基准测试中表现优异,平均得分达到39.5%。

image.png

QuaDMix的核心在于其对数据质量和多样性的联合优化。传统的数据筛选方法往往只关注数据质量,而忽略了数据的多样性。QuaDMix通过特征提取、质量聚合和质量-多样性感知采样的三阶段流程,实现了数据质量和多样性的最佳平衡。这意味着使用QuaDMix框架可以训练出更加高效和泛化的AI模型。实验结果也证明了QuaDMix框架的有效性,其在多个基准测试中表现优异,平均得分达到了39.5%,超越了多种传统方法。

9. Adobe 重磅升级 Firefly AI 平台

AI正在改变内容创作的方式。Adobe 最近对其 Firefly AI 平台进行了重大升级,将其从独立的图像生成器转变为一个综合性的数字内容创作系统。新版本支持生成图像、视频、音频和矢量图形,推出了 Firefly Image Model4和 Firefly Video Model,提供更高的创作灵活性和质量。

image.png

Firefly AI 平台升级的核心在于其对多种数字内容创作的支持。新版本不仅可以生成图像,还可以生成视频、音频和矢量图形。这意味着用户可以使用Firefly AI 平台完成多种类型的数字内容创作,例如图像编辑、视频剪辑、音频合成等。新增的视频生成模型,最长支持五秒的视频剪辑,提升了视觉效果和细节。此外,Adobe还即将推出移动应用程序,实现随时随地的创作与项目同步,进一步提高了创作的便利性。

10. Kimi与财新传媒达成了内容合作协议

信息质量是AI应用的关键。Kimi与财新传媒的合作标志着在财经信息领域的重要进展。此举将为用户提供更专业和可信的财经内容,提升信息获取的效率和准确性。用户在Kimi上询问财经问题时,将整合财新传媒的专业报道,确保答案的高质量和准确性。此外,Kimi还推出了蓝V徽章功能,帮助用户识别高质量的信息来源,进一步增强了信息获取的便利性和可靠性。

Kimi与财新传媒的合作体现了对信息质量的重视。在信息爆炸的时代,用户面临着信息过载和信息质量参差不齐的问题。Kimi通过与财新传媒合作,整合其专业报道,为用户提供更专业和可信的财经信息。此外,Kimi还推出了蓝V徽章功能,帮助用户识别高质量的信息来源,进一步提高了信息获取的效率和可靠性。

11. 巨人网络《太空杀》引入腾讯AI技术

AI正在为游戏行业带来新的可能性。巨人网络旗下的《太空杀》游戏近期接入了腾讯的混元大模型,极大丰富了玩家的游戏体验。自4月28日推出以来,已生成超过700万个AI玩家,提升了游戏的趣味性和挑战性。游戏还将引入腾讯云的语音合成技术,进一步增强创作者的表达方式。

巨人网络《太空杀》引入腾讯AI技术的核心在于其对游戏体验的提升。通过接入腾讯的混元大模型,游戏可以生成超过700万个AI玩家,提高了游戏的智能化水平,也使得每次游戏都有不同的体验。这不仅增强了游戏的可玩性,也为未来AI技术在游戏行业的应用开辟了新的可能性。腾讯云的TTS语音合成技术,增强UGC剧本工具的创造力,提升短视频内容质量,可以为用户提供更加丰富的游戏体验。