AI前沿:MCP拥抱流式HTTP,AI视频生成企业TOP20榜单出炉

2

在人工智能领域,每天都有新的技术和应用涌现,推动着各行各业的创新与发展。今天,我们为您带来最新的AI日报,深入剖析近期AI领域的重大进展和前沿动态,聚焦开发者,助您洞悉技术趋势、了解创新AI产品应用。

1. MCP SDK正式支持流式HTTP:开发者迎来全新体验

MCP近日宣布其软件开发工具包(SDK)正式支持流式HTTP协议,并发布了Typescript SDK 1.10.0版本,这标志着MCP告别了传统的服务器推送事件(SSE)协议。流式HTTP为开发者提供了更为灵活和高效的开发体验,允许在不需要长连接的情况下进行通信,从而简化了服务器管理。此外,流式HTTP仍然保留了SSE的选项,为开发者提供了更多的选择空间。

image.png

流式HTTP规范的推出,是MCP在提升开发灵活性方面迈出的重要一步。通过简化服务器管理和提供更多通信选择,MCP正在积极响应开发者社区的需求。虽然客户端支持目前仍处于初级阶段,但即将上线的支持无疑将进一步推动远程托管的发展,并显著提升开发效率。

2. Vidu Q1正式上线:画质更高清,首尾帧更丝滑

生数科技推出的Vidu Q1是一款高性能的生成式AI视频模型,它凭借卓越的视觉质量、流畅的过渡效果和精准的音效,迅速引起了业界的广泛关注。Vidu Q1的四大核心功能得到了全面升级,为创作者提供了媲美专业影视工作室的创作体验,标志着AI视频生成技术达到了一个新的里程碑。该技术架构的创新和多样化的应用场景,使得Vidu Q1在社交媒体、影视广告、游戏开发等领域展现出广阔的应用前景。

Vidu Q1支持1080p视频输出,能够呈现出媲美专业视觉特效(VFX)的细节表现,尤其适合动漫角色的生成。其引入的“First-to-Last Frame”技术,确保了视频帧之间的流畅衔接,并支持复杂场景的生成。此外,Vidu Q1还支持48kHz高清AI音效生成,用户可以自定义音效与背景音乐,从而提升视频的情感表达。

3. 马斯克的xAI计划筹集250亿美元开发Colossus 2超级计算机

埃隆·马斯克创立的人工智能公司xAI近期宣布启动一项雄心勃勃的新项目,计划筹集高达250亿美元的巨额资金,用于开发下一代超级计算机Colossus2。此举旨在进一步提升xAI在人工智能领域的竞争力,并可能对OpenAI等竞争对手构成挑战。

xAI目前的年收入约为10亿美元,估值在1500亿至2000亿美元之间。Colossus2预计将支持多达100万个NVIDIA GPU,研发成本预计在350亿至400亿美元之间。这项投资不仅显示了xAI对未来AI发展的信心,也预示着AI计算能力竞争的日益激烈。

4. Sand AI开源MAGI-1视频生成模型:无限扩展,高保真

2025年4月21日,Sand AI推出了MAGI-1开源视频生成模型,该模型以其自回归扩散架构和卓越的生成能力迅速引起了业界的广泛关注。MAGI-1不仅支持高保真的视频生成,还具备无限扩展和灵活的时间轴控制功能,使其非常适合影视制作和复杂场景的叙述。

image.png

MAGI-1采用自回归扩散架构,支持高效的视频生成,原生分辨率可达1440x2568px。该模型是开源的,并提供Docker部署支持,从而降低了开发者的使用门槛。MAGI-1还具备无限视频扩展和秒级时间轴控制功能,使其能够胜任复杂动态场景的创作。

5. 超强AI电商购物助手!Add To Cart AI:可理解文本、语音、图像,帮用户找到产品

Add To Cart AI(ACAI)是一款创新的电商购物助手,旨在通过AI技术提升消费者的购物体验。它能够快速将购物清单、聊天记录和图片转化为完整的购物车,从而极大地提高购物效率。

image.png

ACAI具备强大的个性化推荐功能,能够根据用户的历史行为和实时查询提供精准的商品建议。同时,该工具与多个主流电商平台实现了无缝对接,确保商家和消费者都能够享受到便捷的购物体验。ACAI能够将购物清单、聊天记录和图片快速转化为完整的购物车,具备强大的个性化推荐功能,并且已经与WooCommerce、Magento和Shopify等多个电商平台成功对接。

6. Anthropic发布Claude Code最佳实践指南,助力开发者无缝集成AI编程工作流

Anthropic最近推出了Claude Code最佳实践指南,旨在为开发者提供一个灵活的工具,将AI技术无缝融入日常编程任务中。该指南强调以命令行界面为核心的低层次工具,支持开发者根据自身需求自由定制工作方式。

通过CLAUDE.md文件、工具集成和多代理并行开发等功能,Claude Code提供了高效且安全的编码模式,帮助工程师优化工作流并提升开发效率。Claude Code是一个集成于命令行的开发助手,它支持自定义文档CLAUDE.md,从而提升任务适应性与上下文感知能力。该工具与现有的开发环境兼容,支持Unix工具和版本控制,并且能够通过REST API扩展功能,从而简化开发者的协作流程。

7. 真我推出首款AI翻译耳机Bud Air7 Pro,支持32种语言翻译!

真我手机即将发布其首款AI翻译耳机Bud Air7 Pro,这款耳机搭载了讯飞的星火认知大模型4.0Ultra,具备强大的翻译能力,支持中文与32种语言的面对面翻译及同声传译功能。Bud Air7 Pro的发布将与真我GT7手机新品发布会同步进行,届时将展示更多创新技术。

image.png

真我GT7手机搭载了天玑9400+芯片,配备了7200mAh大容量电池及100W光速充电技术,并结合全新的GT性能引擎2.0,从而提升游戏的流畅度。Bud Air7Pro耳机支持中文与32种语言的实时翻译,极大地提升了跨语言交流的效率。真我GT7手机采用了行业最大的7700mm²单VC均热板,确保长时间使用的稳定性。

8. 2025年AI视频生成企业TOP20榜单出炉:可灵AI、即梦AI、PixVerseAI位居前三

近日,DBC、CIW和CIS联合发布了“2025年AI视频生成企业TOP20”榜单,该榜单展示了在AI视频生成领域表现突出的企业。快手的可灵AI、爱诗科技的PixVerseAI和抖音的即梦AI分别占据前三名,这显示出它们在AI视频生成技术上的领先地位。此外,阿里巴巴、腾讯和科大讯飞等多家知名企业也在榜单中名列前茅,进一步证明了AI视频生成技术的快速发展和巨大的市场潜力。

9. GLM-4-32B与GLM-Z1-32B在OpenRouter上线,免费开放

清华大学KEG实验室推出的GLM-4-32B和GLM-Z1-32B两款前沿的大语言模型在OpenRouter平台上正式上线,并完全免费向全球用户开放。这一里程碑式的事件标志着高性能AI模型的普及,为开发者和研究人员提供了强大的工具,从而推动人工智能应用的创新。

image.png

GLM-4-32B具备320亿参数,表现卓越,而GLM-Z1-32B则在复杂任务的解决上表现突出。这两款模型的发布进一步巩固了清华大学在全球AI研究领域的领先地位。GLM-4-32B是一款拥有320亿参数的通用大语言模型,适用于多种自然语言处理任务,其性能可以媲美顶级模型。GLM-Z1-32B引入了创新的“rumination”机制,特别适合处理开放性复杂查询,具备显著的研究优势。

10. 哥伦比亚大学退学生开发“AI面试作弊神器”Interview Coder,成功融资500万美元

最近,哥伦比亚大学的退学生Chungin “Roy” Lee和Neel Shanmugam创办的初创公司Cluely宣布完成530万美元的种子轮融资,并推出了一款名为Interview Coder的AI工具,这款工具被戏称为“面试作弊神器”。该工具能够在多种场景中隐秘地使用人工智能,从而帮助用户获取实时信息。

尽管这两位创始人因开发该工具而被校方停学,但他们的努力已经使得Cluely的年度经常性收入突破300万美元,并引发了关于AI工具在求职面试中合理性的广泛讨论。

11. AI治理能力提升!抖音一季度封禁黑产账号260万个

抖音在2025年第一季度发布的黑产治理数据报告显示,该平台在打击黑色产业链方面取得了显著成效。通过构建以AI为核心的治理体系,抖音封禁了260万个涉及水军、欺诈和违规导流的黑产账号,并将违法线索上报给了相关部门。

image.png

AI技术的深度应用使得抖音在风险识别和处理方面的效率大幅提升,从而更好地保护了用户安全,维护了平台的生态健康。抖音封禁了260万个黑产账号,这些账号涉及水军、欺诈等违规行为。通过AI技术,抖音提升了黑产治理的效率,单个案例的处理时间缩短至秒级。

12. 全球首款!Ainos AI鼻成功植入ugo人形机器人,机器拥有“嗅觉”

Ainos宣布其AI Nose嗅觉模块已经成功安装于日本服务机器人公司ugo开发的人形机器人上,这标志着全球首个具备功能性嗅觉的机器人正式诞生。该技术整合了高精度气体传感器和先进的AI算法,能够数字化并识别多种气味。

image.png

此次合作将推动机器人在医疗、工业和日常生活中的应用,并开启人机交互的新纪元。Ainos的AI Nose模块成功安装于ugo的人形机器人上,使其成为全球首个具备嗅觉的机器人。此次合作结合了ugo在机器人工程领域的优势与Ainos的感知AI技术,共同推动了服务机器人技术的进步。