AI Daily：Cursor Pro解除限制，MiniMax发布视频模型，Google推出轻量级Gemini

在人工智能领域，每天都有新的技术和产品涌现，为开发者和用户带来无限可能。让我们一起深入了解一下近期AI领域的重大进展。

Cursor Pro解除请求限制：开启无限使用的新篇章

对于开发者来说，Cursor Pro解除每月500次快速请求的限制无疑是一个好消息。这意味着开发者可以更加自由地使用Cursor Pro的各项功能，极大地提高开发效率。然而，我们也需要关注可能出现的滥用问题，合理规划使用，避免对服务器造成不必要的压力。

值得注意的是，Cursor Pro推出了全新的Ultra计划，每月收费200美元，提供相当于Pro计划20倍的模型使用量。Anysphere的估值已达到99亿美元，年收入超过5亿美元，巩固了其市场领导地位。这一举措表明，AI工具的市场竞争日益激烈，各厂商都在不断提升服务质量和性能，以吸引更多用户。

MiniMax推出视频生成模型Hailuo 02：开启视频创作新纪元

西域科技推出的视频生成模型Hailuo02在处理复杂场景和提高创意质量方面表现出色，显著降低了视频创作的门槛。这意味着即使没有专业技能，用户也可以轻松创作出高质量的视频内容。

Hailuo02是目前唯一能够高效处理体操动作等复杂场景的模型，已经帮助创作者生成超过3.7亿个视频。其NCR架构将模型训练和推理效率提高了2.5倍，参数规模扩大了三倍，并支持更大规模的数据拟合。此外，Hailuo02还支持1080p视频生成，具有很高的成本效益，可在多个平台上使用，并提供多种分辨率选项。详情请访问：https://hailuoai.com/create

谷歌发布Gemini 2.5 Flash-Lite：更快的推理速度，更低的成本

谷歌推出了Gemini 2.5 Flash-Lite，这是其系列中最轻量级、最具成本效益的AI模型。它具有快速推理和低延迟的特点，适用于各种应用，包括实时翻译和高吞吐量分类任务。这意味着开发者可以利用Gemini 2.5 Flash-Lite构建更加高效、经济的AI应用。

Gemini 2.5 Flash-Lite支持高达100万个token的超长上下文处理，具有强大的灵活性，适用于复杂的系统开发。它已集成到Google AI Studio、Vertex AI平台和Google Search中，帮助开发者高效工作。

iFlytek再次出击！星火X1升级版将于7月发布

iFlytek即将发布星火X1的升级版本，预计将于7月推出。新版本在性能、用户体验和市场布局方面均有显著提升，展示了iFlytek在智能语音领域的持续创新能力。我们可以期待新版星火X1在语音识别、自然语言处理等方面带来更多惊喜。

星火X1升级版将于7月发布，整体性能提升，提供更流畅、更智能的用户体验。iFlytek与多家企业合作，加速市场扩张，彰显其在数字经济领域的领先地位。用户界面和交互体验也得到了显著改进，带来更高效、更便捷的应用体验。

腾讯元宝推出AI编码模式：实时代码生成与预览

腾讯元宝推出了一种新的AI编码模式，通过双栏界面实时生成代码并预览结果，支持多语言在线执行，降低了学习门槛，特别适合教育和家庭场景。这一功能使得编程学习更加直观和互动，有助于培养用户的编程兴趣。

用户可以通过双栏界面实时生成和预览代码，提高开发效率。它支持多种编程语言的在线执行，无需配置环境，简化了操作流程。特别适合教育和家庭场景，激发创造力和编程兴趣。

OpenAI宣布GPT-4.5将从API中停用，开发者感到困惑和失望

OpenAI计划于2025年7月14日停止在API中使用GPT-4.5预览版，这对依赖此模型的开发者产生了重大影响。不过，GPT-4.5仍然可供ChatGPT个人用户使用，OpenAI建议开发者迁移到GPT-4.1或其他模型。这一变化可能会促使开发者重新评估其AI应用，并寻找更合适的替代方案。

OpenAI将于2025年7月14日停止在API中使用GPT-4.5预览版，开发者需要迅速适应这一重大变化。虽然GPT-4.5不再支持API使用，但它仍然是ChatGPT个人用户的工具，提供持续服务。OpenAI鼓励开发者迁移到GPT-4.1或其他替代模型，以确保业务连续性并降低运营成本。

苹果新款语音API转录速度超越OpenAI Whisper 55%

苹果新推出的语音API展现出卓越的转录速度，仅用45秒即可完成对一段34分钟4K视频的转录，远远超过OpenAI的Whisper等其他工具。这项技术的优势不仅在于速度，还在于其本地计算能力，使得多段视频处理更加高效。这意味着苹果在语音识别技术方面取得了显著进展。

苹果新款语音API仅用45秒即可转录一段34分钟的4K视频，超越竞争对手。与OpenAI Whisper相比，苹果的技术效率提高了约55%，显示出显著的改进。本地计算的优势使得Yap在多段视频处理中更加高效，节省了用户大量时间。

百度推出全球首个文心大模型4.5T驱动的双数字人互动直播

本文介绍了百度全球首个由文心大模型4.5T驱动的双数字人互动直播，展示了多模态技术的突破，对直播行业和内容创作生态系统产生了深远影响。这一创新有望为直播内容带来更多可能性，并提升用户体验。

文心大模型4.5T实现了多模态联合建模，显著提升了数字人互动体验。双数字人直播有助于电子商务、教育等领域的内容创作，降低了成本并增强了多样性。开源计划促进了多模态AI技术的普及，帮助中小型企业和开发者进行创新应用。

OpenAI CEO爆料Meta曾试图以1亿美元挖角OpenAI人才但失败

Meta曾开出高薪试图从OpenAI和Google DeepMind挖走顶尖AI研究人员，但未能成功。OpenAI CEO Sam Altman认为，OpenAI的创新文化和AGI发展前景吸引了优秀的员工。同时，OpenAI正在开发一款基于AI的社交媒体应用，以与Meta竞争。这表明在AI领域，人才的争夺异常激烈，而公司的文化和发展前景是吸引人才的关键。

Meta曾开出高价试图从OpenAI挖走人才，但未能成功招募到优秀员工。Sam Altman认为，OpenAI员工更看重公司的创新文化和AGI发展前景。OpenAI正在开发一款基于AI的社交媒体应用，试图在社交网络领域与Meta竞争。

告别“AI感”！Krea1 Beta测试开放，超真实纹理和细节，多样艺术风格

Krea AI的首个图像生成模型Krea1 Beta版现已开放测试，解决了传统AI图像生成中存在的“AI感”问题，提供超真实的纹理、多样的风格和个性化定制支持，以及实时编辑功能。这意味着用户可以创作出更加自然、逼真的AI图像。

超真实的纹理和细节：支持1.5K原生分辨率，最高可达4K超高清，展示了细腻的纹理和逼真的材质。多样的艺术风格：准确理解复杂的艺术风格要求，避免了“AI图像”的单调性。个性化定制支持：允许上传参考图像或数据集，实时调整生成结果，增强了创作者的控制力。

特斯拉Grok车载AI助手即将发布，个性化让驾驶更有趣

特斯拉的Grok车载AI助手有望为车主带来全新的智能体验，具有互动性和个性化功能，包括不同的“个性”版本和儿童模式，但目前仅限于AMD芯片型号。随着Robotaxi平台的推进，Grok的重要性日益凸显。这意味着未来的驾驶体验将更加智能化和个性化。

Grok车载AI助手将打破人与车之间的传统界限，提供丰富的沟通方式，如回答问题和个性化设置。支持各种个性化选项，如不同的个性和儿童模式，适合家庭用户。仅限于AMD芯片型号，新款车型将享受更强大的智能技术，促进车载AI技术的成熟。

谷歌Gemini迎来重大升级！视频上传和分析功能正式上线

谷歌正式发布Gemini 2.5 Pro和Flash版本，全面向用户开放，并增加了视频上传和分析功能，支持Android和Web平台，增强了视频处理能力。用户可以轻松上传视频进行内容分析，极大地提高了视频处理的效率。

Gemini增加了视频上传和分析功能，允许在Android和Web平台上轻松上传视频进行内容分析。Gemini可以全面分析视频内容，包括概述、查找片段或项目以及显示相关片段，从而提高视频处理效率。在视频分析领域，Gemini超越了ChatGPT，提供了更便捷的用户体验，巩固了市场竞争力。

总的来说，近期AI领域涌现出众多创新技术和产品，从Cursor Pro解除请求限制，到MiniMax推出视频生成模型Hailuo 02，再到谷歌发布Gemini 2.5 Flash-Lite，以及iFlytek星火X1升级版、腾讯元宝AI编码模式、苹果新款语音API等，都展示了AI技术的巨大潜力。然而，OpenAI宣布GPT-4.5将从API中停用也提醒我们，技术发展并非一帆风顺，开发者需要不断适应变化，才能在AI浪潮中立于不败之地。