Gemini升级:照片也能生成视频了?
谷歌的 Gemini 模型现在又添新技能,可以直接将照片转化为视频。这项新功能基于 Veo 3 模型,让视频创作变得更加简单。不过,目前这项功能对使用次数有所限制。
自从今年五月 Veo 3 模型首次亮相以来,由它生成的视频已经在互联网上广泛传播,让人越来越难以分辨真假。现在,谷歌让 AI 视频的创作过程变得更加容易。Gemini 应用新增了照片转视频功能,用户只需上传一张照片,就能将其转化为一段视频。这项功能面向 Google One 的 Pro 和 Ultra AI 订阅用户开放,无需额外付费。
此前,Veo 3 仅凭文字描述就能生成包含语音、音乐和背景音效的完整视频。这使得谷歌的 AI 视频逼真度极高,难以一眼识别。而现在,有了参考照片,用户无需详细描述每个细节,就能更轻松地获得想要的效果。虽然 Google 的 Flow AI 工具早已具备类似功能,但现在 Gemini 应用和网页界面也支持了。
要使用照片生成视频,首先需要在 Gemini 工具栏中选择“视频”选项。待该功能可用后,上传图片并添加提示词,包括音频和对话。视频生成过程需要几分钟,因为这需要大量的计算资源,所以视频输出目前还受到限制。
Veo 3 视频的分辨率限制为 720p,时长为 8 秒。而且,AI 生成的结果并不一定符合用户的期望。更让人感到局限的是,Veo 3 视频的生成次数也受到严格限制。AI Pro 订阅用户(每月 20 美元)每天可以生成 3 个视频,而升级到 AI Ultra 计划(每月 250 美元)后,每天也只能生成 5 个视频。
谷歌表示,照片转视频功能已于今日在 Gemini 中推出。只要你订阅了付费 AI 计划,就能立即体验。免费版 Gemini 用户则无法使用此功能。
最近,AI 视频生成技术被滥用的事件再次提醒我们,这项技术可能会被用于不正当用途。Veo 3 似乎非常“听话”,只要不明显违反谷歌的规则,它几乎能生成任何内容。对此,谷歌表示,他们致力于安全,通过“红队”测试积极评估 AI 系统,以确保它们不会生成不安全的内容。所有由 Gemini 和 Veo 3 生成的视频都将带有 Google 的 SynthID 数字水印,以便识别。
AI视频生成的局限性与挑战
尽管 Gemini 的照片转视频功能为用户带来了全新的创作体验,但我们也必须清醒地认识到,这项技术目前仍存在一些局限性。
首先,视频质量和时长受到限制。720p 的分辨率和 8 秒的时长,对于追求高质量视频内容的用户来说,显然是无法满足需求的。这在一定程度上限制了 AI 视频的应用场景,使其更适用于社交媒体分享等轻量级内容。
其次,生成结果的不确定性也是一个问题。AI 的创作过程并非完全可控,最终生成的视频可能与用户的预期存在偏差。这需要用户在使用过程中不断调整提示词和参数,以获得更理想的效果。
此外,生成次数的限制也让用户感到不便。无论是 AI Pro 还是 AI Ultra 计划,每天可生成的视频数量都非常有限。这使得用户在进行创作时需要更加谨慎,避免浪费宝贵的生成机会。
除了技术上的局限性,AI 视频生成还面临着一些伦理和社会挑战。
深度伪造技术的滥用是其中一个重要问题。AI 可以生成高度逼真的虚假视频,用于传播谣言、诽谤他人,甚至进行诈骗等违法犯罪活动。这给社会带来了极大的安全隐患。
内容版权问题也日益突出。AI 生成的视频可能包含受版权保护的音乐、图像等元素,未经授权的使用将构成侵权。如何平衡 AI 创作的自由与版权保护,是一个亟待解决的问题。
虚假信息的泛滥也值得警惕。AI 生成的逼真视频可能会被用于制造和传播虚假信息,误导公众,甚至引发社会动荡。这需要我们提高对 AI 生成内容的警惕性,加强信息甄别能力。
如何安全合理地使用AI视频生成技术?
面对 AI 视频生成技术带来的机遇与挑战,我们应该如何安全合理地使用它呢?
首先,要加强伦理道德建设。AI 开发者和用户都应自觉遵守法律法规和伦理规范,不利用 AI 技术从事违法犯罪活动,不制作和传播虚假信息,不侵犯他人权益。
其次,要完善监管机制。政府应加强对 AI 视频生成技术的监管,建立健全的法律法规,明确 AI 内容的法律责任,严厉打击利用 AI 技术进行违法犯罪活动的行为。
第三,要提高公众的媒介素养。通过教育和宣传,提高公众对 AI 生成内容的辨别能力,增强防范虚假信息和网络诈骗的意识。
第四,要加强技术创新。开发更安全、更可靠的 AI 技术,例如,通过数字水印、区块链等技术,对 AI 生成的内容进行溯源和认证,防止被篡改和滥用。
第五,要促进国际合作。AI 技术的发展具有全球性影响,各国应加强合作,共同应对 AI 带来的挑战,推动 AI 技术的健康发展。
AI视频生成的未来趋势
尽管目前 AI 视频生成技术还存在一些局限性和挑战,但其发展前景依然广阔。
随着技术的不断进步,AI 生成视频的质量将不断提高,分辨率将更高,时长将更长,内容将更加丰富多样。AI 将能够生成更加逼真、更具创意、更符合用户需求的视频内容。
AI 视频生成将更加智能化和个性化。AI 将能够根据用户的偏好和需求,自动生成个性化的视频内容,满足不同用户的需求。
AI 视频生成将与各行各业深度融合。AI 将被广泛应用于影视制作、广告营销、教育培训、新闻传播等领域,为各行业带来新的发展机遇。
AI 视频生成将推动内容创作方式的变革。AI 将成为内容创作者的得力助手,帮助他们更高效地创作出高质量的视频内容,降低创作门槛,激发创作灵感。
AI 视频生成也将带来新的商业模式。例如,AI 可以用于生成虚拟人物、虚拟场景等,为游戏、娱乐等行业提供新的内容和体验。
结论
Gemini 应用的照片转视频功能,是 AI 技术在视频创作领域的一次重要突破。它降低了视频创作的门槛,让更多人能够轻松地制作出精美的视频内容。然而,我们也必须清醒地认识到,AI 视频生成技术目前仍存在一些局限性和挑战。只有通过加强伦理道德建设、完善监管机制、提高公众媒介素养、加强技术创新和促进国际合作,才能确保 AI 视频生成技术得到安全合理的应用,为社会带来福祉。