Seko AI:重新定义短片创作的全流程革命

1

在数字化浪潮席卷全球的今天,视频内容创作正经历着前所未有的变革。随着AI技术的迅猛发展,AI视频生成产品已从最初的新奇玩具,逐步向专业内容创作领域渗透。在这一背景下,商汤科技推出的Seko AI作为行业首发的创编一体AI视频创作Agent,正试图重新定义短片创作的边界,将复杂的影视制作流程简化为普通人也能掌握的创作体验。

从碎片化消费到短影像崛起

人们的生活被分割得愈发碎片化,内容消费比以往任何时候都更坚定地向短影像方向演进。微短剧用户在2024年底已达到6.62亿,微短剧独立APP的人均单日使用时长也涨到了接近2小时。红果短剧的月活用户规模在2024年12月已达1.58亿,到2025年6月更是增长至2.1亿,首次超过主流长剧APP优酷。

这种短影像的崛起并非偶然,而是反映了当代受众对内容消费习惯的根本转变。与此同时,AI技术向生产力工具的转变,也总是发生在当下最热闹的场景中。从去年到今年,AI视频生成逐渐成为大模型浪潮中最具活力的方向之一,视频生成产品的迭代方向也慢慢从AI爱好者手中的新玩具,向专业内容创作者和短剧、漫剧等剧集制作工业靠近。

然而,即使AI技术在视频生成领域取得了显著进展,其对短片制作的能力加持,很多时候仍然被孤立地安放在各个不同的环节上。从策划、剧本创作、选角到拍摄、后期制作、配音等,即便是最轻松的短剧,这套流程的效率和成本压力仍然巨大。

Seko:全流程AI视频创作解决方案

面对这一行业痛点,商汤科技推出了Seko——一个将视频创作全流程都纳入进来的AI视频创作Agent。Seko不是单一的"视频生成器",而是一个将视频创作全流程都整合起来的生产线,基于自然语言交互实现全流程视频创作。

根据实际用户反馈,Seko已经带来了巨大的效率提升。过去需要5人一周完成的工作量,现在1人一天即可完成;"万元级每分钟"的动画视频,成本现在可以降至千元级别。目前,上线一个多月的Seko已迅速积累超10万专业用户,累计生成视频超过50万条,越来越多在短剧工作室、广告公司、MCN机构,以及普通创作者和非专业用户都开始使用Seko。

5分钟走完全流程:AI如何拆解一部短片

带着"制作短片"的目标打开Seko,用户会被其简洁的界面所惊讶——几乎就是一个对话框。Seko的起手式很简单:用户可以选择用自然语言描述故事大纲,或者上传自己已有的角色,也可以选择喜欢的美术风格。

随后,Seko将复刻人类创意团队的工作流程,从"策划摘要"、"美术风格"、"角色主体"、"场景概念"、"音乐风格"、"分镜剧本"的策划逐个展开——这也是剧本影视化的完整流程。用户还可以通过自然语言指令,完成对任意环节的实时干预和修改。

完成所有策划后,Seko正式进入分镜设计环节。传统流程中,分镜的成型和视频化是短片制作工作量最大的环节。一个职业分镜师用storyboard pro一天只能画出不超过5分钟的分镜镜头。而Seko则能高效完成这一工作,并在此基础上提供更多可能性。

在分镜编辑器界面中,用户不仅可以调整图像的尺寸、比例、横屏或竖屏,更关键的是每一个分镜都实现了可自由编辑,让创作者可以充分发挥自主性,实现心目中的理想效果。

Seko在配音部分提供了"画外音"和"对口型"两种模型,有多种音色可选。特别实现了人物、动物角色,以及单人或多角色同时对口型、先后对口型等高难度需求。分镜编辑器还提供了首尾帧交互功能,只需简单地选取下一个分镜做尾帧,就可以孵化出中国风一镜到底的效果,轻松创造出在小红书、抖音以及短剧中传播的爆款内容。

从故事到精致短片,整个制作过程不到5分钟。个人用户王祉君用Seko制作的创作大赛获奖短片《飞天计划》中,可以清晰看到同一场景中远景、中景和特写之间的递进变化,Seko能够用镜头环绕拍摄、人物正反打、光线变化等效果来表现画面切换之间的情绪变化。

将行业knowhow转化为产品亮点

Seko的强大之处不仅在于其全流程整合能力,更在于它将大量影视行业knowhow内化到产品中,解决了视频创作领域的诸多痛点。

多分镜一致性的突破

在多分镜中实现主体角色、场景、风格、光线等连续的一致性,是目前视频生成领域最大的痛点。在影视制作工业中,分镜是连接导演、编剧、摄影、美术、剪辑等所有部门的通用语言。单一的视频生成更像是一个动态的精美插图,展示的是AI理解prompt和生成连贯画面的能力;而分镜则是影视工业语境下的承上启下环节,关乎节奏、视角、连贯性和情绪流,最终要为连贯的视频作品服务。

Seko在一致性表现上令人惊艳,使得这些分镜画面真正意义上嵌入了真实的生产流程。

全流程可编辑能力

Seko全流程的可编辑能力让它成为最靠近真实影视制作工业场景的AI视频生成产品。短剧和视频创作团队经常需要对作品进行细节修改和优化,确保所有镜头呈现都符合预期。而Seko的整个创作流程都可以被反复编辑,无论剧本策划、角色,还是每一个分镜画面都可以在不影响其他因素的情况下,独立进行编辑,提高了创作效率,同时确保创作内容的可控性。

多模型自由选择的创新

如果把可编辑性定义再拓展一些,多种模型的自由选择或许是AI视频生成产品中潜力最大的一种可编辑性。Seko为创作者聚拢了市面上最强的生成模型阵容,包括自研模型以及可灵、即梦、海螺、Wan、Veo等。

支持从创建角色到分镜图生成,再到视频生成这整个创意流程的,并不是单一的模型能力。在最终生成视频时,创作者可以在不同分镜分别选择擅长打斗效果的模型、擅长人物运动物理效果的模型、擅长首尾帧的模型、擅长动漫风格的模型。通过灵活调用,满足导演的风格和审美需求偏好。同时,由于不同模型消耗的积分不同,创作者也可以更灵活地控制制作成本。

目前,一些深度合作的影视工作室已经在用Seko量产短剧和漫剧。Seko通过融合大量专家经验以及与工作室共同打磨,构建出了一套符合影视行业视听语言的剧本生成策略,在机位、镜别、构图、运镜方式等方面优化,有效传达故事逻辑、表现情绪张力。比如在短剧中高频的对话场景中,不需要用户输入专业要求,就可以直接产出过肩正反打镜头;在武打场面中,可以通过大远景交代环境、追逐跟随镜头、人物表情特写、多机位展现打斗过程等方式,营造完整专业的叙事场景。

工作流整合带来的生产力革命

Seko身上最鲜明的特质,是对"分工"和"可控"的强调。亚当·斯密在《国富论》中用制针工厂举过经典例子:一个工人独立完成所有工序,一天可能连一根针都造不出来;而将制针过程分为18道工序,由不同工人专门负责,平均每人每天可以生产成千上万根针。这就是分工带来的效率奇迹。

每一次工业革命本质上都是一场由技术革新发起,最终在精细分工中改变世界效率的革命。AI短片制作由多个复杂环节组成,每个单一环节都像是一个独立的工作流。创作者需要在一个语言模型产品中打磨剧本和人物关系,然后用文生图的多模态模型形成分镜,最后用视频生成模型形成短镜头片段组成短片;而在视觉画面之外,配音和配乐则需要另外调用语音模型。任意一点想法上的变化都意味着整个制作流程需要重来一遍,而创作者只能在这些散落的创作工具中疲于奔命。

这也是为什么AI短片这个火热的内容方向,虽然市场上每天都有大量新作品出现,但鲜有在剧情和制作上具备一定复杂度和深度的作品出现。虽然各个模态下的AI生成能力已经有相当水准,创作者也不缺好的故事和创意,但双方却被短片创作极度复杂而又紧密联系的内容生产链路所牵制。

Seko在产品设计逻辑上贴近短片制作分工逻辑,在技术底色上与单一的模型能力解耦,第一次跳出了AI生成能力作为制作工具的孤立角色,更像整合了短片创作中所有工作流的一个AI原生解决方案。

同时,这个解决方案又是精准可控的。创作者在创作过程中可以清晰地观察到自己需求是否被精准实现,也可以随时回到短片创作的任何一个环节对生成内容做进一步修改。

对于专业视频内容创作者或剧本制作方来说,Seko的角色是一个动态的、可协作的"视觉预演"沙盘,能借此快速验证镜头语言、光影氛围甚至表演节奏的可行性,将抽象的剧本文字转化为具象的视觉共识;而对于非专业视频创作者来说,Seko带来了一种技术上的平权,让长于创意或文字叙事的人能够越过繁琐的技术壁垒,精准可控地将其转化为视觉表达。这不只是创作门槛的降低,更是创作主体和美学可能性上的极大拓宽。

结语:AI视频生成的新时代

Seko的出现标志着AI视频生成领域从技术展示向实用生产力的重要转变。通过整合全流程创作能力、实现多分镜一致性、提供全流程可编辑性,以及支持多模型自由选择,Seko正在重新定义短片创作的可能性边界。

随着AI技术的不断进步和应用的深入,我们可以预见,未来的视频创作将更加智能化、个性化,同时也更加民主化。Seko所代表的工作流整合思路,或许将成为AI视频生成领域的主流方向,为内容创作者提供更强大的工具,同时也为观众带来更加丰富多样的视觉体验。

这不仅仅是技术的进步,更是创作理念的革新。在AI的辅助下,创意的表达将不再受限于技术和资源的限制,每个人都可以成为自己故事的导演。这或许就是Seko带给整个行业最宝贵的启示——技术的最终目的,是服务于人的创造力,而非取代它。