在碎片化内容消费盛行的今天,短影像正以前所未有的速度占领用户注意力。2024年底,微短剧用户已达6.62亿,人均单日使用时长接近2小时。红果短剧月活用户从2024年12月的1.58亿飙升至2025年6月的2.1亿,首次超过主流长剧平台优酷。这一现象背后,不仅是内容消费习惯的变迁,更是技术驱动的生产力革命。
在这场变革中,AI视频生成技术正经历从'玩具'到'专业工具'的蜕变。商汤科技推出的Seko平台,作为行业首个创编一体的AI视频创作Agent,代表了这一领域的最新突破。它不是单一的'视频生成器',而是一个将视频创作全流程纳入其中的智能化生产线,正在重新定义短片创作的生产力边界。
从创意到成片:5分钟走完全流程
打开Seko平台的界面,简洁得几乎让人意外——几乎就是一个对话框。这种极简设计背后,是对视频创作本质的深刻理解。Seko的起手式同样简单:用户可以用自然语言描述故事大纲,上传已有角色,或选择喜欢的美术风格。
随后,Seko将复刻人类创意团队的完整工作流程,从'策划摘要'、'美术风格'、'角色主体'、'场景概念'、'音乐风格'到'分镜剧本',逐个展开——这正是剧本影视化的完整流程。更关键的是,用户可以通过自然语言指令,对任意环节进行实时干预和修改。
分镜设计:从剧本到视觉的跨越
传统流程中,分镜的成型和视频化是短片制作工作量最大的环节。一个职业分镜师使用专业软件,一天最多只能完成5分钟的分镜镜头。而Seko在这一环节的表现尤为惊艳。
从策划文档转入分镜生成后,Seko展现出天才般的分镜画师和掌控全局的AI导演能力。在分镜编辑器中,用户不仅可以调整图像尺寸、比例、横屏或竖屏,更关键的是每个分镜都可自由编辑,充分发挥创作者自主性。
Seko在配音部分提供'画外音'和'对口型'两种模型,多种音色可选,并实现了人物、动物角色,以及单人或多角色同时对口型、先后对口型等高难度需求。其分镜编辑器还提供首尾帧交互功能,只需简单选取下一个分镜做尾帧,就能孵化出中国风一镜到底的效果,轻松创造在小红书、抖音等平台传播的爆款内容。
专业镜头语言的AI实现
在用户王祉君用Seko创作的获奖短片《飞天计划》中,可以清晰看到同一场景中远景、中景和特写的递进变化。Seko能够通过镜头环绕拍摄、人物正反打、光线变化等效果,表现画面切换间的情绪变化。
这种专业镜头语言的实现,源于Seko背后大量影视行业knowhow的积累。从策划到成片,整个制作过程不到5分钟,流程丝滑,最终成片质量也反映出其专业水准。
将行业knowhow转化为产品优势
Seko的独特之处,不仅在于镜头语言的优化,更在于将影视团队共同打磨的专家经验内化于产品,解决视频创作领域的核心痛点。
一致性难题的突破
在多分镜中实现主体角色、场景、风格、光线等连续的一致性,是目前视频生成领域最大的痛点。在传统制作工业中,分镜是连接导演、编剧、摄影、美术、剪辑等所有部门的通用语言。单一的视频生成更像精美插图,展示的是AI理解prompt和生成连贯画面的能力;而分镜则是影视工业语境下的承上启下环节,关乎节奏、视角、连贯性和情绪流。
Seko在一致性表现上的突破,使其分镜真正嵌入到真实生产流程中,而不仅仅是作为静态展示。这种一致性保证了分镜画面能够无缝衔接,形成连贯的视频作品。
全流程可编辑能力
Seko全流程的可编辑能力,使其成为最靠近真实影视制作工业场景的产品。短剧和视频创作团队经常需要对作品进行细节修改和优化,确保所有镜头呈现都符合预期。Seko的整个创作流程都可被反复编辑,无论剧本策划、角色还是每个分镜画面,都能在不影响其他因素的情况下独立编辑,提高创作效率的同时确保内容可控性。
多模型自由选择
如果把可编辑性定义再拓展一些,Seko在模型调用上的自由选择或许是AI视频生成产品中潜力最大的一种可编辑性。Seko为创作者聚拢了市面上最强的生成模型阵容,包括自研模型以及可灵、即梦、海螺、Wan、Veo等。
支持从创建角色到分镜图生成再到视频生成的整个创意流程,并非依赖单一模型能力。在最终生成视频时,创作者可以在不同分镜分别选择擅长打斗效果的模型、擅长人物运动物理效果的模型、擅长首尾帧的模型、擅长动漫风格的模型。通过灵活调用,满足导演的风格和审美需求,同时根据不同模型消耗的积分差异,更灵活地控制制作成本。
专业场景的深度适配
一些深度合作的影视工作室已开始用Seko量产短剧和漫剧。通过融合大量专家经验以及与工作室共同打磨,Seko构建出符合影视行业视听语言的剧本生成策略,在机位、镜别、构图、运镜方式等方面优化,有效传达故事逻辑、表现情绪张力。
在短剧中高频的对话场景中,Seko不需要用户输入专业要求,就能直接产出过肩正反打镜头。在武打场面中,可以通过大远景交代环境、追逐跟随镜头、人物表情特写、多机位展现打斗过程等方式,营造完整专业的叙事场景。
工作流整合带来的生产力革命
Seko身上最鲜明的特质,是对'分工'和'可控'的强调。亚当·斯密在《国富论》中用制针工厂的经典例子说明:分工带来的效率奇迹。AI短片制作同样如此。
打破工具孤岛
传统AI短片制作由多个复杂环节组成,每个环节都像独立工作流。创作者需要在不同工具间切换:在语言模型中打磨剧本,用文生图模型形成分镜,用视频生成模型制作短镜头片段,最后调用语音模型处理配音配乐。任何想法变化都意味着整个流程重来,创作者只能在散落的创作工具中疲于奔命。
这也是为什么市场上AI短片作品虽多,但鲜有在剧情和制作上具备复杂度和深度的作品出现。各模态AI生成能力已有相当水准,创作者不缺好故事和创意,却被短片创作复杂而紧密联系的生产链路所牵制。
AI原生解决方案
Seko在产品设计逻辑上贴近短片制作分工逻辑,在技术底色上与单一模型能力解耦,跳出了AI生成能力作为制作工具的孤立角色,更像整合了短片创作所有工作流的AI原生解决方案。
同时,这一解决方案又是精准可控的。创作者能清晰观察需求是否被精准实现,可随时回到创作任一环节进行修改。对于专业视频内容创作者或制作方,Seko是动态、可协作的'视觉预演'沙盘,能快速验证镜头语言、光影氛围甚至表演节奏的可行性,将抽象剧本文字转化为具象视觉共识。
创作平权的实现
对于非专业视频创作者,Seko带来技术上的平权,让长于创意或文字叙事的人能越过繁琐技术壁垒,精准可控地将创意转化为视觉表达。这不仅降低创作门槛,更极大拓宽了创作主体和美学可能性。
行业变革的信号
Seko的出现,标志着AI视频生成领域正从'玩具'阶段迈向'专业工具'阶段。它不只是效率的提升工具,更是整个创作流程的重构者。通过整合影视行业knowhow、解决多分镜一致性难题、提供全流程可编辑能力,以及灵活调用多种生成模型,Seko重新定义了短片创作的生产力边界。
随着AI技术的不断进步,我们可以预见,未来的视频创作将更加智能化、个性化,创作门槛将进一步降低,而创作质量却会持续提升。Seko的实践证明,AI与人类的协作,而非替代,才是内容创作的未来方向。
在这场AI视频生成的重要变革中,Seko已经跨出了关键一步。它不仅改变了我们制作短片的方式,更在重塑我们对内容创作本身的认知和理解。