在碎片化内容消费时代,短视频正以前所未有的速度占据用户注意力。数据显示,微短剧用户在2024年底已达6.62亿,人均单日使用时长接近2小时。红果短剧月活用户从2024年12月的1.58亿飙升至2025年6月的2.1亿,首次超过主流长剧平台。与此同时,AI视频生成技术正从爱好者手中的新玩具,快速演变为专业内容创作的生产力工具。
在这一背景下,商汤科技推出的Seko作为行业首个创编一体的AI视频创作Agent,正重新定义短片创作的边界。它不是单一的'视频生成器',而是将视频创作全流程纳入其中的智能生产线,实现了从创意到成片的革命性效率提升。
5分钟走完全流程:AI如何拆解短片创作
打开Seko的界面,简洁到近乎极致——几乎只有一个对话框。这种极简设计背后,是AI对短片创作流程的深度重构。用户可以通过自然语言描述故事大纲,上传已有角色,或选择喜欢的美术风格,随即进入完整的创作流程。
Seko复刻了人类创意团队的全流程工作:从'策划摘要'、'美术风格'、'角色主体'、'场景概念'、'音乐风格'到'分镜剧本',几乎涵盖了剧本影视化的所有环节。更关键的是,用户可通过自然语言指令对任意环节进行实时干预和修改。
分镜设计:从脚本到视觉的桥梁
传统流程中,分镜设计是短片制作工作量最大的环节之一。一个专业分镜师使用storyboard pro,一天最多也只能完成不超过5分钟的分镜镜头。而Seko在这一环节展现出突破性能力。
进入分镜编辑器后,用户不仅可以调整图像尺寸、比例、横竖屏,更关键的是每个分镜都可自由编辑,充分发挥创作者自主性。Seko提供的'画外音'和'对口型'两种配音模型,支持多种音色选择,并能实现人物、动物角色,以及单人或多角色同时或先后对口型等高难度需求。
特别值得一提的是首尾帧交互功能。只需简单选取下一个分镜作为尾帧,即可孵化出中国风一镜到底效果,轻松创造出在小红书、抖音等平台传播的爆款内容。从故事到精致短片,整个制作过程不到5分钟。
镜头语言的AI优化
在个人用户@王祉君用Seko制作的获奖短片《飞天计划》中,我们可以清晰看到同一场景中远景、中景和特写的递进变化。Seko通过镜头环绕拍摄、人物正反打、光线变化等效果,实现画面切换间的情绪流动。
这种镜头语言的优化能力,源于Seko背后积累的影视行业knowhow。正是这些专业经验的数字化,使Seko能够将视频创作的诸多痛点转化为产品亮点。
行业Knowhow的产品化:从理论到实践
Seko最核心的创新在于将影视行业的专家经验内化为产品功能,解决了AI视频生成领域的多个关键痛点。
多分镜一致性的突破
在多分镜中实现主体角色、场景、风格、光线等连续的一致性,是目前视频生成领域最大的挑战。单一的视频生成更像动态插图,展示的是AI理解prompt和生成连贯画面的能力;而分镜则是影视工业语境下的承上启下环节,关乎节奏、视角、连贯性和情绪流。
Seko通过以下方式实现一致性突破:
- 角色一致性算法:采用先进的特征提取技术,确保角色在不同场景中保持面部特征、服装细节的一致性
- 场景连贯性技术:通过场景语义理解,维持场景元素的空间关系和视觉风格
- 风格一致性控制:建立风格向量空间,确保整体视觉调性的统一
全流程可编辑能力
Seko的全流程可编辑能力使其成为最接近真实影视制作工业场景的产品。短剧和视频创作团队常需要对作品进行细节修改,而Seko的整个创作流程都可被反复编辑——剧本策划、角色、每个分镜画面都可独立编辑,不影响其他因素。
这种可编辑性体现在多个层面:
- 内容级编辑:可直接修改分镜中的特定元素,如人物表情、道具位置等
- 流程级编辑:可返回任意创作环节进行修改,系统自动协调后续内容
- 参数级编辑:可调整生成参数,如光影强度、运动幅度等
多模型自由调用
Seko在模型调用上为创作者聚拢了市面上最强的生成模型阵容,包括自研模型及可灵、即梦、海螺、Wan、Veo等。这种多模型策略使创作者能在不同分镜选择最适合的模型:
- 打斗场景:选择擅长动作效果的模型
- 人物运动:选择擅长物理效果的模型
- 首尾帧:选择擅长连贯性的模型
- 特定风格:选择擅长该艺术风格的模型
这种灵活调用不仅满足导演的风格偏好,也因不同模型消耗积分不同,帮助创作者更灵活地控制制作成本。
工作流整合带来的生产力革命
Seko最鲜明的特质是对'分工'和'可控'的强调,这呼应了亚当·斯密在《国富论》中关于制针工厂的经典案例——分工带来的效率奇迹。
传统AI短片创作的困境
当前AI短片创作面临三大困境:
- 工具碎片化:创作者需要在语言模型中打磨剧本,用文生图模型形成分镜,用视频生成模型制作镜头片段,再用语音模型处理配音配乐
- 流程断裂:任意一点想法变化都意味着整个制作流程需要重来
- 质量局限:虽然各模态AI生成能力已有相当水准,但鲜有在剧情和制作上具备复杂度和深度的作品
Seko的解决方案
Seko通过以下方式解决这些困境:
- 工作流整合:将短片创作中所有工作流整合为一个AI原生解决方案
- 技术解耦:与单一模型能力解耦,灵活调用最适合的模型
- 实时协作:提供动态、可协作的'视觉预演'沙盘
双重用户价值
Seko为两类用户创造了不同价值:
对专业创作者:
- 快速验证镜头语言、光影氛围和表演节奏
- 将抽象剧本转化为具象视觉共识
- 降低试错成本,提高创作效率
对非专业创作者:
- 实现技术平权,越过技术壁垒
- 将创意和文字叙事精准转化为视觉表达
- 拓宽创作主体和美学可能性
未来展望:AI视频生成的新纪元
Seko的出现标志着AI视频生成领域迈出了重要一步。随着技术的不断进步,我们可以预见以下发展趋势:
- 更深度的行业融合:AI将更深入地理解特定行业的创作规范和审美标准
- 更强的交互能力:自然语言交互将更加精准,实现更复杂的创作意图
- 更低的创作门槛:非专业创作者将能创作出更高质量的专业级内容
- 更丰富的表现形式:AI将支持更多样化的视频形式和风格创新
Seko的成功证明了AI技术在内容创作领域的巨大潜力。它不仅提高了效率,更重新定义了创作的可能性边界。随着技术的不断演进,我们有理由相信,AI将成为内容创作不可或缺的伙伴,而不仅仅是工具。
结语
从'万元级每分钟'到'千元级别',从'5人一周'到'1人一天',Seko通过整合影视行业knowhow、解决多分镜一致性问题、提供全流程可编辑能力,以及灵活调用多种生成模型,彻底改变了短片创作的生产方式。
这不仅是一场效率革命,更是一次创作范式的转变。Seko让AI从'玩具'进化为'生产力工具',为专业创作者提供强大辅助,为非专业用户打开创意之门。随着技术的不断成熟,我们有理由期待AI视频生成将带来更加丰富多彩的内容世界。