在AI技术迅猛发展的今天,工作流自动化工具正经历着前所未有的变革。传统工具如n8n、Dify等虽然功能强大,但对非技术用户而言搭建门槛依然过高。与此同时,以Manus为代表的纯Agent形态工具虽灵活却缺乏稳定性。在这一背景下,Refly.AI创始人黄巍提出了革命性的"Vibe Workflow"概念,试图将Agent的智能性与传统Workflow的可控性完美结合,打造一款真正适合大众使用的AI原生工作流工具。
Vibe Workflow:Agent的智能+Workflow的可控
从AGI发展主线来看,工作流工具呈现两极分化趋势:一端是以Manus为代表的Agent形态,本质上是基于自然语言驱动的Workflow系统;另一端则是以n8n、Dify或纯代码为代表的传统Workflow,更强调精确性和程序行为的细致建模。
在实际使用中,这两种工具都存在明显缺陷。Manus虽然灵活,但整体成本高、稳定性不足、执行时间难以预期,且同一位用户多次提交相同指令时,产出结果往往不一致。而在n8n或Dify等工具中,一旦流程稍微复杂,就需要通过编写代码来维护if-else等控制逻辑,对非程序员用户极不友好,抬高了使用门槛。
Refly.AI的解决方案是将Agent和Workflow有机结合,创造出独特的"Vibe Workflow"概念。其核心特点主要体现在几个层面:
搭建成本无限降低:用户只需一句话即可搭建复杂Workflow。Refly.AI通过将Agent进行"白盒化",提供了一套"Agent Editor",并对Workflow底层结构进行了重构。每个节点本身都是一个Agent,用户只需为其编写prompt、选择合适的tools,系统即可完成多步规划与问题求解。相比之下,传统Workflow中的单个节点往往只负责调用一个API或执行一段代码。
简化复杂逻辑:Refly.AI给每个Agent配备了一台"沙箱",让它能够操作电脑去写代码、根据提供的tools做数据拉取等操作,再进行可视化呈现,从而解决if-else逻辑问题。传统Workflow中复杂的code流程,现在都可以简化为一个节点。内部测试显示,在相同任务下,一个Refly.AI节点可以替代大约20个n8n节点的功能。
自然语言交互:用户面向的Workflow被极大简化,所有操作都是自然语言表达,无需理解搭建逻辑。同时,每个节点任务被设计得足够简单,即使像Kimi K2这样的模型也能近乎100%完美解决问题。通过稳定的编排引擎串联这些简单节点,Refly.AI理论上可以解决无限复杂的问题。

Refly.AI的交互形式
成本与稳定性的精妙平衡
当每个节点都是一个Agent时,成本问题自然成为关注的焦点。与传统n8n相比,Refly.AI的成本控制策略颇具创新性。
在搭建层面,通过copilot配合,用n8n搭建一个8到10个节点的流程可能需要3到6小时,加上调试成本,估计至少消耗大几十万token。而在Refly.AI中,一句话生成Workflow本身消耗的token非常低,可能只需几千甚至上万个token,Kimi K2这样的模型已经能够很好地完成这个任务。
在执行层面,Refly.AI通过将每个任务简化为简短具体的Prompt,确保可一次性执行完毕,仅消耗1至2个积分,成本约0.1至1元。相比Manus单任务数美元的成本,这降低了至少5至7倍。更重要的是,其他人可以复用这些成果,后续调用时token消耗可能仅为原本的50%甚至10%。
然而,Agent节点带来的不确定性也不容忽视。传统n8n的很多节点有确定的结果,而Refly.AI的workflow包含四五个Agent节点,如果每个节点输出确定性达不到100%,整体折损就会比较大。对此,黄巍坦言这是产品选择上的一个折中:既然选择了Vibe Workflow并且每个节点都是Agent,肯定达不到n8n的准确度。
Refly.AI的核心策略是通过大幅降低使用成本与门槛,来平衡用户对准确率的诉求。本质上,这是试图用门槛降低10倍的优势,去换取稳定性降低1到2倍的代价。Refly.AI的场景定位与n8n也有所不同——n8n多用于RSS监听与分析,而Refly.AI更强调内容产出,用户可以组合多模态、音频、视频模型,产出一篇报告或一个数字人视频。这些模态对准确率的要求不高,只要70%内容是对的,听上去有用,用户就觉得OK。
Refly.AI完全放弃了需要100%稳定性的企业自动化操作场景,虽然也是workflow,但更强调为用户产出一个创作结果,比如小红书文案或概念讲解PPT,用户获取结果后可下载并进行二次微调。黄巍表示:"我们希望为用户提供80%有用的结果,用户愿意为它付费,并做二次编辑。未来我们还会提供大量的编辑能力,让用户闭环地完成编辑工作。"
用户画像与场景定位
基于上述产品定位,Refly.AI目前定义的核心用户画像主要集中在三类群体:
有经验的Workflow用户:早期,Refly.AI更倾向于那些有n8n、Dify使用经验,但觉得搭建很复杂,或在寻求简单替代方案的用户。这群用户可能曾经使用过他人的Workflow,或复刻某个大V的Workflow,觉得挺好用但自己不会改。为此,Refly.AI在产品设计中特别加入了一键迁移功能,用户可以将n8n、Claude Skills或其他Workflow平台的内容导入到Refly.AI平台运行。
自媒体创作者:这是Refly.AI重点关注的第二波用户群体。随着模型每天都在更新(今天是Gemini,明天是Claude Opus),很多自媒体用户希望将这些模型串联起来,比如把Claude Opus和Gemini串成两到三个节点的工作流,做一个完整的产出,然后拿它去写文章、录视频。此外,还有许多用户面临跟热点压力大的问题,希望通过Refly.AI搭建工作流,每天自动抓热点,按照自己的风格批量生成内容,然后进行推广和投放。
职场与专业用户:在自媒体场景打透的基础上,Refly.AI计划向外扩张至教育场景、职场白领场景(如写报告、监控内容、做产品分析)以及偏金融场景(如基于财报发布,用"巴菲特视角"写财报分析)。这些场景的共同特点是偏赚钱、偏职场、偏教育,具有较高的ROI和放大效应。
黄巍特别强调:"如果有一个自媒体用户觉得这个工具有价值,用起来了,其实就相当于把他的粉丝一并覆盖和辐射到了。这也是我们早期重点面向的用户群。在这个基础上,如果我们能把自媒体场景打深打透,还可以继续向外扩张。"
用户行为数据:真正的数据飞轮
Refly.AI的创新之处不仅在于技术实现,更在于其对"数据飞轮"的独特理解。黄巍指出:"从长期来看,理想状态当然是用户只需要说一句话,系统就能端到端帮他把事情做完。但就目前来说,大家对模型的发展和能力边界都有一个基本共识:模型可以解决一部分问题,但仍然离不开人的参与。"
在Refly.AI的架构中,用户在跟AI交互的过程中,实际上是在同步沉淀知识+行为。以"抓Product Hunt上的内容发到自己邮箱"为例,用户会不断表达个性化偏好:想抓周榜、日榜还是月榜?希望抓完之后不仅生成音频,还想生成一个"双口相声"版本?这些preference构成了用户和Workflow之间的一种"个性化经验+action"。
对平台而言,最有价值的数据是用户如何围绕一个任务完成一系列行为。这类似于DeepSeek提出的"思维链数据":模型在完成一个任务时,每一步的思考和执行路径。Refly.AI帮助用户沉淀这种"思维链行为数据"。
黄巍进一步解释:"一个用户在工作场景中的思维模式,其实是相对有限且可枚举的。比如一个内容工作者,日常工作大体就是几条路径:关注热点→做选题→产出内容→做分发。这些行为是可以被枚举出来的。这意味着,一旦平台能够把你的这些行为路径都枚举出来,真正感知到你作为内容创作者在这个环境里可能产生的各种动作,我们就可以对'你这个人'做一个建模:在下一个时间点,出现类似情境时,你大概率会采取什么action,我们是可以去做'predict next action'的。"

Refly.AI目前推荐的Workflow模板
当数据量足够大,配合持续的算法设计和尝试,Refly.AI有望实现更长远的目标:在未来的移动端场景里,用户只需要表达一句话,就可以真正实现端到端、无接管地完成任务,而且结果是高度符合个人习惯和预期的——因为平台掌握的是用户最关键的行为数据。
黄巍强调:"Workflow只是我们现阶段切入这个事情的一种方式,它既是一种切入方式,也是收集用户action和思维链数据的最好方式。我们是在搭建一个环境,用来收集用户最有价值的数据。如果只是一款chatbot产品,跟用户简单聊几句,没有任何真实的行为交互,你几乎收集不到他的行为数据。"
从画布到Workflow的产品演进
Refly.AI的产品形态并非一蹴而就,而是经历了多次迭代和演进。黄巍分享道:"这个产品形态,跟我之前在飞书的经历有很大关系。我在飞书负责过字节最早一批'大模型+低代码+Workflow'的项目Aily。所以,我们这批人对'AI+Workflow'有比较系统的认知。"
在飞书期间,黄巍经历了第一代低代码Workflow的全链路:数据建模、流程编排、界面搭建、发布运营和权限体系。第二阶段,他们尝试用AI重构低代码的所有模块,包括AI生成数据模型、生成流程、生成界面,甚至生成全栈应用。这一方向产品化后变成了Aily,团队当时判断:在AI时代,低代码会长出一种新形态——只要有一个足够强的Workflow,就能承载搭建App的全过程。
然而,产品对外后,他们发现一个现实问题:即使给Workflow加了AI,普通用户依然用不起来。本质形态还是传统Workflow,只是加了一些AI节点,更像是n8n的进化版。黄巍总结了两点关键认知:
- Workflow的价值是确定的,但要真正规模化,一定要让普通人能用得上;
- 用户愿意为"先进的生产经验和流程"付费——飞书之所以能卖出去,很重要的一点是,大家希望买到的是字节跳动这家公司的先进流程。
这也是Refly.AI商业化的核心假设:如果一个流程本身有价值,把它封装起来,是可以被规模化销售的。
创业初期,黄巍团队从更小的切口做起:围绕"用户的context很有价值"这一命题,做了一个剪藏插件,让用户保存文章,再基于文章做总结和每日归档。后来发现最大的问题是data connection很难规模化,这条路就暂时放下了。随着ChatGPT Canvas和Claude Artifacts的出现,他们转向"画布"形态,产品迅速走红并顺利融资。
融资后,黄巍开始反思:"虽然有一批愿意付费的用户,但大多是专业用户,小白用户还是看不懂、用不顺。这时候我们有了资源,就回到最初想做的事情——Workflow。"
从"深度画布"到"可落地的Workflow",再到"把Workflow封装成一个个模板",Refly.AI通过一系列演进,一边降低复杂度,一边放大使用的泛化性,让"AI+Workflow"真正有机会被更广泛的人用起来。黄巍表示:"大部分用户只需要消费别人封装好的流程,少部分高阶用户来生产和分享流程。通过这一系列演进,我们一边降低复杂度,一边放大使用的泛化性,让'AI+Workflow'真正有机会被更广泛的人用起来。"
团队建设:不相信"一人公司"的通才理论
Refly.AI目前拥有十三四人的团队,其构建过程经历了多次调整和反思。黄巍坦言团队在测试环节上踩过很大的坑:"我之前在公司里很多角色都干过,唯独没做过测试,写代码也基本不写测试,所以一开始对测试的价值是有偏见的。"
扩团队时,黄巍理想中的研发同学是那种端到端的人:既懂用户需求,又能写代码、自己测、自己上线,看结果复盘。但后来发现,这种人早期很难大规模招到。更麻烦的是,Refly.AI的产品因为是Workflow,非常复杂,导致bug频发。痛定思痛后,他们决定招专职测试人员,"两天之内就招到了人,进来之后,整个节奏立刻不一样:测试同学每天push我们修问题,产品质量稳定性肉眼可见地上来了。"
这次经历让黄巍深刻认识到:"现在大家鼓吹的所谓'一人公司',或者一个人可以把所有事情干完,我觉得是很美好的愿望。但互联网分工这套方法论,已经被无数家公司验证过,我们不应该把它丢弃掉。"
Refly.AI现在的团队构建原则是:
- 在"非重度"方向,每个方向至少招一个特别优秀的人,把这件事完整跑通,只有在确实需要扩张时才上第二个、第三个;
- 在"重度"方向,比如研发、算法、模型调优,会投入更多人力。
当前团队分工大致为:所有方向上至少有一个能把事情落地的人;在研发层面,一部分人做偏运营向的开发(约两人);做模型和工程调优的,两到三人;做底层的workflow和tools基座开发的,三到四人。
面对AI时代是否应招募通才的讨论,黄巍有着自己的见解:"通才当然重要,但前提是你真的能招到通才。这有点像'通用agent'——大家都在说,但现实里没那么多。现实情况是,模型的能力没有大家鼓吹的那么厉害,没达到替代一个人的地步。"
Refly.AI的实践是:招专才,并且是非常专、非常优秀的人,给他们配备最强大的AI工具,让他们把事情做到之前3到5倍甚至10倍的效果。黄巍举例道:"比如我们招一个设计同学,给他配非常完备的AI工具,他只需要专注在把整个产品的框架设计好,尽量的兼容通用,其他的细节可以让AI帮他完成。我们觉得这种是一种非常高效率的协作方式。"
技术壁垒与模型边界的把握
对于Refly.AI的核心壁垒,黄巍认为现阶段技术壁垒更为明显:"首先,我们可能是这个地球上最懂'AI+Workflow'的那批人。第二,我们在正式对外之前,已经组建了一支非常能打仗的团队。"
Refly.AI的产品设计遵循一个核心原则:AI越往前走,真正有价值的产品,一定是在非常复杂的系统工程之上,让用户"感知到的体验"尽可能简单。黄巍解释:"不是说产品本身要做成一个很简单的小玩具,而是底层可以极其复杂,但呈现给用户的路径要是顺滑、低门槛的。这中间要始终顺着AI能力的演进做设计,而不是逆势搞一些反人性的形态。"
以目前的工程复杂度,任何一家小公司很难在3-6个月之内超过Refly.AI。即便短期某些功能形态看上去追上来了,也很难知道下一步会做什么迭代。对大厂而言,要在内部复刻一个同等复杂的系统,至少得拉一个50-100人的团队,全力干一两年。因此,Refly.AI给自己留出了3-6个月的"加速窗口期"。
关于是否会被某一模型厂商绑架的担忧,黄巍表示反而可以说,Refly.AI的做法在某种意义上是偏"激进"的:"无论未来模型怎么迭代,我们都是在模型之上再加了一层抽象,相当于'站在模型肩膀上':模型越强,我们越强;模型越便宜,我们越便宜。同时,我们还会沉淀自己的行为数据,可以进一步优化自研模型和商业模式。"
更重要的是,这个抽象层可以天然兼容不同模型、不同模态,统一放到同一套workflow架构里,完成数据的INPUT、PROCESS和OUTPUT。这让Refly.AI不会被某一个模型厂商锁死。
黄巍认为,不被模型取代的关键在于认识到模型的边界:"模型厂商非常懂模型,他只切了他看起来显而易见的那部分能力。但实际上,模型是一个巨大的宝藏,你可以从里面剥离出对你这个行业最有价值的那部分能力。比如我们做Vibe Workflow,是因为当时看到一个趋势,GPT-5发布之后,ChatGPT把所有的功能选择都收到了一个按钮里,希望用户只需要表达需求,它自动做路由。"
Refly.AI的策略是挑选一个差异化的赛道,在这个赛道里面做到最大:"不要去打模型厂商的主方向,你从里面抽点皮毛出来,把你这个产品做好,至少也是一个几十亿、数百亿美金的规模。早期你的野心不要那么大,能做到Canva那样,就意味着我们的目标没有那么高,我们也可以切到模型的一个切面,切到自己的一块肉。"
创业哲学:慢一点,但别做错事
谈及Refly.AI的终局,黄巍描绘了两个可能的愿景:短期内,它有可能成为一个AI原生的内容平台;长期来看,则是构建一个用户的数字化版本,能帮助用户进入到物理世界去干一些事情。
"短期内,我们希望可能是在做一个AI原生内容平台的机会。但更加现实一点,我们就是在卖模板,做一个很土的生意,卖AI时代的Workflow模板。"黄巍坦言。
对于明年AI行业的发展趋势,黄巍特别关注两个方向:一是让"修小问题"这件事真正被AI自动化掉;二是模型在"编辑能力"上的进步,而不只是生成。"现在模型在生成上已经很强了,但生成完一个PPT、视频或网页之后,我还要为它造一个编辑器,让用户去细调。如果未来模型能以很低的成本精准理解input,做细粒度的编辑,那么Refly.AI这类工具的上限会被大幅抬高。"
黄巍认为,一旦模型的编辑能力变得非常强,未来所有内容的载体其实都是一条流程,这会催生出一个AI-native的原生内容平台。"这个内容平台相比之前最大的变化就是,它的内容是实时生产、实时更新,并且每个内容都可以由人去做个性化甚至'入镜',按需消费。"
对于其他AI应用创业者,黄巍提出了三点建议:
拉长时间维度:"看一个事情,可能要把它拉长到一个维度去看。一个事情在半年这个维度可能看上去很有价值,但拉到1~2年,你要问自己:这个产品还能活吗?早期可以慢一点,关键是'别做错事'。"
跑赢模型迭代:"产品一定要比模型的能力迭代要快3-6个月,并且要在3-6个月之内把自己的想法实践落地,并推向市场和商业化。如果我们能不断地重复这样的周期,我们就能跑赢这个市场,跑赢模型厂商。"
团队构建策略:"早期一定不要有偏见。历史上被证明有价值的分工和合作一定有它的道理,存在即合理。早期一定要找到那种价值观和想法对齐的团队,而不是一味地去看名校背景或光鲜履历。真正能打仗的人,他不一定是履历光鲜的,可能就是普普通通,但他确实能把事情干成。"
结语:AI原生工作流的未来
Refly.AI的Vibe Workflow代表了一种全新的工作流范式,它成功地将Agent的智能性与传统Workflow的可控性相结合,创造出了更适合大众使用的AI原生工具。通过将每个节点升级为独立Agent并配备2-3个工具,Refly.AI不仅大幅降低了工作流搭建门槛,还通过收集用户行为数据构建了独特的"数据飞轮"效应。
与传统工具n8n相比,Refly.AI在搭建成本上降低了90%,执行效率提升了5-7倍,更重要的是,它让非技术用户也能轻松创建复杂的工作流。这种创新不仅改变了工作流工具的格局,也为AI原生应用的发展提供了新的思路。
随着AI技术的不断进步,工作流自动化工具将继续演化。Refly.AI的实践表明,未来的AI原生工作流工具将更加注重用户体验的简化,同时保持底层技术的复杂性。通过"站在模型肩膀上"的策略,Refly.AI有望在AI原生工作流领域持续引领创新,为用户创造更大价值。
正如黄巍所言:"AI最大的能力在于它可以生成内容,以及它的主动性和自动化。那未来的AI内容平台,是不是内容可以极度个性化地定制?用户表达一句话可以生成内容,并对它做编辑、消费和修改。"这或许正是AI原生工作流工具的终极愿景——让每个人都能轻松驾驭AI的力量,实现创意与效率的完美结合。


