AI浏览器颠覆战:Genspark能否成为下一个Chrome?

1

在科技浪潮的推动下,人工智能(AI)正以惊人的速度渗透到我们生活的方方面面。从最初的AI搜索到如今的AI Agent,再到炙手可热的AI浏览器,每一次技术革新都伴随着行业的快速洗牌和用户体验的深刻变革。本文将深入探讨AI浏览器领域的最新进展,剖析Genspark等创新公司的发展战略,并展望AI技术在浏览器领域的未来应用前景。

4月份,Genspark凭借其强大的AI PPT功能崭露头角。仅仅两个月后,Genspark便迅速推出了自己的AI浏览器,这已是该公司在产品方向上的第二次重大转型。早在2024年,Genspark便以AI搜索为主要方向,并积累了500万用户。然而,在2025年,Genspark果断放弃了AI搜索,转而专注于AI Agent。这一决策的关键在于,Genspark团队认为传统AI搜索流程过于固定,无法有效应对复杂的任务。

AI行业的快速发展和激烈竞争可见一斑。稍有不慎,便可能落后于人。回顾过去一年,曾经风光无限的AI六小龙,如今也面临着不同程度的挑战。Genspark的发展历程,无疑是AI行业快速迭代的一个缩影。

Genspark Super Agent的推出取得了显著的成绩,上线45天ARR便达到了3600万美元。值得注意的是,ARR(年度经常性收入)是当前AI公司普遍采用的一种衡量指标,常用于评估SaaS公司的财务状况。简单来说,ARR可以被理解为公司全年的订阅收入,计算方法为“月订阅收入×12个月”。因此,Genspark的3600万美元并非实际收入,而是基于当月收入预测的全年收入。

按照Genspark每月25美元的订阅费用计算,大约有12万人付费订阅了该服务。业内人士认为,Genspark团队凭借着“内卷”精神,成功实现了对Manus的反超。那么,推出AI浏览器,是否会成为Genspark团队“逆袭”的关键一步呢?

AI浏览器的出现,无疑为用户带来了全新的体验。与传统浏览器相比,AI浏览器能够更智能地理解用户需求,并提供个性化的服务。然而,AI浏览器要真正颠覆现有市场格局,还需要在技术创新和用户体验方面不断突破。

AI浏览器的类型与特点

目前,AI浏览器可以分为两大类:一类是“传统浏览器+AI助手”,我称之为“被动式AI浏览器”。这类浏览器通常需要用户主动发起问题,AI主要负责信息的检索和归纳。例如,最近集成了Gemini对话功能的Chrome浏览器。

另一类AI浏览器则更加“AI native”,它们拥有更高的权限访问用户数据,并以此展开更多动作,相当于多了“眼睛”和“手脚”。这类AI浏览器能够更主动地为用户提供服务,例如自动执行任务、智能推荐等。

Genspark作为一家专注于AI Agent的公司,其AI浏览器在解决复杂问题方面表现出色。这得益于AI在内部分解问题、制定计划并在最少监督下逐步执行计划的能力。从这个角度来看,Genspark的AI浏览器颇具亮点。

初次使用Genspark浏览器时,用户需要提供个人信息,例如昵称、职业、个人资料以及期望Genspark具备的特质等。这样,AI便可以根据用户的个人信息给出更个性化、更准确的回复。

Genspark最强大的功能之一是“自动研究”。用户只需粘贴LinkedIn、Twitter或任何与个人相关的网页链接,Genspark便能根据用户的历史数据自动生成一份画像。

基于“眼睛”和“手脚”的能力,Genspark还开发了一些有趣的功能。例如“Find Best Deal”,当用户在购物网站上看中某款商品时,Genspark会自动搜寻全网最低价,并给出选购建议。甚至连eBay上的二手价格也会被考虑在内。

此外,Genspark还提供“电话代打”功能。用户可以让Genspark与真人打电话,例如预定餐厅或查询商店库存。一些日本用户甚至利用该功能来辞职或与恋人分手。

然而,由于网络环境的限制,这些与“现实世界”交互的功能在中国还无法使用。这意味着中国用户无法比较淘宝上的商品,也必须亲自与恋人打电话分手。

在生产力方面,Genspark的视频总结和PPT生成能力令人印象深刻。对于信息密度高的视频,Genspark不仅可以总结视频内容,还可以以此为基础生成一份PPT。例如,Genspark可以根据一段长达两个半小时的播客生成一份12页的PPT,内容涵盖各家公司论文的特点、对比分析以及总体总结。

这份PPT的结构清晰,视觉效果也完全可用。尽管用户没有完整地听完播客,但也能快速了解相关信息。而这一切都是AI在短短几分钟之内完成的。

Genspark还提供“为我下载”功能,用户只需输入提示词,便可以方便地下载视频中提到的论文。

当然,Genspark生成的PPT也存在一些问题,例如某些设计元素的过度使用,或者是一些表格设计得不够精细。这时,用户可以选择使用内置的编辑器进行修改,或者将PPT导入到Canva、Figma等专业软件中进行更高级的编辑。

Genspark在表格方面的能力也很强大。例如,用户可以让Genspark查找20个关于Genspark的YouTube视频、总结观看指标,并突出显示正面和负面的用户评论。Genspark罗列的数据清晰,负面评论也具有代表性,没有因为涉及自身而有所回避。

用户还可以上传PDF格式的产品报告,让AI自动提取关键数据,并生成相关的洞察分析。此外,Genspark还可以自动比较巴黎、罗马、阿姆斯特丹的7天旅行方案,并生成一个表格,甚至能考虑到“推荐季节”和“语言难度”等细节。

在收费方面,Genspark提供每天200免费积分,用户可以试用一些功能。对于重度用户,可以订阅每月25美元的套餐,包含10000积分和所有最新大模型的访问权限。

一些用户已经开始利用Genspark赚钱。一位SEO专家Julian Goldie在Reddit上分享,他用Genspark在15分钟内构建了一个原本需要3周开发时间的定制SEO工具。第二天,他就交付给了客户,赚了2500美元,足够订阅Genspark 10年。

Genspark还推出了AI文档功能,用户只需一句提示词,便可以生成调查问卷、餐厅菜单、简历等。至此,Genspark已经完成了PPT、表格、文档这Office三件套的搭建,并将目标用户瞄准了付费意愿最强的一群人。

从Genspark的产品形态来看,这是一家快速迭代、同时路线非常明确的公司。在积累500万用户时,果断放弃AI搜索,转向复杂任务的解决。接着做出超级智能体,秀肌肉的同时也是验证技术方向。到现在接连推出AI的Office三件套,就是面向付费意愿最强的用户,解决他们真实的问题。

当然,Genspark也并非没有缺点。这应该是一家工程师文化很强的公司,新功能的迭代速度很快。但带来的结果就是界面有些杂乱,或者说不够优雅,例如官网首页大面积的AI播客信息流。对于初次进入Genspark的用户来说,他们可能不太知道要做什么。很多好的功能都有一定的学习曲线,需要更好的引导与说明。

对于更深度的用户而言,历史记录的功能也有些难用。用户往往需要经过很多极菜单、打开了好几个网页之后,才能找到某一份AI生成的PPT。这其中,有一些用户友好的问题可以很快解决掉,但是更根本问题还是指向——AI native的App到底应该是什么样子。这个问题没有答案,整个业界也都在思考。

AI浏览器的未来

在AI Agent之后,AI浏览器已经变成了当下最热门的赛道。Manus、Genspark这类初创公司自不必提,腾讯的QQ浏览器、阿里的夸克、字节的豆包,以及Edge、Chrome这些老牌浏览器,都或多或少在向AI浏览器的形态迁移。

为什么是浏览器?首先,它是互联网时代的入口。回顾历史,入口生意是一门好生意。每一个过路的人都自然而然地会上缴过路费,每一个把持着入口的公司在今天都是几万亿市值的科技巨头。互联网时代是拥有IE浏览器的微软、Chrome的谷歌,移动互联网时代是苹果。直到今天,谷歌公司绝大部分收入都还是通过搜索引擎的广告模式带来的。

尽管今天绝大部分用户的注意力已经被手机所攫取,但是回归到生产力领域,桌面平台几乎还是唯一选择。

而新技术——大模型的出现,给新玩家带来了可能性:“也许,我们可以颠覆掉这个领域的巨头Chrome”。

但,我可能还是会继续使用Chrome。首先是习惯。养成一个习惯需要21天,即使我起心动念想要迁移到某个新浏览器,这21天中的每一秒我都有可能放弃。类似的情况并不是没有发生过,我一度尝试过迁移到Edge、Arc以及Dia。但是当我某一次偶然打开Chrome,那种行云流水的熟悉感又回来之后,Chrome就又变回了我的默认浏览器。

其次,AI行业的变化实在太快了。眼前这个AI浏览器有些功能真的做得很好,但你不知道明年这家公司是不是还活着;下个月是不是会有更强大的竞争对手出现。我的历史数据、插件、账号密码这些都会成为迁移的成本。

但是归根结底,现在的AI浏览器还不够好。不是比Chrome好上一点点,而是破坏式的好,是iPhone对诺基亚的那种好。

与此同时,Chrome也不是诺基亚,它并不差。它的困境,与技术、资金这些都没有关系,而是在于自己的历史包袱。