李彦宏的非共识:百度大模型棋局背后的AI应用哲学

1

作为中国最早一批AI先行者,向来低调温和的李彦宏,在过去一年多来分外活跃,经常提出一些「与众不同」的观点。这些非共识的见解不仅引领了行业思考,更深刻影响着百度在大模型领域的战略布局。

一、不断验证的「非共识」

放眼国内,你可能很难找到比李彦宏更虔诚的AI信仰者。早在2012年百度就由李彦宏带队组建了国内最早的AI研究院,到了2019年前后,李彦宏的40次公开演讲、15万字,次次不离AI。作为全国政协委员,李彦宏更在连续8年的「两会」中,提出了13份AI相关提案。

自2022年底大模型爆发开始,李彦宏对AI的「布道」逐渐密集了起来。在大模型最热的时期,向来低调的李彦宏一改温和往日风格,直言「不断地重复开发各种各样的基础大模型,是对社会资源的一个极大浪费」。

这一观点与当时行业疯狂卷参数、卷数据训练的态势形成鲜明对比。红杉资本调查数据显示,去年英伟达芯片订单高达500亿美元,而整个生成式AI企业的收入才30亿美元,其中OpenAI等极少数头部玩家又拿走了绝大部分收入。

李彦宏认为,「要卷AI应用,不要重复造轮子」,「没有构建于基础模型之上的、丰富的AI原生应用生态,大模型就一文不值」。这一判断在随后的行业发展中得到了验证:美国做基础大模型的企业只剩下5家,国内不少头部大模型企业也罕见地不再谈AGI,转而分享落地方向和进展。

当应用开始被逐渐重视起来,很多人争相打造C端AI爆款,复制互联网时代「超级APP」的神话时,作为互联网时代最成功的创业者之一,李彦宏认为「大模型对于ToB业务的改造,比互联网对于ToB的影响力要大一个数量级」。

这一预判同样在随后的市场发展中得到印证。相比对大模型一时的兴趣,用户更关注产品的体验、内容的建设以及交互的便捷,这些能力的建设远非一朝一夕。而ToB领域的企业级应用则展现出更强的实用价值和商业潜力。

在应用下半场中,当很多人跟风造应用,摸不准方向时。李彦宏先注意到,下一个应用趋势将是智能体,而当时智能体在行业还算是新物种、非共识。与这种市场敏锐捕捉同时发生的,还有百度内部毫无偏差地执行。

李彦宏一直说大模型要卷应用,如今文心大模型发布近一年多来后,百度仍在持续致力于降低普通人开发应用的门槛。经过一年的实践,百度推出的智能体开发工具文心智能体平台已吸引15万家企业、80万名开发者。

二、如何打造「超级有用」的应用?

围绕「超级有用」,在刚刚结束的百度世界2024大会上,百度发布了最新的检索增强的文生图技术(iRAG)和无代码工具「秒哒」。

从行业角度看,过去两年,文本生成大模型基本消除了幻觉,回答问题的准确性大幅提升,但图像等多模态内容和RAG的结合还不够。比如让大模型生成一个北京天坛的照片,天坛是3层建筑,AI生成了4层——明显的信息错误,将限制多模态大模型的规模化应用。

AI生成的天坛图片

百度推出的iRAG依托百度搜索的亿万图片资源和强大的基础模型相结合就可以生成各种真实且准确的图片。这也不难理解,文图生成不精准,要么是大模型没有理解或者没有现有的图片参考,要么就是生成能力欠缺,百度的iRAG针对性解决的正是这两个问题。

根据测评,用户只需输入关键信息,如「帮我画一张马斯克和一只迅猛龙在后备箱里剥豆角」,立马可以获取一张信息无误、超真实的图片,即使该场景现实中不存在,也能生成特定人物和环境的图片。

AI生成的创意图片

相比过去千篇一律的漫画风、卡通风AI图像,这张照片不仅少了很多「AI味儿」,更是在真实度上有了巨大提升。优化大模型准确度,是为了更好应用落地。而围绕应用落地,智能体是目前李彦宏看好的赋能工具。

此前李彦宏曾预判,大模型发展要经历这么几个阶段:首先是Copilot阶段,需要人类进行辅助、把关后,才能交付成果;然后是Agent智能体,智能体最大的特点是有一定的自主性,具备自主使用工具、反思、自我进化等能力;最后是AI Worker,能够像人一样独立完成各种脑力和体力劳动。

而当下正处于Agent智能体阶段。「智能体相当于PC时代的网站和自媒体时代的账号,最明显的特点是门槛足够低,谁都能上手,天花板又足够高,可以做出非常复杂,非常强大的应用。」

基于这种低门槛与高天花板的思路,「无代码」工具「秒哒」应运而生。利用「秒哒」,用户只需要向大模型表达出需要的智能体工作流等信息,大模型就能直接生成代码构建专属智能体。

而且,该智能体还能充分调动、合理编排文心大模型内多种知识库、智能体和工具,比如网页检索、iRAG、地图API等,智能高效完成任务。也就是说,基于无代码产品,每个用户及企业都能通过自然语言交互,自己就可以搭建并指挥多个智能体协同完成任务,不需要基础的代码能力,也不需要项目经理、设计人员、开发人员、测试人员等专业人员,每个人都拥有程序员的能力。

至此,通过iRAG让大模型更精准、通过无代码让人人可上手,「一个前所未有的只靠想法就能赚钱的时代」已经正式完成从0到1的基础设施铺垫。

三、造一个新生态:从1到数百万背后的应用「哲学」

基础设施从0到1的铺垫之后,如何完成从1到100,再到100万乃至数百万的加速?重点在于生态。

于是,一个新的产业分工开始形成:基础设施的提供者们基于大模型的压强投入与海量的数据积累起了技术的钢铁长城;开发者们则凭借专业垂直的知识积累,补全技术落地的最后一块拼图。

AI生态分工示意图

在基础设施侧,截至11月初,百度文心大模型的日均调用量超15亿,相较5月披露的2亿,增长7.5倍,相较一年前首次披露的5000万次,更是增长约30倍,数据大超预期。

在产业应用方面,李彦宏也公布了百度的新进展,他现场发布了基于大模型的100大产业应用,涵盖制造、能源、交通、政务、金融、汽车、教育、互联网等众多行业。通过百度智能云千帆大模型平台,有60%的央国企和大量的民营企业都与百度智能云合作,累计帮助用户精调了3.3万个大模型,开发出了77万个企业级应用。

以百度和智联招聘合作为例。在企业的招聘中,往往面临着两大难题:用人部门提出的人才需求描述主观且模糊,HR无法据此得出可量化的简历挑选标准;与此同时,岗位分工逐渐细化,HR认知与岗位需求之间的鸿沟随之越来越大。

如果无法解决这两大问题,不仅会消耗HR的时间和精力,企业招聘周期变长,甚至错失人才也成为常态。通过自然语言对话获取求职者关键信息,结合岗位描述快速绘制精准匹配画像,精准推荐职位并筛选人才,提升用人和求职双方效率。

现在双方已合作沉淀出系列提示词模板,在数万条数据中验证,场景平均准确率高达93%,这无疑为招聘行业带来革新。

又比如客服领域,在当下,公司类智能体重要性不亚于传统互联网时代的公司官网,在公司基本信息、产品介绍、门店位置等传统官网具备的能力基础上,公司类智能体还具备主动推荐、及时响应和服务能力。百胜集团依托百度的客服产品和大模型能力打造的相关智能体,已经可以解决识别客户意图和上下文关联难题,并覆盖百胜全线业务,日会话峰值达数十万,调用量峰值数百万,问题解决率提升至90%。

李彦宏在大会现场展示的文心智能体平台上的TOP100智能体,既有农民院士智能体等角色类,也有工具、行业、职场、情感、娱乐等各类场景的智能体,涵盖各行各业应用的方方面面。此外百度发布了全新工具类智能体自由画布。

近日,沙利文发布报告《2024年全球AI生态全景概览》则对百度的AI生态建设成果做了精准总结,在全球AI生态全景中,百度与谷歌、OpenAI位于AI-Native Giant同一象限。

全球AI生态全景图

「以应用为核心」这即是百度做大模型初心,也是百度有了如今成果的军功章。

四、长期主义者的AI信仰

像一棵树一样,企业的成功,也是有年轮的。眼花缭乱的数字与层出不穷的产品只是最终的成果,真正的答案,藏在历史中那些幽微的思考与前行印记中。

2014年,风华正茂的百度,在太庙与美国的奇点大学进行了一场关于人工智能的主题分享。并现场提出一个判断:十年内,人工智能的发展将会迎来「奇点」,在此之后,人类的能力进化将永远迟滞于AI的边界扩张,即便是小公司,也能依靠人工智能与行业巨头站在同一竞技舞台。作为分享背景的则是夜幕降临下打在太庙墙上的巨大百度LOGO。

而那时的人工智能,既没有迎来AlphaGo大战李世石的举世瞩目,距离ChatGPT惊艳全人类也有八年之遥。但也正是在那个人工智能还无人问津的时刻,百度开始坚定投入AI研发,向大洋彼岸的尚未拿下诺贝尔奖的Geoff Hinton抛去橄榄枝,并由李彦宏亲自带队建立起了深度学习研究院,并在此后十年时间里,延揽「谷歌大脑之父」吴恩达等领军人才、发布「少帅计划」,年薪百万招募全球30岁以下的AI精英……搭建起了一个由芯片层、框架层、模型层以及应用层组合起来的完整AI技术架构。

百度深度学习研究院

这十二年的漫长探索,跨越了AI的多个发展周期,见证了从深度学习到大模型每一个关键发展阶段的潮起潮落,从深度学习平台到千帆平台、智能体开发平台再到如今的无代码工具,不变的是百度一直在用技术去解决实实在在的问题,将普通人开发应用的门槛打下来。

表面看,这是一个搜索起家在AI上拥有先手优势企业的顺势而为,内核里,却是百度对AI长期主义信仰的坚持。而在这一过程中,时间的价值就在于,在海面之上,用一盏灯点亮另一盏灯。基于百度AI架构的搭建起的AI生态,正如李彦宏所说,「我们即将迎来AI应用的群星闪耀时刻。每一个应用都是一颗星,每一个应用都将成为改变世界的力量。」