最近,OpenAI终于揭开了GPT-4.5(内部代号Orion)的神秘面纱。然而,这次更新却在AI圈内掀起了轩然大波,甚至被戏称为“AI史上最奇葩的一次重大更新”。这究竟是怎么回事呢?
“无聊”的性能提升
按理说,作为GPT-4的升级版,GPT-4.5的性能应该有质的飞跃。然而,事实并非如此。
据OpenAI官方透露,GPT-4.5的预训练计算量是GPT-4的10倍!但如此巨大的投入,换来的却是基准测试仅比GPT-4o高出5%的尴尬结果。在代码测试方面,GPT-4.5的表现也只能说是“中规中矩”,超过了Claude 3.5,却又不及Claude 3.7。
如此“感人”的性能提升,让不少业内人士大跌眼镜。有人调侃道:“这哪是升级,简直是‘挤牙膏’啊!”
“共情”大于“解题”?
面对外界的质疑,OpenAI的CEO Sam Altman这样解释:GPT-4.5带来了“微妙的提升”,虽然在数学、代码等硬核推理领域并不出彩,但在理解人类意图和情感回应方面达到了新高度。
简单来说,GPT-4.5更像一个“情感大师”,能更好地理解你的感受,却不一定能解决你的问题。
内部测试者的反馈也印证了这一点。他们称GPT-4.5“更温暖、直观、自然”,具备“更强的审美直觉和创造力”。
然而,这种“重情感、轻解题”的设定,真的符合用户的需求吗?毕竟,大多数人使用AI,还是希望它能高效地解决实际问题,而不是陪自己“聊天”。
“极恶”的未来?
如果说GPT-4.5的性能和定位还只是“无聊”和“尴尬”,那么OpenAI未来的发展路线,则堪称“极恶”。
Altman宣称,GPT-4.5将是“最后一个非思维链模型”。这句话看似平淡无奇,实则暗藏玄机。
作为AI行业的领头羊,OpenAI的一举一动都会对整个行业产生深远影响。而“思维链模型”的提出,无疑给AI的发展指明了一条新的道路。
思维链模型的优点毋庸置疑,它能让AI像人类一样进行复杂的推理和思考。但问题在于,并非所有场景都需要如此“烧脑”的AI。
试想一下,如果你只是想让AI帮你写一封邮件,或者查询一下天气,它却在那里“冥思苦想”,给你来一段“从宇宙大爆炸到今天”的推理过程,你会不会觉得很崩溃?
更重要的是,思维链模型往往伴随着高昂的成本和较低的效率。这对于企业和普通用户来说,无疑是一个巨大的负担。
因此,思维链应该是一种选择,而不是唯一的出路。AI的发展,需要百花齐放,而不是“一刀切”。
真相与反思
OpenAI元老Ilya Sutskever曾坦言:“我们已经达到了数据的巅峰,传统的预训练方式即将终结。”GPT-4.5的表现,似乎也印证了这一观点。
或许,OpenAI正试图通过人为制造技术瓶颈,为其高成本的新路线铺路。但这种做法,真的可取吗?
市场需要多元化的AI产品,有的场景需要深思熟虑,有的场景需要快速响应。强行将所有需求引向单一技术路线,不仅会扼杀创新,更会让AI技术进一步向少数科技巨头集中,加剧行业的不平等。
效率与智能,本应是并行发展的两条腿。AI的未来,不应该只有“情感”和“推理”,更应该有“实用”和“高效”。
最后,希望OpenAI能重新审视自己的发展战略,真正从用户需求出发,推动AI技术健康、可持续地发展。
希望Altman能记住那句话:不忘初心,方得始终。