当人工智能聊天机器人首次亮相时,各家公司都争先恐后地推出各自的“足够好”的版本,这使得比较 Gemini 和 ChatGPT 等应用程序成为一种潮流。然而,随着谷歌和 OpenAI 不断为其聊天机器人添加新功能、模型和访问方式,两者之间的差异变得越来越微妙。如今,这两款应用程序都具备了顶级人工智能聊天机器人应有的功能:回答问题、网络搜索、多语言翻译、理解音频和生成图像。那么,它们之间究竟有何区别?又该如何选择呢?
我花费了大量时间对 Gemini 和 ChatGPT 进行了测试,在此,我将详细对比它们各自的优势与劣势。
Gemini 与 ChatGPT:核心差异一览
尽管 Gemini 和 ChatGPT 之间的差距正在缩小,但它们在一些关键方面仍然存在差异。以下是一个快速对比,更详细的分析请继续阅读。
ChatGPT
- 创造者: OpenAI
- 模型: GPT-4o mini (免费), GPT-4, GPT-4o, o1-preview, o1 mini (仅限付费套餐)
- 上下文窗口: 128,000 tokens
- 支持的语言: 50+
- 平台: Web, 移动设备, 桌面
- 定价: 免费;ChatGPT Plus 订阅费用为每月 20 美元
Gemini
- 创造者: Google
- 模型: Gemini 1.5 Flash (免费), Gemini 1.5 Pro (仅限 Gemini Advanced)
- 上下文窗口: 最高 100 万 tokens
- 支持的语言: 40+
- 平台: Web, 移动设备
- 定价: 免费;Gemini Advanced 订阅费用为每月 19.99 美元(前 2 个月免费)
Gemini 与 ChatGPT:有哪些共同点?
在深入探讨 Gemini 和 ChatGPT 之间的区别之前,我们先来看看它们有哪些共同点:
处理文本、图像和音频输入的能力。 Gemini 和 ChatGPT 均由多模态人工智能模型驱动,这意味着它们可以处理和输出不同的“模态”,例如文本、图像和音频。特别是音频模式,它允许用户与聊天机器人进行实时的、来回的对话。虽然你可以在所有设备上与 ChatGPT 进行实时聊天,但 Gemini 目前只允许在移动应用程序上进行。不过,这种情况可能会随着时间而改变。
数据分析。 ChatGPT 和 Gemini 都可以分析数据,并提供关于数据的摘要、反馈和见解。它们还可以将你的数据转换成图表和各种可视化效果,帮助你更好地理解数据背后的含义。
网络搜索。 这两款应用程序都可以在网络上搜索实时数据,以便为它们的回答提供信息。ChatGPT 搜索由微软 Bing 提供支持,而 Gemini 自然由 Google 搜索提供支持。这使得它们能够提供更准确、更及时的信息,而不是仅仅依赖于预先训练的数据。
支持的设备。 ChatGPT 和 Gemini 都支持 Web 和移动应用程序。然而,使用 Gemini 时,在不同设备上访问聊天机器人不如使用 ChatGPT 那么简单。ChatGPT 还提供桌面应用程序,而 Gemini 目前还没有。
数据管理。 这两款聊天机器人都提供了类似的数据管理控制。你可以打开或关闭记忆功能,事后删除对话,以及进行不出现在对话历史记录中的对话(在 ChatGPT 中称为“临时聊天”)。这两款应用程序都会将已删除的对话或临时对话保留一段时间。两者之间的唯一区别是 ChatGPT 允许你存档对话,而 Gemini 则没有提供此功能。
对话共享。 ChatGPT 和 Gemini 都允许你与他人分享你的对话。主要区别在于 ChatGPT 不允许你分享包含人工智能生成的图像的对话。
基于先进的 AI 模型,各有千秋
ChatGPT 和 Gemini 都由最先进的多模态人工智能模型驱动,这些模型几乎可以完成任何任务。ChatGPT 由两大系列模型提供支持:GPT-4o 和 o1;而 Google Gemini 聊天机器人由 Google Gemini 提供支持。每个模型都为 ChatGPT 和 Gemini 的独特优势做出了贡献。
上下文窗口。 ChatGPT 的上下文窗口明显小于 Gemini:分别为 128,000 个 tokens 和 100 万个 tokens。尽管如此,128,000 个 tokens 已经超出了大多数用户的需求,因此你可能不会真正注意到其中的差异。上下文窗口的大小决定了模型可以记住和处理多少信息,更大的上下文窗口通常意味着更好的理解和更连贯的对话。
逻辑推理。 ChatGPT 的 o1 模型使用思维链推理来分析复杂问题,谷歌仍在努力解决这个问题。这使得 ChatGPT 在执行解密文本、解决填字游戏以及正确回答数学和英语问题等任务时,成为更强大的选择。思维链推理是一种模仿人类思考过程的技术,它允许模型逐步分解复杂问题,从而提高解决问题的准确性。
图像生成。 这两款应用程序都允许你生成人工智能图像。ChatGPT 使用更成熟的 DALL·E 3,而 Gemini 使用较新的文本到图像生成器 Imagen 3。如果生成图像对你很重要,ChatGPT 会限制你可以使用免费帐户创建的图像数量,而 Gemini 则没有设置此类限制。DALL·E 3 在图像生成方面拥有更丰富的经验和更高的质量,而 Imagen 3 则可能在某些特定场景下表现更好。
记忆。 这两款应用程序都有一个记忆库,但它们的工作方式不同。ChatGPT 的记忆功能默认对所有 ChatGPT Plus 帐户启用,并自动获取你在聊天中分享的详细信息和偏好,以定制其回复。使用 Google Gemini,你需要在设置中手动添加记忆,使其操作更像 ChatGPT 的自定义指令。这意味着 ChatGPT 更加智能化,可以自动学习你的偏好,而 Gemini 则需要你手动进行配置。
文件转换。 ChatGPT 可以将文件从一种格式转换为另一种格式,例如,你可以将文章转换为演示文稿(反之亦然)。Gemini 目前不提供此功能。文件转换功能可以提高工作效率,尤其是在需要快速将信息从一种格式转换为另一种格式时。
诸如此类的小差异有很多,只有当你开始使用它们时,你才会真正知道哪些对你来说更重要。这也是为什么有些人(比如我)同时使用这两者的原因。
Gemini 深度集成 Google 生态系统,ChatGPT 提供更广泛的集成
可以想象,Gemini 已经深度集成到 Google 生态系统中。无需离开聊天,你就可以要求 Gemini 从其他 Google 应用程序(包括 Gmail、Drive、Maps、Flights、Hotels 和 YouTube)中检索实时信息。只需键入 @
,然后输入你想要搜索的应用程序的名称。
在实践中,这意味着你可以执行以下操作:
- 让 Gemini 从 Gmail 中的电子邮件线程中提取详细信息
- 共享存储在 Google Drive 中的文件的链接,或直接在对话中输出该文件的内容
- 将 Gemini 响应导出到 Google 文档、Gmail 或 Google Keep
- 为即将到来的旅行规划你的行程,包括航班、驾车路线和住宿
例如,如果你要求 Gemini 引用 Gmail 或 Drive,它不仅会从引用的电子邮件或文件中提取详细信息,如果你想更深入地挖掘,还会提供指向这些电子邮件或文件的可点击链接。
ChatGPT 确实与 Google Drive 集成,因此它可以读取 Docs、Sheets 等。但是你必须先连接你的 Google 帐户,并准确告诉它要查看哪个文件,而且它仍然无法访问你的电子邮件。这使得 Gemini 在访问和处理 Google 服务中的信息方面更具优势。
相反,ChatGPT 允许你通过在消息栏中输入提示,将预制或定制的聊天机器人(称为 GPT)拉入你的 ChatGPT 对话。这是一种与 Gemini 与 Google 不同的集成方式,但它可以让你轻松地在聊天机器人之间切换,并获得适合该场合的正确 AI 支持。这意味着 ChatGPT 更加灵活,可以根据不同的需求选择不同的 AI 工具。
两者都允许构建自定义聊天机器人,但 ChatGPT 提供更高级的功能
如果你是 Plus 或 Enterprise 用户,OpenAI 允许你构建自定义聊天机器人 (GPT),并且你可以构建的 GPT 数量没有限制。你所要做的就是用简单的英语告诉 GPT 构建器你想要创建什么,构建器将从那里开始。
自定义 GPT 可以浏览 Web、使用 DALL·E 3 生成图像以及运行代码。你还可以将知识文件(例如,编写样式指南或帮助文档)直接上传到 GPT 构建器,以告知 GPT 的响应。
这是一个我创建的 GPT 示例,我只是提示 GPT 构建器创建一个聊天机器人,该机器人仅分享有关水獭的有趣事实。
就 Google 而言,它提供 Gemini Gems,这是他们的定制 Gemini 版本。它目前仅适用于 Gemini Advanced、Business 和 Enterprise 用户,所以我没有机会亲自测试它,但构建过程看起来类似于 ChatGPT 的:告诉 Gem 你想创建什么,Gemini 会处理剩下的事情。如果你有知识资源,你还可以上传知识资源。
与 GPT 不同,你不能使用 Gem 生成 AI 图像或使用 Gemini Live(语音模式)与 Gem 交互。如果这些功能在自定义聊天机器人中对你很重要,请坚持使用 ChatGPT。这表明 ChatGPT 在自定义聊天机器人方面提供了更丰富的功能和更灵活的选项。
Gemini vs. ChatGPT:哪个更好?
如果你仍然想知道 Gemini 和 ChatGPT 有什么区别,那么事实是——区别不大。但是,如果你正在决定使用哪一个,这个答案可能对你没有多大帮助。我的建议是:如果你深度依赖 Google 生态系统,那么使用 Gemini 会更方便。否则,ChatGPT 仍然是大多数人的最佳选择。
重要的是要强调,ChatGPT 和 Gemini 都有一个明显的缺点:这两款聊天机器人都容易产生听起来似乎真实但不准确的回复。归根结底,更好的 AI 工具取决于你使用它的目的,以及你是否能够处理那些令人烦恼的幻觉。选择哪款工具,最终取决于你的具体需求和偏好。