Claude vs ChatGPT：最新深度测评，谁才是你的最佳AI助手？

在人工智能领域，Claude和ChatGPT无疑是两颗耀眼的明星。它们各自拥有独特的优势和应用场景，让用户在选择时常常陷入两难。两个月前，我可能还会毫不犹豫地推荐ChatGPT，但最近Claude的一系列更新，让我开始重新审视它们的价值。有人将ChatGPT比作“理科生”，擅长数学和逻辑推理，而将Claude比作“文科生”，在写作方面表现更出色。但事实真的如此吗？作为一名同时使用Claude和ChatGPT的深度用户，我将从普通用户的视角，对这两款模型的会员版进行一次深层次、全面的对比，希望能帮助大家更好地做出选择。

功能对比：不止于基础能力

除了模型的基础能力，具体的功能也是我们选择AI助手时需要考虑的重要因素。我个人在使用ChatGPT时，特别喜欢它的Canvas功能，而在使用Claude时，则更青睐Artifacts功能。下面，我们来详细了解一下它们的主要功能。

ChatGPT的功能

Canvas: ChatGPT的Canvas功能是一个强大的协作工具，它允许用户与AI共同完成写作和编码项目。想象一下，你正在与团队合作开发一个复杂的软件项目，Canvas功能可以提供内联编辑、代码调试和版本控制等工具，让团队成员可以实时协作，共同完善代码。又或者，你正在撰写一份技术文档，Canvas可以帮助你轻松地组织思路、添加图表和注释，并确保文档的格式统一。
GPTs: GPTs功能则赋予了用户定制AI助手的能力，即使你没有任何编程技能，也可以创建一个能够执行特定任务的AI助手。例如，你可以创建一个专门用于客户服务的AI助手，它可以自动回复常见问题、处理投诉和提供产品信息。或者，你可以创建一个用于数据分析的AI助手，它可以自动提取数据、生成报告和进行预测。甚至，你还可以创建一个用于内容创作的AI助手，它可以自动生成文章、博客帖子和社交媒体内容。只需要简单的指令，GPTs就能帮你完成各种任务。
AI搜索功能: ChatGPT新增的搜索功能将AI的强大能力与互联网的广阔信息相结合，为用户提供更准确、更全面的答案。无论是网页版还是手机和桌面应用，用户都可以通过ChatGPT快速访问最新的学术论文、研究成果和新闻报道。对于研究人员来说，这无疑是一个强大的工具，可以帮助他们快速了解最新的研究进展，并加速研究过程。
DALL·E功能: ChatGPT集成了DALL·E功能，让用户可以直接通过自然语言描述来创建图像。这为广告设计、产品原型制作和社交媒体内容创作等领域带来了无限的可能性。你可以让DALL·E为你生成一张独特的广告海报，或者创建一个逼真的产品原型，又或者为你的社交媒体账号创建引人注目的内容。只需要你的想象力，DALL·E就能将你的想法变成现实。
高级语音: ChatGPT的高级语音功能让用户可以与AI进行自然、流畅的语音对话。与其他语音助手相比，ChatGPT的语音功能更加逼真，更具人情味。因此，许多用户会利用ChatGPT来练习英语口语、进行角色扮演，甚至只是与AI进行闲聊，从而获得乐趣和放松。

Claude的功能

Artifacts: Claude的Artifacts功能让用户可以在对话中创建和引用大量独立的内容，例如代码片段、文本文档和网站设计等。更重要的是，Artifacts支持实时查看、编辑和构建内容，这使得用户可以更加高效地管理和组织他们的工作成果。想象一下，你正在开发一个网站，你可以使用Artifacts来创建和管理不同的网页设计方案，并实时查看它们的效果。或者，你正在编写一篇技术报告，你可以使用Artifacts来整理你的研究数据、图表和参考文献。
数据可视化: Claude的数据分析功能支持用户编写并直接运行JavaScript代码，从而进行复杂的数据处理和实时分析。这对于需要进行数据分析和可视化的场景来说，是一个强大的工具。你可以使用Claude来分析市场数据、生成财务报告，或者进行科学研究。例如，你可以使用Claude来分析销售数据，找出最畅销的产品和最受欢迎的客户群体。或者，你可以使用Claude来分析股票市场数据，预测未来的股价走势。
可视化PDF: Claude能够查看和分析PDF中的图像、图表和图形，这对于处理技术文档、学术论文或法律文件等包含大量图像和图表的PDF文件来说，非常有用。你可以使用Claude来审阅一份技术文档，检查其中的图表是否清晰易懂。或者，你可以使用Claude来分析一篇学术论文，提取其中的关键数据和结论。
Computer use: 通过Claude的API，用户可以控制电脑执行搜索、数据分析和文档处理等任务，这使得Claude可以像一个智能个人助理一样，帮助用户自动化计算机操作。例如，你可以让Claude自动搜索最新的新闻报道，并将它们整理成一份摘要。或者，你可以让Claude自动分析你的电子邮件，并提取其中的关键信息。
LaTeX渲染: Claude能够一致地呈现数学方程式，这对于处理数学公式和科学文献来说，非常重要。无论是学术论文撰写、技术报告还是教育教学，Claude都可以确保数学公式的正确显示。这对于数学家、科学家和工程师来说，无疑是一个福音。

总而言之，ChatGPT和Claude都是功能强大的AI模型，但它们各有专长。ChatGPT以其多功能全面著称，它就像一个多面手，可以应用于各种场景，包括写作协作、自定义AI助手、网络搜索、图像生成和语音对话。而Claude则专注于编码和专业写作，提供代码片段管理、数据可视化、PDF分析等功能，特别适合技术和学术领域。你会为了它们俩的哪个功能订阅呢？这取决于你的具体需求和偏好。

基础能力对比：数据说话

当然，除了功能之外，模型的基础能力也是我们选择AI助手时需要考虑的重要因素。那么，Claude和ChatGPT在基础能力方面，究竟谁更胜一筹呢？让我们通过数据来一探究竟。

由于Claude和ChatGPT等模型在评估基本能力时，通常使用国外的基准数据集。然而，中文和英文在语言结构和表达方式上存在显著差异。为了更准确地评估模型在中文语境下的表现，我选择了国内权威的模型测试机构——CLUE（中文语言理解测评基准）。

在最新版Claude 3.5 sonnet发布时，CLUE中文语言理解测评基准第一时间进行了评测，评测结果如下：

中文代码： o1-preview＞Claude 3.5 Sonnet＞GPT-4o

Claude 3.5 Sonnet(1022)在中文代码能力（SC-Code3）上表现不俗，总分达到84.85分，较GPT-4o-0513高1.52分，较o1-preview低4.54分。其中，在高级代码任务上表现惊艳，得分69.23分，与o1-preview打平。

复杂任务高阶推理能力： o1-preview＞GPT-4o＞Claude 3.5 Sonnet

Claude 3.5 Sonnet(1022)在中文高阶推理任务上取得74.54分，接近ChatGPT-4o-latest，相较o1-preview还有较大差距（-10.73分）。其中，多步推理能力相对突出，超过了ChatGPT-4o-latest。

此外，我还参考了LMSYS竞技场的最新数据。

LMSYS竞技场是由加州大学伯克利分校SkyLab和LMSYS的研究人员开发的。该平台拥有超过 1,000,000 张用户投票，使用 Bradley-Terry 模型生成实时排行榜，对最佳 LLM 和 AI 聊天机器人进行排名。

以下是LMSYS竞技场的最新数据，显示最新版的Claude 3.5 sonnet要落后于GPT 4o和o1-preview模型。

从数据层面来看，ChatGPT的o1模型在整体性能上仍然优于最新版的Claude 3.5 sonnet。因此，如果你更看重模型的整体能力，那么ChatGPT可能更适合你。