Anthropic团队实战:Claude Code如何重塑企业AI工作流?

1

Anthropic团队如何利用Claude Code提升效率

Anthropic的各个团队正在利用Claude Code转变工作流程,使开发人员和非技术人员能够处理复杂的项目,自动化任务,并弥合先前限制其生产力的技能差距。Claude Code通过自然语言指令来编写、测试和调试代码,极大地提高了工作效率,并使得跨团队协作更加顺畅。

为了更深入地了解Claude Code的应用,我们采访了以下团队:

  • 数据基础设施
  • 产品开发
  • 安全工程
  • 推理
  • 数据科学与可视化
  • 产品工程
  • 增长营销
  • 产品设计
  • 强化学习(RL)工程
  • 法律

通过这些访谈,我们收集了关于不同部门如何使用Claude Code、其对工作的影响以及为考虑采用的其他组织提供的技巧。

Claude Code在数据基础设施中的应用

数据基础设施团队负责组织公司内所有团队的业务数据。他们使用Claude Code来自动化日常数据工程任务,解决复杂的基础设施问题,并为技术和非技术团队成员创建文档化的工作流程,以便他们能够独立地访问和操作数据。

Kubernetes调试示例

主要用例:

  • 使用屏幕截图进行Kubernetes调试: 当Kubernetes集群宕机且无法调度新的pod时,团队使用Claude Code诊断问题。他们将仪表板的屏幕截图输入到Claude Code中,Claude Code指导他们逐步浏览Google Cloud的UI菜单,直到他们找到一个警告,指示pod IP地址已耗尽。然后,Claude Code提供了创建新IP池并将其添加到集群的确切命令,从而绕过了需要涉及网络专家的需求。

  • 为财务团队提供纯文本工作流程: 工程师向财务团队成员展示了如何编写描述其数据工作流程的纯文本文件,然后将其加载到Claude Code中以获得完全自动化的执行。没有编码经验的员工可以描述诸如“查询此仪表板,获取信息,运行这些查询,生成Excel输出”之类的步骤,而Claude Code将执行整个工作流程,包括询问所需的输入(如日期)。

  • 为新员工提供代码库导航: 当新的数据科学家加入团队时,他们被指示使用Claude Code来导航其庞大的代码库。Claude Code读取他们的Claude.md文件(文档),识别特定任务的相关文件,解释数据管道依赖关系,并帮助新员工了解哪些上游来源会馈送到仪表板中。这取代了传统的数据目录和可发现性工具。

  • 会话结束时更新文档: 团队要求Claude Code总结已完成的工作会话,并在每个任务结束时提出改进建议。这创建了一个持续改进的循环,其中Claude Code根据实际使用情况帮助改进Claude.md文档和工作流程说明,从而使后续迭代更加有效。

  • 跨多个实例的并行任务管理: 在处理长时间运行的数据任务时,团队会在不同存储库中为不同的项目打开多个Claude Code实例。每个实例都保持完整的上下文,因此当他们在数小时或数天后切换回来时,Claude Code会准确地记住他们在做什么以及他们停止的位置,从而实现真正的并行工作流程管理,而不会丢失上下文。

团队影响:

  • 无需专业知识即可解决基础设施问题: 解决了通常需要系统或网络团队成员参与的Kubernetes集群问题,使用Claude Code诊断问题并提供确切的修复。
  • 加速入职: 新的数据分析师和团队成员可以快速了解复杂的系统并做出有意义的贡献,而无需大量的指导。
  • 增强支持工作流程: Claude Code可以处理更大的数据量并识别异常(例如监视200个仪表板),这对于人类来说是不可能手动审查的。
  • 实现跨团队自助服务: 没有编码经验的财务团队现在可以独立执行复杂的数据工作流程。

数据基础设施团队的建议:

  • 编写详细的Claude.md文件: 你在Claude.md文件中记录你的工作流程、工具和期望越好,Claude Code的性能就越好。当你具有现有的设计模式时,这使Claude Code擅长执行设置新数据管道之类的常规任务。
  • 使用MCP服务器而不是CLI来处理敏感数据: 他们建议使用MCP服务器而不是BigQuery CLI来更好地控制Claude Code可以访问的内容,尤其是在处理需要记录或具有潜在隐私问题的敏感数据时。
  • 分享团队使用会话: 团队举行了会议,成员互相演示了他们的Claude Code工作流程。这有助于传播最佳实践,并展示他们可能没有自己发现的使用该工具的不同方式。

Claude Code在产品开发中的应用

Claude Code产品开发团队使用他们自己的产品来构建Claude Code的更新,从而扩展产品的企业功能和代理循环功能。

主要用例:

  • 使用自动接受模式进行快速原型设计: 工程师通过启用“自动接受模式”(shift+tab)并设置自主循环来使用Claude Code进行快速原型设计,在该循环中,Claude编写代码、运行测试并持续迭代。他们给Claude提供他们不熟悉的抽象问题,让它自主工作,然后在接管最终改进之前审查80%完整的解决方案。该团队建议从干净的git状态开始,并定期提交检查点,以便他们可以轻松地恢复任何不正确的更改(如果Claude偏离轨道)。

  • 同步编码以实现核心功能: 对于涉及应用程序业务逻辑的更关键功能,团队与Claude Code同步工作,提供带有特定实现说明的详细提示。他们实时监控该过程,以确保代码质量、样式指南合规性和正确的体系结构,同时让Claude处理重复的编码工作。

  • 构建Vim模式: 他们最成功的异步项目之一是为Claude Code实现Vim键绑定。他们要求Claude构建整个功能,最终实现的大约70%来自Claude的自主工作,仅需几次迭代即可完成。

  • 测试生成和错误修复: 团队使用Claude Code在实现功能后编写全面的测试,并处理在拉取请求审查中发现的简单错误修复。他们还使用GitHub Actions让Claude自动处理拉取请求评论,例如格式问题或函数重命名。

  • 代码库探索: 在使用不熟悉的代码库(如monorepo或API端)时,团队使用Claude Code快速了解系统的工作方式。他们直接向Claude询问解释和代码参考,而不是等待Slack的响应,从而节省了大量上下文切换时间。

团队影响:

  • 更快的特性实现: Claude Code成功地实现了像Vim模式这样复杂的功能,其中70%的代码由Claude自主编写。
  • 提高开发速度: 该工具可以快速地对特性进行原型设计,并在创意上进行迭代,而不会陷入到实现细节中。
  • 通过自动化测试提高代码质量: Claude生成全面的测试并处理常规的错误修复,在减少人工工作的同时保持高标准。
  • 更好的代码库探索: 团队成员可以快速地掌握monorepo中不熟悉的部分,而无需等待同事的响应。

Claude Code团队的建议:

  • 创建自给自足的循环: 设置Claude以通过自动运行构建、测试和lint来验证自己的工作。这允许Claude自主工作更长时间并发现自己的错误,当你要求Claude在编写代码之前生成测试时,这尤其有效。

  • 培养任务分类直觉: 学会区分异步工作效果良好的任务(外围功能、原型设计)与需要同步监督的任务(核心业务逻辑、关键修复)。产品边缘上的抽象任务可以使用“自动接受模式”来处理,而核心功能需要更密切的监督。

  • 形成清晰、详细的提示: 当组件具有相似的名称或功能时,请在你的请求中非常具体。你的提示越好、越详细,你就越可以信任Claude独立工作,而不会对代码库的错误部分进行意外的更改。

Claude Code在安全工程中的应用

安全工程团队专注于保护软件开发生命周期、供应链安全和开发环境安全。他们广泛使用Claude Code来编写和调试代码。

主要用例:

  • 复杂的基础设施调试: 在处理事件时,他们将堆栈跟踪和文档馈送到Claude Code中,要求它跟踪通过代码库的控制流。这大大减少了生产问题的时间,使他们能够在5分钟内了解通常需要10-15分钟手动代码扫描才能解决的问题。

  • Terraform代码审查和分析: 对于需要安全批准的基础设施变更,团队将Terraform计划复制到Claude Code中,以询问“这将要做什么?我会后悔吗?”这创建了更紧密的反馈循环,并使安全团队可以更快地审查和批准基础设施变更,从而减少了开发过程中的瓶颈。

  • 文档合成和运行手册: Claude Code提取多个文档来源并创建markdown运行手册、故障排除指南和概述。该团队使用这些简化的文档作为调试实际问题的上下文,从而创建了比搜索完整知识库更有效的工作流程。

  • 测试驱动的开发工作流程: 他们现在要求Claude Code提供伪代码,指导它完成测试驱动的开发,并定期检查以在遇到困难时对其进行指导,而不是以前的“设计文档→简陋代码→重构→放弃测试”模式,从而产生更可靠和可测试的代码。

  • 上下文切换和项目入职: 在为现有项目(如“dependant”,一个用于安全审批工作流程的Web应用程序)做出贡献时,他们使用Claude Code来编写、审查和执行以markdown编写并存储在代码库中的规范,从而可以在几天而不是几周内做出有意义的贡献。

团队影响:

  • 减少事件解决时间: 通常需要10-15分钟手动代码扫描的基础设施调试现在大约需要5分钟。
  • 改进的安全审查周期: 用于安全审批的Terraform代码审查发生得更快,从而消除了开发人员在等待安全团队审批时的阻塞。
  • 增强的跨职能贡献: 团队成员可以在几天而不是几周的上下文构建中对项目做出有意义的贡献。
  • 更好的文档工作流程: 来自多个来源的综合故障排除指南和运行手册创建了更有效的调试过程。

安全工程团队的建议:

  • 广泛使用自定义斜杠命令: 安全工程使用了整个monorepo中所有自定义斜杠命令实现的50%。这些自定义命令简化了特定的工作流程并加快了重复的任务。
  • 让Claude先说话: 他们现在告诉Claude Code“逐步提交你的工作”,并让它在定期检查的情况下自主工作,而不是提出有针对性的问题来生成代码片段,从而产生更全面的解决方案。
  • 将其用于文档编制: 除了编码之外,Claude Code还擅长综合文档和创建结构化输出。该团队提供了写作样本和格式偏好,以获得他们可以立即在Slack、Google Docs和其他工具中使用的文档,从而避免了界面切换疲劳。

Claude Code在推理中的应用

推理团队管理着在Claude读取你的提示并生成其响应时存储信息的内存系统。团队成员,尤其是那些不熟悉机器学习的成员,可以广泛使用Claude Code来弥合知识差距并加速他们的工作。

主要用例:

  • 代码库理解和入职: 在加入复杂的代码库时,团队非常依赖Claude Code来快速了解架构。他们要求Claude查找哪些文件调用了特定的功能,而不是手动搜索GitHub存储库,从而在几秒钟内获得结果,而不是询问同事或手动搜索。

  • 具有边缘案例覆盖率的单元测试生成: 在编写核心功能后,他们要求Claude编写全面的单元测试。Claude自动包含错过的边缘案例,从而在几分钟内完成通常需要大量时间和精力的工作,就像他们可以审查的编码助手一样。

  • 机器学习概念解释: 没有机器学习背景的团队成员依靠Claude来解释特定于模型的功能和设置。现在需要一小时Google搜索和阅读文档的工作现在需要10-20分钟,从而将研究时间减少了80%。

  • 跨语言代码翻译: 在测试不同编程语言的功能时,团队解释了他们想要测试的内容,Claude用所需的语言(如Rust)编写逻辑,从而消除了仅出于测试目的而学习新语言的需要。

  • 命令回忆和Kubernetes管理: 他们没有记住复杂的Kubernetes命令,而是向Claude询问正确的语法,例如“如何获取所有pod或部署状态”,并收到其基础设施工作所需的精确命令。

团队影响:

  • 加速机器学习概念学习: 借助Claude Code,他们的研究时间减少了80%,而历史上需要一个小时的Google搜索现在需要10-20分钟。

  • 更快的代码库导航: 该工具可以帮助团队成员在几秒钟内找到相关文件并了解系统架构,而不是依靠同事来分享知识,通常需要几天的时间。

  • 全面的测试覆盖率: Claude自动生成带有边缘案例的单元测试,从而减轻了心理负担,同时保持了代码质量。

  • 消除语言障碍: 团队可以用不熟悉的语言(如Rust)实现功能,而无需学习它。

推理团队的建议:

  • 首先测试知识库功能: 尝试提出各种问题,看看Claude是否可以比Google搜索更快地回答。如果它更快更准确,那么它将是您工作流程中节省时间的宝贵工具。
  • 从代码生成开始: 向Claude提供具体的说明,并要求它编写逻辑,然后验证正确性。这有助于在使用该工具执行更复杂的任务之前建立对该工具功能的信任。
  • 将其用于测试编写: 让Claude编写单元测试可以减轻日常开发工作中的巨大压力。使用此功能可以保持代码质量,而无需花费时间手动考虑所有测试用例。

Claude Code在数据科学和机器学习工程中的应用

数据科学和ML工程团队需要复杂的可视化工具来理解模型性能,但是构建这些工具通常需要不熟悉的语言和框架的专业知识。Claude Code使这些团队无需成为全栈开发人员即可构建生产质量的分析仪表板。

主要用例:

  • 构建JavaScript/TypeScript仪表板应用程序: 尽管知道“很少的JavaScript和TypeScript”,但团队使用Claude Code来构建整个React应用程序,以可视化强化学习(RL)模型性能和训练数据。他们让Claude控制从头开始编写完整的应用程序,例如一个5,000行的TypeScript应用程序,而无需自己理解代码。这至关重要,因为可视化应用程序的上下文相对较低,不需要理解整个monorepo,从而可以快速地对工具进行原型设计,以了解训练和评估期间的模型性能。

  • 处理重复的重构任务: 当面临合并冲突或半复杂的文件重构(对于编辑器宏来说太复杂,但对于主要的开发工作来说又不够大)时,他们将Claude Code用作“老虎机”——提交他们的状态,让Claude自主工作30分钟,然后接受解决方案,或者在不起作用时重新开始。

  • 创建持久的分析工具,而不是抛弃型笔记本电脑: 该团队现在让Claude构建可以在以后的模型评估中重复使用的永久React仪表板,而不是构建被丢弃的一次性Jupyter笔记本电脑。这很重要,因为了解Claude的性能是“团队最重要的事情之一”——他们需要了解模型在训练和评估期间的性能,而“这实际上并非易事,简单的工具无法从查看单个数字上升中获得太多信号。”

  • 零依赖的任务委派: 对于完全不熟悉的代码库或语言中的任务,他们将整个实现委派给Claude Code,从而利用其从monorepo收集上下文并在实际编码过程中无需他们的参与即可执行任务的能力。这使得他们能够在专业知识以外的领域提高生产力,而不是花费时间学习新技术。

团队影响:

  • 实现了2-4倍的时间节省: 例行的重构任务虽然手动完成起来很乏味但可以管理,但现在完成得更快。
  • 用不熟悉的语言构建了复杂的应用程序: 尽管只有最少的JavaScript/TypeScript经验,但还是创建了一个5,000行的TypeScript应用程序。
  • 从抛弃型工具转变为持久型工具: 现在构建可重复使用的React仪表板用于模型分析,而不是一次性的Jupyter笔记本电脑。
  • 直接的模型改进见解: 第一手的Claude Code经验为未来模型迭代的更好的内存系统和UX改进提供了信息。
  • 支持可视化驱动的决策制定: 通过高级数据可视化工具更好地了解Claude在训练和评估期间的性能。

数据科学和机器学习工程团队的建议:

  • 将其视为老虎机: 在让Claude工作之前保存您的状态,让它运行30分钟,然后接受结果或重新开始,而不是试图纠正错误。从头开始通常比试图修复Claude的错误具有更高的成功率。
  • 在需要时中断以简化: 在监督时,不要犹豫停止Claude并问“你为什么要这样做?尝试更简单的方法。”该模型默认倾向于更复杂的解决方案,但对更简单方法的请求反应良好。

Claude Code在产品工程中的应用

产品工程团队致力于PDF支持、引文和Web搜索等功能,这些功能将更多的知识带入Claude的上下文窗口。跨大型、复杂的代码库工作意味着不断遇到不熟悉的代码段,花费大量时间来理解要检查哪些文件以执行任何给定的任务,并在进行更改之前构建上下文。Claude Code通过充当可以帮助他们理解系统架构、识别相关文件并解释复杂交互的指南来改善这种体验。

主要用例:

  • 第一步工作流程计划: 团队将Claude Code用作任何任务的“第一站”,要求它识别要检查哪些文件以进行错误修复、功能开发或分析。这取代了传统的手动导航代码库并在开始工作之前收集上下文的耗时过程。

  • 跨代码库的独立调试: 团队现在有信心解决代码库中不熟悉部分的错误,而不是向其他人寻求帮助。他们可以问Claude“你认为你能修复这个错误吗?这是我看到的行为”,并且通常会立即取得进展,考虑到所需的时间投入,这在以前是不可行的。

  • 通过试用进行模型迭代测试: Claude Code会自动使用最新的研究模型快照,使其成为他们体验模型变更的主要方式。这使团队可以在开发周期中直接获得有关模型行为变更的反馈,这是他们在以前的发布期间没有体验过的。

  • 消除上下文切换开销: 他们无需复制代码片段并将文件拖到Claude.ai中,同时广泛解释问题,而是可以直接在Claude Code中提问,而无需收集其他上下文,从而大大减少了精神开销。

团队影响:

  • 提高了解决不熟悉领域问题的信心: 团队成员可以独立调试错误并调查不熟悉代码库中的事件。
  • 在上下文收集方面节省了大量时间: Claude Code消除了将代码片段复制并将文件拖到Claude.ai中的开销,从而减少了精神上下文切换负担。
  • 更快的轮换入职: 轮换到新团队的工程师可以快速导航不熟悉的代码库并做出有意义的贡献,而无需广泛的同事咨询。
  • 提高了开发人员的幸福感: 该团队报告说,他们的日常工作流程中的摩擦减少,感到更快乐、更有效率。

产品工程团队的建议:

  • 将其视为迭代合作伙伴,而不是一次性解决方案: 不要期望Claude立即解决问题,而是将其视为您可以与之迭代的协作者。这比尝试第一次就获得完美的解决方案效果更好。
  • 使用它来建立对不熟悉领域的信心: 不要犹豫解决您专业知识以外的错误或调查事件。Claude Code使在通常需要大量上下文构建的领域中独立工作成为可能。
  • 从最少的信息开始: 从您需要的最少信息开始,让Claude指导您完成整个过程,而不是预先加载广泛的解释。

Claude Code在增长营销中的应用

增长营销团队专注于构建跨付费搜索、付费社交、移动应用程序商店、电子邮件营销和SEO的绩效营销渠道。作为一个非技术团队,他们使用Claude Code来自动化重复的营销任务并创建代理工作流程,而这些工作流程通常需要大量的工程资源。

主要用例:

  • 自动化的Google Ads创意生成: 该团队构建了一个代理工作流程,该工作流程处理包含数百个现有广告及其效果指标的CSV文件,识别用于迭代效果不佳的广告,并生成符合严格字符限制(标题为30个字符,描述为90个字符)的新变体。使用两个专门的子代理(一个用于标题,一个用于描述),该系统可以在几分钟内生成数百个新广告,而无需跨多个广告系列手动创建。这使他们能够大规模地进行测试和迭代,而这在以前需要花费大量时间才能实现。

  • 用于批量创意制作的Figma插件: 他们开发了一个Figma插件,该插件识别帧并通过交换标题和描述以编程方式生成多达100个广告变体,从而将通常需要花费数小时的复制粘贴工作减少到每次批量处理半秒钟,而不是手动复制和编辑付费社交广告的静态图像。这使得创意输出提高了10倍,从而使团队可以在关键社交渠道上测试更多的创意变体。

  • 用于广告系列分析的Meta Ads MCP服务器: 他们创建了一个与Meta Ads API集成的MCP服务器,以直接在Claude桌面应用程序中查询广告系列效果、支出数据和广告效果,从而无需在平台之间切换以进行效果分析,从而节省了关键时间,因为每次效率提升都会转化为更好的投资回报率。

  • 具有记忆系统的高级提示工程: 他们实现了一个简陋的记忆系统,该系统记录了广告迭代中的假设和实验,从而使系统可以在生成新变体时将先前的测试结果提取到上下文中,从而创建了一个自我改进的测试框架。这使得可以进行手动无法跟踪的系统实验。

团队影响:

  • 重复性任务节省了大量时间: Claude Code将广告文案创建时间从2小时减少到15分钟,从而使团队可以腾出更多时间进行战略工作。
  • 创意输出提高了10倍: 借助自动化的广告生成和Figma集成,该团队现在可以测试渠道中更多的广告变体,以获取最新的视觉设计元素。
  • 像更大的团队一样运作: 该团队可以处理传统上需要专门工程资源的大型开发任务。
  • 战略重点转移: 该团队可以将更多的时间花在整体战略和构建代理自动化上,而不是手动执行。

增长营销团队的建议:

  • 确定启用API的重复性任务: 寻找涉及使用具有API的工具(如广告平台、设计工具、分析平台)执行重复操作的工作流程。这些是自动化的主要候选者,也是Claude Code提供最大价值的地方。
  • 将复杂的工作流程分解为专门的子代理: 不要试图在一个提示或工作流程中处理所有事情,而是为特定任务创建单独的代理(如标题代理与描述代理)。这使得在处理复杂需求时可以更轻松地进行调试并提高输出质量。
  • 在编码之前进行彻底的头脑风暴和提示计划: 花费大量时间使用Claude.ai来思考您的整个工作流程,然后让Claude.ai为Claude Code创建一个全面的提示和代码结构以供参考。此外,逐步进行工作,而不是要求一次性解决方案,以避免Claude被复杂的任务淹没。

Claude Code在产品设计中的应用

产品设计团队支持Claude Code、Claude.ai和Anthropic API,专门从事构建AI产品。即使是非开发人员也可以使用Claude Code来弥合设计和工程之间的传统差距,从而无需与工程师进行广泛的来回迭代即可直接实现他们的设计愿景。

主要用例:

  • 前端修饰和状态管理变更: 团队直接使用Claude Code来实现这些变更,而不是创建广泛的设计文档,并通过与工程师进行多轮反馈来进行视觉调整(字体、颜色、间距)。工程师指出,他们正在进行“通常不会看到设计师进行的大型状态管理变更”,从而使他们能够获得他们设想的确切质量。

  • GitHub Actions自动化的票务: 使用Claude Code的GitHub集成,他们只需提交描述所需变更的问题/票证,Claude会自动提出代码解决方案,而无需打开Claude Code,从而为他们持久的修饰任务积压创建了无缝的错误修复和功能改进工作流程。

  • 快速交互式原型设计: 通过将模型图像粘贴到Claude Code中,他们生成了工程师可以立即理解和迭代的完全可用的原型,从而取代了传统的静态Figma设计周期,而这些设计需要广泛的解释和转换为工作代码。

  • 边缘案例发现和系统架构理解: 团队使用Claude Code来绘制错误状态、逻辑流程和不同的系统状态,从而使他们可以在设计期间识别边缘案例,而不是在开发后期发现它们,从而从根本上提高了其初始设计的质量。

  • 复杂的文案变更和法律合规性: 对于诸如删除整个代码库中的“研究预览”消息之类的任务,他们使用Claude Code来查找所有实例、审查周围的文案、与法律部门实时协调变更并实施更新,这一过程花费了两次30分钟的通话,而不是一周的来回协调。

团队影响:

  • 改变了核心工作流程: Claude Code成为主要的 *设计工具,Figma和Claude Code的打开时间占80%。
  • 执行速度提高了2-3倍: 以前需要与工程师进行广泛来回的视觉和状态管理变更现在可以直接实施。
  • 周期时间从几周缩短到几小时: 像Google Analytics启动消息传递这样需要一周协调的复杂项目现在可以在两次30分钟的通话中完成。
  • 两种不同的用户体验: 开发人员获得“增强的工作流程”(更快的执行速度),而非技术用户获得“天哪,我是开发人员的工作流程”。
  • 改进的设计-工程协作: Claude Code可以改善沟通并加快问题解决速度,因为设计师无需与工程师紧密合作即可了解系统约束和可能性。

产品设计团队的建议:

  • 从工程师那里获得正确的设置帮助: 让工程团队成员帮助进行初始存储库设置和权限设置 - 对于非开发人员来说,技术入门具有挑战性,但是一旦配置好,它将改变日常工作流程。
  • 使用自定义记忆文件来指导Claude的行为: 创建具体的说明,告诉Claude您是一位编码经验很少的设计师,需要详细的解释和较小的增量更改,从而大大提高了Claude响应的质量,并使其不那么令人生畏。
  • 利用图像粘贴进行原型设计: 使用Command+V将屏幕截图直接粘贴到Claude Code中。它擅长读取设计并生成功能代码,这使其对于将静态模型转换为工程师可以立即理解和构建的交互式原型非常有价值。

Claude Code在RL工程中的应用

RL工程团队专注于RL中的高效采样和集群上的权重转移。他们主要使用Claude Code来编写中小型功能、调试和理解复杂的代码库,并采用迭代方法,包括频繁的检查点和回滚。

主要用例:

  • 具有监督自主性的功能开发: 团队让Claude Code编写中小型功能的大部分代码,同时提供监督,例如为权重转移组件实施身份验证机制。他们以交互方式工作,允许Claude发挥主导作用,但在它偏离轨道时对其进行指导。

  • 测试生成和代码审查: 在自己实施变更后,团队要求Claude Code添加测试或审查他们的代码。这种自动化的测试工作流程节省了例行但重要的质量保证任务的大量时间。

  • 调试和错误调查: 他们使用Claude Code来调试错误,结果好坏参半。有时它可以立即识别问题并添加相关的测试,而另一些时候它很难理解问题,但是总的来说,当它起作用时会提供价值。

  • 代码库理解和调用堆栈分析: 他们工作流程中最大的变化之一是使用Claude Code来快速总结相关组件和调用堆栈,从而取代了手动代码阅读或广泛的调试输出生成。

  • Kubernetes操作指南: 他们经常向Claude Code询问Kubernetes操作,否则需要大量的Google搜索或向其基础设施工程中的对应人员询问,从而立即获得配置和部署问题的答案。

开发工作流程影响:

  • 启用了实验方法: 他们现在使用“尝试和回滚”方法,经常提交检查点,以便他们可以测试Claude的自主实施尝试并在需要时进行恢复,从而启用更多的实验。

  • 文档加速: Claude Code会自动添加有用的注释,从而节省了大量的文档编写时间,尽管他们注意到它有时会在奇怪的地方添加注释或使用有问题的代码组织。

  • 加速但有限制: 虽然Claude Code可以用“相对较少的时间”来实现中小型PR,但他们承认它仅在约三分之一的时间内首次尝试有效,需要额外的指导或手动干预。

RL工程团队的建议:

  • 为特定模式自定义您的Claude.md文件: 将说明添加到您的Claude.md文件中,以防止Claude重复进行工具调用错误,例如告诉它“运行pytest而不是run,不要不必要地cd - 只需使用正确的路径。”这大大提高了输出一致性。
  • 使用检查点密集型工作流程: 在Claude进行更改时定期提交您的工作,以便您可以在实验失败时轻松回滚。这使得可以采用更具实验性的开发方法,而没有风险。
  • 先尝试一次性,然后协作: 给Claude一个快速提示,然后让它首先尝试完整的实施。如果它起作用(大约三分之一的时间),那么您已经节省了大量时间。如果不起作用,则切换到更具协作性的指导方法。

Claude Code在法律领域的应用

法律团队通过实验和了解Anthropic产品产品的愿望发现了Claude Code的潜力。此外,一位团队成员有一个与为家人和工作原型创建可访问性工具相关的个人用例,这些原型展示了该技术对非开发人员的力量。

主要用例:

  • 为家庭成员提供定制的可访问性解决方案: 团队成员为因医疗诊断而导致说话困难的家庭成员构建了交流助手。在短短一个小时内,一个人使用本机语音转文本创建了一个预测文本应用程序,该应用程序建议响应并使用语音库来说出它们,从而解决了语音治疗师推荐的现有可访问性工具中的差距。

  • 法律部门工作流程自动化: 该团队创建了原型“电话树”系统,以帮助团队成员与Anthropic的合适律师联系,从而展示了法律部门如何为常见任务构建自定义工具,而无需传统的开发资源。

  • 团队协调工具: 管理人员构建了G Suite应用程序,这些应用程序可以自动执行每周团队更新并跟踪跨产品的法律审查状态,从而使律师可以通过简单的按钮点击而不是电子表格管理来快速标记需要审查的项目。

  • 用于解决方案验证的快速原型设计: 他们使用Claude Code快速构建功能原型,可以向领域专家展示(例如向UCSF专家展示可访问性工具),以在投入更多时间之前验证想法并识别现有解决方案。

工作方式和影响:

  • 在Claude.ai中计划,在Claude Code中构建: 他们使用一个两步过程,首先使用Claude.ai进行头脑风暴和计划,然后转移到Claude Code进行实施,要求它放慢速度并逐步工作,而不是一次输出所有内容。
  • 视觉优先方法: 他们经常使用屏幕截图向Claude Code展示他们希望界面是什么样的,然后根据视觉反馈而不是用文本描述功能进行迭代。
  • 原型驱动的创新: 他们强调克服分享“愚蠢”或“玩具”原型的恐惧,因为这些演示激发了其他人看到他们未曾考虑的可能性。

安全性和合规性意识:

  • MCP集成问题: 产品律师使用Claude Code立即识别深度MCP集成的安全隐患,并指出保守的安全姿态将在AI工具访问更多敏感系统时造成障碍。
  • 合规工具优先级: 他们主张随着AI功能的扩展,迅速构建合规工具,认识到创新和风险管理之间的平衡。

法律部门的建议:

  • 首先在Claude.ai中进行广泛的计划: 在转移到Claude Code之前,使用Claude的对话界面来充实您的整个想法。然后要求Claude将所有内容总结为一个逐步实施的提示。
  • 逐步且以视觉方式工作: 要求Claude Code放慢速度并一次实施一个步骤,以便您可以进行复制粘贴而不会不知所措。自由使用屏幕截图来展示您希望界面是什么样的。
  • 尽管不完美也要共享原型: 克服隐藏“玩具”项目或未完成工作的冲动。共享原型可以帮助其他人看到可能性,并在通常不互动的部门之间激发创新。