德勤AI幻觉报告风波:专业咨询服务的信任危机

1

事件概述:一份价值44万澳元的报告

2025年10月,德勤澳大利亚公司宣布将向澳大利亚政府退还部分款项,原因是为政府撰写的一份报告中充斥着大量由AI生成的虚假引文和不存在的研究来源。这份名为《目标合规框架保证审查》的报告最终于7月完成,并于8月由澳大利亚就业和劳动关系部(DEWR)发布。

德勤报告封面

这份报告聚焦于政府用于自动化福利系统处罚的技术框架,澳大利亚纳税人为此支付了近44万澳元(约29万美元)的费用。然而,报告发布后不久,悉尼大学健康法副主任克里斯·鲁奇(Chris Rudge)发现了多处问题引文,包括多篇引用了丽莎·伯顿·克劳福德(Lisa Burton Crawford)教授的所谓研究,而克劳福德教授是悉尼大学法学院的真实学者,但从未发表过报告中引用的那些研究。

问题的发现:虚假引文的连锁反应

"看到以这种方式将研究归功于我,我感到担忧,"克劳福德教授在8月接受《澳大利亚金融评论》采访时表示,"我希望看到德勤对如何生成这些引文的解释。"

AI生成内容示例

鲁奇教授的发现引发了一系列连锁反应。调查发现,报告中不仅包含了克劳福德教授的虚构研究成果,还引用了其他多位学者的不存在论文,甚至包括一段编造的、 attributed to 联邦法官詹妮弗·戴维斯(Jennifer Davies)的虚假引文(报告中拼写为"Davis")。

这些虚假内容并非孤立案例。在原始报告的141个来源引用中,只有127个出现在更新的版本中。删除的内容包括多位学者的虚构研究成果和那段编造的法官引文。

德勤的回应:"少量更正"

面对质疑,德勤和DEWR在周五发布的原始报告更新版中做出了回应,声称这是为了"解决引文和脚注的少量更正"。

在更新后报告的第58页(共273页)中,德勤添加了一个对"基于生成式AI大语言模型(Azure OpenAI GPT-4o)的工具链"的引用,承认该工具被用作技术工作流的一部分,帮助"评估系统代码状态是否可以映射到业务需求和合规需求"。

德勤澳大利亚公司表示将退还其与政府合同的最后一期款项,但未明确说明这一款项占总合同金额的比例。DEWR的一位发言人对AFR表示,"独立审查的内容得以保留,建议没有变化。"

专家观点:信任的基础已被动摇

然而,悉尼大学的鲁奇教授对这一解释持不同看法。他告诉AFR:"当报告的基础建立在有缺陷、未披露且非专业的方法上时,你无法信任其建议...德勤承认将生成式AI用于核心分析任务,但最初未能披露这一点。"

这一观点直指问题的核心:专业咨询服务的价值建立在信任基础上,而信任来自于透明度和专业性。当一家顶级咨询公司在其核心分析工作中使用AI工具却不披露时,不仅损害了其自身声誉,也可能对整个行业的信任造成深远影响。

行业影响:AI在专业服务中的角色

这一事件引发了关于AI在专业咨询服务中应用的广泛讨论。随着AI工具变得越来越强大,它们正在改变专业工作的方式,但也带来了新的挑战和风险。

专业咨询服务依赖于分析能力、专业知识和判断力。AI可以成为强大的辅助工具,帮助处理大量数据、生成初步见解或加速某些流程。然而,当AI被用于核心分析任务时,其局限性——如"幻觉"问题(即生成看似合理但实际错误或虚构的内容)——可能导致严重后果。

在德勤的案例中,AI不仅生成了虚假引文,还可能影响了报告的分析质量和结论。这引发了一个关键问题:专业服务公司应该如何界定和使用AI工具,以确保其工作质量不受影响?

透明度与责任:专业服务的新挑战

德勤事件凸显了专业服务公司在使用AI时面临的透明度和责任挑战。一方面,AI工具可以提高效率和洞察力;另一方面,它们也可能引入新的风险和不确定性。

专业服务公司需要建立明确的政策,规定在哪些情况下可以使用AI工具,如何验证AI生成的内容,以及何时需要向客户披露AI的使用。这些政策不仅关乎质量控制,也关乎专业诚信和客户信任。

此外,当AI导致错误或问题时,责任归属变得复杂。是使用AI工具的个人分析师的责任?是开发AI工具的技术公司的责任?还是采用这些工具的专业服务公司的责任?德勤事件表明,在当前法律和监管框架下,专业服务公司可能最终承担主要责任,无论它们是否直接导致了问题。

未来展望:专业服务行业的变革

德勤的AI幻觉报告事件可能成为专业服务行业的一个转折点。随着AI技术的不断发展,专业服务公司将面临更大的压力来重新思考其业务模式、工作流程和价值主张。

未来的专业服务可能会更加注重人类专业判断与AI辅助的结合,强调人类分析师在验证AI输出、提供情境理解和做出最终决策方面的关键作用。同时,专业服务公司可能需要投资于新的培训项目,帮助员工理解AI工具的局限性和风险,并开发有效的工作流程来减轻这些风险。

此外,监管机构也可能加强对专业服务公司使用AI的监督,制定更明确的指南和标准,以确保AI的使用不会损害专业服务的质量和完整性。

结论:信任与创新的平衡

德勤的AI幻觉报告事件提醒我们,在拥抱技术创新的同时,专业服务行业必须坚守其核心价值:信任、诚信和质量。AI工具可以成为强大的盟友,但它们不能替代人类的判断力和责任感。

专业服务公司需要在创新与信任之间找到平衡,确保新技术能够增强而非削弱其为客户提供价值的能力。这可能意味着更加透明地使用AI工具,更加严格地验证AI生成的内容,以及更加明确地界定人类与AI在专业工作中的角色和责任。

在AI时代,专业服务的价值可能不再仅仅来自于分析能力或专业知识,而是来自于这些元素与人类判断、道德考量和责任意识的结合。德勤的事件是一个警示,也是一个机会,让整个行业重新思考如何在技术变革中保持其核心价值和竞争优势。