Databricks报告：仅19%组织部署AI智能体，企业实施需考虑三大要素-编程实验室

ZDNET关键要点

建立治理和评估机制是设计智能体（agents）的关键。应从小规模应用智能体入手，而非直接取代整个工作流程。干净、组织良好的数据能让所有智能体工作更顺畅。

微软人工智能首席执行官穆斯塔法·苏莱曼（Mustafa Suleyman）在为《麻省理工科技评论》撰写的专栏文章中表示，计算技术正处于“接近人类水平智能体”的门槛。

特别专题：自主智能体AI：提升效率、赋能员工并改变成果

自主智能体AI正在改变所有行业的工作性质。本专题揭示各组织如何在所有部门实施和管理自主智能体AI，深入剖析其在关键指标上的投资回报率，探讨如何通过最佳实践实现自主智能体AI投资回报的最大化。[立即阅读]

但在此过程中存在许多障碍。企业在重新设计工作流程以及确定自主智能体AI程序应访问哪些信息方面力不从心。此外，还有“自主编程末日”的5大误区。

数据库技术巨头Databricks在《AI智能体现状报告》中指出，这些挑战导致“只有19%的组织部署了AI智能体，而且大多是有限程度的部署”。

Databricks的AI负责人克雷格·威利（Craig Wiley）告诉ZDNET：“和很多首席财务官交谈，他们会说‘我有三个担忧’：能否控制它；能否判断它是否有效（即模型输出是否真正有价值）；以及成本如何？”

威利表示，为解决这些担忧，企业在实施智能体之前应预先考虑三个最佳实践：控制它（治理）、评估其正确性、从小规模开始以实现效率和回报的最大化。此外，麻省理工学院的研究发现，AI智能体运行速度快、缺乏约束且不受控制。

能否控制它？

“能否控制它？”归根结底是治理实践，首先要控制智能体可以访问的数据。AI智能体是一种人工智能程序，能超越ChatGPT等类似聊天机器人提供的简单逐轮提示。智能体可接入企业资源，如数据库；可执行大型语言模型之外的计算机代码；可调用外部程序，如电子邮件系统；还可将多种不同类型的操作组合起来执行整个工作流程。此外，介绍了如何为企业构建更好的AI智能体而不引发信任问题。

数据访问的首要原则是不造成伤害。Databricks的客户——女性健康应用程序Flow拥有7500万用户，用该应用进行个性化评估和咨询。威利解释说：“他们面临的挑战是，希望为应用用户提供越来越强大的反馈、建议和洞察。但他们必须极其谨慎，因为这是非常敏感的数据，他们最不希望看到的是应用用户收到包含其他用户信息的回复。”此外，有人在5分钟内用Tasklet为工作构建了一个应用，实现了无代码梦想。

为防止此类数据泄露，威利表示，治理系统“应该能够有选择地指出，‘嘿，这些工具或这些数据，是每个人都可以使用的；而这里的数据只能由特定用户使用’”。资产管理公司富兰克林邓普顿（Franklin Templeton）在向客户发送投资组合报告时也采取了类似的谨慎措施。他指出：“作为基金客户，我最不希望收到财务顾问发来的关于其他人信息的邮件。”他还说：“我们经常看到，客户对某个用例非常兴奋，开始推进它，但随后遇到问题，他们会说‘哦，我们的问题或回复需要根据用户的不同而有所不同’。这需要强制执行，而不仅仅是在提示中建议，必须明确强制实施。”

关联数据中的关键信息

治理的另一部分是明确问题，并确定能够提供答案的资源。威利这样描述挑战：“我如何将我的问题与完美的数据相匹配，并用合适的模型来支持我的问题以获得回应？”目标是避免让自主智能体AI程序像聊天机器人那样“事务化”，即避免用户不断提出新问题。此外，有人询问了5位数据领域的领导者如何使用AI实现自动化并终结集成难题。

设计智能体时，应使其能够找到许多相互关联的数据，让人类用户能够自动深入了解主题。威利以在线汽车购买平台Edmunds为例，该公司为内部使用创建了一个名为Edmunds Mind的自主信息工具，用于高效管理汽车销售。这个工具旨在整合潜在购买的更多方面。威利解释说：“他们不再只是询问哪款敞篷车最好以及价格多少，而是可以综合查看交通数据、人口统计数据、列表数据和定价数据，询问哪些汽车经销商服务不足。”他表示，这样的智能体“可能会采取一系列步骤来确保回复的高质量，这样用户就不必为模型提供所有信息”。

为实施治理，有一种叫做数据目录的工具可以发挥两个作用。首先，它就像一个“单一窗口”，让IT管理员可以查看智能体可以访问的所有内容，包括结构化和非结构化数据、外部工具调用的模型上下文协议以及正在调用的工具。此外，介绍了如何构建一个有回报且不会导致业务失败的自主AI战略。

其次，数据目录会强制执行身份管理，包括智能体的身份、它可以访问的信息以及用户的身份。目录会在智能体的整个活动过程中跟踪这些身份，以实现数据的分段管理，确保数据仅由智能体和用户在其身份权限允许的范围内访问。威利说，从一开始就将治理作为设计的首要原则，会使客户比那些随意行事的人更有可能将智能体投入生产。“这实际上取决于设计的严谨性。”

如何判断其正确性？

第二个要素是要认真思考如何评估模型的输出。威利说，当Flow的应用程序开发人员“追求准确性时，评估这些智能体是否说出了应说内容的实际上是医生，而不是程序员。软件程序员编写所谓的编排系统来管理智能体，但判断‘这个回复需要更多背景信息或细节’的是医生”。

威利表示，评估工作在程序的整个生命周期内持续进行，并且涉及多个层面。“不仅要关注智能体被问到了什么以及它给出了什么答案，还要关注它思考的每一个中间步骤，它到底在做什么，以及是否朝着正确答案的方向发展？”此外，一位AI专家表示，即使你是一名程序员，工作末日也不会到来，并说明了原因。

如果出现问题，将智能体回退到评估阶段，重新部署，并“不断循环，这样我们就能构建出人们真正渴望的自动化学习型智能体”。威利指出，准确性使Flow能够向市场推出一款在用户体验质量上具有差异化的应用。他补充说，更广泛地说，与治理一样，能够评估智能体输出的公司进入生产阶段的可能性是其他公司的6倍。

小而美

第三个担忧——成本问题相对容易解决，因为它是正确实施前两项（治理和评估）的结果。威利说：“说实话，一旦你能做好这两件事，剩下的就只是实施细节了。”但从一开始就必须考虑成本。此外，介绍了智能体管理平台的兴起和风险。

威利说：“我们花了很多时间与客户讨论这个问题。‘我们能否在合理的成本范围内解决这个问题？假设我们能在这个合理的成本范围内解决问题，它是否真的能为你的公司带来改变？’”

威利继续说道：“实施过程中有一个重要的考虑因素，那就是要考虑从小规模开始，并以能够对智能体进行治理和验证的速度进行构建。我们看到不同雄心水平的公司，雄心是好事。但对于所有软件项目来说，如果我能将各个部分构建得更小、更独立，然后进行测试和确认其有效性，那么我就可以将它们组合成一个更强大的功能集合，以完成更大的任务。”

威利以便利店连锁企业7 - Eleven为例，该公司的服务技术人员需要到现场维修设备。当他们没有正确的手册时，要么是白跑一趟，要么会使工作变得比应有的更复杂。威利说，通过让智能体访问大量文档，公司可以为技术人员提供一个“超级助手”，“他们可以搜索这些机器曾经出现过的每一个问题、每一本手册和规格说明，而不必再打电话问同事‘你以前见过这个问题吗？’”此外，真正的自主AI还需要数年时间才能实现，并说明了原因和实现途径。

另一个例子是贝勒大学（Baylor University），该校使用智能体来审查与潜在学生的每一次通话记录，以分析学生选择学校的决策因素，而人工接听电话时往往没有时间或精力做全面的记录。威利说：“通过深入倾听客户的意见，他们现在对自己的组织有了更多的了解，这是他们以前从未做到过的。”

他说，试图用智能体取代整个工作流程可能不太成功。威利说：“如果我试图取代我的组织使用的ERP或SaaS系统，我最不会做的就是一开始就发出一个单一的提示，说‘嘿，我想要一个新的总账系统’。我会逐个组件地去处理。”

回报如何？

威利表示，目前要获得行业从智能体投资中获得的具体财务回报数据还为时尚早。“我们可能处于类似于2001年互联网发展的阶段，当时公司在网页上进行投资，但还不太明白这一切的目的。”

有一些令人鼓舞的实例。富兰克林邓普顿对投资组合分析的自动化使该公司发现了超过1500万美元的新产品机会，例如客户投资组合中的缺口。此外，一家旅游公司的AI推广如何推动客户满意度提升73%，并提供了适用于企业的5步策略。

企业看到了关键绩效指标（KPI）朝着正确的方向发展，例如7 - Eleven的设备首次修复率提高了25%，维修时间缩短了40%，这可以带来成本节约。

最后一个要素是构思、构建和部署所需的时间。从威利的角度来看，这又回到了在自主AI开始时“确保数据干净且处于正确的位置”。

他说，从一开始就组织好数据将提高项目的“速度”。“如果是这样，那么你的软件开发人员、数据科学家、智能体开发人员……他们就能快速推进。‘如果你的数据状况良好，我们今天下午就能完成（即构建和部署一个自主系统）。如果你的数据状况不佳，那么真正的问题将是我们需要多长时间才能整理好你的数据。’”

人工智能相关内容

我尝试了一款本地、开源且完全免费的Claude Code替代品，了解其工作原理
如何立即从Windows 11中移除Copilot AI
AI正在悄然自我毒害，推动模型走向崩溃，但有解决办法
如何识别AI生成的图像：6个明显的造假迹象以及我常用的免费检测工具

Databricks报告：仅19%组织部署AI智能体，企业实施需考虑三大要素

ZDNET关键要点

特别专题：自主智能体AI：提升效率、赋能员工并改变成果

能否控制它？

关联数据中的关键信息

如何判断其正确性？

小而美

回报如何？

人工智能相关内容

ARM Streaming SVE浮点运算与SME架构深度解析

解锁显卡隐藏性能：NVIDIA Profile Inspector完整使用指南

ComfyUI Essentials完整指南：为什么这是AI绘画工作流必备的终极工具包？

扫描全能王7.7.0逆向永久会员扫描全能王解锁至尊账户企业版

基于Docker与零侵入路由的OpenClaw多租户隔离架构实践

后端架构优化：如何应对最大最小延时约束挑战？

ZDNET关键要点

特别专题：自主智能体AI：提升效率、赋能员工并改变成果

能否控制它？

关联数据中的关键信息

如何判断其正确性？

小而美

回报如何？

人工智能相关内容

ARM Streaming SVE浮点运算与SME架构深度解析

解锁显卡隐藏性能：NVIDIA Profile Inspector完整使用指南

ComfyUI Essentials完整指南：为什么这是AI绘画工作流必备的终极工具包？

扫描全能王7.7.0逆向永久会员 扫描全能王解锁至尊账户企业版

基于Docker与零侵入路由的OpenClaw多租户隔离架构实践

后端架构优化：如何应对最大最小延时约束挑战？

扫描全能王7.7.0逆向永久会员扫描全能王解锁至尊账户企业版