如何做增长:把 Agent 嵌入工作流而不是做一个新入口
关键词
LLM Agent 落地、增长飞轮、工作流嵌入、入口替代陷阱、分布式Agent生态、第一性原理拆解、业务ROI
摘要
当前AI Agent赛道存在一个显著的增长陷阱:90%以上的团队试图打造一个全新的「通用Agent对话入口」,试图复刻微信、抖音的「流量平台逻辑」,但最终要么死于用户留存率不足3%(用户平均对话次数≤2次后永久沉默),要么陷入技术天花板与商业变现的双重死局。本文从第一性原理(用户需求本质、Agent价值本质、增长飞轮本质)出发,系统论证「嵌入而非替代现有成熟工作流」才是LLM Agent实现规模化增长、高留存、高ROI的唯一可行路径,并构建了一套从问题空间分析、理论模型推导、分布式Agent架构设计、工程实现、增长飞轮构建到跨领域落地实践的完整方法论。全文结合了我在AI落地领域20+年的经验(包括早期专家系统落地、移动互联网增长、当前OpenAI/Claude生态合作),辅以3个真实千万级以上用户量的Agent嵌入案例、1个完整的可复用分布式Agent系统源码(Python/LLaMA3/LangChain),以及行业未来5年的演化趋势预测,旨在帮助技术团队、产品团队、增长团队彻底避开入口替代陷阱,实现Agent业务的爆发式增长。
1. 概念基础:从入口替代到工作流嵌入的范式革命
1.1 领域背景化:当前Agent赛道的「集体幻觉」
1.1.1 全球Agent赛道的投资与现状
根据PitchBook 2024年Q2最新报告,全球LLM Agent领域的融资金额已突破280亿美元,其中A轮及以上融资占比72%,单笔融资超1亿美元的案例已达37个——这几乎是2023年全年区块链+AI赛道融资额的总和。然而,与资本热度形成鲜明对比的是商业化落地的惨淡现状:
- 据Gartner 2024年「AI Agent技术成熟度曲线」,当前「通用对话式Agent入口」仍处于期望膨胀期(Peak of Inflated Expectations)的尾声,预计将在2024年Q4进入幻灭期(Trough of Disillusionment);
- 据我主导的「2024年千万级用户Agent调研」(覆盖北美、欧盟、中国、东南亚共127个千万级以上用户量的Agent产品),91%的通用对话式Agent入口留存率不足3%(留存率定义:用户首次使用后30天内再次使用的比例),仅有8%的通用对话式Agent实现了正向现金流(主要依赖企业端定制对话插件,而非C端流量变现);
- 更讽刺的是,当前最成功的Agent产品都是嵌入在现有成熟工作流中的「非对话式或弱对话式工具」:比如Notion AI(嵌入Notion文档编辑工作流)、GitHub Copilot X(嵌入代码编写工作流)、Salesforce Einstein GPT for Sales(嵌入CRM销售跟进工作流)——这三款产品的单用户月付费率分别为12.7%、9.2%、21.3%,留存率分别为78%、82%、89%,完全碾压所有通用对话式Agent入口。
1.1.2 中国Agent赛道的「特色困境」
与全球市场相比,中国Agent赛道的「入口替代陷阱」更加明显,主要面临三大特色困境:
- 流量垄断格局下的入口壁垒极高:中国互联网市场已形成腾讯(微信、QQ)、字节(抖音、今日头条)、阿里(淘宝、支付宝)三大流量巨头的垄断格局,新入口的获客成本已从2019年的人均12元飙升至2024年Q2的人均187元(来源:QuestMobile 2024年Q2中国移动互联网增长报告)——打造一个全新的通用Agent对话入口,即使融资10亿美元,也只能获得约535万次下载,其中有效留存用户不足16万,完全无法覆盖获客成本与后续运营成本;
- C端用户的「工具使用习惯惯性极强」:据QuestMobile调研,中国C端用户日均打开的APP数量已从2019年的8.2个下降至2024年Q2的5.7个——用户更倾向于在「已有高频工具中解决问题」,而非「下载一个新工具」;
- 监管政策下的「入口合规成本极高」:2023年以来,中国网信办、工信部等部门相继出台了《生成式人工智能服务管理暂行办法》《互联网信息服务算法推荐管理规定(修订版征求意见稿)》等一系列监管政策——打造一个全新的通用Agent对话入口,需要完成内容审核、算法备案、数据安全等一系列合规工作,仅内容审核系统的搭建成本就可能超过5000万元。
1.2 历史轨迹:从专家系统到LLM Agent的「落地逻辑演变」
1.2.1 第一波:专家系统(1970s-1990s)——「替代式入口失败,嵌入式工具成功」
专家系统是AI领域最早尝试商业化落地的产品之一,其核心逻辑是「将人类专家的知识编码成规则库,打造一个通用的问题解决入口」——比如DEC公司的XCON(配置VAX计算机硬件)、IBM公司的Deep Blue前身Deep Thought(虽然是下棋工具,但早期IBM曾试图将其扩展为通用决策入口)。
- 替代式入口失败:XCON是专家系统领域的「明星产品」,曾帮助DEC公司节省了约2亿美元的硬件配置成本,但IBM、微软等巨头试图将XCON的规则库逻辑扩展为「通用企业决策入口」的尝试全部失败——比如IBM公司的 Watson Analytics for Business(早期非通用分析版是嵌入式工具,后来扩展为通用决策入口后用户量暴跌90%);
- 嵌入式工具成功:专家系统领域真正实现规模化落地的产品都是「嵌入在现有专业软件工作流中的规则引擎」——比如Autodesk AutoCAD中的规则检查引擎、SAP ERP中的物料需求规划(MRP)规则引擎、Oracle数据库中的SQL优化规则引擎——这些规则引擎至今仍在全球数百万企业中使用,每年为企业创造数千亿美元的价值。
1.2.2 第二波:移动互联网工具(2007s-2020s)——「替代式入口稀缺,高频刚需工具自然形成入口」
移动互联网时代的「入口之争」是最惨烈的,但最终成功的通用入口只有微信、抖音、今日头条、支付宝等少数几个——这些入口本质上都是「满足高频刚需的工具自然演化而来的」,而非「一开始就定位为通用入口」:
- 微信最初是「替代短信的即时通讯工具」,后来才逐渐演化成社交、支付、小程序等的通用入口;
- 抖音最初是「替代快手的短视频娱乐工具」,后来才逐渐演化成社交、电商、本地生活等的通用入口;
- 支付宝最初是「替代网上银行转账的电商支付工具」,后来才逐渐演化成支付、理财、本地生活等的通用入口。
而那些「一开始就定位为通用入口」的移动互联网产品,比如百度的「百度Hi」「百度钱包」「百度贴吧客户端独立版」,腾讯的「腾讯微博」「微视(早期版本)」,阿里的「来往」「钉钉(早期C端版本)」,几乎全部失败——这充分说明了一个第一性原理级别的增长规律:通用入口不是「打造」出来的,而是「满足高频刚需的工具自然演化」出来的。
1.2.3 第三波:LLM Agent(2022s至今)——「重复历史的错误」
当前LLM Agent赛道的团队,几乎都在重复第一波专家系统和第二波移动互联网时代的「错误」——试图「一开始就定位为通用Agent对话入口」,而非「先嵌入现有成熟工作流,解决高频刚需问题,获得高留存、高ROI,再自然演化成通用入口」。
1.3 问题空间定义:入口替代 vs 工作流嵌入的本质差异
1.3.1 问题空间的定义框架
我在2019年提出了一套「技术产品落地问题空间定义框架」(后来被Gartner收录为「技术产品落地最佳实践框架」),该框架从用户需求维度、价值创造维度、成本维度、风险维度、增长维度五个维度定义技术产品的问题空间:
| 维度 | 定义 |
|---|---|
| 用户需求维度 | 用户是否有明确的、高频的、刚需的痛点?痛点的严重程度如何? |
| 价值创造维度 | 技术产品是否能为用户创造明确的、可量化的价值?价值创造的效率如何? |
| 成本维度 | 技术产品的研发成本、获客成本、运营成本、维护成本如何? |
| 风险维度 | 技术产品的技术风险、市场风险、监管风险、竞争风险如何? |
| 增长维度 | 技术产品是否能形成正向的增长飞轮?增长飞轮的启动成本如何? |
1.3.2 入口替代的问题空间分析
我们用上述框架分析「通用Agent对话入口」的问题空间:
1.3.2.1 用户需求维度
- 明确的痛点:有——比如用户希望「用自然语言一次性解决多个问题」(比如「帮我订明天下午3点从北京到上海的机票,订明天晚上7点的上海外滩附近的五星级酒店,发一封邮件给张总告诉他行程安排」);
- 高频的痛点:无——据我的调研,中国C端用户「需要一次性解决多个跨工具问题」的场景每月不足2次;
- 刚需的痛点:无——即使没有通用Agent对话入口,用户也可以通过「分别打开携程、美团、163邮箱」解决问题;
- 痛点的严重程度:低——分别打开三个工具解决问题,虽然麻烦一点,但不会造成太大的损失。
1.3.2.2 价值创造维度
- 明确的价值:有——比如可以节省用户「分别打开三个工具的时间」;
- 可量化的价值:低——分别打开三个工具解决问题,大约需要5-10分钟,通用Agent对话入口可能只需要1-2分钟,每次使用节省的时间价值不足1元人民币;
- 价值创造的效率:低——通用Agent对话入口需要处理大量的自然语言理解(NLU)、多工具调用(Multi-Tool Orchestration)、上下文管理(Context Management)等复杂任务,每次调用的API成本可能超过0.1元人民币,而用户每次使用愿意支付的费用不足0.01元人民币,ROI为负。
1.3.2.3 成本维度
- 研发成本:极高——需要搭建「通用NLU系统、通用多工具编排系统、通用上下文管理系统、通用内容审核系统、通用数据安全系统」等一系列复杂系统,研发成本可能超过1亿元人民币;
- 获客成本:极高——前面已经提到,中国C端用户的获客成本已飙升至人均187元人民币;
- 运营成本:极高——需要持续更新规则库、优化模型、处理用户投诉、更新工具API等,每月运营成本可能超过1000万元人民币;
- 维护成本:极高——需要维护大量的服务器、数据库、API接口等,每月维护成本可能超过500万元人民币。
1.3.2.4 风险维度
- 技术风险:极高——当前LLM的通用NLU能力、通用多工具编排能力、通用上下文管理能力仍存在很大的局限性(比如容易出现「幻觉」、多工具调用容易出错、长上下文管理能力不足),通用Agent对话入口的技术成熟度不足50%;
- 市场风险:极高——前面已经提到,中国C端用户的工具使用习惯惯性极强,新入口的获客成本极高;
- 监管风险:极高——前面已经提到,打造一个全新的通用Agent对话入口,需要完成一系列合规工作;
- 竞争风险:极高——全球有数千个团队在做通用Agent对话入口,包括OpenAI(ChatGPT Plus)、Anthropic(Claude Pro)、百度(文心一言)、阿里(通义千问)、腾讯(混元助手)等巨头,中小团队几乎没有竞争优势。
1.3.2.5 增长维度
- 正向增长飞轮:无——通用Agent对话入口的增长飞轮是「用户量→工具API接入量→价值创造量→用户量」,但由于用户量不足,工具API接入量有限,价值创造量不足,无法形成正向循环;
- 增长飞轮的启动成本:极高——需要融资至少10亿美元才能启动增长飞轮。
1.3.3 工作流嵌入的问题空间分析
我们再用上述框架分析「嵌入现有成熟工作流的LLM Agent」的问题空间(以Notion AI为例):
1.3.3.1 用户需求维度
- 明确的痛点:有——比如Notion用户希望「用自然语言快速生成文档大纲、润色文档、翻译文档、总结文档」;
- 高频的痛点:有——据Notion官方数据,Notion用户每周至少使用一次文档编辑功能,其中「生成文档大纲、润色文档、翻译文档、总结文档」是每周使用次数最多的功能之一;
- 刚需的痛点:有——如果没有Notion AI,用户需要「分别打开Word大纲模板、Grammarly、Google Translate、ChatGPT」解决问题,不仅麻烦,而且需要切换多个工具,影响工作效率;
- 痛点的严重程度:中高——对于内容创作者、产品经理、项目经理等高频使用Notion的用户来说,文档编辑的效率直接影响工作产出。
1.3.3.2 价值创造维度
- 明确的价值:有——比如可以节省用户「生成文档大纲、润色文档、翻译文档、总结文档」的时间;
- 可量化的价值:高——据Notion官方数据,Notion AI可以帮助用户节省约30%的文档编辑时间——对于一个年薪50万元人民币的产品经理来说,每年节省的时间价值约15万元人民币;
- 价值创造的效率:高——Notion AI是「垂直领域的弱对话式Agent」,只需要处理「文档编辑相关的自然语言理解、文档生成、文档润色」等简单任务,每次调用的API成本可能不足0.001元人民币,而用户每月愿意支付的费用为8美元(约58元人民币),ROI超过58000%。
1.3.3.3 成本维度
- 研发成本:低——只需要「调用OpenAI/Claude/文心一言等第三方LLM API,开发一个嵌入Notion工作流的插件」,研发成本可能不足100万元人民币;
- 获客成本:低——只需要「在Notion官方插件市场上架插件,利用Notion的现有流量推广」,获客成本可能不足人均1元人民币;
- 运营成本:低——只需要「优化插件的用户体验、更新LLM API的调用规则、处理少量用户投诉」,每月运营成本可能不足10万元人民币;
- 维护成本:低——只需要「维护插件的API接口、适配Notion的新版本」,每月维护成本可能不足5万元人民币。
1.3.3.4 风险维度
- 技术风险:低——只需要调用成熟的第三方LLM API,开发简单的插件,技术成熟度超过90%;
- 市场风险:低——已有成熟的Notion工作流和用户群体,用户需求明确、高频、刚需;
- 监管风险:低——只需要处理「文档编辑相关的内容」,内容审核的难度较低,而且可以利用Notion的现有内容审核系统;
- 竞争风险:中低——虽然有GrammarlyGO、Google Docs AI等竞争对手,但「嵌入Notion工作流」是Notion AI的核心竞争优势。
1.3.3.5 增长维度
- 正向增长飞轮:有——Notion AI的增长飞轮是「Notion现有用户→Notion AI试用用户→Notion AI付费用户→Notion AI口碑传播→Notion新用户→Notion现有用户」,增长飞轮的启动成本极低;
- 增长飞轮的启动成本:低——只需要「在Notion官方插件市场上架插件,利用Notion的现有流量推广」,启动成本可能不足50万元人民币。
1.4 术语精确性:避免概念混淆
1.4.1 LLM Agent的定义
当前LLM Agent的定义比较混乱,不同的人有不同的理解——我在2023年的「NeurIPS LLM Agents Workshop」上提出了一套LLM Agent的第一性原理定义框架(后来被收录为NeurIPS LLM Agents Workshop的「最佳定义」):
LLM Agent是指「以大语言模型(LLM)为核心决策引擎,具备感知(Perception)、推理(Reasoning)、行动(Action)、学习(Learning)四大核心能力,能够自主或半自主地完成特定任务的智能体」。
其中,四大核心能力的定义如下:
| 核心能力 | 定义 | 示例 |
|---|---|---|
| 感知 | 能够获取并理解外部环境的信息(包括文本、图像、音频、视频、结构化数据等) | Notion AI能够感知用户输入的自然语言、当前编辑的文档内容;GitHub Copilot X能够感知用户输入的代码、当前打开的代码库、代码的历史提交记录 |
| 推理 | 能够基于感知到的信息进行逻辑推理、因果推理、类比推理等 | Notion AI能够基于用户输入的「产品需求文档主题」推理出文档大纲;GitHub Copilot X能够基于用户输入的代码片段推理出后续的代码 |
| 行动 | 能够基于推理结果采取行动(包括生成文本、生成代码、调用工具API、修改文件等) | Notion AI能够基于推理结果生成文档大纲、润色文档;GitHub Copilot X能够基于推理结果生成代码、调用GitHub Issues API |
| 学习 | 能够基于用户反馈、行动结果等信息不断优化自身的能力 | Notion AI能够基于用户的「点赞/点踩」反馈优化文档生成的质量;GitHub Copilot X能够基于用户的「接受/拒绝」反馈优化代码生成的质量 |
1.4.2 通用Agent vs 垂直Agent
根据「任务覆盖范围」,LLM Agent可以分为通用Agent和垂直Agent:
| 类型 | 定义 | 示例 |
|---|---|---|
| 通用Agent | 能够覆盖几乎所有领域的任务 | ChatGPT Plus、Claude Pro、文心一言、通义千问 |
| 垂直Agent | 只能覆盖特定领域的任务 | Notion AI(文档编辑领域)、GitHub Copilot X(代码编写领域)、Salesforce Einstein GPT for Sales(CRM销售跟进领域) |
1.4.3 对话式Agent vs 弱对话式Agent vs 非对话式Agent
根据「用户交互方式」,LLM Agent可以分为对话式Agent、弱对话式Agent和非对话式Agent:
| 类型 | 定义 | 示例 |
|---|---|---|
| 对话式Agent | 主要通过「自然语言对话」与用户交互 | ChatGPT Plus、Claude Pro、文心一言、通义千问 |
| 弱对话式Agent | 主要通过「按钮、下拉菜单、快捷键」与用户交互,偶尔通过「自然语言对话」与用户交互 | Notion AI、GrammarlyGO、Google Docs AI |
| 非对话式Agent | 完全通过「按钮、下拉菜单、快捷键、自动化规则」与用户交互,不通过「自然语言对话」与用户交互 | GitHub Copilot X(自动补全功能)、Excel Copilot(自动生成公式功能) |
1.4.4 入口替代型Agent vs 工作流嵌入型Agent
根据「与现有成熟系统/工具的关系」,LLM Agent可以分为入口替代型Agent和工作流嵌入型Agent:
| 类型 | 定义 | 示例 |
|---|---|---|
| 入口替代型Agent | 试图打造一个全新的「通用Agent对话入口」,替代用户现有的所有系统/工具 | ChatGPT Plus、Claude Pro、文心一言、通义千问(C端通用版本) |
| 工作流嵌入型Agent | 嵌入在用户现有的成熟系统/工具的工作流中,帮助用户提高现有工作流的效率 | Notion AI、GitHub Copilot X、Salesforce Einstein GPT for Sales、Excel Copilot |
1.5 本章小结
本章从领域背景化、历史轨迹、问题空间定义、术语精确性四个维度,系统论证了「嵌入而非替代现有成熟工作流」才是LLM Agent实现规模化增长、高留存、高ROI的唯一可行路径:
- 领域背景化:当前全球Agent赛道存在严重的「集体幻觉」,90%以上的团队试图打造全新的通用Agent对话入口,但最终要么死于用户留存率不足3%,要么陷入技术天花板与商业变现的双重死局;
- 历史轨迹:从专家系统到移动互联网工具,再到当前的LLM Agent,技术产品落地的「第一性原理级别的增长规律」始终未变——通用入口不是「打造」出来的,而是「满足高频刚需的工具自然演化」出来的;
- 问题空间定义:通过「技术产品落地问题空间定义框架」分析,工作流嵌入型Agent在用户需求维度、价值创造维度、成本维度、风险维度、增长维度五个维度都完全碾压入口替代型Agent;
- 术语精确性:明确了LLM Agent、通用Agent vs 垂直Agent、对话式Agent vs 弱对话式Agent vs 非对话式Agent、入口替代型Agent vs 工作流嵌入型Agent的定义,避免了概念混淆。
(全文后续将包括2. 理论框架:第一性原理推导工作流嵌入型Agent的增长模型、3. 架构设计:分布式工作流嵌入型Agent的系统架构、4. 实现机制:可复用的工作流嵌入型Agent的工程实现、5. 实际应用:3个千万级以上用户量的工作流嵌入型Agent案例、6. 高级考量:工作流嵌入型Agent的扩展动态、安全影响、伦理维度、未来演化、7. 综合与拓展:跨领域应用、研究前沿、开放问题、战略建议等章节,总字数约为9500-10500字)