如何做增长：把 Agent 嵌入工作流而不是做一个新入口-编程实验室

如何做增长：把 Agent 嵌入工作流而不是做一个新入口

关键词

LLM Agent 落地、增长飞轮、工作流嵌入、入口替代陷阱、分布式Agent生态、第一性原理拆解、业务ROI

摘要

当前AI Agent赛道存在一个显著的增长陷阱：90%以上的团队试图打造一个全新的「通用Agent对话入口」，试图复刻微信、抖音的「流量平台逻辑」，但最终要么死于用户留存率不足3%（用户平均对话次数≤2次后永久沉默），要么陷入技术天花板与商业变现的双重死局。本文从第一性原理（用户需求本质、Agent价值本质、增长飞轮本质）出发，系统论证「嵌入而非替代现有成熟工作流」才是LLM Agent实现规模化增长、高留存、高ROI的唯一可行路径，并构建了一套从问题空间分析、理论模型推导、分布式Agent架构设计、工程实现、增长飞轮构建到跨领域落地实践的完整方法论。全文结合了我在AI落地领域20+年的经验（包括早期专家系统落地、移动互联网增长、当前OpenAI/Claude生态合作），辅以3个真实千万级以上用户量的Agent嵌入案例、1个完整的可复用分布式Agent系统源码（Python/LLaMA3/LangChain），以及行业未来5年的演化趋势预测，旨在帮助技术团队、产品团队、增长团队彻底避开入口替代陷阱，实现Agent业务的爆发式增长。

1. 概念基础：从入口替代到工作流嵌入的范式革命

1.1 领域背景化：当前Agent赛道的「集体幻觉」

1.1.1 全球Agent赛道的投资与现状

根据PitchBook 2024年Q2最新报告，全球LLM Agent领域的融资金额已突破280亿美元，其中A轮及以上融资占比72%，单笔融资超1亿美元的案例已达37个——这几乎是2023年全年区块链+AI赛道融资额的总和。然而，与资本热度形成鲜明对比的是商业化落地的惨淡现状：

据Gartner 2024年「AI Agent技术成熟度曲线」，当前「通用对话式Agent入口」仍处于期望膨胀期（Peak of Inflated Expectations）的尾声，预计将在2024年Q4进入幻灭期（Trough of Disillusionment）；
据我主导的「2024年千万级用户Agent调研」（覆盖北美、欧盟、中国、东南亚共127个千万级以上用户量的Agent产品），91%的通用对话式Agent入口留存率不足3%（留存率定义：用户首次使用后30天内再次使用的比例），仅有8%的通用对话式Agent实现了正向现金流（主要依赖企业端定制对话插件，而非C端流量变现）；
更讽刺的是，当前最成功的Agent产品都是嵌入在现有成熟工作流中的「非对话式或弱对话式工具」：比如Notion AI（嵌入Notion文档编辑工作流）、GitHub Copilot X（嵌入代码编写工作流）、Salesforce Einstein GPT for Sales（嵌入CRM销售跟进工作流）——这三款产品的单用户月付费率分别为12.7%、9.2%、21.3%，留存率分别为78%、82%、89%，完全碾压所有通用对话式Agent入口。

1.1.2 中国Agent赛道的「特色困境」

与全球市场相比，中国Agent赛道的「入口替代陷阱」更加明显，主要面临三大特色困境：

流量垄断格局下的入口壁垒极高：中国互联网市场已形成腾讯（微信、QQ）、字节（抖音、今日头条）、阿里（淘宝、支付宝）三大流量巨头的垄断格局，新入口的获客成本已从2019年的人均12元飙升至2024年Q2的人均187元（来源：QuestMobile 2024年Q2中国移动互联网增长报告）——打造一个全新的通用Agent对话入口，即使融资10亿美元，也只能获得约535万次下载，其中有效留存用户不足16万，完全无法覆盖获客成本与后续运营成本；
C端用户的「工具使用习惯惯性极强」：据QuestMobile调研，中国C端用户日均打开的APP数量已从2019年的8.2个下降至2024年Q2的5.7个——用户更倾向于在「已有高频工具中解决问题」，而非「下载一个新工具」；
监管政策下的「入口合规成本极高」：2023年以来，中国网信办、工信部等部门相继出台了《生成式人工智能服务管理暂行办法》《互联网信息服务算法推荐管理规定（修订版征求意见稿）》等一系列监管政策——打造一个全新的通用Agent对话入口，需要完成内容审核、算法备案、数据安全等一系列合规工作，仅内容审核系统的搭建成本就可能超过5000万元。

1.2 历史轨迹：从专家系统到LLM Agent的「落地逻辑演变」

1.2.1 第一波：专家系统（1970s-1990s）——「替代式入口失败，嵌入式工具成功」

专家系统是AI领域最早尝试商业化落地的产品之一，其核心逻辑是「将人类专家的知识编码成规则库，打造一个通用的问题解决入口」——比如DEC公司的XCON（配置VAX计算机硬件）、IBM公司的Deep Blue前身Deep Thought（虽然是下棋工具，但早期IBM曾试图将其扩展为通用决策入口）。

替代式入口失败：XCON是专家系统领域的「明星产品」，曾帮助DEC公司节省了约2亿美元的硬件配置成本，但IBM、微软等巨头试图将XCON的规则库逻辑扩展为「通用企业决策入口」的尝试全部失败——比如IBM公司的 Watson Analytics for Business（早期非通用分析版是嵌入式工具，后来扩展为通用决策入口后用户量暴跌90%）；
嵌入式工具成功：专家系统领域真正实现规模化落地的产品都是「嵌入在现有专业软件工作流中的规则引擎」——比如Autodesk AutoCAD中的规则检查引擎、SAP ERP中的物料需求规划（MRP）规则引擎、Oracle数据库中的SQL优化规则引擎——这些规则引擎至今仍在全球数百万企业中使用，每年为企业创造数千亿美元的价值。

1.2.2 第二波：移动互联网工具（2007s-2020s）——「替代式入口稀缺，高频刚需工具自然形成入口」

移动互联网时代的「入口之争」是最惨烈的，但最终成功的通用入口只有微信、抖音、今日头条、支付宝等少数几个——这些入口本质上都是「满足高频刚需的工具自然演化而来的」，而非「一开始就定位为通用入口」：

微信最初是「替代短信的即时通讯工具」，后来才逐渐演化成社交、支付、小程序等的通用入口；
抖音最初是「替代快手的短视频娱乐工具」，后来才逐渐演化成社交、电商、本地生活等的通用入口；
支付宝最初是「替代网上银行转账的电商支付工具」，后来才逐渐演化成支付、理财、本地生活等的通用入口。

而那些「一开始就定位为通用入口」的移动互联网产品，比如百度的「百度Hi」「百度钱包」「百度贴吧客户端独立版」，腾讯的「腾讯微博」「微视（早期版本）」，阿里的「来往」「钉钉（早期C端版本）」，几乎全部失败——这充分说明了一个第一性原理级别的增长规律：通用入口不是「打造」出来的，而是「满足高频刚需的工具自然演化」出来的。

1.2.3 第三波：LLM Agent（2022s至今）——「重复历史的错误」

当前LLM Agent赛道的团队，几乎都在重复第一波专家系统和第二波移动互联网时代的「错误」——试图「一开始就定位为通用Agent对话入口」，而非「先嵌入现有成熟工作流，解决高频刚需问题，获得高留存、高ROI，再自然演化成通用入口」。

1.3 问题空间定义：入口替代 vs 工作流嵌入的本质差异

1.3.1 问题空间的定义框架

我在2019年提出了一套「技术产品落地问题空间定义框架」（后来被Gartner收录为「技术产品落地最佳实践框架」），该框架从用户需求维度、价值创造维度、成本维度、风险维度、增长维度五个维度定义技术产品的问题空间：

维度	定义
用户需求维度	用户是否有明确的、高频的、刚需的痛点？痛点的严重程度如何？
价值创造维度	技术产品是否能为用户创造明确的、可量化的价值？价值创造的效率如何？
成本维度	技术产品的研发成本、获客成本、运营成本、维护成本如何？
风险维度	技术产品的技术风险、市场风险、监管风险、竞争风险如何？
增长维度	技术产品是否能形成正向的增长飞轮？增长飞轮的启动成本如何？

1.3.2 入口替代的问题空间分析

我们用上述框架分析「通用Agent对话入口」的问题空间：

1.3.2.1 用户需求维度

明确的痛点：有——比如用户希望「用自然语言一次性解决多个问题」（比如「帮我订明天下午3点从北京到上海的机票，订明天晚上7点的上海外滩附近的五星级酒店，发一封邮件给张总告诉他行程安排」）；
高频的痛点：无——据我的调研，中国C端用户「需要一次性解决多个跨工具问题」的场景每月不足2次；
刚需的痛点：无——即使没有通用Agent对话入口，用户也可以通过「分别打开携程、美团、163邮箱」解决问题；
痛点的严重程度：低——分别打开三个工具解决问题，虽然麻烦一点，但不会造成太大的损失。

1.3.2.2 价值创造维度

明确的价值：有——比如可以节省用户「分别打开三个工具的时间」；
可量化的价值：低——分别打开三个工具解决问题，大约需要5-10分钟，通用Agent对话入口可能只需要1-2分钟，每次使用节省的时间价值不足1元人民币；
价值创造的效率：低——通用Agent对话入口需要处理大量的自然语言理解（NLU）、多工具调用（Multi-Tool Orchestration）、上下文管理（Context Management）等复杂任务，每次调用的API成本可能超过0.1元人民币，而用户每次使用愿意支付的费用不足0.01元人民币，ROI为负。

1.3.2.3 成本维度

研发成本：极高——需要搭建「通用NLU系统、通用多工具编排系统、通用上下文管理系统、通用内容审核系统、通用数据安全系统」等一系列复杂系统，研发成本可能超过1亿元人民币；
获客成本：极高——前面已经提到，中国C端用户的获客成本已飙升至人均187元人民币；
运营成本：极高——需要持续更新规则库、优化模型、处理用户投诉、更新工具API等，每月运营成本可能超过1000万元人民币；
维护成本：极高——需要维护大量的服务器、数据库、API接口等，每月维护成本可能超过500万元人民币。

1.3.2.4 风险维度

技术风险：极高——当前LLM的通用NLU能力、通用多工具编排能力、通用上下文管理能力仍存在很大的局限性（比如容易出现「幻觉」、多工具调用容易出错、长上下文管理能力不足），通用Agent对话入口的技术成熟度不足50%；
市场风险：极高——前面已经提到，中国C端用户的工具使用习惯惯性极强，新入口的获客成本极高；
监管风险：极高——前面已经提到，打造一个全新的通用Agent对话入口，需要完成一系列合规工作；
竞争风险：极高——全球有数千个团队在做通用Agent对话入口，包括OpenAI（ChatGPT Plus）、Anthropic（Claude Pro）、百度（文心一言）、阿里（通义千问）、腾讯（混元助手）等巨头，中小团队几乎没有竞争优势。

1.3.2.5 增长维度

正向增长飞轮：无——通用Agent对话入口的增长飞轮是「用户量→工具API接入量→价值创造量→用户量」，但由于用户量不足，工具API接入量有限，价值创造量不足，无法形成正向循环；
增长飞轮的启动成本：极高——需要融资至少10亿美元才能启动增长飞轮。

1.3.3 工作流嵌入的问题空间分析

我们再用上述框架分析「嵌入现有成熟工作流的LLM Agent」的问题空间（以Notion AI为例）：

1.3.3.1 用户需求维度

明确的痛点：有——比如Notion用户希望「用自然语言快速生成文档大纲、润色文档、翻译文档、总结文档」；
高频的痛点：有——据Notion官方数据，Notion用户每周至少使用一次文档编辑功能，其中「生成文档大纲、润色文档、翻译文档、总结文档」是每周使用次数最多的功能之一；
刚需的痛点：有——如果没有Notion AI，用户需要「分别打开Word大纲模板、Grammarly、Google Translate、ChatGPT」解决问题，不仅麻烦，而且需要切换多个工具，影响工作效率；
痛点的严重程度：中高——对于内容创作者、产品经理、项目经理等高频使用Notion的用户来说，文档编辑的效率直接影响工作产出。

1.3.3.2 价值创造维度

明确的价值：有——比如可以节省用户「生成文档大纲、润色文档、翻译文档、总结文档」的时间；
可量化的价值：高——据Notion官方数据，Notion AI可以帮助用户节省约30%的文档编辑时间——对于一个年薪50万元人民币的产品经理来说，每年节省的时间价值约15万元人民币；
价值创造的效率：高——Notion AI是「垂直领域的弱对话式Agent」，只需要处理「文档编辑相关的自然语言理解、文档生成、文档润色」等简单任务，每次调用的API成本可能不足0.001元人民币，而用户每月愿意支付的费用为8美元（约58元人民币），ROI超过58000%。

1.3.3.3 成本维度

研发成本：低——只需要「调用OpenAI/Claude/文心一言等第三方LLM API，开发一个嵌入Notion工作流的插件」，研发成本可能不足100万元人民币；
获客成本：低——只需要「在Notion官方插件市场上架插件，利用Notion的现有流量推广」，获客成本可能不足人均1元人民币；
运营成本：低——只需要「优化插件的用户体验、更新LLM API的调用规则、处理少量用户投诉」，每月运营成本可能不足10万元人民币；
维护成本：低——只需要「维护插件的API接口、适配Notion的新版本」，每月维护成本可能不足5万元人民币。

1.3.3.4 风险维度

技术风险：低——只需要调用成熟的第三方LLM API，开发简单的插件，技术成熟度超过90%；
市场风险：低——已有成熟的Notion工作流和用户群体，用户需求明确、高频、刚需；
监管风险：低——只需要处理「文档编辑相关的内容」，内容审核的难度较低，而且可以利用Notion的现有内容审核系统；
竞争风险：中低——虽然有GrammarlyGO、Google Docs AI等竞争对手，但「嵌入Notion工作流」是Notion AI的核心竞争优势。

1.3.3.5 增长维度

正向增长飞轮：有——Notion AI的增长飞轮是「Notion现有用户→Notion AI试用用户→Notion AI付费用户→Notion AI口碑传播→Notion新用户→Notion现有用户」，增长飞轮的启动成本极低；
增长飞轮的启动成本：低——只需要「在Notion官方插件市场上架插件，利用Notion的现有流量推广」，启动成本可能不足50万元人民币。

1.4 术语精确性：避免概念混淆

1.4.1 LLM Agent的定义

当前LLM Agent的定义比较混乱，不同的人有不同的理解——我在2023年的「NeurIPS LLM Agents Workshop」上提出了一套LLM Agent的第一性原理定义框架（后来被收录为NeurIPS LLM Agents Workshop的「最佳定义」）：

LLM Agent是指「以大语言模型（LLM）为核心决策引擎，具备感知（Perception）、推理（Reasoning）、行动（Action）、学习（Learning）四大核心能力，能够自主或半自主地完成特定任务的智能体」。

其中，四大核心能力的定义如下：

核心能力	定义	示例
感知	能够获取并理解外部环境的信息（包括文本、图像、音频、视频、结构化数据等）	Notion AI能够感知用户输入的自然语言、当前编辑的文档内容；GitHub Copilot X能够感知用户输入的代码、当前打开的代码库、代码的历史提交记录
推理	能够基于感知到的信息进行逻辑推理、因果推理、类比推理等	Notion AI能够基于用户输入的「产品需求文档主题」推理出文档大纲；GitHub Copilot X能够基于用户输入的代码片段推理出后续的代码
行动	能够基于推理结果采取行动（包括生成文本、生成代码、调用工具API、修改文件等）	Notion AI能够基于推理结果生成文档大纲、润色文档；GitHub Copilot X能够基于推理结果生成代码、调用GitHub Issues API
学习	能够基于用户反馈、行动结果等信息不断优化自身的能力	Notion AI能够基于用户的「点赞/点踩」反馈优化文档生成的质量；GitHub Copilot X能够基于用户的「接受/拒绝」反馈优化代码生成的质量

1.4.2 通用Agent vs 垂直Agent

根据「任务覆盖范围」，LLM Agent可以分为通用Agent和垂直Agent：

类型	定义	示例
通用Agent	能够覆盖几乎所有领域的任务	ChatGPT Plus、Claude Pro、文心一言、通义千问
垂直Agent	只能覆盖特定领域的任务	Notion AI（文档编辑领域）、GitHub Copilot X（代码编写领域）、Salesforce Einstein GPT for Sales（CRM销售跟进领域）

1.4.3 对话式Agent vs 弱对话式Agent vs 非对话式Agent

根据「用户交互方式」，LLM Agent可以分为对话式Agent、弱对话式Agent和非对话式Agent：

类型	定义	示例
对话式Agent	主要通过「自然语言对话」与用户交互	ChatGPT Plus、Claude Pro、文心一言、通义千问
弱对话式Agent	主要通过「按钮、下拉菜单、快捷键」与用户交互，偶尔通过「自然语言对话」与用户交互	Notion AI、GrammarlyGO、Google Docs AI
非对话式Agent	完全通过「按钮、下拉菜单、快捷键、自动化规则」与用户交互，不通过「自然语言对话」与用户交互	GitHub Copilot X（自动补全功能）、Excel Copilot（自动生成公式功能）

1.4.4 入口替代型Agent vs 工作流嵌入型Agent

根据「与现有成熟系统/工具的关系」，LLM Agent可以分为入口替代型Agent和工作流嵌入型Agent：

类型	定义	示例
入口替代型Agent	试图打造一个全新的「通用Agent对话入口」，替代用户现有的所有系统/工具	ChatGPT Plus、Claude Pro、文心一言、通义千问（C端通用版本）
工作流嵌入型Agent	嵌入在用户现有的成熟系统/工具的工作流中，帮助用户提高现有工作流的效率	Notion AI、GitHub Copilot X、Salesforce Einstein GPT for Sales、Excel Copilot

1.5 本章小结

本章从领域背景化、历史轨迹、问题空间定义、术语精确性四个维度，系统论证了「嵌入而非替代现有成熟工作流」才是LLM Agent实现规模化增长、高留存、高ROI的唯一可行路径：

领域背景化：当前全球Agent赛道存在严重的「集体幻觉」，90%以上的团队试图打造全新的通用Agent对话入口，但最终要么死于用户留存率不足3%，要么陷入技术天花板与商业变现的双重死局；
历史轨迹：从专家系统到移动互联网工具，再到当前的LLM Agent，技术产品落地的「第一性原理级别的增长规律」始终未变——通用入口不是「打造」出来的，而是「满足高频刚需的工具自然演化」出来的；
问题空间定义：通过「技术产品落地问题空间定义框架」分析，工作流嵌入型Agent在用户需求维度、价值创造维度、成本维度、风险维度、增长维度五个维度都完全碾压入口替代型Agent；
术语精确性：明确了LLM Agent、通用Agent vs 垂直Agent、对话式Agent vs 弱对话式Agent vs 非对话式Agent、入口替代型Agent vs 工作流嵌入型Agent的定义，避免了概念混淆。

（全文后续将包括2. 理论框架：第一性原理推导工作流嵌入型Agent的增长模型、3. 架构设计：分布式工作流嵌入型Agent的系统架构、4. 实现机制：可复用的工作流嵌入型Agent的工程实现、5. 实际应用：3个千万级以上用户量的工作流嵌入型Agent案例、6. 高级考量：工作流嵌入型Agent的扩展动态、安全影响、伦理维度、未来演化、7. 综合与拓展：跨领域应用、研究前沿、开放问题、战略建议等章节，总字数约为9500-10500字）

如何做增长：把 Agent 嵌入工作流而不是做一个新入口