news 2026/6/4 16:31:07

【Agent】Toward Efficient Agents

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【Agent】Toward Efficient Agents

note

文章目录

  • note
  • 一、Toward Efficient Agents

一、Toward Efficient Agents

【Agent技术总结】讲的故事是智能体的效率优化,从记忆、工具学习、规划三大核心组件展开系统综述,效率定义(固定成本下的效果、同等效果下的成本),梳理相关基准测试。Toward Efficient Agents: A Survey of Memory, Tool learning, and Planning,https://efficient-agents.github.io/,https://github.com/yxf203/Awesome-Efficient-Agents。https://arxiv.org/pdf/2601.14192v1。核心4点:

1)高效记忆【记忆构建:分为工作记忆(文本压缩、潜在状态存储,如COMEDY的对话蒸馏、MemoryLLM的潜在内存池)和外部记忆(基于项目、图谱、分层结构,如MemoryBank的遗忘曲线管理、Zep的时序知识图谱)->记忆管理:规则式(固定规则剪枝,低成本但缺乏适应性)、LLM式(动态决策增删改,自适应但耗资源)、混合式(规则触发+LLM优化,如MemoryOS的分层管理)->记忆访问:通过规则增强、图谱检索、LLM/工具驱动、分层检索等方式,精准提取关键信息,降低token消耗->多智能体记忆:支持共享记忆(跨智能体复用信息)、本地记忆(轻量化专属存储)、混合记忆(平衡共享与专属)】;

2)高效工具学习【工具选择:通过外部检索(如ProTIP的对比学习)、多标签分类(如TinyAgent的小型模型筛选)、词汇化检索(如ToolkenGPT的工具令牌化),快速匹配最优工具->工具调用:采用原地参数填充(如Toolformer的CoT集成)、并行调用(如LLMCompiler的并行执行)、成本感知调用(如BTP的预算约束规划),降低调用开销->工具集成推理:通过选择性调用(仅必要时触发工具)、成本感知策略优化(如ToolRL的奖励函数设计),将工具调用融入推理流程,提升效率】;

3)高效规划【单智能体规划:通过自适应预算分配(如SwiftSage的快慢思考模式)、结构化搜索(如LATS的蒙特卡洛树搜索)、任务分解(如ReWOO的规划-执行分离)、学习进化(政策优化与技能记忆存储),减少推理步骤->多智能体协作规划:通过拓扑优化(稀疏化交互结构,如Chain-of-Agents的线性传递)、协议优化(压缩通信内容)、协作蒸馏(将多智能体能力蒸馏为单模型,降低推理成本),减少协作开销】;

4)基准测试【记忆基准:评估有效性(如HotpotQA、LoCoMo)与效率(如MemBench的读写时间、StoryBench的token消耗)->工具学习基准:涵盖工具选择(如MetaTool)、参数填充(如BFCL)、多工具协作(如ToolBench),部分支持效率指标(token、延迟、调用次数)->规划基准:聚焦任务成功率与效率(如TPS-Bench的成本-通过率、CostBench的路径偏差)】

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/4 0:31:27

【系统分析师】7.1 软件生命周期

🔄 一、概述:软件产品的“人生旅程”软件生命周期 是指一个软件产品或系统从概念构思开始,历经定义、开发、运行,直至最终退役废弃的完整时间过程。它描述了软件“从生到死”的全貌,是理解和管理一切软件项目活动的最基…

作者头像 李华
网站建设 2026/6/2 6:38:21

CANN ops-cv:异构计算中视觉算子的低延迟设计与硬件资源高效适配实践

前言 在智能驾驶、工业质检、视频分析等实时视觉场景中,算法不仅要准确,更要快。从图像预处理、特征提取到目标检测与分割,整个视觉流水线对底层算子提出了严苛的延迟与吞吐要求。然而,通用深度学习框架中的视觉操作(如…

作者头像 李华
网站建设 2026/5/21 0:58:43

2026年去AIGC痕迹常见问题解答:一文搞懂所有疑问

2026年去AIGC痕迹常见问题解答:一文搞懂所有疑问 去AIGC痕迹的问题太多了,整理了最常见的问题,一篇文章全部解答。 效果相关问题 Q1:去AIGC痕迹真的有效吗? 有效。 专业工具达标率在99%以上,基本用了就能…

作者头像 李华
网站建设 2026/6/1 15:28:11

CANN模型转换:从框架模型到昇腾高效模型的全链路智能转换实战

CANN组织链接:https://atomgit.com/cann ops-nn仓库链接:https://atomgit.com/cann/ops-nn 当PyTorch模型转换失败率高达35%,当量化后精度损失超5%导致医疗诊断误判,当转换后模型在昇腾设备性能不及GPU——模型转换已成为AI落地的…

作者头像 李华
网站建设 2026/5/31 10:25:21

CANN模型训练:从单机单卡到千卡集群的全链路高效训练实战

CANN组织链接:https://atomgit.com/cann ops-nn仓库链接:https://atomgit.com/cann/ops-nn 当千亿参数MoE模型训练周期长达42天,当千卡集群通信开销吞噬68%训练时间,当单节点故障导致72小时训练成果归零——模型训练已成为AI创新的…

作者头像 李华
网站建设 2026/5/29 23:48:16

2025年12月 GESP CCF编程能力等级认证C++三级真题

答案和更多内容请查看网站:【试卷中心 -----> CCF GESP ----> C/C ----> 三级】 网站链接 青少年软件编程历年真题模拟题实时更新 2025年12月 GESP CCF编程能力等级认证C三级真题 一、单选题(每题 2 分,共 30 分)…

作者头像 李华