news 2026/6/6 11:30:34

Agent开发新思路:为什么说“系统如何承载判断“比“模型够不够强“更重要?必读收藏

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Agent开发新思路:为什么说“系统如何承载判断“比“模型够不够强“更重要?必读收藏

Agent技术正从关注模型能力转向系统架构设计。将所有判断交给模型即时完成会导致系统不可预测性增加,而Claude Skills等方案通过将已验证能力拆解为可管理组件,使经验成为长期资产。未来Agent应专注于上下文理解和路径选择,执行的确定性由Skills吸收,不确定性留给推理层。判断的工程化和治理正成为Agent技术的新分水岭,也是系统稳定扩展的关键。


如果从技术演进的角度复盘最近一年的 Agent 项目,一个越来越清晰的事实是:

问题正在从“模型够不够强”,转向“系统如何承载判断”。

Claude、GPT 这类模型在生成能力上已经高度成熟,至少在大多数工程场景中,“能不能生成”早已不是主要限制。

真正开始拖慢系统演化速度的,是我们把大量本该被工程化、被结构化的判断,持续交给模型在运行时即兴完成。

这个问题在系统早期往往不明显。Agent 的第一个原型通常表现良好,一个 prompt,加上一点工具调用,就能跑通完整流程。

但随着场景增多、上下文变复杂、需求开始叠加历史约束,系统会逐渐进入一种工程上非常危险的状态:

行为开始变得不可预测,但你却很难准确定位问题发生在哪一层。

模型参数没有变,数据来源也没有明显变化,业务逻辑看起来仍然成立,但结果却开始呈现出“有时对,有时不对”的不稳定特征。

关键并不在于模型是否足够稳定,而在于系统结构是否在回避一个更基础的问题:

哪些判断应该被固化为系统能力,哪些判断才值得在每一次调用中重新推理

当所有判断都被交给模型即时完成,系统规模越大,不确定性就会被放大得越快。

从这个角度再回头看 Claude Skills,会发现它并没有试图解决“更强智能”的问题,而是在解决一个更底层、更工程化的难题:

如何把已经被反复验证过的能力,从不透明的 prompt 行为中拆解出来,变成可管理、可复用、可回收的系统组件。

Skill 的价值,并不在于能力本身,而在于它让经验第一次具备了长期资产的形态。

这也是为什么当系统里的 Skills 从十几个增长到几十个、上百个时,能力管理本身会迅速成为瓶颈。

最近看到的特赞科技 atypica.AI 发了一个skill0( http://skill0.io/),正是围绕这一问题给出的一个具体实践:

当能力规模扩大,如何让不同团队知道哪些能力已经被验证、哪些仍处在试验阶段,以及如何避免在系统内部反复造轮子。

如果缺少这样一层能力承载机制,所谓的 Agent 架构,最终很容易退化回 prompt 的堆叠。

在这一过程中,Agent 的角色也在悄然发生变化。

与其让 Agent 承担越来越多“会做什么”的职责,不如让它回到一个更克制的位置:理解上下文、做路径选择、判断是否调用某种能力。

执行的确定性尽可能被 Skills 吸收,不确定性才留给推理层处理。到这个阶段,系统关注的重点自然会从“输出是否漂亮”,转向“判断是否正确”。

从行业整体来看,这并不是某一家团队的独立选择,而是一种越来越普遍的工程收敛方向。

当 Agent 真正进入复杂系统、长期运行环境之后,判断如何被工程化、被治理,正在取代模型能力本身,成为新的技术分水岭。

最后

近期科技圈传来重磅消息:行业巨头英特尔宣布大规模裁员2万人,传统技术岗位持续萎缩的同时,另一番景象却在AI领域上演——AI相关技术岗正开启“疯狂扩招”模式!据行业招聘数据显示,具备3-5年大模型相关经验的开发者,在大厂就能拿到50K×20薪的高薪待遇,薪资差距肉眼可见!

业内资深HR预判:不出1年,“具备AI项目实战经验”将正式成为技术岗投递的硬性门槛。在行业迭代加速的当下,“温水煮青蛙”式的等待只会让自己逐渐被淘汰,与其被动应对,不如主动出击,抢先掌握AI大模型核心原理+落地应用技术+项目实操经验,借行业风口实现职业翻盘!

深知技术人入门大模型时容易走弯路,我特意整理了一套全网最全最细的大模型零基础学习礼包,涵盖入门思维导图、经典书籍手册、从入门到进阶的实战视频、可直接运行的项目源码等核心内容。这份资料无需付费,免费分享给所有想入局AI大模型的朋友!

👇👇扫码免费领取全部内容👇👇

部分资料展示

1、 AI大模型学习路线图

2、 全套AI大模型应用开发视频教程

从入门到进阶这里都有,跟着老师学习事半功倍。

3、 大模型学习书籍&文档

4、AI大模型最新行业报告

2025最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

5、大模型大厂面试真题

整理了百度、阿里、字节等企业近三年的AI大模型岗位面试题,涵盖基础理论、技术实操、项目经验等维度,每道题都配有详细解析和答题思路,帮你针对性提升面试竞争力。

6、大模型项目实战&配套源码

学以致用,在项目实战中检验和巩固你所学到的知识,同时为你找工作就业和职业发展打下坚实的基础。

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

  • 👇👇扫码免费领取全部内容👇👇

这些资料真的有用吗?

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/28 16:12:49

Thiol-PEG1K-COOH,巯基-PEG1K-羧基,Thiol-PEG1K-carboxyl,化学性质

Thiol-PEG1K-COOH,巯基-PEG1K-羧基,Thiol-PEG1K-carboxyl,化学性质 Thiol-PEG1K-COOH 是一种功能性单端修饰聚乙二醇(PEG),分子量约 1,000 Da,化学结构可表示为: HS–(CH2–CH2–O…

作者头像 李华
网站建设 2026/5/21 12:32:35

黑客教你月入过万小技巧:SRC漏洞挖掘,一文讲清怎么挖漏洞赚钱!

最近发现很多刚接触渗透方面的小伙伴都不知道实战挖掘漏洞的诀窍,于是我打算写一些自己挖漏洞的诀窍。 src推荐新手挖洞首选漏洞盒子,因为漏洞盒子范围广,国内的站点都收。相比于其他src平台,挖掘难道很适合新手。 这里也推荐几…

作者头像 李华
网站建设 2026/5/13 1:00:28

智能井盖的技术演进:从外挂终端到结构-感知一体化

在城市地下空间数字化进程中,智能井盖作为边缘感知节点,其部署可靠性直接决定了数据链路的完整性。早期方案多采用“井盖外挂传感器”模式,但在实际运维中暴露出设备易被盗、线缆易损、防水失效、安装复杂等工程痛点,尤其在燃气、…

作者头像 李华
网站建设 2026/5/6 2:39:28

Deepoc-m数学大模型:以精准算力,破解半导体设计“精度与效率”双重困局

当半导体工艺节点迈入3nm及更先进制程,芯片设计正面临“复杂度指数级增长”与“精度要求极致严苛”的双重挑战。传统设计模式依赖工程师经验迭代,前端算法转化效率低下、后端布局布线优化不足、仿真验证偏差率居高不下,不仅导致研发周期冗长、…

作者头像 李华
网站建设 2026/5/31 1:47:48

设计K歌点歌辅助工具,录入好友喜好曲风,推荐适配歌曲,标注难度及原唱,帮K歌组织者兼顾所有人喜好,提升聚会氛围。

1. 实际应用场景与痛点分析场景描述- 朋友聚会去 KTV,大家想唱歌,但点歌时往往出现:1. 有人喜欢的歌别人没听过,导致冷场。2. 歌曲难度太高,唱不上去。3. 原唱版本太经典,翻唱难度大。4. 组织者难以兼顾所有…

作者头像 李华
网站建设 2026/5/31 9:44:29

好写作AI:学术写作教学改革——AI时代写作能力评价体系重构

当“AI协作者”走进课堂:教学评价的范式危机当学生使用“好写作AI”高效完成了文献综述、优化了论证逻辑,最终提交了一篇格式规范、语言流畅的论文时,作为教师或导师,我们应如何评价这份成果?传统的评价体系正面临前所…

作者头像 李华