news 2026/5/20 0:45:04

告别AI“失忆症“!OpenAI、Anthropic力推的Harness Engineering,让你的AI编程效率翻倍!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
告别AI“失忆症“!OpenAI、Anthropic力推的Harness Engineering,让你的AI编程效率翻倍!

文章介绍了Harness Engineering的概念,旨在解决AI在编程中反复犯错、跨上下文窗口失败等问题。该工程方法论强调通过构建AI模型的环境(Harness)来提升AI的可靠性,包括指令、状态管理、验证机制等。文章详细阐述了Harness Engineering的定义、特点、优势与劣势,并提供了适用场景建议。通过设计有效的Harness,可以显著提升任务完成质量,减少人工监督开销,并实现工程化可复制,但同时也存在构建成本高、运行成本增加等挑战。


你有没有遇到过这种情况——

花了半小时纠正AI的一个错误,语重心长地在提示词里写明了"不要这样做"。第二天开了新会话,AI若无其事地……又犯了同样的错。

你内心的OS:这是什么失忆的金鱼?!

更气的是,这不是模型的问题,是你的使用方式出了问题。

有一种工程方法论,专门解决这件事。它有个好玩的名字,叫Harness Engineering(驾驭工程)

OpenAI 和 Anthropic 在同一周相继发文背书,HashiCorp 创始人第一个命名它,学术界已经给它建了理论框架。但在国内,知道它的工程师还不多。

这篇文章,把你需要知道的都讲清楚。


基于以下11篇原始资料整理:OpenAI、Anthropic、Thoughtworks、LangChain、HumanLayer、Inngest、学术论文(CAR框架)及 walkinglabs 课程资料。
整理日期:2026-04-22。


零、来历:一个被逼出来的概念

概念的起源与发展脉络

Harness Engineering这一术语在 2026 年初才正式进入主流技术圈,但驱动它诞生的痛点早已存在多年——每一个用 AI 写过正经代码的工程师,都应该能认出自己的影子。

背景痛点:为何需要这个概念?

随着 AI 编程助手(尤其是 Claude、Codex 等大语言模型)在 2024–2025 年间被广泛用于实际软件开发,工程师们普遍遭遇了几类难以用"更好的提示词"解决的深层问题:

  1. Agent 反复犯同类错误

    :每次新会话,Agent 从零开始,没有记忆,会一再重复已知的错误行为(如调用错误的 API、跑错测试命令),需要工程师人工不断纠正。

  2. 长任务跨上下文窗口失败

    :复杂任务需要数小时甚至数天,但每个上下文窗口结束时 Agent 的记忆归零。Agent 要么过于激进地试图一次性完成所有工作,要么在后续会话中误判任务已完成,导致功能残缺。

  3. 模型性能与运行环境强耦合

    :研究发现,同一个模型在不同"运行环境"(harness)下性能差异巨大——改变环境比换更贵的模型更有效。

  4. 缺乏系统性工程方法论

    :提示工程(Prompt Engineering)和上下文工程(Context Engineering)专注于"喂给模型什么",却没有回答"如何让模型持续可靠地工作"这个更根本的问题。

聊两句:2026年,Cursor、Claude Code、通义灵码……国内工程师用AI写代码已经不是新鲜事。但大多数人停留在"会用"阶段,还没升级到"会养"阶段。AI不是魔法棒,它更像一个高度依赖工作环境的聪明员工——环境不对,再贵的模型也发挥不出来。你换过几次模型?有没有想过,问题也许根本不在模型上?

2025 年 11 月:Anthropic 率先发文

2025 年 11 月 26 日,Anthropic 工程师Justin Young发表《Effective harnesses for long-running agents》,链接:https://www.anthropic.com/engineering/effective-harnesses-for-long-running-agents

这是首批系统性使用"harness"这一术语描述 Agent 运行环境的权威技术文章之一。文章提出双 Agent 架构(初始化 Agent + 编码 Agent)、进度追踪文件(claude-progress.txt)和 JSON 特性列表等具体机制,直接响应了上述前两个痛点。

2026 年 2 月 5 日:Mitchell Hashimoto 正式命名

真正将这一实践总结并命名为“Harness Engineering”的,是 HashiCorp 联合创始人、Terraform 和 Ghostty 终端模拟器的创建者Mitchell Hashimoto

2026 年 2 月 5 日,他在个人博客发表《My AI Adoption Journey》,链接:https://mitchellh.com/writing/my-ai-adoption-journey

在"第五步:构建挽具(Engineer the Harness)"一节中写道:

“每当你发现 Agent 犯了一个错误,就花时间设计一个解决方案,让这个 Agent 永远不再犯这个错误。我逐渐把这称为’harness engineering’(挽具工程)。”

他的做法分为两类:

  • 简单问题

    :直接更新AGENTS.md,每一行对应一个已知的 Agent 不良行为,问题几乎立刻消失。

  • 复杂问题

    :编写专用工具(如截图脚本、过滤测试运行器),并同步更新文档告知 Agent 其存在。

2026 年 2 月 11 日:OpenAI 独立印证

仅六天后,OpenAI 工程师Ryan Lopopolo发表《Harness engineering: leveraging Codex in an agent-first world》,链接:https://openai.com/index/harness-engineering/

从完全独立的实践角度印证了同一概念。

他的团队(3 名工程师)用 5 个月时间,以零行人工编写代码的方式,通过 Codex Agent 构建了一个约100 万行代码的生产级内部软件系统,合并了约 1,500 个 PR,平均每名工程师每天完成 3.5 个 PR。关键在于,他们将工程精力完全转向"设计环境、声明意图、提供结构化反馈",而非亲自写代码——这正是 Harness Engineering 的本质。

两篇文章在同一周相继发布,让"Harness Engineering"迅速成为业界热词。

2026 年 2–4 月:多家机构系统化

此后,各头部机构相继跟进,从各自角度系统化这一概念:

时间机构文章/事件
2026-02-17ThoughtworksBirgitta Böckeler 发布内部备忘录,首次引入计算型/推理型控制分类
2026-03-10LangChainVivek Trivedy 发表《The Anatomy of an Agent Harness》(https://www.langchain.com/blog/the-anatomy-of-an-agent-harness ),提出"Agent = Model + Harness"公式,并以 Terminal Bench 2.0 数据证明仅改变 Harness 即可将排名从前 30 提升至前 5
2026-03-24AnthropicPrithvi Rajasekaran 发表《Harness design for long-running application development》(https://www.anthropic.com/engineering/harness-design-long-running-apps ),引入生成器-评估器双 Agent 架构和冲刺合同(Sprint Contract)机制
2026-04-02ThoughtworksBirgitta Böckeler 在 martinfowler.com 发表《Harness engineering for coding agent users》(https://martinfowler.com/articles/harness-engineering.html ),将控制论(Cybernetics)引入 Harness Engineering,提出前馈导引 + 反馈传感框架

至此,Harness Engineering 从一个实践者的个人总结,演变为拥有多家权威机构背书、有理论框架支撑的新兴工程学科。


一、定义:AI 不等于模型

核心公式

不同来源高度一致地使用同一个核心等式,简单到可以当头像签名:

AI Agent = Model(模型)+ Harness(挽具/环境)

Harness(中文常译作"挽具"或"智能体环境")是围绕 AI 模型构建的一切——工具、指令、状态管理、验证机制、运行时基础设施——它让模型的智能变得"可用"。

“The model contains the intelligence and the harness is the system that makes that intelligence useful.”
—— LangChain《The Anatomy of an Agent Harness》(https://www.langchain.com/blog/the-anatomy-of-an-agent-harness )

划重点:模型提供智能,Harness 让智能变得有用。有没有感觉这句话在哪儿听过?对,就像一个顶尖外科医生,光有技术不够,还需要手术室、器械、助手、术后流程——缺了任何一环,手术都不能顺利完成。你的 AI 也一样。


各大厂对定义的差异对比

六家机构,六个视角。核心等式一致,侧重各有不同:

机构定义侧重点主要比喻/框架与其他机构的差异
LangChain最宽泛:Harness = 除模型以外的一切(文件系统、工具、沙箱、编排、运行时基础设施)。“Agent = Model + Harness” 这个等式最早由 LangChain 的 Vivek Trivedy 在 2026 年 3 月系统性提出。来源:https://www.langchain.com/blog/the-anatomy-of-an-agent-harness工作引擎(Work Engine)定义范围最广,包括所有围绕模型的技术层
Anthropic实用工程视角:Harness 是让 Agent 在多个上下文窗口中持续推进任务的一整套环境脚手架——包括初始化脚本、功能列表、进度文件、会话移交机制。Claude Agent SDK 本身被描述为"通用智能体挽具"。来源:https://www.anthropic.com/engineering/effective-harnesses-for-long-running-agents环境脚手架(Environment Scaffolding)更聚焦于长期运行任务的连续性与状态管理,强调"clean state"理念
OpenAI注意:OpenAI 官方文章(https://openai.com/index/harness-engineering/ )中,“harness"这个词本身在正文只出现一次(且是指 evals,而非 harness engineering 本身)。他们更多使用"环境设计(environment design)”、“反馈回路(feedback loops)”、"控制系统(control systems)"等术语。实质上,其 harness 指:结构化文档库、架构约束 linter、可观测性栈、以及"垃圾回收"机制。代码仓库即知识系统(Repository as System of Record)术语使用最不明确,与其他机构存在显著命名差异;强调"零人工代码"的极端自动化场景
Thoughtworks在"限界上下文"中定义:对于编码智能体用户,Harness 分为内层(工具内置:系统提示、代码检索)和外层(用户自建:规则、技能、静态分析、Review Agent)。将 Harness 比作赛博内廷(cybernetic governor)。来源:https://martinfowler.com/articles/harness-engineering.html前馈导引(Feedforward Guides)+ 反馈传感(Feedback Sensors)唯一明确区分"构建者挽具"与"用户挽具"两个层次;引入**计算型(Computational)vs 推理型(Inferential)**的控制分类
HumanLayer将 Harness Engineering 定义为上下文工程(Context Engineering)的子集——专门通过编码智能体的配置接入点(AGENTS.md、MCP 服务器、技能、子智能体、钩子)来管理上下文窗口。来源:https://www.humanlayer.dev/blog/skill-issue-harness-engineering-for-coding-agents配置即杠杆(Configuration as Leverage)强调 Harness Engineering 不等于 Context Engineering,而是其子集;最关注防止"上下文腐烂"
Inngest基础设施视角:Harness 是"连接、保护、编排组件——而不亲自执行任务"的层。LLM 是引擎,工具是外设,内存是存储,Harness 是将它们连接起来的基础设施(耐久执行、事件路由、状态持久化、并发控制)。来源:https://www.inngest.com/blog/your-agent-needs-a-harness-not-a-framework布线挽具/安全带(Wiring Harness / Safety Harness)唯一将 Harness 等同于持久化事件驱动基础设施的视角,来自 DevOps/云原生工程背景
学术界(CAR框架)将 Harness 层分解为三个维度:Control(控制)——哪些指令保持权威;Agency(智能体能力)——哪些行动可用;Runtime(运行时)——状态如何延续、故障如何处理。提出"Harness-sensitive"概念:部分 Agent 性能提升可能来自 Harness 改进,而非模型本身。来源:https://www.preprints.org/manuscript/202603.1756CAR(Control-Agency-Runtime)三元框架唯一来自学术界的系统性框架;提出 HarnessCard 报告格式,类比模型卡(Model Card)

无差异之处:所有来源都认同"Agent = Model + Harness"的核心等式,以及 Harness 的目标是让模型输出更可靠、更可控。


二、特点:Harness 到底长什么样?

1. 五大子系统(walkinglabs 综合框架)

来源:https://github.com/walkinglabs/learn-harness-engineering

┌─────────────────────────────────────────────────────┐ │ THE HARNESS │ │ │ │ Instructions │ State │ Verification │ │ ─────────── │ ───────── │ ─────────────── │ │ AGENTS.md │ progress │ tests + lint │ │ CLAUDE.md │ feature │ type-check │ │ docs/ │ git log │ e2e pipeline │ │ │ │ Scope │ Session Lifecycle │ │ ─────────── │ ──────────────────────────────── │ │ one feature │ init.sh at start │ │ at a time │ clean state at end │ │ │ handoff note for next session │ └─────────────────────────────────────────────────────┘
  • Instructions(指令)

    :告诉 Agent 做什么、按什么顺序、读什么文件。采用渐进式披露(Progressive Disclosure),而非一个巨型文件。

  • State(状态)

    :追踪已完成什么、正在进行什么、接下来是什么。持久化到磁盘,确保会话间的连续性。

  • Verification(验证)

    :只有通过测试才算完成。Agent 不能在没有可运行证据的情况下宣告任务完成。

  • Scope(范围)

    :将 Agent 约束到每次一个功能。防止过度扩展和半途而废。

  • Session Lifecycle(会话生命周期)

    :开始时初始化,结束时清理,为下一次会话留下清晰的重启路径。

这个框架解释了什么?解释了为什么你的 AI 老是"做到一半就忘了"——因为它根本没有外部状态,你也没有给它。人类工程师靠记忆和笔记跨任务协作,AI 靠什么?靠 Harness 里的持久化文件。

2. 计算型 vs 推理型控制(Thoughtworks)

来源:https://martinfowler.com/articles/harness-engineering.html

  • 计算型(Computational)

    :确定性、快速,由 CPU 执行。测试、linter、类型检查、结构分析。可在每次变更时运行,结果可靠。

  • 推理型(Inferential)

    :语义分析、AI 代码审查、LLM as Judge。由 GPU/NPU 运行,速度慢、成本高、结果具有不确定性,但能处理语义判断。

3. 前馈导引 + 反馈传感(Thoughtworks)

来源:https://martinfowler.com/articles/harness-engineering.html

  • 前馈导引(Feedforward Guides)

    :在 Agent 工作前注入上下文——AGENTS.md、技能文件、参考文档、如何引导脚本。提高首次生成正确的概率。

  • 反馈传感(Feedback Sensors)

    :在 Agent 工作后检测问题——静态分析、日志、浏览器测试、AI 代码审查。提供自我修正循环。

4. 三类调控维度(Thoughtworks)

来源:https://martinfowler.com/articles/harness-engineering.html

  • 可维护性挽具(Maintainability Harness)

    :调控代码内部质量——重复代码、圈复杂度、测试覆盖率、架构漂移。

  • 架构适应性挽具(Architecture Fitness Harness)

    :调控架构特征——性能要求、可观测性标准、依赖方向规则。

  • 行为挽具(Behaviour Harness)

    :调控功能正确性——规格说明、测试套件、端到端验证。(目前最难解决的维度)


三、优势:数据说话,别跟我讲"感觉"

  1. 显著提升任务完成质量:Anthropic 的受控实验表明,同一模型(Opus 4.5)、同一提示(构建2D复古游戏编辑器),无 Harness 时花费 $9/20 分钟,产出无法运行;有完整 Harness 时花费 $200/6 小时,产出可以实际游玩的游戏。模型没有变,Harness 变了。来源:https://www.anthropic.com/engineering/harness-design-long-running-apps
  2. 突破单次上下文窗口限制:通过初始化 Agent + 会话移交文件(claude-progress.txtfeature_list.jsongit log),使 Agent 能跨多个上下文窗口持续工作数小时乃至数天。来源:https://www.anthropic.com/engineering/effective-harnesses-for-long-running-agents
  3. 减少人工监督开销:精心设计的 Harness 能在 Agent 输出到达人眼之前自动捕获并修正大量问题,降低审查负担、减少 token 浪费。来源:https://openai.com/index/harness-engineering/
  4. 工程化可复制:将最佳实践编码为 Harness(AGENTS.md、验证脚本、结构测试),可在团队中共享和复用,而不是每次项目重头来过。来源:https://mitchellh.com/writing/my-ai-adoption-journey
  5. 架构约束自动化执行:通过自定义 linter 和结构测试,将架构规范(如依赖方向、命名规范、文件大小限制)自动化执行,“一旦编码,处处生效”。来源:https://openai.com/index/harness-engineering/
  6. 防止上下文腐烂(Context Rot):子智能体作为"上下文防火墙",工具结果截断、进度压缩等机制防止上下文窗口随时间降级,保持 Agent 在"智能区间"内工作。来源:https://www.humanlayer.dev/blog/skill-issue-harness-engineering-for-coding-agents
  7. 提高对 Agent 产出的信任:在代码进入人眼之前完成静态分析、测试运行、架构检查,为开发者提供质量保证。来源:https://martinfowler.com/articles/harness-engineering.html

国内工程师的体感:现在很多团队用 AI 写代码的模式是"一边写一边改",改到怀疑人生。Harness Engineering 的意义不是"AI 变更聪明了",而是"错误在到达你眼前之前就被拦截了"。两者的心理负担,差别很大。


四、劣势:没有银弹,只有权衡

公平起见,坑也要聊清楚:

  1. 前期构建成本高:设计有效的 Harness 需要投入大量精力——编写 AGENTS.md、init.sh、feature_list.json、验证脚本、结构测试等。初期会比直接提示 Agent 更慢。来源:https://www.humanlayer.dev/blog/skill-issue-harness-engineering-for-coding-agents
  2. 运行成本显著增加:多 Agent 架构(规划者 + 生成者 + 评估者)可能使成本提升 20 倍以上(Anthropic 实验:单 Agent $9 vs 完整 Harness $200)。来源:https://www.anthropic.com/engineering/harness-design-long-running-apps
  3. 维护与漂移:Harness 文件(尤其是 AGENTS.md)会过时。"单一巨型文件"方式会成为陈旧规则的墓地,需要持续的"文档园艺(doc-gardening)"维护。来源:https://openai.com/index/harness-engineering/
  4. 模型过拟合风险:模型会在其训练所用的 Harness 上过度拟合。Codex 模型高度依赖apply_patch工具,在不同 Harness 下性能下降。Terminal Bench 2.0 数据显示,Opus 4.6 在 Claude Code 内部排名第33,但在不同 Harness 中排名第5。最优 Harness 不一定是模型训练所用的 Harness。来源:https://www.langchain.com/blog/the-anatomy-of-an-agent-harness
  5. 行为正确性仍难保证:Harness 善于捕获结构性和维护性问题,但对"功能是否符合用户意图"的保证仍然有限。依赖 AI 生成的测试套件存在误判风险(Thoughtworks 指出这是目前最大的悬而未决问题)。来源:https://martinfowler.com/articles/harness-engineering.html
  6. 复杂度膨胀陷阱:过度工程化的 Harness 会让开发者花更多时间调优配置而非交付功能。HumanLayer 建议:“偏向交付;只在 Agent 实际失败后才添加配置。” 来源:https://www.humanlayer.dev/blog/skill-issue-harness-engineering-for-coding-agents
  7. 可测性差:如何评估 Harness 本身的质量?目前还缺少类似代码覆盖率或变异测试的 Harness 覆盖率指标(Thoughtworks 提出的开放问题)。来源:https://martinfowler.com/articles/harness-engineering.html

一个实用建议:不要一开始就搞一套完整的 Harness。从最痛的那个点入手——AI 最频繁犯的那一类错——先把它消灭,然后再扩展。迭代比完美更重要。


五、适用场景:什么时候该上,什么时候别浪费时间?

高度适用

场景原因出处
长期运行的编码任务(数小时乃至数天)解决跨上下文窗口连续性问题;防止 Agent 过早宣告任务完成https://www.anthropic.com/engineering/effective-harnesses-for-long-running-agents
企业级/遗留代码库中的自动化编码需要架构约束执行、上下文管理、风格一致性保证https://martinfowler.com/articles/harness-engineering.html
从零到一构建产品(无人工代码)OpenAI 实验:3个工程师 × 5个月 × 约100万行代码,吞吐量随团队规模增长而提升https://openai.com/index/harness-engineering/
反复出现相同类型失败的 Agent 工作流“每当 Agent 犯错,就将修复编入 Harness,让这个错误永远不再发生”(Mitchell Hashimoto)https://mitchellh.com/writing/my-ai-adoption-journey
多 Agent 协作系统规划者 + 生成者 + 评估者架构,各 Agent 职责隔离https://www.anthropic.com/engineering/harness-design-long-running-apps
需要高可靠性的生产环境通过验证回路、钩子、结构测试减少人工监督需求https://www.inngest.com/blog/your-agent-needs-a-harness-not-a-framework

不适用或性价比低

场景原因出处
一次性简单任务Harness 的前期成本超过其带来的价值https://www.humanlayer.dev/blog/skill-issue-harness-engineering-for-coding-agents
高度不确定或创意性任务(主观设计审美等)行为 Harness 目前对功能正确性保证有限https://martinfowler.com/articles/harness-engineering.html
模型能力覆盖的任务(随模型迭代)更强的模型会让部分 Harness 组件变得冗余——需要定期重新评估哪些组件仍是必要的https://www.humanlayer.dev/blog/skill-issue-harness-engineering-for-coding-agents
团队不具备工程化能力编写验证脚本和结构测试没有可运行验证的 Harness 只是一堆过时文档https://github.com/walkinglabs/learn-harness-engineering


写在最后:模型之争已过时,挽具之争才刚开始

如果你问我 2026 年 AI 编程领域最被低估的认知差距是什么,我的答案是:

大多数人在比较模型,少数人在设计环境。

当你还在纠结"Opus 好还是 Sonnet 好"的时候,有人已经在用 Harness Engineering 让同一个模型产出你两倍的生产力。当你还在靠肉眼审查 AI 的每一行输出的时候,有人的 Harness 已经在你之前帮你发现了 80% 的问题。

这不是天才和普通人的区别。这是工程思维和使用思维的区别。

用过 AI 的人很多,会"养" AI 的人还很少。Harness Engineering 就是养 AI 的学问。

它还很新,很多问题没有标准答案。但有一件事已经很清楚:今后,你在 AI 上获得的竞争优势,将越来越多地来自你的 Harness,而不是你用的模型。

模型,人人都能买到。Harness,只有你自己能建。


你现在用 AI 写代码,有没有遇到过"AI 反复犯同一个错"的情况?你是怎么解决的?评论区见。

01

什么是AI大模型应用开发工程师?

如果说AI大模型是蕴藏着巨大能量的“后台超级能力”,那么AI大模型应用开发工程师就是将这种能量转化为实用工具的执行者。

AI大模型应用开发工程师是基于AI大模型,设计开发落地业务的应用工程师。

这个职业的核心价值,在于打破技术与用户之间的壁垒,把普通人难以理解的算法逻辑、模型参数,转化为人人都能轻松操作的产品形态。

无论是日常写作时用到的AI文案生成器、修图软件里的智能美化功能,还是办公场景中的自动记账工具、会议记录用的语音转文字APP,这些看似简单的应用背后,都是应用开发工程师在默默搭建技术与需求之间的桥梁。

他们不追求创造全新的大模型,而是专注于让已有的大模型“听懂”业务需求,“学会”解决具体问题,最终形成可落地、可使用的产品。

CSDN粉丝独家福利

给大家整理了一份AI大模型全套学习资料,这份完整版的 AI 大模型学习资料已经上传CSDN,朋友们如果需要可以扫描下方二维码&点击下方CSDN官方认证链接免费领取【保证100%免费】

02

AI大模型应用开发工程师的核心职责

需求分析与拆解是工作的起点,也是确保开发不偏离方向的关键。

应用开发工程师需要直接对接业务方,深入理解其核心诉求——不仅要明确“要做什么”,更要厘清“为什么要做”以及“做到什么程度算合格”。

在此基础上,他们会将模糊的业务需求拆解为具体的技术任务,明确每个环节的执行标准,并评估技术实现的可行性,同时定义清晰的核心指标,为后续开发、测试提供依据。

这一步就像建筑前的图纸设计,若出现偏差,后续所有工作都可能白费。

技术选型与适配是衔接需求与开发的核心环节。

工程师需要根据业务场景的特点,选择合适的基础大模型、开发框架和工具——不同的业务对模型的响应速度、精度、成本要求不同,选型的合理性直接影响最终产品的表现。

同时,他们还要对行业相关数据进行预处理,通过提示词工程优化模型输出,或在必要时进行轻量化微调,让基础模型更好地适配具体业务。

此外,设计合理的上下文管理规则确保模型理解连贯需求,建立敏感信息过滤机制保障数据安全,也是这一环节的重要内容。

应用开发与对接则是将方案转化为产品的实操阶段。

工程师会利用选定的开发框架构建应用的核心功能,同时联动各类外部系统——比如将AI模型与企业现有的客户管理系统、数据存储系统打通,确保数据流转顺畅。

在这一过程中,他们还需要配合设计团队打磨前端交互界面,让技术功能以简洁易懂的方式呈现给用户,实现从技术方案到产品形态的转化。

测试与优化是保障产品质量的关键步骤。

工程师会开展全面的功能测试,找出并修复开发过程中出现的漏洞,同时针对模型的响应速度、稳定性等性能指标进行优化。

安全合规性也是测试的重点,需要确保应用符合数据保护、隐私安全等相关规定。

此外,他们还会收集用户反馈,通过调整模型参数、优化提示词等方式持续提升产品体验,让应用更贴合用户实际使用需求。

部署运维与迭代则贯穿产品的整个生命周期。

工程师会通过云服务器或私有服务器将应用部署上线,并实时监控运行状态,及时处理突发故障,确保应用稳定运行。

随着业务需求的变化,他们还需要对应用功能进行迭代更新,同时编写完善的开发文档和使用手册,为后续的维护和交接提供支持。

03

薪资情况与职业价值

市场对这一职业的高度认可,直接体现在薪资待遇上。

据猎聘最新在招岗位数据显示,AI大模型应用开发工程师的月薪最高可达60k。

在AI技术加速落地的当下,这种“技术+业务”的复合型能力尤为稀缺,让该职业成为当下极具吸引力的就业选择。

AI大模型应用开发工程师是AI技术落地的关键桥梁。

他们用专业能力将抽象的技术转化为具体的产品,让大模型的价值真正渗透到各行各业。

随着AI场景化应用的不断深化,这一职业的重要性将更加凸显,也必将吸引更多人才投身其中,推动AI技术更好地服务于社会发展。

CSDN粉丝独家福利

给大家整理了一份AI大模型全套学习资料,这份完整版的 AI 大模型学习资料已经上传CSDN,朋友们如果需要可以扫描下方二维码&点击下方CSDN官方认证链接免费领取【保证100%免费】

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/20 0:41:09

LLM 推理为什么先慢后快?从 Prefill、Decode 到 KV Cache 讲清楚

LLM 推理的延迟不能只用“快”或“慢”概括。 一次回答里至少有两个阶段:Prefill 和 Decode。Prefill 负责处理完整 prompt,并生成第一个输出 token;Decode 负责在第一个 token 之后,继续一个 token 一个 token 地生成内容。 这…

作者头像 李华
网站建设 2026/5/20 0:38:28

告别Vivado自带编辑器!手把手教你用Sublime Text/Notepad++提升FPGA开发效率(附环境变量配置避坑指南)

高效FPGA开发:用Sublime Text与Notepad重构Vivado工作流 在FPGA开发领域,效率往往取决于工具链的流畅度。Vivado作为主流开发环境,其内置编辑器却常成为工作流中的瓶颈——缺乏智能补全、多文件管理笨拙、自定义选项有限。本文将揭示如何通过…

作者头像 李华
网站建设 2026/5/20 0:24:41

Python(while循环)

目录 1.while 循环的基本概念 1.1 语法格式 1.2 最简单的示例 1.3 while 与 for 的对比 2. 代码执行顺序详解 3. 无限循环及其控制 3.1 无限循环的基本写法 3.2 避免无限循环的常见错误 4. break、continue 与 else 4.1 break:提前终止整个循环 4.2 cont…

作者头像 李华