Loop Engineering 深度解析
一、什么是 Loop Engineering?
1.1 定义与起源
Loop Engineering(循环工程)是 2026 年 6 月正式提出的 AI 工程新范式,正在彻底改变我们与 AI 编程代理的交互方式。
这个概念由两位行业领军人物几乎同时提出:
Addy Osmani(Google 云 AI 工程总监)在一篇长文中正式定义
Peter Steinberger(OpenClaw 创始人)的一条推文获得 800 万次浏览,引爆整个技术圈
一句话精准定义:Loop Engineering 就是用你设计的系统,去替代你本人提示 Agent。
你不再是那个守在聊天框前不断输入指令的人,你是那个设计自动化循环结构的人。
1.2 从 Prompt Engineering 到 Loop Engineering
传统的 AI 编程模式是:
人写 Prompt → AI 执行 → 人检查 → 人再写 Prompt → AI 再执行...而 Loop Engineering 的模式是:
人设计循环系统 → 系统自动提示 AI → AI 执行 → 系统检查 → 系统再提示 AI...| 维度 | 传统 Prompt Engineering | Loop Engineering |
|---|---|---|
| 驱动者 | 人 | 系统 |
| 交互方式 | 单次、手动 | 循环、自动 |
| 人的角色 | 包工头、监工 | 架构师、规则制定者 |
| 扩展性 | 受限于人的精力 | 可无限并行扩展 |
二、Loop Engineering 是做什么的?有什么作用?
2.1 解决的核心问题
当 AI Agent 已经能独立完成单个编码任务后,新的瓶颈出现了:人本身成为了效率瓶颈。
你是不是也遇到过这些问题?
不断在聊天框复制粘贴、调整 Prompt
半夜还在等 AI 跑完,好输入下一条指令
同时开 5 个 Agent 窗口,手忙脚乱切换
重复的检查、验证、反馈工作占用大量时间
Loop Engineering 就是为了解决这些问题而生。
2.2 五大核心能力模块
一个完整的 Loop 系统包含五个核心模块:
① 自动化触发器(Automations)
定时启动(如每天早上 6 点)
事件触发(CI 失败、Issue 新建、PR 提交)
周期性巡检(代码质量、依赖更新、安全扫描)
② 工作树(Worktrees)
隔离多个并行开发环境
避免不同任务相互干扰
支持同时运行几十个 Agent 实例
③ 技能(Skills)
项目知识文档化
团队编码规范固化
最佳实践沉淀为可复用模块
④ 连接器(Connectors)
对接 GitHub、Linear、Slack、数据库
MCP 协议让 AI 能操作真实世界工具
读取问题、提交代码、发送通知
⑤ 子代理(Sub-agents)
执行者与检查者分离
不同模型分工协作
避免 “自己给自己打分” 的盲区
2.3 核心价值与作用
1. 真正的无人值守
睡觉前启动循环,醒来代码已经写完、测试通过、PR 提交
7×24 小时持续工作,没有疲劳、不需要休息
2. 规模化生产力
一个人可以同时管理几十、上百个 Agent 实例
Token 吞吐量最大化,人不再是瓶颈
3. 质量可控
标准化的检查流程,避免人为疏忽
多轮验证机制,大幅降低幻觉和错误
4. 知识沉淀
团队经验固化为 Skill,新人快速上手
最佳实践自动化执行,质量一致性保障
三、如何使用 Loop Engineering?
3.1 核心运行机制
每个 Loop 都遵循这个经典的闭环:
定义目标 → 制定计划 → 执行动作 → 观察结果 → 评估修正 ↑ ↓ └─────────────────────────────────────────┘单次迭代详解:
目标层:明确的验收标准和停止条件
计划层:Agent 自主拆解任务、制定步骤
执行层:调用工具写代码、跑测试、读文件
观察层:收集执行输出、错误日志、测试结果
评估层:判断是否达标,决定继续还是停止
3.2 实战入门:五步搭建第一个 Loop
步骤 1:定义清晰的目标规范(Specification)
不要写模糊的目标:
❌ "做一个登录功能"要写精确的验收标准:
✅ "实现 JWT 登录功能,满足: 1. 支持邮箱/密码登录 2. 密码 bcrypt 加密存储 3. Token 过期时间 7 天 4. 单元测试覆盖率 ≥ 80% 5. ESLint 无错误 停止条件:所有测试通过,PR 已创建"步骤 2:创建状态文件(State Management)
Loop 需要记忆,创建STATE.md:
# Loop State ## 配置 - 最大迭代次数:10 - 单次超时:30分钟 - 检查间隔:5分钟 ## 待处理任务 - [ ] 修复 CI #1234 中的类型错误 - [ ] 更新依赖 lodash 到 4.17.21 ## 已完成 - [x] 修复安全漏洞 CVE-2026-1234步骤 3:编写项目技能(Skills)
在.claude/skills/下创建技能文件:
# 代码审查 Skill ## 本项目编码规范 - 使用 TypeScript,严格模式 - 函数必须有 JSDoc 注释 - 错误必须被显式处理 - 禁止使用 any 类型 ## 审查清单 1. 是否有未处理的 Promise? 2. 是否有魔法数字? 3. 是否有重复代码? 4. 边界条件是否覆盖?步骤 4:启动循环
以 Claude Code 为例,使用/loop指令:
# 基础循环:每10分钟检查并修复问题/loop"读取 STATE.md → 执行待办任务 → 更新状态"--interval10m# 定时循环:每天早上6点自动修复CI失败/loop"使用 ci-triage skill 分析昨日所有CI失败,自动修复可解决问题"\--schedule"0 6 * * *"\--max-iterations8# 带目标的循环:直到完成才停止/goal"完成用户登录功能的全部验收标准"\--skillcoding-standards\--max-tokens500000步骤 5:设置停止条件(至关重要!)
这是防止 “无限烧 Token” 的关键,必须明确:
✅ 好的停止条件: - 所有单元测试通过 - ESLint 无错误 - 验收标准全部满足 - 达到最大迭代次数 - Token 消耗达到预算 ❌ 坏的停止条件: - "做得足够好"(主观、模糊) - 没有任何限制3.3 经典实战场景
场景 1:CI 自动修复循环
# GitHub Actions 配置schedule:-cron:'0 6 * * *'jobs:ci-fix-loop:runs-on:ubuntu-lateststeps:-name:Run Claude Code Looprun:|claude-code --worktree ci-fix-$(date +%Y%m%d) " 1. 分析昨日所有失败的 CI 2. 对每个可自动修复的问题创建分支 3. 派生子代理修复代码 4. 派生子代理做 Code Review 5. 测试通过后创建 PR 6. 更新 STATE.md 记录"场景 2:代码质量巡检循环
每周扫描一次代码库
自动发现技术债务
生成修复建议
分配到对应负责人
场景 3:文档自动更新循环
检测代码变更
自动更新对应文档
检查文档与代码一致性
四、总结与展望
Loop Engineering 不是要取代 Prompt Engineering,而是它的升级和延伸。
Prompt Engineering解决 “怎么问才能得到好答案”
Loop Engineering解决 “怎么让系统自动问、自动做”
这是软件开发范式的第四次跃迁:
第一次:汇编语言 → 高级语言
第二次:瀑布开发 → 敏捷开发
第三次:人工编码 → AI 辅助编码
第四次:人驱动 AI → 系统驱动 AI
当你还在一句一句写 Prompt 的时候,别人已经在设计能自动运行的循环系统了。这就是生产力的代差。
下一步行动建议:
从一个简单的自动化场景开始(比如每日 CI 检查)
先跑通最小闭环,再逐步复杂化
重视停止条件和成本控制
把团队经验沉淀为可复用的 Skill
Loop Engineering 时代,优秀工程师的核心竞争力,已经从 “写好 Prompt” 变成了 “设计好系统”。