1. Codex CLI 不是“智能补全”,而是被低估的生产级 Agent 架构
大多数人第一次运行codex --help时,看到的是--prompt,--model,--temperature这类参数,下意识把它当成一个“高级版 Tab 补全”——输入几行注释,回车,等它吐出函数体。我试过在三个中型项目里这么用:一个内部数据清洗工具、一个微服务网关配置生成器、一个前端组件模板批量生成脚本。结果很一致:前两次能跑通,第三次必出问题。不是语法错误,而是逻辑断裂——生成的代码在第 7 行调用了第 12 行才定义的变量;或者把async/await和回调混写,导致 Promise 链彻底崩坏;最隐蔽的一次,它把JSON.parse()写成了JSON.pares(),IDE 没报错,CI 流水线也过了,直到上线后某个边缘请求触发空指针。
后来我把codex命令加了-v参数重跑,发现它实际执行了 4 轮 API 调用:先发一次system prompt初始化上下文,再发一次user prompt描述任务,接着又发两次——一次是“检查上一轮输出是否符合规范”,另一次是“基于检查结果修正”。这根本不是单次补全,而是一个带反馈闭环的微型 Agent。OpenAI 官方文档里从没提过这个细节,但@openai/codex@latest的源码里,lib/agent.js文件明