返回博客

什么是 Loop Engineering?Agent Loop 实用指南

Loop engineering 是围绕发现、交接、验证、状态、调度、worktree、evaluator 和人工闸门,设计安全自主编码代理循环的方法。

2026年6月21日Loop EngineeringLoop Engineering

Loop engineering 是设计能够自动提示编码代理的系统。你不再一条条喂提示词、等待结果、再写下一条提示,而是构建一个可重复的循环:它自己发现工作,把任务交给代理,验证输出,记录状态,并安全地再次运行。

一句话说:prompt engineering 写一条好指令;loop engineering 设计一台能持续生成正确指令、检查结果,并知道何时停下来的机器。

为什么 loop engineering 重要

AI coding agent 在人类给出清晰任务时已经很有用。但如果重复工作可以自动发现、打包、验证和等待审查,它就不再需要人每一步都盯着。

这就是 loop engineering 的核心:把重复工程事务变成窄范围、可观测、可回退的 agent loop。目标不是移除工程师,而是移除重复提示,把人的判断留在真正重要的位置。

一个好的 loop engineering 系统需要回答四个问题:

  1. 下一步应该做什么工作?
  2. 哪个代理或 playbook 负责处理?
  3. 我们如何知道结果是对的?
  4. 哪一步必须让人批准?

Loop engineering 与 prompt、context、harness engineering 的区别

| 层级 | 优化对象 | 产物 | | ------------------- | ------------ | ---------------------------------- | | Prompt engineering | 一次模型响应 | 更好的指令 | | Context engineering | 一次模型窗口 | 正确的文件、事实和约束 | | Harness engineering | 一次代理运行 | 工具、权限、恢复机制和完成条件 | | Loop engineering | 重复代理工作 | 触发器、状态、代理、验证和审查闸门 |

Harness 负责跑一次。Loop 让 harness 带着记忆、证据和边界一轮轮跑下去。

Agent loop 的五个动作

每个可靠的 agent loop 都有五个动作。少掉任何一个,循环通常会停下、空转,或制造没人审查的风险。

1. 发现

循环不用等人粘贴任务,而是自己发现工作。发现源可以是 CI 失败、GitHub issue、停滞 PR、客服工单、分析数据、日志、文档缺口、依赖更新或队列。

2. 交接

循环把一个有边界的任务交给代理。好的交接包含目标、相关文件、约束、验收标准、分支或 worktree,以及停止规则。

3. 验证

循环独立检查结果。验证可以是测试套件、静态分析、确定性规则、第二个 evaluator 代理,或人工审查。生成变更的代理不应该成为唯一的裁判。

4. 持久化

循环写下发生了什么。状态可以放在 STATE.md、PR、issue 评论、数据库行、运行日志或看板里。下一轮不应该从零开始。

5. 调度

循环通过 cron、webhook、CI 事件、队列触发或手动 dispatch 再次运行。调度让一次有用的代理运行变成工程化的操作循环。

生产级 loop engineering 系统的六个组件

生产循环不是一个调用 agent 的脚本。它需要一些无聊但可靠的组件,才能安全运维。

计划自动化

触发器决定循环何时醒来:每日分诊、每小时 CI 清扫、webhook 事件,或队列变化。

隔离 worktree

每次代理运行都应该有隔离的 worktree、分支、沙箱或权限边界。这样并行工作不会互相覆盖,审查也更简单。

可复用技能

技能保存持久判断:如何分诊、跑什么命令、哪些文件重要、什么算完成。改一次技能,比在每个定时任务里粘同一段巨长提示更靠谱。

连接器与 MCP 集成

连接器扩大循环半径。GitHub、CI、文档、issue tracker、Slack、数据库、日历和 MCP 工具,都可以进入循环契约。

生成器与 evaluator 代理

一个代理生成变更,另一个代理或确定性 gate 负责评估。把 generator 和 evaluator 分开,可以减少自我批准,也更容易抓住失败。

状态与记忆

循环需要模型上下文之外的持久状态。日志、摘要、STATE.md、PR、issue 评论和指标,让维护者能审计发生了什么。

安全的 loop engineering 必须有人把关

Loop engineering 最大的错误,是太早给自主循环太多权限。安全循环可以草拟变更、运行检查、总结风险、准备 PR,但应该在不可逆动作前停下来。

合并、部署、删除、发布、关闭、计费,或任何难以撤销的动作之前,都应该有人工闸门。

常见 loop engineering 模式

第一个有用的循环应该窄而无聊:

  • PR babysitter loop:发现停滞 PR,总结阻塞点,并提醒负责人。
  • 每日分诊循环:扫描新 issue,标记紧急程度,识别重复项,并准备审查队列。
  • CI sweeper loop:分类重复失败,区分 flaky 测试和真实回归,并草拟最小诊断 PR。
  • 依赖清扫循环:组合安全升级,运行兼容性检查,把高风险包交给人判断。
  • 变更日志草稿循环:把已合并工作整理成带链接、范围和风险说明的发布记录。

第一个 loop engineering 检查清单

自动化一个重复代理流程前,先回答这些问题:

  1. 循环读取哪个明确来源?
  2. 哪个任务边界防止范围膨胀?
  3. 循环把状态写在哪里?
  4. 每次运行如何隔离?
  5. 什么机制独立验证输出?
  6. 成本、重试和超时限制是什么?
  7. 哪一步必须人工批准?
  8. 坏运行如何回滚或丢弃?

如果这些问题回答不上来,这个循环还没准备好进生产。

最终定义

Loop engineering 是构建可重复、安全、可观测 agent loop 的工程纪律。它位于 prompt、context 和 harness 之上。最好的 loop engineering 系统会让代理更有用,但不会让人更不负责。