Harness Engineering实践:多Agent协作与开源套件对比
速览
本文深入探讨Harness Engineering在AI编程中的应用,通过对比oh-my-opencode、oh-my-claudecode等开源套件,分析多Agent协作模式。作者结合GDIM流程与Codex等工具,总结了抑制AI重构缺陷、提升代码质量的实战经验。
AI 深度解读
背景
随着 AI 编程能力的提升,开发者对 AI 辅助编码的期待已从简单的代码补全转向更复杂的工程化实践。文中提到的 Harness Engineering(智能体编排工程)正是这一趋势下的产物,其核心理念是将 AI 视为执行者,人类负责“许愿”(提出需求与设计),AI 负责实现。
作者最初接触该概念源于 B 站视频及 Anthropic 发布的博文 Effective harnesses for long-running agents。早期概念如 Claude Code 被认为消耗过大且脱离现实,但随着 GDIM (Gap-Driven Iteration Model) 流程的引入及实践,作者发现虽然能实现功能,但 AI 在重构过程中常出现“削足适履”、“补丁摞补丁”等烂设计问题,需要人工大量“擦屁股”。
近期,随着 Claude Opus 4.6 中转站的不稳定,作者转向 GPT-5.4 配合 Codex 及 Superpowers Skills,发现效果显著优于预期。同时,为了探索 OpenCode 生态下的 Oh-My-OpenCode 插件在 Harness Engineering 中的应用,作者试图通过一个包含 8 个交叉开发计划的超级重构项目来测试其能力边界。
面对 Oh-My-OpenCode、Oh-My-ClaudeCode、Oh-My-Codex 以及 CCG-Workflow 等多个开源 Harness 体系,作者意识到个人精力与 Token 成本有限,难以逐一深究。因此,发起此长期帖子,旨在开源共享实践经验,共建交流社区,以应对 AI-Native Engineering 时代的挑战。
核心内容
1. 实践演进与工具选型
作者的实践路径反映了当前 AI 编程工具的快速迭代与生态分化:
- 初期尝试:基于 GDIM Workflow Skill 进行泛化提取,但效果“差强人意”,主要痛点在于 AI 生成的代码结构混乱,缺乏长远设计。
- 中期转向:因 Claude Opus 4.6 服务不稳定,转向 GPT-5.4 配合 Codex。发现 Codex 结合 Superpowers Skills 后,代码理解与设计执行能力大幅提升,从而抛弃了大部分旧有 Skills,全面拥抱新组合。
- 近期探索:在开发自用 Codex Web 工具时,调研发现 OpenCode 自带 Web UI,且 Oh-My-OpenCode 插件能更便捷地实践 Harness Engineering。作者配置该插件后,正在进行大规模重构测试,以挖掘其能力边界。
- 生态困惑:目前存在多个绑定不同模型的开源 Harness 套件(如基于 Claude Code 的 Oh-My-ClaudeCode 和基于 Codex 的 Oh-My-Codex),作者虽偏好开放的 OpenCode 生态,但因过往负面体验而持谨慎态度。
2. Harness Engineering 套件对比
文章详细对比了六种主要套件/工作流在职责划分上的差异。这些套件通过定义不同类型的 Agent(智能体角色)来实现复杂工程任务。
缩写对照:
- CX: Codex
- CC: Claude Code
- OMOC: Oh-My-OpenCode
- OMCC: Oh-My-ClaudeCode
- OMCX: Oh-My-Codex
- CCG: CCG-Workflow (注:非严格 Harness 套件,因社区推荐列入)
职责与 Agent 角色映射表:
| 职责划分 | CX (Codex) | CC (Claude Code) | OMOC (Oh-My-OpenCode) | OMCC (Oh-My-ClaudeCode) | OMCX (Oh-My-Codex) | CCG |
| :--- | :--- | :--- | :--- | :--- | :--- | :--- |
| 通用 / 兜底 | default | General-purpose | Sisyphus | 无 | 无 | 无 |
| 探索 / 检索 | - | - | - | Explore | Explore | /ccg:team-research |
| 需求 / 范围分析 | - | - | Metis | Analyst | 无 | /ccg:team-research |
| 规划 | - | Plan | Prometheus | Planner | Planner | /ccg:team-plan |
| 计划审查 / 反驳 | - | - | Momus | Critic | Critic | /ccg:team-review |
| 架构 / 设计评审 | - | - | Oracle | Architect | Architect | init-architect / /ccg:team-plan |
| 调试 / 根因分析 | - | - | Oracle | Debugger | Debugger | 无 |
| 实现 / 执行 | Worker | General-purpose | Hephaestus / Sisyphus-Junior | Executor | Executor | /ccg:team-exec |
| 代码审查 | - | - | Oracle | Code-Reviewer | 无 | /ccg:team-review |
| 测试工程 / TDD | - | - | - | Test-Engineer | Test-Engineer | 无 |
| 验证 / 验收 | - | - | Atlas | Verifier | Verifier | /ccg:team-review |
| 文档 / 知识检索 | - | - | Librarian | 无 | 无 | 无 |
| 文档写作 | - | - | - | Writer | Writer | 无 |
| 多模态分析 | - | - | Multimodal-Looker | 无 | 无 | ui-ux-designer |
注:表中“-”表示该套件或未列出或未明确对应特定 Agent 角色。
3. 资源与资料汇总
为了支持社区共建,作者整理了以下关键资料:
- Harness 套件:Oh-My-OpenCode, Oh-My-ClaudeCode, Oh-My-Codex, CCG-Workflow。
- 站外资料:
- Effective harnesses for long-running agents (Anthropic)
- 工程技术:在智能体优先的世界中利用 Codex (OpenAI)
- The Anatomy of an Agent Harness (Viv/langchain工程师)
- 站内资料:包括关于 Oh-My-OpenCode 配置心得、OpenAI 提出的 Harness Engineering 实践、Claude Code 高强度实战最佳实践、AI-Native Engineering 工作流分享、Codex 增强版功能介绍以及 Vibecoding 进阶教程等。
关键要点
- AI 编程的痛点转移:早期痛点在于“不会写”,当前痛点在于“写得烂”(如设计缺陷、代码耦合、补丁式开发)。Harness Engineering 旨在通过多 Agent 协作解决复杂设计问题,而非单纯生成代码。
- 模型与工具的组合效应:单纯依赖模型(如 Claude 或 GPT)效果有限,关键在于结合特定的 Skills 或 Harness 框架(如 Superpowers, Oh-My-* 系列)。GPT-5.4 + Codex + Superpowers 的组合在作者实践中表现优异。
- 生态碎片化与选择困难:目前存在多个基于不同模型(Claude, Codex)和平台(OpenCode)的开源 Harness 套件,缺乏统一标准。开发者面临精力分散和 Token 成本高昂的问题。
- 多 Agent 协作的必要性:复杂的 AI 编程任务需要拆解为探索、规划、审查、执行、验证等多个环节,每个环节由专门的 Agent 角色(如 Architect, Critic, Executor)负责,以提高代码质量和设计合理性。
- 社区共建的价值:鉴于个人探索的局限性,通过开源共享实践经验、配置心得和对比数据,有助于整个社区快速掌握 Harness Engineering 的最佳实践,避免重复造轮子。
意义与影响
- 推动 AI 编程从“辅助”向“代理”演进:Harness Engineering 的实践标志着 AI 在软件开发中的角色从被动工具转变为主动的工程参与者。
