← 返回信息流
Agent SkillLINUX DO · Claude·2026/3/21

Harness Engineering实践:多Agent协作与开源套件对比

原标题:想开一个 harness engineering 实践的长期帖子,大家一起分享实践经验

速览

本文深入探讨Harness Engineering在AI编程中的应用,通过对比oh-my-opencode、oh-my-claudecode等开源套件,分析多Agent协作模式。作者结合GDIM流程与Codex等工具,总结了抑制AI重构缺陷、提升代码质量的实战经验。

AI 深度解读

背景

随着 AI 编程能力的提升,开发者对 AI 辅助编码的期待已从简单的代码补全转向更复杂的工程化实践。文中提到的 Harness Engineering(智能体编排工程)正是这一趋势下的产物,其核心理念是将 AI 视为执行者,人类负责“许愿”(提出需求与设计),AI 负责实现。

作者最初接触该概念源于 B 站视频及 Anthropic 发布的博文 Effective harnesses for long-running agents。早期概念如 Claude Code 被认为消耗过大且脱离现实,但随着 GDIM (Gap-Driven Iteration Model) 流程的引入及实践,作者发现虽然能实现功能,但 AI 在重构过程中常出现“削足适履”、“补丁摞补丁”等烂设计问题,需要人工大量“擦屁股”。

近期,随着 Claude Opus 4.6 中转站的不稳定,作者转向 GPT-5.4 配合 CodexSuperpowers Skills,发现效果显著优于预期。同时,为了探索 OpenCode 生态下的 Oh-My-OpenCode 插件在 Harness Engineering 中的应用,作者试图通过一个包含 8 个交叉开发计划的超级重构项目来测试其能力边界。

面对 Oh-My-OpenCodeOh-My-ClaudeCodeOh-My-Codex 以及 CCG-Workflow 等多个开源 Harness 体系,作者意识到个人精力与 Token 成本有限,难以逐一深究。因此,发起此长期帖子,旨在开源共享实践经验,共建交流社区,以应对 AI-Native Engineering 时代的挑战。

核心内容

1. 实践演进与工具选型

作者的实践路径反映了当前 AI 编程工具的快速迭代与生态分化:

  • 初期尝试:基于 GDIM Workflow Skill 进行泛化提取,但效果“差强人意”,主要痛点在于 AI 生成的代码结构混乱,缺乏长远设计。
  • 中期转向:因 Claude Opus 4.6 服务不稳定,转向 GPT-5.4 配合 Codex。发现 Codex 结合 Superpowers Skills 后,代码理解与设计执行能力大幅提升,从而抛弃了大部分旧有 Skills,全面拥抱新组合。
  • 近期探索:在开发自用 Codex Web 工具时,调研发现 OpenCode 自带 Web UI,且 Oh-My-OpenCode 插件能更便捷地实践 Harness Engineering。作者配置该插件后,正在进行大规模重构测试,以挖掘其能力边界。
  • 生态困惑:目前存在多个绑定不同模型的开源 Harness 套件(如基于 Claude CodeOh-My-ClaudeCode 和基于 CodexOh-My-Codex),作者虽偏好开放的 OpenCode 生态,但因过往负面体验而持谨慎态度。

2. Harness Engineering 套件对比

文章详细对比了六种主要套件/工作流在职责划分上的差异。这些套件通过定义不同类型的 Agent(智能体角色)来实现复杂工程任务。

缩写对照:

  • CX: Codex
  • CC: Claude Code
  • OMOC: Oh-My-OpenCode
  • OMCC: Oh-My-ClaudeCode
  • OMCX: Oh-My-Codex
  • CCG: CCG-Workflow (注:非严格 Harness 套件,因社区推荐列入)

职责与 Agent 角色映射表:

| 职责划分 | CX (Codex) | CC (Claude Code) | OMOC (Oh-My-OpenCode) | OMCC (Oh-My-ClaudeCode) | OMCX (Oh-My-Codex) | CCG | | :--- | :--- | :--- | :--- | :--- | :--- | :--- | | 通用 / 兜底 | default | General-purpose | Sisyphus | 无 | 无 | 无 | | 探索 / 检索 | - | - | - | Explore | Explore | /ccg:team-research | | 需求 / 范围分析 | - | - | Metis | Analyst | 无 | /ccg:team-research | | 规划 | - | Plan | Prometheus | Planner | Planner | /ccg:team-plan | | 计划审查 / 反驳 | - | - | Momus | Critic | Critic | /ccg:team-review | | 架构 / 设计评审 | - | - | Oracle | Architect | Architect | init-architect / /ccg:team-plan | | 调试 / 根因分析 | - | - | Oracle | Debugger | Debugger | 无 | | 实现 / 执行 | Worker | General-purpose | Hephaestus / Sisyphus-Junior | Executor | Executor | /ccg:team-exec | | 代码审查 | - | - | Oracle | Code-Reviewer | 无 | /ccg:team-review | | 测试工程 / TDD | - | - | - | Test-Engineer | Test-Engineer | 无 | | 验证 / 验收 | - | - | Atlas | Verifier | Verifier | /ccg:team-review | | 文档 / 知识检索 | - | - | Librarian | 无 | 无 | 无 | | 文档写作 | - | - | - | Writer | Writer | 无 | | 多模态分析 | - | - | Multimodal-Looker | 无 | 无 | ui-ux-designer |

注:表中“-”表示该套件或未列出或未明确对应特定 Agent 角色。

3. 资源与资料汇总

为了支持社区共建,作者整理了以下关键资料:

  • Harness 套件:Oh-My-OpenCode, Oh-My-ClaudeCode, Oh-My-Codex, CCG-Workflow。
  • 站外资料
    • Effective harnesses for long-running agents (Anthropic)
    • 工程技术:在智能体优先的世界中利用 Codex (OpenAI)
    • The Anatomy of an Agent Harness (Viv/langchain工程师)
  • 站内资料:包括关于 Oh-My-OpenCode 配置心得、OpenAI 提出的 Harness Engineering 实践、Claude Code 高强度实战最佳实践、AI-Native Engineering 工作流分享、Codex 增强版功能介绍以及 Vibecoding 进阶教程等。

关键要点

  • AI 编程的痛点转移:早期痛点在于“不会写”,当前痛点在于“写得烂”(如设计缺陷、代码耦合、补丁式开发)。Harness Engineering 旨在通过多 Agent 协作解决复杂设计问题,而非单纯生成代码。
  • 模型与工具的组合效应:单纯依赖模型(如 Claude 或 GPT)效果有限,关键在于结合特定的 Skills 或 Harness 框架(如 Superpowers, Oh-My-* 系列)。GPT-5.4 + Codex + Superpowers 的组合在作者实践中表现优异。
  • 生态碎片化与选择困难:目前存在多个基于不同模型(Claude, Codex)和平台(OpenCode)的开源 Harness 套件,缺乏统一标准。开发者面临精力分散和 Token 成本高昂的问题。
  • 多 Agent 协作的必要性:复杂的 AI 编程任务需要拆解为探索、规划、审查、执行、验证等多个环节,每个环节由专门的 Agent 角色(如 Architect, Critic, Executor)负责,以提高代码质量和设计合理性。
  • 社区共建的价值:鉴于个人探索的局限性,通过开源共享实践经验、配置心得和对比数据,有助于整个社区快速掌握 Harness Engineering 的最佳实践,避免重复造轮子。

意义与影响

  1. 推动 AI 编程从“辅助”向“代理”演进:Harness Engineering 的实践标志着 AI 在软件开发中的角色从被动工具转变为主动的工程参与者。
查看原文 →linux.do