Agent SkillLINUX DO · Claude·2026/3/21

Harness Engineering实践：多Agent协作与开源套件对比

原标题：想开一个 harness engineering 实践的长期帖子，大家一起分享实践经验

速览

本文深入探讨Harness Engineering在AI编程中的应用，通过对比oh-my-opencode、oh-my-claudecode等开源套件，分析多Agent协作模式。作者结合GDIM流程与Codex等工具，总结了抑制AI重构缺陷、提升代码质量的实战经验。

AI 深度解读

背景

随着 AI 编程能力的提升，开发者对 AI 辅助编码的期待已从简单的代码补全转向更复杂的工程化实践。文中提到的 Harness Engineering（智能体编排工程）正是这一趋势下的产物，其核心理念是将 AI 视为执行者，人类负责“许愿”（提出需求与设计），AI 负责实现。

作者最初接触该概念源于 B 站视频及 Anthropic 发布的博文 Effective harnesses for long-running agents。早期概念如 Claude Code 被认为消耗过大且脱离现实，但随着 GDIM (Gap-Driven Iteration Model) 流程的引入及实践，作者发现虽然能实现功能，但 AI 在重构过程中常出现“削足适履”、“补丁摞补丁”等烂设计问题，需要人工大量“擦屁股”。

近期，随着 Claude Opus 4.6 中转站的不稳定，作者转向 GPT-5.4 配合 Codex 及 Superpowers Skills，发现效果显著优于预期。同时，为了探索 OpenCode 生态下的 Oh-My-OpenCode 插件在 Harness Engineering 中的应用，作者试图通过一个包含 8 个交叉开发计划的超级重构项目来测试其能力边界。

面对 Oh-My-OpenCode、Oh-My-ClaudeCode、Oh-My-Codex 以及 CCG-Workflow 等多个开源 Harness 体系，作者意识到个人精力与 Token 成本有限，难以逐一深究。因此，发起此长期帖子，旨在开源共享实践经验，共建交流社区，以应对 AI-Native Engineering 时代的挑战。

核心内容

1. 实践演进与工具选型

作者的实践路径反映了当前 AI 编程工具的快速迭代与生态分化：

初期尝试：基于 GDIM Workflow Skill 进行泛化提取，但效果“差强人意”，主要痛点在于 AI 生成的代码结构混乱，缺乏长远设计。
中期转向：因 Claude Opus 4.6 服务不稳定，转向 GPT-5.4 配合 Codex。发现 Codex 结合 Superpowers Skills 后，代码理解与设计执行能力大幅提升，从而抛弃了大部分旧有 Skills，全面拥抱新组合。
近期探索：在开发自用 Codex Web 工具时，调研发现 OpenCode 自带 Web UI，且 Oh-My-OpenCode 插件能更便捷地实践 Harness Engineering。作者配置该插件后，正在进行大规模重构测试，以挖掘其能力边界。
生态困惑：目前存在多个绑定不同模型的开源 Harness 套件（如基于 Claude Code 的 Oh-My-ClaudeCode 和基于 Codex 的 Oh-My-Codex），作者虽偏好开放的 OpenCode 生态，但因过往负面体验而持谨慎态度。

2. Harness Engineering 套件对比

文章详细对比了六种主要套件/工作流在职责划分上的差异。这些套件通过定义不同类型的 Agent（智能体角色）来实现复杂工程任务。

缩写对照：

CX: Codex
CC: Claude Code
OMOC: Oh-My-OpenCode
OMCC: Oh-My-ClaudeCode
OMCX: Oh-My-Codex
CCG: CCG-Workflow (注：非严格 Harness 套件，因社区推荐列入)

职责与 Agent 角色映射表：

| 职责划分 | CX (Codex) | CC (Claude Code) | OMOC (Oh-My-OpenCode) | OMCC (Oh-My-ClaudeCode) | OMCX (Oh-My-Codex) | CCG | | :--- | :--- | :--- | :--- | :--- | :--- | :--- | | 通用 / 兜底 | default | General-purpose | Sisyphus | 无 | 无 | 无 | | 探索 / 检索 | - | - | - | Explore | Explore | /ccg:team-research | | 需求 / 范围分析 | - | - | Metis | Analyst | 无 | /ccg:team-research | | 规划 | - | Plan | Prometheus | Planner | Planner | /ccg:team-plan | | 计划审查 / 反驳 | - | - | Momus | Critic | Critic | /ccg:team-review | | 架构 / 设计评审 | - | - | Oracle | Architect | Architect | init-architect / /ccg:team-plan | | 调试 / 根因分析 | - | - | Oracle | Debugger | Debugger | 无 | | 实现 / 执行 | Worker | General-purpose | Hephaestus / Sisyphus-Junior | Executor | Executor | /ccg:team-exec | | 代码审查 | - | - | Oracle | Code-Reviewer | 无 | /ccg:team-review | | 测试工程 / TDD | - | - | - | Test-Engineer | Test-Engineer | 无 | | 验证 / 验收 | - | - | Atlas | Verifier | Verifier | /ccg:team-review | | 文档 / 知识检索 | - | - | Librarian | 无 | 无 | 无 | | 文档写作 | - | - | - | Writer | Writer | 无 | | 多模态分析 | - | - | Multimodal-Looker | 无 | 无 | ui-ux-designer |

注：表中“-”表示该套件或未列出或未明确对应特定 Agent 角色。

3. 资源与资料汇总

为了支持社区共建，作者整理了以下关键资料：

Harness 套件：Oh-My-OpenCode, Oh-My-ClaudeCode, Oh-My-Codex, CCG-Workflow。
站外资料：
- Effective harnesses for long-running agents (Anthropic)
- 工程技术：在智能体优先的世界中利用 Codex (OpenAI)
- The Anatomy of an Agent Harness (Viv/langchain工程师)
站内资料：包括关于 Oh-My-OpenCode 配置心得、OpenAI 提出的 Harness Engineering 实践、Claude Code 高强度实战最佳实践、AI-Native Engineering 工作流分享、Codex 增强版功能介绍以及 Vibecoding 进阶教程等。

关键要点

AI 编程的痛点转移：早期痛点在于“不会写”，当前痛点在于“写得烂”（如设计缺陷、代码耦合、补丁式开发）。Harness Engineering 旨在通过多 Agent 协作解决复杂设计问题，而非单纯生成代码。
模型与工具的组合效应：单纯依赖模型（如 Claude 或 GPT）效果有限，关键在于结合特定的 Skills 或 Harness 框架（如 Superpowers, Oh-My-* 系列）。GPT-5.4 + Codex + Superpowers 的组合在作者实践中表现优异。
生态碎片化与选择困难：目前存在多个基于不同模型（Claude, Codex）和平台（OpenCode）的开源 Harness 套件，缺乏统一标准。开发者面临精力分散和 Token 成本高昂的问题。
多 Agent 协作的必要性：复杂的 AI 编程任务需要拆解为探索、规划、审查、执行、验证等多个环节，每个环节由专门的 Agent 角色（如 Architect, Critic, Executor）负责，以提高代码质量和设计合理性。
社区共建的价值：鉴于个人探索的局限性，通过开源共享实践经验、配置心得和对比数据，有助于整个社区快速掌握 Harness Engineering 的最佳实践，避免重复造轮子。

意义与影响

推动 AI 编程从“辅助”向“代理”演进：Harness Engineering 的实践标志着 AI 在软件开发中的角色从被动工具转变为主动的工程参与者。

查看原文 →linux.do