一个 AI 工程交付团队的底层思考:为什么知识沉淀才是真正的技术护城河
2026 年初,Harness Engineering 成为 AI 工程领域最热的话题。OpenAI Codex 在探索零手写代码的指令协议,Cursor 在做背景 Agent 自动冲突检测,Anthropic Claude Code 在打磨多层记忆系统让长时运行保持稳定。
这些实践有一个共同点:大家都在关注"怎么搭建更好的工作流管道"。
但一个更底层的问题被忽略了:管道里流的是什么?
答案是知识。而且知识管理本身就是 Harness Engineering 三支柱(上下文工程 / 架构约束 / 持续治理)的核心能力——上下文工程里的"知识检索注入"和"长短期记忆",持续治理里的"知识生命周期"和"自动衰减",都是明证。只是在当前热潮中,工作流编排这些更显眼的工程话题盖过了底层的知识基础设施。
大家都在讨论高速公路该修几车道、立交桥怎么设计,却忘了问——路上跑的车从哪来、到哪去、怎么保养。
今天用 16 阶段状态机,明天可能用 DAG 图结构。Agent 调度从串行到并行到分层级联,变化极快。但"广告预算扣减在高并发下会超扣,需用 Redis+Lua 保证原子性"——这条知识不管工作流怎么变都有价值。
很多团队搭了复杂的 Agent 工作流,每次需求都跑一遍全流程——但每次从零开始。上次踩的坑下次照踩,上次做的架构决策下次重新推导。投入了工程成本,工具链却没有越来越聪明。
知识分三类:散点型(孤立事实)、因果型(推理链)、时空型(特定场景才成立)。越高阶越难从模型获得,越依赖实践积累。当成百上千条 proven 知识在库时,新人、新项目都能"站在前人肩上"。
五层存储 — 从个人偏好(L0-P)到项目知识(L3),知识可向上提升(L3→L1/L2)被其他项目复用。
五种类型 — model / decision / guideline / pitfall / process,MECE 互斥穷尽,每一条只属于一个类型。
三级成熟度 + 自动衰减 — draft → verified(1 个工作流验证)→ proven(≥2 个项目验证)。proven 12 个月未引用自动降级,draft 持续未引用自动归档。
这个团队的 16 阶段状态机,每个阶段都与知识流动紧密关联:
他们设计了三级渐进式索引解决上下文膨胀问题:Agent 先用 ~50 行读全景目录了解全貌,再用 ~300 行读分类清单定位相关条目,只在真正需要时读完整内容。对比一次性推送 50 条完整知识(可能 5000-10000 行),上下文效率提升了一个数量级。
这套架构看起来很完整,但实际落地时发现了一个被普遍忽略的问题:工作流流转依赖于人的在场。
一天 8 小时工作,真正坐在工位操控 Agent 的时间可能不到 4 小时。会议间隙的 5 分钟、通勤路上的 30 分钟——这些碎片时间恰是 Agent 等你确认的黄金窗口,但你不在电脑前。
他们引入了 Hapi 内网版解决这个问题:手机/平板/浏览器均可远程接管开发机上的 AI 编程会话,24 小时待机。站会时可以用手机扫一眼 Agent 进展,通勤路上可以启动新工作流,在家可以用浏览器继续操控。更重要的是,这保障了知识沉淀闭环的完整性——工作流不再因为"等人"而卡住。
好的 Harness 工程不仅要设计"Agent 怎么跑",还要设计"人怎么随时参与"。
模型会迭代,工具链会更新,工作流会重构。但团队在一个特定业务领域积累的领域模型、架构决策、最佳实践、已知陷阱——这些是永恒的。
工作流是手段,知识是目的。