不需要对话框，也能赋能手艺人

原文：https://mp.weixin.qq.com/s/RJOgFEajlC4hhyamHBO-hw
主办：Anthropic × Cerebral Valley · 「Built with 4.7」黑客松
规则：用 Opus 4.7 + Claude Code，一周时间，做一个东西出来

引 · 一个反常识

Anthropic 刚公布的这场黑客松，参赛规则只有一行：用 Opus 4.7 + Claude Code，一周时间，做个东西出来。

六个获奖项目里，没有一个是聊天机器人。

这件事比"谁拿了金奖"更值得记下来。这两年所有人都在卷对话框——更大的 context、更聪明的 RAG、更花哨的 prompt。这场黑客松六强用脚投票告诉你：当 AI 真正落地到一个具体领域时，对话框只是壳，里面装的是另外的东西。

CORE INSIGHT

它们到底在做什么

每一个项目都在把原本锁在某个人头脑里、几十年累积出来的判断力，变成其他人能用的工具。
板级维修经验锁在少数硬件工程师手里；临床直觉锁在资深医生脑子里；工厂维护知识锁在那个"什么都知道"的老师傅心里；木工手艺锁在没有大学文凭的匠人手上。

• • •

一、六个项目，五个国家，一个共同方向

项目	奖项	国家	隐性知识对象
MedKit	金奖	土耳其	急诊室临床直觉
Wrench Board	银奖	法国	板级维修经验
Maieutic	铜奖	智利	教师对学生思维误区的直觉
Virtual Puppet Theater	最佳创意	丹麦	互动剧场体验
MaestrIA	Keep Thinking	智利	30 年木匠手艺
ARIA	最佳 Managed Agents	法国	工厂老师傅听机器声音的直觉

• • •

二、六强逐一拆解

金奖 MedKit 土耳其 · 执业医生 Bedirhan Keskin

语音驱动的虚拟诊室。系统生成 AI 病人，医学生通过语音问诊、开检查、看影像、做诊断、开处方。每次问诊后系统按最新临床指南给沟通能力、病史采集和临床推理逐项打分，每个扣分点附带文献引用。

技术栈

Claude Managed Agents：1 个 Opus 4.7"主治医师" Agent + 3 个子 Agent（病人角色扮演 / 观察者评估 / 问诊复盘）

病例库

Agent 自动生成，每条都能追溯到真实存在的临床指南

作者原话

"在 AI 身上犯所有的错，然后再去面对真正的病人。"

银奖 Wrench Board 法国 · 自学开发者 Alexis Chapellier

背景：全球每年约有 5000 万吨电子产品变成垃圾，其中很多并非修不了，而是板级维修知识掌握在极少数人手里。

导入主板照片和原理图 PDF（80 多页），Wrench Board 用 Opus 4.7 视觉能力分批并行读取，两分钟内编译成可查询的电气知识图谱（25 元件 + 33 症状 + 10 诊断规则）。然后你可以直接和 Agent 对话——它会在主板照片上一步一步画出诊断路径。

三层记忆

① 你的工具档案（没有热风台就不会让你做 BGA 返焊）
② 这块板的修复历史（之前修过哪里、试过什么方案）
③ 元件白名单

反幻觉

Agent 说出的每个元件编号必须来自工具查询，没查到的服务端直接过滤掉，到不了用户屏幕

技能档案

每次成功维修后用户的技能档案自动升级

"当一个拿着万用表的普通技术员，能做到昨天只有 OEM 售后中心才能做的事，'维修权'才算真正落地了。" — Alexis Chapellier

铜奖 Maieutic 智利 · 大学副主任 Paula Vasquez-Henriquez

给大学一年级 Python 课设计的编程教学平台。Paula 教了六年入门编程，带过 200 个学生，见过太多三种学生：复制 LLM 代码不知道在干嘛的、随便扫题目要求的、还没想清楚就开始敲的。三种都能交作业、都能及格——但没有一个人学到了真正重要的那个东西。

核心反向操作

写代码之前编辑器先锁着。学生用自己的话描述程序应该干什么 → AI 追问没说清楚的地方 → spec 足够清晰才解锁

编辑器规则

自动补全关闭。学生问语法，AI 回答；学生问"我该怎么做"，AI 引导思考，不给答案

提交后

AI 把最初的 spec 和实际代码对齐，让学生自己解释中间的 gap

教师面板

实时看每个学生此刻卡在哪、在怎么推理、哪些错误反复出现——不是看分数，是看推理过程

"在大学禁 AI 并非正确做法。未来的程序员大部分时间都在写 prompt，但好的 prompt 来自于理解你要构建什么、什么可能出错、以及结果对不对。" — Paula Vasquez-Henriquez

Paula 的一句话值得单独拎出：Opus 4.7 能分辨学生是在「推理」还是在「猜」。

最佳创意 Virtual Puppet Theater 丹麦 · Rene Hangstrup Moller

用手对着摄像头比划，屏幕上的木偶就跟着动；说话，木偶也说话；说"给 Bob 戴个王冠"，王冠就出现了；说"我们去海滩吧"，背景就换成沙滩。

技术栈

MediaPipe（手指关节 3D 追踪）+ Web Speech API（识别）+ 11 Labs Flash（合成）+ Three.js（3D 渲染）

双模型分工

日常对话用 Haiku 保速度，道具生成用 Opus 保创意——共享一个缓存

实时生成

"冰淇淋帽子"在用户第一次说出来时，Opus 用基础图形组合实时拼出

Keep Thinking MaestrIA 智利 · 木匠之子 Benjamin Torralbo

Benjamin 的父亲做了 30 年木匠，其中 8 年在修复智利奇洛埃岛上被联合国列入世界遗产的木教堂。但智利体制里，没有大学文凭，你修过再多世界遗产，你也是全隐形人。

使用方式：拍一张受损墙面的照片，输入位置。Opus 4.7 实时展示推理过程——先观察，再诊断，就像一个老师傅到了现场，得先看一圈再开口。

4 个答案

修什么 / 大概多少钱 / 需要多长时间 / 不修会怎样

多 Agent 辩论

木匠 Agent vs 泥瓦匠 Agent，用智利本地西班牙语各自论证修复方案；另一 Agent 跑去 Sodimac 和 Easy 建材超市实时查价，验证预算靠不靠谱

第三个 Agent

自动用智利本地西班牙语写一条 WhatsApp 消息给手艺人，附上完整诊断报告

验证

12 张照片拿给作者父亲做盲测——与 30 年老师傅判断的吻合率：81%

"工具是我做的。知识是他的。" — Benjamin Torralbo

最佳 Managed Agents ARIA 法国 · Idriss Benguezzou & Adam Hnaien

解决工业维护领域一个老问题：在每个工厂、每个车间、每个水站里，总有那么一个人——他能听出机器声音哪里不对劲，他能在机器坏之前两天就知道它要坏了。然后他退休了，这些知识就永远消失了。

传统的工业维修管理系统部署成本 50 万美元起，需要半年的专业咨询。结果就是，超过一半的工厂压根不装。

演示场景是矿泉水灌装厂的一条线、五台设备。把设备手册丢给 ARIA，Opus 4.7 视觉能力读完手册问了三个问题，系统就上线了。

架构

5 个 Agent 各司其职，共享 17 个工具，通过 MCP 协作

警报二次判断

瓶盖机振动异常报警，ARIA 没有立刻发工单——查了上下文发现振动值其实在下降。结论：无需处理。多走了一步：判断这个警报值不值得理

故障链路

检测 Agent → 调查 Agent 启动 extended thinking → 写 Python 在 Anthropic 云沙箱跑回归分析 → 算出退化速率 → 工单包含根因 + 一步步修复建议

历史记忆

类似异常翻出 3 个月前 Tom Anderson 处理过的 case，找到当时方案和零件编号

• • •

三、技术上的三个收敛信号

信号 1

白名单约束开始成为标配

Wrench Board 给 AI 戴了一个硬约束——Agent 输出的元件编号必须来自工具查询，没查到的服务端直接过滤掉。这是一个比"prompt 写更好"更粗暴有效的反幻觉机制。当一个领域的事实集合是有限的（元件、合规条目、SKU），白名单是比 RAG 更可靠的兜底。

信号 2

对象记忆和用户档案在同一个产品里

Wrench Board 同时记你的工具清单（你有什么）和这块板子的修复历史（这只对象有什么）。这不是一个记忆维度，是两个：一个绑用户、一个绑对象。组合起来产品才能"认识你"和"认识它"。

信号 3

多 Agent 不是噱头

MedKit 是 1 主管 + 3 子 Agent；ARIA 是 5 Agent + 17 工具的 MCP 协作；MaestrIA 让木匠 Agent 和泥瓦匠 Agent 用智利本地西班牙语辩论修复方案，另一个 Agent 跑去 Sodimac 和 Easy 实时查价校验预算。

「最佳 Managed Agents 使用奖」单独设了一个，说明 Anthropic 自己也认为这是一个独立的产品形态，不是单 Agent 的简单叠加。

• • •

四、最值得记的一个反向操作

Maieutic 做的事是反直觉的。

它是给大学一年级 Python 课设计的，规则是：写代码之前，编辑器锁着。学生得先用自己的话描述程序应该干什么，AI 读完追问没说清楚的地方，spec 足够清晰才解锁。

编辑器打开后，自动补全是关的。学生问语法 AI 回答；学生问"我该怎么做"，AI 引导思考，不给答案。提交后 AI 把最初的 spec 和实际代码对齐，让学生自己解释 gap 在哪。

这一整套设计的反直觉之处在于：所有人都在卷"AI 帮我写得更快"，Paula 在做的事是"AI 让你慢下来想清楚"。

META POINT

它不是"AI 教你写代码"

它是"AI 当一个学习元认知的镜子"。
当 Opus 4.7 能分辨"在推理"和"在猜"，这个能力本身就比代码补全值钱——不仅在编程教育，在任何"训练判断力"的场景都成立。

• • •

五、最让人记住的故事

Keep Thinking 特别奖给了智利的 Benjamin Torralbo。

他父亲 Juan Rodrigo Torralbo 做了 30 年木匠，其中 8 年在修复智利奇洛埃岛上被联合国列入世界遗产的木教堂。

"智利有超过 28 万名非正式建筑工人，没有任何途径能展示自己的手艺。我爸修复了联合国世界遗产教堂，可没有大学文凭的他，在系统里根本不存在。" — Benjamin Torralbo

Benjamin 做的 MaestrIA 让用户拍受损墙照片+输入位置，AI 分析后给四个答案：修什么、多少钱、多长时间、不修会怎样。然后推荐附近的手艺人，第三个 Agent 用智利本地西班牙语帮你写一条 WhatsApp 消息附诊断报告。

分析过程中还有个有意思的环节：系统模拟不同工种的专家辩论。木匠 vs 泥瓦匠用智利西班牙语各自论证修复方案，另一个 Agent 跑去当地建材超市 Sodimac 和 Easy 实时查价，验证预算是否靠谱。一个报价没有实际价格支撑，说了等于没说。

最后他把 12 张照片拿给父亲做盲测。

VALIDATION

与 30 年老师傅判断的吻合率：81%

这是这场黑客松最值钱的一个数字。它没有让 AI 替代老师傅——它把老师傅 30 年的判断力放大成一个其他人能用的工具。

"工具是我做的。知识是他的。" — Benjamin Torralbo

"你不再是一脸懵地跟工人说'我墙湿了'。你手上拿着诊断报告。客户不会被乱开价，有手艺但不会推销自己的工人也能接到活。"

• • •

结 · 他们可能就是你

原文最后那句话：他们不是硅谷连续创业者，他们是一个土耳其医生、一个智利大学老师、一个木匠的儿子。他们可能就是你。

人类文明里有大量这样的隐性知识：

不在论文里
不在教科书里
不在任何数据库里
只存在于某个人的手感、直觉、几十年累积出来的判断力里

老师傅退休了，临床直觉随一代人老去而失传，没有人宣布它的死亡，也很少有人意识到自己失去了什么。

在 AI 到来之前，这些知识因为太长尾、太不起眼，被鉴定为没有价值，从而忽略。

CLOSING

这六个项目背后的指向

AI 可以接住这些正在断裂的经验，让它变成一种工具，一种传承。

而做这件事，不需要对话框。