不需要对话框,也能赋能手艺人

Claude Code 黑客松六强项目的共同内核
六个项目,没有一个是聊天机器人

2026-04-30  |  CC OPUS 4.7 DEEP ANALYSIS

mp.weixin.qq.com/s/RJOgFEajlC4hhyamHBO-hw

引 · 一个反常识

Anthropic 刚公布的这场黑客松,参赛规则只有一行:用 Opus 4.7 + Claude Code,一周时间,做个东西出来。

六个获奖项目里,没有一个是聊天机器人

这件事比"谁拿了金奖"更值得记下来。这两年所有人都在卷对话框——更大的 context、更聪明的 RAG、更花哨的 prompt。这场黑客松六强用脚投票告诉你:当 AI 真正落地到一个具体领域时,对话框只是壳,里面装的是另外的东西。

CORE INSIGHT

它们到底在做什么

每一个项目都在把原本锁在某个人头脑里、几十年累积出来的判断力,变成其他人能用的工具
板级维修经验锁在少数硬件工程师手里;临床直觉锁在资深医生脑子里;工厂维护知识锁在那个"什么都知道"的老师傅心里;木工手艺锁在没有大学文凭的匠人手上。

• • •

一、六个项目,五个国家,一个共同方向

项目奖项国家隐性知识对象
MedKit金奖土耳其急诊室临床直觉
Wrench Board银奖法国板级维修经验
Maieutic铜奖智利教师对学生思维误区的直觉
Virtual Puppet Theater最佳创意丹麦互动剧场体验
MaestrIAKeep Thinking智利30 年木匠手艺
ARIA最佳 Managed Agents法国工厂老师傅听机器声音的直觉
• • •

二、六强逐一拆解

金奖 MedKit 土耳其 · 执业医生 Bedirhan Keskin

语音驱动的虚拟诊室。系统生成 AI 病人,医学生通过语音问诊、开检查、看影像、做诊断、开处方。每次问诊后系统按最新临床指南给沟通能力、病史采集和临床推理逐项打分,每个扣分点附带文献引用。

技术栈
Claude Managed Agents:1 个 Opus 4.7"主治医师" Agent + 3 个子 Agent(病人角色扮演 / 观察者评估 / 问诊复盘)
病例库
Agent 自动生成,每条都能追溯到真实存在的临床指南
作者原话
"在 AI 身上犯所有的错,然后再去面对真正的病人。"
银奖 Wrench Board 法国 · 自学开发者 Alexis Chapellier

背景:全球每年约有 5000 万吨电子产品变成垃圾,其中很多并非修不了,而是板级维修知识掌握在极少数人手里。

导入主板照片和原理图 PDF(80 多页),Wrench Board 用 Opus 4.7 视觉能力分批并行读取,两分钟内编译成可查询的电气知识图谱(25 元件 + 33 症状 + 10 诊断规则)。然后你可以直接和 Agent 对话——它会在主板照片上一步一步画出诊断路径

三层记忆
① 你的工具档案(没有热风台就不会让你做 BGA 返焊)
② 这块板的修复历史(之前修过哪里、试过什么方案)
③ 元件白名单
反幻觉
Agent 说出的每个元件编号必须来自工具查询,没查到的服务端直接过滤掉,到不了用户屏幕
技能档案
每次成功维修后用户的技能档案自动升级
"当一个拿着万用表的普通技术员,能做到昨天只有 OEM 售后中心才能做的事,'维修权'才算真正落地了。" — Alexis Chapellier
铜奖 Maieutic 智利 · 大学副主任 Paula Vasquez-Henriquez

给大学一年级 Python 课设计的编程教学平台。Paula 教了六年入门编程,带过 200 个学生,见过太多三种学生:复制 LLM 代码不知道在干嘛的、随便扫题目要求的、还没想清楚就开始敲的。三种都能交作业、都能及格——但没有一个人学到了真正重要的那个东西

核心反向操作
写代码之前编辑器先锁着。学生用自己的话描述程序应该干什么 → AI 追问没说清楚的地方 → spec 足够清晰才解锁
编辑器规则
自动补全关闭。学生问语法,AI 回答;学生问"我该怎么做",AI 引导思考,不给答案
提交后
AI 把最初的 spec 和实际代码对齐,让学生自己解释中间的 gap
教师面板
实时看每个学生此刻卡在哪、在怎么推理、哪些错误反复出现——不是看分数,是看推理过程
"在大学禁 AI 并非正确做法。未来的程序员大部分时间都在写 prompt,但好的 prompt 来自于理解你要构建什么、什么可能出错、以及结果对不对。" — Paula Vasquez-Henriquez

Paula 的一句话值得单独拎出:Opus 4.7 能分辨学生是在「推理」还是在「猜」。

最佳创意 Virtual Puppet Theater 丹麦 · Rene Hangstrup Moller

用手对着摄像头比划,屏幕上的木偶就跟着动;说话,木偶也说话;说"给 Bob 戴个王冠",王冠就出现了;说"我们去海滩吧",背景就换成沙滩。

技术栈
MediaPipe(手指关节 3D 追踪)+ Web Speech API(识别)+ 11 Labs Flash(合成)+ Three.js(3D 渲染)
双模型分工
日常对话用 Haiku 保速度,道具生成用 Opus 保创意——共享一个缓存
实时生成
"冰淇淋帽子"在用户第一次说出来时,Opus 用基础图形组合实时拼出
Keep Thinking MaestrIA 智利 · 木匠之子 Benjamin Torralbo

Benjamin 的父亲做了 30 年木匠,其中 8 年在修复智利奇洛埃岛上被联合国列入世界遗产的木教堂。但智利体制里,没有大学文凭,你修过再多世界遗产,你也是全隐形人。

使用方式:拍一张受损墙面的照片,输入位置。Opus 4.7 实时展示推理过程——先观察,再诊断,就像一个老师傅到了现场,得先看一圈再开口。

4 个答案
修什么 / 大概多少钱 / 需要多长时间 / 不修会怎样
多 Agent 辩论
木匠 Agent vs 泥瓦匠 Agent,用智利本地西班牙语各自论证修复方案;另一 Agent 跑去 Sodimac 和 Easy 建材超市实时查价,验证预算靠不靠谱
第三个 Agent
自动用智利本地西班牙语写一条 WhatsApp 消息给手艺人,附上完整诊断报告
验证
12 张照片拿给作者父亲做盲测——与 30 年老师傅判断的吻合率:81%
"工具是我做的。知识是他的。" — Benjamin Torralbo
最佳 Managed Agents ARIA 法国 · Idriss Benguezzou & Adam Hnaien

解决工业维护领域一个老问题:在每个工厂、每个车间、每个水站里,总有那么一个人——他能听出机器声音哪里不对劲,他能在机器坏之前两天就知道它要坏了。然后他退休了,这些知识就永远消失了。

传统的工业维修管理系统部署成本 50 万美元起,需要半年的专业咨询。结果就是,超过一半的工厂压根不装。

演示场景是矿泉水灌装厂的一条线、五台设备。把设备手册丢给 ARIA,Opus 4.7 视觉能力读完手册问了三个问题,系统就上线了。

架构
5 个 Agent 各司其职,共享 17 个工具,通过 MCP 协作
警报二次判断
瓶盖机振动异常报警,ARIA 没有立刻发工单——查了上下文发现振动值其实在下降。结论:无需处理。多走了一步:判断这个警报值不值得理
故障链路
检测 Agent → 调查 Agent 启动 extended thinking → 写 Python 在 Anthropic 云沙箱跑回归分析 → 算出退化速率 → 工单包含根因 + 一步步修复建议
历史记忆
类似异常翻出 3 个月前 Tom Anderson 处理过的 case,找到当时方案和零件编号
• • •

三、技术上的三个收敛信号

信号 1

白名单约束开始成为标配

Wrench Board 给 AI 戴了一个硬约束——Agent 输出的元件编号必须来自工具查询,没查到的服务端直接过滤掉。这是一个比"prompt 写更好"更粗暴有效的反幻觉机制。当一个领域的事实集合是有限的(元件、合规条目、SKU),白名单是比 RAG 更可靠的兜底。

信号 2

对象记忆和用户档案在同一个产品里

Wrench Board 同时记你的工具清单(你有什么)和这块板子的修复历史(这只对象有什么)。这不是一个记忆维度,是两个:一个绑用户、一个绑对象。组合起来产品才能"认识你"和"认识它"。

信号 3

多 Agent 不是噱头

MedKit 是 1 主管 + 3 子 Agent;ARIA 是 5 Agent + 17 工具的 MCP 协作;MaestrIA 让木匠 Agent 和泥瓦匠 Agent 用智利本地西班牙语辩论修复方案,另一个 Agent 跑去 Sodimac 和 Easy 实时查价校验预算。

「最佳 Managed Agents 使用奖」单独设了一个,说明 Anthropic 自己也认为这是一个独立的产品形态,不是单 Agent 的简单叠加。

• • •

四、最值得记的一个反向操作

Maieutic 做的事是反直觉的。

它是给大学一年级 Python 课设计的,规则是:写代码之前,编辑器锁着。学生得先用自己的话描述程序应该干什么,AI 读完追问没说清楚的地方,spec 足够清晰才解锁。

编辑器打开后,自动补全是关的。学生问语法 AI 回答;学生问"我该怎么做",AI 引导思考,不给答案。提交后 AI 把最初的 spec 和实际代码对齐,让学生自己解释 gap 在哪。

这一整套设计的反直觉之处在于:所有人都在卷"AI 帮我写得更快",Paula 在做的事是"AI 让你慢下来想清楚"。

META POINT

它不是"AI 教你写代码"

它是"AI 当一个学习元认知的镜子"。
当 Opus 4.7 能分辨"在推理"和"在猜",这个能力本身就比代码补全值钱——不仅在编程教育,在任何"训练判断力"的场景都成立。

• • •

五、最让人记住的故事

Keep Thinking 特别奖给了智利的 Benjamin Torralbo。

他父亲 Juan Rodrigo Torralbo 做了 30 年木匠,其中 8 年在修复智利奇洛埃岛上被联合国列入世界遗产的木教堂。

"智利有超过 28 万名非正式建筑工人,没有任何途径能展示自己的手艺。我爸修复了联合国世界遗产教堂,可没有大学文凭的他,在系统里根本不存在。" — Benjamin Torralbo

Benjamin 做的 MaestrIA 让用户拍受损墙照片+输入位置,AI 分析后给四个答案:修什么、多少钱、多长时间、不修会怎样。然后推荐附近的手艺人,第三个 Agent 用智利本地西班牙语帮你写一条 WhatsApp 消息附诊断报告。

分析过程中还有个有意思的环节:系统模拟不同工种的专家辩论。木匠 vs 泥瓦匠用智利西班牙语各自论证修复方案,另一个 Agent 跑去当地建材超市 Sodimac 和 Easy 实时查价,验证预算是否靠谱。一个报价没有实际价格支撑,说了等于没说。

最后他把 12 张照片拿给父亲做盲测。

VALIDATION

与 30 年老师傅判断的吻合率:81%

这是这场黑客松最值钱的一个数字。它没有让 AI 替代老师傅——它把老师傅 30 年的判断力放大成一个其他人能用的工具

"工具是我做的。知识是他的。" — Benjamin Torralbo

"你不再是一脸懵地跟工人说'我墙湿了'。你手上拿着诊断报告。客户不会被乱开价,有手艺但不会推销自己的工人也能接到活。"

• • •

结 · 他们可能就是你

原文最后那句话:他们不是硅谷连续创业者,他们是一个土耳其医生、一个智利大学老师、一个木匠的儿子。他们可能就是你。

人类文明里有大量这样的隐性知识:

老师傅退休了,临床直觉随一代人老去而失传,没有人宣布它的死亡,也很少有人意识到自己失去了什么。

在 AI 到来之前,这些知识因为太长尾、太不起眼,被鉴定为没有价值,从而忽略。

CLOSING

这六个项目背后的指向

AI 可以接住这些正在断裂的经验,让它变成一种工具,一种传承

而做这件事,不需要对话框。