主办:Anthropic × Cerebral Valley · 「Built with 4.7」黑客松
规则:用 Opus 4.7 + Claude Code,一周时间,做一个东西出来
引 · 一个反常识
Anthropic 刚公布的这场黑客松,参赛规则只有一行:用 Opus 4.7 + Claude Code,一周时间,做个东西出来。
六个获奖项目里,没有一个是聊天机器人。
这件事比"谁拿了金奖"更值得记下来。这两年所有人都在卷对话框——更大的 context、更聪明的 RAG、更花哨的 prompt。这场黑客松六强用脚投票告诉你:当 AI 真正落地到一个具体领域时,对话框只是壳,里面装的是另外的东西。
它们到底在做什么
每一个项目都在把原本锁在某个人头脑里、几十年累积出来的判断力,变成其他人能用的工具。
板级维修经验锁在少数硬件工程师手里;临床直觉锁在资深医生脑子里;工厂维护知识锁在那个"什么都知道"的老师傅心里;木工手艺锁在没有大学文凭的匠人手上。
一、六个项目,五个国家,一个共同方向
| 项目 | 奖项 | 国家 | 隐性知识对象 |
|---|---|---|---|
| MedKit | 金奖 | 土耳其 | 急诊室临床直觉 |
| Wrench Board | 银奖 | 法国 | 板级维修经验 |
| Maieutic | 铜奖 | 智利 | 教师对学生思维误区的直觉 |
| Virtual Puppet Theater | 最佳创意 | 丹麦 | 互动剧场体验 |
| MaestrIA | Keep Thinking | 智利 | 30 年木匠手艺 |
| ARIA | 最佳 Managed Agents | 法国 | 工厂老师傅听机器声音的直觉 |
二、六强逐一拆解
语音驱动的虚拟诊室。系统生成 AI 病人,医学生通过语音问诊、开检查、看影像、做诊断、开处方。每次问诊后系统按最新临床指南给沟通能力、病史采集和临床推理逐项打分,每个扣分点附带文献引用。
背景:全球每年约有 5000 万吨电子产品变成垃圾,其中很多并非修不了,而是板级维修知识掌握在极少数人手里。
导入主板照片和原理图 PDF(80 多页),Wrench Board 用 Opus 4.7 视觉能力分批并行读取,两分钟内编译成可查询的电气知识图谱(25 元件 + 33 症状 + 10 诊断规则)。然后你可以直接和 Agent 对话——它会在主板照片上一步一步画出诊断路径。
"当一个拿着万用表的普通技术员,能做到昨天只有 OEM 售后中心才能做的事,'维修权'才算真正落地了。"
给大学一年级 Python 课设计的编程教学平台。Paula 教了六年入门编程,带过 200 个学生,见过太多三种学生:复制 LLM 代码不知道在干嘛的、随便扫题目要求的、还没想清楚就开始敲的。三种都能交作业、都能及格——但没有一个人学到了真正重要的那个东西。
"在大学禁 AI 并非正确做法。未来的程序员大部分时间都在写 prompt,但好的 prompt 来自于理解你要构建什么、什么可能出错、以及结果对不对。"
Paula 的一句话值得单独拎出:Opus 4.7 能分辨学生是在「推理」还是在「猜」。
用手对着摄像头比划,屏幕上的木偶就跟着动;说话,木偶也说话;说"给 Bob 戴个王冠",王冠就出现了;说"我们去海滩吧",背景就换成沙滩。
Benjamin 的父亲做了 30 年木匠,其中 8 年在修复智利奇洛埃岛上被联合国列入世界遗产的木教堂。但智利体制里,没有大学文凭,你修过再多世界遗产,你也是全隐形人。
使用方式:拍一张受损墙面的照片,输入位置。Opus 4.7 实时展示推理过程——先观察,再诊断,就像一个老师傅到了现场,得先看一圈再开口。
"工具是我做的。知识是他的。"
解决工业维护领域一个老问题:在每个工厂、每个车间、每个水站里,总有那么一个人——他能听出机器声音哪里不对劲,他能在机器坏之前两天就知道它要坏了。然后他退休了,这些知识就永远消失了。
传统的工业维修管理系统部署成本 50 万美元起,需要半年的专业咨询。结果就是,超过一半的工厂压根不装。
演示场景是矿泉水灌装厂的一条线、五台设备。把设备手册丢给 ARIA,Opus 4.7 视觉能力读完手册问了三个问题,系统就上线了。
三、技术上的三个收敛信号
白名单约束开始成为标配
Wrench Board 给 AI 戴了一个硬约束——Agent 输出的元件编号必须来自工具查询,没查到的服务端直接过滤掉。这是一个比"prompt 写更好"更粗暴有效的反幻觉机制。当一个领域的事实集合是有限的(元件、合规条目、SKU),白名单是比 RAG 更可靠的兜底。
对象记忆和用户档案在同一个产品里
Wrench Board 同时记你的工具清单(你有什么)和这块板子的修复历史(这只对象有什么)。这不是一个记忆维度,是两个:一个绑用户、一个绑对象。组合起来产品才能"认识你"和"认识它"。
多 Agent 不是噱头
MedKit 是 1 主管 + 3 子 Agent;ARIA 是 5 Agent + 17 工具的 MCP 协作;MaestrIA 让木匠 Agent 和泥瓦匠 Agent 用智利本地西班牙语辩论修复方案,另一个 Agent 跑去 Sodimac 和 Easy 实时查价校验预算。
「最佳 Managed Agents 使用奖」单独设了一个,说明 Anthropic 自己也认为这是一个独立的产品形态,不是单 Agent 的简单叠加。
四、最值得记的一个反向操作
Maieutic 做的事是反直觉的。
它是给大学一年级 Python 课设计的,规则是:写代码之前,编辑器锁着。学生得先用自己的话描述程序应该干什么,AI 读完追问没说清楚的地方,spec 足够清晰才解锁。
编辑器打开后,自动补全是关的。学生问语法 AI 回答;学生问"我该怎么做",AI 引导思考,不给答案。提交后 AI 把最初的 spec 和实际代码对齐,让学生自己解释 gap 在哪。
这一整套设计的反直觉之处在于:所有人都在卷"AI 帮我写得更快",Paula 在做的事是"AI 让你慢下来想清楚"。
它不是"AI 教你写代码"
它是"AI 当一个学习元认知的镜子"。
当 Opus 4.7 能分辨"在推理"和"在猜",这个能力本身就比代码补全值钱——不仅在编程教育,在任何"训练判断力"的场景都成立。
五、最让人记住的故事
Keep Thinking 特别奖给了智利的 Benjamin Torralbo。
他父亲 Juan Rodrigo Torralbo 做了 30 年木匠,其中 8 年在修复智利奇洛埃岛上被联合国列入世界遗产的木教堂。
"智利有超过 28 万名非正式建筑工人,没有任何途径能展示自己的手艺。我爸修复了联合国世界遗产教堂,可没有大学文凭的他,在系统里根本不存在。"
Benjamin 做的 MaestrIA 让用户拍受损墙照片+输入位置,AI 分析后给四个答案:修什么、多少钱、多长时间、不修会怎样。然后推荐附近的手艺人,第三个 Agent 用智利本地西班牙语帮你写一条 WhatsApp 消息附诊断报告。
分析过程中还有个有意思的环节:系统模拟不同工种的专家辩论。木匠 vs 泥瓦匠用智利西班牙语各自论证修复方案,另一个 Agent 跑去当地建材超市 Sodimac 和 Easy 实时查价,验证预算是否靠谱。一个报价没有实际价格支撑,说了等于没说。
最后他把 12 张照片拿给父亲做盲测。
与 30 年老师傅判断的吻合率:81%
这是这场黑客松最值钱的一个数字。它没有让 AI 替代老师傅——它把老师傅 30 年的判断力放大成一个其他人能用的工具。
"工具是我做的。知识是他的。"
"你不再是一脸懵地跟工人说'我墙湿了'。你手上拿着诊断报告。客户不会被乱开价,有手艺但不会推销自己的工人也能接到活。"
结 · 他们可能就是你
原文最后那句话:他们不是硅谷连续创业者,他们是一个土耳其医生、一个智利大学老师、一个木匠的儿子。他们可能就是你。
人类文明里有大量这样的隐性知识:
- 不在论文里
- 不在教科书里
- 不在任何数据库里
- 只存在于某个人的手感、直觉、几十年累积出来的判断力里
老师傅退休了,临床直觉随一代人老去而失传,没有人宣布它的死亡,也很少有人意识到自己失去了什么。
在 AI 到来之前,这些知识因为太长尾、太不起眼,被鉴定为没有价值,从而忽略。
这六个项目背后的指向
AI 可以接住这些正在断裂的经验,让它变成一种工具,一种传承。
而做这件事,不需要对话框。