一、文章核心要点
从"物理搬运"到"逻辑蒸馏"——范式跃迁
面对一块装着十年投研资料的硬盘——上千篇报告、上百份纪要、无数Excel——传统的处理方式是"做个能搜索的网盘"。作者提出了一个截然不同的范式:
"自己.skill" 不是把 PDF 喂给大模型,而是把过去的自己定制化为 AI Agent 版同事——雇佣过去的自己,为当前的自己打工。
蒸馏的本质
把素材压成知识库是 IT 项目;
把知识库压成分析框架是 RAG 项目;
把分析框架压成肌肉记忆 + 表达口吻,才是"自己.skill"。
三个层次的对比
| 层次 | 形态 | 能解决的问题 | 不能解决的 |
|---|---|---|---|
| L1 · 网盘式 | 带搜索的 PDF 仓库 | "那篇报告在哪" | 不会推演 |
| L2 · RAG 式 | 检索增强问答 | "基于过去资料回答 X" | 无法继承思维路径 |
| L3 · 蒸馏式 | 研究框架 + 风格化表达 | "按我的方法重新做一遍" | 无法替代直觉判断 |
二、三场实战推演的深度拆解
作者把过去十年的研究素材、自建框架、表达习惯都注入"自己.skill",然后做了三场压力测试。每一场的设计都极具洞察——它们刚好覆盖了投研工作的三个维度:速度、广度、前瞻性。
AI 执行的三步流水线
- 数据自动对齐:锁定 2026-04 最新指标(联邦基金利率),与 IMF 预测、CME 期货数据对比
- 逻辑框架嵌入:调用预设的"美联储传导机制",拆解为 分母端改善 → 北向资金流入 → 港币联系汇率传导 多维度
- 风格化输出:模拟作者口吻、行文习惯,直接给出"增配成长端"结论
痛点:传统美林时钟在当下经常转得像电风扇。官方数据滞后,等到确认周期切换时,资产价格早跑完了。
AI 展现的三种能力
清洗油价、PMI 价格分项、美债收益率等庞杂数据,敏锐捕捉到"油价飙升 vs 就业韧性"的矛盾信号。
自动生成资产胜率雷达图,通过四维度量化体系对 A 股、H 股、黄金打分。
判定当前处于滞胀交易阶段,建议哑铃策略中拉长防御资产久期,系统性上调黄金权重。
这是三个测试中最惊艳的一个。痛点:在长期底部震荡 + 极度悲观情绪下,市场对常规政策表态早已脱敏。人脑很难在咬文嚼字的官方表述里嗅出语义跳跃,往往等到大阳线拔起才后知后觉。
AI 表现出的"超越情绪的冷静"
捕捉到高层表态从"活跃"到"提振"的语义突变,识别出监管协同发声频率的规律。
对比历史底部破净率等指标,指出当前政策语义的急迫性与资产价格的极度悲观之间,出现了过去两年最大的背离敞口。
给出 70-80% 高概率反弹预测,明确建议立刻终止防御策略,全面超配券商及 H 股核心科技资产。
这一段最值得反复读
"AI 判断所承担的角色,是市场大多数参与者的'一致预期'。对文件本身的理解造就的主流观点以及相应资金行为,相比文件的表述和实际程度本身,对市场影响更直接。"
——这句话把 AI 的定位从"分析师替身"重新校准为"一致预期模拟器"。这是文章最深的一刀。
三、可迁移的八条规律
把三个案例的细节蒸馏一层,剥离出真正可迁移的方法论。这八条是给自己看的,不是给原文背书。
蒸馏 = 框架 + 风格,不是数据
素材是燃料,框架是引擎,表达口吻是签名。三者缺一不可。只喂 PDF 的"蒸馏"等于把油倒进没引擎的车——一动不动。
分析师的护城河转移:执行 → 判断
AI 把"两小时数据复盘 + 逻辑梳理"压缩到几分钟。执行成本被打到零,分析师的稀缺性集中到"对边际变化的直觉判断"。能写报告的人贬值,能在拐点拍板的人升值。
AI 是"一致预期模拟器",不是分析师替身
对市场最有定价权的,不是"事实真相",而是"市场大多数怎么理解事实"。AI 自然倾向于主流解读,这恰好让它成为一致预期的精确仿真器——你拿它当对手盘,比当队友更值钱。
风格化输出比逻辑还重要
同一份逻辑,不同人写出来的可信度不同。AI 学到分析师的口吻 + 表达节奏后,下游决策者的采纳率显著提高。蒸馏自己时,把过去 10 篇代表作的写作习惯一并喂进去。
高频数据 × 框架嵌入 = 时钟去抖
美林时钟失效不是模型错,是输入频率太低。把油价/PMI 分项/利差等高频数据接进框架,时钟才不会变电风扇。规律泛化:所有"经典模型失效"的本质,往往都是数据频率与决策频率不匹配。
语义跳跃比关键词词频更值钱
传统文本分析数"稳增长"出现几次。"自己.skill"对比的是"活跃 → 提振"这种语义强度跃迁。同样的字数,权力等级不同。词频是 1.0 级技术,语义张力是 2.0 级技术。
背离敞口是最稀缺的左侧信号
"政策语义急迫性 vs 资产价格极度悲观" = 过去两年最大背离敞口。这种跨数据源的背离是单一指标看不到的,恰好是 AI 最擅长发现的。
AI 的胜率 ≠ 仓位决策
给出 70-80% 反弹概率,但没说该上几成仓——这正是 AI 的边界。胜率是 AI 的主场,赔率与仓位是人类的主场。两个角色不要混淆。
四、AI 在投研里的能力边界(清单)
✓ AI 能做的
- 历史数据自动对齐与多源比对
- 逻辑框架的机械执行(速度 100×)
- 表达口吻 + 行文习惯的风格迁移
- 跨数据源的背离敞口识别
- 政策文本的语义跳跃检测
- 胜率赔率的雷达式量化打分
- 24 小时不疲倦盯盘
- 克服恐惧/贪婪的逆向预判
✗ AI 仍做不到的
- 地缘黑天鹅这类突发事件的边际判断
- 政策底层博弈逻辑的深度理解
- 把胜率翻译为仓位与久期
- 面对面感知市场参与者的情绪反馈
- "读懂文本" → "读懂盘感"
- 对个人投资者非理性行为的定价
- 突破训练数据的真正原创洞察
- 承担错误的责任
五、TZ 实战版 · 把"自己.skill"嵌入 Aquabridge 五层架构
原文的"自己.skill"是单点工具。在 TZ 当前的体系里,它对应的是整个五层架构的一种使用模式——每一层都恰好可以承载蒸馏的一个环节。
映射表
| 原文环节 | Aquabridge 对应层 | 已有资产 |
|---|---|---|
| 素材库 | L1 · Knowledge | ~/.wiki/ + L2-cards 联系簿/运维 + L3-ontology 130+ 节点(opt/qnt/inv/com/laomai/master) |
| 研究框架 | L1 · L3-ontology | opt_delta_action_matrix · opt_ivr_five_zones · qnt_six_layer_architecture · laomai_7_safety_belts …… |
| 角色插件 | L3 · Skills | tz-格物 · tz-拾穗 · tz-互博 · tz-问渠 · tz-布道(已有 TZ 五脉)+ ljg-* 系列 |
| 数字分身执行 | L4 · Agents | 幕僚团 chief(张居正 8787 / 苏格拉底 8788 / 传令兵 60s) |
| 对外交付 | L5 · Terminals | shipping terminal · 阅读室 · ab-strategy · quant-os · master-chat |
第一层:素材清洗与本体化(已部分完成)
原文最关键的隐性步骤是"深度清洗与分类"。TZ 体系里这一步已经做过:
- L1-knowledge/_cleansing/:22 个 SPLIT 提案,把 memory 中的事实段与指令段分离
- L1-knowledge/L3-ontology/nodes/:130+ 节点,按 com/inv/laomai/master/opt/qnt 分桶
- edges/analogous_to.jsonl:跨域类比边,正是 AI"语义共振"需要的素材
把现有 130+ 节点按"是否可被 AI 直接调用"重新打标。能直接调用的进 L3-skills;只是知识陈述的留 L3-ontology。这一步是"自己.skill"的素材编译。
第二层:把研究框架变成可调用的 Skill
TZ 已有的 tz-* 五脉是一个雏形:
| Skill | 对应环节 | "自己.skill"角色 |
|---|---|---|
| tz-格物 | 研究 · 概念解剖 | 分析师 · 第一性原理 |
| tz-拾穗 | 素材 · 信息整理 | 研究助理 · 数据清洗 |
| tz-问渠 | 提问 · 苏格拉底式 | 评审委员 · 反向追问 |
| tz-互博 | 对辩 · 多视角 | 交易对手 · 反方论证 |
| tz-布道 | 输出 · 教学传递 | 分析师 · 风格化表达 |
原文的三个测试场景在 TZ 体系里完全可以复刻。例如测试 3 的 9·24 语义跳跃分析,可以做成一个新 skill tz-语义雷达:输入近 30 天政策文本 + 监管发声频率 → 输出"语义张力评分 + 与资产价格的背离敞口"。
第三层:用 Chief 当数字分身的执行容器
原文里的"自己.skill"是被动调用。TZ 的幕僚团 chief是主动驱动——这正是文章里没讲到的下一步:
差别在于:原文是"问什么答什么"的 query 式蒸馏,TZ 体系是"事件触发的" agent 式蒸馏。同样的 skill 在 chief 框架里就变成了"每天主动跑出三个候选交易机会"。
第四层:风格化签名(缺口)
这是 TZ 现有体系最薄弱的环节。原文强调"模拟我的表达口吻和行文习惯"——这一步在 TZ 当前的 skill 里还没系统化做。
建议新建 tz-voice skill:把过去 1 年发出的研究简报、阅读室文章、决策记录做语料分析,提取 TZ 的句式习惯 / 标点偏好 / 论证节奏,作为所有 AI 输出的强制后处理层。让 AI 写出来的东西"一眼能认出是 TZ 的口吻"。
第五层:边界守门
原文最后一句"风险提示"——AI 幻觉。TZ 体系里这一层应该有硬约束:
1. 任何含具体数字的结论必须标注数据源
2. 任何胜率/赔率必须给出回测时间窗
3. 任何仓位建议必须由人工拍板,AI 只给概率
4. 任何政策语义判断必须附原文链接
5. 任何跨周期类比必须列明本周期与历史周期的关键差异
六、留给 TZ 的三个开放问题
- 蒸馏的边界在哪?——是把 TZ 一个人蒸馏成一个 skill,还是把 TZ 的"不同模式"(如交易模式 / 研究模式 / 教学模式)分别蒸馏成多个 skill?后者的颗粒度更细,可组合性更强,但维护成本也更高。
- "一致预期模拟器"如何变现?——既然 AI 是一致预期的精确仿真器,那么用它做市场情绪的逆向探测器(即"AI 都看好的时候,主力可能在出货")能不能成为一个 alpha 来源?这是文章没讲到的下一层。
- 蒸馏频率如何设置?——AI 学到的是"过去的 TZ",但 TZ 在持续进化。需要建立一个蒸馏-反馈-重蒸馏的循环节奏:每月增量蒸馏 / 每季全量回炉?
七、金句摘录
"真正的蒸馏,是提取一个分析师的研究框架和肌肉记忆。'自己.skill'体现对自己能力的主动定义。"
"AI 判断所承担的角色,是市场大多数参与者的'一致预期',对文件本身的理解造就的主流观点以及相应资金行为,相比文件的表述和实际程度本身,对市场影响更直接。"
"被淘汰的永远只会是搬运数据的熟练工,而掌握了 AI 工具、拥有独立研究框架的分析师,将会获得一支不知疲倦、脑洞无限的投研 AGI 天团。"
"重要的是'投资于人'。"
"执行成本被打到零,分析师的稀缺性集中到对边际变化的直觉判断。能写报告的人贬值,能在拐点拍板的人升值。"
"胜率是 AI 的主场,赔率与仓位是人类的主场。两个角色不要混淆。"